仅需这一篇，吃透负载均衡

Zachary_Fan 2018-11-26 10:11:06

在对分布式系统的「高可用」有了一个初步了解之后，我们也认识到「负载均衡」是「高可用」的核心所在。那么，本篇文章我们将通过图文并茂的方式，来描述出每一种负载均衡策略的完整样貌。

一、负载均衡是什么

由一个独立的统一入口来收敛流量，再做二次分发的过程就是「负载均衡」，它的本质和「分布式系统」一样，是「分治」。

如果大家习惯了开车的时候用一些导航软件，我们会发现，导航软件的推荐路线方案会有一个数量的上限，比如3条、5条。

其实，它也起到了一个类似「负载均衡」的作用，因为如果只能取Top3的通畅路线，自然拥堵严重的路线就无法推荐给你了，使得车流的压力被分摊到了相对空闲的路线上。

在软件系统中也是一样的道理，为了避免流量分摊不均，造成局部节点负载过大（如CPU吃紧等），所以引入一个独立的统一入口来做类似上面的“导航”的工作。但是，软件系统中的「负载均衡」与导航的不同在于，导航是一个柔性策略，最终还是需要使用者做选择，而前者则不同。

怎么均衡的背后是策略在起作用，而策略的背后是由某些算法或者说逻辑来组成的。比如，导航中的算法属于「路径规划」范畴，在这个范畴内又细分为「静态路径规划」和「动态路径规划」，并且，在不同的分支下还有各种具体计算的算法实现，如Dijikstra、A*等。

同样的，在软件系统中的负载均衡，也有很多算法或者说逻辑在支撑着这些策略，巧的是也有静态和动态之分。

二、常用负载均衡策略图解

下面来罗列一下日常工作中最常见的5种策略。

1、轮询

这是最常用也最简单的策略，平均分配，人人都有、一人一次。大致的代码如下：

int globalIndex = 0; //注意是全局变量，不是局部变量。

try

{

return servers[globalIndex];

}

finally

{

globalIndex++;

if (globalIndex == 3)

globalIndex = 0;

}

2、加权轮询

在轮询的基础上，增加了一个权重的概念。权重是一个泛化后的概念，可以用任意方式来体现，本质上是能者多劳的思想。比如，可以根据宿主的性能差异配置不同的权重。大致的代码如下：

int matchedIndex = -1;

int total = 0;

for (int i = 0; i < servers.Length; i++)

{

servers[i].cur_weight += servers[i].weight;//①每次循环的时候做自增（步长=权重值）

total += servers[i].weight;//②将每个节点的权重值累加到汇总值中

if (matchedIndex == -1 || servers[matchedIndex].cur_weight < servers[i].cur_weight) //③如果当前节点的自增数 > 当前待返回节点的自增数，则覆盖。

{

matchedIndex = i;

}

servers[matchedIndex].cur_weight -= total;//④被选取的节点减去②的汇总值，以降低下一次被选举时的初始权重值。

return servers[matchedIndex];

这段代码的过程如下图的表格。“()”中的数字就是自增数，代码中的cur_weight。

值得注意的是，加权轮询本身还有不同的实现方式，虽说最终的比例都是2：1：2。

但是在请求送达的先后顺序上可以有所不同。比如「5-4，3，2-1」和上面的案例相比，最终比例是一样的，但是效果不同，「5-4，3，2-1」更容易产生并发问题，导致服务端拥塞，且这个问题随着权重数字越大越严重。例如，10：5：3的结果是「18-17-16-15-14-13-12-11-10-9，8-7-6-5-4，3-2-1」。

3、最少连接数