4.1 负载均衡概述

负载均衡的主要作用是将网络流量或计算任务均匀分配到多台服务器。通过均衡分配任务,可以避免单个服务器超载,确保资源的高效利用和服务的持续可用。

图 4-1 显示了负载均衡的工作模型。其中,若干客户端(Client)通过负载均衡器(Load Balancer)访问后端服务器(RealServer),中间的负载均衡器起到以下作用:

  • 服务发现:客户端只需与负载均衡器交互,无需了解后端服务器的拓扑结构或配置。此外,负载均衡器通常具备服务发现机制,能够自动感知并适应后端服务器的增减及状态变化。
  • 系统容错:负载均衡器定期对后端服务器进行健康检查,评估服务器的响应时间和健康状态等情况。根据检查结果,负载均衡器仅将请求发送给健康的服务器,并在发现故障时将问题服务器移除出负载均衡池。这样,运维人员可以从容修复故障服务器,系统的整体可用性也不会受到影响。
  • 负载均衡:首先,负载均衡器通过合适的负载均衡算法(如轮询、最少连接、加权分配等)将请求均匀地分发到健康的后端服务器,从而提升系统整体的处理能力和稳定性。其次,后端服务器通常分布在多个网络区域(Zone/Region),负载均衡器通过策略优化流量路由,尽可能将请求保持在同一网络区域内。这不仅提高了服务性能(减少延迟),还降低了资源成本(减少跨区域带宽费用)。


图 4-1 负载均衡工作模型

总字数:481
Last Updated:
Contributors: isno