1、技術架構
2、LVS技術特點

3、Tengine技術特點
4、更多功能

SLB（Server Load Balancer）服務通過設置虛擬服務地址（IP），將位於同一地域（Region）的多台雲服務器（Elastic Compute Service，簡稱ECS）資源虛擬成一個高性能、高可用的應用服務池；再根據應用指定的方式，將來自客戶端的網絡請求分發到雲服務器池中。

SLB服務會檢查雲服務器池中ECS的健康狀態，自動隔離異常狀態的ECS，從而解決了單台ECS的單點問題，同時提高了應用的整體服務能力。在標准的負載均衡功能之外，SLB服務還具備TCP與HTTP抗DDoS攻擊的特性，增強了應用服務器的防護能力。

SLB服務是ECS面向多機方案的一個配套服務，需要同ECS結合使用。

1、技術架構

整個負載均衡系統由3部分構成：四層負載均衡、七層負載均衡和控制系統，如下圖所示：

四層負載均衡
采用開源軟件LVS（Linux Virtual Server）構建，並根據雲計算需求對其進行了定制和優化。
七層負載均衡
采用開源軟件Tengine構建。
控制系統
用於配置和監控負載均衡系統。

2、LVS技術特點

LVS是全球最流行的四層負載均衡開源軟件，可以實現LINUX平台下的負載均衡。

LVS是基於Linux Netfilter框架實現的一個內核模塊（ IPTables是基於Netfilter基本架構實現的一個可擴展的數據報高級管理系統或核外配置工具），名稱為IPVS。其鈎子函數分別HOOK在LOCAL_IN和FORWARD兩個HOOK點，如下圖所示：

在雲計算大規模網絡環境下，官方LVS存在如下問題：

問題1：LVS支持NAT/DR/TUNNEL三種轉發模式，上述模式在多VLAN網絡環境下部署時，存在網絡拓撲復雜，運維成本高的問題。
問題2：和商用負載均衡設備（如F5等）相比，LVS缺少DDOS攻擊防御功能。
問題3：LVS采用PC服務器，常用Keepalived軟件的VRRP心跳協議進行主備部署，其性能無法擴展。
問題4：LVS常用管理軟件Keepalived的配置和健康檢查性能不足。

為了解決上述問題， SLB在官方LVS基礎上進行了如下定制化和優化：

解決1：新增轉發模式FULLNAT，實現LVS-RealServer間跨VLAN通訊。
解決2：新增了SYNPROXY等TCP標志位DDOS攻擊防御功能。
解決3：采用LVS集群方式部署。
解決4：對Keepalived的性能進行了優化。

Aliyun-LVS開源地址： https://github.com/alibaba/LVS 。更多相關說明如下所述。

FULLNAT技術概述

如下圖所示，FULLNAT主要實現方式為：

引入local address（內網IP地址）。cip-vip轉換為lip->rip，而 lip和rip均為IDC內網IP，可以跨VLAN通訊。
IN/OUT的數據流全部經過LVS，為了保證帶寬，采用萬兆（10G）網卡。
FULLNAT轉發模式，當前僅支持TCP協議。

SYNPROXY技術概述

LVS針對TCP標志位DDOS攻擊，采取如下策略：

對於SYN flood類型攻擊，利用SYNPROXY模塊進行防御。

如下圖所示，主要實現方式為：參照Linux TCP協議棧中SYN cookie的思想，LVS代理TCP三次握手。代理過程：

1) Client發送SYN包給LVS。

2) LVS構造特殊SEQ的SYN ACK包給Client。

3) Client回復ACK給LVS。

4) LVS驗證ACK包中ack_seq是否合法。

5) 如果合法，則LVS再和Realserver建立3次握手。

對於ACK/FIN/RSTFlood類型攻擊，查找連接表，如果不存在，則直接丟棄。

集群部署方式

LVS集群部署方式實現的主要方式為：

LVS和上聯交換機間運行OSPF協議。
上聯交換機通過ECMP等價路由，將數據流分發給LVS集群。
LVS集群再轉發給業務服務器。

集群方式部署極大的保證了異常情況下，負載均衡服務的穩定性：

健壯性
LVS和交換機間運行OSPF心跳。1個VIP配置在集群的所有LVS上。當一台LVS down，交換機會自動發現並將其從ECMP等價路由中剔除。
可擴展
如果當前LVS集群無法支撐某個VIP的流量，LVS集群可以進行水平擴容。

Keepalived優化

阿里雲在SLB中針對LVS管理軟件Keepalived進行了全面優化，主要包括：

優化了網絡異步模型，select方式改為epoll方式。
優化了reload過程。

綜上所述，基於LVS的SLB四層負載均衡產品具有如下特點；

高可用：LVS集群保證了冗余性，無單點。
安全：LVS自帶攻擊防御+雲盾，提供了接近於實時防御的能力。
健康檢查：SLB對后端ECS進行健康檢查，自動屏蔽異常狀態的ECS，待該ECS恢復正常后自動解除屏蔽。

3、Tengine技術特點

Tengine是阿里巴巴發起的WEB服務器項目，其在Nginx的基礎上，針對大訪問量網站的需求，添加了很多高級功能和特性是當前最流行的7層負載均衡開源軟件之一。Tengine的性能和穩定性已經在大型的網站如淘寶網，天貓商城等得到了很好的檢驗。它的最終目標是打造一個高效、穩定、安全、易用的Web平台。

注：Tengine開源地址http://tengine.taobao.org/。

針對雲計算場景，Tengine定制的主要特性如下：

繼承Nginx-1.4.6的所有特性，100%兼容Nginx的配置。
動態模塊加載（DSO）支持。加入一個模塊不再需要重新編譯整個Tengine。
更加強大的負載均衡能力，包括一致性Hash模塊、會話保持模塊，還可以對后端的服務器進行主動健康檢查，根據服務器狀態自動上線下線。
監控系統的負載和資源占用從而對系統進行保護。
對運維人員更友好的出錯信息，便於定位出錯機器。
更強大的防攻擊（訪問速度限制等）模塊。

采用Tengine作為SLB的基礎模塊的阿里雲SLB七層負載均衡產品，具有如下特點：

高可用：Tengine集群保證了冗余性，無單點。
安全：多維度的CC攻擊防御能力。
健康檢查：SLB對后端ECS進行健康檢查，自動屏蔽異常狀態的ECS，待該ECS恢復正常后自動解除屏蔽。
會話保持：支持7層會話保持功能。
一致性：支持一致性hash調度。

4、更多功能

SLB作為負載均衡設備，其最重要的指標是【穩定性】，在進一步提高穩定性方面，主要工作包括：

支持集群內部 session同步。
采用Anycast技術實現同城雙A。

在功能方面有更多支持，包括：

白名單訪問控制
從SLB層面實現訪問控制，用戶可以在SLB系統上配置白名單，便於用戶靈活限定外部訪問請求。
更多服務協議的支持
當前已經支持HTTPS、UDP。

四層和七層負載均衡的區別

　　首先簡單介紹一下LVS (Linux Virtual Server)到底是什么東西，其實它是一種集群(Cluster)技術，采用IP負載均衡技術和基於內容請求分發技術。調度器具有很好的吞吐率，將請求均衡地轉移到不同的服務器上執行，且調度器自動屏蔽掉服務器的故障，從而將一組服務器構成一個高性能的、高可用的虛擬服務器。整個服務器集群的結構對客戶是透明的，而且無需修改客戶端和服務器端的程序。

　　為此，在設計時需要考慮系統的透明性、可伸縮性、高可用性和易管理性。一般來說，LVS集

　　負載調度器(load balancer/ Director)，它是整個集群對外面的前端機，負責將客戶的請求發送到一組服務器上執行，而客戶認為服務是來自一個IP地址(我們可稱之為虛擬IP地址)上的。

　　服務器池(server pool/ Realserver)，是一組真正執行客戶請求的服務器，執行的服務一般有WEB、MAIL、FTP和DNS等。

　　共享存儲(shared storage)，它為服務器池提供一個共享的存儲區，這樣很容易使得服務器池擁有相同的內容，提供相同的服務。

　　VS/NAT是一種最簡單的方式，所有的RealServer只需要將自己的網關指向Director即可。客戶端可以是任意操作系統，但此方式下，一個Director能夠帶動的RealServer比較有限。在VS/NAT的方式下，Director也可以兼為一台RealServer。VS/NAT的體系結構如圖所示。

　　IP隧道(IP tunneling)是將一個IP報文封裝在另一個IP報文的技術，這可以使得目標為一個IP地址的數據報文能被封裝和轉發到另一個IP地址。IP隧道技術亦稱為IP封裝技術(IP encapsulation)。IP隧道主要用於移動主機和虛擬私有網絡(Virtual Private Network)，在其中隧道都是靜態建立的，隧道一端有一個IP地址，另一端也有唯一的IP地址。它的連接調度和管理與VS/NAT中的一樣，只是它的報文轉發方法不同。調度器根據各個服務器的負載情況，動態地選擇一台服務器，將請求報文封裝在另一個IP報文中，再將封裝后的IP報文轉發給選出的服務器;服務器收到報文后，先將報文解封獲得原來目標地址為 VIP 的報文，服務器發現VIP地址被配置在本地的IP隧道設備上，所以就處理這個請求，然后根據路由表將響應報文直接返回給客戶。

　　VS/DR方式是通過改寫請求報文中的MAC地址部分來實現的。Director和RealServer必需在物理上有一個網卡通過不間斷的局域網相連。 RealServer上綁定的VIP配置在各自Non-ARP的網絡設備上(如lo或tunl),Director的VIP地址對外可見，而RealServer的VIP對外是不可見的。RealServer的地址即可以是內部地址，也可以是真實地址。

　　VS/DR的工作流程如圖所示：它的連接調度和管理與VS/NAT和VS/TUN中的一樣，它的報文轉發方法又有不同，將報文直接路由給目標服務器。在VS/DR中，調度器根據各個服務器的負載情況，動態地選擇一台服務器，不修改也不封裝IP報文，而是將數據幀的MAC地址改為選出服務器的MAC地址，再將修改后的數據幀在與服務器組的局域網上發送。因為數據幀的MAC地址是選出的服務器，所以服務器肯定可以收到這個數據幀，從中可以獲得該IP報文。當服務器發現報文的目標地址VIP是在本地的網絡設備上，服務器處理這個報文，然后根據路由表將響應報文直接返回給客戶。

　　VS/NAT 的優點是服務器可以運行任何支持TCP/IP的操作系統，它只需要一個IP地址配置在調度器上，服務器組可以用私有的IP地址。缺點是它的伸縮能力有限，當服務器結點數目升到20時，調度器本身有可能成為系統的新瓶頸，因為在VS/NAT中請求和響應報文都需要通過負載調度器。我們在Pentium166 處理器的主機上測得重寫報文的平均延時為60us，性能更高的處理器上延時會短一些。假設TCP報文的平均長度為536 Bytes，則調度器的最大吞吐量為8.93 MBytes/s. 我們再假設每台服務器的吞吐量為800KBytes/s，這樣一個調度器可以帶動10台服務器。(注：這是很早以前測得的數據)

　　基於 VS/NAT的的集群系統可以適合許多服務器的性能要求。如果負載調度器成為系統新的瓶頸，可以有三種方法解決這個問題：混合方法、VS/TUN和 VS/DR。在DNS混合集群系統中，有若干個VS/NAT負調度器，每個負載調度器帶自己的服務器集群，同時這些負載調度器又通過RR-DNS組成簡單的域名。

　　對於那些將IP地址或者端口號在報文數據中傳送的網絡服務，需要編寫相應的應用模塊來轉換報文數據中的IP地址或者端口號。這會帶來實現的工作量，同時應用模塊檢查報文的開銷會降低系統的吞吐率。

　　在VS/TUN 的集群系統中，負載調度器只將請求調度到不同的后端服務器，后端服務器將應答的數據直接返回給用戶。這樣，負載調度器就可以處理大量的請求，它甚至可以調度百台以上的服務器(同等規模的服務器)，而它不會成為系統的瓶頸。即使負載調度器只有100Mbps的全雙工網卡，整個系統的最大吞吐量可超過 1Gbps。所以，VS/TUN可以極大地增加負載調度器調度的服務器數量。VS/TUN調度器可以調度上百台服務器，而它本身不會成為系統的瓶頸，可以用來構建高性能的超級服務器。VS/TUN技術對服務器有要求，即所有的服務器必須支持“IP Tunneling”或者“IP Encapsulation”協議。目前，VS/TUN的后端服務器主要運行Linux操作系統，我們沒對其他操作系統進行測試。因為“IP Tunneling”正成為各個操作系統的標准協議，所以VS/TUN應該會適用運行其他操作系統的后端服務器。

　　跟VS/TUN方法一樣，VS/DR調度器只處理客戶到服務器端的連接，響應數據可以直接從獨立的網絡路由返回給客戶。這可以極大地提高LVS集群系統的伸縮性。跟VS/TUN相比，這種方法沒有IP隧道的開銷，但是要求負載調度器與實際服務器都有一塊網卡連在同一物理網段上，服務器網絡設備(或者設備別名)不作ARP響應，或者能將報文重定向(Redirect)到本地的Socket端口上。

　　注：以上三種方法所能支持最大服務器數目的估計是假設調度器使用100M網卡，調度器的硬件配置與后端服務器的硬件配置相同，而且是對一般Web服務。使用更高的硬件配置(如千兆網卡和更快的處理器)作為調度器，調度器所能調度的服務器數量會相應增加。當應用不同時，服務器的數目也會相應地改變。所以，以上數據估計主要是為三種方法的伸縮性進行量化比較。

　　◆最少的連接方式(Least Connection)：傳遞新的連接給那些進行最少連接處理的服務器。當其中某個服務器發生第二到第7 層的故障，BIG-IP 就把其從服務器隊列中拿出，不參加下一次的用戶請求的分配, 直到其恢復正常。

　　◆最快模式(Fastest)：傳遞連接給那些響應最快的服務器。當其中某個服務器發生第二到第7 層的故障，BIG-IP 就把其從服務器隊列中拿出，不參加下一次的用戶請求的分配，直到其恢復正常。

　　◆觀察模式(Observed)：連接數目和響應時間以這兩項的最佳平衡為依據為新的請求選擇服務器。當其中某個服務器發生第二到第7 層的故障，BIG-IP就把其從服務器隊列中拿出，不參加下一次的用戶請求的分配，直到其恢復正常。

　　◆預測模式(Predictive)：BIG-IP利用收集到的服務器當前的性能指標，進行預測分析，選擇一台服務器在下一個時間片內，其性能將達到最佳的服務器相應用戶的請求。(被BIG-IP 進行檢測)

　　◆動態性能分配(Dynamic Ratio-APM):BIG-IP 收集到的應用程序和應用服務器的各項性能參數，動態調整流量分配。

　　◆動態服務器補充(Dynamic Server Act.):當主服務器群中因故障導致數量減少時，動態地將備份服務器補充至主服務器群。

　　◆服務類型(ToS): 按不同的服務類型(在Type of Field中標識)負載均衡對數據流進行分配。

　　◆規則模式：針對不同的數據流設置導向規則，用戶可自行

分享阿里雲SLB-負載均衡的實現基本原理架構

負載均衡技術原理淺析

1、技術架構

2、LVS技術特點

FULLNAT技術概述

SYNPROXY技術概述

集群部署方式

Keepalived優化

3、Tengine技術特點

4、更多功能

四層和七層負載均衡的區別

LVS：三種負載均衡方式比較

免責聲明！