nginx負載均衡
負載均衡建立在現有網絡結構之上,提供了一種廉價有效透明的方法擴展網絡設備和服務器的帶寬,增加吞吐量、加強網絡數據處理能力、提高網絡的靈活性和可用性。
隨着網站的發展,服務器壓力越來越大,我們可能首先會將數據庫,靜態文件分離出去。但是隨着發展,單獨業務API的請求的壓力也會變得很大,這時候我們可能需要做負載均衡將一台服務器面臨的壓力分散到多台服務器上。
nginx 不僅可以作為強大的web服務器,也可以作為反向代理服務器,而且nginx還可以按照調度規則實現動靜分離,還可以對后端的服務器做負載均衡。
nginx負載均衡配置
nginx的負載均衡主要是對proxy_pass和upstream的配置。
我們首先需要建立一個Spring Boot的項目對外提供服務,來模擬我們實際的服務,還可以配置其它可以提供網絡請求處理的框架來提供服務,這里具體由什么來提供服務和nginx配置並不相關。
Spring Boot 項目建立的過程就不提了,這里只貼一下主要的代碼:
import org.springframework.beans.factory.annotation.Value;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;
@RestController
@SpringBootApplication
public class NginxtestApplication {
@Value("${server.port:}")
private String port;
public static void main(String[] args) {
SpringApplication.run(NginxtestApplication.class, args);
}
@GetMapping("")
public String hello() {
System.out.println("call me " + port);
return "i am " + port;
}
}
將項目打包后,我們執行下面的命令
java -jar test.jar --server.port=8001
java -jar test.jar --server.port=8002
接下來我們打開nginx的配置文件
http {
upstream upstream_name{
server 192.168.0.28:8001;
server 192.168.0.28:8002;
}
server {
listen 8080;
server_name localhost;
location / {
proxy_pass http://upstream_name;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
}
}
}
我這里沒有把默認的一些配置貼出來。
首先,在http下添加 upstream upstream_name {}
來配置要映射的服務器。
其中的upstream_name
大家可以指定為服務的域名或者項目的代號。
server下的location 我們將 /
下的全部請求轉發到 http://upstream_name
,也就是我們上面配置的服務器列表中的某一台服務器上。具體是哪台服務器,nginx會根據配置的調度算法來確認。
我們在瀏覽器中打開localhost:8080
。多刷新幾次就可以看到頁面上的內容發生了變化。
nginx負載均衡策略
nginx的負載均衡策略有4種:
輪詢(默認)
最基本的配置方法,它是upstream的默認策略,每個請求會按時間順序逐一分配到不同的后端服務器。
參數有:
參數 | 描述 |
---|---|
fail_timeout | 與max_fails結合使用 |
max_fails | 設置在fail_timeout參數設置的時間內最大失敗次數,如果在這個時間內,所有針對該服務器的請求都失敗了,那么認為該服務器會被認為是停機了 |
fail_time | 服務器會被認為停機的時間長度,默認為10s。 |
backup | 標記該服務器為備用服務器。當主服務器停止時,請求會被發送到它這里。 |
down | 標記服務器永久停機了。 |
注意:
- 在輪詢中,如果服務器down掉了,會自動剔除該服務器。
- 缺省配置就是輪詢策略。
- 此策略適合服務器配置相當,無狀態且短平快的服務使用。
權重
在輪詢策略的基礎上制定淪陷的幾率。例如
upstream foo {
server localhost:8001 weight=2;
server localhost:8002;
server localhost:8003 backup;
server localhost:8004 max_fails=3 fail_timeout=20s;
}
這里例子中,weight參數用於制定輪詢的幾率,weight默認值為1;weight的數值和被訪問的幾率成正比。
注意:
- 權重越高分配到需要處理的請求越多。
- 此策略可以與least_conn和ip_hash結合使用。
- 此策略比較適合服務器的硬件配置差別比較大的情況。
ip_hash
負載均衡器按照客戶端IP地址的分配方式,可以確保相同客戶端的請求一直發送到相同的服務器。這樣每個訪客都固定訪問一個后端服務器。
upstream foo {
ip_hash;
server localhost:8001 weight=2;
server localhost:8002;
server localhost:8003;
server localhost:8004 max_fails=3 fail_timeout=20s;
}
注意:
- 在nginx版本1.3.1之前,不能在ip_hash中使用權重(weight)。
- ip_hash不能與backup同時使用。
- 此策略適合有狀態服務,比如session。
- 當有服務器需要剔除,必須手動down掉。
least_conn 最小連接
把請求轉發給連接數較少的后端服務器。輪詢算法是把請求平均的轉發給各個后端,使它們的負載大致相同;但是,有些請求占用的時間很長,會導致其所在的后端負載較高。這種情況下,least_conn這種方式就可以達到更好的負載均衡效果
upstream foo {
least_conn;
server localhost:8001 weight=2;
server localhost:8002;
server localhost:8003 backup;
server localhost:8004 max_fails=3 fail_timeout=20s;
}
注意:
- 此負載均衡策略適合請求處理時間長短不一造成服務器過載的情況。
除了上面這些調度策略之后,還有一些第三方的調度策略可以集成到nginx中。
在實際運用中,需要根據不同的場景選擇不同的策略,大多是多種策略結合使用以達到實際需求的性能。