Nginx系列:后端服務應用健康檢測


嚴格來說,nginx到目前為止沒有針對負載均衡后端節點的健康檢測的模塊,但是可以通過proxy_next_upstream來間接實現,但proxy_next_upstream還是會把請求轉發給故障服務器的,然后再轉發給別的服務器,這樣就需要多一次轉發。nginx_upstream_check_module為淘寶技術團隊開發的nginx模塊,用來檢測后方server的健康狀態,如果后端服務器不可用,則請求不再轉發到這台服務器。

官網: https://github.com/yaoweibin/nginx_upstream_check_module 

 

0x01: 安裝nginx_upstream_check_module模塊

以下命令均在root用戶下執行

下載

wget https://codeload.github.com/yaoweibin/nginx_upstream_check_module/zip/v0.3.0

下載zip文件

unzip nginx_upstream_check_module-0.3.0.zip  

進入nginx源碼目錄,進行打該模塊的補丁(這一步千萬不能遺漏)

根據官網如下提示

 

在nginx-1.16.1目錄執行如下命令,nginx_upstream_check_module源碼目錄跟nginx源碼目錄同級

patch -p1 < ../nginx_upstream_check_module-0.3.0/check_1.7.2+.patch  

出現如下錯誤,推斷可能是版本不兼容

 

看下官網發現nginx_upstream_check_module-0.3.0標簽是2014年打的比較老,查看master源碼發現patch已經更新了很多,應該是README文件沒有更新

 

重新執行以下步驟,獲取最新nginx_upstream_check_module

#下載 wget https://codeload.github.com/yaoweibin/nginx_upstream_check_module/zip/master #解壓 unzip nginx_upstream_check_module-master.zip #重新解壓一個nginx  tar -zxvf nginx-1.16.1.tar.gz  #打補丁 patch -p1 < ../nginx_upstream_check_module-master/check_1.16.1+.patch 

先查看之前安裝nginx的配置項

 

然后通過./configure --add-module來增加模塊

./configure --prefix=/usr/local/nginx --user=nginx \
--group=nginx --add-module=../nginx_upstream_check_module-master 

注意:如果之前安裝過nginx,需要將之前的configure參數保留

執行mak編譯nginx

make

make之后的操作需要注意,如果nginx第一次安裝,直接執行make install即可

make install

如果單純添加模塊,不需要install,而是執行以下操作,將打過補丁的nginx二進制文件覆蓋/usr/local/nginx/sbin/目錄中的文件即可

#備份之前的nginx mv /usr/local/nginx/sbin/nginx  /usr/local/nginx/sbin/nginx.bak #拷貝新的nginx到sbin目錄 cp /nginx源碼目錄/objs/nginx   /usr/local/nginx/sbin/

0x02:配置nginx upstream參數

  • 在配置參數之前,可以先參考【Nginx系列:負載均衡】創建兩個服務
  • 新增接口健康檢查接口: /health/status
package com.olive.controller; import java.util.HashMap; import java.util.Map; import org.springframework.web.bind.annotation.GetMapping; import org.springframework.web.bind.annotation.RestController; @RestController public class UserController {     @GetMapping("/health/status")     public Map<String, Object> checkHealth() {         Map<String, Object> result = new HashMap<>();         result.put("code", "000000");         result.put("message", "ok");         result.put("body", "我是服務器8866"); //        result.put("body", "我是服務器8867");         return result;     } } 
  • 健康檢查配置
 upstream myserver {       server 192.168.56.1:8866;          server 192.168.56.1:8867;          #http健康檢查相關配置          check interval=3000 rise=2 fall=3 timeout=3000 type=http;          #/health/status為后端健康檢查接口          check_http_send "HEAD /health/status HTTP/1.0\r\n\r\n";          check_http_expect_alive http_2xx http_3xx;     } 

詳細見圖

 

interval: 向后端發送的健康檢查包的間隔,單位為毫秒

rsie: 如果連續成功次數達到rise_count,服務器就被認為是up

fall: 如果連續失敗次數達到fall_count,服務器就被認為是down

timeout: 后端健康請求的超時時間,單位為毫秒

type: 健康檢查包的類型,支持tcp、ssl_hello、http、mysql、ajp

  • 如果想查看后端服務器實時的健康狀態,可以在對應server中增加以下location配置
location /nstatus {
  check_status;
  access_log off;   #allow SOME.IP.ADD.RESS;   #deny all; }

0x03:查看健康檢查狀態

通過http://localhost:80/nstatus 查看,剛開始后端兩個節點都處於停止狀態,status為down

 

server number為后端服務器數量,generation為nginx reload的次數

此時啟動其中一台8867,查看nginx的error.log日志,出現如下日志,說明8867這台應用已經處於可檢查狀態

2020/08/21 23:03:55 [error] 10809#0: enable check peer: 192.168.56.1:8867 

刷新nstatus頁面,如下圖所示,發現8867這台狀態變為了up,表示已連接成功

 

啟動8866,與8867過程相同,最終頁面狀態變為如下,此時兩台狀態均為up:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM