Nginx為什么支持那么高的並發量?


我之前對常見的 IO模型做了詳細總結,原理搞懂了,今天面試,面試官問了我一個問題:

nginx為什么有那么高的並發量?我竟然語塞了!!!

哎!人吶,最怕的就是學東西只學一半兒,兄弟們可長點心吧!!!

Nginx跟IO多路復用

Nginx 以其高性能,穩定性,豐富的功能,簡單的配置和低資源消耗而聞名。本文從底層原理分析 Nginx 為什么這么快!

Nginx 的進程模型

img

Nginx 服務器,正常運行過程中:

  • 多進程:一個 Master 進程、多個 Worker 進程。

  • Master 進程:管理 Worker 進程。

    • 對外接口:接收外部的操作(信號);
    • 對內轉發:根據外部操作的不同,通過信號管理 Worker;
    • 監控:監控 Worker 進程的運行狀態,Worker 進程異常終止后,自動重啟 Worker 進程。
  • Worker 進程:所有 Worker 進程都是平等的。

    • 實際處理:網絡請求,由 Worker 進程處理。
    • Worker 進程數量在 nginx.conf 中配置,一般設置為核心數,充分利用 CPU 資源,同時,避免進程數量過多,避免進程競爭 CPU 資源,增加上下文切換的損耗。

思考:

  1. 請求是連接到 Nginx,Master 進程負責處理和轉發?
  2. 如何選定哪個 Worker 進程處理請求?請求的處理結果,是否還要經過 Master 進程?

img

HTTP 連接建立和請求處理過程

HTTP 連接建立和請求處理過程如下:

  1. Nginx 啟動時,Master 進程,加載配置文件。
  2. Master 進程,初始化監聽的 Socket。
  3. Master 進程,Fork 出多個 Worker 進程。
  4. Worker 進程,競爭新的連接,獲勝方通過三次握手,建立 Socket 連接,並處理請求。

Nginx 高性能、高並發

Nginx 為什么擁有高性能並且能夠支撐高並發?

  1. Nginx 采用多進程+異步非阻塞方式(IO 多路復用 Epoll)。

    • 請求的完整過程:建立連接→讀取請求→解析請求→處理請求→響應請求。
    • 請求的完整過程對應到底層就是:讀寫 Socket 事件。
  2. Nginx 的事件處理模型

    • Request:Nginx 中 HTTP 請求。
  3. 基本的 HTTP Web Server 工作模式:

    • 接收請求:逐行讀取請求行和請求頭,判斷段有請求體后,讀取請求體。**
    • 處理請求。
    • 返回響應:**根據處理結果,生成相應的 HTTP 請求(響應行、響應頭、響應體)。
  4. Nginx 也是這個套路,整體流程一致:

img

模塊化體系結構

img

Nginx 的模塊

Nginx 的模塊根據其功能基本上可以分為以下幾種類型:

  • ① event module:搭建了獨立於操作系統的事件處理機制的框架,及提供了各具體事件的處理。包括 ngx_events_module,ngx_event_core_module 和 ngx_epoll_module 等。

    • Nginx 具體使用何種事件處理模塊,這依賴於具體的操作系統和編譯選項。
  • ② phase handler:此類型的模塊也被直接稱為 handler 模塊。主要負責處理客戶端請求並產生待響應內容,比如 ngx_http_static_module 模塊,負責客戶端的靜態頁面請求處理並將對應的磁盤文件准備為響應內容輸出。

  • ③ output filter:也稱為 filter 模塊,主要是負責對輸出的內容進行處理,可以對輸出進行修改。

    • 例如,可以實現對輸出的所有 html 頁面增加預定義的 footbar 一類的工作,或者對輸出的圖片的 URL 進行替換之類的工作。
  • ④ upstream:upstream 模塊實現反向代理的功能,將真正的請求轉發到后端服務器上,並從后端服務器上讀取響應,發回客戶端。

    • upstream 模塊是一種特殊的 handler,只不過響應內容不是真正由自己產生的,而是從后端服務器上讀取的。
  • ⑤ load-balancer:負載均衡模塊,實現特定的算法,在眾多的后端服務器中,選擇一個服務器出來作為某個請求的轉發服務器。

常見問題剖析

Nginx vs Apache

Nginx:

  • IO 多路復用,Epoll(freebsd 上是 kqueue)

  • 高性能

  • 高並發

  • 占用系統資源少

Apache:

  • 阻塞+多進程/多線程

  • 更穩定,Bug 少

  • 模塊更豐富

Nginx 最大連接數

基礎背景:

  1. Nginx 是多進程模型,Worker 進程用於處理請求。
  2. 單個進程的連接數(文件描述符 fd),有上限(nofile):ulimit -n。
  3. Nginx 上配置單個 Worker 進程的最大連接數:worker_connections 上限為 nofile。
  4. Nginx 上配置 Worker 進程的數量:worker_processes。

因此,Nginx 的最大連接數:

  • Nginx 的最大連接數:Worker 進程數量 x 單個 Worker 進程的最大連接數。

  • 上面是 Nginx 作為通用服務器時,最大的連接數。

  • Nginx 作為反向代理服務器時,能夠服務的最大連接數:(Worker 進程數量 x 單個 Worker 進程的最大連接數)/ 2。

  • Nginx 反向代理時,會建立 Client 的連接和后端 Web Server 的連接,占用 2 個連接。

思考:

  1. 每打開一個 Socket 占用一個 fd?
  2. 為什么,一個進程能夠打開的 fd 數量有限制?

HTTP 請求和響應

HTTP 請求:

  1. 請求行:method、uri、http version
  2. 請求頭
  3. 請求體

HTTP 響應:

  1. 響應行:http version、status code
  2. 響應頭
  3. 響應體

IO 模型

IO模型詳細請參見

處理多個請求時,可以采用:IO 多路復用或者阻塞 IO+多線程:

  • IO 多路復用:一個線程,跟蹤多個 Socket 狀態,哪個就緒,就讀寫哪個。

  • 阻塞 IO+多線程:每一個請求,新建一個服務線程。

IO 多路復用和多線程的適用場景?

IO 多路復用:

單個連接的請求處理速度沒有優勢

  1. 大並發量:只使用一個線程,處理大量的並發請求,降低上下文環境切換損耗,也不需要考慮並發問題,相對可以處理更多的請求。
  2. 消耗更少的系統資源(不需要線程調度開銷)。
  3. 適用於長連接的情況(多線程模式長連接容易造成線程過多,造成頻繁調度)。

阻塞 IO +多線程:

實現簡單,可以不依賴系統調用

  1. 每個線程,都需要時間和空間。
  2. 線程數量增長時,線程調度開銷指數增長。

select/poll 和 epoll 比較如下:

select/poll 系統調用:

select 系統調用

int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);

select:

  1. 查詢 fd_set 中,是否有就緒的 fd,可以設定一個超時時間,當有 fd (File descripter) 就緒或超時返回。

  2. fd_set 是一個位集合,大小是在編譯內核時的常量,默認大小為 1024。

  3. 特點:

    • 連接數限制:fd_set 可表示的 fd 數量太小了;
    • 線性掃描:判斷 fd 是否就緒,需要遍歷一邊 fd_set;
    • 數據復制:用戶空間和內核空間,復制連接就緒狀態信息。

poll 系統調用

int poll(struct pollfd fds[], nfds_t nfds, int timeout);

poll:

  1. 解決了連接數限制:poll 中將 select 中的 fd_set 替換成了一個 pollfd 數組,解決 fd 數量過小的問題。
  2. 數據復制:用戶空間和內核空間,復制連接就緒狀態信息。

epoll,event 事件驅動:

  1. 事件機制:避免線性掃描,為每個 fd,注冊一個監聽事件,fd 變更為就緒時,將 fd 添加到就緒鏈表。

  2. fd 數量:無限制(OS 級別的限制,單個進程能打開多少個 fd)。

select,poll,epoll:

I/O 多路復用的機制。

  1. I/O 多路復用就通過一種機制,可以監視多個描述符,一旦某個描述符就緒(一般是讀就緒或者寫就緒),能夠通知程序進行相應的讀寫操作;監視多個文件描述符。

  2. 但 select,poll,epoll 本質上都是同步 I/O:用戶進程負責讀寫(從內核空間拷貝到用戶空間),讀寫過程中,用戶進程是阻塞的;

  3. 異步 IO:無需用戶進程負責讀寫,異步 IO,會負責從內核空間拷貝到用戶空間。

Nginx 的並發處理能力

關於 Nginx 的並發處理能力:並發連接數,一般優化后,峰值能保持在 1~3w 左右。(內存和 CPU 核心數不同,會有進一步優化空間)。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM