CGI 和 FastCGI 協議的運行原理


介紹

在用PHP開發的過程中,我們常常使用Nginx或者Apache作為我們的Web服務器。但是PHP是如何與這些Web服務器通信的呢?

  • Apache把PHP作為一個模塊集成到Apache進程(httpd)運行,這種mod_php的運行模式與PHP-CGI沒有任何關系。

  • Nginx是通過PHP-FPM(PHP-FPM實現了FastCGI協議)來實現與PHP的通信。

要談FastCGI就必須先說說CGI。那什么是CGI?

CGI(Common Gateway Interface:通用網關接口)是Web 服務器運行時外部程序的規范,按CGI 編寫的程序可以擴展服務器功能。CGI 應用程序能與瀏覽器進行交互,還可通過數據庫API 與數據庫服務器等外部數據源進行通信,從數據庫服務器中獲取數據。--百度百科

CGI協議同 HTTP 協議一樣是一個「應用層」協議,它的 功能 是為了解決 Web 服務器與 PHP 應用(或其他 Web 應用)之間的通信問題。

既然它是一個「協議」,換言之它與語言無關,即只要是實現類 CGI 協議的應用就能夠實現相互的通信。

深入CGI協議

我們已經知道了 CGI 協議是為了完成 Web 服務器和應用之間進行數據通信這個問題。那么,這一節我們就來看看究竟它們之間是如何進行通信的。

簡單來講 CGI 協議它描述了 Web 服務器和應用程序之間進行數據傳輸的格式,並且只要我們的編程語言支持標准輸入(STDIN)、標准輸出(STDOUT)以及環境變量等處理,你就可以使用它來編寫一個 CGI 程序。

CGI的運行原理

  • 當用戶訪問我們的 Web 應用時,會發起一個 HTTP 請求。最終 Web 服務器接收到這個請求。

  • Web 服務器創建一個新的 CGI 進程。在這個進程中,將 HTTP 請求數據已一定格式解析出來,並通過標准輸入和環境變量傳入到 URL 指定的 CGI 程序(PHP 應用 $_SERVER)。

  • Web 應用程序處理完成后將返回數據寫入到標准輸出中,Web 服務器進程則從標准輸出流中讀取到響應,並采用 HTTP 協議返回給用戶響應。

一句話就是 Web 服務器中的 CGI 進程將接收到的 HTTP 請求數據讀取到環境變量中,通過標准輸入轉發給 PHP 的 CGI 程序;當 PHP 程序處理完成后,Web 服務器中的 CGI 進程從標准輸出中讀取返回數據,並轉換回 HTTP 響應消息格式,最終將頁面呈獻給用戶。然后 Web 服務器關閉掉這個 CGI 進程。

可以說 CGI 協議特別擅長處理 Web 服務器和 Web 應用的通信問題。然而,它有一個嚴重缺陷,對於每個請求都需要重新 fork 出一個 CGI 進程,處理完成后立即關閉。

CGI協議的缺陷

  • 每次處理用戶請求,都需要重新 fork CGI 子進程、銷毀 CGI 子進程。

  • 一系列的 I/O 開銷降低了網絡的吞吐量,造成了資源的浪費,在大並發時會產生嚴重的性能問題。

深入FastCGI協議

從功能上來講,CGI 協議已經完全能夠解決 Web 服務器與 Web 應用之間的數據通信問題。但是由於每個請求都需要重新 fork 出 CGI 子進程導致性能堪憂,所以基於 CGI 協議的基礎上做了改進便有了 FastCGI 協議,它是一種常駐型的 CGI 協議。

本質上來將 FastCGI 和 CGI 協議幾乎完全一樣,它們都可以從 Web 服務器里接收到相同的數據,不同之處在於采取了不同的通信方式。

再來回顧一下 CGI 協議每次接收到 HTTP 請求時,都需要經歷 fork 出 CGI 子進程、執行處理並銷毀 CGI 子進程這一系列工作。

FastCGI 協議采用 進程間通信(IPC) 來處理用戶的請求,下面我們就來看看它的運行原理。

FastCGI協議運行原理

  • FastCGI 進程管理器啟動時會創建一個 主(Master) 進程和多個 CGI 解釋器進程(Worker 進程),然后等待 Web 服務器的連接。

  • Web 服務器接收 HTTP 請求后,將 CGI 報文通過 套接字(UNIX 或 TCP Socket)進行通信,將環境變量和請求數據寫入標准輸入,轉發到 CGI 解釋器進程。

  • CGI 解釋器進程完成處理后將標准輸出和錯誤信息從同一連接返回給 Web 服務器。

  • CGI 解釋器進程等待下一個 HTTP 請求的到來。

為什么是 FastCGI 而非 CGI 協議

如果僅僅因為工作模式的不同,似乎並沒有什么大不了的。並沒到非要選擇 FastCGI 協議不可的地步。

然而,對於這個看似微小的差異,但意義非凡,最終的結果是實現出來的 Web 應用架構上的差異。

CGI 與 FastCGI 架構

在 CGI 協議中,Web 應用的生命周期完全依賴於 HTTP 請求的聲明周期。

對每個接收到的 HTTP 請求,都需要重啟一個 CGI 進程來進行處理,處理完成后必須關閉 CGI 進程,才能達到通知 Web 服務器本次 HTTP 請求處理完成的目的。

但是在 FastCGI 中完全不一樣。

FastCGI 進程是常駐型的,一旦啟動就可以處理所有的 HTTP 請求,而無需直接退出。

再看 FastCGI 協議

通過前面的講解,我們相比已經可以很准確的說出來 FastCGI 是一種通信協議 這樣的結論。現在,我們就將關注的焦點挪到協議本身,來看看這個協議的定義。

同 HTTP 協議一樣,FastCGI 協議也是有消息頭和消息體組成。

消息頭信息

主要的消息頭信息如下:

  • Version: 用於表示 FastCGI 協議版本號。

  • Type: 用於標識 FastCGI 消息的類型 - 用於指定處理這個消息的方法。

  • RequestID: 標識出當前所屬的 FastCGI 請求。

  • Content Length: 數據包包體所占字節數。

消息類型定義

  • BEGIN_REQUEST: 從 Web 服務器發送到 Web 應用,表示開始處理新的請求。

  • ABORT_REQUEST: 從 Web 服務器發送到 Web 應用,表示中止一個處理中的請求。比如,用戶在瀏覽器發起請求后按下瀏覽器上的「停止按鈕」時,會觸發這個消息。

  • END_REQUEST: 從 Web 應用發送給 Web 服務器,表示該請求處理完成。返回數據包里包含「返回的代碼」,它決定請求是否成功處理。

  • PARAMS: 「流數據包」,從 Web 服務器發送到 Web 應用。此時可以發送多個數據包。發送結束標識為從 Web 服務器發出一個長度為 0 的空包。且 PARAMS 中的數據類型和 CGI 協議一致。即我們使用 $_SERVER 獲取到的系統環境等。

  • STDIN: 「流數據包」,用於 Web 應用從標准輸入中讀取出用戶提交的 POST 數據。

  • STDOUT: 「流數據報」,從 Web 應用寫入到標准輸出中,包含返回給用戶的數據。

Web 服務器和 FastCGI 交互過程

  • Web 服務器接收用戶請求,但最終處理請求由 Web 應用完成。此時,Web 服務器嘗試通過套接字(UNIX 或 TCP 套接字,具體使用哪個由 Web 服務器配置決定)連接到 FastCGI 進程。

  • FastCGI 進程查看接收到的連接。選擇「接收」或「拒絕」連接。如果是「接收」連接,則從標准輸入流中讀取數據包。

  • 如果 FastCGI 進程在指定時間內沒有成功接收到連接,則該請求失敗。否則,Web 服務器發送一個包含唯一的RequestID 的 BEGIN_REQUEST 類型消息給到 FastCGI 進程。后續所有數據包發送都包含這個 RequestID。 然后,Web 服務器發送任意數量的 PARAMS 類型消息到 FastCGI 進程。一旦發送完畢,Web 服務器通過發送一個空PARAMS 消息包,然后關閉這個流。 另外,如果用戶發送了 POST 數據 Web 服務器會將其寫入到 標准輸入(STDIN) 發送給 FastCGI 進程。當所有 POST 數據發送完成,會發送一個空的 標准輸入(STDIN) 來關閉這個流。

  • 同時,FastCGI 進程接收到 BEGINREQUEST 類型數據包。它可以通過響應 ENDREQUEST 來拒絕這個請求。或者接收並處理這個請求。如果接收請求,FastCGI 進程會等待接收所有的 PARAMS 和 標准輸入數據包。 然后,在處理請求並將返回結果寫入 標准輸出(STDOUT) 流。處理完成后,發送一個空的數據包到標准輸出來關閉這個流,並且會發送一個 END_REQUEST 類型消息通知 Web 服務器,告知它是否發生錯誤異常。

為什么需要在消息頭發送 RequestID 這個標識?

如果是每個連接僅處理一個請求,發送 RequestID 則略顯多余。

但是我們的 Web 服務器和 FastCGI 進程之間的連接可能處理多個請求,即一個連接可以處理多個請求。所以才需要采用數據包協議而不是直接使用單個數據流的原因:以實現「多路復用」。

因此,由於每個數據包都包含唯一的 RequestID,所以 Web 服務器才能在一個連接上發送任意數量的請求,並且 FastCGI 進程也能夠從一個連接上接收到任意數量的請求數據包。

另外我們還需要明確一點就是 Web 服務器 與 FastCGI 進程間通信是 無序的。即使我們在交互過程中看起來一個請求是有序的,但是我們的 Web 服務器也有可能在同一時間發出幾十個 BEGIN_REQUEST 類型的數據包,以此類推。

PHP-FPM

PHP-FPM即PHP-FastCGI Process Manager.

PHP-FPM是FastCGI的實現,並提供了進程管理的功能。

進程包含 master 進程和 worker 進程兩種進程。

master 進程只有一個,負責監聽端口,接收來自 Web Server 的請求,而 worker 進程則一般有多個(具體數量根據實際需要配置),每個進程內部都嵌入了一個 PHP 解釋器,是 PHP 代碼真正執行的地方。

PHP-FPM 是 FastCGI 進程管理器(PHP FastCGI Process Manager)(http://php.net/manual/zh/install.fpm.php),用於替換 PHP 內核的 FastCGI 的大部分附加功能(或者說一種替代的 PHP FastCGI 實現),對於高負載網站是非常有用的。

PHP-FPM如何工作的?

PHP-FPM 進程管理器有兩種進程組成,一個 Master 進程和多個 Worker 進程。Master 進程負責監聽端口,接收來自 Web 服務器的請求,然后指派具體的 Worker 進程處理請求;worker 進程則一般有多個 (依據配置決定進程數),每個進程內部都嵌入了一個 PHP 解釋器,用來執行 PHP 代碼。

Nginx 服務器如何與 FastCGI 協同工作

Nginx 服務器無法直接與 FastCGI 服務器進行通信,需要啟用 ngx_http_fastcgi_module 模塊進行代理配置,才能將請求發送給 FastCGI 服務。

轉載:

PHP和Apache是如何通信的?

Nginx+PHP-FPM運行原理詳解

掌握CGI和FastCGI協議的運行原理


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM