CGI 和 FastCGI 協議的運行原理

本文轉載自查看原文 2018-10-22 10:32 2488 PHP-FPM/ PHP/ FastCGI

介紹
深入CGI協議
- CGI的運行原理
- CGI協議的缺陷
深入FastCGI協議
PHP-FPM
- PHP-FPM如何工作的？
- Nginx 服務器如何與 FastCGI 協同工作

介紹

在用PHP開發的過程中，我們常常使用Nginx或者Apache作為我們的Web服務器。但是PHP是如何與這些Web服務器通信的呢？

Apache把PHP作為一個模塊集成到Apache進程(httpd)運行,這種mod_php的運行模式與PHP-CGI沒有任何關系。
Nginx是通過PHP-FPM（PHP-FPM實現了FastCGI協議)來實現與PHP的通信。

要談FastCGI就必須先說說CGI。那什么是CGI？

CGI(Common Gateway Interface:通用網關接口)是Web 服務器運行時外部程序的規范,按CGI 編寫的程序可以擴展服務器功能。CGI 應用程序能與瀏覽器進行交互,還可通過數據庫API 與數據庫服務器等外部數據源進行通信,從數據庫服務器中獲取數據。--百度百科

CGI協議同 HTTP 協議一樣是一個「應用層」協議，它的功能是為了解決 Web 服務器與 PHP 應用（或其他 Web 應用）之間的通信問題。

既然它是一個「協議」，換言之它與語言無關，即只要是實現類 CGI 協議的應用就能夠實現相互的通信。

深入CGI協議

我們已經知道了 CGI 協議是為了完成 Web 服務器和應用之間進行數據通信這個問題。那么，這一節我們就來看看究竟它們之間是如何進行通信的。

簡單來講 CGI 協議它描述了 Web 服務器和應用程序之間進行數據傳輸的格式，並且只要我們的編程語言支持標准輸入（STDIN）、標准輸出（STDOUT）以及環境變量等處理，你就可以使用它來編寫一個 CGI 程序。

CGI的運行原理

當用戶訪問我們的 Web 應用時，會發起一個 HTTP 請求。最終 Web 服務器接收到這個請求。
Web 服務器創建一個新的 CGI 進程。在這個進程中，將 HTTP 請求數據已一定格式解析出來，並通過標准輸入和環境變量傳入到 URL 指定的 CGI 程序（PHP 應用 $_SERVER）。
Web 應用程序處理完成后將返回數據寫入到標准輸出中，Web 服務器進程則從標准輸出流中讀取到響應，並采用 HTTP 協議返回給用戶響應。

一句話就是 Web 服務器中的 CGI 進程將接收到的 HTTP 請求數據讀取到環境變量中，通過標准輸入轉發給 PHP 的 CGI 程序；當 PHP 程序處理完成后，Web 服務器中的 CGI 進程從標准輸出中讀取返回數據，並轉換回 HTTP 響應消息格式，最終將頁面呈獻給用戶。然后 Web 服務器關閉掉這個 CGI 進程。

可以說 CGI 協議特別擅長處理 Web 服務器和 Web 應用的通信問題。然而，它有一個嚴重缺陷，對於每個請求都需要重新 fork 出一個 CGI 進程，處理完成后立即關閉。

CGI協議的缺陷

每次處理用戶請求，都需要重新 fork CGI 子進程、銷毀 CGI 子進程。
一系列的 I/O 開銷降低了網絡的吞吐量，造成了資源的浪費，在大並發時會產生嚴重的性能問題。

深入FastCGI協議

從功能上來講，CGI 協議已經完全能夠解決 Web 服務器與 Web 應用之間的數據通信問題。但是由於每個請求都需要重新 fork 出 CGI 子進程導致性能堪憂，所以基於 CGI 協議的基礎上做了改進便有了 FastCGI 協議，它是一種常駐型的 CGI 協議。

本質上來將 FastCGI 和 CGI 協議幾乎完全一樣，它們都可以從 Web 服務器里接收到相同的數據，不同之處在於采取了不同的通信方式。

再來回顧一下 CGI 協議每次接收到 HTTP 請求時，都需要經歷 fork 出 CGI 子進程、執行處理並銷毀 CGI 子進程這一系列工作。

而 FastCGI 協議采用 進程間通信(IPC) 來處理用戶的請求，下面我們就來看看它的運行原理。

FastCGI協議運行原理

FastCGI 進程管理器啟動時會創建一個主（Master）進程和多個 CGI 解釋器進程（Worker 進程），然后等待 Web 服務器的連接。
Web 服務器接收 HTTP 請求后，將 CGI 報文通過套接字（UNIX 或 TCP Socket）進行通信，將環境變量和請求數據寫入標准輸入,轉發到 CGI 解釋器進程。
CGI 解釋器進程完成處理后將標准輸出和錯誤信息從同一連接返回給 Web 服務器。
CGI 解釋器進程等待下一個 HTTP 請求的到來。

為什么是 FastCGI 而非 CGI 協議

如果僅僅因為工作模式的不同，似乎並沒有什么大不了的。並沒到非要選擇 FastCGI 協議不可的地步。

然而，對於這個看似微小的差異，但意義非凡，最終的結果是實現出來的 Web 應用架構上的差異。

CGI 與 FastCGI 架構

在 CGI 協議中，Web 應用的生命周期完全依賴於 HTTP 請求的聲明周期。

對每個接收到的 HTTP 請求，都需要重啟一個 CGI 進程來進行處理，處理完成后必須關閉 CGI 進程，才能達到通知 Web 服務器本次 HTTP 請求處理完成的目的。

但是在 FastCGI 中完全不一樣。

FastCGI 進程是常駐型的，一旦啟動就可以處理所有的 HTTP 請求，而無需直接退出。

再看 FastCGI 協議

通過前面的講解，我們相比已經可以很准確的說出來 FastCGI 是一種通信協議 這樣的結論。現在，我們就將關注的焦點挪到協議本身，來看看這個協議的定義。

同 HTTP 協議一樣，FastCGI 協議也是有消息頭和消息體組成。

消息頭信息

主要的消息頭信息如下:

Version: 用於表示 FastCGI 協議版本號。
Type: 用於標識 FastCGI 消息的類型 - 用於指定處理這個消息的方法。
RequestID: 標識出當前所屬的 FastCGI 請求。
Content Length: 數據包包體所占字節數。

消息類型定義

BEGIN_REQUEST: 從 Web 服務器發送到 Web 應用，表示開始處理新的請求。
ABORT_REQUEST: 從 Web 服務器發送到 Web 應用，表示中止一個處理中的請求。比如，用戶在瀏覽器發起請求后按下瀏覽器上的「停止按鈕」時，會觸發這個消息。
END_REQUEST: 從 Web 應用發送給 Web 服務器，表示該請求處理完成。返回數據包里包含「返回的代碼」，它決定請求是否成功處理。
PARAMS: 「流數據包」，從 Web 服務器發送到 Web 應用。此時可以發送多個數據包。發送結束標識為從 Web 服務器發出一個長度為 0 的空包。且 PARAMS 中的數據類型和 CGI 協議一致。即我們使用 $_SERVER 獲取到的系統環境等。
STDIN: 「流數據包」，用於 Web 應用從標准輸入中讀取出用戶提交的 POST 數據。
STDOUT: 「流數據報」，從 Web 應用寫入到標准輸出中，包含返回給用戶的數據。

Web 服務器和 FastCGI 交互過程

Web 服務器接收用戶請求，但最終處理請求由 Web 應用完成。此時，Web 服務器嘗試通過套接字（UNIX 或 TCP 套接字，具體使用哪個由 Web 服務器配置決定）連接到 FastCGI 進程。
FastCGI 進程查看接收到的連接。選擇「接收」或「拒絕」連接。如果是「接收」連接，則從標准輸入流中讀取數據包。
如果 FastCGI 進程在指定時間內沒有成功接收到連接，則該請求失敗。否則，Web 服務器發送一個包含唯一的RequestID 的 BEGIN_REQUEST 類型消息給到 FastCGI 進程。后續所有數據包發送都包含這個 RequestID。然后，Web 服務器發送任意數量的 PARAMS 類型消息到 FastCGI 進程。一旦發送完畢，Web 服務器通過發送一個空PARAMS 消息包，然后關閉這個流。另外，如果用戶發送了 POST 數據 Web 服務器會將其寫入到標准輸入（STDIN）發送給 FastCGI 進程。當所有 POST 數據發送完成，會發送一個空的標准輸入（STDIN）來關閉這個流。
同時，FastCGI 進程接收到 BEGINREQUEST 類型數據包。它可以通過響應 ENDREQUEST 來拒絕這個請求。或者接收並處理這個請求。如果接收請求，FastCGI 進程會等待接收所有的 PARAMS 和標准輸入數據包。然后，在處理請求並將返回結果寫入標准輸出（STDOUT）流。處理完成后，發送一個空的數據包到標准輸出來關閉這個流，並且會發送一個 END_REQUEST 類型消息通知 Web 服務器，告知它是否發生錯誤異常。

為什么需要在消息頭發送 RequestID 這個標識？

如果是每個連接僅處理一個請求，發送 RequestID 則略顯多余。

但是我們的 Web 服務器和 FastCGI 進程之間的連接可能處理多個請求，即一個連接可以處理多個請求。所以才需要采用數據包協議而不是直接使用單個數據流的原因：以實現「多路復用」。

因此，由於每個數據包都包含唯一的 RequestID，所以 Web 服務器才能在一個連接上發送任意數量的請求，並且 FastCGI 進程也能夠從一個連接上接收到任意數量的請求數據包。

另外我們還需要明確一點就是 Web 服務器與 FastCGI 進程間通信是無序的。即使我們在交互過程中看起來一個請求是有序的，但是我們的 Web 服務器也有可能在同一時間發出幾十個 BEGIN_REQUEST 類型的數據包，以此類推。

PHP-FPM

PHP-FPM即PHP-FastCGI Process Manager.

PHP-FPM是FastCGI的實現，並提供了進程管理的功能。

進程包含 master 進程和 worker 進程兩種進程。

master 進程只有一個，負責監聽端口，接收來自 Web Server 的請求，而 worker 進程則一般有多個(具體數量根據實際需要配置)，每個進程內部都嵌入了一個 PHP 解釋器，是 PHP 代碼真正執行的地方。

PHP-FPM 是 FastCGI 進程管理器（PHP FastCGI Process Manager）(http://php.net/manual/zh/install.fpm.php)，用於替換 PHP 內核的 FastCGI 的大部分附加功能（或者說一種替代的 PHP FastCGI 實現），對於高負載網站是非常有用的。

PHP-FPM如何工作的？

PHP-FPM 進程管理器有兩種進程組成，一個 Master 進程和多個 Worker 進程。Master 進程負責監聽端口，接收來自 Web 服務器的請求，然后指派具體的 Worker 進程處理請求；worker 進程則一般有多個 (依據配置決定進程數)，每個進程內部都嵌入了一個 PHP 解釋器，用來執行 PHP 代碼。

Nginx 服務器如何與 FastCGI 協同工作

Nginx 服務器無法直接與 FastCGI 服務器進行通信，需要啟用 ngx_http_fastcgi_module 模塊進行代理配置，才能將請求發送給 FastCGI 服務。

轉載:

PHP和Apache是如何通信的?

Nginx+PHP-FPM運行原理詳解

掌握CGI和FastCGI協議的運行原理

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 PHP-FPM、CGI、FastCGI以及Nginx運行PHP的原理簡述簡單了解下CGI、FastCGI和php-fpm的概念和區別和運行原理 Nginx FastCGI的運行原理 CGI與FastCGI APACHE PHP的幾種運行方式（CGI,FASTCGI） php的幾種運行模式CLI、CGI、FastCGI、mod_php apache php的幾種運行方式（cgi,fastcgi php的幾種運行模式CLI、CGI、FastCGI、mod_php Nginx解析PHP的原理 | CGI、FastCGI及php-fpm的關系 Nginx+FastCGI運行原理(一)