http請求流程:一般情況下,提交動態請求的時候,nginx會直接把 請求轉交給php-fpm,而php-fpm再分配php-cgi進程來處理相關的請求,之后再依次返回,最后由nginx把結果反饋給客戶端瀏覽器。
Nginx 502 Bad Gateway錯誤是FastCGI有問題
解決辦法
遇到502問題,可以優先考慮按照以下兩個步驟去解決。
1、查看當前的PHP FastCGI進程數是否夠用(max_children值) netstat -anpo | grep "php-cgi"| wc -l 如果實際使用的“FastCGI進程數”接近預設的“FastCGI進程數”,那么,說明“FastCGI進程數”不夠用,需要增大。
2、部分PHP程序的執行時間超過了Nginx的等待時間(php內存不足) 增加nginx.conf配置文件中FastCGI的timeout時間,例如: fastcgi_connect_timeout 300; fastcgi_send_timeout 300; fastcgi_read_timeout 300; php.ini中的memory_limit=64M,重啟nginx。 如果這樣修改了還解決不了問題,可以參考下面這些方案:
3、max-children和max-requests 一台服務器上運行着nginx php(fpm) xcache,訪問量日均 300W pv左右 最近經常會出現這樣的情況:
php頁面打開很慢,cpu使用率突然降至很低,系統負載突然升至很高,查看網卡的流量,也會發現突然降到了很低。這種情況只持續數秒鍾就恢復了 檢查php-fpm的日志文件發現了一些線索: Sep3008:32:23.289973[NOTICE] fpm_unix_init_main(), line 271: getrlimit(nofile): max:51200,cur:51200 Sep3008:32:23.290212[NOTICE] fpm_sockets_init_main(), line 371:using inherited socket fd=10,“127.0.0.1:9000″ Sep3008:32:23.290342[NOTICE] fpm_event_init_main(), line 109: libevent:using epoll Sep3008:32:23.296426[NOTICE] fpm_init(), line 47: fpm is running, pid 30587 在這幾句的前面,是1000多行的關閉children和開啟children的日志 原來,php-fpm有一個參數 max_requests,該參數指明了,每個children最多處理多少個請求后便會被關閉,默認的設置是500。
因為php是把請求輪詢給每個children,在大流量下,每個childre到達max_requests所用的時間都差不多,這樣就造成所有的children基本上在同一時間被關閉。 在這期間,nginx無法將php文件轉交給php-fpm處理,所以cpu會降至很低(不用處理php,更不用執行sql),而負載會升至很高(關閉和開啟children、nginx等待php-fpm),
網卡流量也降至很低(nginx無法生成數據傳輸給客戶端) 增加children的數量,並且將 max_requests 設置未 0 或者一個比較大的值: 打開 /usr/local/php/etc/php-fpm.conf 調大以下兩個參數(根據服務器實際情況,過大也不行) <valuename=”max_children”>5120</value> <valuename=”max_requests”>600</value> 然后重啟php-fpm。 5、增加緩沖區容量大小 將nginx的error log打開,發現“pstream sent too big header while reading response header from upstream”這樣的錯誤提示。
查閱了一下資料,大意是nginx緩沖區有一個bug造成的,我們網站的頁面消耗占用緩沖區可能過大。參考老外寫的修改辦法增加了緩沖區容量大小設置,502問題徹底解決。
后來系統管理員又對參數做了調整只保留了2個設置參數:client head buffer,fastcgi buffer size。
6、request_terminate_timeout 如果主要是在一些post或者數據庫操作的時候出現502這種情況,而不是在靜態頁面操作中常見,那么可以查看一下php-fpm.conf設置中的一項:
request_terminate_timeout 這個值是max_execution_time,就是fast-cgi的執行腳本時間。 0s為關閉,就是無限執行下去。(當時裝的時候沒仔細看就改了一個數字) 優化fastcgi中,還可以改改這個值5s 看看效果。 php-cgi進程數不夠用、php執行時間長、或者是php-cgi進程死掉,都會出現502錯誤。
Nginx 502 Bad Gateway的含義是請求的PHP-CGI已經執行,但是由於某種原因(一般是讀取資源的問題)沒有執行完畢而導致PHP-CGI進程終止,一般來說Nginx 502 Bad Gateway和php-fpm.conf的設置有關。
php-fpm.conf有兩個至關重要的參數,一個是max_children,另一個是request_terminate_timeout,但是這個值不是通用的,而是需要自己計算的。在安裝好使用過程中出現502問題,一般是因為默認php-cgi進程是5個,可能因為php-cgi進程不夠用而造成502,需要修改/usr/local/php/etc/php-fpm.conf 將其中的max_children值適當增加。
計算的方式如下:
如果你的服務器性能足夠好,且寬帶資源足夠充足,PHP腳本沒有系循環或BUG的話你可以直接將 request_terminate_timeout設置成0s。0s的含義是讓PHP-CGI一直執行下去而沒有時間限制。而如果你做不到這一點,也就 是說你的PHP-CGI可能出現某個BUG,或者你的寬帶不夠充足或者其他的原因導致你的PHP-CGI假死那么就建議你給 request_terminate_timeout賦一個值,這個值可以根據服務器的性能進行設定。一般來說性能越好你可以設置越高,20分鍾-30分 鍾都可以。而max_children這個值又是怎么計算出來的呢?這個值原則上是越大越好,php-cgi的進程多了就會處理的很快,排隊的請求就會很少。 設置max_children也需要根據服務器的性能進行設定,一般來說一台服務器正常情況下每一個php-cgi所耗費的內存在20M左右。
按照官方的答案,排查了相關的可能,並結合了網友的答案,得出了下面的解決辦法。
1、查看php fastcgi的進程數(max_children值)
netstat -anpo | grep “php-cgi” | wc -l
5(假如顯示5)
2、查看當前進程
top觀察fastcgi進程數,假如使用的進程數等於或高於5個,說明需要增加(根據你機器實際狀況而定)
3、調整/usr/local/php/etc/php-fpm.conf 的相關設置
<value name=”max_children”>10</value><value name=”request_terminate_timeout”>60s</value>max_children最多10個進程,按照每個進程20MB內存,最多200MB。request_terminate_timeout執行的時間為60秒,也就是1分鍾。