nginx網站502與504錯誤分析

本文轉載自查看原文 2021-06-05 09:17 1701

狀態代碼解釋

502 Bad Gateway：作為網關或者代理工作的服務器嘗試執行請求時，從上游服務器接收到無效的響應。
504 Gateway Time-out：作為網關或者代理工作的服務器嘗試執行請求時，未能及時從上游服務器（URI標識出的服務器，例如HTTP、FTP、LDAP）或者輔助服務器（例如DNS）收到響應。

502 Bad Gateway原因分析

將請求提交給網關如php-fpm執行，但是由於某些原因沒有執行完畢導致php-fpm進程終止執行。說到此，這個問題就很明了了，與網關服務如php-fpm的配置有關了。
php-fpm.conf配置文件中有兩個參數就需要你考慮到，分別是max_children和request_terminate_timeout。
max_children最大子進程數，在高並發請求下，達到php-fpm最大響應數，后續的請求就會出現502錯誤的。可以通過netstat命令來查看當前連接數。
request_terminate_timeout設置單個請求的超時終止時間。還應該注意到php.ini中的max_execution_time參數。當請求終止時，也會出現502錯誤的。
當積累了大量的php請求，你重啟php-fpm釋放資源，但一兩分鍾不到，502又再次呈現，這是什么原因導致的呢？這時還應該考慮到數據庫，查看下數據庫進程是否有大量的locked進程，數據庫死鎖導致超時，前端終止了繼續請求，但是SQL語句還在等待釋放鎖，這時就要重啟數據庫服務了或kill掉死鎖SQL進程了。
對於長時間的請求可以考慮使用異步方式，可以參閱《關於PHP實現異步操作的研究》。

504 Gateway Time-out原因分析

504錯誤一般是與nginx.conf配置有關了。主要與以下幾個參數有關：fastcgi_connect_timeout、fastcgi_send_timeout、fastcgi_read_timeout、fastcgi_buffer_size、fastcgi_buffers、fastcgi_busy_buffers_size、fastcgi_temp_file_write_size、fastcgi_intercept_errors。特別是前三個超時時間。如果fastcgi緩沖區太小會導致fastcgi進程被掛起從而演變為504錯誤。

小結

1. max_children

2. request_terminate_timeout、max_execution_time
3. 數據庫
4. 網關服務是否啟動如php-fpm

504錯誤主要查看nginx.conf關於網關如fastcgi的配置。

解決方法之一

一、fastcgi緩沖區設置過小

出現錯誤，首先要查找nginx的日志文件，目錄為/var/log/nginx，在日志中發現了如下錯誤。

2013/01/17 13:33:47 [error] 15421#0: *16 upstream sent too big header while reading response header from upstream

查閱了一下資料，大意是nginx緩沖區有一個bug造成的,我們網站的頁面消耗占用緩沖區可能過大。

網上查找了一下解決方法，在國外網站看到了一個增加緩沖區的方法，徹底解決了Nginx 502 Bad Gateway的問題。方法如下：

http {

...

fastcgi_buffers 8 16k;

fastcgi_buffer_size 32k;

...

}

二、代理緩沖區設置過小請根據服務器已經網站的情況自行增大上述兩個配置項。

如果你使用的是nginx反向代理，如果header過大，超出了默認的1k，就會引發上述的upstream sent too big header （說白了就是nginx把外部請求給后端處理，后端返回的header太大，nginx處理不過來就會導致502。

server {

listen 80;

server_name www.example.com;

location / {

###############添加這3行

proxy_buffer_size 64k;

proxy_buffers 32 32k;

proxy_busy_buffers_size 128k;

###############添加這3行

proxy_set_header Host $host ;

proxy_set_header X-Real-IP $remote_addr ;

proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for ;

............

}

三、默認php-cgi的進程數設置過少
在安裝好使用過程中出現502問題，一般是因為默認php-cgi進程是5個，可能因為phpcgi進程不夠用而造成502，需要修改/usr/local/php/etc/php-fpm.conf 將其中的max_children值適當增加。也有可能是max_requests值不夠用。需要說明的是這連個配置項占用內存很大，請根據服務器配置進行設置。否則可能起到反效果。

四、php執行超時

php執行超時，修改/usr/local/php/etc/php.ini 將max_execution_time 改為300

五、nginx等待時間超時
部分PHP程序的執行時間超過了Nginx的等待時間，可以適當增加nginx.conf配置文件中FastCGI的timeout時間

http {

fastcgi_connect_timeout 300;

fastcgi_send_timeout 300;

fastcgi_read_timeout 300;

......

}

nginx 502 bad gateway

一些運行在Nginx上的網站有時候會出現“502 Bad Gateway”錯誤，有些時候甚至頻繁的出現。以下是小編搜集整理的一些Nginx 502錯誤的排查方法，供參考：

　　Nginx 502錯誤的原因比較多，是因為在代理模式下后端服務器出現問題引起的。這些錯誤一般都不是nginx本身的問題，一定要從后端找原因！但nginx把這些出錯都攬在自己身上了，着實讓nginx的推廣者備受置疑，畢竟從字眼上理解，bad gateway？不就是bad nginx嗎？讓不了解的人看到，會直接把責任推在nginx身上，希望nginx下一個版本會把出錯提示寫稍微友好一些，至少不會是現在簡單的一句 502 Bad Gateway，另外還不忘附上自己的大名。

Nginx 502的觸發條件

　　502錯誤最通常的出現情況就是后端主機當機。在upstream配置里有這么一項配置：proxy_next_upstream，這個配置指定了 nginx在從一個后端主機取數據遇到何種錯誤時會轉到下一個后端主機，里頭寫上的就是會出現502的所有情況拉，默認是error timeout。error就是當機、斷線之類的，timeout就是讀取堵塞超時，比較容易理解。我一般是全寫上的：

proxy_next_upstream error timeout invalid_header http_500 http_503;

不過現在可能我要去掉http_500這一項了，http_500指定后端返回500錯誤時會轉一個主機，后端的jsp出錯的話，本來會打印一堆 stacktrace的錯誤信息，現在被502取代了。但公司的程序員可不這么認為，他們認定是nginx出現了錯誤，我實在沒空跟他們解釋502的原理了……

503錯誤就可以保留，因為后端通常是apache resin，如果apache死機就是error，但resin死機，僅僅是503，所以還是有必要保留的。

解決辦法

遇到502問題，可以優先考慮按照以下兩個步驟去解決。

1、查看當前的PHP FastCGI進程數是否夠用：

netstat -anpo | grep "php-cgi" | wc -l

如果實際使用的“FastCGI進程數”接近預設的“FastCGI進程數”，那么，說明“FastCGI進程數”不夠用，需要增大。

2、部分PHP程序的執行時間超過了Nginx的等待時間，可以適當增加nginx.conf配置文件中FastCGI的timeout時間，例如：

http  {
  fastcgi_connect_timeout 300;
  fastcgi_send_timeout 300;
  fastcgi_read_timeout 300;
  ......
  }

php.ini中memory_limit設低了會出錯，修改了php.ini的memory_limit為64M，重啟nginx，發現好了，原來是PHP的內存不足了。

　　如果這樣修改了還解決不了問題，可以參考下面這些方案：

一、max-children和max-requests

　　一台服務器上運行着nginx php(fpm) xcache，訪問量日均 300W pv左右。

　　最近經常會出現這樣的情況：php頁面打開很慢，cpu使用率突然降至很低，系統負載突然升至很高，查看網卡的流量，也會發現突然降到了很低。這種情況只持續數秒鍾就恢復了。

　　檢查php-fpm的日志文件發現了一些線索。

Sep 30 08:32:23.289973 [NOTICE] fpm_unix_init_main(), line 271: getrlimit(nofile): max:51200, cur:51200  Sep 30 08:32:23.290212 [NOTICE] fpm_sockets_init_main(), line 371: using inherited socket fd=10, “127.0.0.1:9000″  Sep 30 08:32:23.290342 [NOTICE] fpm_event_init_main(), line 109: libevent: using epoll  Sep 30 08:32:23.296426 [NOTICE] fpm_init(), line 47: fpm is running, pid 30587

在這幾句的前面，是1000多行的關閉children和開啟children的日志。

　　原來，php-fpm有一個參數 max_requests，該參數指明了，每個children最多處理多少個請求后便會被關閉，默認的設置是500。因為php是把請求輪詢給每個 children，在大流量下，每個childre到達max_requests所用的時間都差不多，這樣就造成所有的children基本上在同一時間被關閉。

　　在這期間，nginx無法將php文件轉交給php-fpm處理，所以cpu會降至很低(不用處理php，更不用執行sql)，而負載會升至很高(關閉和開啟children、nginx等待php-fpm)，網卡流量也降至很低(nginx無法生成數據傳輸給客戶端)

　　解決問題很簡單，增加children的數量，並且將 max_requests 設置為 0 或者一個比較大的值：

　　打開 /usr/local/php/etc/php-fpm.conf調大以下兩個參數(根據服務器實際情況，過大也不行）

<value name="max_children">5120</value>  <value name="max_requests">600</value>

然后重啟php-fpm。

二、增加緩沖區容量大小

　　將nginx的error log打開，發現“pstream sent too big header while reading response header from upstream”這樣的錯誤提示。查閱了一下資料，大意是nginx緩沖區有一個bug造成的,我們網站的頁面消耗占用緩沖區可能過大。參考老外寫的修改辦法增加了緩沖區容量大小設置，502問題徹底解決。后來系統管理員又對參數做了調整只保留了2個設置參數：client head buffer，fastcgi buffer size。

三、request_terminate_timeout

　　如果主要是在一些post或者數據庫操作的時候出現502這種情況，而不是在靜態頁面操作中常見，那么可以查看一下php-fpm.conf設置中的一項：

request_terminate_timeout

這個值是max_execution_time，就是fast-cgi的執行腳本時間。

0s為關閉，就是無限執行下去。（當時裝的時候沒仔細看就改了一個數字）問題解決了，執行很長時間也不會出錯了。優化fastcgi中，還可以改改這個值5s 看看效果。

php-cgi進程數不夠用、php執行時間長、或者是php-cgi進程死掉，都會出現502錯誤。

深入分析Nginx 502 Bad Gateway和Nginx 504 Gateway Time-out及其解決

Nginx 502 Bad Gateway的含義是請求的PHP-CGI已經執行，但是由於某種原因（一般是讀取資源的問題）沒有執行完畢而導致PHP-CGI進程終止。
　　 Nginx 504 Gateway Time-out的含義是所請求的網關沒有請求到，簡單來說就是沒有請求到可以執行的PHP-CGI。
　　解決這兩個問題其實是需要綜合思考的，一般來說Nginx 502 Bad Gateway和php-fpm.conf的設置有關，而Nginx 504 Gateway Time-out則是與nginx.conf的設置有關。
　　而正確的設置需要考慮服務器自身的性能和訪客的數量等多重因素。
　　以我目前的服務器為例子CPU是奔四1.5G的，內存1GB，CENTOS的系統，訪客大概是50人左右同時在線。
　　但是在線的人大都需要請求PHP-CGI進行大量的信息處理，因此我將nginx.conf設置為：
　　 fastcgi_connect_timeout 300s;
　　 fastcgi_send_timeout 300s;
　　 fastcgi_read_timeout 300s;
　　 fastcgi_buffer_size 128k;
　　 fastcgi_buffers 8 128k;#8 128
　　 fastcgi_busy_buffers_size 256k;
　　 fastcgi_temp_file_write_size 256k;
　　 fastcgi_intercept_errors on;
　　這里最主要的設置是前三條，即
　　 fastcgi_connect_timeout 300s;
　　 fastcgi_send_timeout 300s;
　　 fastcgi_read_timeout 300s;
　　這里規定了PHP-CGI的連接、發送和讀取的時間，300秒足夠用了，因此我的服務器很少出現504 Gateway Time-out這個錯誤。最關鍵的是php-fpm.conf的設置，這個會直接導致502 Bad Gateway和504 Gateway Time-out。
　　下面我們來仔細分析一下php-fpm.conf幾個重要的參數：
　　 php-fpm.conf有兩個至關重要的參數，一個是"max_children",另一個是"request_terminate_timeout"
　　我的兩個設置的值一個是"40 ，一個是"900 ，但是這個值不是通用的，而是需要自己計算的。
計算的方式如下：
　　如果你的服務器性能足夠好，且寬帶資源足夠充足，PHP腳本沒有系循環或BUG的話你可以直接將"request_terminate_timeout"設置成0s。0s的含義是讓PHP-CGI一直執行下去而沒有時間限制。而如果你做不到這一點，也就是說你的PHP-CGI可能出現某個BUG，或者你的寬帶不夠充足或者其他的原因導致你的PHP-CGI能夠假死那么就建議你給"request_terminate_timeout"賦一個值，這個值可以根據你服務器的性能進行設定。一般來說性能越好你可以設置越高，20分鍾-30分鍾都可以。由於我的服務器PHP腳本需要長時間運行，有的可能會超過10分鍾因此我設置了900秒，這樣不會導致PHP-CGI死掉而出現502 Bad gateway這個錯誤。
　　而"max_children"這個值又是怎么計算出來的呢？這個值原則上是越大越好，php-cgi的進程多了就會處理的很快，排隊的請求就會很少。設置"max_children"也需要根據服務器的性能進行設定，一般來說一台服務器正常情況下每一個php-cgi所耗費的內存在20M左右，因此我的"max_children"我設置成40個，20M*40=800M也就是說在峰值的時候所有PHP-CGI所耗內存在800M以內，低於我的有效內存1Gb。而如果我的"max_children"設置的較小，比如5-10個，那么php-cgi就會"很累"，處理速度也很慢，等待的時間也較長。如果長時間沒有得到處理的請求就會出現504 Gateway Time-out這個錯誤，而正在處理的很累的那幾個php-cgi如果遇到了問題就會出現502 Bad gateway這個錯誤。

Nginx 502 bad gateway錯誤解決方法

使用Nginx作為Web服務器的時候，你或多或少都會遇到Nginx 502 bad gateway的錯誤，造成這種錯誤的原因有很多。下面我們來一一解析。

一、查看php-cgi是否在運行
有時候由於網站流量過大或者其它原因，導致php-cgi直接down掉，所以我們得看php-cgi是否在運行。執行如下命令：

ps -A | grep php5-cgi
如果沒有運行，手動啟動

/etc/init.d/php_cgi start
如果你發現php-cgi不明原因有時候down掉，可以使用下面的腳本臨時解決這個問題，添加到cronjob。

if ps aux | grep ‘php5-cgi' | grep -v grep > /dev/null ; then echo "PHP-cgi is runnning !" else echo "PHP-cgi is down. Starting over…" /etc/init.d/php-fcgi start fi 二、fastcgi進程數不夠用、php執行時間長的原因
fastcgi進程數可以修改php-fpm.conf中的max_children的數值，高峰時php-cgi耗掉的最大內存為20M，請根據自己的內存情況計算了。
限制php執行時間可以在php-fpm.conf中的request_terminate_timeout設置，這是為了防止php程序的bug導致php-cgi假死。

三、FastCGI執行時間過長
根據實際情況調高以下參數值

fastcgi_connect_timeout 300; fastcgi_send_timeout 300; fastcgi_read_timeout 300;
除了上面列出的三種情況，當然還會有其它原因，但上面三種情況是最常見的

　　最近幾天發現網通線路的服務器出現流量不穩定的情況，具體的表現是，流量時而高，時而低，在流量低的時候發現系統的負載很小，幾乎為0，但是過一會，負載又高上去，流量也上去，很是奇怪，查找了2天沒有找到原因，后來看到一邊文章，介紹了解決nginx出現502的錯誤現象，按照這個方法進行嘗試，最終還是找到了問題的原因。

　　解決步驟如下：

　　1、查看當前的PHP FastCGI進程數是否夠用

　　netstat -anpo | grep "php-cgi" | wc -l

　　如果實際使用的"FastCGI進程數"接近預設的"FastCGI進程數"，那么，說明"FastCGI進程數"不夠用，需要增大。

　　2、部分PHP程序的執行時間超過了Nginx的等待時間，可以適當增加nginx.conf配置文件中FastCGI的timeout時間，例如：

　　在做第一步的時候，系統當前的PHP FastCGI進程數明顯超過了預設值的64這個數值，在電信的服務器上查看當前的PHP FastCGI進程數沒有高於64這個數值，而且網通線路的活動連接明顯高於電信的活動連接，准備到晚上的時候看看情況，結果到晚上22：30的時候，查看系統當前的PHP FastCGI進程數明顯小於64預設值，當前的活動連接也比原來低很多，由此可以說明出現nginx不穩定的情況是由於服務器訪問負載過大引起的，就是加上第二步的錯誤也不頂作用。

　　總結，php-cgi進程數不夠用、php執行時間長、或者是php-cgi進程死掉，都會出現502錯誤

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 四、nginx的502、504、500錯誤解決關於Nginx499、502和504的分析 nginx 500錯誤分析網站后台500錯誤分析 Nginx 502/504 Gateway time-out錯誤完美解決方案【轉發】 nginx自定義500，502，504錯誤頁面無法跳轉【轉】狀態碼502和504分析 Nginx 504錯誤總結 nginx服務器常見錯誤代碼500、501、502、503、504、505 Jmeter壓測502、504錯誤