網站故障公告4:最新進展——也許還是虛擬機惹的禍


繼續說抱歉!今天雖然在訪問次高峰期訪問速度表現不錯,但是在訪問最高峰期還是沒扛得住。

繼續努力解決問題!這是我們唯一的選擇。“他說風雨中這點痛算什么,擦干淚,不要問為什么。。。”

RDS的原因已經排除。故障的重要特征已鎖定。在訪問速度慢的時候,雲服務器的TCP連接數特別高;Requests/s波動很大(見下圖),在0~上百之間跳動;IIS同時連接數(來自負載均衡)由平時的100以下劇增至2000以上;加上昨天的創建數據庫連接的超時問題(今天由於在連接字符串中設置了Connect Timeout=150,連接超時未出現)。這些現象說明了雲服務器的TCP連接處理能力急劇下降。

我們猜測在訪問高峰期,雲服務器的並發連接數超過一定的閾值時,雲服務器的網絡吞吐能力會急劇下降。

怎么解決這個問題?目前最快最有效的方法就是向負載均衡中填更多的雲服務器,減少單台雲服務器的並發連接。明天還要准備更多的雲服務器,只要一出現問題,就向負載均衡中填雲服務器。

相關博文:

網站故障公告1:使用阿里雲RDS之后一個讓人欲哭無淚的下午

網站故障公告2:找到問題的重要線索

網站故障公告3:應該找到了問題的真正原因


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM