繼續說抱歉!今天雖然在訪問次高峰期訪問速度表現不錯,但是在訪問最高峰期還是沒扛得住。
繼續努力解決問題!這是我們唯一的選擇。“他說風雨中這點痛算什么,擦干淚,不要問為什么。。。”
RDS的原因已經排除。故障的重要特征已鎖定。在訪問速度慢的時候,雲服務器的TCP連接數特別高;Requests/s波動很大(見下圖),在0~上百之間跳動;IIS同時連接數(來自負載均衡)由平時的100以下劇增至2000以上;加上昨天的創建數據庫連接的超時問題(今天由於在連接字符串中設置了Connect Timeout=150,連接超時未出現)。這些現象說明了雲服務器的TCP連接處理能力急劇下降。
我們猜測在訪問高峰期,雲服務器的並發連接數超過一定的閾值時,雲服務器的網絡吞吐能力會急劇下降。
怎么解決這個問題?目前最快最有效的方法就是向負載均衡中填更多的雲服務器,減少單台雲服務器的並發連接。明天還要准備更多的雲服務器,只要一出現問題,就向負載均衡中填雲服務器。
相關博文: