雲計算之路-阿里雲上:14:20-14:55博客后台2台服務器都CPU 100%引發的故障


2017年6月20日更新:今天我們最終發現,CPU 100%問題是博客后台程序所引用的開源組件 HtmlSanitizer 在處理特定html字符串時引起的,升級至最新版3.4.156可解決這個問題。

非常抱歉,今天下午14:20-14:55期間,由於同一個負載均衡中的2台服務器都出現CPU 100%問題,造成博客后台無法正常訪問,由此給您帶來了很大很大的麻煩,請您諒解。

博客后台是CPU消耗很低的應用,這2台服務器通常CPU占用在5%左右,之前從來沒有出現CPU 100%的問題(所以連雲監控都沒添加CPU監控報警)。這次問題很突然,我們發現問題后,遠程連接不上服務器,只能通過阿里雲控制台重啟服務器,重啟后立馬恢復正常。

對於問題的具體原因,目前還沒找到,我們正在進一步排查,也反饋給了阿里雲,阿里雲也在排查。

對於這次故障,我們會吸取教訓,采取改進措施:

1)加強監控

2)采用 Docker 進行容器化部署:在更多服務器上用更多容器運行,避免2台服務器同時出問題引發故障,但這要等我們完成博客后台向 ASP.NET Core 的遷移。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM