雲計算之路系列博文分享的是我們將網站從IDC機房遷移至雲計算平台的實際經歷,目前已遷入阿里雲,這次分享的是我們對之前的博文“解決images.cnblogs.com響應速度慢的詭異問題”中遇到的雲服務器並發連接問題的猜想。不妥之處,歡迎批評指正。 這里再簡單描述一下這個問題:我們的圖片站點(靜態 ...
首先向大家致歉,這次雲服務器故障發現於 : 左右, : 左右恢復正常,給大家帶來了麻煩,請大家諒解 故障的原因是雲服務器所在的集群負載過高,磁盤寫入性能急劇下降,造成很多數據庫寫入操作超時。后來恢復正常的解決方法是將雲服務器遷移至另一個集群。 下面是故障發生的主要經過: 今天上午 : 左右一位園友通過郵件反饋在訪問園子時遇到 Bad Gateway錯誤,見下圖: 這是由阿里雲負載均衡SLB返回的錯 ...
2013-03-14 23:53 43 7565 推薦指數:
雲計算之路系列博文分享的是我們將網站從IDC機房遷移至雲計算平台的實際經歷,目前已遷入阿里雲,這次分享的是我們對之前的博文“解決images.cnblogs.com響應速度慢的詭異問題”中遇到的雲服務器並發連接問題的猜想。不妥之處,歡迎批評指正。 這里再簡單描述一下這個問題:我們的圖片站點(靜態 ...
非常非常抱歉,由於我們的疏忽 —— docker swarm 集群中的 2 台服務器沒有及時續費,造成在夜里0點被自動關機,從而引發整個 docker swarm 集群故障,造成今天凌晨 0:30 ~ 7:50 左右跑在集群上的站點無法訪問,由此給您帶來很大很大的麻煩,懇請您的諒解。受這次故障影響 ...
無地自容的道歉之后,向大家匯報一下故障的整個經過。在此再次向大家表示歉意,望大家能諒解! 14:15,有園友在閃存上說博客后台不能發布博文(見下圖)。 14:17左右,我們看到了這條閃存。立即進入博客后台測試,發現提交時會出現如下的錯誤: "Timeout expired. ...
這里的“她”指的是硬盤,“她的人”指的是硬盤空間,“她的心”指的是硬盤的IO能力。 自從使用阿里雲以來,我們遇到了三次故障(一、二、三),這三次故障都與磁盤IO高有關。第一次故障發生在跑zzk.cnblogs.com索引服務的雲服務器上,當時的Avg.Disk Read Queue Length ...
今天下午14:30左右開始,不知道怎么回事,博客站點負載均衡中的web服務器輪番CPU 100%。平時訪問高峰5台服務器就能穩穩支撐,而今天發現CPU出現100%問題后就開始加服務器,結果到目前加到了9台,也無濟於事,只是從5台服務器輪番CPU 100%變成9台服務器輪詢100%。 非常抱歉 ...
今天下午訪問高峰的時候,主站的Web服務器出現奇怪的問題,開始是2台8核8G的雲服務器(ECS),后來又加了1台8核8G的雲服務器,問題依舊。 而且3台服務器特地使用了不同的配置:1台是禁用了虛擬內存的臨時磁盤雲服務器,1台是啟用了虛擬內存的臨時磁盤雲服務器,1台是禁用了虛擬內存的雲盤雲服務器 ...
3月21日,由於使用阿里雲服務器自建 docker swarm 集群的不穩定,我們將自建 docker swarm 集群上的所有應用切換阿里雲容器服務 swarm 版(非swarm mode)。 3月22日,我們進行移除與重啟節點的操作時引發了故障,詳見 雲計算之路-阿里雲上-容器服務:移除節點 ...
最近我們在服務器部署上使用了一些阿里雲競價服務器,比如在負載均衡中使用包年包月服務器與競價服務器相結合,服務器部署調整時先用競價服務器臨時頂替一下。使用競價服務器最大的風險是隨時可能會被釋放,今天之前我們只遇到過1次競價服務器被釋放的情況,那次被釋放了2台,也是在周五,看來周五是一個競價的高峰 ...