原文:雲計算之路-遷入阿里雲后:20130314雲服務器故障經過

首先向大家致歉,這次雲服務器故障發現於 : 左右, : 左右恢復正常,給大家帶來了麻煩,請大家諒解 故障的原因是雲服務器所在的集群負載過高,磁盤寫入性能急劇下降,造成很多數據庫寫入操作超時。后來恢復正常的解決方法是將雲服務器遷移至另一個集群。 下面是故障發生的主要經過: 今天上午 : 左右一位園友通過郵件反饋在訪問園子時遇到 Bad Gateway錯誤,見下圖: 這是由阿里雲負載均衡SLB返回的錯 ...

2013-03-14 23:53 43 7565 推薦指數:

查看詳情

雲計算之路-入阿里:對服務器並發連接問題的猜想

雲計算之路系列博文分享的是我們將網站從IDC機房遷移至雲計算平台的實際經歷,目前已遷入阿里,這次分享的是我們對之前的博文“解決images.cnblogs.com響應速度慢的詭異問題”中遇到的服務器並發連接問題的猜想。不妥之處,歡迎批評指正。 這里再簡單描述一下這個問題:我們的圖片站點(靜態 ...

Wed Mar 13 22:50:00 CST 2013 16 6211
雲計算之路-阿里上:部分服務器未及時續費造成docker swarm集群故障

非常非常抱歉,由於我們的疏忽 —— docker swarm 集群中的 2 台服務器沒有及時續費,造成在夜里0點被自動關機,從而引發整個 docker swarm 集群故障,造成今天凌晨 0:30 ~ 7:50 左右跑在集群上的站點無法訪問,由此給您帶來很大很大的麻煩,懇請您的諒解。受這次故障影響 ...

Thu Feb 01 17:21:00 CST 2018 23 1471
雲計算之路-阿里上:2013年4月7日14:15~18:35服務器故障經過

無地自容的道歉之后,向大家匯報一下故障的整個經過。在此再次向大家表示歉意,望大家能諒解! 14:15,有園友在閃存上說博客后台不能發布博文(見下圖)。 14:17左右,我們看到了這條閃存。立即進入博客后台測試,發現提交時會出現如下的錯誤: "Timeout expired. ...

Mon Apr 08 19:55:00 CST 2013 50 7131
雲計算之路-遷入阿里:問題的根源——買到她的“人”,卻買不到她的“心”

這里的“她”指的是硬盤,“她的人”指的是硬盤空間,“她的心”指的是硬盤的IO能力。 自從使用阿里以來,我們遇到了三次故障(一、二、三),這三次故障都與磁盤IO高有關。第一次故障發生在跑zzk.cnblogs.com索引服務服務器上,當時的Avg.Disk Read Queue Length ...

Fri Mar 15 21:09:00 CST 2013 40 7821
雲計算之路-阿里上:博客web服務器輪番CPU 100%

今天下午14:30左右開始,不知道怎么回事,博客站點負載均衡中的web服務器輪番CPU 100%。平時訪問高峰5台服務器就能穩穩支撐,而今天發現CPU出現100%問題就開始加服務器,結果到目前加到了9台,也無濟於事,只是從5台服務器輪番CPU 100%變成9台服務器輪詢100%。 非常抱歉 ...

Thu Mar 15 00:21:00 CST 2018 25 3055
雲計算之路-阿里上:Web服務器遭遇奇怪的“黑色30秒”問題

今天下午訪問高峰的時候,主站的Web服務器出現奇怪的問題,開始是2台8核8G的服務器(ECS),后來又加了1台8核8G的服務器,問題依舊。 而且3台服務器特地使用了不同的配置:1台是禁用了虛擬內存的臨時磁盤服務器,1台是啟用了虛擬內存的臨時磁盤服務器,1台是禁用了虛擬內存的服務器 ...

Wed Apr 23 01:21:00 CST 2014 35 6683
雲計算之路-阿里上:一夜之間競價服務器全沒了

最近我們在服務器部署上使用了一些阿里競價服務器,比如在負載均衡中使用包年包月服務器與競價服務器相結合,服務器部署調整時先用競價服務器臨時頂替一下。使用競價服務器最大的風險是隨時可能會被釋放,今天之前我們只遇到過1次競價服務器被釋放的情況,那次被釋放了2台,也是在周五,看來周五是一個競價的高峰 ...

Fri Mar 16 20:30:00 CST 2018 9 4079
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM