雲計算之路-阿里雲上:在烏雲中堅信藍天


繼續向大家匯報阿里雲上的天氣變化情況。今天(5月8日)上午糟糕的天氣(8:30~9:50,10:50~11:40)給大家逛園帶來了很大的麻煩,請諒解!

早上8:30左右由於阿里雲RDS出現突發故障(故障是RDS負載均衡引起的),造成網站不能正常訪問,訪問時出現了504 Gateway Time-out錯誤。

8:45左右RDS恢復正常,但由於RDS故障恢復時進行了HA切換(數據庫熱備切換),數據庫訪問切換到了另外一台熱備服務器上,而這台SQL Server服務器需要一段時間進行預熱(建立緩存)。

在預熱期間由於SQL緩存命中率低,大量的磁盤IO造成很多SQL查詢執行時間很長,引起網站訪問速度變得很慢。當時正在值訪問高峰期,SQL Server一邊要進行預熱,一邊要處理大量的查詢請求,這種雪上加霜的情形讓SQL Server遲遲不能進入正常工作狀態。后來通過增加RDS內存提高SQL Server緩存命中率之后才解決問題。

這種情況我們是第一次遇到,以前用自己的服務器,即使服務器重啟,起來之后SQL Server很快就能進入正常工作狀態。可能是因為現在的數據庫壓力比以前大了很多。

這次故障說明了即使數據庫服務器有熱備,但切換到熱備服務器也不能保證短時間內恢復正常。

這次故障說明了緩存是多么多么的重要,因為在熱備服務器預熱階段,唯一能減輕SQL Server負擔的就是緩存,雖然我們最近對緩存進行了很大的優化,但還遠遠不夠。

這次故障說明了阿里雲需要進一步提高RDS的穩定性。雲計算,穩定大於一切!

 

出了這么多問題,很多朋友在質疑我們為什么還堅守在阿里雲上?

我們考慮過很多次,支撐我們堅守的理由有:

  • 我們真的很需要雲計算
  • 雲計算真的會變得和水電一樣重要,它的發展會給整個產業帶來巨大的提升;
  • 做雲計算平台真的很復雜、難度很大,而且是摸着石頭過海,沒有多少經驗可以借鑒;
  • 阿里雲是目前國內最有希望將雲計算做起來的,我們相信阿里雲能解決這些問題。

任何一個偉大的東西不是因為天生偉大,從不出問題,而是因為它把所有遇到的問題都解決了,然后變得偉大。

堅守在阿里雲上,就是堅守在雲計算之路上,在烏雲中堅信藍天源於這樣一個信念:我們堅信雲計算的時代已經到來了!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM