自從5月24日發布博文(雲計算之路-阿里雲上:兩個重要突破)之后,情況有了明顯改善。但是我們不但沒有絲毫的放松,反而變得更加艱苦。我們被一個非常非常奇怪的問題所困擾,這段時間我們與阿里雲一起在努力與之作艱苦斗爭。 這個問題每天會出現十幾次,每次出現都會持續10秒鍾(“黑色10秒鍾”由此而來 ...
一圖勝千言,先看下圖中Linux . . . 的Changelog: 截圖來自:https: launchpad.net ubuntu source linux . . . Linux . . . 發布時間: 年 月 日 我們是 月 日遷入阿里雲的 我們遭遇的 黑色 秒鍾 問題詳見:雲計算之路 阿里雲上:超級奇怪的 黑色 秒鍾 。 本來准備硬啃內核代碼證明是Xen的問題引起的 黑色 秒鍾 ,現在不 ...
2013-06-02 12:30 31 7085 推薦指數:
自從5月24日發布博文(雲計算之路-阿里雲上:兩個重要突破)之后,情況有了明顯改善。但是我們不但沒有絲毫的放松,反而變得更加艱苦。我們被一個非常非常奇怪的問題所困擾,這段時間我們與阿里雲一起在努力與之作艱苦斗爭。 這個問題每天會出現十幾次,每次出現都會持續10秒鍾(“黑色10秒鍾”由此而來 ...
什么是“黑色10秒鍾”? “黑色10秒鍾”是一種故障特征,每次發生時都持續10秒鍾。在這10秒鍾期間,IIS只接收請求,不響應請求,等10秒鍾一過,這些未響應的請求會一起響應。如果你在“黑色10秒鍾”的第1秒訪問網站,要等10秒鍾之后才能看到頁面。 詳見雲計算之路-阿里雲上:超級奇怪的“黑色 ...
為了更好地分享我們解決“黑色1秒”問題的過程,在這篇博文中我們將專門描述一下“黑色1秒”問題的表現。 “黑色1秒”是我們使用阿里雲以來繼“黑色10秒”之后遭遇的最奇特、最詭異、最難以捉摸、最富有戲劇性的問題。 它有2個最顯著的特征: 第一個是最直觀的表現,在Windows性能監視 ...
如果說2013年雲計算之路的主題是“踩坑”,那么2014年我們希望雲計算之路的主題變成“填坑”——當然填坑是阿里雲來完成的,我們只是見證曾經的坑坑窪窪變成平坦大道。 15號(周四)晚上我們發現了SLB會話保持的坑,16號晚上阿里雲成功定位並進行修復,這兩天正式發布后會填平這個坑。這次從踩坑 ...
在雲上,底層的東西你無法觸及,遇到奇怪問題時只能靠猜想,所以使用雲計算會鍛煉你的想像力。 (上圖中藍色是ASP.NET的Requests Queued,另外一個是HTTP.SYS的Arrival Rate) 昨天我們發現了一個重要的線索——“黑色30秒”到來時,最初的表現是請求出現排隊 ...
雲上真是無奇不有,這兩天我們什么也沒動,“黑色30秒”招呼不打一聲就走了,而來了一位不速之客——“黑色1秒”;就寫了一篇博文,30秒就變成了1秒,看來多寫博客是硬道理。 在上篇博文的評論中有人說——就30秒,有必要這么較真嗎——當時想,別說30秒,哪怕1秒,我們也會較真。結果說1秒,1秒就來 ...
“黑色1秒”問題經過一個多月的艱苦奮戰,今天終於取得了重要進展!我們終於有了足夠的數據證明不是微軟IIS的問題,就是阿里雲Xen虛擬機的問題。 這篇博文分享的是我們如何進行證明的,而且這次證明連Window性能監視器都不需要。 下面我們來分析一下今天10:37:35出現的“黑色1秒”(下面所用 ...
。而且阿里雲的雲服務器,所有的網絡負載都集中在一塊內網網卡上,SLB(負載均衡)用它,OCS(緩存服務)用它, ...