在雲上,底層的東西你無法觸及,遇到奇怪問題時只能靠猜想,所以使用雲計算會鍛煉你的想像力。 (上圖中藍色是ASP.NET的Requests Queued,另外一個是HTTP.SYS的Arrival Rate) 昨天我們發現了一個重要的線索——“黑色30秒”到來時,最初的表現是請求出現排隊 ...
如果說 年雲計算之路的主題是 踩坑 ,那么 年我們希望雲計算之路的主題變成 填坑 當然填坑是阿里雲來完成的,我們只是見證曾經的坑坑窪窪變成平坦大道。 號 周四 晚上我們發現了SLB會話保持的坑, 號晚上阿里雲成功定位並進行修復,這兩天正式發布后會填平這個坑。這次從踩坑到填坑的過程是最痛快的一次。 接下來我們的目標鎖定在 黑色n秒 剛發現一個英文說法:stuck for x seconds 這個坑 ...
2014-05-18 20:45 9 4685 推薦指數:
在雲上,底層的東西你無法觸及,遇到奇怪問題時只能靠猜想,所以使用雲計算會鍛煉你的想像力。 (上圖中藍色是ASP.NET的Requests Queued,另外一個是HTTP.SYS的Arrival Rate) 昨天我們發現了一個重要的線索——“黑色30秒”到來時,最初的表現是請求出現排隊 ...
昨天對“黑色n秒”問題的最終猜想以失敗而告終,從而讓我們結束了被動猜想階段,進入了主動進攻階段——出招。 今天出第一招——用C#寫個小程序,讓其在每個CPU核上運行一個線程,不讓任何一個CPU核進入空閑(idle)狀態,以進一步排除CPU idle引起的“黑色n秒”。 在這一招中,借助 ...
為了更好地分享我們解決“黑色1秒”問題的過程,在這篇博文中我們將專門描述一下“黑色1秒”問題的表現。 “黑色1秒”是我們使用阿里雲以來繼“黑色10秒”之后遭遇的最奇特、最詭異、最難以捉摸、最富有戲劇性的問題。 它有2個最顯著的特征: 第一個是最直觀的表現,在Windows性能監視 ...
雖然昨天的第一招失敗了,但是從失敗中我們學到了與多核CPU相關的Processor Affinity(處理器關聯)的知識。 既然我們可以讓.NET程序的不同線程運行於指定的CPU核,那是不是也可以讓IIS應用程序池的進程w3wp運行於指定的CPU核? 雖然看起來“黑色n秒”似乎與w3wp ...
的) 我們遭遇的“黑色10秒鍾”問題詳見:雲計算之路-阿里雲上:超級奇怪的“黑色10秒鍾”。 本來 ...
“黑色1秒”問題經過一個多月的艱苦奮戰,今天終於取得了重要進展!我們終於有了足夠的數據證明不是微軟IIS的問題,就是阿里雲Xen虛擬機的問題。 這篇博文分享的是我們如何進行證明的,而且這次證明連Window性能監視器都不需要。 下面我們來分析一下今天10:37:35出現的“黑色1秒”(下面所用 ...
。而且阿里雲的雲服務器,所有的網絡負載都集中在一塊內網網卡上,SLB(負載均衡)用它,OCS(緩存服務)用它, ...
在昨天針對“黑色30秒”問題的分析中,我們猜測Requests Queued上升是由於正在處理的請求出不去(到達不了客戶端)。今天我們結合IIS日志驗證這個猜測。 IIS日志中有一個重要的指標——time-taken,time-taken不僅包含了請求在服務端執行的時間,還包含了響應的內容 ...