原文:雲計算之路-阿里雲上:對“黑色n秒”問題的最終猜想——CPU C-states引起的

如果說 年雲計算之路的主題是 踩坑 ,那么 年我們希望雲計算之路的主題變成 填坑 當然填坑是阿里雲來完成的,我們只是見證曾經的坑坑窪窪變成平坦大道。 號 周四 晚上我們發現了SLB會話保持的坑, 號晚上阿里雲成功定位並進行修復,這兩天正式發布后會填平這個坑。這次從踩坑到填坑的過程是最痛快的一次。 接下來我們的目標鎖定在 黑色n秒 剛發現一個英文說法:stuck for x seconds 這個坑 ...

2014-05-18 20:45 9 4685 推薦指數:

查看詳情

雲計算之路-阿里上:對“黑色30問題猜想

上,底層的東西你無法觸及,遇到奇怪問題時只能靠猜想,所以使用雲計算會鍛煉你的想像力。 (上圖中藍色是ASP.NET的Requests Queued,另外一個是HTTP.SYS的Arrival Rate) 昨天我們發現了一個重要的線索——“黑色30”到來時,最初的表現是請求出現排隊 ...

Thu Apr 24 20:01:00 CST 2014 12 2862
雲計算之路-阿里上:消滅“黑色n”第一招——不讓CPU空閑

昨天對“黑色n問題最終猜想以失敗而告終,從而讓我們結束了被動猜想階段,進入了主動進攻階段——出招。 今天出第一招——用C#寫個小程序,讓其在每個CPU核上運行一個線程,不讓任何一個CPU核進入空閑(idle)狀態,以進一步排除CPU idle引起的“黑色n”。 在這一招中,借助 ...

Tue May 20 01:18:00 CST 2014 10 3146
雲計算之路-阿里上:什么是“黑色1”?

為了更好地分享我們解決“黑色1問題的過程,在這篇博文中我們將專門描述一下“黑色1問題的表現。 “黑色1”是我們使用阿里以來繼“黑色10”之后遭遇的最奇特、最詭異、最難以捉摸、最富有戲劇性的問題。 它有2個最顯著的特征: 第一個是最直觀的表現,在Windows性能監視 ...

Fri May 30 00:23:00 CST 2014 12 4580
雲計算之路-阿里上:消滅“黑色n”第二招——給w3wp進程指定CPU

雖然昨天的第一招失敗了,但是從失敗中我們學到了與多核CPU相關的Processor Affinity(處理器關聯)的知識。 既然我們可以讓.NET程序的不同線程運行於指定的CPU核,那是不是也可以讓IIS應用程序池的進程w3wp運行於指定的CPU核? 雖然看起來“黑色n”似乎與w3wp ...

Tue May 20 23:37:00 CST 2014 10 3435
雲計算之路-阿里上:黑色1,微軟的問題還是阿里問題

黑色1問題經過一個多月的艱苦奮戰,今天終於取得了重要進展!我們終於有了足夠的數據證明不是微軟IIS的問題,就是阿里Xen虛擬機的問題。 這篇博文分享的是我們如何進行證明的,而且這次證明連Window性能監視器都不需要。 下面我們來分析一下今天10:37:35出現的“黑色1”(下面所用 ...

Tue Jun 10 21:14:00 CST 2014 42 6388
雲計算之路-阿里上:結合IIS日志分析“黑色30問題

在昨天針對“黑色30問題的分析中,我們猜測Requests Queued上升是由於正在處理的請求出不去(到達不了客戶端)。今天我們結合IIS日志驗證這個猜測。 IIS日志中有一個重要的指標——time-taken,time-taken不僅包含了請求在服務端執行的時間,還包含了響應的內容 ...

Fri Apr 25 23:55:00 CST 2014 6 3559
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM