仔細閱讀了http://www.cnblogs.com/cmt/p/3729386.html這篇關於xen的博文,這篇博文寫的挺贊的,分析的也很細致,涉及到4年前的一個patch的故事。在講這個故事之前,先說明下,阿里雲官方的xen已經包含了博文中提到的xen的cpu idle潛在問題的修復版本 ...
在之前對 黑色 秒 問題的分析博文中,我們將最大嫌疑對象鎖定在了Xen,在這篇博文我們將從Xen的角度進行分析。也許有人會問,為什么不知道天多高地多厚地去研究不屬於自己范圍的問題 只因我們對一個問題的強烈好奇心 究竟是不是我們用Windows的錯 注 :文中所說的Xen補丁問題只是提供一種分析問題的思路,我們遇到的 黑色 秒 問題與有沒有打這個補丁沒有關系 注 :關於這個Xen補丁背后的故事,推薦 ...
2014-05-15 15:42 27 4339 推薦指數:
仔細閱讀了http://www.cnblogs.com/cmt/p/3729386.html這篇關於xen的博文,這篇博文寫的挺贊的,分析的也很細致,涉及到4年前的一個patch的故事。在講這個故事之前,先說明下,阿里雲官方的xen已經包含了博文中提到的xen的cpu idle潛在問題的修復版本 ...
在發現雲服務器讀取OCS緩存的“黑色0.1秒”是發生在socket讀取數據時,而且是發生在讀取開始的字節,甚至在socket寫數據時(比如寫入緩存key)也會出現超過50ms的情況,我們的好奇心被激發到一個新的高度。 根據我們的實測,在雲服務器上創建一個新的TCP連接通常也不過3ms左右 ...
為了更好地分享我們解決“黑色1秒”問題的過程,在這篇博文中我們將專門描述一下“黑色1秒”問題的表現。 “黑色1秒”是我們使用阿里雲以來繼“黑色10秒”之后遭遇的最奇特、最詭異、最難以捉摸、最富有戲劇性的問題。 它有2個最顯著的特征: 第一個是最直觀的表現,在Windows性能監視 ...
在雲上,底層的東西你無法觸及,遇到奇怪問題時只能靠猜想,所以使用雲計算會鍛煉你的想像力。 (上圖中藍色是ASP.NET的Requests Queued,另外一個是HTTP.SYS的Arrival Rate) 昨天我們發現了一個重要的線索——“黑色30秒”到來時,最初的表現是請求出現排隊 ...
“黑色1秒”問題經過一個多月的艱苦奮戰,今天終於取得了重要進展!我們終於有了足夠的數據證明不是微軟IIS的問題,就是阿里雲Xen虛擬機的問題。 這篇博文分享的是我們如何進行證明的,而且這次證明連Window性能監視器都不需要。 下面我們來分析一下今天10:37:35出現的“黑色1秒”(下面所用 ...
針對Web服務器“黑色30秒”問題(詳見雲計算之路-阿里雲上:Web服務器遭遇奇怪的“黑色30秒”問題),經過分析,我們准備從這個地方下手——為什么會出現\ASP.NET\Request Queued大於0的情況(為什么請求會排隊)? 首先, 通過Windows性能監視器去觀察,看能不能找到 ...
在昨天針對“黑色30秒”問題的分析中,我們猜測Requests Queued上升是由於正在處理的請求出不去(到達不了客戶端)。今天我們結合IIS日志驗證這個猜測。 IIS日志中有一個重要的指標——time-taken,time-taken不僅包含了請求在服務端執行的時間,還包含了響應的內容 ...
今天下午15:11-15:13間出現了類似“黑色30秒”的狀況,我們用強大的IIS日志分析工具——Log Parser Studio進行了進一步的分析。 分析情況如下—— 先看一下Windows性能監視器中的問題表現: 然后用Log Parser Studio分析07:11:55與07 ...