在雲上,底層的東西你無法觸及,遇到奇怪問題時只能靠猜想,所以使用雲計算會鍛煉你的想像力。 (上圖中藍色是ASP.NET的Requests Queued,另外一個是HTTP.SYS的Arrival Rate) 昨天我們發現了一個重要的線索——“黑色30秒”到來時,最初的表現是請求出現排隊 ...
黑色 秒 問題經過一個多月的艱苦奮戰,今天終於取得了重要進展 我們終於有了足夠的數據證明不是微軟IIS的問題,就是阿里雲Xen虛擬機的問題。 這篇博文分享的是我們如何進行證明的,而且這次證明連Window性能監視器都不需要。 下面我們來分析一下今天 : : 出現的 黑色 秒 下面所用的IIS日志分析工具是Log Parser Studio,這是我們在排查 黑色 秒 問題期間對我們幫助最大的一個工 ...
2014-06-10 13:14 42 6388 推薦指數:
在雲上,底層的東西你無法觸及,遇到奇怪問題時只能靠猜想,所以使用雲計算會鍛煉你的想像力。 (上圖中藍色是ASP.NET的Requests Queued,另外一個是HTTP.SYS的Arrival Rate) 昨天我們發現了一個重要的線索——“黑色30秒”到來時,最初的表現是請求出現排隊 ...
為了更好地分享我們解決“黑色1秒”問題的過程,在這篇博文中我們將專門描述一下“黑色1秒”問題的表現。 “黑色1秒”是我們使用阿里雲以來繼“黑色10秒”之后遭遇的最奇特、最詭異、最難以捉摸、最富有戲劇性的問題。 它有2個最顯著的特征: 第一個是最直觀的表現,在Windows性能監視 ...
針對Web服務器“黑色30秒”問題(詳見雲計算之路-阿里雲上:Web服務器遭遇奇怪的“黑色30秒”問題),經過分析,我們准備從這個地方下手——為什么會出現\ASP.NET\Request Queued大於0的情況(為什么請求會排隊)? 首先, 通過Windows性能監視器去觀察,看能不能找到 ...
[更新:抱歉!“黑色1秒”后來又出現了,詳見:雲計算之路-阿里雲上-幸福沒那么容易:“黑色1秒”又出現了] 前幾天發生了2件神奇的事情:一是1位園友在阿里雲上遇到了和我們一模一樣的“黑色1秒”問題;二是阿里雲推出了IO優化的基於KVM架構的服務器,據說理論上可以解決“黑色1秒”問題。很巧 ...
今天下午訪問高峰的時候,主站的Web服務器出現奇怪的問題,開始是2台8核8G的雲服務器(ECS),后來又加了1台8核8G的雲服務器,問題依舊。 而且3台服務器特地使用了不同的配置:1台是禁用了虛擬內存的臨時磁盤雲服務器,1台是啟用了虛擬內存的臨時磁盤雲服務器,1台是禁用了虛擬內存的雲盤雲服務器 ...
在昨天針對“黑色30秒”問題的分析中,我們猜測Requests Queued上升是由於正在處理的請求出不去(到達不了客戶端)。今天我們結合IIS日志驗證這個猜測。 IIS日志中有一個重要的指標——time-taken,time-taken不僅包含了請求在服務端執行的時間,還包含了響應的內容 ...
今天下午15:11-15:13間出現了類似“黑色30秒”的狀況,我們用強大的IIS日志分析工具——Log Parser Studio進行了進一步的分析。 分析情況如下—— 先看一下Windows性能監視器中的問題表現: 然后用Log Parser Studio分析07:11:55與07 ...
在這篇博文中,我們拋開對阿里雲的懷疑,完全從ASP.NET的角度進行分析,看能不能找到針對問題現象的更合理的解釋。 “黑色30秒”問題現象的主要特征是:排隊的請求(Requests Queued)突增,到達HTTP.SYS的請求數(Arrival Rate)下降,QPS(Requests/Sec ...