原文:云计算之路-阿里云上:“黑色1秒”问题与2009年Xen一个补丁的故事

在之前对 黑色 秒 问题的分析博文中,我们将最大嫌疑对象锁定在了Xen,在这篇博文我们将从Xen的角度进行分析。也许有人会问,为什么不知道天多高地多厚地去研究不属于自己范围的问题 只因我们对一个问题的强烈好奇心 究竟是不是我们用Windows的错 注 :文中所说的Xen补丁问题只是提供一种分析问题的思路,我们遇到的 黑色 秒 问题与有没有打这个补丁没有关系 注 :关于这个Xen补丁背后的故事,推荐 ...

2014-05-15 15:42 27 4339 推荐指数:

查看详情

云计算之路2009Xen一个补丁背后那不为人知的故事

仔细阅读了http://www.cnblogs.com/cmt/p/3729386.html这篇关于xen的博文,这篇博文写的挺赞的,分析的也很细致,涉及到4前的一个patch的故事。在讲这个故事之前,先说明下,阿里官方的xen已经包含了博文中提到的xen的cpu idle潜在问题的修复版本 ...

Sat May 17 19:53:00 CST 2014 15 2478
云计算之路-阿里上:基于Xen的IO模型进一步分析“黑色0.1问题

  在发现服务器读取OCS缓存的“黑色0.1”是发生在socket读取数据时,而且是发生在读取开始的字节,甚至在socket写数据时(比如写入缓存key)也会出现超过50ms的情况,我们的好奇心被激发到一个新的高度。   根据我们的实测,在服务器上创建一个新的TCP连接通常也不过3ms左右 ...

Tue May 13 23:24:00 CST 2014 7 3339
云计算之路-阿里上:什么是“黑色1”?

为了更好地分享我们解决“黑色1问题的过程,在这篇博文中我们将专门描述一下“黑色1问题的表现。 “黑色1”是我们使用阿里以来继“黑色10”之后遭遇的最奇特、最诡异、最难以捉摸、最富有戏剧性的问题。 它有2个最显著的特征: 第一个是最直观的表现,在Windows性能监视 ...

Fri May 30 00:23:00 CST 2014 12 4580
云计算之路-阿里上:对“黑色30问题的猜想

上,底层的东西你无法触及,遇到奇怪问题时只能靠猜想,所以使用云计算会锻炼你的想像力。 (上图中蓝色是ASP.NET的Requests Queued,另外一个是HTTP.SYS的Arrival Rate) 昨天我们发现了一个重要的线索——“黑色30”到来时,最初的表现是请求出现排队 ...

Thu Apr 24 20:01:00 CST 2014 12 2862
云计算之路-阿里上:黑色1,微软的问题还是阿里问题

黑色1问题经过一个多月的艰苦奋战,今天终于取得了重要进展!我们终于有了足够的数据证明不是微软IIS的问题,就是阿里Xen虚拟机的问题。 这篇博文分享的是我们如何进行证明的,而且这次证明连Window性能监视器都不需要。 下面我们来分析一下今天10:37:35出现的“黑色1”(下面所用 ...

Tue Jun 10 21:14:00 CST 2014 42 6388
云计算之路-阿里上:排查“黑色30问题-为什么请求会排队

针对Web服务器“黑色30问题(详见云计算之路-阿里上:Web服务器遭遇奇怪的“黑色30问题),经过分析,我们准备从这个地方下手——为什么会出现\ASP.NET\Request Queued大于0的情况(为什么请求会排队)? 首先, 通过Windows性能监视器去观察,看能不能找到 ...

Wed Apr 23 21:05:00 CST 2014 10 3756
云计算之路-阿里上:结合IIS日志分析“黑色30问题

在昨天针对“黑色30问题的分析中,我们猜测Requests Queued上升是由于正在处理的请求出不去(到达不了客户端)。今天我们结合IIS日志验证这个猜测。 IIS日志中有一个重要的指标——time-taken,time-taken不仅包含了请求在服务端执行的时间,还包含了响应的内容 ...

Fri Apr 25 23:55:00 CST 2014 6 3559
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM