今天下午14:30左右开始,不知道怎么回事,博客站点负载均衡中的web服务器轮番CPU 100%。平时访问高峰5台服务器就能稳稳支撑,而今天发现CPU出现100%问题后就开始加服务器,结果到目前加到了9台,也无济于事,只是从5台服务器轮番CPU 100%变成9台服务器轮询100%。 非常抱歉 ...
非常抱歉,昨天的服务器CPU 问题是达到 memcached 的连接数限制引起的,不是阿里云服务器的问题。 之前我们用的是阿里云 云数据库 memcached 版 ,上个周末我们换成了自己搭建 基于阿里云 内存网络增强型 服务器用 docker 跑 memcached 。 但我们在部署 memcached 时没有设置 conn limit 参数 默认值是 。 由于周一周二两天服务器没出现问题,而且 ...
2018-03-15 13:36 17 2792 推荐指数:
今天下午14:30左右开始,不知道怎么回事,博客站点负载均衡中的web服务器轮番CPU 100%。平时访问高峰5台服务器就能稳稳支撑,而今天发现CPU出现100%问题后就开始加服务器,结果到目前加到了9台,也无济于事,只是从5台服务器轮番CPU 100%变成9台服务器轮询100%。 非常抱歉 ...
云计算之路系列博文分享的是我们将网站从IDC机房迁移至云计算平台的实际经历,目前已迁入阿里云,这次分享的是我们对之前的博文“解决images.cnblogs.com响应速度慢的诡异问题”中遇到的云服务器并发连接问题的猜想。不妥之处,欢迎批评指正。 这里再简单描述一下这个问题:我们的图片站点(静态 ...
这篇博文记录一下6月1日在阿里云上遇到的奇怪的CPU 100%问题,希望多年以后能真相大白。 那天负载均衡(SLB)中只放了1台云服务器(平时都放2台),由于是节假日,虽然只放了一台,但这台服务器的负载也没有平时高。但在上午的时候突然出现了CPU 100%问题,然后切换到另外一台云服务器恢复正常 ...
2017年6月20日更新:今天我们最终发现,CPU 100%问题是博客后台程序所引用的开源组件 HtmlSanitizer 在处理特定html字符串时引起的,升级至最新版3.4.156可解决这个问题。 非常抱歉,今天下午14:20-14:55期间,由于同一个负载均衡中的2台服务器都出现CPU ...
如果说2013年云计算之路的主题是“踩坑”,那么2014年我们希望云计算之路的主题变成“填坑”——当然填坑是阿里云来完成的,我们只是见证曾经的坑坑洼洼变成平坦大道。 15号(周四)晚上我们发现了SLB会话保持的坑,16号晚上阿里云成功定位并进行修复,这两天正式发布后会填平这个坑。这次从踩坑 ...
今天下午访问高峰的时候,主站的Web服务器出现奇怪的问题,开始是2台8核8G的云服务器(ECS),后来又加了1台8核8G的云服务器,问题依旧。 而且3台服务器特地使用了不同的配置:1台是禁用了虚拟内存的临时磁盘云服务器,1台是启用了虚拟内存的临时磁盘云服务器,1台是禁用了虚拟内存的云盘云服务器 ...
云计算之路系列博文分享的是我们将网站从IDC机房迁移至云计算平台的实际经历,目前即将迁入阿里云,这次分享的是在正式迁移前两台云服务器出现的奇怪问题。 其中一台的故事是这样的: 博客园找找看的后台服务(建索引,查找索引)很早就迁入阿里云的一台云服务器上,一直正常,Windows性能监视器中 ...
首先向大家致歉,这次云服务器故障发现于17:30左右,18:30左右恢复正常,给大家带来了麻烦,请大家谅解! 故障的原因是云服务器所在的集群负载过高,磁盘写入性能急剧下降,造成很多数据库写入操作超时。后来恢复正常的解决方法是将云服务器迁移至另一个集群。 下面是故障发生的主要经过: 今天上午 ...