2017年6月20日更新:今天我们最终发现,CPU 100%问题是博客后台程序所引用的开源组件 HtmlSanitizer 在处理特定html字符串时引起的,升级至最新版3.4.156可解决这个问题。 非常抱歉,今天下午14:20-14:55期间,由于同一个负载均衡中的2台服务器都出现CPU ...
今天下午 : 左右开始,不知道怎么回事,博客站点负载均衡中的web服务器轮番CPU 。平时访问高峰 台服务器就能稳稳支撑,而今天发现CPU出现 问题后就开始加服务器,结果到目前加到了 台,也无济于事,只是从 台服务器轮番CPU 变成 台服务器轮询 。 非常抱歉,由此给您带来麻烦,请您谅解。当您打开页面很慢或者出现 错误,就是因为所访问的服务器当时CPU 。 发布这篇博文之后,发现今天上午出现过故障 ...
2018-03-14 16:21 25 3055 推荐指数:
2017年6月20日更新:今天我们最终发现,CPU 100%问题是博客后台程序所引用的开源组件 HtmlSanitizer 在处理特定html字符串时引起的,升级至最新版3.4.156可解决这个问题。 非常抱歉,今天下午14:20-14:55期间,由于同一个负载均衡中的2台服务器都出现CPU ...
非常抱歉,昨天的服务器CPU 100%问题是达到 memcached 的连接数限制引起的,不是阿里云服务器的问题。 之前我们用的是阿里云“云数据库 memcached 版”,上个周末我们换成了自己搭建——基于阿里云“内存网络增强型”服务器用 docker 跑 memcached ...
今天下午访问高峰的时候,主站的Web服务器出现奇怪的问题,开始是2台8核8G的云服务器(ECS),后来又加了1台8核8G的云服务器,问题依旧。 而且3台服务器特地使用了不同的配置:1台是禁用了虚拟内存的临时磁盘云服务器,1台是启用了虚拟内存的临时磁盘云服务器,1台是禁用了虚拟内存的云盘云服务器 ...
这篇博文记录一下6月1日在阿里云上遇到的奇怪的CPU 100%问题,希望多年以后能真相大白。 那天负载均衡(SLB)中只放了1台云服务器(平时都放2台),由于是节假日,虽然只放了一台,但这台服务器的负载也没有平时高。但在上午的时候突然出现了CPU 100%问题,然后切换到另外一台云服务器恢复正常 ...
首先向大家致歉,这次云服务器故障发现于17:30左右,18:30左右恢复正常,给大家带来了麻烦,请大家谅解! 故障的原因是云服务器所在的集群负载过高,磁盘写入性能急剧下降,造成很多数据库写入操作超时。后来恢复正常的解决方法是将云服务器迁移至另一个集群。 下面是故障发生的主要经过: 今天上午 ...
云计算之路系列博文分享的是我们将网站从IDC机房迁移至云计算平台的实际经历,目前已迁入阿里云,这次分享的是我们对之前的博文“解决images.cnblogs.com响应速度慢的诡异问题”中遇到的云服务器并发连接问题的猜想。不妥之处,欢迎批评指正。 这里再简单描述一下这个问题:我们的图片站点(静态 ...
最近我们在服务器部署上使用了一些阿里云竞价服务器,比如在负载均衡中使用包年包月服务器与竞价服务器相结合,服务器部署调整时先用竞价服务器临时顶替一下。使用竞价服务器最大的风险是随时可能会被释放,今天之前我们只遇到过1次竞价服务器被释放的情况,那次被释放了2台,也是在周五,看来周五是一个竞价的高峰 ...
虚拟内存的,但昨天由于虚拟内存不够用,造成了服务器自动重启(详见云计算之路-阿里云上:禁用Window ...