在上次遭遇 docker swarm 集群故障后,我们将 docker 由 17.10.0-ce 升级为最新稳定版 docker 17.12.0-ce 。 前天晚上22:00之后集群中的2个节点突然出现CPU波动,在CPU波动之后,在凌晨夜深人静、访问量极低的时候,整个集群出现了故障,访问 ...
注:不好意思,写的时候时间弄错了,应该是 天 次故障, 月 日未发生故障。 上海连续三天的高温,阿里云却是连续三天的故障 年 月 日 : : , 小时RDS故障 详见云计算之路 阿里云上 阵雨:RDS故障的突袭 年 月 日 : : , 分钟RDS故障 年 月 日 : : , 分钟SLB故障 详见云计算之路 阿里云上 十字路口:阿里云SLB故障 年 月 日 : : , 分钟RDS故障 一个是最前端 ...
2013-07-26 14:12 66 12694 推荐指数:
在上次遭遇 docker swarm 集群故障后,我们将 docker 由 17.10.0-ce 升级为最新稳定版 docker 17.12.0-ce 。 前天晚上22:00之后集群中的2个节点突然出现CPU波动,在CPU波动之后,在凌晨夜深人静、访问量极低的时候,整个集群出现了故障,访问 ...
后续进展:云计算之路-阿里云上:向大家汇报一下今天上午的网站故障 今天上午(5月16日)9:30~9:40左右,下午16:30~17:00左右,由于博客站点的Web服务器CPU大幅波动(有如坐过山车),造成网站不能正常访问,给大家带来了很大的麻烦,请大家谅解! 经过阿里云工程师的仔细 ...
风雨之后是彩虹,经历了三个月的风雨之后,从6月14日起(上次故障发生于6月13日)开始享受彩虹。。。而今天突袭而来的RDS故障让我们懂得了彩虹期间会有阵雨,但不管怎么样,离“晴空万里”越来越近了。 2013年7月23日10:00~11:00左右,我们使用的阿里云RDS(关系型数据库服务)突然 ...
2013年7月24日,18:20~18:50左右,处于阿里云云服务最前沿的SLB(负载均衡)出现故障,造成了网站不能正常访问(由于是最前沿,这次连502也看不到了)。 在大家对昨日RDS故障带来的麻烦还记忆犹新的时候,今天又给大家带来新的麻烦,我们真的真的很抱歉! 我们本来想走上云计算之路 ...
3月21日,由于使用阿里云服务器自建 docker swarm 集群的不稳定,我们将自建 docker swarm 集群上的所有应用切换阿里云容器服务 swarm 版(非swarm mode)。 3月22日,我们进行移除与重启节点的操作时引发了故障,详见 云计算之路-阿里云上-容器服务:移除节点 ...
首先向大家致歉,这次云服务器故障发现于17:30左右,18:30左右恢复正常,给大家带来了麻烦,请大家谅解! 故障的原因是云服务器所在的集群负载过高,磁盘写入性能急剧下降,造成很多数据库写入操作超时。后来恢复正常的解决方法是将云服务器迁移至另一个集群。 下面是故障发生的主要经过: 今天上午 ...
非常抱歉,今天 10:05-10:20 左右,我们用阿里云服务器搭建的 docker swarm 集群又出现故障,又是因为突然的节点 CPU 波动。 受这次故障影响的站点有 闪存,博问,班级,园子,短信息,招聘,小组,网摘,openapi ,由此给您带来很大的麻烦,请您谅解。 故障前先是有一个 ...
2013年8月22日23:50~23:58左右,由于阿里云SLB(负载均衡)故障造成网站不能正常访问,给大家带来了麻烦,望大家谅解! 8月19日我们收到阿里云的短信通知: 尊敬的阿里云用户: 您好! 负载均衡(SLB)将于8月22日22:00 至 23日00:00进行 ...