原文:云计算之路-阿里云上:部分服务器未及时续费造成docker swarm集群故障

非常非常抱歉,由于我们的疏忽 docker swarm 集群中的 台服务器没有及时续费,造成在夜里 点被自动关机,从而引发整个 docker swarm 集群故障,造成今天凌晨 : : 左右跑在集群上的站点无法访问,由此给您带来很大很大的麻烦,恳请您的谅解。受这次故障影响的站点有 闪存,博问,班级,园子,短信息,招聘,小组,网摘,openapi 。 昨天下午 : 左右我们收到了阿里云的服务器到期通 ...

2018-02-01 09:21 23 1471 推荐指数:

查看详情

云计算之路-阿里上:docker swarm 集群故障与异常

在上次遭遇 docker swarm 集群故障后,我们将 docker 由 17.10.0-ce 升级为最新稳定版 docker 17.12.0-ce 。 前天晚上22:00之后集群中的2个节点突然出现CPU波动,在CPU波动之后,在凌晨夜深人静、访问量极低的时候,整个集群出现了故障,访问 ...

Fri Jan 19 20:52:00 CST 2018 5 2269
云计算之路-阿里上:3个manager节点异常造成 docker swarm 集群宕机

今天 11:29 - 11:39 左右,docker swarm 集群 3 个 manager 节点同时出现异常,造成整个集群宕机,由此给您带来很大的麻烦,请您谅解。 受此次故障影响的站点有:博问,闪存,班级,园子,短信息,招聘,小组,网摘,新闻,openapi 最近我们刚刚确认我们所有遇到 ...

Wed Mar 14 20:21:00 CST 2018 9 1620
云计算之路-阿里上:docker swarm 集群再次出现故障

非常非常抱歉!16:30 ~ 17:00 左右我们用于跑 ASP.NET Core 站点的 docker swarm 集群再次出现宕机,由此给您带来了很大很大的麻烦,恳请您的谅解! 受此次故障影响的站点有:博问,闪存,班级,园子,短信息,招聘,小组,网摘,新闻,openapi 故障 ...

Fri Mar 16 02:13:00 CST 2018 15 3051
云计算之路-阿里上:节点 CPU 波动引发 docker swarm 集群故障

非常抱歉,今天 10:05-10:20 左右,我们用阿里服务器搭建的 docker swarm 集群又出现故障,又是因为突然的节点 CPU 波动。 受这次故障影响的站点有 闪存,博问,班级,园子,短信息,招聘,小组,网摘,openapi ,由此给您带来很大的麻烦,请您谅解。 故障前先是有一个 ...

Fri Jan 26 19:08:00 CST 2018 8 2427
云计算之路-迁入阿里后:20130314服务器故障经过

首先向大家致歉,这次服务器故障发现于17:30左右,18:30左右恢复正常,给大家带来了麻烦,请大家谅解! 故障的原因是服务器所在的集群负载过高,磁盘写入性能急剧下降,造成很多数据库写入操作超时。后来恢复正常的解决方法是将服务器迁移至另一个集群。 下面是故障发生的主要经过: 今天上午 ...

Fri Mar 15 07:53:00 CST 2013 43 7565
云计算之路-阿里上-容器难容:优化自建 docker swarm 集群的部署

在上周六遭遇阿里容器服务 swarm 版的故障之后,我们决定还是走自建 docker swarm 之路,只要不是阿里底层的问题,我们相信会找到办法解决或避开自建 docker swarm 不稳定的问题。 以下是我们即将采用的 docker swarm 集群部署优化措施 ...

Tue Apr 03 03:48:00 CST 2018 4 1657
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM