原文:云计算之路-阿里云上:docker swarm 集群故障与异常

在上次遭遇 docker swarm 集群故障后,我们将 docker 由 . . ce 升级为最新稳定版 docker . . ce 。 前天晚上 : 之后集群中的 个节点突然出现CPU波动,在CPU波动之后,在凌晨夜深人静 访问量极低的时候,整个集群出现了故障,访问集群上的所有站点都出现了 ,过了一段时间后自动恢复正常。 ECS实例:swarm node ,CPU百分比于 : 发生告警,值为 ...

2018-01-19 12:52 5 2269 推荐指数:

查看详情

云计算之路-阿里上:节点 CPU 波动引发 docker swarm 集群故障

非常抱歉,今天 10:05-10:20 左右,我们用阿里服务器搭建的 docker swarm 集群又出现故障,又是因为突然的节点 CPU 波动。 受这次故障影响的站点有 闪存,博问,班级,园子,短信息,招聘,小组,网摘,openapi ,由此给您带来很大的麻烦,请您谅解。 故障前先是有一个 ...

Fri Jan 26 19:08:00 CST 2018 8 2427
云计算之路-阿里上:docker swarm 集群再次出现故障

非常非常抱歉!16:30 ~ 17:00 左右我们用于跑 ASP.NET Core 站点的 docker swarm 集群再次出现宕机,由此给您带来了很大很大的麻烦,恳请您的谅解! 受此次故障影响的站点有:博问,闪存,班级,园子,短信息,招聘,小组,网摘,新闻,openapi 故障 ...

Fri Mar 16 02:13:00 CST 2018 15 3051
云计算之路-阿里上:3个manager节点异常造成 docker swarm 集群宕机

今天 11:29 - 11:39 左右,docker swarm 集群 3 个 manager 节点同时出现异常,造成整个集群宕机,由此给您带来很大的麻烦,请您谅解。 受此次故障影响的站点有:博问,闪存,班级,园子,短信息,招聘,小组,网摘,新闻,openapi 最近我们刚刚确认我们所有遇到 ...

Wed Mar 14 20:21:00 CST 2018 9 1620
云计算之路-阿里上:部分服务器未及时续费造成docker swarm集群故障

非常非常抱歉,由于我们的疏忽 —— docker swarm 集群中的 2 台服务器没有及时续费,造成在夜里0点被自动关机,从而引发整个 docker swarm 集群故障,造成今天凌晨 0:30 ~ 7:50 左右跑在集群上的站点无法访问,由此给您带来很大很大的麻烦,恳请您的谅解。受这次故障影响 ...

Thu Feb 01 17:21:00 CST 2018 23 1471
云计算之路-阿里上-容器难容:优化自建 docker swarm 集群的部署

在上周六遭遇阿里容器服务 swarm 版的故障之后,我们决定还是走自建 docker swarm 之路,只要不是阿里底层的问题,我们相信会找到办法解决或避开自建 docker swarm 不稳定的问题。 以下是我们即将采用的 docker swarm 集群部署优化措施 ...

Tue Apr 03 03:48:00 CST 2018 4 1657
云计算之路-阿里上-容器难容:自建docker swarm集群遭遇无法解决的问题

我们从今年6月开始在生产环境进行 docker 容器化部署,将已经迁移至 ASP.NET Core 的站点部署到 docker swarm 集群上。开始我们选用的阿里容器服务,但是在使用过程中我们遭遇了恐怖的路由服务(acsrouting)路由错乱问题 —— 请求被随机路由到集群中的任一容器 ...

Sun Aug 27 07:18:00 CST 2017 18 3603
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM