原文:云计算之路-阿里云上:3个manager节点异常造成 docker swarm 集群宕机

今天 : : 左右,docker swarm 集群 个 manager 节点同时出现异常,造成整个集群宕机,由此给您带来很大的麻烦,请您谅解。 受此次故障影响的站点有:博问,闪存,班级,园子,短信息,招聘,小组,网摘,新闻,openapi 最近我们刚刚确认我们所有遇到的 docker swarm 不稳定问题都与部分节点的异常状况有关,即使是一直让我们非常头疼的 docker flow proxy ...

2018-03-14 12:21 9 1620 推荐指数:

查看详情

云计算之路-阿里上:docker swarm 集群故障与异常

在上次遭遇 docker swarm 集群故障后,我们将 docker 由 17.10.0-ce 升级为最新稳定版 docker 17.12.0-ce 。 前天晚上22:00之后集群中的2个节点突然出现CPU波动,在CPU波动之后,在凌晨夜深人静、访问量极低的时候,整个集群出现了故障,访问 ...

Fri Jan 19 20:52:00 CST 2018 5 2269
云计算之路-阿里上:节点 CPU 波动引发 docker swarm 集群故障

非常抱歉,今天 10:05-10:20 左右,我们用阿里服务器搭建的 docker swarm 集群又出现故障,又是因为突然的节点 CPU 波动。 受这次故障影响的站点有 闪存,博问,班级,园子,短信息,招聘,小组,网摘,openapi ,由此给您带来很大的麻烦,请您谅解。 故障前先是有一个 ...

Fri Jan 26 19:08:00 CST 2018 8 2427
云计算之路-阿里上:部分服务器未及时续费造成docker swarm集群故障

非常非常抱歉,由于我们的疏忽 —— docker swarm 集群中的 2 台服务器没有及时续费,造成在夜里0点被自动关机,从而引发整个 docker swarm 集群故障,造成今天凌晨 0:30 ~ 7:50 左右跑在集群上的站点无法访问,由此给您带来很大很大的麻烦,恳请您的谅解。受这次故障影响 ...

Thu Feb 01 17:21:00 CST 2018 23 1471
云计算之路-阿里上-容器难容:优化自建 docker swarm 集群的部署

在上周六遭遇阿里容器服务 swarm 版的故障之后,我们决定还是走自建 docker swarm 之路,只要不是阿里底层的问题,我们相信会找到办法解决或避开自建 docker swarm 不稳定的问题。 以下是我们即将采用的 docker swarm 集群部署优化措施 ...

Tue Apr 03 03:48:00 CST 2018 4 1657
云计算之路-阿里上-容器难容:自建docker swarm集群遭遇无法解决的问题

我们从今年6月开始在生产环境进行 docker 容器化部署,将已经迁移至 ASP.NET Core 的站点部署到 docker swarm 集群上。开始我们选用的阿里容器服务,但是在使用过程中我们遭遇了恐怖的路由服务(acsrouting)路由错乱问题 —— 请求被随机路由到集群中的任一容器 ...

Sun Aug 27 07:18:00 CST 2017 18 3603
云计算之路-阿里上:docker swarm 集群再次出现故障

非常非常抱歉!16:30 ~ 17:00 左右我们用于跑 ASP.NET Core 站点的 docker swarm 集群再次出现宕机,由此给您带来了很大很大的麻烦,恳请您的谅解! 受此次故障影响的站点有:博问,闪存,班级,园子,短信息,招聘,小组,网摘,新闻,openapi 故障 ...

Fri Mar 16 02:13:00 CST 2018 15 3051
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM