原文:云计算之路-阿里云上-容器难容:容器服务故障以及自建 docker swarm 集群故障

月 日,由于使用阿里云服务器自建 docker swarm 集群的不稳定,我们将自建 docker swarm 集群上的所有应用切换阿里云容器服务 swarm 版 非swarm mode 。 月 日,我们进行移除与重启节点的操作时引发了故障,详见 云计算之路 阿里云上 容器服务:移除节点引发博问站点短暂故障 。 月 日,我们参考阿里云容器服务帮助文档 指定多节点调度通过给节点添加用户标签的方式成 ...

2018-04-01 12:19 14 1816 推荐指数:

查看详情

云计算之路-阿里上-容器难容:优化自建 docker swarm 集群的部署

在上周六遭遇阿里容器服务 swarm 版的故障之后,我们决定还是走自建 docker swarm 之路,只要不是阿里底层的问题,我们相信会找到办法解决或避开自建 docker swarm 不稳定的问题。 以下是我们即将采用的 docker swarm 集群部署优化措施 ...

Tue Apr 03 03:48:00 CST 2018 4 1657
云计算之路-阿里上-容器难容自建docker swarm集群遭遇无法解决的问题

我们从今年6月开始在生产环境进行 docker 容器化部署,将已经迁移至 ASP.NET Core 的站点部署到 docker swarm 集群上。开始我们选用的阿里容器服务,但是在使用过程中我们遭遇了恐怖的路由服务(acsrouting)路由错乱问题 —— 请求被随机路由到集群中的任一容器 ...

Sun Aug 27 07:18:00 CST 2017 18 3603
云计算之路-阿里上:docker swarm 集群故障与异常

在上次遭遇 docker swarm 集群故障后,我们将 docker 由 17.10.0-ce 升级为最新稳定版 docker 17.12.0-ce 。 前天晚上22:00之后集群中的2个节点突然出现CPU波动,在CPU波动之后,在凌晨夜深人静、访问量极低的时候,整个集群出现了故障,访问 ...

Fri Jan 19 20:52:00 CST 2018 5 2269
云计算之路-阿里上:节点 CPU 波动引发 docker swarm 集群故障

非常抱歉,今天 10:05-10:20 左右,我们用阿里服务器搭建的 docker swarm 集群又出现故障,又是因为突然的节点 CPU 波动。 受这次故障影响的站点有 闪存,博问,班级,园子,短信息,招聘,小组,网摘,openapi ,由此给您带来很大的麻烦,请您谅解。 故障前先是有一个 ...

Fri Jan 26 19:08:00 CST 2018 8 2427
云计算之路-阿里上:docker swarm 集群再次出现故障

非常非常抱歉!16:30 ~ 17:00 左右我们用于跑 ASP.NET Core 站点的 docker swarm 集群再次出现宕机,由此给您带来了很大很大的麻烦,恳请您的谅解! 受此次故障影响的站点有:博问,闪存,班级,园子,短信息,招聘,小组,网摘,新闻,openapi 故障 ...

Fri Mar 16 02:13:00 CST 2018 15 3051
云计算之路-阿里上:部分服务器未及时续费造成docker swarm集群故障

非常非常抱歉,由于我们的疏忽 —— docker swarm 集群中的 2 台服务器没有及时续费,造成在夜里0点被自动关机,从而引发整个 docker swarm 集群故障,造成今天凌晨 0:30 ~ 7:50 左右跑在集群上的站点无法访问,由此给您带来很大很大的麻烦,恳请您的谅解。受这次故障影响 ...

Thu Feb 01 17:21:00 CST 2018 23 1471
云计算之路-阿里上-容器服务:移除节点引发博问站点短暂故障

昨天 18:00 之后我们将自建 docker swarm 集群上的所有应用都切换到了阿里 swarm 容器服务(非 swarm mode ,不支持 overlay 网络)的集群上。 今天晚上我们通过阿里容器服务控制台将1个节点移出集群(当时集群中一共有9个节点) 没想到这样一个常规 ...

Fri Mar 23 05:28:00 CST 2018 4 758
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM