原文:雲計算之路-阿里雲上:docker swarm 集群再次出現故障

非常非常抱歉 : : 左右我們用於跑 ASP.NET Core 站點的 docker swarm 集群再次出現宕機,由此給您帶來了很大很大的麻煩,懇請您的諒解 受此次故障影響的站點有:博問,閃存,班級,園子,短信息,招聘,小組,網摘,新聞,openapi 故障的經過是這樣的。 一開始只是訪問時偶爾出現 ,然后 逐漸增多。登錄到集群的各個節點,發現有節點 ssh 登錄響應慢,登錄進去后執行 doc ...

2018-03-15 18:13 15 3051 推薦指數:

查看詳情

雲計算之路-阿里上:docker swarm 集群故障與異常

在上次遭遇 docker swarm 集群故障后,我們將 docker 由 17.10.0-ce 升級為最新穩定版 docker 17.12.0-ce 。 前天晚上22:00之后集群中的2個節點突然出現CPU波動,在CPU波動之后,在凌晨夜深人靜、訪問量極低的時候,整個集群出現故障,訪問 ...

Fri Jan 19 20:52:00 CST 2018 5 2269
雲計算之路-阿里上:神奇的“黑色30秒”再次出現,究竟是誰的錯?

自從4月28日我們從ASP.NET線程的角度對“黑色30秒”問題進行分析之后,我們采用了新的線程設置,然后觀察“黑色30秒”是否再次出現。 采用以上設置之后,Requests Queued出現的頻率的確少了。之后的幾天,也沒出現“黑色30秒”。 於是,ASP.NET線程設置問題 ...

Tue May 06 03:41:00 CST 2014 32 4718
雲計算之路-阿里上:節點 CPU 波動引發 docker swarm 集群故障

非常抱歉,今天 10:05-10:20 左右,我們用阿里服務器搭建的 docker swarm 集群出現故障,又是因為突然的節點 CPU 波動。 受這次故障影響的站點有 閃存,博問,班級,園子,短信息,招聘,小組,網摘,openapi ,由此給您帶來很大的麻煩,請您諒解。 故障前先是有一個 ...

Fri Jan 26 19:08:00 CST 2018 8 2427
雲計算之路-阿里上:部分服務器未及時續費造成docker swarm集群故障

非常非常抱歉,由於我們的疏忽 —— docker swarm 集群中的 2 台服務器沒有及時續費,造成在夜里0點被自動關機,從而引發整個 docker swarm 集群故障,造成今天凌晨 0:30 ~ 7:50 左右跑在集群上的站點無法訪問,由此給您帶來很大很大的麻煩,懇請您的諒解。受這次故障影響 ...

Thu Feb 01 17:21:00 CST 2018 23 1471
雲計算之路-阿里上-容器難容:優化自建 docker swarm 集群的部署

在上周六遭遇阿里容器服務 swarm 版的故障之后,我們決定還是走自建 docker swarm 之路,只要不是阿里底層的問題,我們相信會找到辦法解決或避開自建 docker swarm 不穩定的問題。 以下是我們即將采用的 docker swarm 集群部署優化措施 ...

Tue Apr 03 03:48:00 CST 2018 4 1657
雲計算之路-阿里上-容器難容:自建docker swarm集群遭遇無法解決的問題

我們從今年6月開始在生產環境進行 docker 容器化部署,將已經遷移至 ASP.NET Core 的站點部署到 docker swarm 集群上。開始我們選用的阿里容器服務,但是在使用過程中我們遭遇了恐怖的路由服務(acsrouting)路由錯亂問題 —— 請求被隨機路由到集群中的任一容器 ...

Sun Aug 27 07:18:00 CST 2017 18 3603
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM