非常抱歉,今天 10:30-10:45 左右由於 docker swarm 集群節點出現問題,造成除博客之外的站點出現訪問異常,由此給您帶來很大的麻煩,請您諒解。 故障開始時出現有時訪問正常有時訪問出現 502 或 500 ,當時我們就判斷是某個節點出現問題,但無法直接定位出哪個節點,只能依次 ...
我們的生產環境部署了 個 docker swarm 集群,集群 swarm a 用於專門跑博客站點,集群 swarm b 用於跑其他站點,manager 節點用了阿里雲包月服務器,worker 節點用了阿里雲搶占式實例。 今天 : 收到阿里雲的短信通知 您的搶占式實例:實例ID 實例名稱 因庫存變化,即將進入釋放狀態 ,一共被釋放了 台,其中 台是集群 swarm a 的節點服務器, 台是集群 s ...
2019-10-15 15:56 14 2064 推薦指數:
非常抱歉,今天 10:30-10:45 左右由於 docker swarm 集群節點出現問題,造成除博客之外的站點出現訪問異常,由此給您帶來很大的麻煩,請您諒解。 故障開始時出現有時訪問正常有時訪問出現 502 或 500 ,當時我們就判斷是某個節點出現問題,但無法直接定位出哪個節點,只能依次 ...
非常抱歉,今天下午 16:55~17:05 左右,由於 docker swarm 集群的突發不穩定問題造成新版博客后台(目前處於灰度發布階段)無法正常使用,由此給您帶來麻煩,請您諒解。 出故障期時,新版博客后台的2個容器都無法正常啟動。 發現問題后,我們進行了刪除 stack ...
今天傍晚 17:38-18:18 左右,由於 docker swarm 集群出現 "The swarm does not have a leader" 問題,造成博問、閃存、園子、小組、openapi 無法正常訪問,由此給您帶來麻煩,請您諒解。 目前我們已經遷移至 asp.net core ...
非常抱歉,今天 10:05-10:20 左右,我們用阿里雲服務器搭建的 docker swarm 集群又出現故障,又是因為突然的節點 CPU 波動。 受這次故障影響的站點有 閃存,博問,班級,園子,短信息,招聘,小組,網摘,openapi ,由此給您帶來很大的麻煩,請您諒解。 故障前先是有一個 ...
今天凌晨我們用阿里雲服務器自建的 kubernetes 集群出現突發異常情況,博客站點(blog-web)與博客 web api(blog-api)的 pod 無法正常啟動(CrashLoopBackOff)。 kubectl get pods -l app=blog-web ...
在上次遭遇 docker swarm 集群故障后,我們將 docker 由 17.10.0-ce 升級為最新穩定版 docker 17.12.0-ce 。 前天晚上22:00之后集群中的2個節點突然出現CPU波動,在CPU波動之后,在凌晨夜深人靜、訪問量極低的時候,整個集群出現了故障,訪問 ...
最近,我們對新版博客后台(Angular 8.2.7 + .NET Core 3.0)進行了灰度發布,如果您訪問博客后台時跳轉到 https://i-beta.cnblogs.com/ ,說明使用的就是新版博客后台。 今天我們在一次基於 gitlab-ci 的自動化發布過程中,由於操作問題 ...
3月21日,由於使用阿里雲服務器自建 docker swarm 集群的不穩定,我們將自建 docker swarm 集群上的所有應用切換阿里雲容器服務 swarm 版(非swarm mode)。 3月22日,我們進行移除與重啟節點的操作時引發了故障,詳見 雲計算之路-阿里雲上-容器服務:移除節點 ...