原文:【故障公告】docker swarm 集群問題造成新版博客后台故障

非常抱歉,今天下午 : : 左右,由於 docker swarm 集群的突發不穩定問題造成新版博客后台 目前處於灰度發布階段 無法正常使用,由此給您帶來麻煩,請您諒解。 出故障期時,新版博客后台的 個容器都無法正常啟動。 發現問題后,我們進行了刪除 stack 並重新部署的操作。 重新部署后發現 prod swarm w 節點上的容器可以正常啟動,而 prod swarm w 節點上的容器問題依舊 ...

2019-11-25 17:53 45 3414 推薦指數:

查看詳情

故障公告docker swarm 集群問題引發的故障

我們的生產環境部署了 2 個 docker swarm 集群集群 swarm-a 用於專門跑博客站點,集群 swarm-b 用於跑其他站點,manager 節點用了阿里雲包月服務器,worker 節點用了阿里雲搶占式實例。 今天 11:03 收到阿里雲的短信通知“您的搶占式實例:實例ID(實例 ...

Tue Oct 15 23:56:00 CST 2019 14 2064
故障公告】10:30-10:45 左右 docker swarm 集群節點問題引發故障

非常抱歉,今天 10:30-10:45 左右由於 docker swarm 集群節點出現問題造成博客之外的站點出現訪問異常,由此給您帶來很大的麻煩,請您諒解。 故障開始時出現有時訪問正常有時訪問出現 502 或 500 ,當時我們就判斷是某個節點出現問題,但無法直接定位出哪個節點,只能依次 ...

Mon Sep 03 19:16:00 CST 2018 2 725
故障公告新版博客后台部署時的配置問題引發故障

最近,我們對新版博客后台(Angular 8.2.7 + .NET Core 3.0)進行了灰度發布,如果您訪問博客后台時跳轉到 https://i-beta.cnblogs.com/ ,說明使用的就是新版博客后台。 今天我們在一次基於 gitlab-ci 的自動化發布過程中,由於操作問題 ...

Fri Nov 15 06:55:00 CST 2019 5 1255
故障公告】redis內存耗盡造成博客后台無法保存

非常抱歉,今天上午11:00~11:30左右,由於 redis 服務器內存耗盡造成博客后台故障——保存博文時總是提示“請求太過頻繁,請稍后再試”,由此給您帶來麻煩,請您諒解。 由於 redis 監控報警配置沒有及時更新,當 redis 服務器內存耗盡時我們沒有收到報警通知,所以未能及時發現問題 ...

Thu Dec 24 20:07:00 CST 2020 54 5899
遲到的故障公告:錯誤的緩存數據引發新版博客后台發布后的故障

10月18日晚上 22:00 ,我們對處於灰度發布階段的新版博客后台(Angular 8.2.7 + .NET Core 3.0)進行了一次發布操作,在發布后由於清除緩存 web api 的一個 bug 造成在發布后通過新版博客后台修改的博文無法訪問(404錯誤);在發現問題后,我們回退至發布之前 ...

Thu Nov 21 00:46:00 CST 2019 13 1711
雲計算之路-阿里雲上:部分服務器未及時續費造成docker swarm集群故障

非常非常抱歉,由於我們的疏忽 —— docker swarm 集群中的 2 台服務器沒有及時續費,造成在夜里0點被自動關機,從而引發整個 docker swarm 集群故障造成今天凌晨 0:30 ~ 7:50 左右跑在集群上的站點無法訪問,由此給您帶來很大很大的麻煩,懇請您的諒解。受這次故障影響 ...

Thu Feb 01 17:21:00 CST 2018 23 1471
雲計算之路-阿里雲上:docker swarm 集群故障與異常

在上次遭遇 docker swarm 集群故障后,我們將 docker 由 17.10.0-ce 升級為最新穩定版 docker 17.12.0-ce 。 前天晚上22:00之后集群中的2個節點突然出現CPU波動,在CPU波動之后,在凌晨夜深人靜、訪問量極低的時候,整個集群出現了故障,訪問 ...

Fri Jan 19 20:52:00 CST 2018 5 2269
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM