今天晚上9點我們收到阿里雲的告警通知: 【阿里雲監控】華東1(杭州)-雲數據庫RDS版<cnblogsdb> [instanceId=xxx] 於21:00 發生告警, 前往診斷 CPU使用率平均值(98.25>=80 ), 持續時間4分鍾, rds_CpuUsage ...
今天下午 : 左右,先是發現博客后台出現 博客后台的 pod 健康檢查時會連接數據庫,如果連接過慢造成健康檢查失敗,pod 會重啟,如果所有 pod 都因健康檢查失敗而重啟,這時訪問就會出現 。過了一會,其中 個 pod 重啟成功,博客后台恢復正常。 原以為只是一次短暫的波動,但隨即發現博客站點響應速度變慢,難道數據庫服務器又要出現 CPU 了,趕緊登錄阿里雲RDS控制台查看監控,CPU 正常,查 ...
2021-05-07 17:49 70 7517 推薦指數:
今天晚上9點我們收到阿里雲的告警通知: 【阿里雲監控】華東1(杭州)-雲數據庫RDS版<cnblogsdb> [instanceId=xxx] 於21:00 發生告警, 前往診斷 CPU使用率平均值(98.25>=80 ), 持續時間4分鍾, rds_CpuUsage ...
今天上午11:10,我們又中“獎”了,我們使用的阿里雲 RDS 實例(SQL Server 2016 標准版,16核32G)突發出現 CPU 100%,引發全站故障,直到 12:15 才完全恢復,由此給您帶來很大的麻煩,請您諒解。 這是我們今年的第3次中“獎”,前2次分別發生 ...
11月3日,詳見 【故障公告】訪問高峰數據庫服務器 CPU 100% 引發全站故障 阿里雲 RDS ...
今天五一勞動節的一大早 4:50-6:30 期間,我們使用的阿里雲 RDS SQL Server 數據庫實例再次出現 CPU 100% 問題,引發全站故障,由此給您帶來麻煩,請您諒解。 我們發現故障后立即進行主備切換,與上次故障不同的是,這次主備切換沒有成功,再次切換,依然沒有成功,后來嘗試重啟 ...
非常抱歉,今天 10:30-10:45 左右由於 docker swarm 集群節點出現問題,造成除博客之外的站點出現訪問異常,由此給您帶來很大的麻煩,請您諒解。 故障開始時出現有時訪問正常有時訪問出現 502 或 500 ,當時我們就判斷是某個節點出現問題,但無法直接定位出哪個節點,只能依次 ...
悄悄地它又突然來了 —— 數據庫服務器 CPU 100% 問題,上次光臨時間是 3-30 8:48,這次是 4-28 9:41。 這次我們做出了快速反應,發現后立即進行主備切換,這次一次切換成功,CPU 很快恢復正常。 但是,這次來的“真”是時候(訪問高峰),雖然數據庫 CPU 恢復正常 ...
非常抱歉!今天 12:03-12:52 ,由於數據庫連接數異常突增超過1萬,達到了阿里雲RDS的最大連接數限制,影響了全站的正常訪問。由此給您帶來麻煩,請您諒解。 在發現數據庫連接數突增的問題后,我們一開始懷疑可能是我們的某些應用中產生太多ADO.NET連接引起的,但是對嫌疑的應用 ...
非常抱歉,今天上午 10:48 ~ 11:33 期間,我們所使用的數據庫服務(阿里雲 RDS 實例 SQL Server 2016 標准版)又出現了 CPU 近 100% 問題,由此給您帶來麻煩,請您諒解。 這次剛開始出現 CPU 近 100% 問題時,沒有造成大的影響,后來有段時間 CPU ...