風雨之后是彩虹,經歷了三個月的風雨之后,從6月14日起(上次故障發生於6月13日)開始享受彩虹。。。而今天突襲而來的RDS故障讓我們懂得了彩虹期間會有陣雨,但不管怎么樣,離“晴空萬里”越來越近了。 2013年7月23日10:00~11:00左右,我們使用的阿里雲RDS(關系型數據庫服務)突然 ...
今天上午 : 左右,我們所使用的阿里雲 RDS 實例的 CPU 突然飆高到近 ,造成大量數據庫查詢操作緩慢 超時,在這個惡劣條件下大量 memcached 緩存無法建立,這樣的雪上加霜讓 Web 服務器的 CPU 跟着不堪重負,於是要么訪問緩慢,要么直接 。。。造成網站無法正常訪問,由此給您帶來了很大的麻煩,請您諒解。 問題非常奇怪,昨天同樣的時間段,RDS CPU 占用卻少很多,平時 RDS ...
2018-01-11 12:56 36 5733 推薦指數:
風雨之后是彩虹,經歷了三個月的風雨之后,從6月14日起(上次故障發生於6月13日)開始享受彩虹。。。而今天突襲而來的RDS故障讓我們懂得了彩虹期間會有陣雨,但不管怎么樣,離“晴空萬里”越來越近了。 2013年7月23日10:00~11:00左右,我們使用的阿里雲RDS(關系型數據庫服務)突然 ...
虛擬內存的,但昨天由於虛擬內存不夠用,造成了服務器自動重啟(詳見雲計算之路-阿里雲上:禁用Window ...
非常抱歉,今天 10:05-10:20 左右,我們用阿里雲服務器搭建的 docker swarm 集群又出現故障,又是因為突然的節點 CPU 波動。 受這次故障影響的站點有 閃存,博問,班級,園子,短信息,招聘,小組,網摘,openapi ,由此給您帶來很大的麻煩,請您諒解。 故障前先是有一個 ...
非常抱歉,今天凌晨 3:20~8:30 左右,我們使用的阿里雲 RDS 實例 SQL Server 2016 標准版突然出現 CPU 100% 故障,造成全站無法正常訪問,由此給您帶來巨大的麻煩,請您諒解。 問題很奇怪,故障期間是數據庫服務器負載極低的時間段。從阿里雲 RDS 控制台 ...
非常抱歉,今天 8:48 開始,我們使用的阿里雲 RDS SQL Server 數據庫實例突然出現 CPU 100% 問題,引發全站故障,由此給您帶來麻煩,請您諒解。 發現故障后立即進行主備切換,和往常一樣,第1次主備切換失敗,第2次主備切換完成后恢復正常。 上次同樣故障發生在2020年 ...
非常抱歉!今天 12:03-12:52 ,由於數據庫連接數異常突增超過1萬,達到了阿里雲RDS的最大連接數限制,影響了全站的正常訪問。由此給您帶來麻煩,請您諒解。 在發現數據庫連接數突增的問題后,我們一開始懷疑可能是我們的某些應用中產生太多ADO.NET連接引起的,但是對嫌疑的應用 ...
繼續向大家匯報,上周在阿里雲的幫助下我們重點解決的是以下兩個問題: 1. 在專門跑博客站點的負載均衡中,如果單台雲服務器處理的並發請求高(比如超過200 Get Requests/s),CPU有時會出現坐“過山車”的情況,CPU占用瞬間跳到100%,然后又回落(見下圖)。這種情況只有1秒的采樣 ...
昨天 18:00 之后我們將自建 docker swarm 集群上的所有應用都切換到了阿里雲 swarm 容器服務(非 swarm mode ,不支持 overlay 網絡)的集群上。 今天晚上我們通過阿里雲容器服務控制台將1個節點移出集群(當時集群中一共有9個節點) 沒想到這樣一個常規 ...