非常抱歉,今天上午的博客站點故障給大家帶來了很大的麻煩,請大家諒解。這次故障是我們發布 .NET Core 版博客站點引起的,雖然我們進行了充分的准備,但還是低估了高並發下的復雜問題。 以下是故障背景與大致經過: 在這個炎炎夏日,我們正熱火朝天地忙着整個 .NET Core 遷移工程的收官 ...
注:這邊博文分享的是我們處理故障過程中發生的事實,故障的確是在我們將博客系統從 .NET . 版回退到 .NET Core . 版恢復的,但不一定是 .NET . 本身的問題,有可能是巧合,也有可能是我們的應用代碼不能適應 .NET . 的某些變更,我們會進一步排查與驗證。 自從博客系統升級 .NET . 之后遇到的詭異故障 一 二 三 四 ,今天它又出現了,就在前天剛剛故障之后, 就在昨天 . ...
2020-11-12 23:11 110 6762 推薦指數:
非常抱歉,今天上午的博客站點故障給大家帶來了很大的麻煩,請大家諒解。這次故障是我們發布 .NET Core 版博客站點引起的,雖然我們進行了充分的准備,但還是低估了高並發下的復雜問題。 以下是故障背景與大致經過: 在這個炎炎夏日,我們正熱火朝天地忙着整個 .NET Core 遷移工程的收官 ...
非常抱歉,今天下午 17:10~17:40 左右,由於博客系統所使用的 redis 服務器宕機,造成博客站點無法正常訪問,由此給您帶來很大的麻煩,請您諒解。 我們會針對這次故障改進 redis 服務器的部署,提高 redis 服務器的高可用性。目前 redis 服務是用阿里雲服務器單獨部署 ...
非常非常抱歉,今天上午的故障又一次給大家帶來麻煩了,再次懇請大家的諒解。 在昨天升級阿里雲 RDS SQL Server 實例的配置后(詳見昨天的博文),萬萬沒有想到,今天上午更高配置的阿里雲 RDS 實例依然出現了 CPU 居高不下的問題。 在數據庫 CPU 高的情況下,有時對訪問速度 ...
着通過這個IP訪問博客站點(www.cnblogs.com)的所有用戶(絕大多數用戶都使用這個IP)都無 ...
【更新】抱歉,是我們錯怪了 .NET 5.0 ,故障與 .NET 5.0 無關,詳見 Memcached 的惹禍,.NET 5.0 的背鍋 昨天晚上我們將博客系統從 .NET Core 3.1 升級到了 .NET 5.0 ,本來是一次很有信心的升級,但沒有想到在今天下午訪問高峰時竟然出現 ...
非常抱歉,今天凌晨博客站點負載均衡中所有3台服務器的IIS應用程序池突然停止工作,造成 1:20-7:45 左右博客站點無法正常訪問,由此給您帶來很大的麻煩,請您諒解。 服務器操作系統是 Windows Server 2016,對應的 IIS 錯誤日志如下: A process ...
非常抱歉,今天下午14:40-15:00左右,web服務器突然雪崩似的出現CPU 100%問題,造成博客站點無法訪問(503)。由此給您帶來很大的麻煩,請您諒解。 在問題出現之前,博客站點運行着5台web服務器,4台4核8G的阿里雲-計算型(原獨享)sn1系列II-服務器,1台8核8G的阿里雲 ...
在上次發布失敗后,很多朋友建議我們改用 k8s ,但我們還是想再試試 docker swarm ,實在不行再改用 k8s 。 在改進了 docker swarm 集群的部署后,我們准備今天 17:3 ...