非常抱歉,今天上午的博客站点故障给大家带来了很大的麻烦,请大家谅解。这次故障是我们发布 .NET Core 版博客站点引起的,虽然我们进行了充分的准备,但还是低估了高并发下的复杂问题。 以下是故障背景与大致经过: 在这个炎炎夏日,我们正热火朝天地忙着整个 .NET Core 迁移工程的收官 ...
注:这边博文分享的是我们处理故障过程中发生的事实,故障的确是在我们将博客系统从 .NET . 版回退到 .NET Core . 版恢复的,但不一定是 .NET . 本身的问题,有可能是巧合,也有可能是我们的应用代码不能适应 .NET . 的某些变更,我们会进一步排查与验证。 自从博客系统升级 .NET . 之后遇到的诡异故障 一 二 三 四 ,今天它又出现了,就在前天刚刚故障之后, 就在昨天 . ...
2020-11-12 23:11 110 6762 推荐指数:
非常抱歉,今天上午的博客站点故障给大家带来了很大的麻烦,请大家谅解。这次故障是我们发布 .NET Core 版博客站点引起的,虽然我们进行了充分的准备,但还是低估了高并发下的复杂问题。 以下是故障背景与大致经过: 在这个炎炎夏日,我们正热火朝天地忙着整个 .NET Core 迁移工程的收官 ...
非常抱歉,今天下午 17:10~17:40 左右,由于博客系统所使用的 redis 服务器宕机,造成博客站点无法正常访问,由此给您带来很大的麻烦,请您谅解。 我们会针对这次故障改进 redis 服务器的部署,提高 redis 服务器的高可用性。目前 redis 服务是用阿里云服务器单独部署 ...
非常非常抱歉,今天上午的故障又一次给大家带来麻烦了,再次恳请大家的谅解。 在昨天升级阿里云 RDS SQL Server 实例的配置后(详见昨天的博文),万万没有想到,今天上午更高配置的阿里云 RDS 实例依然出现了 CPU 居高不下的问题。 在数据库 CPU 高的情况下,有时对访问速度 ...
着通过这个IP访问博客站点(www.cnblogs.com)的所有用户(绝大多数用户都使用这个IP)都无 ...
【更新】抱歉,是我们错怪了 .NET 5.0 ,故障与 .NET 5.0 无关,详见 Memcached 的惹祸,.NET 5.0 的背锅 昨天晚上我们将博客系统从 .NET Core 3.1 升级到了 .NET 5.0 ,本来是一次很有信心的升级,但没有想到在今天下午访问高峰时竟然出现 ...
非常抱歉,今天凌晨博客站点负载均衡中所有3台服务器的IIS应用程序池突然停止工作,造成 1:20-7:45 左右博客站点无法正常访问,由此给您带来很大的麻烦,请您谅解。 服务器操作系统是 Windows Server 2016,对应的 IIS 错误日志如下: A process ...
非常抱歉,今天下午14:40-15:00左右,web服务器突然雪崩似的出现CPU 100%问题,造成博客站点无法访问(503)。由此给您带来很大的麻烦,请您谅解。 在问题出现之前,博客站点运行着5台web服务器,4台4核8G的阿里云-计算型(原独享)sn1系列II-服务器,1台8核8G的阿里云 ...
在上次发布失败后,很多朋友建议我们改用 k8s ,但我们还是想再试试 docker swarm ,实在不行再改用 k8s 。 在改进了 docker swarm 集群的部署后,我们准备今天 17:3 ...