。 自从博客系统升级 .NET 5.0 之后遇到的诡异故障(一、二、三、四),今天它又出现了,就在前 ...
更新 抱歉,是我们错怪了 .NET . ,故障与 .NET . 无关,详见 Memcached 的惹祸,.NET . 的背锅 昨天晚上我们将博客系统从 .NET Core . 升级到了 .NET . ,本来是一次很有信心的升级,但没有想到在今天下午访问高峰时竟然出现了故障,大量请求访问速度变慢或者因为下面的数据库连接超时异常出现 错误。 System.InvalidOperationExcept ...
2020-10-15 15:19 138 10700 推荐指数:
。 自从博客系统升级 .NET 5.0 之后遇到的诡异故障(一、二、三、四),今天它又出现了,就在前 ...
10月18日晚上 22:00 ,我们对处于灰度发布阶段的新版博客后台(Angular 8.2.7 + .NET Core 3.0)进行了一次发布操作,在发布后由于清除缓存 web api 的一个 bug 造成在发布后通过新版博客后台修改的博文无法访问(404错误);在发现问题后,我们回退至发布之前 ...
非常抱歉,今天下午 17:10~17:40 左右,由于博客系统所使用的 redis 服务器宕机,造成博客站点无法正常访问,由此给您带来很大的麻烦,请您谅解。 我们会针对这次故障改进 redis 服务器的部署,提高 redis 服务器的高可用性。目前 redis 服务是用阿里云服务器单独部署 ...
最近,我们对新版博客后台(Angular 8.2.7 + .NET Core 3.0)进行了灰度发布,如果您访问博客后台时跳转到 https://i-beta.cnblogs.com/ ,说明使用的就是新版博客后台。 今天我们在一次基于 gitlab-ci 的自动化发布过程中,由于操作问题 ...
我们的生产环境部署了 2 个 docker swarm 集群,集群 swarm-a 用于专门跑博客站点,集群 swarm-b 用于跑其他站点,manager 节点用了阿里云包月服务器,worker 节点用了阿里云抢占式实例。 今天 11:03 收到阿里云的短信通知“您的抢占式实例:实例ID(实例 ...
上周五下午,我们在博客中部署了推荐系统,在博文下方显示“最新IT新闻”的地方显示自动推荐的关联博文。我们用的推荐系统是第四范式的推荐服务,我们自己只是搭建了一个推荐系统中转站(基于 ASP.NET Core),接收来自博客前端的请求,然后将请求转发给第四范式的推荐服务,并将响应内容转发给博客前端 ...
非常抱歉,这次故障给您带来麻烦了,请您谅解。 今天早上 10:54 左右,我们所使用的数据库服务(阿里云 RDS 实例 SQL Server 2016 标准版)CPU 突然飙升至 90% 以上,应用日志中出现大量数据库查询超时的错误。 我们收到告警通知并确认问题后,在 11 ...
昨天晚上,我们使用的阿里云 RDS SQL Server 2008 R2 实例突然出现持续 CPU 100% 问题,后来我们通过重启实例恢复了正常(详见故障公告)。但是在恢复正常后发现了新问题,这台 RDS 实例 IOPS 不够用,必须要进行升级,而且当时过了 0 点也是升级的好时间,再加上 ...