10月18日晚上 22:00 ,我们对处于灰度发布阶段的新版博客后台(Angular 8.2.7 + .NET Core 3.0)进行了一次发布操作,在发布后由于清除缓存 web api 的一个 bug 造成在发布后通过新版博客后台修改的博文无法访问(404错误);在发现问题后,我们回退至发布之前 ...
最近,我们对新版博客后台 Angular . . .NET Core . 进行了灰度发布,如果您访问博客后台时跳转到 https: i beta.cnblogs.com ,说明使用的就是新版博客后台。 今天我们在一次基于 gitlab ci 的自动化发布过程中,由于操作问题在发布前没有对 appsettings.Production.json 的修改进行保存,造成容器在启动时使用了旧版的配置文件 ...
2019-11-14 22:55 5 1255 推荐指数:
10月18日晚上 22:00 ,我们对处于灰度发布阶段的新版博客后台(Angular 8.2.7 + .NET Core 3.0)进行了一次发布操作,在发布后由于清除缓存 web api 的一个 bug 造成在发布后通过新版博客后台修改的博文无法访问(404错误);在发现问题后,我们回退至发布之前 ...
非常抱歉,今天下午 16:55~17:05 左右,由于 docker swarm 集群的突发不稳定问题造成新版博客后台(目前处于灰度发布阶段)无法正常使用,由此给您带来麻烦,请您谅解。 出故障期时,新版博客后台的2个容器都无法正常启动。 发现问题后,我们进行了删除 stack ...
我们的生产环境部署了 2 个 docker swarm 集群,集群 swarm-a 用于专门跑博客站点,集群 swarm-b 用于跑其他站点,manager 节点用了阿里云包月服务器,worker 节点用了阿里云抢占式实例。 今天 11:03 收到阿里云的短信通知“您的抢占式实例:实例ID(实例 ...
非常抱歉,从昨天上午开始,部署在 k8s 集群上的博客后台(基于 .NET Core 3.1 + Angular 8.2 实现)出现奇怪问题,一到访问高峰就多次出现 502 ,有时能自动恢复,有时需要我们手动删除 pod ,由此给您带来麻烦,请您谅解。 我们的应用都部署在同一个 k8s 集群 ...
【更新】抱歉,是我们错怪了 .NET 5.0 ,故障与 .NET 5.0 无关,详见 Memcached 的惹祸,.NET 5.0 的背锅 昨天晚上我们将博客系统从 .NET Core 3.1 升级到了 .NET 5.0 ,本来是一次很有信心的升级,但没有想到在今天下午访问高峰时竟然出现 ...
非常抱歉,今天下午 17:10~17:40 左右,由于博客系统所使用的 redis 服务器宕机,造成博客站点无法正常访问,由此给您带来很大的麻烦,请您谅解。 我们会针对这次故障改进 redis 服务器的部署,提高 redis 服务器的高可用性。目前 redis 服务是用阿里云服务器单独部署 ...
非常抱歉,今天上午11:00~11:30左右,由于 redis 服务器内存耗尽造成博客后台故障——保存博文时总是提示“请求太过频繁,请稍后再试”,由此给您带来麻烦,请您谅解。 由于 redis 监控报警配置没有及时更新,当 redis 服务器内存耗尽时我们没有收到报警通知,所以未能及时发现问题 ...
今天凌晨我们用阿里云服务器自建的 kubernetes 集群出现突发异常情况,博客站点(blog-web)与博客 web api(blog-api)的 pod 无法正常启动(CrashLoopBackOff)。 kubectl get pods -l app=blog-web ...