非常抱歉,昨天 18:40~19:10 再次遭遇上次遇到的 SQL 语句执行超时引发的网站首页访问故障,由此您带来麻烦,请您谅解。 上次故障详见之前的故障公告,上次排查下来以为是 SQL Server 参数嗅探问题引起的,但在引起参数嗅探的漏洞被修复后再次出现故障说明上次的判断是错误 ...
非常抱歉,今天早上 : : 期间,由于获取网站首页博文列表的 SQL 语句出现突发的查询超时问题,造成访问网站首页时出现 错误,由此给您带来麻烦,请您谅解。 故障的情况是这样的。 故障期间日志中记录了大量下面的错误。 数据库服务器 阿里云 RDS SQL Server 实例 的 CPU 消耗突增。 数据库服务器的 IOPS 暴增。 通过阿里云 RDS 控制台的 CloudDBA 可以查看到故障期间 ...
2020-02-03 14:25 15 3109 推荐指数:
非常抱歉,昨天 18:40~19:10 再次遭遇上次遇到的 SQL 语句执行超时引发的网站首页访问故障,由此您带来麻烦,请您谅解。 上次故障详见之前的故障公告,上次排查下来以为是 SQL Server 参数嗅探问题引起的,但在引起参数嗅探的漏洞被修复后再次出现故障说明上次的判断是错误 ...
悄悄地它又突然来了 —— 数据库服务器 CPU 100% 问题,上次光临时间是 3-30 8:48,这次是 4-28 9:41。 这次我们做出了快速反应,发现后立即进行主备切换,这次一次切换成功,CPU 很快恢复正常。 但是,这次来的“真”是时候(访问高峰),虽然数据库 CPU 恢复正常 ...
今天凌晨我们用阿里云服务器自建的 kubernetes 集群出现突发异常情况,博客站点(blog-web)与博客 web api(blog-api)的 pod 无法正常启动(CrashLoopBack ...
今天上午11:10,我们又中“奖”了,我们使用的阿里云 RDS 实例(SQL Server 2016 标准版,16核32G)突发出现 CPU 100%,引发全站故障,直到 12:15 才完全恢复,由此给您带来很大的麻烦,请您谅解。 这是我们今年的第3次中“奖”,前2次分别发生 ...
CloudDBA 看,故障期间下面的一个 SQL 语句大量执行,并且极其消耗 CPU 。 开始我们 ...
11月3日,详见 【故障公告】访问高峰数据库服务器 CPU 100% 引发全站故障 阿里云 RDS ...
我们的生产环境部署了 2 个 docker swarm 集群,集群 swarm-a 用于专门跑博客站点,集群 swarm-b 用于跑其他站点,manager 节点用了阿里云包月服务器,worker 节 ...
非常抱歉, 今天 22:30 左右我们添加博文访问过滤规则时,误添加一条错误的规则,由于管理后台缺少对应的验证,错误的规则被添加到数据库,结果引发了异常: 造成 22:30~22:50 期间所有博文访问500,由此给您带来很大的麻烦,请您谅解。 我们会吸取教训,对这部分实现 ...