原文:【故障公告】14:30-15:30左右数据库连接数飙升引发全站故障(更新)

今天下午 : 左右,先是发现博客后台出现 博客后台的 pod 健康检查时会连接数据库,如果连接过慢造成健康检查失败,pod 会重启,如果所有 pod 都因健康检查失败而重启,这时访问就会出现 。过了一会,其中 个 pod 重启成功,博客后台恢复正常。 原以为只是一次短暂的波动,但随即发现博客站点响应速度变慢,难道数据库服务器又要出现 CPU 了,赶紧登录阿里云RDS控制台查看监控,CPU 正常,查 ...

2021-05-07 17:49 70 7517 推荐指数:

查看详情

故障公告】访问高峰数据库服务器 CPU 100% 引发全站故障

今天上午11:10,我们又中“奖”了,我们使用的阿里云 RDS 实例(SQL Server 2016 标准版,16核32G)突发出现 CPU 100%,引发全站故障,直到 12:15 才完全恢复,由此给您带来很大的麻烦,请您谅解。 这是我们今年的第3次中“奖”,前2次分别发生 ...

Tue Nov 03 21:35:00 CST 2020 94 14561
故障公告数据库服务器再次 CPU 100% 引发全站故障

今天五一劳动节的一大早 4:50-6:30 期间,我们使用的阿里云 RDS SQL Server 数据库实例再次出现 CPU 100% 问题,引发全站故障,由此给您带来麻烦,请您谅解。 我们发现故障后立即进行主备切换,与上次故障不同的是,这次主备切换没有成功,再次切换,依然没有成功,后来尝试重启 ...

Sun May 02 04:53:00 CST 2021 16 2778
故障公告】10:30-10:45 左右 docker swarm 集群节点问题引发故障

非常抱歉,今天 10:30-10:45 左右由于 docker swarm 集群节点出现问题,造成除博客之外的站点出现访问异常,由此给您带来很大的麻烦,请您谅解。 故障开始时出现有时访问正常有时访问出现 502 或 500 ,当时我们就判断是某个节点出现问题,但无法直接定位出哪个节点,只能依次 ...

Mon Sep 03 19:16:00 CST 2018 2 725
故障公告数据库服务器 CPU 100% 引发网站故障

悄悄地它又突然来了 —— 数据库服务器 CPU 100% 问题,上次光临时间是 3-30 8:48,这次是 4-28 9:41。 这次我们做出了快速反应,发现后立即进行主备切换,这次一次切换成功,CPU 很快恢复正常。 但是,这次来的“真”是时候(访问高峰),虽然数据库 CPU 恢复正常 ...

Wed Apr 28 20:07:00 CST 2021 58 6407
云计算之路-阿里云上:RDS数据库连接数过万引发故障,主备切换后恢复正常

非常抱歉!今天 12:03-12:52 ,由于数据库连接数异常突增超过1万,达到了阿里云RDS的最大连接数限制,影响了全站的正常访问。由此给您带来麻烦,请您谅解。 在发现数据库连接数突增的问题后,我们一开始怀疑可能是我们的某些应用中产生太多ADO.NET连接引起的,但是对嫌疑的应用 ...

Fri Apr 07 00:09:00 CST 2017 26 6930
故障公告数据库服务器 CPU 近 100% 引发故障

非常抱歉,今天上午 10:48 ~ 11:33 期间,我们所使用的数据库服务(阿里云 RDS 实例 SQL Server 2016 标准版)又出现了 CPU 近 100% 问题,由此给您带来麻烦,请您谅解。 这次刚开始出现 CPU 近 100% 问题时,没有造成大的影响,后来有段时间 CPU ...

Thu Nov 28 20:35:00 CST 2019 51 4765
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM