风雨之后是彩虹,经历了三个月的风雨之后,从6月14日起(上次故障发生于6月13日)开始享受彩虹。。。而今天突袭而来的RDS故障让我们懂得了彩虹期间会有阵雨,但不管怎么样,离“晴空万里”越来越近了。 2013年7月23日10:00~11:00左右,我们使用的阿里云RDS(关系型数据库服务)突然 ...
今天上午 : 左右,我们所使用的阿里云 RDS 实例的 CPU 突然飙高到近 ,造成大量数据库查询操作缓慢 超时,在这个恶劣条件下大量 memcached 缓存无法建立,这样的雪上加霜让 Web 服务器的 CPU 跟着不堪重负,于是要么访问缓慢,要么直接 。。。造成网站无法正常访问,由此给您带来了很大的麻烦,请您谅解。 问题非常奇怪,昨天同样的时间段,RDS CPU 占用却少很多,平时 RDS ...
2018-01-11 12:56 36 5733 推荐指数:
风雨之后是彩虹,经历了三个月的风雨之后,从6月14日起(上次故障发生于6月13日)开始享受彩虹。。。而今天突袭而来的RDS故障让我们懂得了彩虹期间会有阵雨,但不管怎么样,离“晴空万里”越来越近了。 2013年7月23日10:00~11:00左右,我们使用的阿里云RDS(关系型数据库服务)突然 ...
虚拟内存的,但昨天由于虚拟内存不够用,造成了服务器自动重启(详见云计算之路-阿里云上:禁用Window ...
非常抱歉,今天 10:05-10:20 左右,我们用阿里云服务器搭建的 docker swarm 集群又出现故障,又是因为突然的节点 CPU 波动。 受这次故障影响的站点有 闪存,博问,班级,园子,短信息,招聘,小组,网摘,openapi ,由此给您带来很大的麻烦,请您谅解。 故障前先是有一个 ...
非常抱歉,今天凌晨 3:20~8:30 左右,我们使用的阿里云 RDS 实例 SQL Server 2016 标准版突然出现 CPU 100% 故障,造成全站无法正常访问,由此给您带来巨大的麻烦,请您谅解。 问题很奇怪,故障期间是数据库服务器负载极低的时间段。从阿里云 RDS 控制台 ...
非常抱歉,今天 8:48 开始,我们使用的阿里云 RDS SQL Server 数据库实例突然出现 CPU 100% 问题,引发全站故障,由此给您带来麻烦,请您谅解。 发现故障后立即进行主备切换,和往常一样,第1次主备切换失败,第2次主备切换完成后恢复正常。 上次同样故障发生在2020年 ...
非常抱歉!今天 12:03-12:52 ,由于数据库连接数异常突增超过1万,达到了阿里云RDS的最大连接数限制,影响了全站的正常访问。由此给您带来麻烦,请您谅解。 在发现数据库连接数突增的问题后,我们一开始怀疑可能是我们的某些应用中产生太多ADO.NET连接引起的,但是对嫌疑的应用 ...
继续向大家汇报,上周在阿里云的帮助下我们重点解决的是以下两个问题: 1. 在专门跑博客站点的负载均衡中,如果单台云服务器处理的并发请求高(比如超过200 Get Requests/s),CPU有时会出现坐“过山车”的情况,CPU占用瞬间跳到100%,然后又回落(见下图)。这种情况只有1秒的采样 ...
昨天 18:00 之后我们将自建 docker swarm 集群上的所有应用都切换到了阿里云 swarm 容器服务(非 swarm mode ,不支持 overlay 网络)的集群上。 今天晚上我们通过阿里云容器服务控制台将1个节点移出集群(当时集群中一共有9个节点) 没想到这样一个常规 ...