原文:【故障公告】推荐系统中转站撑爆服务器 TCP 连接引发的故障

上周五下午,我们在博客中部署了推荐系统,在博文下方显示 最新IT新闻 的地方显示自动推荐的关联博文。我们用的推荐系统是第四范式的推荐服务,我们自己只是搭建了一个推荐系统中转站 基于 ASP.NET Core ,接收来自博客前端的请求,然后将请求转发给第四范式的推荐服务,并将响应内容转发给博客前端。 这个中转站的功能非常简单,就是一个 http 请求 响应搬运工,简单到让我们忽视了它会给服务器带来的 ...

2018-10-30 11:30 6 1364 推荐指数:

查看详情

故障公告】阿里云抢占式实例服务器被自动释放引发故障

非常抱歉,由于一台使用阿里云抢占式实例的缓存服务器被自动释放,造成今天 10:20-11:30 左右网站无法正常访问,由此给您带来很大的麻烦,恳请您的谅解。 这台阿里云抢占式实例服务器的出价方式是“使用自动出价”,之前我们使用这种出价方式的阿里云抢占式实例从来没有被自动释放过。 而购买页面 ...

Thu Apr 04 22:30:00 CST 2019 20 4056
故障公告】数据库服务器再次 CPU 100% 引发全站故障

今天五一劳动节的一大早 4:50-6:30 期间,我们使用的阿里云 RDS SQL Server 数据库实例再次出现 CPU 100% 问题,引发全站故障,由此给您带来麻烦,请您谅解。 我们发现故障后立即进行主备切换,与上次故障不同的是,这次主备切换没有成功,再次切换,依然没有成功,后来尝试重启 ...

Sun May 02 04:53:00 CST 2021 16 2778
故障公告】数据库服务器 CPU 100% 引发网站故障

悄悄地它又突然来了 —— 数据库服务器 CPU 100% 问题,上次光临时间是 3-30 8:48,这次是 4-28 9:41。 这次我们做出了快速反应,发现后立即进行主备切换,这次一次切换成功,CPU 很快恢复正常。 但是,这次来的“真”是时候(访问高峰),虽然数据库 CPU 恢复正常 ...

Wed Apr 28 20:07:00 CST 2021 58 6407
故障公告】访问高峰数据库服务器 CPU 100% 引发全站故障

今天上午11:10,我们又中“奖”了,我们使用的阿里云 RDS 实例(SQL Server 2016 标准版,16核32G)突发出现 CPU 100%,引发全站故障,直到 12:15 才完全恢复,由此给您带来很大的麻烦,请您谅解。 这是我们今年的第3次中“奖”,前2次分别发生 ...

Tue Nov 03 21:35:00 CST 2020 94 14561
故障公告】redis 服务器宕机引发博客站点故障

非常抱歉,今天下午 17:10~17:40 左右,由于博客系统所使用的 redis 服务器宕机,造成博客站点无法正常访问,由此给您带来很大的麻烦,请您谅解。 我们会针对这次故障改进 redis 服务器的部署,提高 redis 服务器的高可用性。目前 redis 服务是用阿里云服务器单独部署 ...

Thu Jul 15 02:53:00 CST 2021 35 4679
故障公告】数据库服务器 CPU 近 100% 引发故障

非常抱歉,今天上午 10:48 ~ 11:33 期间,我们所使用的数据库服务(阿里云 RDS 实例 SQL Server 2016 标准版)又出现了 CPU 近 100% 问题,由此给您带来麻烦,请您谅解。 这次刚开始出现 CPU 近 100% 问题时,没有造成大的影响,后来有段时间 CPU ...

Thu Nov 28 20:35:00 CST 2019 51 4765
SSH远程连接不了服务器故障及排查故障的步骤

今天我在连接公司的服务器时候,发现ssh连接不了,以下就是我在自己虚拟机上面ssh远程连接不了服务器的排查故障整理 服务器ssh连接不上的原因有以下几种: 1,网络原因,我们可以先ping一下服务气的IP是否能ping通,能平通就可以排除网络原因 不能ping通,可以看一下network ...

Wed Apr 01 17:23:00 CST 2020 0 1196
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM