【文章推荐】记一次网络请求连接超时的事故

原文：记一次网络请求连接超时的事故

从HTTP请求超时重试机制操作系统网络等层面剖析了事故的原因，最终解决业务问题。这里先抛两个问题：你遭遇过由于网络连接或请求超时造成的生产事故吗你知道操作系统默认的网络连接超时是多少秒问题背景最近同事出现这么一个问题，简单业务场景：服务A使用HTTP请求服务B接口m。服务A起了一个定时任务Task：从db查询数据总共有条，每条记录对应一次请求，循环调用m接口。服务B收到请求会使 ...

2020-12-17 14:54 0 351 推荐指数：

查看详情

记go中一次http超时引发的事故

记一次http超时引发的事故前言分析下具体的代码实现服务设置超时客户端设置超时 http.client context http.Transport 问题总结 ...

记一次订单号事故

记一次订单号事故去年年底的时候，我们线上出了一次事故，这个事故的表象是这样的: 系统出现了两个一模一样的订单号，订单的内容却不是不一样的，而且系统在按照订单号查询的时候一直抛错，也没法正常回调，而且事情发生的不止一次，所以这次系统升级一定要解决掉。经手的同事之前也改过几次 ...

记一次Spring配置事故

在引入Spring的Validated时，需要声明如下bean：出于偷懒，放在了如下的一个初始化中： ...

记一次kubernetes集群异常: kubelet连接apiserver超时

Background kubernetes是master-slave结构，master node是集群的大脑，当master node发生故障时整个集群都"out of control"。master node中最重要的当属apiserver组件，它负责处理所有请求，并持久化状态到etcd ...

记一次go中map并发引起的事故

池连接失败场景复原先来看来伪代码一个全局的map，然后WaitGroup开启一组协程并 ...

记一次生产事故--磁盘被占满

写在前面今天，跑在阿里云ECS上的生产环境，突然间访问异常，接口各种报错，无奈公司没有专业的运维人员，只能硬着头皮解决一下。问题排查先从表面看起，数据库首先报错直观上看，设备没有可 ...

记一次线上事故的JVM内存学习

今天线上的hadoop集群崩溃了，现象是namenode一直在GC，长时间无法正常服务。最后运维大神各种倒腾内存，GC稳定后，服务正常。虽说全程在打酱油，但是也跟着学习不少的东西。第一个 ...

记一次dirty_ratio引起的线上事故

故障时间轴发生时间：2020-09-14 06:40 发现时间：2020-09-14 06:41 响应时间：2020-09-14 07:42 故障表现磁盘> ...

原文：记一次网络请求连接超时的事故

相关推荐

相关标签