花费 14 ms
caseStudy-20180913-Kafka进程挂掉&解决办法

问题描述 2018年xx月xx日 下午4点20分左右 xxx无意中看到xxx正在排查线上Kafka集群遇到的问题,随后问明情况,有一台机器上Kafka进程挂了,当时他正在lark平台上查看错误日志信 ...

Tue Apr 07 06:42:00 CST 2020 0 1190
一次线上事故的处理流程和总结

1、事故问题: 某个旧版本业务功能中运行了一个失败重试的job,因一位离职的同事编码时未考虑周全出现死循环,导致线上从24日下午2点一直到27日晚9点持续3天一 ...

Tue Jul 31 18:00:00 CST 2018 0 1408
业务服务经常假死故障排查

目录 概述 故障回溯 补充说明 其他工具 概述 最近遇到线上故障,具体的情况就是后端服务请求一直 pending,服务经常假死重启。 但是观察 整个进程 ...

Fri Dec 10 04:05:00 CST 2021 0 1159

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM