caseStudy-20180913-Kafka进程挂掉&解决办法
问题描述 2018年xx月xx日 下午4点20分左右 xxx无意中看到xxx正在排查线上Kafka集群遇到的问题,随后问明情况,有一台机器上Kafka进程挂了,当时他正在lark平台上查看错误日志信 ...
问题描述 2018年xx月xx日 下午4点20分左右 xxx无意中看到xxx正在排查线上Kafka集群遇到的问题,随后问明情况,有一台机器上Kafka进程挂了,当时他正在lark平台上查看错误日志信 ...
1、事故问题: 某个旧版本业务功能中运行了一个失败重试的job,因一位离职的同事编码时未考虑周全出现死循环,导致线上从24日下午2点一直到27日晚9点持续3天一 ...
系统背景介绍 用户系统负责用户生命周期管理,包括注册、登陆、用户信息获取等,其作为基础服务只提供内网服务,简称为service;application组件包装service的服务对app渠道提供服务 ...
目录 概述 故障回溯 补充说明 其他工具 概述 最近遇到线上故障,具体的情况就是后端服务请求一直 pending,服务经常假死重启。 但是观察 整个进程 ...