原文:记一次kafka客户端NOT_COORDINATOR_FOR_GROUP处理过程

转发请注明原创地址:https: www.cnblogs.com dongxiao yang p .html 某日晚高峰忽然集群某个大流量业务收到lag报警,查看客户端日志发现reblance一直无法成功,日志如下 根据客户端日志显示consumer在尝试joingroup的过程中收到了服务端COORDINATOR状态不正常的信息,怀疑是服务端负责这个consumer group的broker在c ...

2019-03-27 12:28 0 1103 推荐指数:

查看详情

一次线上服务CPU 100%的处理过程

告警 正在开会,突然钉钉告警声响个不停,同时市场人员反馈客户在投诉系统登不进了,报504错误。查看钉钉上的告警信息,几台业务服务器节点全部报CPU超过告警阈值,达100%。 赶紧从会上下来,SSH登录服务器,使用 top 命令查看,几个Java进程CPU占用达到180%,190%,这几 ...

Fri Jul 10 22:01:00 CST 2020 15 1844
一次ceph pg unfound处理过程

今天检查ceph集群,发现有pg丢失,于是就有了本文~~~ 1.查看集群状态 从输出发现pg 2.2b is active+recovery_unfound+degraded, acting ...

Tue Jan 26 22:34:00 CST 2021 0 576
一次eureka客户端注册失败的问题

  最近老大给了一台新服务器,做测试用,从装软件开始,到把整个环境搭起来,因为之前没有完成搭过,所以费了几天时间,最后总算是成功跑起来了。昨天早上来更新下项目,在测试服务器上重新发布了一下,结果发现服 ...

Sat Oct 13 02:10:00 CST 2018 0 1590
杂谈--一次”失败“问题处理过程

近期总有开发同事过来抱怨说有写执行超时,但是查看相关语句又没有任何问题,统计正常,执行计划合理,IO压力较低,锁也正常,正常5ms可以结束的SQL竟然超时,不可思议,但由于超时的时间和频率不固定,我们 ...

Sun May 25 09:58:00 CST 2014 8 1226
【linux】记录一次系统被攻击的处理过程

今天登录zabbix监控网页的时候发现非常卡,登录到系统里面以后,通过top看,CPU已经100%了,有一个叫做httpds的进程占用,第一反映就是系统被入侵了,下面记录了处理过程,仅供各位参考 通过top发现CPU占用过高达到100%,是httpds进程占用,正常的apache进程应该是 ...

Mon Mar 27 20:43:00 CST 2017 0 1883
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM