一、背景 开发排查系统问题用得最多的手段就是查看系统日志,在分布式环境中一般使用ELK来统一收集日志,但是在并发大时使用日志定位问题还是比较麻烦,由于大量的其他用户/其他线程的日志也一起输出穿行其中导致很难筛选出指定请求的全部相关日志,以及下游线程/服务对应的日志。 二、解决思路 ...
在工作中,相信大家最怕的一件事就是听到有人在工作群艾特你:某某功能报错啦。。。 然后你就得屁颠屁颠的去服务器看日志,日志量少还好点,多的话找起来太麻烦了。不太容易直接定位到关键地方。 东找找西找找,好不容易找到了报错的信息,却不知道当时的参数信息是什么,也不太好复现,太难了。。 改完还得写故障报告,美好的一天又没了。 要解决这类的痛点需要做下面几件事情: 日志收集 异常告警 日志增加链路 API响 ...
2021-01-18 12:52 4 914 推荐指数:
一、背景 开发排查系统问题用得最多的手段就是查看系统日志,在分布式环境中一般使用ELK来统一收集日志,但是在并发大时使用日志定位问题还是比较麻烦,由于大量的其他用户/其他线程的日志也一起输出穿行其中导致很难筛选出指定请求的全部相关日志,以及下游线程/服务对应的日志。 二、解决思路 ...
作为程序员对 GitHub 应该都不会陌生,我经常沉迷其中,找一些惊艳的项目或者工具。不过用的时间久了,发现它的用户体验实在是不敢恭维,有时候会让你做很多重复操作,浪费不少时间。 比如我想单独下载一 ...
背景 我们项目中现有日志系统,采用的是slf4j+logback这套日志组件,也是Java生态里面比较常用的一个日志组件,但是随着分布式的演进,这套组件明显存在以下几个问题: 1.各种无关日志穿行其中,导致我们可能无法直接定位整个操作流程 ...
Story background 回望2018年12月,这也许是程序员们日夜不得安宁的日子,皆因各种前线的系统使用者都需要冲业绩等原因,往往在这个时候会向系统同时写入海量的数据,当我们的应用 ...
日常Bug排查-消息不消费 前言 日常Bug排查系列都是一些简单Bug排查,笔者将在这里介绍一些排查Bug的简单技巧,同时顺便积累素材_。 Bug现场 某天下午,在笔者研究某个问题正high的时候。开发突然找到笔者,线上某个系统突然消费不了queue了。Queue不消费也算是日常问题了。淡 ...
两个流程链路问题的排查和总结 原创 编程一生 编程一生 8月13日 乱码问题 现象 在一类简单的业务场景下发起http请求的测试案例,返回的时候会100%有乱码。如果跳过跟厂商定制的7层负载均衡设备,直接连后端一台机器,则100%无乱码。在其 ...
本文为博主原创,未经允许不得转载: 在开发过程中,经常会使用log记录一下当前请求的参数,过程和结果,以便帮助定位问题。在并发量下的情况下,日志打印不会剧增,可以很快就能通过打印的日志查看执行的情况。但是在高并发大量请求的场景下,日志也会频繁打印,刷新,通过查看日志来定位问题时就会变得 ...
注意:在公众号 可以获取更多资料 今天线上查bug,使用上了链路追踪,真的很方便,同一个请求,调用的所有服务的日志,能根据Trace Id筛选出来,效率提高了很多。 所以,项目加链路追踪的决定,是非常正确的选择。 以前,线上环境有问题,为了查询日志,运维工程师登录 ...