原文:记录一次因subprocess PIPE 引起的线上故障

sence:python中使用subprocess.Popen cmd, stdout sys.STDOUT, stderr sys.STDERR, shell True ,stdout, stderr 为None. 在错误中执行是无法捕获 stderr的内容,后面将上面的改为 subprocess.Popen cmd, stdout PIPE, stderr PIPE, shell True ...

2021-11-04 19:36 0 109 推荐指数:

查看详情

记录一次线上yarn RM频繁切换的故障

周末一大早被报警惊醒,rm频繁切换 急急忙忙排查 看到两处错误日志 错误信息1 错误信息2 查看源码处FairScheduler 跟进去看下 ...

Sat Dec 21 23:13:00 CST 2019 0 728
ThreadLocal引起一次线上事故

> 线上用户存储数据后查看提示无权限 前言 不知道什么时候年轻的我曾一度认为Java没啥难度,没有我实现不了的需求,没有我解不了的bug 直到我遇到至今难忘的一个bug 。 线上用户存储数据后查看提示无权限 初次定位 明明自己添加的数据,为什么提示 ...

Fri May 14 16:48:00 CST 2021 3 766
通过jstack与jmap分析一次线上故障

一、发现问题 下面是线上机器的cpu使用率,可以看到从4月8日开始,随着时间cpu使用率在逐步增高,最终使用率达到100%导致线上服务不可用,后面重启了机器后恢复。 二、排查思路 简单分析下可能出问题的地方,分为5个方向: 1.系统本身代码问题 2.内部下游系统的问题导致的雪崩 ...

Mon May 14 08:49:00 CST 2018 1 1935
一次线上OOM故障排查经过

转贴:http://my.oschina.net/flashsword/blog/205266 本文是一次线上OOM故障排查的经过,内容比较基础但是真实,主要是记录一下,没有OOM排查经验的同学也可以参考。 现象 我们之前有一个计算作业。最近经常出现不稳定,无法正常响应的情况。具体表现 ...

Thu Mar 06 21:05:00 CST 2014 0 2844
通过jstack与jmap分析一次线上故障

一、发现问题 下面是线上机器的cpu使用率,可以看到从4月8日开始,随着时间cpu使用率在逐步增高,最终使用率达到100%导致线上服务不可用,后面重启了机器后恢复。 二、排查思路 简单分析下可能出问题的地方,分为5个方向: 1.系统本身代码问题 2.内部下游系统的问题导致的雪崩 ...

Sat Mar 30 00:34:00 CST 2019 0 1788
【JVM】记录一次线上SWAP偏高告警的故障分析过程

近期遇到一个堆外内存导致swap飙高的问题,这类问题比较罕见,因此将整个排查过程记录下来了 现象描述 最近1周线上服务器时不时出现swap报警(swap超过内存10%时触发报警,内存是4G,因此swap超过400M会触发报警),每次都是童鞋们通过重启tomcat解决的;但导致的根本原因 ...

Wed May 15 22:20:00 CST 2019 0 725
Layui引起的对前端的一次记录

前言 首先会做这次记录,也是因为自己也是第一次去接触这个框架,以前总是听说,并没有去用过。这次出于实习的原因,去学习了一下Layui这个“面向后端开发者的框架”。其次,此篇记录仅供参考,毕竟我也不是开发者,所以不能保证文章引用的内容以及自己的理解是否正确,请自行决断一些内容的正确性。 前段时间 ...

Thu Sep 02 23:41:00 CST 2021 0 337
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM