原文:背锅之旅:前任对我的爱-只备份不删除导致的磁盘爆满

问题起源 某天早上收到BOSS 消息,如下: 苦逼的运维又开始了一天的背锅 排查问题 登陆阿里云查看一下磁盘 如下: emmmm 登陆服务器查看:这台服务器还是第一次登陆,因为上个架构师半路跑了,有点裂开,怎么办,查看历史记录吧 哦好 历史记录是有这样的操作的,进入 var atlassian application data confluence backups ll 查看有近两个月的备份 du ...

2020-08-15 10:40 3 435 推荐指数:

查看详情

为什么PUSH推送要经常

前言 只有光头才能变强。 文本已收录至我的GitHub精选文章,欢迎Star:https://github.com/ZhongFuCheng3y/3y 自从做了推送以后,每隔 ...

Wed May 13 17:18:00 CST 2020 0 876
kafka存储数据量过大,导致磁盘爆满

问题: 注意到自己负责kafka的某个topic最小的偏移量为0,而最大的偏移量都7亿多了,说明存储在kafka里面的数据没有定时删除,通过登陆到kafka服务器,查看配置文件services.properties,发现log.retention.hours=876000(100年),我猜想配置 ...

Fri Apr 26 19:00:00 CST 2019 0 3999
开发导致的内存泄露问题,运维小伙伴儿这样排查不

前些日子小组内安排值班,轮流看顾我们的服务,主要做一些报警邮件处理、Bug排查、运营issue处理的事。工作日还好,无论干什么都要上班的,若是轮到周末,那这一天算是毁了。 不知道是公司网络广了就这样 ...

Fri Nov 27 17:09:00 CST 2020 2 289
YAML 有漏洞被弃用?网友:YAML 不

文 | Travis 出品 | OSC开源社区(ID:oschina2013) Tensorflow 是一个基于 Python 的机器学习和人工智能项目,该项目由 Google 开发。近日 Tens ...

Sun Sep 12 03:11:00 CST 2021 0 131
测试人员如何逃过“侠”宿命?

所谓的“”场景? 线上出了问题,首先第一想到的是测试人员没测好,进而出现了以下追责的对话: 1、为什么这么浅显的bug没发现? 2、这个bug这么严重,你怎么不提出来呢? 我提了的,但XX说不影响不改/XX说不影响延期了…… 那为什么你没找我确认? 3、这么严重的bug ...

Thu Jul 12 02:00:00 CST 2018 10 1681
写给一直在的你

你是一个测试人员,早出晚归,一身疲惫。你对项目的质量负责。 但每次上线或交付以后,你总是觉得心里没底,成天惴惴不安。不出问题就好,出了问题,是你没测出来,是你的,可以选择忍辱偷生,或是走人。 在大多数时候,大家背地你称呼你为:侠。 很多时候项目是这样一个循环。 需求评审,测试只需要 ...

Fri Sep 08 00:38:00 CST 2017 1 1806
这样查生产问题,不做

技术的太多,到底该不该你? 一大早就被微信群炸醒,开发短信服务的猿妹子,在公司微信群里说: 短信的生产环境服务器, CPU 占用率过高,疯狂报警,应该是你们昨天上线看门狗导致的(看门狗:守护短信服务的监控应用,后续有机会再进行分享)。 没错,昨天确实给短信服务装上了看门狗。但是看门狗服务 ...

Tue Apr 21 22:44:00 CST 2020 26 3458
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM