原文:背鍋之旅:前任對我的愛-只備份不刪除導致的磁盤爆滿

問題起源 某天早上收到BOSS 消息,如下: 苦逼的運維又開始了一天的背鍋 排查問題 登陸阿里雲查看一下磁盤 如下: emmmm 登陸服務器查看:這台服務器還是第一次登陸,因為上個架構師半路跑了,有點裂開,怎么辦,查看歷史記錄吧 哦好 歷史記錄是有這樣的操作的,進入 var atlassian application data confluence backups ll 查看有近兩個月的備份 du ...

2020-08-15 10:40 3 435 推薦指數:

查看詳情

為什么PUSH推送要經常

前言 只有光頭才能變強。 文本已收錄至我的GitHub精選文章,歡迎Star:https://github.com/ZhongFuCheng3y/3y 自從做了推送以后,每隔 ...

Wed May 13 17:18:00 CST 2020 0 876
kafka存儲數據量過大,導致磁盤爆滿

問題: 注意到自己負責kafka的某個topic最小的偏移量為0,而最大的偏移量都7億多了,說明存儲在kafka里面的數據沒有定時刪除,通過登陸到kafka服務器,查看配置文件services.properties,發現log.retention.hours=876000(100年),我猜想配置 ...

Fri Apr 26 19:00:00 CST 2019 0 3999
開發導致的內存泄露問題,運維小伙伴兒這樣排查不

前些日子小組內安排值班,輪流看顧我們的服務,主要做一些報警郵件處理、Bug排查、運營issue處理的事。工作日還好,無論干什么都要上班的,若是輪到周末,那這一天算是毀了。 不知道是公司網絡廣了就這樣 ...

Fri Nov 27 17:09:00 CST 2020 2 289
YAML 有漏洞被棄用?網友:YAML 不

文 | Travis 出品 | OSC開源社區(ID:oschina2013) Tensorflow 是一個基於 Python 的機器學習和人工智能項目,該項目由 Google 開發。近日 Tens ...

Sun Sep 12 03:11:00 CST 2021 0 131
測試人員如何逃過“俠”宿命?

所謂的“”場景? 線上出了問題,首先第一想到的是測試人員沒測好,進而出現了以下追責的對話: 1、為什么這么淺顯的bug沒發現? 2、這個bug這么嚴重,你怎么不提出來呢? 我提了的,但XX說不影響不改/XX說不影響延期了…… 那為什么你沒找我確認? 3、這么嚴重的bug ...

Thu Jul 12 02:00:00 CST 2018 10 1681
寫給一直在的你

你是一個測試人員,早出晚歸,一身疲憊。你對項目的質量負責。 但每次上線或交付以后,你總是覺得心里沒底,成天惴惴不安。不出問題就好,出了問題,是你沒測出來,是你的,可以選擇忍辱偷生,或是走人。 在大多數時候,大家背地你稱呼你為:俠。 很多時候項目是這樣一個循環。 需求評審,測試只需要 ...

Fri Sep 08 00:38:00 CST 2017 1 1806
這樣查生產問題,不做

技術的太多,到底該不該你? 一大早就被微信群炸醒,開發短信服務的猿妹子,在公司微信群里說: 短信的生產環境服務器, CPU 占用率過高,瘋狂報警,應該是你們昨天上線看門狗導致的(看門狗:守護短信服務的監控應用,后續有機會再進行分享)。 沒錯,昨天確實給短信服務裝上了看門狗。但是看門狗服務 ...

Tue Apr 21 22:44:00 CST 2020 26 3458
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM