原文:【運維】記一次上線前的緊急定位與修復-獻上九條小經驗

簡介 本文介紹了作者所在團隊在某次上線前測試發現問題 定位問題並修復上線的過程,最后給出幾點經驗總結,希望對大家有用。 過程 今天需要上線,但昨晚才合並了所有分支,時間很緊迫。不幸的是,打包測試后發現有一個Springboot應用 模塊R 啟動失敗,但進程沒有死,一直在輸出報錯日志。 Google了相關的報錯日志,並沒有找到相關信息。查看了模塊R的代碼變更,並沒有什么改動,以為是環境問題 部署到 ...

2019-11-14 08:28 0 377 推薦指數:

查看詳情

一次Drone無法觸發構建的問題定位與處理

問題 好巧不巧,當你晚上准備上線的時候,在下午臨近下班的時候CICD工具出問題了,提交代碼不能觸發構建,不能上線了,Drone那邊負責人也下班了,正好CICD關聯的公司git倉庫也出問題了(就是上次Drone構建失敗被誤會的部門),我們的構建服務也沒有相關的報錯日志,就順水推鍋取消了上線 ...

Fri Mar 05 21:53:00 CST 2021 0 417
驚魂web應用宕機一次網站的緊急恢復

  這次網站的故障出現的比較突然,沒有任何防備,有種突如其來的感覺。這是一台阿里雲服務器,采用wdcp的nginx+apache+mysql的方式運行。一位同事在對web目錄進行壓縮后,由於web目錄 ...

Wed Jul 08 23:30:00 CST 2015 8 2400
一次LVM修復過程

進行以下操作好好搜搜資料,我提供的資料只是供參考理解。數據很重要!!! 寫在前面:創建lv的時候,建議在pv上留一些空間。 關鍵屬於:pv 物理卷,vg 卷組, lv邏輯卷。 也就是說:lvm把一堆硬盤組成一個硬盤組,然后再上面再進一步分邏輯卷。好處是擴展方便。壞處就是我遇到的壞處 ...

Sun Oct 22 03:34:00 CST 2017 0 3180
一次uboot編譯/經驗/教訓

一次uboot編譯/經驗/教訓 - 最近學習uboot移植有關的知識,在了解原理后自己編譯uboot,但是出現了好多各式各樣的錯誤,最后換了幾次系統環境之后才找到錯誤來源 1.准備源碼與交叉編譯工具鏈 環境:ubuntu19.04虛擬機 首先從linux公社下載 ...

Thu Mar 19 22:44:00 CST 2020 0 601
一次jstack命令定位問題

今天天氣不錯,但是趕上惡意加班心情就不爽,懷着不爽的心情干活,總能創造出更多的問題,這不,今天就自己挖了一個坑,自己跳進去了,好在上來了 經過是這樣的,開始調試canal采集binlog時,由於添加 ...

Sun Mar 14 01:01:00 CST 2021 0 279
一次定位zookeeper連接不上的問題

起因,想起來分布式鎖也是常考的知識點,自己還不是太熟,就想着在網上找個demo學學 找到了一個看上去還不錯的,他使用的是ZkClient這個客戶端。 由於我之前在工程里測試過kafka,而kafk ...

Wed Jan 13 03:11:00 CST 2021 0 598
一次歷時六小時的上線經歷

  這是農歷去年(陽歷2016.1.29)的事了。公司的一個項目已開發得七七八八了,要准備上線了。項目經理與公司領導及用戶協商,定於2016.1.28日(周四)上線。但這天由於項目經理需要去機場接人,加上組同事也忙着。就推后一天上線。這里就不得不談下公司的項目從開發到上線的過程:公司項目分開 ...

Mon Feb 15 19:08:00 CST 2016 22 4320
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM