記一次訂單號事故 去年年底的時候,我們線上出了一次事故,這個事故的表象是這樣的: 系統出現了兩個一模一樣的訂單號,訂單的內容卻不是不一樣的,而且系統在按照 訂單號查詢的時候一直拋錯,也沒法正常回調,而且事情發生的不止一次,所以 這次系統升級一定要解決掉。 經手的同事之前也改過幾次 ...
今天在修改了數據庫參數后,關閉數據庫及crs,然后重新啟動了服務器,服務器啟動完成之后,發現數據庫無法啟動,過程如下: step :重啟數據庫 step :重啟服務器: 等服務器重啟完成,發現crs起不來: 根據以前的經驗,服務器起來后 分鍾左右,crs即可啟動完成。然而等待了 分鍾,依然無法啟動。 step :於是請求協助,通過手動啟動crs,發現crs啟動了。 經過大概 分鍾的等待,數據庫的資 ...
2018-02-11 22:56 0 1867 推薦指數:
記一次訂單號事故 去年年底的時候,我們線上出了一次事故,這個事故的表象是這樣的: 系統出現了兩個一模一樣的訂單號,訂單的內容卻不是不一樣的,而且系統在按照 訂單號查詢的時候一直拋錯,也沒法正常回調,而且事情發生的不止一次,所以 這次系統升級一定要解決掉。 經手的同事之前也改過幾次 ...
在引入Spring的Validated時,需要聲明如下bean: 出於偷懶,放在了如下的一個初始化中: ...
事故經過:網站突然無法正常使用,php子進程驟高,詢問開發無改動代碼,查看cpu,內存均無異常,最后查看磁盤使用率100%,然后通過top查看是php進程導致,就一直在查找代碼問題,均無收獲,最后實在沒轍了,老大說刪除下日志試試吧,刪完后網站恢復正常。突然想到一個東西inode,當時由於沒有常看 ...
早上上班后得知,服務費未同步到代理商系統。查看draft_server系統生產環境的log,顯示在往RabbitMQ推數據時出現異常:no route to host。 打 ...
錯誤使用map引發的血案 前言 場景復原 原因 參考 錯誤使用map引發的血案 前言 最近業務中,同事使用map來接收返回的結果,使用 ...
寫在前面 今天,跑在阿里雲ECS上的生產環境,突然間訪問異常,接口各種報錯,無奈公司沒有專業的運維人員,只能硬着頭皮解決一下。 問題排查 先從表面看起,數據庫首先報錯 直觀上看,設備沒有可 ...
今天線上的hadoop集群崩潰了,現象是namenode一直在GC,長時間無法正常服務。最后運維大神各種倒騰內存,GC穩定后,服務正常。雖說全程在打醬油,但是也跟着學習不少的東西。 第一個問題:為什么會頻繁GC 有過JVM經驗的開發者都應該知道,GC是在內存不夠時,JVM自動進行 ...
接口m。服務A起了一個定時任務Task: 從db查詢數據總共有1200+條,每條記錄對應一次請求,循環 ...