原文:因我而起的生產事故

首先,祝大家新年快樂 應該陸陸續續開始踏上了回家的征程吧 生產事故 產品上線一段時間之后,技術支持反饋客戶現場一個進程總是掛掉或者不干活 最開始不緊不慢的查找問題,后來老大很生氣說:生產事故很嚴重,你們居然不重視 成立了一個應急小組,專門解決此問題,其中包括我 事故原因 經過 天沒日沒夜的艱苦奮斗,終於找到進程掛掉的原因,問題因我而起。大約去年 月,做一個項目,與大數據對接,把數據推給它,然在加 ...

2019-01-23 16:01 8 1272 推薦指數:

查看詳情

生產安全事故等級划分

1.特別重大事故:30人以上死亡,或100人以上重傷(包括急性工業中毒,下同)或1億元以上直接經濟損失 2.重大事故:10人以上30人以下死亡,或50人以上100人以下重傷,或5000w-1億以下直接經濟損失 3.較大事故:3人以上10人以下死亡,或者10人以上50人以下重傷 ...

Tue May 12 15:25:00 CST 2020 0 633
一次生產事故的優化經歷

在一次正常的活動促銷之后,客服開始陸續反饋有用戶反應在搶標的時候打不開網頁或者APP,在打開的時候標的就已經被搶光了,剛開始沒有特別的上心,覺得搶標不就是這樣嗎,搶小米手機的時候也不就這樣嗎?隨着活動 ...

Mon Feb 06 16:50:00 CST 2017 88 20906
restTemplate超時時間引發的生產事故

1、現象:   今天下午公司客戶群里突然報警,說訂單沒有推送服務商,經排查發現是rabbitmq堵住了,查詢elk和監控沒有發現業務異常或超時日志。   通過rabbitmq后面發現一個隊列有異常 ...

Fri May 01 06:07:00 CST 2020 0 1149
一次生產事故后感

今晚我們的其中一個產品的其中一個比較偏的環境出現了一次生產事故, 前端所有請求都發送失敗。 我是中途被通知出了事故的,這事甚至驚動了一些領導。 期間有懷疑是我做的前端改動導致的問題。 最終排查,發現是ngix的配置錯誤導致的,通過修改配置修復了問題。 事情雖然結束過去 ...

Wed Jul 21 07:27:00 CST 2021 13 1698
用long類型讓我出了次生產事故,寫代碼還是要小心點

昨天發現線上試跑期的一個程序掛了,平時都跑的好好的,查了下日志是因為昨天運營跑了一家美妝top級淘品牌店,會員量近千萬,一下子就把128G的內存給爆了,當時並行跑了二個任務,沒轍先速寫一段代碼限流,后 ...

Mon Apr 27 15:41:00 CST 2020 17 3236
記一次生產事故--磁盤被占滿

寫在前面 今天,跑在阿里雲ECS上的生產環境,突然間訪問異常,接口各種報錯,無奈公司沒有專業的運維人員,只能硬着頭皮解決一下。 問題排查 先從表面看起,數據庫首先報錯 直觀上看,設備沒有可用空間,也就是磁盤滿了。 進入服務器后台,執行 發現確實磁盤滿了,而且滿的很徹底。系統盤 ...

Tue Feb 11 03:58:00 CST 2020 0 782
記一次生產kafka消息消費的事故

事故背景:   我們公司與合作方公司有個消息同步的需求,合作方是消息生產者,我們是消息消費者,他們通過kafka給我們推送消息,我們實時接收,然后進行后續業務處理。昨天上午,發現他們推送過來的廣場門店信息我們都沒有消費,導致我們系統和他們系統數據不一致,從而導致無法提單,無法出報表(報表有誤 ...

Wed Jun 12 18:07:00 CST 2019 0 571
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM