原文:記錄一次線上處理5千萬數據轉換的經驗

前言:剛來新公司 個月就面臨了一次線上真實數據的轉換,這些數據異常重要,對我們公司來說就是客戶的資源,說白了就是客戶存在我們公司的錢,一旦處理失敗將會影響極大,可以想象一下你存銀行 萬元,第二天查詢卻一分錢沒有的情況,但是很遺憾此次處理沒有處理好,造成了極大的影響,對我個人而言也是,后續我對此次數據轉換失敗進行了深刻反思,發現處理失敗原因主要 個方面, 是流程不對, 是基礎知識准備不足,現在我將把 ...

2017-12-13 20:38 4 2429 推薦指數:

查看詳情

一次線上FullGC問題記錄

​ 標題采自:英雄聯盟-瑞文:斷劍重鑄之日,騎士歸來之時! 斷劍 ​ 前兩天早上在擠地鐵的時候看到小組群里,主管發了好多消息,打開來一看,說是XX項目自從22號發版后,每天晚上就瘋狂Full GC ...

Fri Dec 07 19:40:00 CST 2018 3 854
一次線上事故的處理流程和總結

1、事故問題: 某個舊版本業務功能中運行了一個失敗重試的job,因一位離職的同事編碼時未考慮周全出現死循環,導致線上從24日下午2點一直到27日晚9點持續3天一直在刷日志。異常日志內容如下: 2、事故過程分析: ①、根據異常日志 ...

Tue Jul 31 18:00:00 CST 2018 0 1408
記錄線上一次線程hang住問題

線上發現執行某特定任務在某個特定時間點后不再work。該任務由線程池中線程執行定時周期性調度,根據日志查看無任何異常。從代碼研判應該無關定時任務框架,因為對提交的定時任務做了wrap,會將異常都catch住,保證下次仍然能夠正常調度。 通過jstack導出堆棧信息,發現問題線程的堆棧信息 ...

Wed Mar 21 04:56:00 CST 2018 1 2107
記錄一次tcp_timestamps 線上問題的排查

我們的情況和這個朋友遇到的有點類似: https://blog.csdn.net/majianting/article/details/96476375 如我的域名是:yuming.api.com 如公網ip是:192.168.2.202 我線上的接口是:http://yuming.api.com ...

Thu Apr 14 17:22:00 CST 2022 0 758
記錄一次線上yarn RM頻繁切換的故障

周末一大早被報警驚醒,rm頻繁切換 急急忙忙排查 看到兩處錯誤日志 錯誤信息1 錯誤信息2 查看源碼處FairScheduler 跟進去看下 ...

Sat Dec 21 23:13:00 CST 2019 0 728
一次線上Redis類轉換異常排查引發的思考

之前同事反饋說線上遇到Redis反序列化異常問題,異常如下: 已知信息如下: 該異常不是必現的,偶爾才會出現; 出現該異常后重啟應用或者過一會就好了; 序列化協議使用了hessian。 因為偶爾出現,首先看了報異常那塊業務邏輯是不是有問題,看了一遍也發現 ...

Mon Jun 24 19:05:00 CST 2019 0 885
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM