原文:記錄一次mongodb因網絡問題導致shard節點異常

現象: 機房反饋 點左右,機房交換機故障,導致網絡出現問題 業務人員反饋某個接口超時 初查:通過業務日志查看分析發現,在連接mongo的某個collections時候,報錯錯誤如下: 在寫入數據的時候報錯: 因此初步確定問題出在mongo分片集群上 進入mongos節點,進行findOne操作,提示如下: 查看shard信息: 沒有發現異常,然后挨個檢查shard節點日志 發現在shard 節點的 ...

2018-12-10 13:33 0 1398 推薦指數:

查看詳情

記錄一次並發導致數據重復創建的問題

這事第一個版本的代碼邏輯,通過數據庫中是否有紀錄來防止重復創建 但是測試MM發現創建了2條紀錄,查詢日志發現:第一次請求在寫入數據庫之前,第二請求已經執行過了判斷邏輯,所以並沒有查詢到寫入紀錄,從而導致重復創建。 解決方案,加入分布式鎖,第二個版本代碼如下 經過此次修改,以為解決 ...

Sat Feb 03 01:04:00 CST 2018 0 1147
記錄一次idea的git導致的macpro風扇狂轉問題

現象 macpro風扇忽然狂轉不停;使用軟件Macs Fan Control檢測如下:cpu溫度持續過高(超過50度),風扇當前轉速比較高 解決 觀察cpu使用情況,發現git占用cpu很高, ...

Sat Jul 20 01:09:00 CST 2019 0 717
記錄一次TraceId的問題

多服務部署的時候,各個服務通過httpClient進行調用時候,有時候出現問題,需要進行追查。但是如果沒有一個標記,就會很迷茫,特別是多個服務來回調用,就無法快速定位問題。這個時候一般是使用MDC的 traceId來追蹤。但是由於每個服務的traceId ...

Wed Aug 21 19:03:00 CST 2019 0 1055
記錄一次問題排查

1. 問題描述:早上剛來上班,業務部門同事反應管理后台無法登錄 2. 問題排查定位 2.1 服務器排查 a. 接口是否可以調通:首先自己登陸后台,發現時好時壞,偶爾接口返回【系統忙】。我們系統接口異常調不通會返回系統忙 b. 服務是否死掉或者假死:連接服務器->查看Java ...

Tue Aug 03 02:08:00 CST 2021 0 260
記錄一次句柄泄漏的異常解決

最近入職了一家生產機器人的公司,我們做的軟件就是運行在這個機器人上的,機器人服務有個特點就是里面的軟件要連續24小時不間斷服務,所以要求app能夠持續的運行服務。 測試那邊很久以前就記錄過一個奇異的問題,就是機器人在使用一天以后,會莫名奇妙的閃退,java層有crashhandler,但是也抓 ...

Sat Aug 18 00:30:00 CST 2018 2 5905
一次SpringAOP環繞通知導致全局異常抓取失效的問題

背景 在web開發過程中,我們每個項目都必然會主動或者被動的拋出各種各樣的異常,那么如果拋出到最上層還沒有捕獲,那么就會導致程序停止。所以,一般我們在開發中都會使用全局異常捕獲機制,捕獲各種各樣的異常,最后返回統一的結果實體類給調用方。 另一方面,我們在使用spring框架開發的過程中 ...

Wed Sep 30 02:07:00 CST 2020 0 1394
一次ElasticSearch重啟之后shard未分配問題的解決

一次ElasticSearch重啟之后shard未分配問題的解決 環境 ElasticSearch6.3.2,三節點集群 Ubuntu16.04 一個名為user的索引,索引配置為:3 primary shard,每個primary shard 2個replica 正常 ...

Mon Oct 01 06:43:00 CST 2018 0 1523
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM