Redis讀超時排查

本文轉載自查看原文 2018-06-17 17:05 2005 緩存學習

現象：STORM UI中發現bolt中有failed，異常日志拋異常read time out

業務場景：storm讀寫redis。

查看redis日志發現，正常情況下每隔2小時都會有超時的異常拋出來，拋出異常的 redis機器有多台。

分析慢日志：

1、看命令數和value大小：找到其中一台redis，看命令數，只要在10W tps以下都不算大，看慢的命令是否有大value，發現並不大（只看了其中一個，其他沒看）

2、看連接數在3K以下並不高

3、看網卡流量，平均比較高

問題定位：多個項目共用一個redis集群，導致redis網卡流量居高不下，而redis是多線程接收命令，單線程處理命令，即使一個命令的value並不大，可能因為等待執行的命令較多，導致當前的命令處理變慢！

正常的redis網卡流量應該像下面這樣好看

后續發現其他問題，虛機所在物理機上多台虛機丟包

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Redis 超時排查 redis連接超時問題排查 Redis查詢超時問題排查及原因分析【Redis連接超時】記錄線上RedisConnectionFailureException異常排查過程記一次redis讀取超時的排查過程（SADD惹的禍） TCP超時、ping不丟包排查日常問題排查-調用超時 redis 性能監控和排查如何排查Redis性能問題 redis安裝及錯誤排查