原文:集群雲盤報錯問題排查

當存儲和計算分離之后,給容器掛載的硬盤一般是塊設備,但這個塊設備可能是在其他主機上,使用iscsi協議來讀寫。 最近遇到一個問題,當iscsi的對應target出問題之后,容器中寫盤出現io error, . blk update request: critical medium error, dev sdh, sector . Buffer I O error on dev sdh, logic ...

2019-11-12 09:36 0 492 推薦指數:

查看詳情

阿里的致命問題

影響范圍: 所有使用了阿里,並啟用了多副本或主從切換的服務,如:MySQL、Redis、MongoDB、DRBD、Hadoop 以及用戶自行開發的應用程序等。 表現症狀: 當發生網絡分區等不可用故障時,上述依賴於的服務無法正常完成主從切換 ...

Mon Feb 06 13:21:00 CST 2017 1 1363
RKE 集群常見問題排查

SSH 連接報錯 Failed to set up SSH tunneling for host [xxx.xxx.xxx.xxx]: Can't retrieve Docker Info Failed to dial to /var/run/docker.sock: ssh ...

Fri Mar 11 17:57:00 CST 2022 0 963
接口重復請求報錯問題排查

背景:接口多次連續請求,客戶端會收到服務端的400的錯誤,但是單次請求是可以成功 因為從服務中看,報錯400 並不是服務暴露出來的,服務沒有日志 但是從nginx中已經看到有錯誤了,肯定發送給了服務,只是這個400,並不是測試的服務返回到,應該是底層返回的 排查問題 ...

Wed Oct 14 04:11:00 CST 2020 0 554
線上 ELK 集群健康值 red 狀態問題排查與解決

之前一直運行正常的數據分析平台,最近一段時間沒有注意發現日志索引數據一直未生成,大概持續了n多天,當前狀態: 單台機器, Elasticsearch(下面稱ES)單節點(空集群),1000+shrads, 約200G大小。 問題排查 服務器內存,CPU狀態檢查 使用 top 查看服務器 ...

Tue Aug 07 22:24:00 CST 2018 0 4433
zookeeper集群環境查看leader節點及問題排查

zookeeeper集群環境查看leader節點 在項目實施中經常需要用用zookeeeper集群環境,當需要定位zookeeper集群是否穩定的時候,會需要判斷集群中leader是否進行改變,這時候就需要命令來查看 出現Error contacting service. ...

Wed Oct 27 00:23:00 CST 2021 0 2805
七牛存儲 報錯問題

上傳 401 錯誤碼 liangchao • 發表於:2015年08月20日 15:26 • 更新於:2016年01月07日 17:01 一、報錯:{"error":"expired token"},{“error”:”token out of date”} 處理方法 ...

Tue Apr 19 01:57:00 CST 2016 0 8062
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM