原文:Ceph osd故障恢復

調高osd的日志等級 加上紅框那一行就可以了 osd的日志路徑: var log ceph ceph osd. .log 注意:加上了這一行后日志會刷很多,所以要特別注意日志容量的變化,以防把var目錄寫滿了 缺少osdmap或者錯誤的osdmap 從osd日志中發現這兩種錯誤都是屬於osdmap不正常,可以從其它正常osd上拷貝osdmap到對應啟動錯誤的osd上,假設不正常的osdmap序號 ...

2019-12-03 19:30 0 952 推薦指數:

查看詳情

Ceph monitor故障恢復探討

1 問題 一般來說,在實際運行中,ceph monitor的個數是2n+1(n>=0)個,在線上至少3個,只要正常的節點數>=n+1,ceph的paxos算法能保證系統的正常運行。所以,對於3個節點,同時只能掛掉一個。一般來說,同時掛掉2個節點的概率比較小,但是萬一掛 ...

Thu Aug 21 07:47:00 CST 2014 3 13506
ETCD節點故障恢復

我在微服務組里面主要負責配置中心的構建,我們的配置中心使用到了ETCD。在我們的內網環境中搭建了三個節點的ETCD,不過這三個節點的ETCD都搭建在同一台機器上。后來機器資源不夠了系統直接kill了E ...

Mon Jan 15 08:01:00 CST 2018 0 1395
Ceph OSD故障處理

故障描述: 節前將所有ceph節點全部關機,節后開機后發現 osd 全部down ceph -s發現 HEALTH_WARN 320 pgs stale; 320 pgs stuck stale; 3/3 in osds are down 查詢很多資料都不知道如何處理,只能刪除 ...

Mon Feb 06 06:05:00 CST 2017 0 1939
rabbitMQ故障恢復的順序(重要)

rabbitmq模式 這里我們重點說下鏡像隊列模式: 鏡像有三種類型: 所以,集群模式是為了提高擴展性,鏡像模式提高高可用性。rabbitmq的節點存儲類型 RabbitMQ的集群 ...

Fri Nov 05 23:17:00 CST 2021 0 1026
ceph_osd故障檢測

1. 當前monitor可以通過3種途徑檢測到osd離線 1) Osd自主上報 2) Osd通過投票的方式(滿足一下條件之一,mon會將osd標記為down) a) 投票攜帶了Force/Immediate標識(和其他osd建立鏈接時返回 ...

Sat Apr 20 18:02:00 CST 2019 0 684
MongoDB集群節點RECOVERING故障恢復

今天收到客服部說查詢不到數據,隨后上服務器檢查集群狀態,發現了有兩台機的副本集異常了,狀態為RECOVERING ps: 集群為3節點3副本 集群主機副本2 ...

Sat Apr 27 00:18:00 CST 2019 0 1336
記一次mysql故障恢復

事情要從倆月前的一個坑說起,一台新的測試服務器,新項目一元奪寶用的。 配置aws上的一台雲主機,系統盤8G,一塊300G的雲硬盤。 拿到機器后,另一運維小哥安裝php,nginx,mysql等軟件 ...

Wed Dec 07 01:44:00 CST 2016 0 2076
mysql MHA高可用故障恢復

恢復MHA故障 1.手動修復 1)修復掛掉的數據庫 2)找到主從語句 3)修復的數據庫執行change語句 4)查看主從狀態 5)修復MHA配置 6)重新啟動MHA 2.腳本修復 1)創建腳本目錄 2)寫腳本 3)加上判斷 三、MHA ...

Tue Nov 10 22:37:00 CST 2020 0 376
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM