1 問題 一般來說,在實際運行中,ceph monitor的個數是2n+1(n>=0)個,在線上至少3個,只要正常的節點數>=n+1,ceph的paxos算法能保證系統的正常運行。所以,對於3個節點,同時只能掛掉一個。一般來說,同時掛掉2個節點的概率比較小,但是萬一掛 ...
調高osd的日志等級 加上紅框那一行就可以了 osd的日志路徑: var log ceph ceph osd. .log 注意:加上了這一行后日志會刷很多,所以要特別注意日志容量的變化,以防把var目錄寫滿了 缺少osdmap或者錯誤的osdmap 從osd日志中發現這兩種錯誤都是屬於osdmap不正常,可以從其它正常osd上拷貝osdmap到對應啟動錯誤的osd上,假設不正常的osdmap序號 ...
2019-12-03 19:30 0 952 推薦指數:
1 問題 一般來說,在實際運行中,ceph monitor的個數是2n+1(n>=0)個,在線上至少3個,只要正常的節點數>=n+1,ceph的paxos算法能保證系統的正常運行。所以,對於3個節點,同時只能掛掉一個。一般來說,同時掛掉2個節點的概率比較小,但是萬一掛 ...
我在微服務組里面主要負責配置中心的構建,我們的配置中心使用到了ETCD。在我們的內網環境中搭建了三個節點的ETCD,不過這三個節點的ETCD都搭建在同一台機器上。后來機器資源不夠了系統直接kill了E ...
故障描述: 節前將所有ceph節點全部關機,節后開機后發現 osd 全部down ceph -s發現 HEALTH_WARN 320 pgs stale; 320 pgs stuck stale; 3/3 in osds are down 查詢很多資料都不知道如何處理,只能刪除 ...
rabbitmq模式 這里我們重點說下鏡像隊列模式: 鏡像有三種類型: 所以,集群模式是為了提高擴展性,鏡像模式提高高可用性。rabbitmq的節點存儲類型 RabbitMQ的集群 ...
1. 當前monitor可以通過3種途徑檢測到osd離線 1) Osd自主上報 2) Osd通過投票的方式(滿足一下條件之一,mon會將osd標記為down) a) 投票攜帶了Force/Immediate標識(和其他osd建立鏈接時返回 ...
今天收到客服部說查詢不到數據,隨后上服務器檢查集群狀態,發現了有兩台機的副本集異常了,狀態為RECOVERING ps: 集群為3節點3副本 集群主機副本2 ...
事情要從倆月前的一個坑說起,一台新的測試服務器,新項目一元奪寶用的。 配置aws上的一台雲主機,系統盤8G,一塊300G的雲硬盤。 拿到機器后,另一運維小哥安裝php,nginx,mysql等軟件 ...
、恢復MHA故障 1.手動修復 1)修復掛掉的數據庫 2)找到主從語句 3)修復的數據庫執行change語句 4)查看主從狀態 5)修復MHA配置 6)重新啟動MHA 2.腳本修復 1)創建腳本目錄 2)寫腳本 3)加上判斷 三、MHA ...