問題描述：

掉電后，上電發現cluster中的主機node3下的所有osd都down掉了，通過命令重啟node3的ceph-osd服務，osd依然無法up；通過激活集群所有osd還是不行。

[root@node1 ~]# ceph osd tree
ID CLASS WEIGHT  TYPE NAME      STATUS REWEIGHT PRI-AFF 
-1       0.05878 root default                           
-3       0.01959     host node1                         
 0   hdd 0.00980         osd.0      up  1.00000 1.00000 
 3   hdd 0.00980         osd.3      up  1.00000 1.00000 
-5       0.01959     host node2                         
 1   hdd 0.00980         osd.1      up  1.00000 1.00000 
 4   hdd 0.00980         osd.4      up  1.00000 1.00000 
-7       0.01959     host node3                         
 2   hdd 0.00980         osd.2    down        0 1.00000 
 5   hdd 0.00980         osd.5    down        0 1.00000

解決方法：

1. 刪除該主機中的所有osd

通過刪除osd的shell腳本的博客刪除主機下的所有down掉的osd

2. 重新創建該主機下的osd

通過admin節點執行下面命令重建osd：

# ceph-deploy osd create node3:/dev/sdb2 node3:/dev/sdc2

3. 激活集群中所有osd

# ceph-deploy osd activate  node1:/dev/sdb1 node2:/dev/sdb1 node3:/dev/sdb2 node1:/dev/sdc1 node2:/dev/sdc1 node3:/dev/sdc2

驗證osd是否up：

[root@node1 ~]# ceph osd tree
ID CLASS WEIGHT  TYPE NAME      STATUS REWEIGHT PRI-AFF 
-1       0.05878 root default                           
-3       0.01959     host node1                         
 0   hdd 0.00980         osd.0      up  1.00000 1.00000 
 3   hdd 0.00980         osd.3      up  1.00000 1.00000 
-5       0.01959     host node2                         
 1   hdd 0.00980         osd.1      up  1.00000 1.00000 
 4   hdd 0.00980         osd.4      up  1.00000 1.00000 
-7       0.01959     host node3                         
 2   hdd 0.00980         osd.2      up  1.00000 1.00000 
 5   hdd 0.00980         osd.5      up  1.00000 1.00000

參考文檔：

http://www.cnblogs.com/boshen-hzb/p/6796604.html

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Error EBUSY: osd.0 is still up; must be down before removal的解決辦法解決ceph節點因斷開SSH遠程后的造成集群網絡不穩定(節點的Mon和OSD進程自動down)的問題關於在win8系統下用VMware 9.0裝系統導致物理機不斷重啟的解決辦法 VMware虛擬機網絡橋接模式下無法與主機ping通解決辦法 Chrome所有插件崩潰解決辦法 Kubernetes集群證書過期解決辦法 ES集群health為yellow解決辦法 Win7多用戶情況下，指定某一用戶為自動登陸-解決辦法啟動網卡報錯（Failed to start LSB: Bring up/down networking ）解決辦法總結 wpf button的mouse(leftbutton)down/up,click事件不響應解決辦法