簡介:
硬盤其實是服務器故障率最高的設備,沒有之一。
只有它是機械的,有磨損,風扇還好,無塵機房可以一直用。
玩意硬盤壞一塊怎么辦?
一:查看ceph狀態
root@pve4:~# ceph osd tree
ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF
-1 3.27478 root default
-3 0.81870 host pve1
0 hdd 0.81870 osd.0 up 1.00000 1.00000
-5 0.81870 host pve2
1 hdd 0.81870 osd.1 up 1.00000 1.00000
-7 0.81870 host pve3
2 hdd 0.81870 osd.2 up 1.00000 1.00000
-9 0.81870 host pve4
3 hdd 0.81870 osd.3 down 0 1.00000
osd.3 下線了
二:去除故障硬盤
ceph osd out osd.3 #下線osd盤
ceph auth del osd.3 #刪除權限
ceph osd rm 3 #刪除3號
ceph osd crush rm osd.3 #管理刪除osd
ceph osd crush rm pve4 #管理刪除節點

root@pve4:~# ceph osd rm 3 removed osd.3 root@pve4:~# ceph osd tree ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF -1 3.27478 root default -3 0.81870 host pve1 0 hdd 0.81870 osd.0 up 1.00000 1.00000 -5 0.81870 host pve2 1 hdd 0.81870 osd.1 up 1.00000 1.00000 -7 0.81870 host pve3 2 hdd 0.81870 osd.2 up 1.00000 1.00000 -9 0.81870 host pve4 3 hdd 0.81870 osd.3 DNE 0 root@pve4:~# ceph osd crush rm osd.3 removed item id 3 name 'osd.3' from crush map root@pve4:~# ceph osd tree ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF -1 2.45609 root default -3 0.81870 host pve1 0 hdd 0.81870 osd.0 up 1.00000 1.00000 -5 0.81870 host pve2 1 hdd 0.81870 osd.1 up 1.00000 1.00000 -7 0.81870 host pve3 2 hdd 0.81870 osd.2 up 1.00000 1.00000 -9 0 host pve4
三:添加新磁盤
記得初始化
wipefs -af /dev/sdc #sdc為新更換的磁盤設備名稱
如果報錯,掃描不到,徹底清除磁盤信息,並重啟
dd if=/dev/zero of=/dev/sdb bs=512K count=1
reboot