1、將主機進入維護模式(可選)
如果主機支持帶外管理配置RAID可以不用重啟,否則需要重啟進入RAID卡配置RAID,有的服務器支持在esxi底層通過命令行工具(需要安裝對應的軟件包)對自己家的RAID卡直接配置RAID,這是也可以不重啟主機
2、找到故障的磁盤進行更換,並重新配置RAID0
一般主機面板會有告警,同時硬盤故障指示燈也會亮起,也可以通過帶外管理查看對應到告警來定位硬盤,下面是在vCenter上查看故障磁盤
3、聲明新添加的故障磁盤(在對應的磁盤組中通過添加磁盤也應該可以,沒事測試)
4、刪除故障磁盤
故障的磁盤無法從vCenter界面中移除磁盤(也可能是我先更換的硬盤后移除硬盤引起的,先移除也可以但是沒有測試)
5、通過命令行刪除磁盤
a、命令介紹
SSH或者ESXi Shell登錄到有SSD設備故障的主機;
執行如下命令確認故障磁盤設備ID:esxcli vsan storage list
此時,會看到naa.xxxxxx開頭的設備; ##這種磁盤為正常可識別的磁盤
執行如下命令,從Disk Group刪除掉設備:
esxcli vsan storage remove -s naa.xxxxx
命令選項包括 -d(用於磁盤)、-s(用於 SSD)和 -u(用於 VSAN 磁盤的 UUID)
可以查看這條命令的幫助信息
----------------------------------------------------------------------------------
[root@vsan13:~] esxcli vsan storage remove --help
Usage: esxcli vsan storage remove [cmd options]
Description:
remove Remove physical disks from vSAN disk groups.
Cmd options:
-d | --disk=<str> Specify individual hdd to remove from vSAN usage.e.g.: mpx.vmhba2:C0:T1:L0
-m | --evacuation-mode=<str>
Action the vSAN service must take before the host can enter maintenance mode (default noAction). Allowed values are:
ensureObjectAccessibility: Evacuate data from the disk to ensure object accessibility in the vSAN cluster, before removing the disk.
evacuateAllData: Evacuate all data from the disk before removing it.
noAction: Do not move vSAN data out of the disk before removing it.
-s | --ssd=<str> Specify a disk group's fronting ssd to remove the ssd and each backing hdd from vSAN usage.e.g.: mpx.vmhba2:C0:T1:L0
-u | --uuid=<str> Specify UUID of vSAN disk.e.g.: 52afa1de-4240-d5d6-17f9-8af1ec8509e5
-------------------------------------------------------------------------------------
b、具體操作
通過命令 esxcli vsan storage list 查看故障磁盤
故障磁盤沒有naa.xxxxxx開頭的字樣
c、通過命令刪除磁盤
參考:
https://blog.51cto.com/wangchunhai/2668349
https://blog.51cto.com/sampsondotqiu/2456607
https://blog.csdn.net/fq3758/article/details/110533065
https://www.jianshu.com/p/756e266be0d9