故障描述:
今天突然接到報警,一台服務器無法連通,無法登錄、無法 ping 通。
打電話到 IDC ,授權工程師查看服務器狀態,返回結果如下:
1、服務器關機狀態
2、無法開機 ( 電源燈亮 ),按開機鍵沒反應。
3、嘗試拔掉電源,等待幾分鍾后再次開機,結果還是不行。
這是一台宿主機,上面開了 5 個虛擬機,一下子全狗帶了... 關鍵數據還在里面。
好在,受影響的業務不是主要業務,但也處於無法提供服務的狀態。
解決方法:
第二天去機房把服務器拉回公司 ( 機房在外地 ),通電發現還真是無法開機,還發現一點就是,服務器診斷面板上 BOARD 亮黃燈!
基本斷定是主板故障了吧 ?
下面是搞數據:
1、好在公司機房機架上還有一台同型號的服務器 IBM X3650 M4
2、這台服務器跟壞掉的服務器機器型號、RAID卡信息、硬盤數量等都一致
3、唯一的區別就是,公司的這台服務器沒有做 RAID,壞掉的這台是 RAID10
4、機櫃服務器關機 ( 最好先備份一下數據 ),拔出硬盤 ( 8塊硬盤,順序不能亂 )
5、將壞掉的服務器硬盤按順序拔出,插入機櫃中這台好的服務器中 ( 順序不能亂 )
6、開機,根據提示導入 RAID 信息
( 輸入 C、是否導入 Y、選擇配置文件,其實就一個,選 all 即可,Start、同意導入 import,退出 exit,reboot 重啟服務器 )
7、很順利,由於線上服務器密碼極度復雜,這里重啟的時候順便重置一下 root 用戶密碼
8、進入系統配置IP,然后就可以不用在機房待着了,備份數據,傳到線上,恢復業務
9、關機、拔出硬盤,按順序插入原來的壞機器,給機櫃上的機器重新按順序插入原硬盤
10、執行第六步,重啟 進入系統
異地備份很重要!!!
