服務器硬件問題導致虛擬機自動重啟


 

 

 

 

 

 

 

                                          環境:Esxi虛擬化 宿主機上面跑兩台機器(20.11,21.12),插兩塊300G的SATA硬盤

現象:監控頁面在昨天半夜到今早經常出現空缺部分(感覺應該是機器重啟了):

    現象如下

排查:

1.首先在21.12這台機器上使用last命令查看重啟情況(沒來得及截圖)但是確實是系統重啟過

2.查看/var/log/messages日志,鎖定8:27分的日志(也就是重啟的時間段)

單從日志信息上看cpu不支持變頻的問題,由於在操作系統和VCS日志中均沒有發現其他異常,因此懷疑是服務器硬件出了問題,去機房一看,服務器住面板的故障燈顯示紅色

報錯信息如下:PDR1101 FAULT delected on drive1.check drive

看着是drive1硬盤壞了,為了保險起見,找到快速服務代碼,聯系戴爾客服,客服解釋是硬盤問題

由於這台服務器是之前同事上架的,並不知道raid級別,關閉這台服務器,再次開機摁ctrl+r,查看,發現做的是raid1(還算有良心,系統有同步的)

於是把壞的硬盤拔下去,在找到一塊大小型號一樣的服務器類型硬盤插上去(服務器使用的是dell cheetah 15k.7 300GB SATA)(雖然帶有紅色按鈕的硬盤支持熱插拔,但是並不建議開機的時候插拔,最好先關機)

 

這台機器是做的EXSI虛擬化,又是raid1,按照常理來說壞的硬盤拔下來,插上新的硬盤對系統不會有影響,虛擬機還能正常進去,但是當我在宿主機中打開21.12這台虛擬機的時候,報錯(進不去了)

 

趕緊去機房重啟宿主機服務器,發現系統進不去了,提示找不到,一直在PXE獲取,但是沒有系統可進

重啟 修改硬盤為ACHI模式,ctrl+r 查看硬盤的狀態,硬盤狀態顯示是online的,於是可以確定是第二塊硬盤raid數據損壞了,導致系統都沒了(看來raid1並不穩啊)

 

目前擺在眼前有兩種解決辦法 1.找專業的戴爾工程師修復數據備份,重裝ESXI

          

              2.重裝EXSI

 

本機是測試環境,數據並不重要

但是環境比較重要,於是在其他宿主機分出一部分硬盤空間,聯系同事臨時部署個資管對應分支代碼的環境給測試使用,我這頭再重新安裝ESXI

重啟 ctrl+r進raid 做個raid1,然后清空之前硬盤的數據,開始初始化,等待大概二十分鍾

接一個外接光驅,插入R720 ESXI鏡像光盤,然后在重啟,摁F11進bios UEFI 選擇DVD USB模式啟動

開始安裝過程從鏡像中拷貝文件

拷貝完成

進入安裝過程,按回車繼續

用戶協議,點擊F11接受並繼續

選擇安裝位置

按回車繼續

F11安裝

選擇安裝語言

設置系統安裝密碼,需要最少7

確認安裝,並提示如果安裝將重建磁盤,點擊F11確認

經過一段時間等待,安裝成功。點擊回車重啟。

重啟

重啟之后會再次拷貝文件,也就是這兩個頁面

然后再次重啟進入PXE分配ip進入系統(我們現在可以在這台虛擬化宿主機上建虛擬機繼續使用了)

 

以上步驟也可以連接戴爾服務器管理口(IDRAC)操作

【IP設置】

(1)最簡單設置方法就是利用前面板的LCD加三個左右確認按鈕,進入Setup->iDRAC->IP->子網掩碼->網關->DNS設置(最后的DNS最好也設置一下)。在設置好之后,切記要按確認。

(2)如果想進入BIOS里面設置,開機按F2,System Settup->iDRAC Setting,在NIC Selectioin那里選一個網口(默認LOM1)。記錄右邊滑動條往下來才能看到設置IP地址,默認已經是172.12.0.171設置好。

可以在面板上查看 √ setup  IDRAC

【網絡訪問】

剛開始還以為按默認的172.12.0.171設置就可以,在本地服務器還是遠程,怎么都登陸不上。

有幾個原因如下:

(1) 首先,因為我們電腦是DHCP獲取到192.168.x的IP,所以不可能到達172.12的網段。所以,我們把電腦的網卡設置為手動IP,然后點高級,將172.12.x的網段加進入。

iDRAC的全稱為 Integrated Dell Remote Access Controller ,中文翻譯為戴爾遠程控制卡,一般位於服務器的后面,標注為iDRAC。開機運行時候可以通過機器前面的LCD控制面板對它進行IP的設定,然后就可以在本地的任何一台電腦上,在IE瀏覽器中輸入剛才配置的IP地址,使用默認的用戶名和密碼(root /calvin)來操作這台電腦  ,默認用戶名root,密碼:calvin。(就算這台服務器剛開始的時候什么系統都沒有),就像這服務器就在你面前一樣 ,可以設置BIOS中的各項設置。例如現在我設置服務器的iDRAC 的 IP為172.16.136.171 ,連接上網線。在我本機上面,輸入這個Ip地址,然后會出現下圖:

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM