dell PowerEdge R720 自動重啟分析
一,問題描述:
在同一批服務器當中,碰到這樣一台服務器,如果不跑任何服務時沒有問題,但一跑任務就是自動重啟。既然同樣的系統別的服務器都沒出現這種問題,此時通過快速服務代碼找dell售后。
二,安裝日志收集工具Dell System E-Support Tool (DSET) 3.5.1 - [Linux 64-bit],下載地址:
http://downloads.dell.com/FOLDER01894671M/1/dell-dset-lx64-3.5.1.101.bin
下載后:
chmod +x dell-dset-lx64-3.5.1.101.bin
./dell-dset-lx64-3.5.1.101.bin
版權聲明,直接按q退出即可。如果提示這個,只需要到/opt/dell/advdiages/dest/uninstall.sh 卸載即可。
Dell System E-Support Tool 3.5.1 is already installed on your system.
Uninstall DSET by running uninstall.sh from the /opt/dell/advdiags/dset location, and then install this version of DSET.
按y同意后
./dell-dset-lx64-3.5.1.101.bin
選擇2后,彈出下面對話框
等待收集完后,默認存儲在當前目錄下,下載下來查看日志中的錯誤。
三,分析日志,解壓需要輸入密碼,密碼是dell。解壓完后,用dsetreport.hta查看日志。
紅色打X的時間跟系統自動重啟時間能夠對應后,此時DELL的回復是如下:
這個報錯CPU 1 M01 VDDQ PG voltage is outside of range.,但是cpu 及電壓又都是正常的。
建議您機器關機拔除所有電源,長按開機按鈕30s-60s 后在 接上電源線開機,一般報錯就會消失。
另外更新下bios 版本到最新,更新方法直接在linux 系統下運行更新程序即可(更新過程中請勿斷電)
Bios 下載地址
Bios Firmware Version 2.1.3, Released 12/18/2013, Recommended, requires immediate reboot
Red Hat: http://downloads.dell.com/FOLDER01866020M/1/BIOS_3VRRM_LN_2.1.3.BIN




