SMART(Self-Monitoring, Analysis, and Reporting Technology)是一種普及度比較高的磁盤分析檢測工具,磁盤運行過程中,該工具搜集磁盤的狀態參數,如型號、容量、溫度、密度、扇區、尋道時間、傳輸、誤碼率等。可以做到動態檢測磁盤狀態,當某些參數達到閾值時,會警示磁盤故障。
SMART包括2個工具,守護進程smartd和應用程序smartctl。守護進程用來檢測、監控、分析、上報磁盤信息,有對應的配置維護。smartctl用以檢查磁盤的運行狀態信息。
下面簡單列舉smartctrl的常用用法:
smartctl -a
smartctl -s on
smartctl -H
smartctl -A
smartctl -t long
smartctl -t short
smartctl -C -t
smartctl -X
smartctl -l selftest
smartctl -l error
一般會在守護進程smartd中配置一些高級功能,比如,定時檢測、分析匯總、上報等。可以編輯smartd.conf進行配置。常用的配置項:
- 郵件告警
/dev/sda -a -m admin@example.com,root@localhost #監控磁盤的所有屬性,出現 Failure,郵件通知
/dev/sda -H -m admin@example.com,root@localhost #監控磁盤的健康狀態,出現 Failure,郵件通知
/dev/sdb -m admin@example.com -M test #啟用時,發送test消息 - 定時檢測
/dev/sde -d hpt,1/1 -a -s S/../.././01 #每天1:00-2:00 am,進行短自檢
/dev/sde -d hpt,1/2 -a -s S/../.././02 #每天2:00-3:00 am,進行短自檢
/dev/sde -d hpt,1/3 -a -s S/../.././03 #每天3:00-4:00 am,進行短自檢
/dev/sde -d hpt,1/4/1 -a -s L/../../7/00 #每周日00:00-01:00 am,進行長自檢
/dev/sde -d hpt,1/4/2 -a -s L/../../7/02 #每周日02+00-03:00 am,進行長自檢
【參考】http://smartmontools.sourceforge.net/man/smartd.conf.5.html