1、 確認所在主機及系統版本
通過#hostname、#oslevel確認所在主機后,再進行后續操作
2、運行lsdev 命令配置各種參數,所列各種設備狀態都應為Available。
#lsdev –CHS a 列出系統中可用設備。
#lsdev –Cc processor 列出系統中的所有CPU。
#lsdev –Cc memory 列出系統中的所有內存。
#lsdev –Cc disk 列出系統中的所有硬盤。
#lsdev -Cc adapter | grep ent 列出系統中的所有網卡
#lsdev -Cc adapter | grep scsi 列出系統中的所有SCSI卡。
#lsdev -Cc adapter | grep ssa 列出系統中的所有SSA卡。
3、檢查pv信息
#lspv 顯示系統中可用的PV。
#lspv hdiskn 顯示hdiskn的具體信息。
#lsdev –Cc pdisk 顯示磁盤陣列的硬盤的具體信息。
對SSA硬盤的檢測:在對主機進行工作之前可以先把磁盤陣列上電,等主機完全啟動后,登錄到主機上,運行以下命令“ lsdev –Cc pdisk “,應該可以看到所有SSA硬盤,並且狀態應為Available.。
4、 檢查內存信息
# lsattr –El mem0 列出系統中內存mem0的大小
5 、檢查vg信息
#lsvg 列出系統中所有的vg。
#lsvg rootvg 列出rootvg的詳細信息。
#lsvg –o 列出激活的vg
6、檢查系統中各網卡配置
#netstat –in 查看網卡的IP是否配置好了。
7、檢測主機內所有硬件
# diag 檢測結果為 “No trouble found ”則各部分工作正常。
(選擇:Task Selection-> SSA Service Aids)對SSA硬盤鏈路連接的校驗,可以通過SSA 工具里的Link Verification 來檢測。如有必要,可以用 Certify Disk運行硬盤診斷部分進行硬盤的表面分析測試。
9、查看PAGING SPACE的使用情況
#lsps –a 通常如果使用率超過70%,就需要采取措施。
10、查看有無stale的lv
# lsvg –o | lsvg –il | grep –i stale 如果輸入該命令之后有輸出結果,就需要采取措施
11、 查看root用戶的mail
#mail 是否有收到系統錯誤報告
12、 檢查雙機狀態
#lssrc –g cluster 檢查ha三個工作進程是否激活
#/usr/sbin/cluster/clstat –a 檢查雙機狀態是否up
#檢查hacmp.out日志, 是否有異常信息輸出。
13、 檢查能否順利進入CDE界面
如果不能進入的話,要檢查/etc/hosts表中有否錯誤的項目。
14、 用smitty ssaraid 查看磁盤陣列RAID盤的狀態是否是Good。
如果是degrade或其他狀態表示RAID盤出現問題了
15、 查看系統的DUMP設置是否正常。
#sysdumpdev -l
16、 查看當前操作系統補丁版本補丁程序(PTF)是否滿足穩定運行的需要。
#instfix –ik |grep ML
17、查看磁盤空間占用率
#df –h 確保以下文件系統的占用率高於80%立即上報:
/ /var /usr /home /tmp 其余文件系統的占用率高於95%立即上報。可通過shell編程,在達到警戒線時發送郵件通知管理員。
find . –size +2048 –o ctime 1 –exec ls –l {} \; 查出大於1M或一天之內修改過的文件。
18、磁帶機是否需要清洗
#/usr/lpp/diagnostics/bin/utape -cd rmt0 –n
顯示結果為磁帶機使用的小時數,若大於規定時數,如72小時,則不論磁帶機黃燈是否亮都應用清潔帶清洗
19、檢查 errdaemon, srcmstr 是否正常運行
# ps -ef|grep err
# ps -ef|grep src
20、性能命令參數及解析(vmstat、sar、ps、iostat、netstat)
vmstat命令解析:vmstat 命令的輸出可以反映系統整體運行狀況,包括cpu、內存、虛擬頁面、系統進程和系統調用情況。
檢查CPU是否為瓶頸,分別檢查CPU的四項數值和kthr的兩項數值.
檢查MEM是否為瓶頸,分別檢查Memory的兩項數值和Page 的六項數值.
sar命令解析: sar可以用來收集反映系統運行狀況,主要是查看CPU的運行狀況,CPU是否負載均衡,是否存在分配不均的情況。
ps命令解析:ps可以用來查看進程的當前狀態。通過參數的配搭,可以觀察目前正在運行的進程所耗的時間,CPU和memory 量.其中,%CPU表示進程所占用的CPU資源情況,%MEM表示進程所占用的內存情況。主要檢查是否有標示為<defunc>的僵屍進程耗用系統資源,以及數據庫的進程的系統消耗情況。
iostat命令解析: iostat可以用來查看系統的 I/O的輸入輸出情況,主要查看陣列上的硬盤的每秒讀寫量,同時估算磁盤陣列讀寫速度HHhHhh 。可配合dd使用,如:在機器上用dd命令進行磁盤陣列的寫操作校驗,與此同時用iostat 1 –d hdiskX觀察磁盤。
netstat命令解析: netstat可以用來查看系統的網絡情況,主要是查看網絡客戶端連接的情況和開銷,檢查參數為state,如有死連接,state狀態為fin_wait, 這樣耗用系統網絡資源,從而導致網絡性能下降構成瓶頸。