AIX小型機狀態監測


1、 確認所在主機及系統版本


通過#hostname、#oslevel確認所在主機后,再進行后續操作


2、運行lsdev 命令配置各種參數,所列各種設備狀態都應為Available


#lsdev –CHS a               列出系統中可用設備。
#lsdev –Cc processor         列出系統中的所有CPU。
#lsdev –Cc memory         列出系統中的所有內存。
#lsdev –Cc disk              列出系統中的所有硬盤。
#lsdev -Cc adapter | grep ent        列出系統中的所有網卡
#lsdev -Cc adapter | grep scsi     列出系統中的所有SCSI卡。
#lsdev -Cc adapter | grep ssa        列出系統中的所有SSA卡。


3、檢查pv信息


#lspv           顯示系統中可用的PV。
#lspv hdiskn       顯示hdiskn的具體信息。
#lsdev –Cc pdisk    顯示磁盤陣列的硬盤的具體信息。
對SSA硬盤的檢測:在對主機進行工作之前可以先把磁盤陣列上電,等主機完全啟動后,登錄到主機上,運行以下命令“ lsdev –Cc pdisk “,應該可以看到所有SSA硬盤,並且狀態應為Available.。


4、 檢查內存信息


# lsattr –El mem0    列出系統中內存mem0的大小


5 、檢查vg信息


#lsvg           列出系統中所有的vg。
#lsvg rootvg        列出rootvg的詳細信息。
#lsvg –o         列出激活的vg


6、檢查系統中各網卡配置


#netstat –in    查看網卡的IP是否配置好了。


7、檢測主機內所有硬件


# diag 檢測結果為 “No trouble found ”則各部分工作正常。


(選擇:Task Selection-> SSA Service Aids)對SSA硬盤鏈路連接的校驗,可以通過SSA 工具里的Link Verification 來檢測。如有必要,可以用 Certify Disk運行硬盤診斷部分進行硬盤的表面分析測試。


9、查看PAGING SPACE的使用情況


#lsps –a  通常如果使用率超過70%,就需要采取措施。
10、查看有無stale的lv
# lsvg –o | lsvg –il | grep –i stale  如果輸入該命令之后有輸出結果,就需要采取措施


11、 查看root用戶的mail


#mail  是否有收到系統錯誤報告


12、 檢查雙機狀態


#lssrc –g cluster 檢查ha三個工作進程是否激活

 


#/usr/sbin/cluster/clstat –a  檢查雙機狀態是否up


#檢查hacmp.out日志,  是否有異常信息輸出。


13、 檢查能否順利進入CDE界面
如果不能進入的話,要檢查/etc/hosts表中有否錯誤的項目。


14、 用smitty ssaraid 查看磁盤陣列RAID盤的狀態是否是Good。


如果是degrade或其他狀態表示RAID盤出現問題了


15、  查看系統的DUMP設置是否正常。
#sysdumpdev  -l


16、 查看當前操作系統補丁版本補丁程序(PTF)是否滿足穩定運行的需要。


#instfix –ik |grep ML


17、查看磁盤空間占用率


#df –h  確保以下文件系統的占用率高於80%立即上報:

/  /var  /usr  /home  /tmp    其余文件系統的占用率高於95%立即上報。可通過shell編程,在達到警戒線時發送郵件通知管理員。


find . –size +2048 –o ctime 1 –exec ls –l {} \; 查出大於1M或一天之內修改過的文件。


18、磁帶機是否需要清洗
#/usr/lpp/diagnostics/bin/utape -cd rmt0 –n
顯示結果為磁帶機使用的小時數,若大於規定時數,如72小時,則不論磁帶機黃燈是否亮都應用清潔帶清洗


19、檢查 errdaemon, srcmstr 是否正常運行


# ps -ef|grep err


# ps -ef|grep src


20、性能命令參數及解析(vmstat、sar、ps、iostat、netstat)


vmstat命令解析:vmstat 命令的輸出可以反映系統整體運行狀況,包括cpu、內存、虛擬頁面、系統進程和系統調用情況。
檢查CPU是否為瓶頸,分別檢查CPU的四項數值和kthr的兩項數值.
檢查MEM是否為瓶頸,分別檢查Memory的兩項數值和Page 的六項數值.


sar命令解析:  sar可以用來收集反映系統運行狀況,主要是查看CPU的運行狀況,CPU是否負載均衡,是否存在分配不均的情況。


ps命令解析:ps可以用來查看進程的當前狀態。通過參數的配搭,可以觀察目前正在運行的進程所耗的時間,CPU和memory 量.其中,%CPU表示進程所占用的CPU資源情況,%MEM表示進程所占用的內存情況。主要檢查是否有標示為<defunc>的僵屍進程耗用系統資源,以及數據庫的進程的系統消耗情況。


iostat命令解析: iostat可以用來查看系統的 I/O的輸入輸出情況,主要查看陣列上的硬盤的每秒讀寫量,同時估算磁盤陣列讀寫速度HHhHhh 。可配合dd使用,如:在機器上用dd命令進行磁盤陣列的寫操作校驗,與此同時用iostat 1 –d  hdiskX觀察磁盤。

netstat命令解析: netstat可以用來查看系統的網絡情況,主要是查看網絡客戶端連接的情況和開銷,檢查參數為state,如有死連接,state狀態為fin_wait, 這樣耗用系統網絡資源,從而導致網絡性能下降構成瓶頸。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM