AIX系統日志


1、系統錯誤日志

存放路徑:/var/adm/ras/errlog

說明:該日志記錄了系統所檢測到的軟硬件故障和錯誤,尤其對系統的硬件故障有很大的參考價值,是AIX提供的最有價值的日志之一, errlog 文件用more或者其他文本的查看命令來打開我們看到的只是一對亂碼,為了能夠查看錯誤日志文件需要使用aix的errpt命令,如:errpt 列信息;errpt –a列詳細信息,詳細使用方法可以參考man

2、用戶的登錄日志

存放路徑:/var/adm/wtmp    /var/adm/sulog

說明:這些日志記錄了用戶登錄和訪問服務器的情況信息,具體的日志文件有wtmp、、sulog等,它們記錄的分別是不同的事件,wtmp記錄的是歷史的login和lognout信息,可以用last命令訪問。sulog記錄的是用戶用su命令轉變為另一用戶的信息。who、last等這些命令可以查看wtmp和sulog的內容
如:Last –f wtmp
我們想查看最近10
次登錄的用戶和他們的地址,可以用如下命令:
  last -10

3、集群管理軟件hacmp的日志

存放路徑:/tmp/hacmp.out

說明:HACMP是IBM提供的確保系統運行可靠性的集群套件,HACMP在每次啟動和關閉時都要經歷一段時間以停止服務和轉換文件系統,我們可以通過對HACMP。OUT日志文件的跟蹤實時的了解HACMP在啟動和關閉時的信息,如出現啟動失敗則可以幫助我們定位錯誤。

   可以使用tail進行跟蹤,tail –f /tmp/hacmp.out

4、系統啟動錯誤日志

存放路徑:/var/adm/ras/bootlog

說明:該日志可以跟蹤系統在Boot過程中發生的問題,包括服務器液晶板上的代碼信息都有記載。可以使用alog命令監視這些問題, 存放在/var/adm/ras/bootlog中,可以使用alog –o –t boot命令查看該文件。

5、FTP用戶操作日志

存放路徑:自定義(建議/tmp/ftplog.out

說明:很多服務器都會用到FTP功能,大量的用戶通過FTP登陸到服務器上給系統的安全性帶來了很大的問題,AIX給我們提供了一套很不錯的可以記錄用戶FTP操作情況的日志。

具體設置步驟如下:

在/etc/inetd.conf文件中編輯 FTP 一行,在FTPD后加“-d”

重啟服務: refresh –s inetd

touch /tmp/ftplog.out

在/etc/syslog.conf文件中加上兩行:

daemon:debug      /tmp/ftplog.out

daemon:info        /tmp/ftplog.out

重啟服務: refresh –s syslogd


  以上只是我在工作中主要用到的一些日志,只是AIX給我們提供了很多其他重要的日志文件中的一部分,大家可以在工作中慢慢體會。

AIX errpt 命令使用

備查


修改當前的日志文件
/usr/lib/errdemon -i /var/adm/ras/myerrlog
修改當前日志文件大小
/usr/lib/errdemon -s 28866

修改當前日志緩沖區大小
/usr/lib/errdemon -B 20480
修改2個重復錯誤之間的間隔時間
/usr/lib/errdemon -t 50

ps -ef | grep errdemon

/usr/lib/errdemon

/usr/lib/errstop
ps -ef | grep errdemon

errpt | more

詳細
errpt -a | pg

以ASCII 方式顯示


errpt -g -j 74533D1A | more

檢查過去24小時內發生的錯誤日志
date

errpt -a -s 0128092102

errclear 命令清除日志記錄
刪除所有日志
errclear 0

刪除10天前的軟件記錄
errclear -d -S 10

 

 

======================

errpt命令

用more或者其他文本的查看命令來打開errlog文件我們看到的只是一對亂碼,為了能夠查看錯誤日志文件需要使用aix的errpt命令。
使用errpt命令查看日志,可能根據使用的參數來確定輸出什么樣的日志,甚至排序的方式,這是使用純文本的日志不能做到的,或者說不能輕易做到的。
下面我們來看errpt命令的使用。
# errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
9DBCFDEE   0109034400 T O errdemon       ERROR LOGGING TURNED ON
192AC071   0109034300 T O errdemon       ERROR LOGGING TURNED OFF
C092AFE4   0109033500 I O ctcasd         ctcasd Daemon Started
A6DF45AA   0109033500 I O RMCdaemon      The daemon is started.
9DBCFDEE   0109033400 T O errdemon       ERROR LOGGING TURNED ON
192AC071   0106130900 T O errdemon       ERROR LOGGING TURNED OFF
369D049B   0106082400 I O SYSPFS         UNABLE TO ALLOCATE SPACE IN FILE SYSTE
這里的輸出分為六列依次為:
1.錯誤標示符IDENTIFIER:並不唯一,由它來確定使用的錯誤模板,顯然同一種錯誤的IDENTIFIER是相同的。
2.時間戳TIMESTAMP:錯誤發生的時間,MMDDhhmmYY,依次表示月日時分年。
3.類型TYPE:錯誤的類型,或者說嚴重的程度。
分為6個:
PEND        設備或功能組件可能丟失 簡寫P
PERF        性能嚴重下降        P
PERM        硬件設備或軟件模塊損壞,確診了的 P
TEMP        臨時性錯誤,經過重試后已經恢復正常        T
INFO        一般消息,不是錯誤                I
UNKN        不能確定錯誤的嚴重性        U
4.種類CLASS c:指出錯誤源
H        硬件或介質故障
S        軟件故障
O        人為錯誤
U        不能確定
5.        資源名RESOURCE_NAME
最初檢測到錯誤的資源名軟件或者硬件,並不代表這個資源有問題,而只是最先在它發現的。
 
errpt -a 報告可能包含下列信息:
 
LABEL    事件的預定義名稱
IDENTIFIER   事件的數字標識符
Date/Time   事件的日期和時間
Sequence Number  事件的唯一編號
Machine ID   系統處理器部件的標識號
Node ID    系統的縮寫名(助記名)
Class    錯誤的一般原因。可能的錯誤類型有:
 H   硬件
 S   軟件
 O   指示性信息
 U   未確定的
Type    發生的錯誤的嚴重性。可能有如下錯誤類型:
 PEND   一個設備或部件將很快喪失其可用性
 PERF   設備或部件的性能已降級至可接受的水平以下
 PERM   不可能恢復的狀況。此類錯誤通常是最嚴重的錯誤,並可能意味着硬件設備或軟件模塊損壞。
   除 PERM 之外的錯誤類型通常不代表一個故障,但可通過診斷程序進行分析。
 TEMP   多次不成功的嘗試之后,被恢復的狀況。此錯誤類型也用來記錄指示性的信息條目,如 DASD 設備的數據傳輸統計。
 UNKN   不能確定錯誤的嚴重性
 INFO   指示性的錯誤日志條目,和不是錯誤的結果
Resource Name   發現錯誤的資源名稱。對於軟件錯誤,這是一個軟件部件、或一個可執行程序的名稱。對於硬件錯誤,這是一個設備、
   或系統部件的名稱。這不表示部件故障、或需要替換。相反,可用來確定用來分析錯誤的適當診斷模塊。
Resource Class   發現故障的資源通用類。(如,disk 設備類)
Resource Type   發現故障的資源類型
Location Code   設備的路徑。可能有多達四個字段,分別涉及 drawer(抽屜)、slot(插槽)、connector(連接器)、port(端口)。
VPD    關鍵產品數據(Vital product data)。該字段的內容是多種多樣的。設備的錯誤日志條目比較典型地,
   返回關於設備廠商、序列號、工程變動級別、只讀存儲器級別等方面的信息。
Description   錯誤的摘要
Probable Cause   列出一些可能導致錯誤的原因
User Causes   列出一些用戶誤操作導致故障的可能原因。
   不正確地插入的磁盤和外部設備(如 modems 和 prints)不能被開啟,就是用戶導致錯誤的例子。
Actions    描述校正用戶導致的錯誤的推薦操作
Install Causes   列出由於不正確的安裝或配置過程而導致故障的可能性原因。
   此類錯誤的例子包含:硬件和軟件不匹配、電纜或線纜連接不正確而松動、不正確地配置系統。
Actions    描述校正安裝導致錯誤的推薦操作
Failure Causes   列出硬件、或軟件可能的缺陷/故障(defect)
Actions    描述校正故障的推薦操作。對於硬件錯誤,會運行診斷程序。
Detailed Data   對於每一個錯誤日志條目都是唯一的故障數據,如設備 sense 數據。
 
比如:
# errpt -aj 4B219AEA|more
---------------------------------------------------------------------------
LABEL:          LVM_GS_CHILDGONE
IDENTIFIER:     4B219AEA
Date/Time:       Wed Dec  5 18:12:31 BEIST 2007
Sequence Number: 1917
Machine Id:      00028057D600
Node Id:         localhost
Class:           U
Type:            PERM
Resource Name:   LIBLVM          
Resource Class:  NONE
Resource Type:   NONE
Location:        
VPD:            
Description
Concurrent LVM daemon forced Volume Group offline
 
Probable Causes
Unrecoverable event detected by Concurrent LVM daemon
Failure Causes
Lost communication with remote nodes
Lost quorum
        Recommended Actions
        Ensure Cluster daemons are running
        CHECK ERROR LOG FOR ADDITIONAL RELATED ENTRIES
        Attempt to bring the Concurrent Volume Group back online
        IF PROBLEM PERSISTS, CONTACT APPROPRIATE SERVICE REPRESENTATIVE
Detail Data
Volume Group ID
0001 CCCD 0000 D600 0000 0114 16BE 3BDC 
MAJOR/MINOR DEVICE NUMBER
0000 0000 
SENSE DATA
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 
Duplicates
Number of duplicates
           1
Time of first duplicate
Wed Dec  5 08:48:00 BEIST 2007
Time of last duplicate
Wed Dec  5 08:48:17 BEIST 2007

 

轉載自:http://blog.sina.com.cn/s/blog_5ded2e5b0100ix7f.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM