原文地址:
http://ask.seowhy.com/article/3784
服務器日志,顧名思義必然是服務器的運營狀態的一種記錄。在了解記錄特性之前 首先要了解其字段記錄的內容。首先來說說iis服務器的log日志的結構
– 日期(date):發出請求的日期。
- 時間(time):發出請求的時間(協調世界時 (UTC))。
- 客戶端 IP 地址(c-ip):發出請求的客戶端的 IP 地址。
- 用戶名(cs-username):訪問服務器的已通過身份驗證的用戶的名稱。匿名用戶用連字符來表示。
- 服務名(s-sitename):滿足請求的站點實例編號。
- 服務器名稱(s-computername):生成日志文件項的服務器的名稱。
- 服務器 IP 地址(s-ip):生成日志文件項的服務器的 IP 地址。
- 服務器端口(s-port):為服務配置的服務器端口號。
- 方法(cs-method):請求的操作,例如 GET 方法。
- URI 資源(cs-uri-stem):操作的統一資源標識符或目標。
- URI 查詢(cs-uri-query):客戶端嘗試執行的查詢(如果有)。只有動態頁面才需要統一資源標識符 (URI) 查詢。
- 協議狀態(sc-status):HTTP 或 FTP 狀態代碼。
- 協議子狀態(sc-substatus):HTTP 或 FTP 子狀態代碼。
- Win32 狀態(sc-win32-status):Windows 狀態代碼。
- 發送的字節數(sc-bytes):服務器發送的字節數。
- 接收的字節數(cs-bytes):服務器接收的字節數。
- 所用時間(time-taken):操作所花費的時間(毫秒)。
- 協議版本(cs-version):客戶端使用的協議版本(HTTP 或 FTP)。
- 主機(cs-host):主機名稱(如果有)。
- 用戶代理(cs(UserAgent)):客戶端使用的瀏覽器類型。
- Cookie (cs(Cookie)):發送或接收的 Cookie 內容(如果有)。
- 引用站點(cs(Referer)):用戶上次訪問的站點。此站點提供與當前站點的鏈接。
根據日志中 #Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status sc-bytes cs-bytes time-taken 字段中的排列順序 可以輕易獲取其下每個字段所對應的意義,然而 apache服務器卻與iis規整的輸入方式相駁。apache並沒有一個#Fileds開頭的字段記錄當前的字段輸出內容 所以相比之下不是很有好。已下為apache中的log日志輸出形式:
106.186.23.21 – - [07/Dec/2013:00:04:48 +0800] “GET /forum/ HTTP/1.0″ 403 208 “http://www.helendoron.com.cn/forum/” “Mozilla/5.0 (Windows NT 5.1; rv:13.0) Gecko/20100101 Firefox/13.0″
其中以空格為分割每個字段,大致的意義如下 訪問ip 空字段(記錄瀏覽者的標識已廢棄) 空字段(記錄瀏覽者進行身份驗證時提供的名字) 訪問時間 記錄服務器收到的請求類型 返回訪問類型404等 下載量 跳轉過來的網址 訪問者的類型
了解了字段類型之后,可以通過字段的類型獲得什么樣的信息呢?其中最最基本的則是蜘蛛扒取的頁面。和訪問者訪問的頁面。而通過我們的各種信息組合,比如訪問時間跟訪問頁面組合 可以查詢出網站點擊的高峰時段,用戶訪問的入口和出口。這比較關鍵,可以分析出網站的優勢。那些頁面比較吸引游客 哪些讓人作嘔,並以此來調整網站的內容。 最后則是通過用戶的ip段和訪問的頁面模擬出用戶的操作習慣。若是分析出了大部分用戶的操作習慣,則可以把網站主打的內容 放置在更為顯眼的地方,對於網站的ui優化也是一大幫助。
作者公告牌
上述內容由 飛鴿牌手拉葫蘆www.wulinfeige.com/ 為您提供 雙鳥電動葫蘆 www.tbmhulu.com/