數據工作-百度統計初體驗


Researsh百度統計,記錄此過程中的點滴和自己的看法

百度統計是什么?
一款專業網站流量分析工具,能夠告訴您訪客是如何找到並瀏覽您的網站,以及如何改善訪客在您網站上的使用體驗。。。。。。不多羅嗦,此處省略N百字
 
帶着一些問題去研究
  • 訪客屬性:通過對您網站頁面的監測,分析訪客行為,刻畫出您網站的訪客屬性,主要包括性別、年齡、職業和學歷四個部分。這個屬性怎么搞出來的,原理是什么?
    答案:訪客屬性是拿着訪客的baiduid去passport那邊獲取的。大概就是passport建立了一套用戶屬性的服務,可以使用baiduid去取,不需要userid。
  • 平均停留時長:訪客瀏覽某一頁面時所花費的平均時長,頁面的停留時長=進入下一個頁面的時間-進入本頁面的時間。那么第一頁如果沒有跳轉是否有平均停留時長?
    答案:根據訪客瀏覽兩個頁面之間的時間間隔來計算頁面停留時間,當訪客訪問一個頁面后沒有再訪問下一個頁面,便無法得知訪客在該頁面的停留時間
  • 忠誠度是什么計算邏輯
    答案:忠誠度就是記錄訪客在一個月內的訪問次數,次數多的忠誠度就高
  • 熱力圖是用戶點擊、鼠標移動得到的熱力分析,還是其他?
    答案:熱力圖監控的是鼠標點擊
  • 異步請求怎么統計
    答案:有JSAPI叫_trackPageview,用於發送某個指定URL的PV統計請求,通常用於AJAX頁面的PV統計。
    詳情還得看官方文檔,地址 http://tongji.baidu.com/open/
  • 百度統計有流量限制嗎?
    答案:不做任何流量限制,目前可穩定支持“每日千萬以上PV”的站點流量統計和分析
  • 百度統計和站內統計數據不一樣是為什么?
    答案:
    a.定義不同。如訪客在未關閉瀏覽器的情況下30分鍾內N次(N>1)訪問網站,百度統計會視為1次訪問
    b.跟蹤技術。有基於瀏覽器Cookie、flash Cookie、IP+用戶代理(基於IP+用戶代理的方式,一般是分析日志文件來獲取數據,但無法排除蜘蛛程序等來源的點擊量,通常會比基於COOKIE的跟蹤方式獲取的流量數據更高)
    c.還有不少不一一列舉,可查看 http://yingxiao.baidu.com/support/tongji/detail_2755.html
 
百度統計不能做什么
  • 不支持添加中文域名
  • 用戶過少時很多報表和數據沒有數,如訪客數據(樣本量過少不足以分析網站的訪客屬性)
  • 不能讓你的站點起死回生...
 
有意思的關鍵點
  • 忠誠度:訪客在您網站上的訪問行為特征分布。通過訪客忠誠度報告,您可以及時了解訪客在您網站的行為規律以及對您網站的忠誠度。 
  • 頁頭訪問次數:訪客抵達網站頁頭的次數。如果您的網站打開速度太慢,或網站內容不吸引人,訪客可能未等頁面完全打開就離開了網站,此時計入頁頭訪問次數,但不計入訪問次數。
  • 訪問時長和最后一頁的關閉時間:百度統計於2012年11月1日起對訪問時長算法進行優化,針對未能收到關閉時間的頁面將采取以下優化方法:  1)  用戶一次訪問中只訪問了一個頁面而該頁面的關閉時間未收到,則系統賦予該頁面一定定值作為訪問時長;  2)  用戶一次訪問中涉及到n(n≥2)個頁面,其中第n個頁面的關閉時間無法收到,則系統將前 (n-1)個頁面的平均訪問時長作為第n個頁面的訪問時長。以上調整會使得平均訪問時長較原來有一定程度的下降,卻更符合用戶真實訪問行為。
  • 訪問深度: 訪客一次訪問會話中瀏覽的不同頁面數
  • 訪問頻次: 訪客一天內在網站上的訪問會話總次數
  • 訪問頁數: 訪客一次訪問會話中的頁面瀏覽量,即同一頁面多次被瀏覽累計
  • 流失率:對指定路徑對應的步驟而言,訪客從該步驟進入到下一個步驟的過程中流失的比例。 本步驟的流失率=(本步驟的進入次數-下一步驟的進入次數)/本步驟的進入次數。
  • 老訪客: 今日之前有過訪問,且今日再次訪問的訪客,記為老訪客。
  • 跳出率:只瀏覽了一個頁面便離開了網站的訪問次數占總的訪問次數的百分比。 子目錄的跳出率是指只瀏覽子目錄中一個頁面便離開的訪問次數占子目錄總訪問次數的百分比。
  • 退出率:為從該頁面跳出網站的瀏覽量的次數占該頁面為下游帶去所有瀏覽量的比
  • 平均停留時長&平均訪問時長&平均訪問頁數&上次訪問時間
  • 新訪客數:訪客中歷史第一次訪問網站的訪客數
  • ip數和uv數不一致:在網吧或者學校等地,是共用一個IP上網的,但是實際訪客數並不唯一,就可能出現IP數小於訪客數;一般家庭電腦大多用ADSL撥號上網,也就是動態的IP 地址,一天可能撥好幾次,但是實際訪客數唯一,便會出現IP數大於uv數
  • 抵達率: 訪問某網站的抵達率=訪問次數/點擊次數。抵達率過低,則說明較多點擊未能抵達網站,需要查看網站url是否正常打開,速度是否夠快。
 
 
百度統計的基友
 
  • 百度指數:以百度網頁搜索和百度新聞搜索為基礎的免費海量數據分析服務,用以反映不同關鍵詞在過去一段時間里的“用戶關注度”和“媒體關注度”。您可以發現、共享和挖掘互聯網上最有價值的信息和資訊,直接、客觀地反映社會熱點、網民的興趣和需求。
  • 百度推廣:向企業提供的 按效果付費‍ 的網絡營銷服務,借助百度超過 80%‍ 中國搜索引擎市場份額和 60萬家 聯盟網站,打造了鏈接億萬網民和企業的供需平台,讓有需求的人最便捷地找到適合自己的產品和服務,也讓企業用少量投入就可以獲得大量潛在客戶、有效提升企業品牌影響力。
 
可借鑒的關鍵點
  • 維度分的比較細,可以得到更好的數據挖掘與分析
  1. 操作系統
  2. 地域分布
  3. 瀏覽器分布&搜索詞分布
  4. 搜索引擎分布
  5. 其他來源分布(如直接訪問、站內來源、其他網站)
  6. 屏幕分辨率分布
  7. 按小時/天/周/月分布
  8. 是否支持COOKIE
  9. 是否支持JAVA
  10. 網絡服務提供商
  11. 語言環境
 
  • 一次訪問(Session)的定義
訪客在您網站上的會話(Session)次數,一次會話會瀏覽一個或多個頁面。在百度統計里,以下三種情況會記為新的訪問:
  1. 訪客關閉瀏覽器后重新進入您的網站;
  2. 訪客不關閉瀏覽器,但是在您網站上不活動超過30分鍾,30分鍾后訪客再次點擊您網站上的鏈接;
  3. 訪客任何時候從其他網站到達您的網站。
就是某個頁面在一次會話中被多次訪問,只會計算一次pv。
  • 趨勢分析
一段時間內您網站的整體流量及轉化情況,您也可以選擇地域與來源組合查詢細分來源的流量數據
 
 
  • 最后一頁的關閉時間的計算方法
  1. 用戶一次訪問中只訪問了一個頁面而該頁面的關閉時間未收到,則系統賦予該頁面一定定值作為訪問時長;
  2. 用戶一次訪問中涉及到n(n≥2)個頁面,其中第n個頁面的關閉時間無法收到,則系統將前 (n-1)個頁面的平均訪問時長作為第n個頁面的訪問時長。
     以上調整會使得平均訪問時長較原來有一定程度的下降,卻更符合用戶真實訪問行為。
 
 
簡單總結
     百度統計所提供的多種圖形化報表還是不錯的,雖然有些flash讓我不爽:)
     有很多有意思的定義值得借鑒和學習,如頁面關閉時間的計算方法、pv計算的方法。
     后續ASAE平台會借鑒其經驗,如趨勢分析、訪問深度分析等等。
     
 
     有人問我數據分析有什么用,我會告訴他:“不能起死回生,可能錦上添花”。
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM