090實戰 Hadoop離線項目介紹(不包括程序)


一:項目場景

1.需求分析

  根據用戶行為數據進行程序的處理,得到結果保存到關系型數據庫中
  需要收集用戶(系統使用者)在不同客戶端上產生的用戶行為數據,最終保存到hdfs上
  需要明確收集字段的相關信息,而且需要考慮到后期的新需求的提出

  總:收集不同客戶端的用戶行為數據,通過mr、hive進行數據分析處理,將分析結果數據保存到關系型數據庫中

 

2.場景一

  

 

二:核心關注點 

1.核心關注點

  購買率
    購買的人數/總人數 購買的人數/查看該商品的總人數
  復購率
    n次購買的人數 / n-1次購買的人數(n>=2)
  訂單數量、訂單金額、訂單的類型
  成功訂單數量、成功訂單金額、成功訂單的類型
  退款訂單數量、退款訂單金額、退款訂單的類型
  訪客/會員數量
  訪客轉會員的比率
  SEM效果(廣告推廣效果)
  網站內容相關的一個分析(網站的跳出率、頁面的跳出率)

 

三:重要概念

1.訪客

  標示訪問網站指定用戶、一般稱為自然人

 

  區分PC,手機:

  )PC:

    采用IP地址區分訪客。由於NAT、代理等等,面臨一個問題:一個IP地址對應多個訪客, 但是實現簡單

    采用客戶端種植cookie的方式,當用戶第一次訪問系統的時候,在客戶端的cookie中保存一個唯一uuid標識符,將過期時間設置為10年

  )手機   

    采用設備的固定識別碼,比如:IMEI、MEID.....
      如果設備是比較差的,或者進行過刷機操作,這些識別碼可能會出現誤差,多個設備對應一個識別碼
     類似於pc端的種植cookie的方式,在用戶第一次訪問系統的時候,在磁盤中寫入一個唯一標識符

 

  指標:

  )新增訪客:第一次訪問系統的訪客數量
  )活躍訪客數量:統計的是給定時間段內訪問過系統的訪客數量(老訪客+新訪客)
  )總訪客數量:迄今為止,訪問過系統的訪客總數量
  )流失訪客數量:上一個時間段內訪問過系統,但是當前時間段內沒有訪問系統的訪客數量
  )回流訪客數量:上一個時間段內沒有訪問過系統,但是當前時間段內訪問過系統的訪客數量

 

2.會員

  指業務系統中注冊用戶、直接使用業務系統中會員標識符id來表示
  標示當訪問者登錄我們的系統后,就成為一個會員,但是此時該訪問者還是訪客
  統計指標:
   )新增會員:第一次登錄系統的會員數量
  )活躍會員數量:統計的是給定時間段內登錄過系統的會員數量(老會員+新會員)
  )總會員數量: 迄今為止,新增會員數量的總和
  )回流會員
  )流失會員
  )訪客轉會員比率
  )新增訪客轉會員的比率

 

3.會話(案例在下面

  用戶進入到系統到離開系統這一段時間被成為會話,這段時間的會話時間長度就叫做會話長度,一個會話中的所有操作都屬於同一個會話

  區分會話

  )PC端:
    采用瀏覽器的session機制(SessionStorage、Cookie Session)
    在cookie中存儲一個操作時間,在操作的時候,進行判斷時間是否過期,如果過期,產生一個新的會話,如果沒有過期,更新操作時間
  )移動端:
    采用移動端的session機制
    類似pc端種植cookie的方式,在磁盤中寫入一個時間進行判斷

  指標:

    會話長度
    會話數量
    跳出會話的數量:在一個會話中,只訪問過一次網站的會話數量

 

4.跳出率

  指標:  

  會話跳出率:跳出會話/總會話數量
  頁面跳出率
    從該頁面離開后,進入到其他頁面的會話數量占進入該頁面會話數量的百分比
      -1. 離開系統的會話數量 / 進入該頁面的會話數量
      -2. 進入詳情頁面的會話數量 / 進入該頁面的會話數量

 

5.外鏈

  不同外鏈帶來的會話數量/訪客數量/訂單數量

 

6.pv

 

7.uv

 

8.獨立IP

 

9.DEPth view

  訪問深度,訪問了多少頁面
  統計的是各個不同訪問深度中的訪客/會話數量
  DV展示的是一個網站內容整體上對用戶的吸引程度,結合跳出率,能夠更改的修改網站內容,增加網站的黏性,增加網站的友好性

 

四:維度

  操作系統維度: 操作系統名稱、操作系統版本
  語言維度:
  外鏈維度:百度、360、google等等
  支付方式維度:alipay、weixin、銀行卡支付....
  貨幣類型維度:
  商鋪維度
  版本維度: 比如v1, v2等等,一般用於多個版本之間進行數據比較(AB測試)

  以及:

  

 

五:分析

  維度+核心點+重要概念

 

六:項目結構

1.整體

  )用戶數據基本分析模塊

  )瀏覽器分析模塊

  )地域分析模塊

  )外鏈分析模塊

  )用戶瀏覽深度分析模塊

  )事件分析模塊

  )訂單分析模塊

 

 

2.用戶基本數據

  

3.瀏覽器分析

  

4.地域分析

  

5.用戶深度分析

  

 

6.外鏈分析

  

7.訂單分析

  

8.事件分析

  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM