一:項目場景
1.需求分析
根據用戶行為數據進行程序的處理,得到結果保存到關系型數據庫中
需要收集用戶(系統使用者)在不同客戶端上產生的用戶行為數據,最終保存到hdfs上
需要明確收集字段的相關信息,而且需要考慮到后期的新需求的提出
總:收集不同客戶端的用戶行為數據,通過mr、hive進行數據分析處理,將分析結果數據保存到關系型數據庫中
2.場景一

二:核心關注點
1.核心關注點
購買率
購買的人數/總人數 購買的人數/查看該商品的總人數
復購率
n次購買的人數 / n-1次購買的人數(n>=2)
訂單數量、訂單金額、訂單的類型
成功訂單數量、成功訂單金額、成功訂單的類型
退款訂單數量、退款訂單金額、退款訂單的類型
訪客/會員數量
訪客轉會員的比率
SEM效果(廣告推廣效果)
網站內容相關的一個分析(網站的跳出率、頁面的跳出率)
三:重要概念
1.訪客
標示訪問網站指定用戶、一般稱為自然人
區分PC,手機:
)PC:
采用IP地址區分訪客。由於NAT、代理等等,面臨一個問題:一個IP地址對應多個訪客, 但是實現簡單
采用客戶端種植cookie的方式,當用戶第一次訪問系統的時候,在客戶端的cookie中保存一個唯一uuid標識符,將過期時間設置為10年
)手機
采用設備的固定識別碼,比如:IMEI、MEID.....
如果設備是比較差的,或者進行過刷機操作,這些識別碼可能會出現誤差,多個設備對應一個識別碼
類似於pc端的種植cookie的方式,在用戶第一次訪問系統的時候,在磁盤中寫入一個唯一標識符
指標:
)新增訪客:第一次訪問系統的訪客數量
)活躍訪客數量:統計的是給定時間段內訪問過系統的訪客數量(老訪客+新訪客)
)總訪客數量:迄今為止,訪問過系統的訪客總數量
)流失訪客數量:上一個時間段內訪問過系統,但是當前時間段內沒有訪問系統的訪客數量
)回流訪客數量:上一個時間段內沒有訪問過系統,但是當前時間段內訪問過系統的訪客數量
2.會員
指業務系統中注冊用戶、直接使用業務系統中會員標識符id來表示
標示當訪問者登錄我們的系統后,就成為一個會員,但是此時該訪問者還是訪客
統計指標:
)新增會員:第一次登錄系統的會員數量
)活躍會員數量:統計的是給定時間段內登錄過系統的會員數量(老會員+新會員)
)總會員數量: 迄今為止,新增會員數量的總和
)回流會員
)流失會員
)訪客轉會員比率
)新增訪客轉會員的比率
3.會話(案例在下面)
用戶進入到系統到離開系統這一段時間被成為會話,這段時間的會話時間長度就叫做會話長度,一個會話中的所有操作都屬於同一個會話
區分會話
)PC端:
采用瀏覽器的session機制(SessionStorage、Cookie Session)
在cookie中存儲一個操作時間,在操作的時候,進行判斷時間是否過期,如果過期,產生一個新的會話,如果沒有過期,更新操作時間
)移動端:
采用移動端的session機制
類似pc端種植cookie的方式,在磁盤中寫入一個時間進行判斷
指標:
會話長度
會話數量
跳出會話的數量:在一個會話中,只訪問過一次網站的會話數量
4.跳出率
指標:
會話跳出率:跳出會話/總會話數量
頁面跳出率
從該頁面離開后,進入到其他頁面的會話數量占進入該頁面會話數量的百分比
-1. 離開系統的會話數量 / 進入該頁面的會話數量
-2. 進入詳情頁面的會話數量 / 進入該頁面的會話數量
5.外鏈
不同外鏈帶來的會話數量/訪客數量/訂單數量
6.pv
7.uv
8.獨立IP
9.DEPth view
訪問深度,訪問了多少頁面
統計的是各個不同訪問深度中的訪客/會話數量
DV展示的是一個網站內容整體上對用戶的吸引程度,結合跳出率,能夠更改的修改網站內容,增加網站的黏性,增加網站的友好性
四:維度
操作系統維度: 操作系統名稱、操作系統版本
語言維度:
外鏈維度:百度、360、google等等
支付方式維度:alipay、weixin、銀行卡支付....
貨幣類型維度:
商鋪維度
版本維度: 比如v1, v2等等,一般用於多個版本之間進行數據比較(AB測試)
以及:

五:分析
維度+核心點+重要概念
六:項目結構
1.整體
)用戶數據基本分析模塊
)瀏覽器分析模塊
)地域分析模塊
)外鏈分析模塊
)用戶瀏覽深度分析模塊
)事件分析模塊
)訂單分析模塊

2.用戶基本數據

3.瀏覽器分析

4.地域分析

5.用戶深度分析

6.外鏈分析

7.訂單分析

8.事件分析

