注:由於文章篇幅有限,獲取資料可直接掃二維碼,更有深受好評的大數據實戰精英+架構師好課等着你。
大數據技術交流QQ群:207540827
速點鏈接加入高手戰隊:http://www.dajiangtai.com/course/112.do
項目概述
某電商平台擬對電商網站的各種行為數據進行分析(業務過程包括訪問、瀏覽、購買、支付等),輔助產品經理和管理人員了解產品現有情況,並持續改進產品設計,制定和調整公司戰略目標,進而達到提升公司業績的目標。
業務數據庫和上報到服務器的埋點日志數據會經過數據采集、清洗、存儲、分析、可視化這一完整流程,通過對海量用戶行為數據的分析,可以幫助電商網站找到網站的優化思路,從而在海量用戶數據的基礎上對網站進行改進和完善。
項目需求分析
用戶session統計
用戶在電商網站上有很多行為,每一次行為操作稱之為一個action,本項目中我們關注如下四種用戶行為:
(1)點擊
(2)搜索
(3)下單(購買)
(4)支付
session就是某個時間某個用戶從進入網站開始,做了大量的操作(多個action),最后離開/關閉瀏覽器/不過任何動作導致超時的過程。該需求主要是對session進行統計,包括:(1)session聚合指標
(2)按時間隨機抽取session
(3)按天統計點擊、下單、購買top 10品類
(4)top10品類中排名前10的session
區域熱門商品統計
按天統計出各個區域top 3熱門商品。主要幫助管理者了解不同區域商品的整體情況,從而對商品相關戰略調整提供依據。可基於Hive或者Flink SQL實現。
廣告流量實時統計
電商網站/app一般會接入第三方廣告平台,這也是電商平台的核心收入來源之一。廣告招商完成后,廣告主的廣告會在網站/app的某些廣告位上發布,用戶訪問網站/app會曝光該廣告,用戶可能會點擊改廣告。電商網站可以按照曝光量、點擊量等方式來收費。
統計廣告流量實時數據,讓高管和產品經理實時掌握各種廣告投放效果,便於調整廣告投放戰略和策略,並進行優化,以最大化廣告收益。本模塊分析的廣告流量主要包括曝光量和點擊量:
(1)各城市廣告曝光量和點擊量統計
(2)各區域每個廣告實時點擊流統計
(3)各區域top 3點擊量廣告統計
實時方案設計
數據處理流程設計
由於文章篇幅有限,獲取資料可直接掃二維碼。
大數據技術交流QQ群:207540827