淘寶用戶行為分析-數據分析


一、項目目的及數據來源

  該項目基於現代電商行業---以淘寶作為分析標的,多維度分析用戶行為。數據來源於https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1。

二、分析維度

  基於現有的數據以及分析方法,分為四個維度進行分析:

  1.時間維度分析

  以淘寶用戶發生行為的時間,由大到小細化:月份--星期--日--小時,分析行為發生的深層含義,了解用戶在何時會產生大的‘’行為-經濟”效應。

  2.轉化漏斗維度分析

  計算瀏覽-支付轉化率、收藏-支付轉化率、添加購物車-支付轉化率,從用戶的瀏覽到支付行為進行漏斗分析。

  3.商品購買情況分析

  從商品的復購率、平均購買次數、平均購買商品數量等,了解商品在銷售的過程中的數量情況。

  4.對用戶進行分類,利用FRM模型,提高銷售的核心,精准營銷客戶群體。

三、分析項目

  項目分析流程線:提出問題-分析數據含義-數據清洗-建立模型-數據可視化

  1.提出問題

  (1)研究用戶在不同時段的行為規律,找到在不同的周期下的活躍度

  (2)用戶不同行為之間的轉化

  (3)用戶對那些商品分類以及下級商品的購買偏好 

  (4)區分核心價值客戶,調整營銷策略

  2.分析數據含義

  本項目數據來源於阿里巴巴2014年11月18日至12月18日淘寶用戶的真實的商品、行為數據,約有100萬條隨機用戶的行為數據,行為類型包括瀏覽(PV)、收藏、添加購物車、支付。

  數據集字段的含義如下:

  user_id:用戶id

  item_id:商品id

  behavior_type:行為類型(1表示PV,2表示收藏,3表示添加購物車,4表示支付)  

  user_geohash:用戶地理位置

  item_category:商品分類

  date:日期

  buy_hour:行為發生時間

  3.數據清洗

  數據庫采用MYSQL,通過Navicat導入數據。

   

   在Navicat環境下對一系列數據以多維度處理分析,主要分為用戶信息表、重復購買表、用戶行為類型時間點分布表,分別導出到Excel,采用powerquery和powerpivot對數據再次進行二次整合、處理。

  注意:由於user_geohash缺失值較多,會對整體項目產生誤導性,故不分析該維度。

  4.建立模型和可視化

  (1)PV:訪問量,指在網站的頁面瀏覽量或點擊量,每刷新一次就自動疊加。

       

       

   上圖可以明顯看出,在12月12日出現了訪問量激增,出現了峰值,明顯與雙十二的活動有關。可以在活動的前幾天加大投入商品的上架數量和廣告的投入,降低客戶獲取成本。

  (2)UV:獨立訪客量,指一台電腦的IP地址就算一個訪客。

  利用powerpivot 的discount函數對用戶進行不重復計算,結果如下:

    

  同時,采用數據透視表對不同的行為類型分組,得出在不同的行為下用戶的人數,結果如下:

      

  采用powerpivot建立各個表的鏈接關系,計算得出單個用戶支付次數:

    

  上圖可以看到購買次數最多為22次,通過計算,用戶的復購率62%,超過一半的用戶有2次或2次以上的購買行為。

  (3)用戶行為類型之間的轉化漏斗關系

  i.由於收藏和添加購物車沒有相應的承接關系,所以視為平行關系。

  

         

   對於用戶來說,當選擇一件商品收藏或者添加到購物車,都是同等的行為,在順序上是不分先后的,所以在此項目上我們是作為一個相加的階段。由漏斗圖可以明顯的看到,在PV向收藏和添加購物車的數量所占的比例不高,只有5.10%左右的轉化率。同時也有用戶沒有通過收藏和添加購物車直接購買,但比例所占較低。瀏覽頁面的次數較多,但是使用收藏和購物車的功能較少。另一方面,通過收藏和添加購物車的功能實現支付的轉化率高達20.31%,表明了這兩項功能是實現最終轉化的重要環節,商家可在這兩個功能上多做活動,促使用戶成交。

  ii.因為支付是最終目的,從PV、收藏、添加購物車三種前期行為,可以得出每種行為與支付的轉化率。

  

  從計算得出的數據來看,購物車的轉化率最高,收藏的轉化率最低。前面表示這兩張行為是相等的,但是對於用戶消費而言,添加到購物車意味着購買傾向更高,尤其在有活動的時候,用戶直接支付,減少競爭購買時間。

  iii.不同行為的轉化時間

  

  上圖所示,瀏覽到支付的平均轉化時間是最短的,期間少了收藏或者添加購物車的功能,但是所占的比例低。購物車平均轉化時長在27小時左右,比收藏的平均轉化時長還短,結合轉化率,購物車轉化是作為商品成交的一個重要的關鍵點。

  (4)基於時間維度分析用戶的行為規律

  i.基於行為的不同時點分布

  

        

   由上圖可以看出,每天的零點到早上的5點,各種行為數量都是快速下降,達到一天中的最低值。6點到10點處於快速攀升階段,隨后達到一個平穩階段。在下午17點開始,用戶的活躍度快速上升,在晚上的21、22點達到全天的最高值。商家活動可以根據用戶的活躍時間展開。

  ii.基於行為的不同日期分布

       

  

       

       

   上圖所示,在12月12日出現峰值,明顯與雙十二活動有關,添加購物車的行為數量激增,與活動的性質有關。由此可表明,添加購物車是實現支付的重要手段之一。

  iii.用戶行為一周中的時間分布

  

       

   每周的活躍度相對穩定,由於雙十二活動是星期五,出現了支付增加的現象,雙十二前3天出現了添加購物車的行為增多,導致總體的數量比星期五的總量還多。周末的用戶活躍度較為穩定。

  iv.不同月份的用戶行為規律

  

       

   由於數據有超過一半的日期在12月,其次12月還有大型的消費活動,導致11月的各方面行為數據都要比12月低。

  (5)RFM模型:找到核心,精准營銷

  

   

      

   通過RFM模型,實現差異化營銷。數據基本上集中一個月內,所以在客戶分類上處於聯系緊密的。對於價值高的客戶,作為重點客戶關注,保持高質量的服務。價值偏低的客戶,商家可以定期發送相應的優惠信息告知以保持較高的黏度,提高銷售的捆綁率,增加購買的頻率。

  5.結論

   本項目結合MYSQL,Excel,PowerBI多種數據處理方法展現,整個數據集的數據量大約100萬,在數據分析上,針對整個流程做總結,結合業務指標,我們可以借用AAARR模型讓項目更加清晰體現。

  (1)獲取客戶(Aquisition):2014年12月12日是全年特有的大型消費活動,提前一個月推廣大量活動,吸引用戶,電商平台眾多,商家需要做到讓用戶移情到淘寶。同時,我們在時間點上可以看到,晚上21、22點是消費的高峰期,平台展開活動可以選定在這個時間段。

    在用戶獲取上,國內用淘寶的用戶基數龐大,獲取成本降低。老客戶帶動新客戶,利用轉發鏈接加快活動推廣速度,商家通過折扣優惠吸引用戶提前預定商品,利用口碑信譽獲取新客戶。

  (2)提高活躍度(Activation):很多用戶點擊瀏覽的次數很多,但是至關重要的添加購物車和支付所占的比例很低。另一方面是商品本身,比如頁面制作粗糙,在頁面搜索的功能不夠智能,分類不明確等原因會讓用戶喪失使用軟件的興趣。

    改善建議:提高使用頁面的智能化;增加多義詞的搜索;提供同類商品的頁面投放,增加選擇的多樣化;優化商品頁面的關鍵詞提示,讓用戶的第一印象更好。

  (3)提高留存率(Retention):對於一個軟件而言,怎么讓用戶經常使用,最好做到離不開。根據數據分析,可以將客戶分類,重點針對不同類型的客戶做相應的營銷策略。商家可以多利用優惠折扣來留住客戶,再推出新的產品,捆綁銷售,售后服務質量要提高。大多數商家的客服因為與用戶有摩擦使得以后拉入購物黑名單。潛在客戶可以進行信息拜訪,提高用戶的印象度。

  (4)獲取收入(Revenue):根據每周/每月/每季度的復購率,留存率,流失率,廣告投入等因素,對比同類商品的價格,合理定制價格。用戶的購買金額,購買次數,購買偏好在頁面推薦相應的商品。采用適合平台的策略促使用戶有“這個平台有”的觀念。

  (5)傳播(Refer):渠道是傳播的通道,國內有微博、抖音、網上直播等快速傳播渠道,病毒性是一個平台或者是一件商品快速被用戶或者消費者所知的。同時,用戶主動推送給新用戶,新用戶再推送給新用戶,實現快速傳播。

  

  

 

 

 

 

 

  

 

 

 

 

  

  

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM