JData大數據競賽18年賽題-如期而至-用戶購買時間預測


年前做的,也是學習別人的作品作為記錄

 

一、賽題

  

表1:sku基本信息表(jdata_sku_basic_info)

 

 

 

 

表2:用戶基本信息表(jdata_user_basic_info)

 

 

 

 

 

表3:用戶行為表(jdata_user_action)

 

 

 

 

 

 

表4:用戶訂單表(jdata_user_order)

 

 

 

 

 

表5:評論分數數據表(jdata_user_comment_score)

 

 

 

 

數據說明:

 

 

 

任務:

根據提供的數據,預測未來一個月內最有可能購買目標品類的用戶,並預測首次購買日期

 

 

二、思路

  1.提取數據及預處理        data_load.py

    ①加載數據

    ②將日期轉為pandas形式,處理分別得到年月日

    ③統計訂單評價等級和次數

    ④得到三個dataframe

Jdata_user_order:user_id,sku_id,o_id,o_date,o_area,o_sku_num,o_date_y,o_date_m,           o_date_d,price,cate,para_1,para_2,para_3,score_level_1_count,score_level_2_count,

        Score_level_3_count,cost

Jdata_user_action:user_id,sku_id,a_date,a_num,a_type,a_date_y,a_date_m,a_date_d,price,cate,para_1,para_2,para_3

 

Jdata_user_basic_info:user_id,age_-1,age_1,age_2,age_3,age_4,age_5,age_6,sex_0,sex_1,sex_2,user_lv_cd_1, user_lv_cd_2, user_lv_cd_3, user_lv_cd_4, user_lv_cd_5

    ⑤特征選擇     feat_main.py  feature.py

 


參考特征:

與購買相關的特征:

訂單數/商品數/商品種類/購買次數/有購買行為的天數/有購買行為的月數

與瀏覽和收藏相關的特征:

行為(瀏覽或收藏)商品數/行為(瀏覽或收藏)商品種類/行為(瀏覽或收藏)天數/收藏商品數/收藏商品種類/有收藏行為的天數

地理信息:

用戶下單過的地點數/用戶訂單數最大的地點編號

參數信息:

用戶所購買商品price/para1/para2/para3的最大值最小值平均值中位數

用戶花費:

用戶的總花費

用戶購買集中度:

用戶購買集中度=購買的商品次數/購買的商品種類

用戶商品忠誠度:

用戶購買同一sku的最大次數

用戶購買轉化率:

用戶購買轉化率=用戶購買的商品種類/用戶有行為(瀏覽或收藏)的商品種類

日期特征:

購買的最小的day/最大的day/平均的day

近3個月/5個月 月首購買日期的最大、最小、平均、中位數

 

三、代碼

不知道博客園怎么上傳文件,zzz

先不上傳了


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM