uplift model學習筆記


一、解決的問題:

  通常的 Propensity Model 和 Response Model 只是給目標用戶打了個分,並沒有確保模型的結果可以使得活動的提升最大化;它沒有告訴市場營銷人員,哪個用戶最有可能提升活動響應;

  因此,需要另外一個統計模型,用來定向那些可以被營銷推廣活動明顯驅動他們偏好響應的用戶,也就是“營銷敏感”用戶;

  Uplift Model的最終目標就是找到最有可能被營銷活動影響的用戶,從而提升活動的反響(r(test)-r(control))、提升ROI、提升整體的市場響應率;

  因此,模型要避免推廣預算花在

  (一)從購買者角度來看:

  (1)自然反應的用戶(即不需要營銷也會來的用戶);(2)頑固不會響應的用戶;

  (二)從流失者的角度來說:

  (1)肯定的用戶;

  (2)因為進行了市場推廣反而流失的用戶;

  (3)沒有意識到是否有這個活動會有什么影響的用戶;(即營銷不敏感的用戶)

二、什么是uplift model ?

  直接為treatment所帶來的影響提升建模;

三、如何進行uplift modeling?(差分響應)

方法(一):

1、建立兩個logistic模型

Logit(Ptest(response|X,treatment =1)) = a+ b*X +c*treatment

Logit(Pcontrol(response|X,treatment=0) ) = a + b*X 

2、將兩個得分相減,計算uplift score

Score = Ptest(response|X,treatment =1) - Pcontrol(response|X,treatment =0)

方法(二):

只用一個模型,但是建立兩個同樣的;

1、Logit(P(reponse|X) = a + b*X + c*treatment + d* treatment *X

2、將兩個得分相減得到uplift score

Score = P(response|X,treatment =1) - P(response|X,treatment =0)

 方法(三):

knn modeling

方法(四):

Naive Bayes

 四、uplift model使用過程中需要注意的問題:

1、訓練樣本

  由於強化學習需要用到的是反饋數據,因此訓練樣本的及時及自動更新會是比較重要的方面(尤其是label的更新和實時特征的更新),才能體現出來強化學習優於機器學習的地方,使用用戶反饋的標注樣本來更新訓練樣本庫,可以使得反饋及時地得到學習,從而優化算法效果;

2、label設計問題

3、問題定義

  uplift的點與運營活動指標完美結合

4、冷啟動策略問題

5、抽樣訓練時樣本有偏的問題

 

 

總結:

   "Where traditional predictive modeling focuses on the outcome, uplift modeling focuses on the effectiveness of the treatment.Then, you can target resources on the cases that are likely to be positively impacted by the treatment."

  Uplift Model 的精髓是,它專注於作用之后效果的提升,因此區分出“營銷/核銷敏感人群”這一步特別重要,也是篩選特征的重要考慮方面;它對ROI結果的優化,不是在於模型設計的復雜,而是在於將ROI的思維策略融入到了模型當中。

  但是其實ROI並不僅僅是提升核銷率,從長遠的營銷價值來說,ROI最優化還需要考慮用戶的終身價值,也就是對用戶所投入的每一分錢,是否對該用戶長遠來看給企業帶來的價值是最大化的。

  Uplift Model對正負樣本的定義就是,with treatment 和 without treatment的時候,是否具有response。

  

上圖就是uplift model的建模假設矩陣。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM