AB實驗人群定向HTE模型2 - Causal Tree with Trigger

本文轉載自查看原文 2019-10-22 10:32 515 ABtest/ HTE/ CausalInference

這篇論文是在 Recursive Partitioning for Heterogeneous Causal Effects 的基礎上加入了兩個新元素：

Trigger：對不同群體的treatment選擇個性化閾值。 E.g優惠券力度，紅包金額
新的Node Penalty: 旨在增強模型generalization

論文

C. Tran and E. Zheleva, “Learning triggers for heterogeneous treatment effects,” in Proceedings of the AAAI Conference on Artificial Intelligence, 2019

模型

Trigger

Trigger的計算主要用在treatment是一個潛在連續變量，例如服葯的劑量，優惠券的金額等等。這時實驗希望得到的不僅是優惠券是否能提升用戶留存，而且是對哪些用戶使用多少金額的優惠券能最大化ROI。
作者在通過樹划分用戶群的同時計算能夠使該用戶群CATE最大化的Trigger閾值。既在遍歷所有特征可能取值的同時遍歷所有treatment的可能取值，取jointly的最優解。如下

\[\begin{align} T = {t_i}&\quad \text{treatment的所有可能取值}\\ \theta_l &\quad \text{最優treatment閾值}\\ F^t(S_l) &= max_{\theta_l}F(S_l)\\ \end{align} \]

小思考
感覺這里對最佳trigger的選擇還有優化的空間。因為上述split假定了實驗效果對treatment的取值是單調的，如果不單調上述split可能得到不make sense的結果。而且在一些應用場景下是希望取到有條件最優解，例如在成本不超過N的情況下收益越高越好，而不是簡單的最大化實驗效果，這個當前也還無法解決。

Node Penalty

在Athey(2016)的Causal Tree中，作者通過在Cost Functino中加入葉節點方差，以及用驗證集估計CATE的方式來解決決策樹過擬合的問題。這里Tran提出的新的penalty旨在衡量相同節點訓練集和驗證機在CATE估計上的差異。

我們先回顧一下要用到的Notation

\[\begin{align} & {(X_i, Y_i,T_i): X_i \in X} \\ & \text{where X是特征，Y是Response，T是AB實驗分組}\\ &T_i \in {0,1} \quad \\ &Y_i = \begin{cases} Y(1) & \quad T_i = 0\\ Y(0) & \quad T_i = 1\\ \end{cases}\\ &CATE: \tau(x) = E(Y_i(1)-Y_i(0)|X=x)\\ \end{align} \]

以下是Athey(2016) Causal Tree的定義

\[\begin{align} &S_l = {(X_i, Y_i,T_i): X_i \in X_l} \quad \text{葉節點-局部樣本}\\ &\hat{\mu_t}(S_l) = \frac{1}{N_{l,t}}\sum_{T_i=t, i \in S_l}Y_i \quad \text{AB組Y的均值} \\ &\hat{\tau}(S_l) = \hat{\mu_1}(S_l) -\hat{\mu_0}(S_l) \quad \text{葉節點CATE}\\ &F(S_l) = N_l * \hat{\tau}^2(S_l)\\ & \text{cost fucntion}: max \sum_{i=1}^L F(S_i)\\ \end{align} \]

作者先把全樣本切分成train, val和test。用訓練集來建樹，用test來估計葉節點variance，penalize小的葉結點帶來的高方差，然后用葉節點上train和val的差異來penalize損失函數,以下\(\lambda\)控制penalty的大小：

\[\begin{align} &penalty = N_L^{val} * |\hat{\tau}(S_l^{val}) -\hat{\tau}(S_l^{train}) | \\ &cost = \frac{(1-\lambda)F(S_l^{train}) - \lambda * penalty}{|N_l^{train} - N_l^{val}| +1}\\ \end{align} \]

小思考
各式各樣解決over-fitting的方法不能說沒有用，但個人認為最終通過Causal Tree得到的特征和特征取值，還是要依據業務邏輯來進行驗證。以及在不同的樣本集上很可能特征取值的變動要超過over-fitting的影響。所以主觀判斷在這里也很重要

其他相關模型詳見AB實驗的高端玩法系列1-實用HTE論文GitHub收藏

歡迎留言～

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 AB實驗人群定向HTE模型1 - Causal Tree AB實驗人群定向HTE模型4 - Double Machine Learning AB實驗人群定向HTE模型5 - Meta Learner AB實驗的高端玩法系列1 - AB實驗人群定向/個體效果差異/HTE/Uplift Model 論文github收藏【定向系列】4：人群包基礎操作指南·上 AB實驗的高端玩法系列2 - 更敏感的AB實驗, CUPED！【定向系列】5：頭條人群包高階玩法，看這篇就夠了 js實現事件模型bind與trigger 實驗二：ICMP重定向攻擊【轉】AB實驗設計思路及實驗落地