廣告點擊率預估中貝葉斯平滑


廣告點擊率預估是一個非常經典的轉化率預估問題,在互聯網時代,廣告作為互聯網公司盈利的一種重要手段或方法,而廣告又分為很多種(這部分的知識可以課后腦補一下),今天主要講下在計算廣告當中,競價廣告涉及到的ctr預估遇到的平滑問題。這里先解釋一下競價廣告:簡單講來就是廣告主需要在媒體投放平台投放廣告,而媒體需要通過多個廣告主競價,價高者得的方式來獲取利潤。而這里主要介紹兩種競價方式:1、CPM方式,2、CPC方式;

CPM方式是按照千次展示固定的價格來收費,這里實際上不涉及競價。而CPC是根據廣告主出的低價,乘以ctr;再乘以1000得到一個最終的價格。

所以這里的ctr預估對於廣告主來說是非常重要的,如果ctr預估過高,導致投放成本很快用完,無法達到預期投放目標;而ctr預估過低,就無法得到曝光展示機會。

而CTR預估中,ctr平滑就是一個非常重要的過程:下面首先來講講貝葉斯平滑是個什么東西

1、貝葉斯平滑假設前提

當某個廣告曝光給到用戶,用戶點擊或者不點擊是服從二項分布:(通俗的理解,所謂二項分布就是n次伯努利概率分布)伯努利分布就是用戶是否點擊廣告服從伯努利分布。即

所以某個廣告點擊率CTR可以理解成,n個用戶是否點擊廣告的概率分布,而用戶是否點擊廣告服從伯努利分布,n個用戶,則該廣告的點擊率是符合二項分布,轉化成最大似然估計。則是n個用戶是否點擊該廣告的概率最大即為轉化率。

而為了求得這個最大似然估計,通過利用用戶的歷史數據作為先驗概率,利用貝葉斯原理,預估出后驗概率。這里我們用廣告的轉化率CTR對應期望作為目標函數,則對應損失函數如下所示:

r表示根據歷史得到先驗概率期望,^r表示真實概率期望。即使得L(^r,r)最小。然后我們就得到這個東西

 而上式中,對於點擊次數,服從的是二項分布,即f(C,I|r)Bin(r)f(C,I|r)∼Bin(r)。二項分布的共軛先驗是Beta分布。Beta分布我理解是表示正負樣本真實概率的一個分布,其中有兩個參數,a和b,分別表示正樣本個數,和負樣本個數。也可以將CTR理解成是一個服從Bate分布的。於是我們就得到下面的轉化率結果:

 

貝葉斯平滑參數計算:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM