本文介紹CTR相關基礎知識。
一、廣告投放系統

廣告系統包含多個子系統。除了上圖所示的廣告投放系統外,還包含商業系統(廣告庫的獲得),統計系統(點擊展示日志的獲得)等。
廣告投放系統主要是面向用戶的,交互邏輯就是用戶請求一個網頁之后,會想檢索系統請求廣告,然后檢索系統從廣告庫中獲取一個廣告列表,進行特征抽取之后進行點擊率預估,排名靠前的展示給 用戶。然后根據用戶的點擊情況獲得展示點擊日志,之后進行線 下的模型訓練學習。之前的廣告投放系統分為線上系統和線下模型訓練系統,現在出現的一種是在線學習,即用戶的操作能夠實時的影響到模型。
二、CTR與CTR預估
2.1 CTR的計算
幾個基本概念:

展示問題:
為了客觀公正,應該確定用戶真正看到廣告。為了最大程度的公正,對於位置好的廣告,一次請求就記為一次展示;對於位置不好的,比如在網頁下面的,采用埋點,用戶滑到網頁底部才算一次展示(一般就是一段js代碼實現)
點擊問題:
怎么確定用戶點沒點廣告呢?
主要有兩種方法:
- 重定向

- 行為上報(主要用於第三方統計)

2.2 CTR的作用
- 競價排序: 一方面依賴於價格,一方面依賴於CTR

ps:cpc為每次點擊的收費
- 競價收費:(廣義第二價格競價)

這樣收費的原因是:一方面有利於廣告主拔高價格。不然的話比如現在AB兩個廣告主A出3元 B出5元,那么會刺激B只出3.1就拿到這個廣告。
另一方面有利於優化點擊率。
程序化購買依據:

關於DSP SSP Ad Exchange的介紹
作者:陳叨叨 鏈接:https://www.zhihu.com/question/23458646/answer/25535257 來源:知乎 著作權歸作者所有,轉載請聯系作者獲得授權。 其實很簡單,舉個例子就明白了。 Nike 公司想在網上打廣告推出自己的一款新鞋子,目標客戶是20歲左右的男性大學生。推廣過程包含4個方面: 1. 確認推廣渠道: 確定男大學生喜歡上的網頁 比如:新浪體育,人人網,還有一些小型的論壇。 2. 確認目標客戶屬性:男性20歲大學生 3. 制作推廣材料:廣告banner 4. 購買廣告位置 對於新浪體育而言,他家網頁有很多可以打廣告的位置,一個一個去賣太麻煩了,他們就將這些廣告位統一放入了Ad Exchange平台(相當於在賣廣告位的”菜市場“里面擺了個攤位),通過SSP對菜市場里面擺放的廣告位進行布局管理,更好的將“菜=廣告位置”賣出去,所以叫SSP(Sell-side Platform銷售方平台)。 對於Nike而言,他們通過DSP來到這個菜市場(Ad Exchange),RTB幫助他們計算怎么在有限的預算下買更多更符合推廣要求的菜。所以DSP是想打廣告的,對廣告位置有購買需求的公司使用的,叫(Demand-side Platform需求方平台)。 “菜”在這里就是指符合“男性20歲大學生”條件的cookie,每個人瀏覽網頁的歷史都會被電腦記錄下來,形成cookie。由於cookie是匿名的(不記錄瀏覽者的個人信息)所以有第三方的一些數據公司將cookie導入自己的系統里面分析,匹配上系統里面已知的個人信息如性別,地理位置,年齡等后,再將這個cookie導入到這個菜市場(Ad Exchange),相當於給每種菜都放了一個介紹在旁邊(山西大白菜),這些公司被稱為Data supplier。 這種購買的行為是每分每秒鍾都在發生的,當一個符合條件的“男性20歲大學生”准備打開網頁A時,cookie就被放在了菜市場,Nike看到后即可后買,然后將將制作好的廣告banner展現在這個網頁上,整個過程大約需要0.4秒,所以瀏覽者是完全感受不到的。與此同時又有無數個符合條件的cookie在瀏覽無數個網頁,所以需要實時競標,即讓電腦自動幫你買入需要的“菜”,,從而產生了RTB(Real-time bidding),一般說來RTB僅僅是DSP平台的一個功能。
半個小時讀懂互聯網廣告新生態 http://socialbeta.com/t/china-programmatic-advertising-landscape.html
之所以用CTR作為排序和競價的核心,是因為CTR是用戶、廣告主、媒體三方利益的交叉點。
2.3 CTR預估:預測CTR


三、CTR預估評價指標
3.1 離線指標
3.1.1 LogLoss
衡量預測准不准確

(p是真實分布,q是預測分布)


3.1.2 AUC
衡量把正樣本排在負樣本前邊的能力
參考之前介紹:http://www.cnblogs.com/futurehau/p/6109772.html
3.2 在線指標
3.2.1 CPM
每千次點擊帶來多少錢
3.2.2CPC
每次點擊扣廣告主多少錢

