推薦系統技術演進趨勢:召回->排序->重排


導讀:推薦系統技術,總體而言,與 NLP 和圖像領域比,發展速度不算太快。不過最近兩年,由於深度學習等一些新技術的引入,總體還是表現出了一些比較明顯的技術發展趨勢。這篇文章試圖從推薦系統幾個環節,以及不同的技術角度,來對目前推薦技術的比較彰顯的技術趨勢做個歸納。個人判斷較多,偏頗難免,所以還請謹慎參考。

在寫技術趨勢前,照例還是對推薦系統的宏觀架構做個簡單說明,以免讀者迷失在技術細節中。

 

 

 

 

實際的工業推薦系統,如果粗分的化,經常講的有兩個階段。首先是召回,主要根據用戶部分特征,從海量的物品庫里,快速找回一小部分用戶潛在感興趣的物品,然后交給排序環節,排序環節可以融入較多特征,使用復雜模型,來精准地做個性化推薦。召回強調快,排序強調准。當然,這是傳統角度看推薦這個事情。

但是,如果我們更細致地看實用的推薦系統,一般會有四個環節,--召回---粗排--精排--重排

 

實際的工業推薦系統,如果粗分的化,經常講的有兩個階段。首先是召回,主要根據用戶部分特征,從海量的物品庫里,快速找回一小部分用戶潛在感興趣的物品,然后交給排序環節,排序環節可以融入較多特征,使用復雜模型,來精准地做個性化推薦。召回強調快,排序強調准。當然,這是傳統角度看推薦這個事情。

但是,如果我們更細致地看實用的推薦系統,一般會有四個環節,如下圖所示:

 

 

 

 

傳統的標准召回結構一般是多路召回,如上圖所示。如果我們根據召回路是否有用戶個性化因素存在來划分,可以分成兩大類:一類是無個性化因素的召回路,比如熱門商品或者熱門文章或者歷史點擊率高的物料的召回;另外一類是包含個性化因素的召回路,比如用戶興趣標簽召回。我們應該怎么看待包含個性化因素的召回路呢?其實吧,你可以這么看,可以把某個召回路看作是:單特征模型排序的排序結果。意思是,可以把某路召回,看成是某個排序模型的排序結果,只不過,這個排序模型,在用戶側和物品側只用了一個特征。比如說,標簽召回,其實就是用用戶興趣標簽和物品標簽進行排序的單特征排序結果;再比如協同召回,可以看成是只包含 UID 和 ItemID 的兩個特征的排序結果….諸如此類。我們應該統一從排序的角度來看待推薦系統的各個環節,這樣可能會更好理解本文所講述的一些技術。

如果我們換做上面的角度看待有個性化因素召回路,那么在召回階段引入模型,就是自然而然的一個拓展結果:無非是把單特征排序,拓展成多特征排序的模型而已;而多路召回,則可以通過引入多特征,被融入到獨立的召回模型中,找到它的替代品。如此而已。所以,隨着技術的發展,在 embedding 基礎上的模型化召回,必然是個符合技術發展潮流的方向。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM