推薦系統技術演進趨勢：召回->排序->重排

本文轉載自查看原文 2020-01-13 18:43 2883

導讀：推薦系統技術，總體而言，與 NLP 和圖像領域比，發展速度不算太快。不過最近兩年，由於深度學習等一些新技術的引入，總體還是表現出了一些比較明顯的技術發展趨勢。這篇文章試圖從推薦系統幾個環節，以及不同的技術角度，來對目前推薦技術的比較彰顯的技術趨勢做個歸納。個人判斷較多，偏頗難免，所以還請謹慎參考。

在寫技術趨勢前，照例還是對推薦系統的宏觀架構做個簡單說明，以免讀者迷失在技術細節中。

實際的工業推薦系統，如果粗分的化，經常講的有兩個階段。首先是召回，主要根據用戶部分特征，從海量的物品庫里，快速找回一小部分用戶潛在感興趣的物品，然后交給排序環節，排序環節可以融入較多特征，使用復雜模型，來精准地做個性化推薦。召回強調快，排序強調准。當然，這是傳統角度看推薦這個事情。

但是，如果我們更細致地看實用的推薦系統，一般會有四個環節，--召回---粗排--精排--重排

但是，如果我們更細致地看實用的推薦系統，一般會有四個環節，如下圖所示：

：

傳統的標准召回結構一般是多路召回，如上圖所示。如果我們根據召回路是否有用戶個性化因素存在來划分，可以分成兩大類：一類是無個性化因素的召回路，比如熱門商品或者熱門文章或者歷史點擊率高的物料的召回；另外一類是包含個性化因素的召回路，比如用戶興趣標簽召回。我們應該怎么看待包含個性化因素的召回路呢？其實吧，你可以這么看，可以把某個召回路看作是：單特征模型排序的排序結果。意思是，可以把某路召回，看成是某個排序模型的排序結果，只不過，這個排序模型，在用戶側和物品側只用了一個特征。比如說，標簽召回，其實就是用用戶興趣標簽和物品標簽進行排序的單特征排序結果；再比如協同召回，可以看成是只包含 UID 和 ItemID 的兩個特征的排序結果….諸如此類。我們應該統一從排序的角度來看待推薦系統的各個環節，這樣可能會更好理解本文所講述的一些技術。

如果我們換做上面的角度看待有個性化因素召回路，那么在召回階段引入模型，就是自然而然的一個拓展結果：無非是把單特征排序，拓展成多特征排序的模型而已；而多路召回，則可以通過引入多特征，被融入到獨立的召回模型中，找到它的替代品。如此而已。所以，隨着技術的發展，在 embedding 基礎上的模型化召回，必然是個符合技術發展潮流的方向。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。