推薦算法(1)——推薦算法的經典套路


0、參考文獻

https://mp.weixin.qq.com/s/XD6qFpt8FdLTy2PcrLiTIA

1、 推薦算法套路

(1)排序模型一般都衍生自Google的Wide & Deep模型,有一個淺層模型(LR或FM)負責記憶,DNN負責擴展

(2)特征一般都采用類別特征。畫像、用戶歷史天然就是高維、稀疏的類別特征。對於實數型特征,比如用戶、物料的一些統計指標,在我的實踐中,也通過分桶,先離散化成類別特征,再接入模型

(3)每個類別特征經過Embedding變成一個向量,以擴展其內涵。

(4)屬於一個Field的各Feature Embedding需要通過Pooling壓縮成一個向量,以減少DNN的規模

(5)多個Field Embedding拼接在一起,喂入DNN

(6)DNN通過多層Fully Connection Layer (FC)完成特征之間的高階交叉,增強模型的擴展能力。

2、關鍵點

  • 記憶與擴展是推薦算法兩大經典、永恆的主題。如何實現擴展?靠的是Embedding和特征之間的交叉。
  • Embedding化“精確匹配”為“模糊查找“,大大提升了推薦算法的擴展能力,是”深度學習應用於推薦系統“的基石
  • 高維、稀疏的類別特征是推薦系統中的一等公民。為了彌補單個類別特征表達能力弱的問題,需要Embedding擴展其內涵,需要交叉擴展其外延。
  • 高維特征空間直接接入DNN,會引發參數規模的膨脹。為解決這一難題,Field & Pooling應運而生。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM