原文:推薦系統系列(一):FM理論與實踐

背景 在推薦領域CTR click through rate 預估任務中,最常用到的baseline模型就是LR Logistic Regression 。對數據進行特征工程,構造出大量單特征,編碼之后送入模型。這種線性模型的優勢在於,運算速度快可解釋性強,在特征挖掘完備且訓練數據充分的前提下能夠達到一定精度。但這種模型的缺點也是較為明顯的: 模型並未考慮到特征之間的關系 y w sum i n ...

2019-10-03 15:17 0 417 推薦指數:

查看詳情

推薦系統系列(三):FNN理論實踐

背景 在FM之后出現了很多基於FM的升級改造工作,由於計算復雜度等原因,FM通常只對特征進行二階交叉。當面對海量高度稀疏的用戶行為反饋數據時,二階交叉往往是不夠的,三階、四階甚至更高階的組合交叉能夠進一步提升模型學習能力。如何能在引入更高階的特征組合的同時,將計算復雜度控制在一個可接受的范圍內 ...

Tue Oct 29 22:36:00 CST 2019 0 2434
推薦系統系列(四):PNN理論實踐

背景 上一篇文章介紹了FNN [2],在FM的基礎上引入了DNN對特征進行高階組合提高模型表現。但FNN並不是完美的,針對FNN的缺點上交與UCL於2016年聯合提出一種新的改進模型PNN(Product-based Neural Network)。 PNN同樣引入了DNN對低階特征進行組合 ...

Fri Nov 01 19:21:00 CST 2019 0 419
推薦系統系列(五):Deep Crossing理論實踐

背景 特征工程是繞不開的話題,巧妙的特征組合也許能夠為模型帶來質的提升。但同時,特征工程耗費的資源也是相當可觀的,對於后期模型特征的維護、模型線上部署不太友好。2016年,微軟提出Deep Cros ...

Sun Nov 10 05:09:00 CST 2019 0 815
推薦系統實踐 0x0c FM系列(LR/FM/FFM)

邏輯回歸(LR) 在介紹FM系列之前,我想首先簡單介紹一下邏輯回歸。通常來說,邏輯回歸模型能夠綜合利用更多的信息,如用戶、物品、上下文等多種不同的特征,生成更為全面的結果。另外,邏輯回歸將推薦問題看成一個分類問題。通過預測正樣本的概率對物品進行排序,這里的正樣本可以是用戶觀看了某個視頻,也可以是 ...

Tue Dec 08 03:16:00 CST 2020 0 363
推薦系統系列(六):Wide&Deep理論實踐

背景 在CTR預估任務中,線性模型仍占有半壁江山。利用手工構造的交叉組合特征來使線性模型具有“記憶性”,使模型記住共現頻率較高的特征組合,往往也能達到一個不錯的baseline,且可解釋性強。但這種 ...

Mon Nov 18 06:30:00 CST 2019 0 952
推薦系統模型之 FM

什么是FM模型 FM英文全稱是“Factorization Machine”,簡稱FM模型,中文名“因子分解機”。 FM模型其實有些年頭了,是2010年由Rendle提出的,但是真正在各大廠大規模在CTR預估和推薦領域廣泛使用,其實也就是最近幾年的事。 FM模型 原理 ...

Mon Apr 22 23:27:00 CST 2019 1 4121
推薦系統實戰(二) —— FM

因子分解機系列--FM 1.FM背景 FM (Factorization Machine) 主要是為了解決數據稀疏的情況下,特征怎樣組合的問題。目前主要應用於CTR預估以及推薦系統中的概率計算。下圖是一個廣告分類的問題,根據用戶和廣告位相關的特征,預測用戶是否點擊了廣告。圖片來源,詳見參考 ...

Tue May 14 23:59:00 CST 2019 3 928
FM的推導原理--推薦系統

FM:解決稀疏數據下的特征組合問題 Factorization Machine(因子分解機) 美團技術團隊的文章,覺得寫得很好啊:https://tech.meituan.com ...

Mon Jul 31 00:20:00 CST 2017 0 3330
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM