一、前述
隱語義模型是近年來推薦系統領域較為熱門的話題,它主要是根據隱含特征將用戶與物品聯系起來。
因為用戶和物品之間有着隱含的聯系。所以把用戶轉成隱語義,然后物品轉成隱語義組合,通過中介隱含因子連接。
二、具體
1、隱語義模型舉例和求解
N代表用戶,M代表物體
第一步:先分解 將用戶分解成F個因子的矩陣 將物品也分解成F個因子的矩陣 (F*N)T*(F*M )=N*M 其中T表示轉置。
第二步:轉成機器學習模型:
RUI代表用戶對物品的關系
Pu代表用戶對隱藏因子的關系
QI代表物品對隱藏因子的關系
轉換成機器學習模型,必須先找出損失函數。
損失值=預測值-真實值 其中預測值即分解的RUI ,真實值就是真實的RUI,我們希望找出P矩陣(用戶和隱藏因子的和關系)和Q矩陣(物品和隱藏因子的關系),實際上就是找出對應的參數,所以這些參數就是我們需要求解的模型,我們將這些參數加入到損失函數里面去,做正則化。
第三步:求解模型
對損失函數求導:
對參數更新迭代:沿着梯度下降的方向,P ,Q就是具體的參數
第四步:建模求解,選擇正負樣本。
正樣本:用戶對物品打分就是正樣本。
負樣本:選取那些很熱門,而用戶卻沒有行為的物品。
對每個用戶,要保證正負樣本的平衡(數目相似)
對於用戶—物品集K {(u,i)},其中如果(u, i)是正樣本,則有 𝑟𝑢𝑖= 1,負樣本則𝑟𝑢𝑖= 0
第五步:參數選擇
F值越大,表示映射維度越多。
隱特征的個數F,通常F=100
學習速率alpha,別太大
正則化參數lambda,別太大
負樣本/正樣本比例 ratio
第六步:模型使用
根據求得的P和Q,還原回去可得原用戶對物品的評分矩陣,從而進行推薦。
2、協同過濾VS隱語義比較
原理:協同過濾基於統計,隱語義基於建模
空間復雜度,隱語義模型較小
實時推薦依舊難,目前離線計算多
隱語義模型咋解釋呢?不解釋