模型的建立相當於從行為數據中提取特征,給用戶和物品同時打上“標簽”
有顯性特征時,我們可以直接匹配做出推薦
沒有時,可以根據已有的偏好數據,去發掘出隱藏的特征,這需要用到隱語義模型(LFM)
一、隱語義模型(LFM Latent Factor Mode)
基於樣本的用戶偏好信息,訓練一個推薦模型,然后根據實時的用戶喜好信息進行預測新物品的得分,計算推薦
目標:揭示隱藏特征【使用偏好數據訓練模型,找到內在規律,再用模型來做預測(類似回歸)】
方法:矩陣分解進行降維分析【分解之后的矩陣代表了用戶和物品的隱藏特征】
1、LFM降維方法-矩陣因子分解
想要發現K個隱類,就是找到兩個矩陣P和Q,使得兩個矩陣的乘積近似等於R
找到影響用戶打分的隱藏因子-》預測評分矩陣
2、模型的求解-損失函數
目標:找到最好的分解方式,讓分解之后的預測評分矩陣誤差最小
選擇平方損失函數,並且加入正則化項,以防止過擬合
3、最小化過程的求解:
- 隨機梯度下降算法:
- 模型求解算法-交替最小二乘法(ALS Alternating Least Square)
思想:由於兩個矩陣P和Q都是未知,且通過矩陣乘法耦合再一起,為了使它們解耦,
可以先固定Q,把P當作變量,通過損失函數最小化求出P,再反過來固定P,把Q當作變量,求解出Q,如此交替執行,直到誤差滿足閾值條件,或者到達迭代上限。