一、余弦相似度:
余弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似,這就叫"余弦相似性"
二維向量的余弦相似度:
多維向量的余弦相似度(類比)
協同過濾(Collaborative Filtering, 簡稱 CF):
- 收集用戶行為
- 減噪與歸一化處理
- 減噪:用戶行為數據是用戶在使用應用過程中產生的,它可能存在大量的噪音和用戶的誤操作,我們可以通過經典的數據挖掘算法過濾掉行為數據中的噪音,這樣可以是我們的分析更加精確
- 歸一化:將各個行為的數據統一在一個相同的取值范圍中,從而使得加權求和得到的總體喜好更加精確。
二、基於物品的協同過濾推薦算法(itemCF):
算法思想:給用戶推薦那些和他們之前喜歡的物品相似的物品
用戶行為與權重:點擊-1、搜索-3、收藏-5 、付款-10
用戶 A、B、C
商品 1、2、3、4、5、6
- 根據用戶行為列表計算用戶、物品的評分矩陣
- 根據用戶、物品的評分矩陣計算物品、物品的相似矩陣
- 相似度矩陣x評分矩陣=推薦列表
- 推薦列表中用戶之前已經有過行為的元素置為0
三、基於用戶的協同過濾推薦算法(UserCF)
算法思想:給用戶推薦和他興趣相似的其他用戶喜歡的物品
用戶行為與權重:點擊-1、搜索-3、收藏-5 、付款-10
用戶 A、B、C、D、E、F
商品 1、2、3、4、5、6
- 根據用戶行為列表計算物品、用戶的評分矩陣
- 根據物品、用戶的評分矩陣計算用戶、用戶的相似矩陣
- 相似度矩陣X評分矩陣=推薦列表
- 將推薦列表中用戶已有行為的元素置0
四、基於內容推薦算法
算法思想:給用戶推薦和他們之前喜歡的物品在內容上相似的其他物品
1表示電影具有某個特征 0表示電影不具有某個特征
物品特征建模:Item Profile
- 構建Item Profile矩陣(電影的特征項矩陣)
- 構建Item User評分矩陣(用戶電影的評分矩陣)
- Item User x Item Profile = User Profile (用戶對電影的喜愛程度)
- 對Item Profile和User Profile求余弦相似度
五、基於物品的協同過濾推薦算法(itemCF)說明:
1、根據用戶行為列表計算用戶、物品的評分矩陣
2、根據用戶物品的評分矩陣計算物品、物品的相似矩陣
3、相似度矩陣x評分矩陣=推薦列表
4、推薦列表中用戶之前已經有過行為的元素置為0