推薦算法-余弦相似度


一、余弦相似度:

余弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似,這就叫"余弦相似性"

二維向量的余弦相似度:

多維向量的余弦相似度(類比)

 

協同過濾(Collaborative Filtering, 簡稱 CF):

  • 收集用戶行為
  • 減噪與歸一化處理
  1. 減噪:用戶行為數據是用戶在使用應用過程中產生的,它可能存在大量的噪音和用戶的誤操作,我們可以通過經典的數據挖掘算法過濾掉行為數據中的噪音,這樣可以是我們的分析更加精確
  2. 歸一化:將各個行為的數據統一在一個相同的取值范圍中,從而使得加權求和得到的總體喜好更加精確。

二、基於物品的協同過濾推薦算法(itemCF):

算法思想:給用戶推薦那些和他們之前喜歡的物品相似的物品

用戶行為與權重:點擊-1、搜索-3、收藏-5 、付款-10

用戶 A、B、C

商品 1、2、3、4、5、6

  • 根據用戶行為列表計算用戶、物品的評分矩陣
  • 根據用戶、物品的評分矩陣計算物品、物品的相似矩陣 
  • 相似度矩陣x評分矩陣=推薦列表
  • 推薦列表中用戶之前已經有過行為的元素置為0

三、基於用戶的協同過濾推薦算法(UserCF)

算法思想:給用戶推薦和他興趣相似的其他用戶喜歡的物品

用戶行為與權重:點擊-1、搜索-3、收藏-5 、付款-10

用戶 A、B、C、D、E、F  

商品 1、2、3、4、5、6

  • 根據用戶行為列表計算物品、用戶的評分矩陣
  • 根據物品、用戶的評分矩陣計算用戶、用戶的相似矩陣
  • 相似度矩陣X評分矩陣=推薦列表
  • 將推薦列表中用戶已有行為的元素置0

四、基於內容推薦算法

算法思想:給用戶推薦和他們之前喜歡的物品在內容上相似的其他物品

1表示電影具有某個特征  0表示電影不具有某個特征

物品特征建模:Item Profile

  • 構建Item Profile矩陣(電影的特征項矩陣)
  • 構建Item User評分矩陣(用戶電影的評分矩陣)
  • Item User x Item Profile = User Profile (用戶對電影的喜愛程度)
  • 對Item Profile和User Profile求余弦相似度

五、基於物品的協同過濾推薦算法(itemCF)說明:

1、根據用戶行為列表計算用戶、物品的評分矩陣

 

2、根據用戶物品的評分矩陣計算物品、物品的相似矩陣

3、相似度矩陣x評分矩陣=推薦列表

4、推薦列表中用戶之前已經有過行為的元素置為0

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM