閱讀筆記：Item-based Collaborative Filtering Recommendation Algorithms

本文轉載自查看原文 2018-08-13 09:50 1024 協同過濾/ 論文閱讀筆記/ 矩陣分解

概要：
推薦系統通過信息獲取技術解決在線的個人的消息、產品或者服務的推薦問題。這些系統，特別是基於k臨近協同過濾算法，在網絡上取得了廣泛的成功。可用信息和訪問人數的巨大增加成了推薦系統一個難題。基於商品的協同過濾推薦算法應運而生，通過分析用戶特征矩陣計算推薦信息。本文主要分析不同的基於商品的推薦算法，還會同k臨近過濾算法比較，同時提供比現存最好的基於用戶算法更好的算法。
一、協同過濾算法分類
協同過濾算法主要分為：1.基於存儲 2.基於模型
基於存儲：它利用整個用戶商品數據來產生預測，使用靜態的方法找到相似用戶，他們評價了不同的商品但是評價相似或者他們想買相似的商品，一旦形成相似組群，系統就會整合組群來產生預測。這種方法也被叫做臨近算法或者基於用戶的協同過濾算法，得到廣泛的應用。
面臨的問題：
1.稀疏問題：商品很多，即使是非常愛買東西的用戶買的物品可能都不會超過總商品的1%。
2.性能：計算量隨着用戶和商品的增加而增加。因此數據量一大性能就降低。
基於模型：它通過產生一個用戶評分模型來推薦，這個算法采用了概率論的方法，通過用戶給出的期望價值來給其他商品打分，這個模型通過機器學習算法比如貝葉斯網絡, clustering, 和 rule-based等等實現的。貝葉斯網絡模型為協同過濾算法提供了一個概率模型，Clustering模型把協同過濾算法當成一個分類問題，通過將相似者分組然后估計該客戶在這個類別的可能性，通過這些來計算商品評分的可能性。rule-based通過共同購買的商品的相關度來產生基於商品相關度的推薦。
二、協同過濾算法用到的度量技術
商品相似度：
1.cosine相似度：只考慮item向量的點積
2.correlation-based相似度（Pearson相似度）：考慮了item的平均評分
3.adjusted cosine相似度：考慮了用戶對item的平均評分
預測計算：
1.使用相似度加權平均
2.使用回歸模型。使用加權平均時，采用的與預測物品i相似的物品 j的相似度Sim j* j的評分Rj。而使用回歸模型時，它會計算出一個線性回歸 f(j) =α*avg(Rj) + β + ξ，從而計算出一個不同於Rj的分值，然后再使用加權平均。
評價系統好壞的方式：
1.statistical accuracy metrics:MOE、RMSE
2.decision support accuracy metrics:reversal rate, weighted errors, ROC
三、結論
1.基於物品的算法預測結果要比基於用戶的算法預測結果好
2.基本的基於物品的算法，模型大小越大，推薦質量越好，但是基於回歸的物品算法，先是隨着模型大小增加而增加，之后質量下降。
3.adjusted cosine similarity效果比較好

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 論文閱讀 - Item-Based Collaborative Filtering Recommendation Algorithms 論文筆記-Item2Vec- Neural Item Embedding for Collaborative Filtering 論文筆記 : NCF( Neural Collaborative Filtering) DNN論文分享 - Item2vec: Neural Item Embedding for Collaborative Filtering 協同過濾user-based CF算法與item-based CF算法對比協同過濾User-based算法與Item-based算法對比論文筆記：Neural Graph Collaborative Filtering（SIGIR 2019） Intent Contrastive Learning for Sequential Recommendation閱讀筆記協同過濾 Collaborative Filtering 論文筆記 2016-CIKM Learning Graph-based POI Embedding for Location-based Recommendation