推薦系統實踐（項亮）— 第3章推薦系統冷啟動問題

本文轉載自查看原文 2018-10-28 11:32 653 讀書筆記

3.1 冷啟動問題簡介

　　常用解決方案：

3.2 利用用戶注冊信息

　　基於用戶注冊信息的推薦算法其核心問題是計算每種特征的用戶喜歡的物品。幫助用戶發現他們不容易發現的物品，而不是熱門物品。

　　基本流程：（1）獲取用戶注冊信息；（2）根據注冊信息對用戶分類；（3）給用戶推薦他所屬分類中用戶喜歡的物品。將推薦列表根據一定的權重相加，得到最終的推薦列表。

3.3 選擇合適的物品啟動用戶的興趣

　　在新用戶第一次訪問推薦系統時，不立即給用戶展示推薦結果，而是提供一些物品，根據用戶的反饋來提供個性化推薦。　　

　　選擇啟動物品需要具備的特點：

　　一般可以使用決策樹算法構建一個這樣的選擇啟動物品集合的系統。給定一群用戶，用這群用戶對物品評分的方差度量這群用戶興趣的一致程度。如果方差很大，說明這一群用戶的興趣不太一致，反之則說明這群用戶的興趣比較一致。通過如下方式度量一個物品的區分度 $D (i) :$

$D (i) :$

　　另一種理解：計算的這個方差，相當於決策樹里計算的信息熵，

　　 $D (i) :$

3.4 利用物品的內容信息

　　對於物品的冷啟動問題，一般是利用物品的文本信息，計算物品的詞向量，然后根據詞向量計算物品的相似性，將其加入相似性矩陣。通過物品內容（文本）計算物品相似性，是基於內容的過濾算法。

　　UserCF算法對物品冷啟動問題不太敏感，因為總有一些用戶通過某些途徑對新物品進行反饋，這樣就可以推薦給興趣相投的其他用戶，從而推廣物品；另外，解決第一推動力還可以考慮利用物品的內容信息，將新物品投給曾經喜歡過和它內容相似的其他物品的用戶。

　　ItemCF算法對物品冷啟動問題很敏感，物品相似度表的更新跟不上，此時只能利用物品的內容信息計算物品相關表，基於內容的相關表計算相對簡單，能頻繁更新解決物品冷啟動問題。

　　總結：如果用戶的行為強烈受到某一內容的影響，那么內容過濾算法的性能最優，可以超過協同過濾算法，但如果需要豐富的領域知識的場景，協同過濾會明顯高於內容過濾算法。

　　LDA算法：屬於話題模型，生成模型，基本思想是：

3.5 發揮專家的作用

　　針對系統冷啟動問題，一般使用專家進行樣本標注。例如：Jinni采用本人工、半自動的方法。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。