Recommender Systems Handbook讀書筆記之7
《Recommender Systems Handbook》,市面上不多的關於推薦系統的書之一。2010年10月出版,英文版。目前還沒有中文版,估計出中文版的可能性不大,讀者數量太少了。全書871頁,比較厚。Amazon.com上這本書還沒有讀者評論,看來在英語世界里“推薦系統“這個主題也相對比較冷。
這本書斷斷續續看了三個月。總體感覺還是很不錯。由一群相關領域的研究人員集體編寫,每一章都有幾位研究者負責。
全書共分五大部分:
1:基礎技術,介紹各種推薦算法。
2:具體應用及其評估
3:與推薦系統交互
4:推薦系統與社群
5:高級算法
一二部分比較基礎,后面三個部分相對來說離實際應用遠一些,許多內容還處於研究中。
以下是讀書過程中的一些摘抄(大部分是從前6篇筆記中復制過來的)
書中第一章是全書介紹,其中總結了推薦系統的用途如下:
1:增加產品銷售量;
2:銷售更多類別的產品。推薦系統可以推薦出用戶可能本來不會去留意的其他類別的商品;
3:提高用戶滿意度;
4:提高用戶忠誠度;
5:更好地理解用戶需求;
6:找到一些優秀的產品;
7:找到全部優秀的產品;某些場景(比如一些醫療或財務的應用)需要找到全部的合適的產品;
8:對產品做注解,比如在電視推薦系統中說明哪些節目值得觀看;
9:推薦系列產品;
10:推薦打包產品;
11:只看不買,這種場景下仍然可以推薦出匹配用戶興趣的產品;
12:找到可信的推薦系統:有時候用戶不相信系統的推薦,有些體統可以提供一些功能讓用戶去測試它們的推薦結果;
13:改善用戶資料:通過推薦系統可以知道更多的用戶的喜好;
14:自我表達:有些用戶喜歡表達自己對產品的看法;
15:幫助他人;
16:影響他人;
第二章:推薦系統中使用的數據挖掘方法,分為:數據處理(相似度度量、抽樣、降維、降噪)、分類(具體算法有最近鄰、決策樹、基於規則的分類、貝葉斯分類、人工神經網絡、支持向量機)、聚類分析、關聯規則挖掘
第三章:基於內容的推薦系統:State of the Art and Trends。
第四章:基於近鄰的推薦方法概覽。
以下一小段內容摘譯自第四章:
有三種類型的信息搜索:
1:搜索對象清晰可辨;
2:搜索對象不能被完全描述,但是可以被一眼認出;
3:以意外的、偶然的方式獲取信息;
第五章:協同過濾中的改進;
第六章:開發基於約束的推薦器;
以下內容摘自第六章:
傳統推薦方法(基於內容的過濾和協同過濾)對於書,電影,新聞之類的產品是非常適合的。但是在汽車,電腦,房產,財務服務等領域的推薦中不是最好的方法。比如房產的買賣數量要少很多,某個產品不容易收集到大量的用戶評價。並且,用戶對基於數年前的產品特征的推薦會很不滿意。
基於知識的推薦系統可以解決這類問題,並且基於知識的推薦系統沒有冷啟動(新產品得不到推薦)的問題。當然,知識獲取是這類系統的瓶頸。
第七章:上下文感知的推薦系統:常規推薦系統只考慮user和item,上下文感知的推薦系統則認為“上下文信息”也需要考慮。比如旅游網站的推薦,冬天與夏天應該有很大不同;再比如新聞網站的推薦需要考慮時間,工作日用戶更願意關注時事新聞和股市信息,周末則更願意關注電影評論和購物信息;
第八章:評估推薦系統
第九章:一個IPTV服務供應商的推薦系統:一個大規模產品環境。介紹一個電視點播系統中的推薦系統。挑戰是需要實時,同時又無法判斷操作遙控器的用戶的身份(解決方案是根據時間段來區分用戶)
第十章:如何在實驗室之外得到推薦系統:介紹搭建實際應用的推薦系統需要考慮的方面;
第十一章:匹配推薦技術與領域:介紹不同應用場景下適用的推薦技術與算法;
第十二章:Technology Enhanced Learning中的推薦系統;
第十三章:對於評論推薦系統(Critiquing Recommenders)的評估。所謂評論推薦系統,是根據用戶的評論來調整推薦內容的系統。
第十四章:創建更可信的、更有說服力的推薦系統:原始特征對推薦系統評估的影響
第十五章:為推薦系統設計、評估“推薦系統給用戶的解釋”(Designing and Evaluating Explanations for
Recommender Systems)
第十六章:對“基於點評研究的生產推薦系統”的可用性的指導
第十七章:基於地圖的產品類別可視化
第十八章:個性化web搜索中的社群、協同與推薦系統
第十九章:社區tag推薦系統
第二十章:信任與推薦
第二十一章:團體推薦系統:合並個體模型
第二十二章:聚集推薦系統中的參數
第二十三章:推薦系統中的實時學習
第二十四章:多個評判標准的推薦系統
第二十五章:健壯的推薦