機器學習算法學習---推薦系統的常用算法(一)


概括分類:
1) 基於內容的推薦:這一類一般依賴於自然語言處理NLP的一些知識,通過挖掘文本的TF-IDF特征向量,來得到用戶的偏好,進而做推薦。這類推薦算法可以找到用戶獨特的小眾喜好,而且還有較好的解釋性。這一類由於需要NLP的基礎,本文就不多講,在后面專門講NLP的時候再討論。

2)協調過濾推薦:本文后面要專門講的內容。協調過濾是推薦算法中目前最主流的種類,花樣繁多,在工業 界已經有了很多廣泛的應用。它的優點是不需要太多特定領域的知識,可以通過基於統計的機器學習算法來得到較好的推薦效果。最大的優點是工程上容易實現,可 以方便應用到產品中。目前絕大多數實際應用的推薦算法都是協同過濾推薦算法。

3)混合推薦:這個類似我們機器學習中的集成學習,博才眾長,通過多個推薦算法的結合,得到一個更好的 推薦算法,起到三個臭皮匠頂一個諸葛亮的作用。比如通過建立多個推薦算法的模型,最后用投票法決定最終的推薦結果。混合推薦理論上不會比單一任何一種推薦 算法差,但是使用混合推薦,算法復雜度就提高了,在實際應用中有使用,但是並沒有單一的協調過濾推薦算法,比如邏輯回歸之類的二分類推薦算法廣泛。

4)基於規則的推薦:這類算法常見的比如基於最多用戶點擊,最多用戶瀏覽等,屬於大眾型的推薦方法,在目前的大數據時代並不主流。

5)基於人口統計信息的推薦:這一類是最簡單的推薦算法了,它只是簡單的根據系統用戶的基本信息發現用戶的相關程度,然后進行推薦,目前在大型系統中已經較少使用。

1、概念

協同過濾包括在線的協同和離線的過濾。在線協同是指通過在線數據找到用戶可能喜歡的物品;離線過濾是指過濾掉一些不值得推薦的數據。

 

我們的問題是這樣的m個物品,m個用戶的數據,只有部分用戶和部分數據之間是有評分數據的,其它部分評分是空白,此時我們要用已有的部分稀疏數據來預測那些空白的物品和數據之間的評分關系,找到最高評分的物品推薦給用戶。 

 

分類:

(1)基於用戶的協同過濾。考慮用戶之間的相似度,通過相似用戶獲得評價高分物品,將其推薦給目標用戶。

(2)基於項目的協同過濾。考慮物品之間的相似度,通過目標用戶對某些物品的評分,將相似物品推薦給他。

(3)基於模型的協同過濾。目前最主流的,下面詳細介紹。

2、基於模型的協同過濾

 

用機器學習的思想來建模解決,主流的方法可以分為:用關聯算法,聚類算法,分類算法,回歸算法,矩陣分解,神經網絡,圖模型以及隱語義模型來解決。

詳情可見:

https://www.cnblogs.com/pinard/p/6349233.html

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM