Book
· 1. Book Crossing
BookCrossing(BX)數據集由Cai-Nicolas花了的4周(2004年8月/ 9月)從Book-Crossing社區中爬取得到的。
· 下載鏈接:http://www2.informatik.uni-freiburg.de/~cziegler/BX
電子商務
· 2. Amazon
該數據集包括自1996年5月至2014年7月,來自亞馬遜上的1.428億產品的評論和metadata。
· 下載鏈接:http://jmcauley.ucsd.edu/data/amazon/
· 3. Retailrocket推薦系統數據集
該數據集由三個文件組成:一個行為數據集(events.csv),一個屬性數據集(item_properties.сsv)和一個類目樹數據集(category_tree.сsv)。該數據來自現實世界的電子商務網站。
· 下載鏈接:https://www.kaggle.com/retailrocket/ecommerce-dataset
音樂
· 4. Amazon Music
該數字音樂數據集包含來自亞馬遜的評論和元數據
· 下載鏈接:http://jmcauley.ucsd.edu/data/amazon/
· 5. Yahoo Music
該數據集是一個快照,收集了音樂社區對各種音樂藝術家的偏好。
· 下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
· 6. LastFM(Implicit)
該數據集收集了Last.fm網站上2千名用戶的社交網絡、tagging和music artist listening信息。
· 下載鏈接:https://grouplens.org/datasets/hetrec-2011/
· 7. Milion Song Dataset
Million Song數據集是一個免費的數據集,提供了一百萬條當代流行音樂曲目相關的的audio features和metadata。
· 下載鏈接:https://labrosa.ee.columbia.edu/millionsong/
電影
· 8. MovieLens
GroupLens Research已經從他們的電影網站收集整理的rating數據集。
· 下載鏈接:https://grouplens.org/datasets/movielens/
· 9. Yahoo Movies
該數據集包含從兩個不同來源收集的歌曲的rating數據集。第一個來源是用戶在與Yahoo上使用音樂服務是產生的rating數據。
· 下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
· 10. CiaoDVD
CiaoDVD是2013年12月從http://dvd.ciao.co.uk網站上抓取的DVD類別數據集。
· 下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
·11. FilmTrust
FilmTrust是2011年6月從整個FilmTrust網站上抓取的一個小型數據集。
· 下載鏈接:https://www.librec.net/datasets.html
· 12. Netflix
這是Netflix獎競賽中使用的官方數據集。
· 下載鏈接:http://academictorrents.com/details/9b13183dc4d60676b773c9e2cd6de5e5542cee9a
游戲
· 13. Steam Video Games
這是一個用戶行數據集,包含:user-id,game-title,behavior-name,value。包括“purchase”和“play”數據集。購買了,puchase的值為1,而“play”的值表示用戶播放音樂的時長。
· 下載鏈接:https://www.kaggle.com/tamber/steam-video-games/data
Jokes
· 14. Jester
該笑話數據集包含來自73,496個用戶,關於100個笑話的410萬連續rating數據(-10.00到+10.00)
· 下載鏈接:http://www.ieor.berkeley.edu/~goldberg/jester-data/
餐飲
·15. Chicago Entree
該數據集包含用戶與Entree Chicago餐廳推薦系統交互的記錄數據。
· 下載鏈接:http://archive.ics.uci.edu/ml/datasets/Entree+Chicago+Recommendation+Data
動漫
·16. 動漫推薦數據庫
該數據集包含來自12,294個動漫的73,516個用戶的用戶偏好數據。每個用戶都可以將動畫添加到已完成的列表中並為其評分,該數據集把這些評級整理起來。
· 下載鏈接:https://www.kaggle.com/CooperUnion/anime-recommendations-database
其他數據集
· GroupLens數據集
· 下載鏈接:https://grouplens.org/datasets/
· LibRec數據集
· 下載鏈接:https://www.librec.net/datasets.html
· Yahoo Research數據集
· 下載鏈接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
· 斯坦福大型網絡數據集匯編