Surprise(Simple Python Recommendation System Engine)是一款推薦系統庫,是scikit系列中的一個。簡單易用,同時支持多種推薦算法。基礎算法、協同過濾、矩陣分解等
Surprise使用
Surprise里有自帶的Movielens數據集。
- 1、載入自帶數據集
from surprise import Dataset,evaluate,print_perf #默認載入movielens數據集 data=Dataset.load_builtin('ml-100k') #k折交叉驗證 data.split(n_folds=3) #假設使用SVD矩陣分解 algo=SVD() #在數據集上測試效果(評估) perf=evaluate(algo,data,measures=['RMSE','MAE']) print_perf(perf)
- 2、載入自己的數據集
#指定文件所在路徑 file_path=os.path.expanduser('文件路徑') #告訴文本閱讀器,文本的格式是怎樣的 reader=Reader(line_format=' ',seq='\t') #加載數據 data=DataSet.load_form_file(file_path,reader=reader)