Python電影數據分析

本文轉載自查看原文 2018-04-19 18:36 2182 Python進化論

數據說明：MovieLens數據集，它包含來自於943個用戶以及精選的1682部電影的100K個電影打分。每個用戶至少為20部電影打分，數據類型user id | item id | rating | timestamp.

地址：https://grouplens.org/datasets/movielens/

1、引入pandas,numpy包

2、讀取數據：首先，文件如果不在默認路徑下，需要更改路徑，使用下面兩行命令，另外要注意正反斜杠的應用。

os.getcwd()

os.chdir("新的路徑")

3、由於數據包含了打分數據，用戶數據，但在兩個文件里，因此需要合並。首先，使用header=['l列名1','列名2'.....]格式給兩個文件添加列名

然后數據合並

結果：

將文件轉換成字典類型，並按照列名讀取兩列

數據統計分析，data.describe()

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 豆瓣電影數據分析 MovieLens電影數據分析【python數據分析實戰】電影票房數據分析(二)數據可視化【python數據分析實戰】電影票房數據分析(一)數據采集數據分析案例-----------分析電影數據 Python爬蟲實戰+數據分析+數據可視化（豆瓣八佰電影影評）豆瓣高分電影信息分析（數據分析） Python數據分析 Python數據分析貓眼電影之哪吒數據爬取、數據分析