對豆瓣電影近十年數據(截止2019年3月)進行分析


豆瓣作為國內文藝愛好者聚集地,電影評分體系具有相當的客觀性,同時作為一個詳實的資料庫,可以為我們了解電影行業提供一個很好的參考。本文數據取自豆瓣網。

工具:Excel、tableau

拿到數據先對數據進行處理:刪除空行、刪除重復值

對相應數據進行查找替換:(盡量保證數據的客觀性、真實性)

中國浙江--中國

中國*--中國

美國*--美國

日本*--日本等

1、豆瓣電影近十年上映數量分析:

從圖中可以看出,在2010年--2015年的電影數量穩步增長,2016年電影數量激增,2017年的電影數量與2016年相當,2018年數量稍有回落,是什么原因導致這種情況呢?通過查閱相關資料發現,電影數量的這一變化和當時的經濟環境有很大的關系。

 

 

2、那么十年中哪幾個國家的電影產量比較高呢?

數據顯示,近十年中制片數量比較高的三個國家分別是美國、中國、日本,其中美國制片數量最高,為6544,中國處於中間位置,制片數量是5215,日本為3844。

 

 

3、對制片數量較高的三個國家進行了對比,美國的電影生產數量最高,且每年的電影數量相對比較均衡,跟美國相比,日本的電影數量相對較低,也是比較均衡,對比美國和日本的電影數量,發現中國的電影數量在2016年升高明顯。那么,中國電影在2016年劇增的原因是什么呢?分析認為這一變化與當時國內行業政策、經濟環境、社會環境有很大關系。

 

 4、那么,豆瓣電影近十年找那個那些種類的電影數量比較多呢?

從上圖可以看出,近十年中,愛情片居於首要地位,其次是驚悚片,第三為喜劇片。

 

5、通過對國家的篩選,可以發現,美國、中國、日本這三個國家的電影主體方向是不同的,美國電影中居於前三位的是驚悚片、恐怖片和科幻片;中國電影中占據前三名的寶座的則是愛情片、懸疑片、動作片;而日本居於首位的為動漫,剛好體現日本動漫行業的發達。下圖中紅顏色越深代表數量越多,綠顏色越深代表電影數量越少,除了電影分類以外,還可以看出來中國的愛情片在三個制片大國的電影分類中數量最多。從三個國家的電影種類排名也可以發現不同國家的文化存在很大的差異。

 

 

6、三個國家高分和低分電影數量對比

通過對比三個電影大國的高分電影和低分電影的數據,可以發現,美國和日本的高分電影更多,說明兩個國家的電影質量比較高,而中國高分電影較少,低分電影很多,說明中國電影可能更關注數量,對質量的追求遠不如美國和日本。

7分以上的電影分布:日本高分電影最多,占比44.46%,中國高分電影最少,占比13.92%。

 

 3分以下的電影分布:中國低分電影最多,占比79.31%。

 

 反思:1、剛開始嘗試做數據分析,對具體行業數據沒有特別清晰的認識,數據預處理方向不明確,過程中進行了大量重復工作。

            2、數據准備不充分,數據源中沒有票房數據,這一點應該在准備階段考慮到,以后工作中應該吸取這一教訓。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM