最近哪吒大火,所以我們分析一波哪吒的影評信息,分析之前我們需要數據呀,所以開篇我們先講一下爬蟲的數據提取;話不多說,走着。 首先我們找到網站的url = "https://maoyan.com/films/1211270",找到評論區看看網友的吐槽,如下 F12打開看看有沒有評論信息 ...
目錄 前言 分析 具體步驟 登錄 爬取與存儲 可視化分析 結語 前言 暑期檔電影慘淡,但隨着哪吒爆紅開拓了新局面。這也是國產動畫的首次爆紅。在哪吒剛出,筆者以為最多 億就算不錯的了。沒想過僅過了幾天就破了 億。接着頭條又突破 億 目前 天 億,勢頭增長依然很猛 那筆者就很好奇人們是怎么看待這一步電影的呢 哪吒 我想哪吒是陪伴過不少人成長的一部動畫片吧,也是記憶中算得上最好看的動畫片之一了。里面的 ...
2019-08-08 12:26 4 1406 推薦指數:
最近哪吒大火,所以我們分析一波哪吒的影評信息,分析之前我們需要數據呀,所以開篇我們先講一下爬蟲的數據提取;話不多說,走着。 首先我們找到網站的url = "https://maoyan.com/films/1211270",找到評論區看看網友的吐槽,如下 F12打開看看有沒有評論信息 ...
思路: 1、打開書本“更多”短評,復制鏈接 2、腳本分析鏈接,通過獲取短評數,計算出頁碼數 3、通過頁碼數,循環爬取當頁短評 4、短評寫入到txt文本 5、讀取txt文本,處理文本,輸出出現頻率最高的詞組(前X)----通過分析得到其他結果可自由發散 用到的庫: 整個腳本 ...
哪吒:“去他個鳥命!我命由我,不由天!是魔是仙,我自己決定!” 哪吒:“若命運不公,便和它奮斗到底。” 哪吒:“生活你全是淚,越是折騰越倒霉,垂死掙扎你累不累,不如癱在床上睡。” 哪吒:“你是我唯一的朋友啊!”——敖丙:“你也是我唯一的朋友。” 哪吒:“三年是短了點,不過我也玩的挺開心 ...
在上篇實現了電影詳情和短評數據的抓取。到目前為止,已經抓了2000多部電影電視以及20000多的短評數據。 數據本身沒有規律和價值,需要通過分析提煉成知識才有意義。抱着試試玩的想法,准備做一個有關情感分析方面的統計,看看這些評論里面的小伙伴都抱着什么態度來看待自己看過的電影,懷着何種心情 ...
十月份的黃金周,乃至整個十月份,妥妥的是《長津湖》的天下,才小半個月票房就已經突破44億,都快追上戰狼2了。貓眼評分9.5,口碑超高,2021年票房口碑雙豐收大黑馬! 今天我們通過爬取貓眼的電影評論,進行可視化分析,康康長津湖為什么這么受歡迎,最后教 ...
周末,看到朋友在朋友圈發了一條心情,是關於最新上映的電影《少年的你》,剛好前段時間又學習了一下爬蟲,於是心血來潮,想爬一下這部電影的短評,看看口碑如何。此筆記僅用於學習,不得商業獲利!如有侵害任何公司利益,請告知刪除! 本文記錄使用request,以及正則表達式re爬取影評的過程 ...
寫在前面 用Python加上一些數據分析,來證明《海王》好看。 《海王》一部電影帶你重溫《馴龍高手》《變形金剛》《星球大戰》《星河戰隊》《鐵血戰士》《安德的游戲》《異形》可能還借鑒了對手的《鋼鐵俠》與《黑豹》劇情,再稍稍帶一點《大魚海棠》的味道,配上一丟丟溫子仁式恐怖片套路,優秀 ...
最近學到數據可視化到了詞雲圖,正好學到爬蟲,各種爬網站 【實驗名稱】 爬取豆瓣電影《千與千尋》的評論並生成詞雲 1. 利用爬蟲獲得電影評論的文本數據 2. 處理文本數據生成詞雲圖 第一步,准備數據 需要登錄豆瓣網站才能夠獲得短評文本數據https://movie.douban.com ...