原文:爬取豆瓣電影信息

昨天寫了一個小爬蟲,爬取了豆瓣上 年中國大陸的電影信息,網址為豆瓣選影視,爬取了電影的名稱 導演 編劇 主演 類型 上映時間 片長 評分和鏈接,並保存到MongoDB中。 一開始用的本機的IP地址,沒用代理IP,請求了十幾個網頁之后就收不到數據了,報HTTP錯誤 ,然后用瀏覽器打開網頁試了一下,發現瀏覽器也是 。。。 但是我不怕,我有代理IP,哈哈哈 詳見我前一篇隨筆:爬取代理IP。 使用代理IP ...

2018-12-10 13:00 0 1597 推薦指數:

查看詳情

scrapy豆瓣電影信息

最近在學python,對python爬蟲框架十分着迷,因此在網上看了許多大佬們的代碼,經過反復測試修改,終於大功告成! 原文地址是:https://blog.csdn.net/ljm_9615/ar ...

Fri Jun 01 00:53:00 CST 2018 0 816
python豆瓣電影信息數據

題外話+ 大家好啊,最近自己在做一個屬於自己的博客網站(准備辭職回家養老了,明年再戰)在家里 瑣事也很多, 加上自己 一回到家就懶了(主要是家里冷啊! 廣東十幾度,老家幾度,躲在被窩瑟瑟發抖,) ...

Sat Dec 29 00:06:00 CST 2018 0 4988
豆瓣電影

一、任務描述   https://movie.douban.com/tag/#/豆瓣電影,選擇電影,中國大陸,2018年,按評分最高,前200部,保存電影名稱,圖片鏈接,和電影評分。   由於網頁是動態加載,每頁顯示20條,每一頁的網址是變化的,需要去網頁上查看網址。   打開 ...

Mon Jun 17 06:35:00 CST 2019 0 1260
1-1 用Python豆瓣及IMDB上的電影信息

下面的代碼可以抓取豆瓣及IMDB上的電影信息,由於每段代碼使用的數據源自上一段代碼輸出的數據,所以需要按順序執行。 step1_getDoubanMovies.py step2_getScore.py ...

Tue May 17 01:54:00 CST 2016 1 1612
Python爬蟲入門 | 豆瓣電影信息

這是一個適用於小白的Python爬蟲免費教學課程,只有7節,讓零基礎的你初步了解爬蟲,跟着課程內容能自己資源。看着文章,打開電腦動手實踐,平均45分鍾就能學完一節,如果你願意,今天內你就可以邁入爬蟲的大門啦~ ps注意:很多人學Python過程中會遇到各種煩惱問題,沒有人幫答疑容易放棄。為此 ...

Thu Mar 12 21:36:00 CST 2020 0 1933
Python豆瓣電影top

Python豆瓣電影top250 下面以四種方法去解析數據,前面三種以插件庫來解析,第四種以正則表達式去解析。 xpath pyquery beaufifulsoup re 信息:名稱 評分 小評 結果顯示 使用xpath ...

Sun Aug 18 21:32:00 CST 2019 0 1028
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM