Python項目實踐--當當和豆瓣圖書爬蟲

本文轉載自查看原文 2020-04-01 16:15 750 Scrapy/ Python項目實踐

接口地址：

把isbn替換為實際需要查詢圖書的isbn編號即可。

選用的爬蟲框架是Scrapy，具體學習文檔可參考：

官方文檔：https://scrapy.org/

網頁解析部分，如果是靜態網頁可以直接對返回的數據進行解析。

針對動態網頁，最終選用的方案是Selenium Chrome方案。分析過程見以下文檔：

這里主要分為三部分內容：

(1) 抓取各大免費代理，從實際效果來看，可用的合法代理還是比較少的。

(2) 當當圖書抓取。

(3) 豆瓣圖書抓取。

中間件部分針對抓取圖書和抓取代理、使用免費代理和付費代理做了區分。

（持續整理中）

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 爬蟲之獲取當當網全部圖書 Python爬蟲-爬取豆瓣圖書Top250 爬蟲系列之豆瓣圖書排行【python爬蟲】爬取當當網TOP500圖書暢銷榜爬蟲實踐-爬取豆瓣網圖書TOP250的數據爬蟲之爬取豆瓣圖書的評論 Python爬蟲筆記：爬取豆瓣圖書TOP250單頁數據 python爬蟲實踐——爬取“豆瓣top250” Python網絡爬蟲——當當網 python豆瓣的簡單爬蟲