scrapy爬蟲中如何實現翻頁請求

本文轉載自查看原文 2018-11-22 21:44 2944 爬蟲/ 翻頁請求

通過scrapy.Request實現翻頁請求：

 scrapy.Request(url, callback=None, method='GET', headers=None, body=None, cookies=None, meta=None,
                         encoding='utf-8', priority=0, dont_filter=False, errback=None, flags=None)

這里一爬取騰訊招聘網站的崗位信息為例制作一個爬蟲進行翻頁請求的實現

 1 # -*- coding: utf-8 -*-
 2 import scrapy
 3 
 4 
 5 class HrSpider(scrapy.Spider):
 6     name = 'Hr'
 7     allowed_domains = ['tencent.com']
 8     start_urls = ['https://hr.tencent.com/position.php']
 9 
10     def parse(self, response):
11         tr_list=response.xpath("//table[@class='tablelist']/tr")[1:-1]
12         for tr in tr_list:
13             item={}
14             item["title"]=tr.xpath("./td[1]/a/text()").extract_first()
15             item["postion"]=tr.xpath("./td[2]/text()").extract_first()
16             item["publish_date"]=tr.xpath("./td[5]/text()").extract_first()
17             yield item
18         #找到下一頁的URL地址,實現翻頁請求
19         next_url=response.xpath("//a[@id='next']/@href").extract_first()
20         if next_url !=" javascript:;":
21             next_url="https://hr.tencent.com/"+next_url
22             yield scrapy.Request(
23                 next_url,
24                 callback=self.parse
25             )

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Scrapy爬蟲案例01——翻頁爬取 34.scrapy解決爬蟲翻頁問題如何實現在scrapy調試爬蟲爬蟲--Scrapy-參數等級和請求傳參爬蟲scrapy組件請求傳參,post請求,中間件 scrapy實現post請求與請求傳參如何在vscode中調試python scrapy爬蟲爬蟲（十三）：scrapy中pipeline的用法爬蟲（十五）：scrapy中的settings詳解 Scrapy爬蟲(九)：scrapy的調試技巧