關於在scrapy中使用xpath

本文轉載自查看原文 2019-03-28 21:08 504 爬蟲

1. 還是以虎嗅為例,他給我返回的是一個json格式的json串

2.那么我需要操作的就是把json串轉換成我們的字典格式再進行操作

str=json.loads(response.body)['data']  #這邊是拿到響應體數據,然后進行序列化成字典,拿到字典中key為data的的值.是一個字符串

3.自己導入選擇器

from scrapy.selector import Selector

4.使用Selector的xpath方法獲取內容

result = Selector(text=你從json提取出來的str).xpath('你的xpath表達式').extract()

5.使用效果

　　我把上一篇虎嗅的在parse中修改了來示范一下

 #處理數據
    def parse(self, response):
        str=json.loads(response.body)['data']
        result = Selector(text=str).xpath('//div[@class="mod-b mod-art"]/div[3]/h2/a/text()').extract()
        print('result===',result)
        #這邊處理比較難以理解,要多看看

5.文檔

　　當輸入 response.selector 時， 您將獲取到一個可以用於查詢返回數據的selector(選擇器)， 
以及映射到 response.selector.xpath() 、 response.selector.css() 的 
快捷方法(shortcut): response.xpath() 和 response.css() 。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Scrapy中對xpath使用re python中使用XPath python中使用XPath scrapy中使用代理在Scrapy中使用Selenium Scrapy下xpath基本的使用方法 scrapy中的xpath中的re使用 python中使用XPath筆記 scrapy中使用 IP 代理 XPath語法在C#中使用XPath示例