08.06自我總結
python爬蟲網頁解析之parsel模塊
一.parsel模塊安裝
官網鏈接https://pypi.org/project/parsel/1.0.2/
pip install parsel==1.0.2
二.模塊作用
改模塊主要用來將請求后的字符串格式解析成re,xpath,css進行內容的匹配
三.使用
import requests
import parsel
response = requests.get(url)
sel = parsel.Selector(response.text) #注意這里的S要大寫
# re正則
# print(sel.re('正則匹配格式'))
# xpath
# print(sel.xpath('xpath').getall()) #getall獲取所有
# css選擇器
# print(sel.css('css選擇器 ::text').extract_first())#獲取第一個