使用xpath提取頁面所有a標簽的href屬性值

本文轉載自查看原文 2019-12-18 22:36 22471 python腳本學習/ python腳本

# -*- coding: utf-8 -*-

#1.選取節點
#獲取所有的div元素 //div
#/代表獲取根節點的直接子元素
#獲取所有帶有id屬性的div //div[@id]
#2.謂詞(索引從1開始)
#獲取body下面的第一個/最后一個div元素/前兩個 //body/div[1] //body/div[last()] //body/div[position<3]
#獲取具有class='price'屬性的div標簽 //div[@class='price']
#3.通配符
# * |
#4.運算符 and or 

import requests
from lxml import etree

url = "http://www.baidu.com"
resp = requests.get(url)
resp.encoding="utf-8"

html = etree.HTML(resp.text)
#獲取所有a標簽的href屬性
linklist = html.xpath("//a/@href")

for item in linklist:
    print(item)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 xpath提取網頁的所有href標簽 jQuery獲取頁面所有a標簽對應的href屬性值使用 lxml 中的 xpath 高效提取文本與標簽屬性值使用 lxml 中的 xpath 高效提取文本與標簽屬性值 C#Xpath解析HtmlDocument的使用方法與遞歸取得頁面所有標簽xpath值（附源碼）獲取頁面所有a標簽href Python——XPath提取某個標簽下所有文本使用xpath進行熟悉href屬性 xpath提取目錄下所有標簽內的內容，遞歸 //text（） PHP替換HTML文件中所有a標簽的HREF屬性，其他不變