xpath提取網頁的所有href標簽


from lxml import etree

html = "需要解析的網頁"
html = etree.HTML(html)
#獲取所有的href屬性
url_list = html.xpath("//*/@href")

for url in url_list:
    print(url)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM