xpath提取网页的所有href标签

本文转载自查看原文 2020-10-16 17:31 1318 爬虫相关问题

from lxml import etree

html = "需要解析的网页"
html = etree.HTML(html)
#获取所有的href属性
url_list = html.xpath("//*/@href")

for url in url_list:
    print(url)

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 xpath提取目录下所有标签内的内容，递归 //text（）使用 xpath helper 提取网页链接 [PHP] xpath提取网页数据内容 xpath提取多个标签下的text 用python selenium提取网页中的所有标签中的超级链接地址 xpath获取当前标签下的所有文本获取网页中所有的标签 xpath下的 href和text() xpath表达式，提取标签下的全部内容（将其他标签过滤） WebBrowser网页操作之提取获取元素和标签（完整篇）