python 使用xpath获取网页标签内容

本文转载自查看原文 2022-04-18 19:30 903 Python

获取指定html的标签内容

打开网页的开发者模式,得到路径标签，然后加上/text() 即可得到标签的文本内容
//*[@id="sonsyuanwen"]/div[1]/h1

对于网页爬取来说，还是很方便的

# -*- ecoding: utf-8 -*-
# @ModuleName: test005
# @Function: 
# @Author: darling
# @Time: 2022-04-18 13:58

import requests

from lxml import etree


def get_url():
    resource = requests.get('https://so.gushiwen.cn/shiwenv_444df93c9bdf.aspx')
    html = etree.HTML(resource.text)
    title = html.xpath('//*[@id="sonsyuanwen"]/div[1]/h1/text()')
    neir=html.xpath('//*[@id="contson444df93c9bdf"]/text()')
    print(title,neir)
    return resource


if __name__ == "__main__":
    res = get_url()
    print(res)

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 xpath提取标签和内容使用Xpath从网页中获取数据用正则获取网页中的标签内容 Python Xpath 提取html整个元素（标签与内容）获取网页内容生成html，并将某些标签属性进行修改 (基于python3.6) 解析xpath获取到的标签 python3获取一个网页特定内容使用CefSharp获取A标签中的内容 xpath获取a标签下文本 Python爬虫：lxml模块分析并获取网页内容