python 使用xpath獲取網頁標簽內容

本文轉載自查看原文 2022-04-18 19:30 903 Python

獲取指定html的標簽內容

打開網頁的開發者模式,得到路徑標簽，然后加上/text() 即可得到標簽的文本內容
//*[@id="sonsyuanwen"]/div[1]/h1

對於網頁爬取來說，還是很方便的

# -*- ecoding: utf-8 -*-
# @ModuleName: test005
# @Function: 
# @Author: darling
# @Time: 2022-04-18 13:58

import requests

from lxml import etree


def get_url():
    resource = requests.get('https://so.gushiwen.cn/shiwenv_444df93c9bdf.aspx')
    html = etree.HTML(resource.text)
    title = html.xpath('//*[@id="sonsyuanwen"]/div[1]/h1/text()')
    neir=html.xpath('//*[@id="contson444df93c9bdf"]/text()')
    print(title,neir)
    return resource


if __name__ == "__main__":
    res = get_url()
    print(res)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python使用xpath獲取內容 xpath獲取標簽對本身含內容, 獲取html內容 xpath提取標簽和內容使用Xpath從網頁中獲取數據 Python爬蟲十六式 - 第四式: 使用Xpath提取網頁內容用正則獲取網頁中的標簽內容 python簡單使用xpath查找網頁元素 Python Xpath 提取html整個元素（標簽與內容） Python獲取網頁指定內容(BeautifulSoup工具的使用方法) Python獲取網頁指定內容(BeautifulSoup工具的使用方法)