Python3 BeautifulSoup和Pyquery解析库随笔

本文转载自查看原文 2018-07-02 12:44 987 爬虫模块

BeautifuSoup和Pyquery解析库方法比较

1.对象初始化：

BeautifySoup库：

1 from bs4 import BeautifulSoup
2 
3 html = 'html string......'
4 soup = BeautifulSoup(html, 'lxml')

Pyquery库：

1 from pyquery import PyQuery as pq
2 
3 # 以字符串初始化
4 html = 'html string...'
5 doc = pq(html)
6 # 以url初始化
7 doc = pq(url='https://....')
8 # 以文件初始化
9 doc = pq(filename='XXX.html')

2. 节点属性获取：

BeautifuSoup库：

1 # 在根据节点选择器、方法选择器或者CSS选择器，选择出节点（例如：li）后，两种方法获取属性值
2 value = li['attr_name']
3 value = li.attrs['attr_name']

Pyquery库：

1 # 在根据CSS选择器定位到节点（例如li）后，两种方法获取属性值
2 value = li.attr.attr_name
3 value = li.attr('attr_name')

3. 文本内容获取：

BeautifulSoup库：

# 在根据节点选择器、方法选择器或者CSS选择器，选择出节点（例如：li）后，两种方法获取属性值
text = li.string
text = li.get_text()

Pyquery库：

1 # 在根据CSS选择器定位到节点（例如li）后
2 text = li.text()

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 爬虫之解析库-----re、beautifulsoup、pyquery python中pyquery库的css选择器实战解析小白学 Python 爬虫（23）：解析库 pyquery 入门 pyquery 的用法 --爬虫解析库 python3 BeautifulSoup模块 python3 爬虫之Pyquery的使用方法 03 解析库beautifulsoup 爬虫解析库——BeautifulSoup python3用BeautifulSoup抓取a标签 python BeautifulSoup库详解