Jsoup笔记

本文转载自查看原文 2019-05-28 21:02 458

Jsoup是一款Java 的HTML(html也是XML文档)解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery选择器的操作方法来取出和操作数据。所以使用jsoup就可以解析HTML。
Jsoup使用的是DOM解析方式，把整个HTML文档（XML文档）加载到内存中形成一棵DOM树，得到文档的Document对象。HTML里的标签，会转换成Element对象。
jar包：

三、Jsoup的API介绍

Jsoup类提供了三种常用方法：

Document提供提供了常用方法：

方法	参数	返回值	说明
getElementById(id)	id:标签的id	Element
getElementsByTag(tagName)	tagName：标签名称	Elements
getElementsByClass(className)	className：类名	Elements
getElementsByAttribute(attrName)	attrName：属性名	Elements
parent()		Element
children()		Elements

Element：标签转换成的一个对象

Elements：本质是ArrayList<Element>，是一个Element的集合

css-like语法

Elements elements = document.select(String cssQuery)
- Document对象可以使用此方法：从整个html文档里查找
- Element对象也可以使用此方法：从某Element标签内部查找
- Elements对象也可以使用此方法：从一批Elements标签内部查找

Element和Elements提供了获取数据的方法：

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 Jsoup（一）Jsoup详解（官方） jsoup入门 JSOUP 爬虫 jsoup教程基于jsoup的爬虫 [转]Jsoup（一）Jsoup详解（官方） Jsoup（四）-- Jsoup获取DOM元素属性值 Jsoup解析Xml{详解} 使用 jsoup 解析HTML jsoup的介绍使用(转)