XML--解析

本文轉載自查看原文 2020-06-21 08:40 744 xml

XML--解析

博客說明

文章所涉及的資料來自互聯網整理和個人總結，意在於個人學習和經驗匯總，如有什么地方侵權，請聯系本人刪除，謝謝！

解析

操作xml文檔，將文檔中的數據讀取到內存中

操作xml文檔

解析(讀取)：將文檔中的數據讀取到內存中
寫入：將內存中的數據保存到xml文檔中。持久化的存儲

解析xml的方式

DOM：將標記語言文檔一次性加載進內存，在內存中形成一顆dom樹
- 優點：操作方便，可以對文檔進行CRUD的所有操作
- 缺點：占內存
SAX：逐行讀取，基於事件驅動的。
- 優點：不占內存。
- 缺點：只能讀取，不能增刪改

xml常見的解析器

JAXP：sun公司提供的解析器，支持dom和sax兩種思想
DOM4J：一款非常優秀的解析器
Jsoup：jsoup 是一款Java 的HTML解析器，可直接解析某個URL地址、HTML文本內容。它提供了一套非常省力的API，可通過DOM，CSS以及類似於jQuery的操作方法來取出和操作數據。
PULL：Android操作系統內置的解析器，sax方式的。

Jsoup快速入門

步驟：
1. 導入jar包
2. 獲取Document對象
3. 獲取對應的標簽Element對象
4. 獲取數據

代碼

					//2.1獲取student.xml的path
	        String path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();
	        //2.2解析xml文檔，加載文檔進內存，獲取dom樹--->Document
	        Document document = Jsoup.parse(new File(path), "utf-8");
	        //3.獲取元素對象 Element
	        Elements elements = document.getElementsByTag("name");
	        System.out.println(elements.size());
	        //3.1獲取第一個name的Element對象
	        Element element = elements.get(0);
	        //3.2獲取數據
	        String name = element.text();
	        System.out.println(name);

對象的使用

	1. Jsoup：工具類，可以解析html或xml文檔，返回Document
     * parse：解析html或xml文檔，返回Document
         * parse(File in, String charsetName)：解析xml或html文件的。
         * parse(String html)：解析xml或html字符串
         * parse(URL url, int timeoutMillis)：通過網絡路徑獲取指定的html或xml的文檔對象

Document：文檔對象。代表內存中的dom樹
- 獲取Element對象
  - getElementById(String id)：根據id屬性值獲取唯一的element對象
  - getElementsByTag(String tagName)：根據標簽名稱獲取元素對象集合
  - getElementsByAttribute(String key)：根據屬性名稱獲取元素對象集合
  - getElementsByAttributeValue(String key, String value)：根據對應的屬性名和屬性值獲取元素對象集合
Elements：元素Element對象的集合。可以當做 ArrayList 來使用
Element：元素對象
1. 獲取子元素對象
  - getElementById(String id)：根據id屬性值獲取唯一的element對象
  - getElementsByTag(String tagName)：根據標簽名稱獲取元素對象集合
  - getElementsByAttribute(String key)：根據屬性名稱獲取元素對象集合
  - getElementsByAttributeValue(String key, String value)：根據對應的屬性名和屬性值獲取元素對象集合
2. 獲取屬性值
  - String attr(String key)：根據屬性名稱獲取屬性值
3. 獲取屬性值
  - String attr(String key)：根據屬性名稱獲取屬性值
4. 獲取文本內容
  - String text():獲取文本內容
  - String html():獲取標簽體的所有內容(包括字標簽的字符串內容)

5、Node：節點對象

是Document和Element的父類

快捷查詢方式

selector:選擇器
- 使用的方法：Elements select(String cssQuery)
  - 語法：參考Selector類中定義的語法

XPath：XPath即為XML路徑語言，它是一種用來確定XML（標准通用標記語言的子集）文檔中某部分位置的語言

使用Jsoup的Xpath需要額外導入jar包。

代碼：

        //1.獲取student.xml的path
	        String path = JsoupDemo6.class.getClassLoader().getResource("student.xml").getPath();
	      //2.獲取Document對象
	        Document document = Jsoup.parse(new File(path), "utf-8");
        //3.根據document對象，創建JXDocument對象
        JXDocument jxDocument = new JXDocument(document);

        //4.結合xpath語法查詢
        //4.1查詢所有student標簽
        List<JXNode> jxNodes = jxDocument.selN("//student");
        for (JXNode jxNode : jxNodes) {
            System.out.println(jxNode);
        }

        System.out.println("--------------------");

        //4.2查詢所有student標簽下的name標簽
        List<JXNode> jxNodes2 = jxDocument.selN("//student/name");
        for (JXNode jxNode : jxNodes2) {
            System.out.println(jxNode);
        }

        System.out.println("--------------------");

        //4.3查詢student標簽下帶有id屬性的name標簽
        List<JXNode> jxNodes3 = jxDocument.selN("//student/name[@id]");
        for (JXNode jxNode : jxNodes3) {
            System.out.println(jxNode);
        }
        System.out.println("--------------------");
        //4.4查詢student標簽下帶有id屬性的name標簽 並且id屬性值為itcast

        List<JXNode> jxNodes4 = jxDocument.selN("//student/name[@id='itcast']");
        for (JXNode jxNode : jxNodes4) {
            System.out.println(jxNode);
        }

感謝

黑馬程序員

萬能的網絡

以及勤勞的自己
關注公眾號：歸子莫，獲取更多的資料，還有更長的學習計划

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 XML--簡介和基本用法 XML--約束【譯】用jQuery 處理XML-- jQuery與XML XML--將XML中數據提取出轉換成表 XML解析（pull解析） XML解析與JSON解析 xml解析 xml規范及xml解析【Python】 xml解析與生成 xml Boost解析xml——xml寫入