XML解析的深度解讀

本文轉載自查看原文 2018-01-09 15:15 2100 java基礎/ parseXML

一、XML是什么？有什么用？

XML是指可擴展標記語言(eXtensible MarkupLanguage)，它是一種標記語言。它被設計的宗旨是描述數據（XML），而非顯示數據（HTML）。

目前遵循的是W3C組織於2000年發布的XML1.0規范

應用場景：

1、描述數據

2、作為配置文件存在

二、XML的基本語法

1、文檔聲明：很重要

在編寫XML文檔時，需要先使用文檔聲明來聲明XML文檔。且必須出現在文檔的第一行。

作用：告知解析器，我是一個XML文檔。

最簡單的聲明語法：

<?xml version="1.0"?> 中間不要加空格，后面加？號

當我們寫好的一個xml文件寫入內存的時候會轉換為二進制保存，這個時候會查碼表，記事本保存的時候是gbk，而保存的時候默認查碼表時用的是utf-8，

這個時候我們就可以用encoding屬性：默認是UTF-8 <?xml version="1.0" encoding="GBK"?>，這樣就可以解決亂碼等問題。

standlone屬性：該xml文件是否獨立存在。

2、元素（標簽）

XML語法非常嚴格。不能夠省略結束標簽。

一個XML文檔必須有且僅有一個根標簽

XML中不會忽略主體內容中出現的空格和換行

元素(標簽)的名稱可以包含字母、數字、減號、下划線和英文句點，但必須遵守下面的一些規范：

l 嚴格區分大小寫；<P> <p>

l 只能以字母或下划線開頭；abc _abc

l 不能以xml(或XML、Xml等)開頭----W3C保留日后使用；

l 名稱字符之間不能有空格或制表符；ab

l 名稱字符之間不能使用冒號； (有特殊用途)

3、元素的屬性

屬性值一定要用引號(單引號或雙引號)引起來

元素中屬性不允許重復

4、注釋

XML中的注釋語法為：

XML聲明之前不能有注釋不允許第一行寫注釋(不同於java)

5、CDATA區

Character Data：字符數據。

語法：

<![CDATA[

內容

]]>

作用：

被CDATA包圍的內容，都是普通的文本字符串。

6、特殊字符

特殊字符替代符號

& &amp

< &lt

> &gt

" &quot

' &apos

7、處理指令(PI:ProcessingInstruction)（了解）

XML聲明就是一種處理指令

處理指令：<?指令名稱屬性?>

[java] view plain copy

<?xml version="1.0" encoding="GBK"?>
<?xml-stylesheet type="text/css" href="main.css"?>
<world>
<chinese>中國</chinese>
<america>美國</america>
<japan>小日本</japan>
</world>

三、XML的約束

XML可以自定義。如果作為配置文件。

格式良好的XML文檔：遵循XML語法的。

有效的XML文檔：遵守約束的XML文檔。

有效的XML文檔必定是格式良好的，但良好的不一定是有效的。

1、DTD約束：（能看懂DTD即可）

a、DTD(Document Type Definition)：文檔類型定義

作用：約束XML的書寫規范

注意：dtd可以寫在單獨的文件中，擴展名是dtd，且必須使用UTF-8編碼進行保存。

b、XML文檔中如何導入DTD約束文檔（XML外部）

l dtd文檔在本地：

<!DOCTYPE 根元素 SYSTEM "dtd文件的路徑">

l dtd文檔在網絡上：

<!DOCTYPE 根元素 PUBLIC "dtd名稱" "DTD文檔的URL鏈接地址">

c、了解：也可以把DTD的內容直接寫在XML文檔內部。

寫在XML文檔內部，dtd沒有編碼要求。（了解）

[java] view plain copy

<?xml version="1.0" encoding="GBK"?>
<!DOCTYPE 書架 [
<!ELEMENT 書架 (書+)>
<!ELEMENT 書 (書名,作者,售價)>
<!ELEMENT 書名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售價 (#PCDATA)>
<!ATTLIST 書
ISBN ID #REQUIRED
COMMENT CDATA #IMPLIED
出版社 CDATA "指令匯公司"
>
<!ENTITY copyright "指令匯公司">
]>
<書架>
<書 ISBN="a" COMMENT="ddd" 出版社="指令匯公司">
<書名>Java就業培訓教程</書名>
<作者>&copyright;</作者>
<售價>39.00元</售價>
</書>
<書 ISBN="b">
<書名>JavaScript網頁開發</書名>
<作者>張孝祥</作者>
<售價>28.00元</售價>
</書>
</書架>

練習：

[java] view plain copy

<?xml version="1.0" encoding="GBK"?>
<!DOCTYPE TVSCHEDULE [
<!ELEMENT TVSCHEDULE (CHANNEL+)>
<!ELEMENT CHANNEL (BANNER,DAY+)>
<!ELEMENT BANNER (#PCDATA)>
<!ELEMENT DAY (DATE,(HOLIDAY|PROGRAMSLOT+)+)>
<!ELEMENT HOLIDAY (#PCDATA)>
<!ELEMENT DATE (#PCDATA)>
<!ELEMENT PROGRAMSLOT (TIME,TITLE,DESCRIPTION?)>
<!ELEMENT TIME (#PCDATA)>
<!ELEMENT TITLE (#PCDATA)>
<!ELEMENT DESCRIPTION (#PCDATA)>
<!ATTLIST TVSCHEDULE NAME CDATA #REQUIRED>
<!ATTLIST CHANNEL CHAN CDATA #REQUIRED>
<!ATTLIST PROGRAMSLOT VTR CDATA #IMPLIED>
<!ATTLIST TITLE RATING CDATA #IMPLIED>
<!ATTLIST TITLE LANGUAGE CDATA #IMPLIED>
]>
<TVSCHEDULE NAME="NN">
<CHANNEL CHAN="CC">
<BANNER>AAA</BANNER>
<DAY>
<DATE>2015</DATE>
<PROGRAMSLOT>
<TIME>ee</TIME>
<TITLE>bb</TITLE>
<DESCRIPTION>cc</DESCRIPTION>
</PROGRAMSLOT>
</DAY>
</CHANNEL>
</TVSCHEDULE>

2、Schema約束（新，有替換DTD的趨勢）

四、利用Java代碼解析XML文檔

1、解析方式

l DOM：Document Object Model，文檔對象模型。這種方式是W3C推薦的處理XML的一種標准方式。

缺點：必須讀取整個XML文檔，才能構建DOM模型，如果XML文檔過大，造成資源的浪費。

優點：適合對XML中的數據進行操作（CRUD）。

l SAX：Simple API for XML。這種方式不是官方標准，屬於開源社區XML-DEV，幾乎所有的XML解析器都支持它。

2、解析工具

JAXP：

DOM或SAX方式進行解析XML。API在JDK之中。

Dom4J：（推薦）

是開源組織推出的解析開發包。(牛，大家都在用，包括SUN公司的一些技術的實現都在用)

五、JAXP進行DOM方式解析XML基本練習

1、JAXP簡介：

開發包：（JDK中）

DOM：W3C。org.w3c.dom.* DOM規范。（接口/抽象類）

SAX：開源組織。org.xml.sax.* SAX規范。（接口/抽象類）

JAXP：javax.xml.*

2、利用JAXP進行DOM方式解析

[java] view plain copy

//JAXP進行DOM方式解析的基本操作
public class JaxpDemo1 {
public static void main(String[] args) throws Exception {
//得到解析器
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
//通過解析器就可以得到代表整個內存中XML的Document對象
Document document = builder.parse("src/book.xml");
test8(document);
}
// 1、得到某個具體的節點內容: 劉豐
private static void test1(Document document){
NodeList nl = document.getElementsByTagName("作者");
Node authorNode = nl.item(0);
System.out.println(authorNode.getTextContent());
}
// 2、遍歷所有元素節點:打印元素的名稱
private static void test2(Node node){
//確定node的類型
//方式一
// if(node.getNodeType()==Node.ELEMENT_NODE){
// //是元素
// }
//方式二
if(node instanceof Element){
//是元素
Element e = (Element)node;
System.out.println(e.getNodeName());//打印元素名稱
}
//判斷有沒有子節點
NodeList nl = node.getChildNodes();
for(int i=0;i<nl.getLength();i++){
Node n = nl.item(i);
test2(n);
}
}
// 3、修改某個元素節點的主體內容:<售價>39.00元</售價>--->10元
private static void test3(Document document) throws Exception{
//得到售價
Node priceNode = document.getElementsByTagName("售價").item(0);
priceNode.setTextContent("10元");
//更新XML文件
TransformerFactory tf = TransformerFactory.newInstance();
Transformer t = tf.newTransformer();
//構建輸入源：
Source source = new DOMSource(document);
//構建目標：
Result result = new StreamResult("src/book.xml");
t.transform(source, result);
}
// 4、向指定元素節點中增加子元素節點:第一本書添加子元素 <出版社>黑馬程序員</出版社>
private static void test4(Document document) throws Exception{
//創建：<出版社>黑馬程序員</出版社>
Element e = document.createElement("出版社");
e.setTextContent("黑馬程序員");
//得到書，把新節點掛上去
Node bookNode = document.getElementsByTagName("書").item(0);
bookNode.appendChild(e);
//更新XML文件
TransformerFactory tf = TransformerFactory.newInstance();
Transformer t = tf.newTransformer();
//構建輸入源：
Source source = new DOMSource(document);
//構建目標：
Result result = new StreamResult("src/book.xml");
t.transform(source, result);
}
// 5、向指定元素節點上增加同級元素節點:第一本書<售價>前面添加<批發價>30</批發價>
private static void test5(Document document) throws Exception{
//創建新節點
Element e = document.createElement("批發價");
e.setTextContent("30元");
//找到<售價>
Node priceNode = document.getElementsByTagName("售價").item(0);
//父標簽：調用insertBefore(新節點,參考節點);
Node bookNode = priceNode.getParentNode();
bookNode.insertBefore(e, priceNode);
//更新XML文件
TransformerFactory tf = TransformerFactory.newInstance();
Transformer t = tf.newTransformer();
//構建輸入源：
Source source = new DOMSource(document);
//構建目標：
Result result = new StreamResult("src/book.xml");
t.transform(source, result);
}
// 6、刪除指定元素節點:刪除批發價
private static void test6(Document document) throws Exception{
Node priceNode = document.getElementsByTagName("批發價").item(0);
priceNode.getParentNode().removeChild(priceNode);
//更新XML文件
TransformerFactory tf = TransformerFactory.newInstance();
Transformer t = tf.newTransformer();
//構建輸入源：
Source source = new DOMSource(document);
//構建目標：
Result result = new StreamResult("src/book.xml");
t.transform(source, result);
}
// 7、操作XML文件屬性:書籍添加一個屬性：ISBN=“ABC”
private static void test7(Document document) throws Exception{
Node bookNode = document.getElementsByTagName("書").item(0);
if(bookNode instanceof Element){
Element e = (Element)bookNode;
e.setAttribute("ISBN", "ABC");
}
//更新XML文件
TransformerFactory tf = TransformerFactory.newInstance();
Transformer t = tf.newTransformer();
//構建輸入源：
Source source = new DOMSource(document);
//構建目標：
Result result = new StreamResult("src/book.xml");
t.transform(source, result);
}
// 8、操作XML文件屬性:獲取ISBN=“ABC”
private static void test8(Document document) throws Exception{
Node bookNode = document.getElementsByTagName("書").item(0);
if(bookNode instanceof Element){
Element e = (Element)bookNode;
System.out.println(e.getAttribute("ISBN"));
}
}
}

3、DOM小案例

a、建立xml文件

[java] view plain copy

<?xml version="1.0" encoding="UTF-8" standalone="no"?><exam>
<student examid="222" idcard="111">
<name>劉豐</name>
<location>湖北</location>
<grade>100</grade>
</student>
<student examid="dsf" idcard="2342"><name>dsf</name><location>435</location><grade>654.0</grade></student></exam>

b、代碼要精細。要分層。

DAO:com.zhilinghui.dao

VIEW:com.zhilinghui.view

JavaBean:com.zhilinghui.domain(領域)

c、設計JavaBean

[java] view plain copy

public class Student {
private String idcard;
private String examid;
private String name;
private String location;
private float grade;
public Student(){}
public Student(String idcard, String examid, String name, String location,
float grade) {
super();
this.idcard = idcard;
this.examid = examid;
this.name = name;
this.location = location;
this.grade = grade;
}
public String getIdcard() {
return idcard;
}
public void setIdcard(String idcard) {
this.idcard = idcard;
}
public String getExamid() {
return examid;
}
public void setExamid(String examid) {
this.examid = examid;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getLocation() {
return location;
}
public void setLocation(String location) {
this.location = location;
}
public float getGrade() {
return grade;
}
public void setGrade(float grade) {
this.grade = grade;
}
@Override
public String toString() {
return "Student [idcard=" + idcard + ", examid=" + examid + ", name="
+ name + ", location=" + location + ", grade=" + grade + "]";
}
}

d、開發DAO

數據訪問對象

[java] view plain copy

public class StudentDao {
/**
* 保存學生信息到XML文件中
* @param student 封裝要保存的信息
* @return 成功返回true，否則false
* @throws Exception
*/
public boolean save(Student student) throws Exception{
if(student==null)
throw new IllegalArgumentException("學生參數不能為null");
boolean result = false;
/*
* <student idcard="111" examid="222">
<name>劉豐</name>
<location>湖北</location>
<grade>100</grade>
</student>
*/
//得到Document
Document document = JaxpUtil.getDocument();
//創建一個student元素：設置屬性
Element studentE = document.createElement("student");//<student></student>
studentE.setAttribute("idcard", student.getIdcard());
studentE.setAttribute("examid", student.getExamid());//<student idcard="111" examid="222"></student>
//創建name，location，grade元素，掛到student上
Element nameE = document.createElement("name");
nameE.setTextContent(student.getName());//<name>劉豐</name>
Element locationE = document.createElement("location");
locationE.setTextContent(student.getLocation());//<location>湖北</location>
Element gradeE = document.createElement("grade");
gradeE.setTextContent(student.getGrade()+"");//<grade>100</grade>
studentE.appendChild(nameE);
studentE.appendChild(locationE);
studentE.appendChild(gradeE);
//把student掛接到exam上
Node examNode = document.getElementsByTagName("exam").item(0);
examNode.appendChild(studentE);
//寫到xml中
JaxpUtil.wirte2xml(document);
//更改result的取值為true
result = true;
return result;
}
/**
* 根據姓名刪除信息
* @param name
* @return 成功返回true，否則false
*/
public boolean delete(String name){
boolean result = false;
try {
Document document = JaxpUtil.getDocument();
//得到所有的name元素
NodeList nl = document.getElementsByTagName("name");
//遍歷：比對文本內容是否和參數一樣
for(int i=0;i<nl.getLength();i++){
if(nl.item(i).getTextContent().equals(name)){
//如果找到了一樣的：爺爺干掉爸爸
nl.item(i).getParentNode().getParentNode().removeChild(nl.item(i).getParentNode());
//寫回xml
JaxpUtil.wirte2xml(document);
break;
}
}
result = true;
} catch (Exception e) {
throw new RuntimeException(e);//異常轉譯
}
return result;
}
/**
* 根據准考證號查詢學生信息
* @param examid
* @return 沒有返回null
*/
public Student findByExamId(String examid){
Student student = null;
try {
Document document = JaxpUtil.getDocument();
//得到所有的student元素
NodeList nl = document.getElementsByTagName("student");
//遍歷：比對examid屬性
for(int i=0;i<nl.getLength();i++){
Element e = (Element) nl.item(i);
if(e.getAttribute("examid").equals(examid)){
// 找到了：創建student對象，並設置相應的值
student = new Student();
student.setIdcard(e.getAttribute("idcard"));
student.setExamid(examid);
student.setName(e.getElementsByTagName("name").item(0).getTextContent());
student.setLocation(e.getElementsByTagName("location").item(0).getTextContent());
student.setGrade(Float.parseFloat(e.getElementsByTagName("grade").item(0).getTextContent()));
break;
}
}
} catch (Exception e) {
throw new RuntimeException(e);//異常轉譯
}
return student;
}
}

e、測試DAO的功能

[java] view plain copy

public class StudentDaoTest {
public static void main(String[] args) {
StudentDao dao = new StudentDao();
// Student student = new Student();
// student.setIdcard("333");
//
// dao.save(student);
// Student s = dao.findByExamId("444");
// System.out.println(s);
System.out.println(dao.delete("阿嬌"));
}
}

f、開發界面

[java] view plain copy

ublic class Main {
public static void main(String[] args) throws Exception {
StudentDao dao = new StudentDao();
System.out.println("a、添加用戶\tb、查詢成績\tc、刪除用戶");
System.out.println("請輸入操作類型：");
BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
String op = br.readLine();//讀取用戶輸入的a|b|c
if("a".equals(op)){
//添加
System.out.println("請輸入學生姓名：");
String name = br.readLine();
System.out.println("請輸入學生准考證號：");
String examid = br.readLine();
System.out.println("請輸入學生身份證號：");
String idcard = br.readLine();
System.out.println("請輸入學生所在地：");
String location = br.readLine();
System.out.println("請輸入學生成績：");
String grade = br.readLine();
//封裝數據
Student student = new Student(idcard, examid, name, location, Float.parseFloat(grade));
//調用dao
boolean b = dao.save(student);
if(b){
System.out.println("------添加成功------");
}else{
System.out.println("------服務器忙------");
}
}else if("b".equals(op)){
//查詢
System.out.println("請輸入學生准考證號：");
String examid = br.readLine();
Student s = dao.findByExamId(examid);
if(s==null)
System.out.println("------查無此人------");
else
System.out.println(s);
}else if("c".equals(op)){
//刪除
System.out.println("請輸入要刪除的學生姓名：");
String name = br.readLine();
boolean b = dao.delete(name);
if(b){
System.out.println("------刪除成功------");
}else{
System.out.println("------服務器忙------");
}
}else{
System.out.println("你傻呀，輸錯了");
}
}
}

sax解析原理

在使用 DOM 解析 XML 文檔時，需要讀取整個 XML 文檔，在內存中構架代表整個 DOM 樹的Doucment對象，從而再對XML文檔進行操作。此種情況下，如果 XML 文檔特別大，就會消耗計算機的大量內存，並且容易導致內存溢出。

SAX解析允許在讀取文檔的時候，即對文檔進行處理，而不必等到整個文檔裝載完才會文檔進行操作。

SAX采用事件處理的方式解析XML文件，利用 SAX 解析 XML 文檔，涉及兩個部分：解析器和事件處理器：解析器可以使用JAXP的API創建，創建出SAX解析器后，就可以指定解析器去解析某個XML文檔。解析器采用SAX方式在解析某個XML文檔時，它只要解析到XML文檔的一個組成部分，都會去調用事件處理器的一個方法，解析器在調用事件處理器的方法時，會把當前解析到的xml文件內容作為方法的參數傳遞給事件處理器。事件處理器由程序員編寫，程序員通過事件處理器中方法的參數，就可以很輕松地得到sax解析器解析到的數據，從而可以決定如何對數據進行處理

基本解析操作

    //1解析器
    SAXParser parse = SAXParserFactory.newInstance().newSAXParser();
    //2獲取xml讀取器
    XMLReader reader = parse.getXMLReader();
    //3注冊內容處理器
    reader.setContentHandler(new ContentHandler1());
    //4讀取xml文檔
    reader.parse("src/book.xml");

封裝讀取書

封裝到BOOK.java

public class sax3 {

//封裝讀取書
    public static void main(String[] args) throws Exception {

        SAXParser parse=SAXParserFactory.newInstance().newSAXParser();

        XMLReader reader=parse.getXMLReader();

        final List<Book> books=new ArrayList<Book>();
        reader.setContentHandler(new DefaultHandler(){

           private Book b=null;
           private String currentTagName=null;
            public void startElement(String uri, String localName,
                    String qName, Attributes attributes) throws SAXException {

                if("書".equals(qName)){
                    b=new Book();
                }
                currentTagName=qName;
            }

            public void endElement(String uri, String localName, String qName)
                    throws SAXException {
                if("書".equals(qName)){
                    books.add(b);
                    b=null;
                }
                currentTagName=null;
            }
            @Override
            public void characters(char[] ch, int start, int length)
                    throws SAXException {
                if("書名".equals(currentTagName)){
                    b.setName(new String(ch,start,length));
                }
                if("作者".equals(currentTagName)){
                    b.setAuthor(new String(ch,start,length));
                }
                if("售價".equals(currentTagName)){
                    b.setPrice(new String(ch,start,length));
                }
            }
        });
        reader.parse("src/book.xml");

        for(Book book:books)
            System.out.println(book);
    }
}

dom4j解析原理

Dom4j是一個簡單、靈活的開放源代碼的庫。Dom4j是由早期開發JDOM的人分離出來而后獨立開發的。與JDOM不同的是，dom4j使用接口和抽象基類，雖然Dom4j的API相對要復雜一些，但它提供了比JDOM更好的靈活性。 Dom4j是一個非常優秀的Java XML API，具有性能優異、功能強大和極易使用的特點。現在很多軟件采用的Dom4j，例如Hibernate，包括sun公司自己的JAXM也用了Dom4j。使用Dom4j開發，需下載dom4j相應的jar文件。

1、基本練習 a、拷貝jar包：把dom4j-1.6.1.jar加入到你的classpath中 b、基本操作

// 1、得到某個具體的節點內容:jinpingmei

@Test
public void test1() throws Exception{
    SAXReader reader = new SAXReader();
    Document document = reader.read("src/book.xml");
    //首先要得到根元素
    Element root = document.getRootElement();
    List<Element> bookElements = root.elements();
//      Element bookName = (Element) bookElements.get(0).elements().get(0);
//      System.out.println(bookName.getText());
    System.out.println(bookElements.get(0).elementText("書名"));
}

// 2、遍歷所有元素節點：名稱

@Test
public void test2()throws Exception{
    SAXReader reader = new SAXReader();
    Document document = reader.read("src/book.xml");
    //首先要得到根元素
    Element root = document.getRootElement();
    treeWalk(root);
}
public void treeWalk(Element rootElement){//遞歸
    System.out.println(rootElement.getName());
    int nodeCount = rootElement.nodeCount();//子節點的數量
    for(int i=0;i<nodeCount;i++){
        Node node = rootElement.node(i);//得到一個子節點
        if(node instanceof Element){
            treeWalk((Element)node);
        }
    }
}

// 3、修改某個元素節點的主體內容：<售價>10元---20

@Test
public void test3()throws Exception{
    SAXReader reader = new SAXReader();
    Document document = reader.read("src/book.xml");
    //首先要得到根元素
    Element root = document.getRootElement();
    //得售價
    Element priceElement = root.element("書").element("售價");
    priceElement.setText("21元");
    //寫回XML文檔
//      OutputFormat format = OutputFormat.createCompactFormat();//去除空格回車換行，適合運行期間
    OutputFormat format = OutputFormat.createPrettyPrint();//漂亮的格式 默認編碼是UTF-8
    XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"), format);
    writer.write(document);
    writer.close();
}

// 4、向指定元素節點中增加子元素節點：<出版社>黑馬程序員

@Test
public void test4()throws Exception{
    SAXReader reader = new SAXReader();
    Document document = reader.read("src/book.xml");
    //首先要得到根元素
    Element root = document.getRootElement();
    //得售價
    Element bookElement = root.element("書");
    //創建新元素
    Element publisherElement = DocumentHelper.createElement("出版社");
    publisherElement.setText("黑馬程序員");

    bookElement.add(publisherElement);
    //寫回XML文檔
//      OutputFormat format = OutputFormat.createCompactFormat();//去除空格回車換行，適合運行期間
    OutputFormat format = OutputFormat.createPrettyPrint();//漂亮的格式 默認編碼是UTF-8
    XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"), format);
    writer.write(document);
    writer.close();
}

// 5、向指定元素節點上增加同級元素節點:<售價>21元添加<批發價>

@Test
public void test5()throws Exception{
    SAXReader reader = new SAXReader();
    Document document = reader.read("src/book.xml");
    //首先要得到根元素
    Element root = document.getRootElement();
    //得售價
    Element bookElement = root.element("書");
    //創建新元素
    Element priceElement = DocumentHelper.createElement("批發價");
    priceElement.setText("30元");

    List<Element> bookChildren = bookElement.elements();//得到書的子元素
    bookChildren.add(2, priceElement);

    //寫回XML文檔
//      OutputFormat format = OutputFormat.createCompactFormat();//去除空格回車換行，適合運行期間
    OutputFormat format = OutputFormat.createPrettyPrint();//漂亮的格式 默認編碼是UTF-8
    XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"), format);
    writer.write(document);
    writer.close();
}

// 6、刪除指定元素節點：批發價

@Test
public void test6()throws Exception{
    SAXReader reader = new SAXReader();
    Document document = reader.read("src/book.xml");
    //首先要得到根元素
    Element root = document.getRootElement();
    Element priceElement = root.element("書").element("批發價");

    priceElement.getParent().remove(priceElement);

    //寫回XML文檔
//      OutputFormat format = OutputFormat.createCompactFormat();//去除空格回車換行，適合運行期間
    OutputFormat format = OutputFormat.createPrettyPrint();//漂亮的格式 默認編碼是UTF-8
    XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"), format);
    writer.write(document);
    writer.close();
}

// 7、操作XML文件屬性

@Test
public void test7()throws Exception{
    SAXReader reader = new SAXReader();
    Document document = reader.read("src/book.xml");
    //首先要得到根元素
    Element root = document.getRootElement();
    Element book = root.element("書");
    System.out.println(book.attributeValue("ISBN"));
}
@Test
public void test8()throws Exception{
    SAXReader reader = new SAXReader();
    Document document = reader.read("src/book.xml");
    //首先要得到根元素
    Element root = document.getRootElement();
    Element book = root.element("書");
    book.addAttribute("A", "B");
    //寫回XML文檔
//      OutputFormat format = OutputFormat.createCompactFormat();//去除空格回車換行，適合運行期間
    OutputFormat format = OutputFormat.createPrettyPrint();//漂亮的格式 默認編碼是UTF-8
    XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"), format);
    writer.write(document);
    writer.close();
}

Xpath

XPath是一個努力為XSL轉換XSLT和XPointer [ ] [ ]之間共享一個共同的XPointer功能語法和語義的結果。它的主要目的是解決一個XML XML文檔部分[ ]。為了支持這一功能，還提供用於處理字符串的基本設施、數字和布爾值。XPath使用一個緊湊的、非XML語法方便使用在uri和XML屬性值的XPath。XPath操作基於XML文檔的邏輯結構，而不是其表面的語法。Xpath的名字來自其使用的符號在URL路徑通過一個XML文檔的層次結構導航。除了用於定位，XPath還設計有一個真子集，可用於匹配（測試一個節點是否符合一個模式）；使用XPath進行XSLT。

XPath模型的XML文檔的節點樹。有不同類型的節點，包括元素節點、屬性節點和文本節點。XPath定義了一個方法來計算每個節點類型字符串值。某些類型的節點也有名字。XPath完全支持XML命名空間的XML名稱] [。因此，一個節點的名稱被建模為一個地方的部分和一個可能的空命名空間URI；這就是所謂的擴展名。在[ 5數據模型]中詳細描述了數據模型。

@Test//Xpath
public void test11() throws Exception{
    SAXReader reader = new SAXReader();
    Document document = reader.read("src/book.xml");
    Node n = document.selectSingleNode("//書[1]/書名");
    System.out.println(n.getText());
}
@Test//Xpath：第一本書的ISBN的值
public void test12() throws Exception{
    SAXReader reader = new SAXReader();
    Document document = reader.read("src/book.xml");
    Node n = document.selectSingleNode("//書[1]");
    System.out.println(n.valueOf("@ISBN"));
}

xml約束之schema

XML Schema 也是一種用於定義和描述 XML 文檔結構與內容的模式語言，其出現是為了克服 DTD 的局限性

XML Schema 文件自身就是一個XML文件，但它的擴展名通常為.xsd。支持名稱空間。一個XML Schema文檔通常稱之為模式文檔(約束文檔)，遵循這個文檔書寫的xml文件稱之為實例文檔。

和XML文件一樣，一個XML Schema文檔也必須有一個根結點，但這個根結點的名稱為schema。

編寫了一個XML Schema約束文檔后，通常需要把這個文件中聲明的元素綁定到一個ＵＲＩ地址上，在XML Schema技術中有一個專業術語來描述這個過程，即把XML Schema文檔聲明的元素綁定到一個名稱空間上，以后XML文件就可以通過這個URI（即名稱空間）來告訴解析引擎，xml文檔中編寫的元素來自哪里，被誰約束。

學習目標：不需要我們編寫xsd 重點：根據xsd編寫出xml文檔。難點：在xml中引入xsd約束

基本操作步驟：

a、根據xsd文件，找到根元素

<?xml version="1.0" encoding="UTF-8"?>
<書架>

</書架>

b、根元素來在哪個名稱空間使用xmlns關鍵字來聲明名稱空間。

<?xml version="1.0" encoding="UTF-8"?>
<tf:書架 xmlns:tf="http://www.zhilinghui.com">

</tf:書架>

c、名稱空間和哪個xsd文件對應

<?xml version="1.0" encoding="UTF-8"?>
<tf:書架 xmlns:tf="http://www.zhilinghui.com"
    schemaLocation="http://www.zhilinghui.com book.xsd">

</tf:書架>

d、schemaLocation來自一個標准的名稱空間：固定寫法

<?xml version="1.0" encoding="UTF-8"?>
<tf:書架 xmlns:tf="http://www.zhilinghui.com"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.zhilinghui.com book.xsd">

</tf:書架>
==============================================================================================================================
DOM4J的另一種深度解讀：

DOM4J

與利用DOM、SAX、JAXP機制來解析xml相比，DOM4J 表現更優秀，具有性能優異、功能強大和極端易用使用的特點，只要懂得DOM基本概念，就可以通過dom4j的api文檔來解析xml。dom4j是一套開源的api。實際項目中，往往選擇dom4j來作為解析xml的利器。

先來看看dom4j中對應XML的DOM樹建立的繼承關系

針對於XML標准定義，對應於圖2-1列出的內容，dom4j提供了以下實現：

同時，dom4j的NodeType枚舉實現了XML規范中定義的node類型。如此可以在遍歷xml文檔的時候通過常量來判斷節點類型了。

常用API

class org.dom4j.io.SAXReader

read 提供多種讀取xml文件的方式，返回一個Domcument對象

interface org.dom4j.Document

iterator 使用此法獲取node
getRootElement 獲取根節點

interface org.dom4j.Node

getName 獲取node名字，例如獲取根節點名稱為bookstore
getNodeType 獲取node類型常量值，例如獲取到bookstore類型為1——Element
getNodeTypeName 獲取node類型名稱，例如獲取到的bookstore類型名稱為Element

interface org.dom4j.Element

attributes 返回該元素的屬性列表
attributeValue 根據傳入的屬性名獲取屬性值
elementIterator 返回包含子元素的迭代器
elements 返回包含子元素的列表

interface org.dom4j.Attribute

getName 獲取屬性名
getValue 獲取屬性值

interface org.dom4j.Text

getText 獲取Text節點值

interface org.dom4j.CDATA

getText 獲取CDATA Section值

interface org.dom4j.Comment

getText 獲取注釋

實例一：

  1 //先加入dom4j.jar包 
  2 import java.util.HashMap;
  3 import java.util.Iterator;
  4 import java.util.Map;
  5 
  6 import org.dom4j.Document;
  7 import org.dom4j.DocumentException;
  8 import org.dom4j.DocumentHelper;
  9 import org.dom4j.Element;
 10 
 11 /**   
 12 * @Title: TestDom4j.java
 13 * @Package 
 14 * @Description: 解析xml字符串
 15 * @author 無處不在
 16 * @date 2012-11-20 下午05:14:05
 17 * @version V1.0   
 18 */
 19 public class TestDom4j {
 20 
 21     public void readStringXml(String xml) {
 22         Document doc = null;
 23         try {
 24 
 25             // 讀取並解析XML文檔
 26             // SAXReader就是一個管道，用一個流的方式，把xml文件讀出來
 27             // 
 28             // SAXReader reader = new SAXReader(); //User.hbm.xml表示你要解析的xml文檔
 29             // Document document = reader.read(new File("User.hbm.xml"));
 30             // 下面的是通過解析xml字符串的
 31             doc = DocumentHelper.parseText(xml); // 將字符串轉為XML
 32 
 33             Element rootElt = doc.getRootElement(); // 獲取根節點
 34             System.out.println("根節點：" + rootElt.getName()); // 拿到根節點的名稱
 35 
 36             Iterator iter = rootElt.elementIterator("head"); // 獲取根節點下的子節點head
 37 
 38             // 遍歷head節點
 39             while (iter.hasNext()) {
 40 
 41                 Element recordEle = (Element) iter.next();
 42                 String title = recordEle.elementTextTrim("title"); // 拿到head節點下的子節點title值
 43                 System.out.println("title:" + title);
 44 
 45                 Iterator iters = recordEle.elementIterator("script"); // 獲取子節點head下的子節點script
 46 
 47                 // 遍歷Header節點下的Response節點
 48                 while (iters.hasNext()) {
 49 
 50                     Element itemEle = (Element) iters.next();
 51 
 52                     String username = itemEle.elementTextTrim("username"); // 拿到head下的子節點script下的字節點username的值
 53                     String password = itemEle.elementTextTrim("password");
 54 
 55                     System.out.println("username:" + username);
 56                     System.out.println("password:" + password);
 57                 }
 58             }
 59             Iterator iterss = rootElt.elementIterator("body"); ///獲取根節點下的子節點body
 60             // 遍歷body節點
 61             while (iterss.hasNext()) {
 62 
 63                 Element recordEless = (Element) iterss.next();
 64                 String result = recordEless.elementTextTrim("result"); // 拿到body節點下的子節點result值
 65                 System.out.println("result:" + result);
 66 
 67                 Iterator itersElIterator = recordEless.elementIterator("form"); // 獲取子節點body下的子節點form
 68                 // 遍歷Header節點下的Response節點
 69                 while (itersElIterator.hasNext()) {
 70 
 71                     Element itemEle = (Element) itersElIterator.next();
 72 
 73                     String banlce = itemEle.elementTextTrim("banlce"); // 拿到body下的子節點form下的字節點banlce的值
 74                     String subID = itemEle.elementTextTrim("subID");
 75 
 76                     System.out.println("banlce:" + banlce);
 77                     System.out.println("subID:" + subID);
 78                 }
 79             }
 80         } catch (DocumentException e) {
 81             e.printStackTrace();
 82 
 83         } catch (Exception e) {
 84             e.printStackTrace();
 85 
 86         }
 87     }
 88 
 89     /**
 90      * @description 將xml字符串轉換成map
 91      * @param xml
 92      * @return Map
 93      */
 94     public static Map readStringXmlOut(String xml) {
 95         Map map = new HashMap();
 96         Document doc = null;
 97         try {
 98             // 將字符串轉為XML
 99             doc = DocumentHelper.parseText(xml); 
100             // 獲取根節點
101             Element rootElt = doc.getRootElement(); 
102             // 拿到根節點的名稱
103             System.out.println("根節點：" + rootElt.getName()); 
104 
105             // 獲取根節點下的子節點head
106             Iterator iter = rootElt.elementIterator("head"); 
107             // 遍歷head節點
108             while (iter.hasNext()) {
109 
110                 Element recordEle = (Element) iter.next();
111                 // 拿到head節點下的子節點title值
112                 String title = recordEle.elementTextTrim("title"); 
113                 System.out.println("title:" + title);
114                 map.put("title", title);
115                 // 獲取子節點head下的子節點script
116                 Iterator iters = recordEle.elementIterator("script"); 
117                 // 遍歷Header節點下的Response節點
118                 while (iters.hasNext()) {
119                     Element itemEle = (Element) iters.next();
120                     // 拿到head下的子節點script下的字節點username的值
121                     String username = itemEle.elementTextTrim("username"); 
122                     String password = itemEle.elementTextTrim("password");
123 
124                     System.out.println("username:" + username);
125                     System.out.println("password:" + password);
126                     map.put("username", username);
127                     map.put("password", password);
128                 }
129             }
130 
131             //獲取根節點下的子節點body
132             Iterator iterss = rootElt.elementIterator("body"); 
133             // 遍歷body節點
134             while (iterss.hasNext()) {
135                 Element recordEless = (Element) iterss.next();
136                 // 拿到body節點下的子節點result值
137                 String result = recordEless.elementTextTrim("result"); 
138                 System.out.println("result:" + result);
139                 // 獲取子節點body下的子節點form
140                 Iterator itersElIterator = recordEless.elementIterator("form"); 
141                 // 遍歷Header節點下的Response節點
142                 while (itersElIterator.hasNext()) {
143                     Element itemEle = (Element) itersElIterator.next();
144                     // 拿到body下的子節點form下的字節點banlce的值
145                     String banlce = itemEle.elementTextTrim("banlce"); 
146                     String subID = itemEle.elementTextTrim("subID");
147 
148                     System.out.println("banlce:" + banlce);
149                     System.out.println("subID:" + subID);
150                     map.put("result", result);
151                     map.put("banlce", banlce);
152                     map.put("subID", subID);
153                 }
154             }
155         } catch (DocumentException e) {
156             e.printStackTrace();
157         } catch (Exception e) {
158             e.printStackTrace();
159         }
160         return map;
161     }
162 
163     public static void main(String[] args) {
164 
165         // 下面是需要解析的xml字符串例子
166         String xmlString = "<html>" + "<head>" + "<title>dom4j解析一個例子</title>"
167                 + "<script>" + "<username>yangrong</username>"
168                 + "<password>123456</password>" + "</script>" + "</head>"
169                 + "<body>" + "<result>0</result>" + "<form>"
170                 + "<banlce>1000</banlce>" + "<subID>36242519880716</subID>"
171                 + "</form>" + "</body>" + "</html>";
172 
173         /*
174          * Test2 test = new Test2(); test.readStringXml(xmlString);
175          */
176         Map map = readStringXmlOut(xmlString);
177         Iterator iters = map.keySet().iterator();
178         while (iters.hasNext()) {
179             String key = iters.next().toString(); // 拿到鍵
180             String val = map.get(key).toString(); // 拿到值
181             System.out.println(key + "=" + val);
182         }
183     }
184 
185 }

實例二：

 1 /**
 2  * 解析包含有DB連接信息的XML文件
 3  * 格式必須符合如下規范：
 4  * 1. 最多三級，每級的node名稱自定義；
 5  * 2. 二級節點支持節點屬性，屬性將被視作子節點；
 6  * 3. CDATA必須包含在節點中，不能單獨出現。
 7  *
 8  * 示例1——三級顯示：
 9  * <db-connections>
10  *         <connection>
11  *            <name>DBTest</name>
12  *            <jndi></jndi>
13  *            <url>
14  *                <![CDATA[jdbc:mysql://localhost:3306/db_test?useUnicode=true&characterEncoding=UTF8]]>
15  *             </url>
16  *            <driver>org.gjt.mm.mysql.Driver</driver>
17  *             <user>test</user>
18  *            <password>test2012</password>
19  *            <max-active>10</max-active>
20  *            <max-idle>10</max-idle>
21  *            <min-idle>2</min-idle>
22  *            <max-wait>10</max-wait>
23  *            <validation-query>SELECT 1+1</validation-query>
24  *         </connection>
25  * </db-connections>
26  *
27  * 示例2——節點屬性：
28  * <bookstore>
29  *         <book category="cooking">
30  *            <title lang="en">Everyday Italian</title>
31  *            <author>Giada De Laurentiis</author>
32  *            <year>2005</year>
33  *            <price>30.00</price>
34  *         </book>
35  *
36  *         <book category="children" title="Harry Potter" author="J K. Rowling" year="2005" price="$29.9"/>
37  * </bookstore>
38  *
39  * @param configFile
40  * @return
41  * @throws Exception
42  */
43 public static List<Map<String, String>> parseDBXML(String configFile) throws Exception {
44     List<Map<String, String>> dbConnections = new ArrayList<Map<String, String>>();
45     InputStream is = Parser.class.getResourceAsStream(configFile);
46     SAXReader saxReader = new SAXReader();
47     Document document = saxReader.read(is);
48     Element connections = document.getRootElement();
49 
50     Iterator<Element> rootIter = connections.elementIterator();
51     while (rootIter.hasNext()) {
52         Element connection = rootIter.next();
53         Iterator<Element> childIter = connection.elementIterator();
54         Map<String, String> connectionInfo = new HashMap<String, String>();
55         List<Attribute> attributes = connection.attributes();
56         for (int i = 0; i < attributes.size(); ++i) { // 添加節點屬性
57             connectionInfo.put(attributes.get(i).getName(), attributes.get(i).getValue());
58         }
59         while (childIter.hasNext()) { // 添加子節點
60             Element attr = childIter.next();
61             connectionInfo.put(attr.getName().trim(), attr.getText().trim());
62         }
63         dbConnections.add(connectionInfo);
64     }
65 
66     return dbConnections;
67 }

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [源碼解析]深度學習利器之自動微分(3) --- 示例解讀深度解讀 OpenYurt ：邊緣自治能力設計解析 Linux SWAP 深度解讀 jetty.xml 解讀 logback.xml解讀----日志配置解讀 .NET 5 Preview 1的深度解讀和跟進深度解讀 AlphaGo 算法原理深度學習入門----EfficientNet解讀 Java內存模型深度解讀 Java內存模型深度解讀