DOM4J解析XML文檔、Document對象、節點對象節點對象屬性、將文檔寫入XML文件(詳細)


Dom4j是一個簡單、靈活的開放源代碼的庫。Dom4j是由早期開發JDOM開發的。與JDOM不同的是,dom4j使用接口和抽象的人分離出來而后獨立基類,雖然Dom4j的API相對要復雜一些,但它提供了比JDOM更好的靈活性。 

Dom4j是一個非常優秀的Java XML API,具有性能優異、功能強大和極易使用的特點。現在很多軟件采用的Dom4j,例如Hibernate,包括sun公司自己的JAXM也用了Dom4j。

使用Dom4j開發,需下載dom4j相應的jar文件。

Document對象

DOM4j中,獲得Document對象的方式有三種:

1.讀取XML文件,獲得document對象            

                   SAXReader reader = new SAXReader();
              Document   document = reader.read(new File("input.xml"));

2.解析XML形式的文本,得到document對象.

                   String text = "<members></members>";
              Document document = DocumentHelper.parseText(text);

3.主動創建document對象.

                  Document document = DocumentHelper.createDocument();
             //創建根節點

                  Element root = document.addElement("members");

節點對象

1.獲取文檔的根節點.

      Element root = document.getRootElement();

2.取得某個節點的子節點.

Element element=node.element(“書名");

3.取得節點的文字

      String text=node.getText();

4.取得某節點下所有名為“member”的子節點,並進行遍歷.
 List nodes = rootElm.elements("member");
 
  for (Iterator it = nodes.iterator(); it.hasNext();) {
     Element elm = (Element) it.next();
    // do something
 }

5.對某節點下的所有子節點進行遍歷.
    for(Iterator it=root.elementIterator();it.hasNext();){
       Element element = (Element) it.next();
       // do something
    }

6.在某節點下添加子節點.
Element ageElm = newMemberElm.addElement("age");

7.設置節點文字.
 element.setText("29");

8.刪除某節點.
//childElm是待刪除的節點,parentElm是其父節點

    parentElm.remove(childElm);

9.添加一個CDATA節點.
Element contentElm = infoElm.addElement("content");
contentElm.addCDATA(diary.getContent());

節點對象屬性

1.取得某節點下的某屬性
    Element root=document.getRootElement();    
    //屬性名name

         Attribute attribute=root.attribute("size");

2.取得屬性的文字
    String text=attribute.getText();

 3.刪除某屬性
 Attribute attribute=root.attribute("size");
 root.remove(attribute);

3.遍歷某節點的所有屬性
   Element root=document.getRootElement();    
   for(Iterator it=root.attributeIterator();it.hasNext();){
         Attribute attribute = (Attribute) it.next();
         String text=attribute.getText();
         System.out.println(text);
    }

4.設置某節點的屬性和文字.
   newMemberElm.addAttribute("name", "sitinspring");

5.設置屬性的文字
   Attribute attribute=root.attribute("name");
   attribute.setText("sitinspring");

將文檔寫入XML文件.

1.文檔中全為英文,不設置編碼,直接寫入的形式.
  XMLWriter writer = new XMLWriter(new  FileWriter("output.xml"));
  writer.write(document);
  writer.close();

2.文檔中含有中文,設置編碼格式寫入的形式.
OutputFormat format = OutputFormat.createPrettyPrint();
// 指定XML編碼                   

     format.setEncoding("GBK");       
XMLWriter writer = new XMLWriter(newFileWriter("output.xml"),format);
writer.write(document);
writer.close();

Dom4j在指定位置插入節點

1.得到插入位置的節點列表(list)

2.調用list.add(index,elemnent),由index決定element的插入位置。

Element元素可以通過DocumentHelper對象得到。示例代碼:

Element aaa = DocumentHelper.createElement("aaa");

aaa.setText("aaa");

List list = root.element("書").elements();

list.add(1, aaa);

//更新document

字符串與XML的轉換 

1.將字符串轉化為XML
 

     String text = "<members> <member>sitinspring</member></members>";
Document document = DocumentHelper.parseText(text);

2.將文檔或節點的XML轉化為字符串.

     SAXReader reader = new SAXReader();
Document   document = reader.read(new File("input.xml"));            
Element root=document.getRootElement();    

            
String docXmlText=document.asXML();

String rootXmlText=root.asXML();
Element memberElm=root.element("member");
String memberXmlText=memberElm.asXML();
續寫

dom4j是一個Java的XML API,類似於jdom,用來讀寫XML文件的。

下載(環境配置)

DOM4J是開源組織提供的一個免費的、強大的XML解析工具,如果開發者需要在項目中使用那么需要下載並引入jar包。

1. 下載DOM4J地址:http://sourceforge.net/projects/dom4j

2. 引入:dom4j-1.6.1.jar (核心包)、 jaxen-1.1-beta-6.jar(Xpath支持包)

方法

它的主要方法都在org.dom4j這個包里定義:
Attribute Attribute定義了XML的屬性
Branch Branch為能夠包含子節點的節點如XML元素(Element)和文檔(Docuemnts)定義了一個公共的行為,
CDATA CDATA 定義了XML CDATA 區域
CharacterData CharacterData是一個標識借口,標識基於字符的節點。如CDATA,Comment, Text.
Comment Comment 定義了XML注釋的行為
Document 定義了XML文檔
DocumentType DocumentType 定義XML DOCTYPE聲明
Element Element定義XML 元素
ElementHandler ElementHandler定義了 Element 對象的處理器
ElementPath 被 ElementHandler 使用,用於取得當前正在處理的路徑層次信息
Entity Entity定義 XML entity
Node Node為所有的dom4j中XML節點定義了多態行為
NodeFilter NodeFilter 定義了在dom4j節點中產生的一個濾鏡或謂詞的行為(predicate)
ProcessingInstruction ProcessingInstruction 定義 XML 處理指令.
Text Text 定義XML 文本節點.
Visitor Visitor 用於實現Visitor模式.
XPath XPath 在分析一個字符串后會提供一個XPath 表達式

繼承關系

要想弄懂這套接口,關鍵的是要明白接口的繼承關系:
  • interface java.lang.Cloneable
    • interface org.dom4j.Node
    • interface org.dom4j.Attribute
    • interface org.dom4j.Branch
      • interface org.dom4j.Document
      • interface org.dom4j.Element
    • interface org.dom4j.CharacterData
      • interface org.dom4j.CDATA
      • interface org.dom4j.Comment
      • interface org.dom4j.Text
    • interface org.dom4j.DocumentType
    • interface org.dom4j.Entity
    • interface org.dom4j.ProcessingInstruction

主要JAVA包

Document對象

1.讀取XML文件,獲得document對象.  

SAXReader reader = new SAXReader();   
Document   document = reader.read(new File("input.xml"));   

2.解析XML形式的文本,得到document對象.   

String text = "<members></members>";   
Document document = DocumentHelper.parseText(text);   

3.主動創建document對象.   

Document document = DocumentHelper.createDocument();   
Element root = document.addElement("members");// 創建根節點   

Element節點

1.獲取文檔的根節點.   
Element rootElm = document.getRootElement();   
2.取得某節點的單個子節點.   

Element memberElm=root.element("member");// "member"是節點名   

3.取得節點的文字   

String text=memberElm.getText();也可以用:   
String text=root.elementText("name");這個是取得根節點下的name字節點的文字.   

4.取得某節點下名為"member"的所有字節點並進行遍歷.   

List nodes = rootElm.elements("member");   
for (Iterator it = nodes.iterator(); it.hasNext();) {   
  Element elm = (Element) it.next();   
  // do something   
}   

5.對某節點下的所有子節點進行遍歷.   

for(Iterator it=root.elementIterator();it.hasNext();){   
  Element element = (Element) it.next();   
   // do something   
}   

6.在某節點下添加子節點.   

Element ageElm = newMemberElm.addElement("age");   

7.設置節點文字.   

ageElm.setText("29");   

8.刪除某節點.   

parentElm.remove(childElm);// childElm是待刪除的節點,parentElm是其父節點   

9.添加一個CDATA節點.   

Element contentElm = infoElm.addElement("content");   
contentElm.addCDATA(diary.getContent());  

Attribute屬性

1.取得某節點下的某屬性   

Element root=document.getRootElement();       
Attribute attribute=root.attribute("size");// 屬性名name

2.取得屬性的文字   

// 也可以用
String text=attribute.getText();   
//  這個是取得根節點下name字節點的屬性firstname的值:  
String text2=root.element("name").attributeValue("firstname");

3.遍歷某節點的所有屬性    

Element root=document.getRootElement();        
for(Iterator it=root.attributeIterator();it.hasNext();){    
 Attribute attribute = (Attribute) it.next();    
 String text=attribute.getText();    
 System.out.println(text);    
}

4.設置某節點的屬性和文字.    

newMemberElm.addAttribute("name", "sitinspring");    

5.設置屬性的文字   

Attribute attribute=root.attribute("name");    
attribute.setText("sitinspring");    

6.刪除某屬性    

Attribute attribute=root.attribute("size");// 屬性名name    
root.remove(attribute);    

解析步驟

1. 准備需要解析的xml文件linkmans.xml

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<linkmans>
    <linkman>
        <name>jack</name>
        <phone>18663243245</phone>
        <email>jack@163.com</email>
    </linkman>
    <linkman>
        <name>張三</name>
        <phone>1353243247</phone>
        <email>zs@126.com</email>
    </linkman>
</linkmans>

2. 獲取解析器

public static SAXReader getReader() {
    return new SAXReader();
}

3. 獲取解析對象

public static Document getDocument(File file) throws Exception {
    // 3.1獲取解析器
    SAXReader reader = getReader();
    // 3.2解析文檔
    Document doc = reader.read(file);
    return doc;
}

4. 獲取根元素節點

public static void getRoot(File file) throws Exception {
    // 4.1獲取解析器
    SAXReader reader = getReader();
    // 4.2解析文檔
    Document doc = reader.read(file);
    // 4.3獲取根元素
    Element root = doc.getRootElement();
    System.out.println(root.getName());
}

5. 獲取指定的其他的元素

public static void getElement(File file) throws Exception {
    // 5.1獲取解析器
    SAXReader reader = getReader();
    // 5.2解析文檔
    Document doc = reader.read(file);
    // 5.3獲取根元素
    Element root = doc.getRootElement();
    // 5.4獲取所有的linkman
    List list = root.elements("linkman");
    Iterator it = list.iterator();
    // 5.5循環遍歷節點
    while (it.hasNext()) {
        Element ele = (Element) it.next();
        System.out.println(ele.getName());
    }
    System.out.println("---------------");
    // 簡化
    for (Iterator i = root.elementIterator(); i.hasNext();) {
        Element element = (Element) i.next();
        System.out.println(element.getName());
    }
    // 5.6獲取第二個linkman的名字
    Element linkman2 = (Element) list.get(1);
    String name = linkman2.element("name").getText();
    System.out.println(name);
}

6. 添加元素

public static Document addElement(File file) throws Exception {
    // 6.1獲取解析器
    SAXReader reader = getReader();
    // 6.2解析文檔
    Document doc = reader.read(file);
    // 6.3獲取根元素
    Element root = doc.getRootElement();
    // 6.4創建新元素
    Element new_linkman = DocumentHelper.createElement("linkman");
    Element new_name = DocumentHelper.createElement("name");
    Element new_phone = DocumentHelper.createElement("phone");
    Element new_email = DocumentHelper.createElement("email");

    new_name.setText("焦寧波");
    new_phone.setText("186xxxxxxxxx");
    new_email.setText("jnb@itcast.cn");
    // 6.5建立關系
    new_linkman.add(new_name);
    new_linkman.add(new_phone);
    new_linkman.add(new_email);
    root.add(new_linkman);
    return doc;
}

7. 修改的document需要進行持久化的操作,因此需要提供以下的方法。

public static void writeDocument2XML(Document doc, File file) throws Exception {
    // 創建創建一個轉換對象
    XMLWriter writer = new XMLWriter(
    // 可以解決輸入的數據時中文的亂碼問題
    new OutputStreamWriter(new FileOutputStream(file), "UTF-8"));
    // 將doc寫入指定文件
    writer.write(doc);
    // 釋放資源
    writer.close();
}

8. 修改元素

public static Document modifyElement(File file) throws Exception {
    // 8.1獲取解析器
    SAXReader reader = getReader();
    // 8.2解析文檔
    Document doc = reader.read(file);
    // 8.3獲取根元素
    Element root = doc.getRootElement();
    // 8.4直接獲取第二個linkman的name
    Element name = ((Element) root.elements("linkman").get(1)).element("name");
    name.setText("李四");
    return doc;
}

9. 刪除元素

public static Document removeAll(File file) throws Exception {
    // 9.1獲取解析器
    SAXReader reader = getReader();
    // 9.2解析文檔
    Document doc = reader.read(file);
    // 9.3獲取根元素
    Element root = doc.getRootElement();
    // 9.4獲取所有的linkman
    List list = root.elements("linkman");
    // 9.4循環斷絕關系
    for (Object temp: list) {
        // 轉型
        Element linkman = (Element) temp;
        // 斷絕關系
        root.remove(linkman);
    }
    return doc;
}

10. 屬性的操作

public static Document optionAttribute(File file) throws Exception {
    // 10.1獲取解析器
    SAXReader reader = getReader();
    // 10.2解析文檔
    Document doc = reader.read(file);
    // 10.3獲取根元素
    Element root = doc.getRootElement();
    // 10.4獲取所有的linkman
    List list = root.elements("linkman");
    // 10.4循環添加屬性
    int count = 0;
    for (Object temp: list) {
        // 轉型
        Element linkman = (Element) temp;
        // 添加屬性
        linkman.add(DocumentHelper.createAttribute(linkman, "id", "00" + (count + 1)));
        count++;
    }
    // 10.5獲取焦寧波的id
    Element linkman3 = (Element) list.get(2);
    String value = linkman3.attribute("id").getText();
    System.out.println(value);
    // 10.6修改屬性
    linkman3.attribute("id").setText("007");
    // 10.7刪除屬性
    linkman3.remove(linkman3.attribute("id"));
    return doc;
}

11.

      Element rootElement = document.getRootElement(); //獲取文檔的根節點<Package>/<Package>
     Element element = rootElement.element("RequestNodes");//獲取父節點(RequestNodes)
     List elements = element.elements("RequestNode"); //獲取所有的 RequestNode節點

      Iterator it = elements.iterator();
     while (it.hasNext()) {
     Element ele = (Element) it.next();
     Element elementZipCode= ele.element("ZipCode");//獲取到每個郵編節點
     String text = elementZipCode.getText();//郵編得的值

}

   例子:xml  

?xml version="1.0" encoding="GBK"?>
<Package>
<Head>
<TransDate>2017-05-12</TransDate>
<TransTime>15:27:05</TransTime>
<TransName>PR*****</TransName>
</Head>
<RequestNodes>
<RequestNode>
<AppntName>*****</AppntName>
<ZipCode>20*****</ZipCode>
<Address>*****</Address>
<ContNo>2016051100111486</ContNo>
<CValiDate>2016-05-12</CValiDate>
<PaytoDate>2017-05-12</PaytoDate>
<InsuredName>王麗</InsuredName>
<AgentName>功夫熊貓</AgentName>
<Phone>1******838738</Phone>
<PayMode>*****</PayMode>
<HLPrem>0.00</HLPrem>
<Risks>
<Risk>
<RiskName>*********</RiskName>
<Premium>10000.00</Premium>
<SubRiskFlag>M</SubRiskFlag>
</Risk>
</Risks>
<BankCode>*****</BankCode>
<AccType>******</AccType>
<BankAccNo>***************0799</BankAccNo>
<SumPremium>1*****0.00</SumPremium>
<ComAddress>*****</ComAddress>
<NoticeNo>500*****00*****32</NoticeNo>
<PrintDate>*****-05-12</PrintDate>
</RequestNode>
</RequestNodes>
</Package>

例子

//需要解析的emplist.xml
<?xml version="1.0" encoding="utf-8"?>
<list> 
  <emp id="1"> 
    <name>張三</name>  
    <age>34</age>  
    <gender>男</gender>  
    <salary>3000</salary> 
  </emp>  
  <emp id="2"> 
    <name>李四</name>  
    <age>14</age>  
    <gender>女</gender>  
    <salary>4000</salary> 
  </emp>  
  <emp id="3"> 
    <name>王五</name>  
    <age>14</age>  
    <gender>女</gender>  
    <salary>50000</salary> 
  </emp>  
  <emp id="4"> 
    <name>趙六</name>  
    <age>29</age>  
    <gender>男</gender>  
    <salary>300</salary> 
  </emp>  
  <emp id="5"> 
    <name>錢7</name>  
    <age>53</age>  
    <gender>男</gender>  
    <salary>12000</salary> 
  </emp> 
</list>
/**
 * 該類用於表示emplist.xml文檔中的一個emp數據
 */
public class Emp {
    private int id;
    private String name;
    private int age;
    private String gender;
    private int salary;
    public Emp(){
        
    }
    public Emp(int id, String name, int age, String gender, int salary) {
        super();
        this.id = id;
        this.name = name;
        this.age = age;
        this.gender = gender;
        this.salary = salary;
    }
    public int getId() {
        return id;
    }
    public void setId(int id) {
        this.id = id;
    }
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
    public int getAge() {
        return age;
    }
    public void setAge(int age) {
        this.age = age;
    }
    public String getGender() {
        return gender;
    }
    public void setGender(String gender) {
        this.gender = gender;
    }
    public int getSalary() {
        return salary;
    }
    public void setSalary(int salary) {
        this.salary = salary;
    }
    
    public String toString(){
        return  id+","+name+","+age+","+gender+","+salary;
    }
}
/**
 * 使用DOM解析XML文檔
 */
public class ParseXmlDemo {
    public static void main(String[] args) {
        try {
            /**
             * 解析大致步驟:
             * 1:創建SAXReader
             * 2:使用SAXReader解析指定的xml文檔信息,並返回對應Document對象
             *      Document對象中就包含了該XML文檔中的所有信息及結構了。
             * 3:根據文檔結構將xml描述的樹狀信息讀取到。
             */
            //1:
            SAXReader reader = new SAXReader();
            /**
             * 2:解析xml工作在這里就進行完畢了
             * 
             */
            Document doc =    reader.read(new File("emplist.xml"));
            //3
            List<Emp> list = new ArrayList<Emp>();
                /**
                 * 解析第一步,獲取根標簽(根元素)
                 * Document提供了一個可以獲取根元素的方法;
                 * Element getRootElement();
                 * Element 的每一個實例表示xml文檔中一對標簽。這里獲取的根標簽就相當於是
                 * <list>....</list>那對標簽。
                 */
            Element root =doc.getRootElement();
            /**
             * 由於xml文檔中一個標簽可能含有其他子標簽
             * 所以Element對象提供了可以獲取其表示的標簽中的子標簽的方法:
             * List elment()
             * 獲取當期標簽下所有子標簽,List集合中存放的是若干個Element實例,
             * 每個實例表示其中一個子標簽。
             * 
             * List elements(String name)
             * 獲取當前標簽下所有同名(參數指定該名字)子標簽
             * 
             *  Element element(String name)
             *  獲取當前標簽下給定名字的標簽,若有多個,獲取第一個。
             */
            
            List<Element>  elementlist = root.elements("emp");
            //遍歷每一個<emp>標簽
            
            for(Element empEle: elementlist){
                //獲取name的值
                Element nameEle = empEle.element("name");
                /**
                 * String getText()  獲取當前標簽中間的文本(字符串)
                 * getTextTrim()  去空白。。
                 */
                String name =nameEle.getText();
                
                Element ageEle =empEle.element("age");
                int  age = Integer.parseInt(ageEle.getText());
                /**
                 * String elmentText(String name)
                 * 獲取當前標簽下給定名字的子標簽中間的文本,這個方法等同於上面獲取name中間文本的兩句代碼。
                 */
                String gender =empEle.elementText("gender");
                
                int salary=Integer.parseInt(empEle.elementText("salary"));
                
                /**
                 * Element 還提供了可以用來獲取其描述的標簽中的屬性信息:
                 * Attribute attribute(String name)
                 * 該方法可以獲取給定名字的屬性,Attribute的每一個實例都可以表示一個標簽中的一個屬性。
                 */
                Attribute attr =empEle.attribute("id");
                
                int id =Integer.parseInt(attr.getValue());
                
                Emp emp = new Emp(id,name,age,gender,salary);
                
                list.add(emp);
            }
            System.out.println("解析完畢!");
            for(Emp e :list){
                System.out.println(e);
            }
            
        
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

運行結果:

解析完畢!
1,張三,34,男,3000
2,李四,14,女,4000
3,王五,14,女,50000
4,趙六,29,男,300
5,錢7,53,男,12000

總結

1. dom4j是一個易用的、開源的庫,用於XML,XPath和XSLT。它應用於Java平台,采用了Java集合框架並完全支持DOM,SAX和JAXP。

2. dom4j是一個非常非常優秀的Java XML API,具有性能優異、功能強大和極端易用使用的特點,同時它也是一個開放源代碼的軟件,現在越來越多的Java軟件都在使用dom4j來讀寫XML,特別值得一提的是連Sun的JAXM也在用dom4j。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM