C#解析XML


之前在項目中處理的都是一些小數據量的XML文件,都是直接用.Net Framework中System.XML命名空間下的基本的XmlDocument、XmlElement、XmlNode等基本類,讀取了節點之后,獲取屬性及其內部文本內容,但是這種方法在處理小文本量XML數據時,尚可使用,一旦處理較大數據量的XML數據,就顯得那么笨拙,效率也低下。

用XPath語言可以方便高效的篩選、獲取我們想要的節點、屬性等,正如博友所說“XPath語言相對於XML就如同SQL語言相對於DataBase”,這里也給大家分享下:

 

1.這里我參照MSDN給出一個XML源文件,為了顯示不同的效果,XML結構在邏輯上並不合理

 1 <?xml version="1.0" encoding="utf-8" ?>
2 <bookstore>
3 <book>
4 <title>C語言</title>
5 <author name ="XIAO">
6 <age>25</age>
7 </author>
8 <price>50</price>
9 </book>
10 <book>
11 <title>數據庫</title>
12 <price>100</price >
13 </book >
14 <book>
15 <title>數據結構</title>
16 <age>100</age>
17 <author name ="Wang">
18 <age>25</age>
19 <sex>female</sex>
20 </author>
21 <price>66.5</price >
22 </book >
23 </bookstore>

 

2.簡單示例

 1         private void button1_Click(object sender, EventArgs e)
2 {
3 XmlDocument doc = new XmlDocument();
4 doc.Load(@"..\..\CD.xml");
5
6 XmlElement root = null;
7 root = doc.DocumentElement;
8
9 XmlNodeList listNodes = null;
10 listNodes = root.SelectNodes("/bookstore/book/price");
11 foreach (XmlNode node in listNodes )
12 {
13 richTextBox1.Text += node.InnerText + "\n";
14 }
15 }

這里 listNodes=root.SelectNodes("/bookstore/book/price");意思是選取所有符合bookstore——>book——>price層級關系的price節點

效果如下圖:

 

3.XPath詳解

 1)"/bookstore/book/price"

XPath的開頭是一個斜線(/)代表這是絕對路徑,這可以選出所有路徑符合這個模式的元素。這代表選出所有bookstore根節點下的book元素下的price元素。

2)"//title"

開頭是兩個斜線(//)表示文件中所有符合模式的元素都會被選出來,即使是處於樹中不同的層級也會被選出來。這代表選出所有title元素。

3)"/bookstore/book/author/*"

使用星號(*)可以選擇未知的元素。這代表選出bookstore根節點下的book節點下的anthor節點下的所有可能的節點。

得到的結果:25 25 female

4)"/bookstore/book/*/age"

上面的語法會選出所有bookstore根節點下的book節點的隔一個層次的age節點

得到的結果為:25 25

5)"/*/*/age"

選取有兩個層級的age元素,得到的結果為:100

要注意的是,想要存取不分層級的元素,XPath語法必須以兩個斜線開頭(//),想要存取未知元素才用星號(*),星號只能代表未知名稱的元素,不能代表未知層級的元素。

6)"bookstore/book[1]/title"

 使用中括號可以選擇分支。這代表選擇bookstore根節點下第一個book節點的title節點。

得到的結果為:C語言

7)"bookstore/book[last()]/title"

 同樣,這里表示選擇最后一個節點,得到的結果是:數據結構

8)"bookstore/book/author[sex]"

這里表示選取所有帶有sex元素並滿足一定層次結構的author節點,得到的結果是:25female

9)"/bookstore/book[price=66.5]/title"

 選取price元素值是66.5的book節點的title子節點,得到的結果是:數據結構

10)"/bookstore/book/title | /bookstore/book/price"

 使用Or操作數(|)就可以選擇一個以上的路徑。這里表示選取符合一定層次結構的title元素與price元素

其結果是:C語言 50 數據庫 100 數據結構 66.5

 11)"//@name"

XPath中,除了選擇元素以外,也可以選擇屬性,屬性都是以@開頭。這里表示選取所有的name屬性。

其結果是:XIAO Wang

 12)"//author[@name]/age"

這里表示選取所有具有name屬性的author節點的age節點。其結果是:25 25

13)"//*[@*]"

選取所有有屬性的節點。其結果是:25 25female

14)"//author[@name='Wang']/sex"

選取所有屬性name值為Wang的author節點的sex子節點。其結果是:female

 

4.帶有命名空間(NameSpace)的XML文本解析

XML文本:

 1 <?xml version="1.0" encoding="utf-8" ?>
2 <bookstore xmlns="http://www.lucernepublishing.com"
3 xml:base="http://www.semanticweb.org/ontologies/2012/2/OntologyMinePower.owl">
4 <book>
5 <title>C語言</title>
6 <author name ="XIAO">
7 <age>25</age>
8 </author>
9 <price>50</price>
10 </book>
11 <book>
12 <title>數據庫</title>
13 <price>100</price >
14 </book >
15 <book>
16 <title>數據結構</title>
17 <age>100</age>
18 <author name ="Wang">
19 <age>25</age>
20 <sex>female</sex>
21 </author>
22 <price>66.5</price >
23 </book >
24 </bookstore>

解析:

 1         private void button1_Click(object sender, EventArgs e)
2 {
3 XmlDocument doc = new XmlDocument();
4 doc.Load(@"..\..\CD.xml");
5
6 XmlElement root = null;
7 root = doc.DocumentElement;
8
9 XmlNamespaceManager nsmgr = new XmlNamespaceManager(doc.NameTable);
10 nsmgr.AddNamespace("ab", "http://www.lucernepublishing.com");
11
12 XmlNodeList listNodes = null;
13 listNodes = doc.SelectNodes("/ab:bookstore/ab:book[ab:author[ab:sex]]/ab:price", nsmgr);
14 foreach (XmlNode node in listNodes )
15 {
16 richTextBox1.Text += node.InnerText + "\n";
17 }
18 }

 該XPath語言的意思是查詢bookstore下的所有帶有author節點,並且author節點帶有sex節點的book節點的price子節點。其結果是66.5

對於有命名空間的XML文本的解析,只需調用XmlNode.SelectNodes的不同的重載函數,賦予XmlNamespaceManager參數,並相應調整XPath語句即可。

 

文章參考:

MSDN中XmlNode.SelectNodes 方法;

W3CSchool在線幫助XPath;

http://www.cnblogs.com/hya1109/archive/2007/12/16/996535.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM