C#解析XML

本文轉載自查看原文 2012-03-17 20:55 46280 XPath/ XML/ C#編程

之前在項目中處理的都是一些小數據量的XML文件，都是直接用.Net Framework中System.XML命名空間下的基本的XmlDocument、XmlElement、XmlNode等基本類，讀取了節點之后，獲取屬性及其內部文本內容，但是這種方法在處理小文本量XML數據時，尚可使用，一旦處理較大數據量的XML數據，就顯得那么笨拙，效率也低下。

用XPath語言可以方便高效的篩選、獲取我們想要的節點、屬性等，正如博友所說“XPath語言相對於XML就如同SQL語言相對於DataBase”，這里也給大家分享下：

1.這里我參照MSDN給出一個XML源文件，為了顯示不同的效果，XML結構在邏輯上並不合理

 1 <?xml version="1.0" encoding="utf-8" ?>
 2 <bookstore>
 3   <book>
 4     <title>C語言</title>
 5     <author name ="XIAO">
 6       <age>25</age>
 7     </author>
 8     <price>50</price>
 9   </book>
10   <book>
11     <title>數據庫</title>
12     <price>100</price >
13   </book >
14   <book>
15     <title>數據結構</title>
16     <age>100</age>
17     <author name ="Wang">
18       <age>25</age>
19       <sex>female</sex>
20     </author>
21     <price>66.5</price >
22   </book >
23 </bookstore>

2.簡單示例

 1         private void button1_Click(object sender, EventArgs e)
 2         {
 3             XmlDocument doc = new XmlDocument();
 4             doc.Load(@"..\..\CD.xml");
 5 
 6             XmlElement root = null;
 7             root = doc.DocumentElement;
 8 
 9             XmlNodeList listNodes = null;
10             listNodes = root.SelectNodes("/bookstore/book/price");
11             foreach (XmlNode node in listNodes )
12             {
13                 richTextBox1.Text += node.InnerText + "\n";
14             }
15         }

這里 listNodes=root.SelectNodes("/bookstore/book/price");意思是選取所有符合bookstore——>book——>price層級關系的price節點

效果如下圖：

3.XPath詳解

1)"/bookstore/book/price"

XPath的開頭是一個斜線（/）代表這是絕對路徑，這可以選出所有路徑符合這個模式的元素。這代表選出所有bookstore根節點下的book元素下的price元素。

2)"//title"

開頭是兩個斜線（//）表示文件中所有符合模式的元素都會被選出來，即使是處於樹中不同的層級也會被選出來。這代表選出所有title元素。

3)"/bookstore/book/author/*"

使用星號（*）可以選擇未知的元素。這代表選出bookstore根節點下的book節點下的anthor節點下的所有可能的節點。

得到的結果：25 25 female

4)"/bookstore/book/*/age"

上面的語法會選出所有bookstore根節點下的book節點的隔一個層次的age節點。

得到的結果為：25 25

5)"/*/*/age"

選取有兩個層級的age元素，得到的結果為：100

要注意的是，想要存取不分層級的元素，XPath語法必須以兩個斜線開頭(//)，想要存取未知元素才用星號(*)，星號只能代表未知名稱的元素，不能代表未知層級的元素。

6)"bookstore/book[1]/title"

使用中括號可以選擇分支。這代表選擇bookstore根節點下第一個book節點的title節點。

得到的結果為：C語言

7)"bookstore/book[last()]/title"

同樣，這里表示選擇最后一個節點，得到的結果是：數據結構

8)"bookstore/book/author[sex]"

這里表示選取所有帶有sex元素並滿足一定層次結構的author節點，得到的結果是：25female

9)"/bookstore/book[price=66.5]/title"

選取price元素值是66.5的book節點的title子節點，得到的結果是：數據結構

10)"/bookstore/book/title | /bookstore/book/price"

使用Or操作數(|)就可以選擇一個以上的路徑。這里表示選取符合一定層次結構的title元素與price元素

其結果是：C語言 50 數據庫 100 數據結構 66.5

11)"//@name"

在XPath中，除了選擇元素以外，也可以選擇屬性，屬性都是以@開頭。這里表示選取所有的name屬性。

其結果是：XIAO Wang

12)"//author[@name]/age"

這里表示選取所有具有name屬性的author節點的age節點。其結果是：25 25

13)"//*[@*]"

選取所有有屬性的節點。其結果是：25 25female

14)"//author[@name='Wang']/sex"

選取所有屬性name值為Wang的author節點的sex子節點。其結果是：female

4.帶有命名空間(NameSpace)的XML文本解析

XML文本：

 1 <?xml version="1.0" encoding="utf-8" ?>
 2 <bookstore xmlns="http://www.lucernepublishing.com"
 3            xml:base="http://www.semanticweb.org/ontologies/2012/2/OntologyMinePower.owl">
 4   <book>
 5     <title>C語言</title>
 6     <author name ="XIAO">
 7       <age>25</age>
 8     </author>
 9     <price>50</price>
10   </book>
11   <book>
12     <title>數據庫</title>
13     <price>100</price >
14   </book >
15   <book>
16     <title>數據結構</title>
17     <age>100</age>
18     <author name ="Wang">
19       <age>25</age>
20       <sex>female</sex>
21     </author>
22     <price>66.5</price >
23   </book >
24 </bookstore>

解析：

 1         private void button1_Click(object sender, EventArgs e)
 2         {
 3             XmlDocument doc = new XmlDocument();
 4             doc.Load(@"..\..\CD.xml");
 5 
 6             XmlElement root = null;
 7             root = doc.DocumentElement;
 8 
 9             XmlNamespaceManager nsmgr = new XmlNamespaceManager(doc.NameTable);
10             nsmgr.AddNamespace("ab", "http://www.lucernepublishing.com");
11            
12             XmlNodeList listNodes = null;
13             listNodes = doc.SelectNodes("/ab:bookstore/ab:book[ab:author[ab:sex]]/ab:price", nsmgr);
14             foreach (XmlNode node in listNodes )
15             {
16                 richTextBox1.Text += node.InnerText + "\n";
17             }
18         }

該XPath語言的意思是查詢bookstore下的所有帶有author節點，並且author節點帶有sex節點的book節點的price子節點。其結果是66.5

對於有命名空間的XML文本的解析，只需調用XmlNode.SelectNodes的不同的重載函數，賦予XmlNamespaceManager參數，並相應調整XPath語句即可。

文章參考:

MSDN中XmlNode..:SelectNodes 方法;

W3CSchool在線幫助XPath;

http://www.cnblogs.com/hya1109/archive/2007/12/16/996535.html

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 C#解析XML C#解析XML (C# ) 解析XML。 C# 解析Xml接口 c#(.Net)解析xml C# XML創建解析、XML格式化 c# xml序列化和反序列化。也就是xml的解析和反解析。 C#關於xml文件和TreeView之間的轉換解析帶有命名空間的xml解析，C# C# XML 解析包含特殊字符的內容