C++讀入XML文件


最近要做一個VRP的算法,測試集都是放在Xml文件中,而我的算法使用C++來寫,所以需要用C++來讀取Xml文件。

在百度上搜“C++讀取Xml文件”,可以出來很多博客,大多數是關於tinyXml的,所以這篇博文也是講述如何用tinyXML來讀取XML文件。

有些內容可能參考到了@marchtea的博文《C++讀取XML,tinyXml的使用》:http://www.cnblogs.com/marchtea/archive/2012/11/08/2760593.html。

tinyXml是一個免費開源的C++庫,可以到官網上下載:https://sourceforge.net/projects/tinyxml/。

下載下來解壓之后,可以看到下面這些文件:

我是在windows下用VS來寫C++的,按照@marchtea的說法,只需要直接打開tinyxml.sln就可以,不過我還是用了笨辦法:

  • 把tinystr.cpp, tinyxml.cpp, tinyxmlerror.cpp, tinyxmlparser.cpp, tinystr.h, tinyxml.h拷貝到工程目錄下;
  • 然后加入頭文件引用:#include "tinystr.h"   #include "tinyxml.h"。

接下來就來分享一下我讀取VRP問題中的solomon benchmark的方法,這些方法都是參考自tinyXml的官方教程,在下載的文件夾中有"doc"子文件夾,打開它,有一個叫做"tutorial0"的html文件,打開它可以看到詳細的教程。

OK,now begins!

我要讀取的Xml文件有如下的格式(只列舉部分):

<!-- 要讀取的Xml文件 -->
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<instance>
    <network>
        <nodes>
            <node id="0" type="0">
                <cx>40.0</cx>
                <cy>50.0</cy>
            </node>
        <!--  有N+1個這樣的node節點 -->
        </nodes>    
    </network>
    <requests>
        <request id="1" node="1">
            <tw>
                <start>145</start>
                <end>175</end>
            </tw>
            <quantity>20.0</quantity>
            <service_time>10.0</service_time>
        </request>
        <!-- 有N個這樣的request節點 -->
    </requests>
</instance>    

這里稍微解釋一下為什么nodes節點的數目會比requests節點多1個。這是因為nodes節點包括了顧客節點(N個)和倉庫節點(1個),而requests屬性只屬於顧客節點。

我是把xml文件中的這些數據讀入到類對象數組中,每個類對象代表一個節點,類的定義如下:

// Customer.h
#ifndef _Customer_H
#define _Customer_H

class Customer{
public:
	Customer(int id=0, float x=0, float y=0, float startTime=0, float endTime=0, float quantity=0, float serviceTime=0);
	void setId(int id);   // 設置成員id的值
	void setX(float x);   // 設置成員x的值
	void setY(float y);   // 設置成員y的值
	void setStartTime(float startTime);  // 設置成員startTime的值
	void setEndTime(float endTime);      // 設置成員endTime的值
	void setQuantity(float quantity);    // 設置成員quantity的值
	void setServiceTime(float serviceTime);  // 設置成員serviceTime的值
	void show();  // 顯示顧客節點信息
private:
	int id;
	float x;
	float y;
	float startTime;
	float endTime;
	float quantity;
	float serviceTime;
};

#endif

OK,那么現在開始貼一下main.cpp代碼(Customer.cpp比較簡單,就不貼了)

// main.cpp
#include "Customer.h"
#include "tinystr.h"
#include "tinyxml.h"
#include<iostream>
#include<vector>
#include<string>
#include<stdlib.h>
#include<iomanip>

using namespace std;
static const int NUM_OF_CUSTOMER = 51;        //顧客數量
static const char* FILENAME = "RC101_050.xml";  //文件名

int main(){
	vector<Customer *> customerSet(0);  // 顧客集,每個元素是Customer對象的指針
	int i,j,k,count;
	int temp1;    // 存放整型數據
	float temp2;  // 存放浮點型數據
	Customer* customer;   // 臨時顧客節點指針
	for (i=0; i<NUM_OF_CUSTOMER; i++) {  // 先初始化顧客集
		customer = new Customer();
		customerSet.push_back(customer);
	}
	TiXmlDocument doc(FILENAME);    // 讀入XML文件
	if(!doc.LoadFile()) return -1;  // 如果無法讀取文件,則返回
	TiXmlHandle hDoc(&doc);         // hDoc是&doc指向的對象
	TiXmlElement* pElem;            // 指向元素的指針
	pElem = hDoc.FirstChildElement().Element(); //指向根節點
	TiXmlHandle hRoot(pElem);       // hRoot是根節點

	// 讀取x,y,它們放在network->nodes->node節點中
	TiXmlElement* nodeElem = hRoot.FirstChild("network").FirstChild("nodes").FirstChild("node").Element(); //當前指向了node節點
	count = 0;  // 記錄移動到了哪個node節點,並且把該node節點的信息錄入到順序對應的customer中
	for(nodeElem; nodeElem; nodeElem = nodeElem->NextSiblingElement()) { // 挨個讀取node節點的信息
		customer = customerSet[count];  // 當前顧客節點,注意不能賦值給一個新的對象,否則會調用復制構造函數
		TiXmlHandle node(nodeElem);  // nodeElem所指向的節點
		TiXmlElement* xElem = node.FirstChild("cx").Element();  // cx節點
		TiXmlElement* yElem = node.FirstChild("cy").Element();  // cy節點
		nodeElem->QueryIntAttribute("id", &temp1);  //把id放到temp1中,屬性值讀法
		customer->setId(temp1);           
		temp2 = atof(xElem->GetText());    // char轉float
		customer->setX(temp2);
		temp2 = atof(yElem->GetText());
		customer->setY(temp2);
		count++;
	}

	// 讀取其余信息
	TiXmlElement* requestElem = hRoot.FirstChild("requests").FirstChild("request").Element(); // 指向了request節點
	count = 1;
	for(requestElem; requestElem; requestElem = requestElem->NextSiblingElement()) {
		customer = customerSet[count];     // 當前顧客節點,注意不能賦值給一個新的對象,否則會調用復制構造函數
		TiXmlHandle request(requestElem);  // 指針指向的對象
		TiXmlElement* startTimeElem = request.FirstChild("tw").FirstChild("start").Element(); // start time
		TiXmlElement* endTimeElem = request.FirstChild("tw").FirstChild("end").Element();     // end time
		TiXmlElement* quantityElem = request.FirstChild("quantity").Element();                // quantity
		TiXmlElement* serviceTimeElem = request.FirstChild("service_time").Element();         // service time
		// 分別讀取各項數據
		temp2 = atof(startTimeElem->GetText());
		customer->setStartTime(temp2);   
		temp2 = atof(endTimeElem->GetText());
		customer->setEndTime(temp2);
		temp2 = atof(quantityElem->GetText());
		customer->setQuantity(temp2);
		temp2 = atof(serviceTimeElem->GetText());
		customer->setServiceTime(temp2);
		count++;
	}

	// 將讀取到的信息輸出到控制台
	cout<<setiosflags(ios_base::left)<<setw(6)<<"id"<<setw(6)<<"x"<<setw(6)<<
		"y"<<setw(12)<<"startTime"<<setw(12)<<"endTime"<<setw(12)<<"quantity"<<setw(14)<<"serviceTime"<<endl;
	for(i=0; i<NUM_OF_CUSTOMER; i++) {
		customer = customerSet[i];
		customer->show();
	}
	system("pause");
	return 0;
}

  

在解釋main.cpp的內容之前,先解釋一下一些數據類型(只是個人理解,歡迎糾錯):

  • TiXmlDocument:文件節點,把Xml文件的內容讀入到該類型變量中
  • TiXmlElement*:指向節點的指針
  • TiXmlHandle:節點的實例,也就是TiXmlElement所指向的對象
  • FirstChild("nodeName"):第一個名字為“nodeName”的子節點
  • NextSiblingElement():下一個兄弟節點元素,它們有相同的父節點
  • QueryIntAttribute("attributeName", &var):把節點屬性名為attributeName的屬性值以int類型賦值給var變量
  • GetText():獲取當前節點元素的內容,即包含在<node>text</node>中的text

OK,有了以上一些簡單的知識積累,就可以很方便地讀取Xml文件了,現在截取xml的部分來講解:

<instance>
    <network>
        <nodes>
            <node id="0" type="0">
                <cx>40.0</cx>
                <cy>50.0</cy>
            </node>
        <!--  有N+1個這樣的node節點 -->
        </nodes>    
    </network>
    .....
</instance>

在這部分我們會把顧客的id,坐標x,y都讀入到Customer對象中。 

1. 首先我們得到了文件節點hDoc,現在我們要進入根節點"instance":

TiXmlElement* pElem;            // 指向元素的指針
pElem = hDoc.FirstChildElement().Element(); //指向根節點
TiXmlHandle hRoot(pElem);       // hRoot是根節點

根節點"instance"是文件節點的第一個子節點,所以用 pElem = hDoc.FirstChildElement().Element() 就可以使得指針pElem指向"instance",hRoot是pElem所指向的對象。

2. 現在我們需要進入到“node”節點中,遍歷其兄弟節點,將所有數據讀入。下面的語句可以將第一個“node”節點的指針賦值給nodeElem:

TiXmlElement* nodeElem = hRoot.FirstChild("network").FirstChild("nodes").FirstChild("node").Element(); //當前指向了node節點

節點的id值放在"node"節點的屬性"id"中:

nodeElem->QueryIntAttribute("id", &temp1);  //把id放到temp1中,屬性值讀法

然后坐標x, y的值放在“node”節點的子節點"cx"和"cy"的內容(text)中,所以我們這樣來讀取:

TiXmlElement* xElem = node.FirstChild("cx").Element();  // cx節點
temp2 = atof(xElem->GetText());    // char轉float

函數atof在庫<stdlib>中,用以將char數組轉化為浮點數。

 

通過1,2兩步,我們已經把第一個“node”節點的id, x, y的值讀入到對象中,然后只需要把遍歷所有的兄弟節點即可:

for(nodeElem; nodeElem; nodeElem = nodeElem->NextSiblingElement()) {
......
}

 

讀入requests節點下的startTime, endTime, quantity, serviceTime等值的方法也是一樣的,詳情參考main.cpp代碼。

運行結果如下:

 

總結:

其實說白了讀取Xml文件的關鍵在於:

  • 移動指針到所要讀取數據的節點中; 
  • 若是讀取屬性值,則使用QueryIntAttribute方法直接讀取;
  • 若讀取的是節點的內容,則使用getText()方法讀取;
  • 連續的數據具有兄弟節點關系,使用NextSiblingElement()方法來指向下一個兄弟節點

 

后記:

這篇博文只介紹了如何讀取Xml文件,至於如何寫入Xml文件,請參考tinyXml的官方教程,講的特別清楚,特別良心。

希望大家看了之后有所收獲,歡迎交流。

  

  

 

  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM