最近要做一個VRP的算法,測試集都是放在Xml文件中,而我的算法使用C++來寫,所以需要用C++來讀取Xml文件。
在百度上搜“C++讀取Xml文件”,可以出來很多博客,大多數是關於tinyXml的,所以這篇博文也是講述如何用tinyXML來讀取XML文件。
有些內容可能參考到了@marchtea的博文《C++讀取XML,tinyXml的使用》:http://www.cnblogs.com/marchtea/archive/2012/11/08/2760593.html。
tinyXml是一個免費開源的C++庫,可以到官網上下載:https://sourceforge.net/projects/tinyxml/。
下載下來解壓之后,可以看到下面這些文件:

我是在windows下用VS來寫C++的,按照@marchtea的說法,只需要直接打開tinyxml.sln就可以,不過我還是用了笨辦法:
- 把tinystr.cpp, tinyxml.cpp, tinyxmlerror.cpp, tinyxmlparser.cpp, tinystr.h, tinyxml.h拷貝到工程目錄下;
- 然后加入頭文件引用:#include "tinystr.h" #include "tinyxml.h"。
接下來就來分享一下我讀取VRP問題中的solomon benchmark的方法,這些方法都是參考自tinyXml的官方教程,在下載的文件夾中有"doc"子文件夾,打開它,有一個叫做"tutorial0"的html文件,打開它可以看到詳細的教程。
OK,now begins!
我要讀取的Xml文件有如下的格式(只列舉部分):
<!-- 要讀取的Xml文件 -->
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<instance>
<network>
<nodes>
<node id="0" type="0">
<cx>40.0</cx>
<cy>50.0</cy>
</node>
<!-- 有N+1個這樣的node節點 -->
</nodes>
</network>
<requests>
<request id="1" node="1">
<tw>
<start>145</start>
<end>175</end>
</tw>
<quantity>20.0</quantity>
<service_time>10.0</service_time>
</request>
<!-- 有N個這樣的request節點 -->
</requests>
</instance>
這里稍微解釋一下為什么nodes節點的數目會比requests節點多1個。這是因為nodes節點包括了顧客節點(N個)和倉庫節點(1個),而requests屬性只屬於顧客節點。
我是把xml文件中的這些數據讀入到類對象數組中,每個類對象代表一個節點,類的定義如下:
// Customer.h
#ifndef _Customer_H
#define _Customer_H
class Customer{
public:
Customer(int id=0, float x=0, float y=0, float startTime=0, float endTime=0, float quantity=0, float serviceTime=0);
void setId(int id); // 設置成員id的值
void setX(float x); // 設置成員x的值
void setY(float y); // 設置成員y的值
void setStartTime(float startTime); // 設置成員startTime的值
void setEndTime(float endTime); // 設置成員endTime的值
void setQuantity(float quantity); // 設置成員quantity的值
void setServiceTime(float serviceTime); // 設置成員serviceTime的值
void show(); // 顯示顧客節點信息
private:
int id;
float x;
float y;
float startTime;
float endTime;
float quantity;
float serviceTime;
};
#endif
OK,那么現在開始貼一下main.cpp代碼(Customer.cpp比較簡單,就不貼了)
// main.cpp
#include "Customer.h"
#include "tinystr.h"
#include "tinyxml.h"
#include<iostream>
#include<vector>
#include<string>
#include<stdlib.h>
#include<iomanip>
using namespace std;
static const int NUM_OF_CUSTOMER = 51; //顧客數量
static const char* FILENAME = "RC101_050.xml"; //文件名
int main(){
vector<Customer *> customerSet(0); // 顧客集,每個元素是Customer對象的指針
int i,j,k,count;
int temp1; // 存放整型數據
float temp2; // 存放浮點型數據
Customer* customer; // 臨時顧客節點指針
for (i=0; i<NUM_OF_CUSTOMER; i++) { // 先初始化顧客集
customer = new Customer();
customerSet.push_back(customer);
}
TiXmlDocument doc(FILENAME); // 讀入XML文件
if(!doc.LoadFile()) return -1; // 如果無法讀取文件,則返回
TiXmlHandle hDoc(&doc); // hDoc是&doc指向的對象
TiXmlElement* pElem; // 指向元素的指針
pElem = hDoc.FirstChildElement().Element(); //指向根節點
TiXmlHandle hRoot(pElem); // hRoot是根節點
// 讀取x,y,它們放在network->nodes->node節點中
TiXmlElement* nodeElem = hRoot.FirstChild("network").FirstChild("nodes").FirstChild("node").Element(); //當前指向了node節點
count = 0; // 記錄移動到了哪個node節點,並且把該node節點的信息錄入到順序對應的customer中
for(nodeElem; nodeElem; nodeElem = nodeElem->NextSiblingElement()) { // 挨個讀取node節點的信息
customer = customerSet[count]; // 當前顧客節點,注意不能賦值給一個新的對象,否則會調用復制構造函數
TiXmlHandle node(nodeElem); // nodeElem所指向的節點
TiXmlElement* xElem = node.FirstChild("cx").Element(); // cx節點
TiXmlElement* yElem = node.FirstChild("cy").Element(); // cy節點
nodeElem->QueryIntAttribute("id", &temp1); //把id放到temp1中,屬性值讀法
customer->setId(temp1);
temp2 = atof(xElem->GetText()); // char轉float
customer->setX(temp2);
temp2 = atof(yElem->GetText());
customer->setY(temp2);
count++;
}
// 讀取其余信息
TiXmlElement* requestElem = hRoot.FirstChild("requests").FirstChild("request").Element(); // 指向了request節點
count = 1;
for(requestElem; requestElem; requestElem = requestElem->NextSiblingElement()) {
customer = customerSet[count]; // 當前顧客節點,注意不能賦值給一個新的對象,否則會調用復制構造函數
TiXmlHandle request(requestElem); // 指針指向的對象
TiXmlElement* startTimeElem = request.FirstChild("tw").FirstChild("start").Element(); // start time
TiXmlElement* endTimeElem = request.FirstChild("tw").FirstChild("end").Element(); // end time
TiXmlElement* quantityElem = request.FirstChild("quantity").Element(); // quantity
TiXmlElement* serviceTimeElem = request.FirstChild("service_time").Element(); // service time
// 分別讀取各項數據
temp2 = atof(startTimeElem->GetText());
customer->setStartTime(temp2);
temp2 = atof(endTimeElem->GetText());
customer->setEndTime(temp2);
temp2 = atof(quantityElem->GetText());
customer->setQuantity(temp2);
temp2 = atof(serviceTimeElem->GetText());
customer->setServiceTime(temp2);
count++;
}
// 將讀取到的信息輸出到控制台
cout<<setiosflags(ios_base::left)<<setw(6)<<"id"<<setw(6)<<"x"<<setw(6)<<
"y"<<setw(12)<<"startTime"<<setw(12)<<"endTime"<<setw(12)<<"quantity"<<setw(14)<<"serviceTime"<<endl;
for(i=0; i<NUM_OF_CUSTOMER; i++) {
customer = customerSet[i];
customer->show();
}
system("pause");
return 0;
}
在解釋main.cpp的內容之前,先解釋一下一些數據類型(只是個人理解,歡迎糾錯):
- TiXmlDocument:文件節點,把Xml文件的內容讀入到該類型變量中
- TiXmlElement*:指向節點的指針
- TiXmlHandle:節點的實例,也就是TiXmlElement所指向的對象
- FirstChild("nodeName"):第一個名字為“nodeName”的子節點
- NextSiblingElement():下一個兄弟節點元素,它們有相同的父節點
- QueryIntAttribute("attributeName", &var):把節點屬性名為attributeName的屬性值以int類型賦值給var變量
- GetText():獲取當前節點元素的內容,即包含在<node>text</node>中的text
OK,有了以上一些簡單的知識積累,就可以很方便地讀取Xml文件了,現在截取xml的部分來講解:
<instance>
<network>
<nodes>
<node id="0" type="0">
<cx>40.0</cx>
<cy>50.0</cy>
</node>
<!-- 有N+1個這樣的node節點 -->
</nodes>
</network>
.....
</instance>
在這部分我們會把顧客的id,坐標x,y都讀入到Customer對象中。
1. 首先我們得到了文件節點hDoc,現在我們要進入根節點"instance":
TiXmlElement* pElem; // 指向元素的指針 pElem = hDoc.FirstChildElement().Element(); //指向根節點 TiXmlHandle hRoot(pElem); // hRoot是根節點
根節點"instance"是文件節點的第一個子節點,所以用 pElem = hDoc.FirstChildElement().Element() 就可以使得指針pElem指向"instance",hRoot是pElem所指向的對象。
2. 現在我們需要進入到“node”節點中,遍歷其兄弟節點,將所有數據讀入。下面的語句可以將第一個“node”節點的指針賦值給nodeElem:
TiXmlElement* nodeElem = hRoot.FirstChild("network").FirstChild("nodes").FirstChild("node").Element(); //當前指向了node節點
節點的id值放在"node"節點的屬性"id"中:
nodeElem->QueryIntAttribute("id", &temp1); //把id放到temp1中,屬性值讀法
然后坐標x, y的值放在“node”節點的子節點"cx"和"cy"的內容(text)中,所以我們這樣來讀取:
TiXmlElement* xElem = node.FirstChild("cx").Element(); // cx節點
temp2 = atof(xElem->GetText()); // char轉float
函數atof在庫<stdlib>中,用以將char數組轉化為浮點數。
通過1,2兩步,我們已經把第一個“node”節點的id, x, y的值讀入到對象中,然后只需要把遍歷所有的兄弟節點即可:
for(nodeElem; nodeElem; nodeElem = nodeElem->NextSiblingElement()) {
......
}
讀入requests節點下的startTime, endTime, quantity, serviceTime等值的方法也是一樣的,詳情參考main.cpp代碼。
運行結果如下:

總結:
其實說白了讀取Xml文件的關鍵在於:
- 移動指針到所要讀取數據的節點中;
- 若是讀取屬性值,則使用QueryIntAttribute方法直接讀取;
- 若讀取的是節點的內容,則使用getText()方法讀取;
- 連續的數據具有兄弟節點關系,使用NextSiblingElement()方法來指向下一個兄弟節點
后記:
這篇博文只介紹了如何讀取Xml文件,至於如何寫入Xml文件,請參考tinyXml的官方教程,講的特別清楚,特別良心。
希望大家看了之后有所收獲,歡迎交流。
