python的XML處理模塊ElementTree

本文轉載自查看原文 2018-05-25 11:16 1827 py_functional_programming

ElementTree是python的XML處理模塊，它提供了一個輕量級的對象模型。它在Python2.5以后成為Python標准庫的一部分，但是Python2.4之前需要單獨安裝。在使用ElementTree模塊時，需要import xml.etree.ElementTree的操作。

ElementTree表示整個XML節點樹，而Element表示節點數中的一個單獨的節點。

構建XML文件

ElementTree(tag)，其中tag表示根節點，初始化一個ElementTree對象。

Element(tag, attrib={}, **extra)函數用來構造XML的一個根節點，其中tag表示根節點的名稱，attrib是一個可選項，表示節點的屬性。

SubElement(parent, tag, attrib={}, **extra)用來構造一個已經存在的節點的子節點

Element.text和SubElement.text表示element對象的額外的內容屬性，Element.tag和Element.attrib分別表示element對象的標簽和屬性。

ElementTree.write(file, encoding='us-ascii', xml_declaration=None, default_namespace=None, method='xml')，函數新建一個XML文件，並且將節點數數據寫入XML文件中。

#encoding=utf-8
import xml.etree.ElementTree as ET

#新建xml文件
def buildNewsXmlFile():
        #設置一個新節點，並設置其標簽為root
        root = ET.Element("root")

        #在root下新建兩個子節點,設置其名稱分別為sina和chinabyte
        sina = ET.SubElement(root, "sina")
        chinabyte = ET.SubElement(root, "chinabyte")

        #在sina下新建兩個子節點，設置其節點名稱分別為number和first
        sina_number = ET.SubElement(sina, "number")
        sina_number.text = "1"
        sina_first = ET.SubElement(sina, "first")
        sina_first.text = "http://roll.tech.sina.com.cn/internet_all/index_1.shtml"

        #在chinabyte下新建兩個子節點，設置其節點名稱為number和first
        chinabyte_number = ET.SubElement(chinabyte, "number")
        chinabyte_number.text = "1"
        chinabyte_first = ET.SubElement(chinabyte, "first")
        chinabyte_first.text = "http://www.chinabyte.com/more/124566.shtml"

        #將節點數信息保存在ElementTree中，並且保存為XML格式文件
        tree = ET.ElementTree(root)
        tree.write("urlfile.xml")

解析和修改XML文件

ElementTree.parse(source, parser=None)，將xml文件加載並返回ElementTree對象。parser是一個可選的參數，如果為空，則默認使用標准的XMLParser解析器。

ElementTree.getroot()，得到根節點。返回根節點的element對象。

Element.remove(tag)，刪除root下名稱為tag的子節點

以下函數，ElementTree和Element的對象都包含。

find(match)，得到第一個匹配match的子節點，match可以是一個標簽名稱或者是路徑。返回個element

findtext(match,default=None)，得到第一個配置的match的element的內容

findall(match)，得到匹配match下的所有的子節點，match可以是一個標簽或者是路徑，它會返回一個list，包含匹配的elements的信息

iter(tag)，創建一個以當前節點為根節點的iterator。

這里有一個xml文件

<?xml version="1.0"?>
<data>
    <country name="Liechtenstein">
        <rank>1</rank>
        <year>2008</year>
        <gdppc>141100</gdppc>
        <neighbor name="Austria" direction="E"/>
        <neighbor name="Switzerland" direction="W"/>
    </country>
    <country name="Singapore">
        <rank>4</rank>
        <year>2011</year>
        <gdppc>59900</gdppc>
        <neighbor name="Malaysia" direction="N"/>
    </country>
    <country name="Panama">
        <rank>68</rank>
        <year>2011</year>
        <gdppc>13600</gdppc>
        <neighbor name="Costa Rica" direction="W"/>
        <neighbor name="Colombia" direction="E"/>
    </country>
</data>

現在是解析xml文件的代碼

#解析Xml文件
def parseXmlFile(xml_name):
        #將XMl文件加載並返回一個ELementTree對象
        tree = ET.parse(xml_name)

        #得到第一個匹配sina標簽的Element對象
        sina = tree.find("contry")

        #得到sina的SubElement
        for sub_tag in sina:
                print sub_tag.text

        #得到所有匹配sina標簽的Element對象的list集合
        list_contry = tree.findall("contry")

        for contry in list_contry:
                for sub_tag in contry:
                        print sub_tag.text
	#修改xml文件
        for rank in tree.iter('rank')
        new_rank = int(rank.text)+1
        rank.text = str(new_rank)
        rank.set('updated', 'yes')
        tree.write(xml_name)

第一次的輸出是：1，2008，14100

第二次的輸出是：1，2008，14100，4，2011，59900，68，2011，13600

修改后的xml文件為

<?xml version="1.0"?>
<data>
    <country name="Liechtenstein">
        <rank updated="yes">2</rank>
        <year>2008</year>
        <gdppc>141100</gdppc>
        <neighbor name="Austria" direction="E"/>
        <neighbor name="Switzerland" direction="W"/>
    </country>
    <country name="Singapore">
        <rank updated="yes">5</rank>
        <year>2011</year>
        <gdppc>59900</gdppc>
        <neighbor name="Malaysia" direction="N"/>
    </country>
    <country name="Panama">
        <rank updated="yes">69</rank>
        <year>2011</year>
        <gdppc>13600</gdppc>
        <neighbor name="Costa Rica" direction="W"/>
        <neighbor name="Colombia" direction="E"/>
    </country>
</data>

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python之xml文檔及配置文件處理（ElementTree模塊、ConfigParser模塊） python xml.etree.ElementTree模塊生成、解析xml python處理xml的常用包（lib.xml、ElementTree、lxml） Python XML解析之ElementTree Python xml處理模塊 python XML文件解析：用ElementTree解析XML Python xml.etree.ElementTree讀寫xml文件實例 python ElementTree 輸出帶縮進格式的xml string ZH奶酪：Python使用ElementTree解析XML【譯】 python處理xml文件