python XML文件解析：用xml.dom.minidom來解析xml文件

本文轉載自查看原文 2019-03-01 16:00 3043 Python

python解析XML常見的有三種方法：

一是xml.dom.*模塊，是W3C DOM API的實現，若需要處理DOM API則該模塊很合適，

二是xml.sax.*模塊，它是SAX API的實現，這個模塊犧牲了便捷性來換取速度和內存占用，SAX是一個基於事件的API，這就意味着它可以“在空中”處理龐大數量的的文檔，不用完全加載進內存

三是xml.etree.ElementTree模塊（簡稱 ET），它提供了輕量級的Python式的API，相對於DOM來說ET 快了很多，而且有很多令人愉悅的API可以使用，相對於SAX來說ET的ET.iterparse也提供了 “在空中” 的處理方式，沒有必要加載整個文檔到內存，ET的性能的平均值和SAX差不多，但是API的效率更高一點而且使用起來很方便

xml.dom.*

　　文件對象模型（Document Object Model，簡稱DOM），是W3C組織推薦的處理可擴展置標語言的標准編程接口。一個 DOM 的解析器在解析一個XML文檔時，一次性讀取整個文檔，把文檔中所有元素保存在內存中的一個樹結構里，之后你可以利用DOM 提供的不同的函數來讀取或修改文檔的內容和結構，也可以把修改過的內容寫入xml文件。python中用xml.dom.minidom來解析xml文件。

　　a. 獲得子標簽　　　

　　b. 區分相同標簽名的標簽

　　c. 獲取標簽屬性值

　　d. 獲取標簽對之間的數據

#通過minidom解析xml文件
import xml.dom.minidom as xmldom
import os

#get file object
domobj=xmldom.parse(r'C:\Temp\new1.xml')
print("xmldom.parse:",type(domobj))

#get element object
elementobj=domobj.documentElement
print("domobj.documentElement:",type(elementobj))


#get sub label
subElementObj=elementobj.getElementsByTagName("login")
print("getElementsByTagName:",type(subElementObj))
print(len(subElementObj))

#get tab attribute
print(subElementObj[0].getAttribute("username"))
print(subElementObj[0].getAttribute("passwd"))


#distince same tag
subElementOjb1=elementobj.getElementsByTagName("caption")
print(len(subElementOjb1))
for i in range(len(subElementOjb1)):
    print(subElementOjb1[i].firstChild.data)

Learn from : https://www.cnblogs.com/xiaobingqianrui/p/8405813.html

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python模塊：xml.dom.minidom Python minidom模塊(DOM寫入和解析XML) DOM解析XML文件 XML文件解析DOM解析和SAX解析 Python（00）：解析xml文件（sax、dom、ElementTree）和lxml 使用python的minidom模塊格式化、對齊、換行、整理xml文件 dom4j解析XML文件用Dom4j來解析XML文件 dom4j解析復雜的xml文件 python之XML文件解析