python中用ElementTree.iterparse()讀取xml文件中的多層節點

本文轉載自查看原文 2015-05-17 13:50 2201 iterparse/ xml/ clear/ Python

　　我在使用Python解析比較大型的xml文件時，為了提高效率，決定使用iterparse()方法，但是發現根據網上的例子：每次if event == 'end':之后elem.clear()或者是每次 if elem.tag == '':之后clear()，都只能去到當前標簽的相關內容，如果想繼續讀取得到標簽的子標簽，則會返回為空，也就是取不到。

　　其實iterparse()方法的原理是當遇到標簽的“>”符號時觸發start，當遇到標簽的結束標志是會觸發end，比如：

<item>

　　</country>

</item>

　　在這個xml栗子中，用iterparse()方法捕捉end來獲取標簽，如果要獲取<country>標簽，那elem先獲取的是country下的<city>標簽，因為在遍歷到<country>標簽的結束標志</>前，先遍歷到<city>的結束標志，所以elem先獲取<country>標簽的子標簽<city>，這類似於深度優先遍歷，所以如果每次if完都clear()的話，會clear掉相應標簽的子標簽，所以得不到其子標簽。

　　我嘗試了各種方法來解決這個問題，后來通過這么寫來實現的：

from xml.etree import ElementTree

for event, elem in ElementTree.iterparse(xml):
　　if event == 'end':
　　　　if elem.tag == 'name' and elem.find('children').get('name') == attr_name:

　　　　　　相應標簽的操作

　　　　　　elem.clear()
　　　　if ....:

　　　　　　elem.clear()

　　我把clear()方法放在了if里面，這樣只有在找到相應標簽並且讀取完其子標簽后再clear()，這樣就可以讀取子標簽以及多層節點了。

　　功能是實現了，但是不知道其效率有沒有影響，本人菜鳥剛接觸Python，還望大牛們指點。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python xml.etree.ElementTree解析xml文件獲取節點 python XML文件解析：用ElementTree解析XML Python XML解析之ElementTree Python xml.etree.ElementTree讀寫xml文件實例 python ElementTree 節點標簽修改 Python（00）：解析xml文件（sax、dom、ElementTree）和lxml python的XML處理模塊ElementTree Python使用ElementTree處理XML C#中讀取xml文件指定節點 python 使用ElementTree解析xml