Python全面解析xml文件
如何解析簡(jiǎn)單的xml文檔?
實(shí)際案例
xml是一種十分常用的標(biāo)記性語(yǔ)言,可提供統(tǒng)一的方法來(lái)描述應(yīng)用程序的結(jié)構(gòu)化數(shù)據(jù):
<?xml version="1.0" encoding="utf-8" ?> <data> <country name="Liechtenstein"> <rank updated="yes">2</rank> <year>2008</year> <gdppc>141100</gdppc> <neighbor name="Austria" direction="E"/> <neighbor name="Switzerland" direction="W"/> </country> </data>
python中如何解析xml文檔?
解決方案
使用標(biāo)準(zhǔn)庫(kù)中的xml.etree.ElementTree,其中的parse函數(shù)可以解析XML文檔。
代碼演示
(1)使用parse解析XML文檔
from xml.etree.ElementTree import parse f = open('demo.xml') # 第1個(gè)參數(shù)為輸入源,返回一個(gè)ElementTree對(duì)象 et = parse(f) # 通過(guò)元素樹(shù)(ElementTree)得到根結(jié)點(diǎn) root = et.getroot() print(root) # 查看標(biāo)簽 print(root.tag) # 查看屬性 print(root.attrib) # 查看文本,去除空格 print(root.text.strip()) # 遍歷元素樹(shù) # 得到節(jié)點(diǎn)的子元素,python3中g(shù)etchildren被廢棄 children = list(root) print(children) # 獲取每個(gè)子節(jié)點(diǎn)元素的屬性 for child in root: print(child.get('name')) ''' find、findall和iterfind只能找對(duì)于 當(dāng)前的元素它的直接子元素,不能查找孫子元素。 ''' # 根據(jù)標(biāo)簽尋找子元素,find總是找到第1個(gè)碰到的元素 print(root.find('country')) # findall是找到所有的的元素 print(root.findall('country')) # 不需要列表,希望是一個(gè)可迭代對(duì)象,得到一個(gè)生成器對(duì)象 print(root.iterfind('country')) for e in root.iterfind('country'): print(e.get('name')) # 無(wú)論在那個(gè)層級(jí)下都能找到rank標(biāo)簽 # 在默認(rèn)情況下不輸入?yún)?shù),會(huì)列出整個(gè)當(dāng)前節(jié)點(diǎn)之下的所有元素 print(list(root.iter())) # 遞歸的去尋找標(biāo)簽為rank的子節(jié)點(diǎn) print(list(root.iter('rank')))
(2)關(guān)于findall查找的高級(jí)用法
from xml.etree.ElementTree import parse f = open('demo.xml') # 第1個(gè)參數(shù)為輸入源,返回一個(gè)ElementTree對(duì)象 et = parse(f) # 通過(guò)元素樹(shù)(ElementTree)得到根結(jié)點(diǎn) root = et.getroot() # *能匹配所有的child,只想找root的所有孫子節(jié)點(diǎn) print(root.findall('country/*')) # 查找任意層次下的子元素,.點(diǎn)為當(dāng)前節(jié)點(diǎn),..為父節(jié)點(diǎn) print(root.findall('.//rank')) print(root.findall('.//rank/..')) # @描述包含某一屬性,[@attrib] print(root.findall('country[@name]')) # 指定屬性為特定值,[@attrib='value'] print(root.findall('country[@name="Singapore"]')) # 指定一個(gè)元素必須包含一個(gè)指定的子元素,[tag] print(root.findall('country[rank]')) # 指定元素的文本必須等于特定的值,[tag='text'] print(root.findall('country[rank="5"]')) # 找多個(gè)元素路徑指定相對(duì)位置,[position] print(root.findall('country[1]')) print(root.findall('country[2]')) # last()為倒著找 print(root.findall('country[last()]')) # 找倒數(shù)第二個(gè) print(root.findall('country[last()-1]'))
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
淺談Python xlwings 讀取Excel文件的正確姿勢(shì)
這篇文章主要介紹了淺談Python xlwings 讀取Excel文件的正確姿勢(shì),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-02-02CentOS6.5設(shè)置Django開(kāi)發(fā)環(huán)境
這篇文章主要為大家詳細(xì)介紹了CentOS6.5設(shè)置Django開(kāi)發(fā)環(huán)境,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2016-10-10Python中pycharm編輯器界面風(fēng)格修改方法
這篇文章主要介紹了Python中pycharm編輯器界面風(fēng)格修改方法,本文通過(guò)圖文并茂的形式給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-03-03python+django+mysql開(kāi)發(fā)實(shí)戰(zhàn)(附demo)
本文主要介紹了python+django+mysql開(kāi)發(fā)實(shí)戰(zhàn)(附demo),文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-01-01keras的get_value運(yùn)行越來(lái)越慢的解決方案
這篇文章主要介紹了keras的get_value運(yùn)行越來(lái)越慢的解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05機(jī)器學(xué)習(xí)python實(shí)戰(zhàn)之決策樹(shù)
這篇文章主要為大家詳細(xì)介紹了機(jī)器學(xué)習(xí)python實(shí)戰(zhàn)之決策樹(shù)的相關(guān)資料 ,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-11-11一招教你搞定Pycharm無(wú)法下載漢化包問(wèn)題
最近需要用到自然語(yǔ)言處理工具,python提供了很多自帶的工具包,下面這篇文章主要給大家介紹了關(guān)于Pycharm無(wú)法下載漢化包問(wèn)題的解決辦法,文中通過(guò)圖文介紹的非常詳細(xì),需要的朋友可以參考下2024-03-03