欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python實(shí)現(xiàn)XML文件解析的示例代碼

 更新時(shí)間:2018年02月05日 14:10:44   作者:小兵千睿  
本篇文章主要介紹了Python實(shí)現(xiàn)XML文件解析的示例代碼,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧

1. XML簡(jiǎn)介

XML(eXtensible Markup Language)指可擴(kuò)展標(biāo)記語(yǔ)言,被設(shè)計(jì)用來(lái)傳輸和存儲(chǔ)數(shù)據(jù),已經(jīng)日趨成為當(dāng)前許多新生技術(shù)的核心,在不同的領(lǐng)域都有著不同的應(yīng)用。它是web發(fā)展到一定階段的必然產(chǎn)物,既具有SGML的核心特征,又有著HTML的簡(jiǎn)單特性,還具有明確和結(jié)構(gòu)良好等許多新的特性。

test.XML文件

<?xml version="1.0" encoding="utf-8"?>
<catalog>
  <maxid>4</maxid>
  <login username="pytest" passwd='123456'>
    <caption>Python</caption>
    <item id="4">
      <caption>測(cè)試</caption>
    </item>
  </login>
  <item id="2">
    <caption>Zope</caption>
  </item>
</catalog>

XML詳細(xì)介紹可以參考: http://www.w3school.com.cn/xmldom/dom_nodetype.asp

2. XML文件解析

python解析XML常見(jiàn)的有三種方法:一是xml.dom.*模塊,它是W3C DOM API的實(shí)現(xiàn),若需要處理DOM API則該模塊很適合;二是xml.sax.*模塊,它是SAX API的實(shí)現(xiàn),這個(gè)模塊犧牲了便捷性來(lái)?yè)Q取速度和內(nèi)存占用,SAX是一個(gè)基于事件的API,這就意味著它可以“在空中”處理龐大數(shù)量的的文檔,不用完全加載進(jìn)內(nèi)存;三是xml.etree.ElementTree模塊(簡(jiǎn)稱 ET),它提供了輕量級(jí)的Python式的API,相對(duì)于DOM來(lái)說(shuō)ET 快了很多,而且有很多令人愉悅的API可以使用,相對(duì)于SAX來(lái)說(shuō)ET的ET.iterparse也提供了 “在空中” 的處理方式,沒(méi)有必要加載整個(gè)文檔到內(nèi)存,ET的性能的平均值和SAX差不多,但是API的效率更高一點(diǎn)而且使用起來(lái)很方便。

2.1 xml.dom.*

文件對(duì)象模型(Document Object Model,簡(jiǎn)稱DOM),是W3C組織推薦的處理可擴(kuò)展置標(biāo)語(yǔ)言的標(biāo)準(zhǔn)編程接口。一個(gè) DOM 的解析器在解析一個(gè)XML文檔時(shí),一次性讀取整個(gè)文檔,把文檔中所有元素保存在內(nèi)存中的一個(gè)樹結(jié)構(gòu)里,之后你可以利用DOM 提供的不同的函數(shù)來(lái)讀取或修改文檔的內(nèi)容和結(jié)構(gòu),也可以把修改過(guò)的內(nèi)容寫入xml文件。python中用xml.dom.minidom來(lái)解析xml文件。

a. 獲得子標(biāo)簽

b. 區(qū)分相同標(biāo)簽名的標(biāo)簽

c. 獲取標(biāo)簽屬性值

d. 獲取標(biāo)簽對(duì)之間的數(shù)據(jù)

#coding=utf-8

#通過(guò)minidom解析xml文件
import xml.dom.minidom as xmldom
import os
''' 
XML文件讀取 
<?xml version="1.0" encoding="utf-8"?>
<catalog>
  <maxid>4</maxid>
  <login username="pytest" passwd='123456'>dasdas
    <caption>Python</caption>
    <item id="4">
      <caption>測(cè)試</caption>
    </item>
  </login>
  <item id="2">
    <caption>Zope</caption>
  </item>
</catalog>

'''

xmlfilepath = os.path.abspath("test.xml")
print ("xml文件路徑:", xmlfilepath)

# 得到文檔對(duì)象
domobj = xmldom.parse(xmlfilepath)
print("xmldom.parse:", type(domobj))
# 得到元素對(duì)象
elementobj = domobj.documentElement
print ("domobj.documentElement:", type(elementobj))

#獲得子標(biāo)簽
subElementObj = elementobj.getElementsByTagName("login")
print ("getElementsByTagName:", type(subElementObj))

print (len(subElementObj))
# 獲得標(biāo)簽屬性值
print (subElementObj[0].getAttribute("username"))
print (subElementObj[0].getAttribute("passwd"))

#區(qū)分相同標(biāo)簽名的標(biāo)簽
subElementObj1 = elementobj.getElementsByTagName("caption")
for i in range(len(subElementObj1)):
  print ("subElementObj1[i]:", type(subElementObj1[i]))
  print (subElementObj1[i].firstChild.data) #顯示標(biāo)簽對(duì)之間的數(shù)據(jù)

輸出結(jié)果:

>>> D:\Pystu>python xml_instance.py
>>> xml文件路徑: D:\Pystu\test.xml
>>> xmldom.parse: <class 'xml.dom.minidom.Document'>
>>> domobj.documentElement: <class 'xml.dom.minidom.Element'>
>>> getElementsByTagName: <class 'xml.dom.minicompat.NodeList'>
>>> username: pytest
>>> passwd: 123456
>>> subElementObj1[i]: <class 'xml.dom.minidom.Element'>
>>> Python
>>> subElementObj1[i]: <class 'xml.dom.minidom.Element'>
>>> 測(cè)試
>>> subElementObj1[i]: <class 'xml.dom.minidom.Element'>
>>> Zope

2.2 xml.etree.ElementTree

ElementTree生來(lái)就是為了處理XML,它在Python標(biāo)準(zhǔn)庫(kù)中有兩種實(shí)現(xiàn):一種是純Python實(shí)現(xiàn)的,如xml.etree.ElementTree,另一種是速度快一點(diǎn)的xml.etree.cElementTree。注意:盡量使用C語(yǔ)言實(shí)現(xiàn)的那種,因?yàn)樗俣雀?,而且消耗的?nèi)存更少。

a. 遍歷根節(jié)點(diǎn)的下一層

b. 下標(biāo)訪問(wèn)各個(gè)標(biāo)簽、屬性、文本

c. 查找root下的指定標(biāo)簽

d. 遍歷XML文件

e. 修改XML文件

#coding=utf-8

#通過(guò)解析xml文件
'''
try:
  import xml.etree.CElementTree as ET
except:
  import xml.etree.ElementTree as ET

從Python3.3開始ElementTree模塊會(huì)自動(dòng)尋找可用的C庫(kù)來(lái)加快速度  
'''
import xml.etree.ElementTree as ET
import os
import sys
''' 
XML文件讀取 
<?xml version="1.0" encoding="utf-8"?>
<catalog>
  <maxid>4</maxid>
  <login username="pytest" passwd='123456'>dasdas
    <caption>Python</caption>
    <item id="4">
      <caption>測(cè)試</caption>
    </item>
  </login>
  <item id="2">
    <caption>Zope</caption>
  </item>
</catalog>
'''

#遍歷xml文件
def traverseXml(element):
  #print (len(element))
  if len(element)>0:
    for child in element:
      print (child.tag, "----", child.attrib)
      traverseXml(child)
  #else:
    #print (element.tag, "----", element.attrib)
    

if __name__ == "__main__":
  xmlFilePath = os.path.abspath("test.xml")
  print(xmlFilePath)
  try:
    tree = ET.parse(xmlFilePath)
    print ("tree type:", type(tree))
  
    # 獲得根節(jié)點(diǎn)
    root = tree.getroot()
  except Exception as e: #捕獲除與程序退出sys.exit()相關(guān)之外的所有異常
    print ("parse test.xml fail!")
    sys.exit()
  print ("root type:", type(root))  
  print (root.tag, "----", root.attrib)
  
  #遍歷root的下一層
  for child in root:
    print ("遍歷root的下一層", child.tag, "----", child.attrib)

  #使用下標(biāo)訪問(wèn)
  print (root[0].text)
  print (root[1][1][0].text)

  print (20 * "*")
  #遍歷xml文件
  traverseXml(root)
  print (20 * "*")

  #根據(jù)標(biāo)簽名查找root下的所有標(biāo)簽
  captionList = root.findall("item") #在當(dāng)前指定目錄下遍歷
  print (len(captionList))
  for caption in captionList:
    print (caption.tag, "----", caption.attrib, "----", caption.text)

  #修改xml文件,將passwd修改為999999
  login = root.find("login")
  passwdValue = login.get("passwd")
  print ("not modify passwd:", passwdValue)
  login.set("passwd", "999999")  #修改,若修改text則表示為login.text
  print ("modify passwd:", login.get("passwd"))

輸出結(jié)果:

>>> D:\Pystu\test.xml
>>> tree type: <class 'xml.etree.ElementTree.ElementTree'>
>>> root type: <class 'xml.etree.ElementTree.Element'>
>>> catalog ---- {}
>>> 遍歷root的下一層 maxid ---- {}
>>> 遍歷root的下一層 login ---- {'username': 'pytest', 'passwd': '123456'}
>>> 遍歷root的下一層 item ---- {'id': '2'}
>>> 4
>>> 測(cè)試
>>> ********************
>>> maxid ---- {}
>>> login ---- {'username': 'pytest', 'passwd': '123456'}
>>> caption ---- {}
>>> item ---- {'id': '4'}
>>> caption ---- {}
>>> item ---- {'id': '2'}
>>> caption ---- {}
>>> ********************
>>> 1
>>> item ---- {'id': '2'} ----
>>> not modify passwd: 123456
>>> modify passwd: 999999

附:

#coding=utf-8

'''
  XML解析類
  @功能-結(jié)點(diǎn)的增刪改查
'''
import xml.etree.ElementTree as ET
import sys
import os.path

class XmlParse:
  def __init__(self, file_path):
    self.tree = None
    self.root = None
    self.xml_file_path = file_path

  def ReadXml(self):
    try:
      print("xmlfile:", self.xml_file_path)
      self.tree = ET.parse(self.xml_file_path)
      self.root = self.tree.getroot()
    except Exception as e:
      print ("parse xml faild!")
      sys.exit()
    else:
      print ("parse xml success!")      
    finally: 
      return self.tree
        
  def CreateNode(self, tag, attrib, text):
    element = ET.Element(tag, attrib)
    element.text = text
    print ("tag:%s;attrib:%s;text:%s" %(tag, attrib, text))
    return element
       
  def AddNode(self, Parent, tag, attrib, text):
    element = self.CreateNode(tag, attrib, text)
    if Parent:
      Parent.append(element)
      el = self.root.find("lizhi")
      print (el.tag, "----", el.attrib, "----", el.text)
    else:
      print ("parent is none")

  def WriteXml(self, destfile):
    dest_xml_file = os.path.abspath(destfile)
    self.tree.write(dest_xml_file, encoding="utf-8",xml_declaration=True)
    

if __name__ == "__main__":
  xml_file = os.path.abspath("test.xml")
  parse = XmlParse(xml_file)
  tree = parse.ReadXml()
  root = tree.getroot()
  print (root)
  parse.AddNode(root, "Python", {"age":"22", "hello":"world"}, "YES")
  
  parse.WriteXml("testtest.xml")

2.3 xml.sax.*

SAX是一種基于事件驅(qū)動(dòng)的API,利用SAX解析XML牽涉到兩個(gè)部分:解析器和事件處理器。

解析器負(fù)責(zé)讀取XML文檔,并向事件處理器發(fā)送事件,如元素開始跟元素結(jié)束事件

事件處理器則負(fù)責(zé)對(duì)事件作出相應(yīng),對(duì)傳遞的XML數(shù)據(jù)進(jìn)行處理

常用場(chǎng)景:

(1)對(duì)大型文件進(jìn)行處理

(2)只需文件的部分內(nèi)容,或只需從文件中得到特定信息

(3)想建立自己的對(duì)象模型

基于事件驅(qū)動(dòng)的SAX解析XML內(nèi)容的知識(shí)后續(xù)補(bǔ)充!

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • 在Python的Django框架中實(shí)現(xiàn)Hacker News的一些功能

    在Python的Django框架中實(shí)現(xiàn)Hacker News的一些功能

    這篇文章主要介紹了在Python的Django框架中實(shí)現(xiàn)Hacker News的一些功能,包括投票“頂”評(píng)論等功能,需要的朋友可以參考下
    2015-04-04
  • python使用selenium實(shí)現(xiàn)批量文件下載

    python使用selenium實(shí)現(xiàn)批量文件下載

    這篇文章主要介紹了python使用selenium實(shí)現(xiàn)批量文件下載,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-03-03
  • Python入門教程(二十二)Python的類和對(duì)象

    Python入門教程(二十二)Python的類和對(duì)象

    這篇文章主要介紹了Python入門教程(二十二)Python的類和對(duì)象,Python是一門非常強(qiáng)大好用的語(yǔ)言,也有著易上手的特性,本文為入門教程,需要的朋友可以參考下
    2023-04-04
  • 使用Python的networkx繪制精美網(wǎng)絡(luò)圖教程

    使用Python的networkx繪制精美網(wǎng)絡(luò)圖教程

    今天小編就為大家分享一篇使用Python的networkx繪制精美網(wǎng)絡(luò)圖教程,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-11-11
  • 如何利用pygame實(shí)現(xiàn)簡(jiǎn)單的五子棋游戲

    如何利用pygame實(shí)現(xiàn)簡(jiǎn)單的五子棋游戲

    這篇文章主要給大家介紹了關(guān)于如何利用pygame實(shí)現(xiàn)簡(jiǎn)單的五子棋游戲的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用pygame具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-12-12
  • Python爬取京東商品信息評(píng)論存并進(jìn)MySQL

    Python爬取京東商品信息評(píng)論存并進(jìn)MySQL

    這篇文章主要介紹了Python爬取京東商品信息評(píng)論存并進(jìn)MySQL,文章通過(guò)構(gòu)建mysql數(shù)據(jù)表展開Python爬取信息存進(jìn)MySQL的內(nèi)容,需要的小伙伴可以參考一下
    2022-04-04
  • wxPython 入門教程

    wxPython 入門教程

    您可以在幾分鐘內(nèi)編寫一段 Python腳本和讓桌面擁有令人難以置信的相當(dāng)漂亮的 GUI應(yīng)用程序。這篇文章向您展示如何使用一 Python-著稱的 GUI 庫(kù)wxPython,來(lái)做到這一點(diǎn)的。向您的朋友和鄰居介紹!
    2008-10-10
  • python實(shí)現(xiàn)釘釘機(jī)器人自動(dòng)打卡天天早下班

    python實(shí)現(xiàn)釘釘機(jī)器人自動(dòng)打卡天天早下班

    這篇文章主要為大家介紹了python實(shí)現(xiàn)釘釘機(jī)器人自動(dòng)打卡天天下早班實(shí)例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-06-06
  • Python如何自定義鄰接表圖類

    Python如何自定義鄰接表圖類

    這篇文章主要介紹了Python如何自定義鄰接表圖類問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-12-12
  • python?matplotlib繪圖詳解大全(非常詳細(xì)!)

    python?matplotlib繪圖詳解大全(非常詳細(xì)!)

    這篇文章主要給大家介紹了關(guān)于python?matplotlib繪圖詳解的相關(guān)資料,matplotlib是python中用于繪制各種圖像的模塊,功能十分強(qiáng)大,通常與pandas模塊搭配使用,可以生成各種樣視的圖片,用于數(shù)據(jù)的分析和展示,需要的朋友可以參考下
    2023-09-09

最新評(píng)論