欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python解析xml文件方式(解析、更新、寫(xiě)入)

 更新時(shí)間:2020年03月05日 17:33:56   作者:Liu Zhian  
這篇文章主要介紹了python解析xml文件方式(解析、更新、寫(xiě)入),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

Overview

這篇博客內(nèi)容將包括對(duì)XML文件的解析、追加新元素后寫(xiě)入到XML,以及更新原XML文件中某結(jié)點(diǎn)的值。使用的是python的xml.dom.minidom包,詳情可見(jiàn)其官方文檔:xml.dom.minidom官方文檔。全文都將圍繞以下的customer.xml進(jìn)行操作:

<?xml version="1.0" encoding="utf-8" ?>
<!-- This is list of customers -->
<customers>
 <customer ID="C001">
  <name>Acme Inc.</name>
  <phone>12345</phone>
  <comments>
   <![CDATA[Regular customer since 1995]]>
  </comments>
 </customer>
 <customer ID="C002">
  <name>Star Wars Inc.</name>
  <phone>23456</phone>
  <comments>
   <![CDATA[A small but healthy company.]]>
  </comments>
 </customer>
</customers>

CDATA:在XML中,不會(huì)被解析器解析的部分?jǐn)?shù)據(jù)。

聲明:在本文中,結(jié)點(diǎn)和節(jié)點(diǎn)被視為了同一個(gè)概念,你可以在全文的任何地方替換它,我個(gè)人感覺(jué)區(qū)別不是很大,當(dāng)然,你也可以看做是我的打字輸入錯(cuò)誤。

1. 解析XML文件

在解析XML時(shí),所有的文本都是儲(chǔ)存在文本節(jié)點(diǎn)中的,且該文本節(jié)點(diǎn)被視為元素結(jié)點(diǎn)的子結(jié)點(diǎn),例如:2005,元素節(jié)點(diǎn) ,擁有一個(gè)值為 “2005” 的文本節(jié)點(diǎn),“2005” 不是 元素的值,最常用的方法就是getElementsByTagName()方法了,獲取到結(jié)點(diǎn)后再進(jìn)一步根據(jù)文檔結(jié)構(gòu)解析即可。

具體的理論就不過(guò)多描述,配合上述XML文件和下面的代碼,你將清楚的看到操作方法,下面的代碼執(zhí)行的工作是將所有的結(jié)點(diǎn)名稱(chēng)以及結(jié)點(diǎn)信息輸出一下:

# -*- coding: utf-8 -*-
"""
  @Author : LiuZhian
  @Time  : 2019/4/24 0024 上午 9:19
  @Comment : 
"""
from xml.dom.minidom import parse
def readXML():
 domTree = parse("./customer.xml")
 # 文檔根元素
 rootNode = domTree.documentElement
 print(rootNode.nodeName)

 # 所有顧客
 customers = rootNode.getElementsByTagName("customer")
 print("****所有顧客信息****")
 for customer in customers:
 if customer.hasAttribute("ID"):
  print("ID:", customer.getAttribute("ID"))
  # name 元素
  name = customer.getElementsByTagName("name")[0]
  print(name.nodeName, ":", name.childNodes[0].data)
  # phone 元素
  phone = customer.getElementsByTagName("phone")[0]
  print(phone.nodeName, ":", phone.childNodes[0].data)
  # comments 元素
  comments = customer.getElementsByTagName("comments")[0]
  print(comments.nodeName, ":", comments.childNodes[0].data)

if __name__ == '__main__':
 readXML()

2. 寫(xiě)入XML文件

在寫(xiě)入時(shí),我覺(jué)得可分為兩種方式:

新建一個(gè)全新的XML文件

在已有XML文件基礎(chǔ)上追加一些元素信息

至于以上兩種情況,其實(shí)創(chuàng)建元素結(jié)點(diǎn)的方法類(lèi)似,你必須要做的都是先創(chuàng)建/得到一個(gè)DOM對(duì)象,再在DOM基礎(chǔ)上創(chuàng)建new一個(gè)新的結(jié)點(diǎn)。

如果是第一種情況,你可以通過(guò)dom=minidom.Document()來(lái)創(chuàng)建;如果是第二種情況,直接可以通過(guò)解析已有XML文件來(lái)得到dom對(duì)象,例如dom = parse("./customer.xml")

在具體創(chuàng)建元素/文本結(jié)點(diǎn)時(shí),你大致會(huì)寫(xiě)出像以下這樣的“四部曲”代碼:

①創(chuàng)建一個(gè)新元素結(jié)點(diǎn)createElement()

②創(chuàng)建一個(gè)文本節(jié)點(diǎn)createTextNode()

③將文本節(jié)點(diǎn)掛載元素結(jié)點(diǎn)上

④將元素結(jié)點(diǎn)掛載到其父元素上。

現(xiàn)在,我需要新建一個(gè)customer節(jié)點(diǎn),信息如下:

<customer ID="C003">
  <name>kavin</name>
  <phone>32467</phone>
  <comments>
   <![CDATA[A small but healthy company.]]>
  </comments>
 </customer>

代碼如下:

def writeXML():
 domTree = parse("./customer.xml")
 # 文檔根元素
 rootNode = domTree.documentElement

 # 新建一個(gè)customer節(jié)點(diǎn)
 customer_node = domTree.createElement("customer")
 customer_node.setAttribute("ID", "C003")

 # 創(chuàng)建name節(jié)點(diǎn),并設(shè)置textValue
 name_node = domTree.createElement("name")
 name_text_value = domTree.createTextNode("kavin")
 name_node.appendChild(name_text_value) # 把文本節(jié)點(diǎn)掛到name_node節(jié)點(diǎn)
 customer_node.appendChild(name_node)

 # 創(chuàng)建phone節(jié)點(diǎn),并設(shè)置textValue
 phone_node = domTree.createElement("phone")
 phone_text_value = domTree.createTextNode("32467")
 phone_node.appendChild(phone_text_value) # 把文本節(jié)點(diǎn)掛到name_node節(jié)點(diǎn)
 customer_node.appendChild(phone_node)

 # 創(chuàng)建comments節(jié)點(diǎn),這里是CDATA
 comments_node = domTree.createElement("comments")
 cdata_text_value = domTree.createCDATASection("A small but healthy company.")
 comments_node.appendChild(cdata_text_value)
 customer_node.appendChild(comments_node)

 rootNode.appendChild(customer_node)

 with open('added_customer.xml', 'w') as f:
 # 縮進(jìn) - 換行 - 編碼
 domTree.writexml(f, addindent=' ', encoding='utf-8')

if __name__ == '__main__':
 writeXML()

3. 更新XML文件

在更新XML時(shí),只需先找到對(duì)應(yīng)的元素結(jié)點(diǎn),然后將其下的文本結(jié)點(diǎn)或?qū)傩匀≈蹈录纯?,然后保存到文件,具體我就不多說(shuō)了,代碼中我將思路都注釋清楚了,如下:

def updateXML():
 domTree = parse("./customer.xml")
 # 文檔根元素
 rootNode = domTree.documentElement

 names = rootNode.getElementsByTagName("name")
 for name in names:
 if name.childNodes[0].data == "Acme Inc.":
  # 獲取到name節(jié)點(diǎn)的父節(jié)點(diǎn)
  pn = name.parentNode
  # 父節(jié)點(diǎn)的phone節(jié)點(diǎn),其實(shí)也就是name的兄弟節(jié)點(diǎn)
  # 可能有sibNode方法,我沒(méi)試過(guò),大家可以google一下
  phone = pn.getElementsByTagName("phone")[0]
  # 更新phone的取值
  phone.childNodes[0].data = 99999

 with open('updated_customer.xml', 'w') as f:
 # 縮進(jìn) - 換行 - 編碼
 domTree.writexml(f, addindent=' ', encoding='utf-8')

if __name__ == '__main__':
 updateXML()

如有不對(duì)之處,還煩請(qǐng)指教~

補(bǔ)充知識(shí):python 讀取xml文件內(nèi)容并完成修改

我就廢話不多說(shuō)了,還是直接看代碼吧!

import os
import xml.etree.ElementTree as ET


def changesku(inputpath):
  listdir = os.listdir(inputpath)
  for file in listdir:
    if file.endswith('xml'):
      file = os.path.join(inputpath,file)
      tree = ET.parse(file)
      root = tree.getroot()
      for object1 in root.findall('object'):   #我要修改的元素在object里面,所以需要先找到object
        for sku in object1.findall('name'):  #查找想要修改的所有同種元素
          if (sku.text == '005'):         #‘005'為原始的text
            sku.text = '008'           #修改‘name'的標(biāo)簽值
            tree.write(file,encoding='utf-8')   #寫(xiě)進(jìn)原始的xml文件,不然修改就無(wú)效,‘encoding = “utf - 8”'避免原始xml                                           #中文字符亂碼

          else:
            pass                  
    else:
      pass

if __name__ == '__main__':
  
  inputpath = 'D:\\easy\\hebing_xml'     #這是xml文件的文件夾的絕對(duì)地址
  changesku(inputpath) 

以上這篇python解析xml文件方式(解析、更新、寫(xiě)入)就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python+Selenium實(shí)現(xiàn)短視頻熱點(diǎn)爬取

    Python+Selenium實(shí)現(xiàn)短視頻熱點(diǎn)爬取

    隨著短視頻的大火,不僅可以給人們帶來(lái)娛樂(lè),還有熱點(diǎn)新聞時(shí)事以及各種知識(shí),刷短視頻也逐漸成為了日常生活的一部分。本文將通過(guò)Pyhton依托Selenium來(lái)爬取短視頻熱點(diǎn),需要的可以參考一下
    2022-04-04
  • Python使用bs4獲取58同城城市分類(lèi)的方法

    Python使用bs4獲取58同城城市分類(lèi)的方法

    這篇文章主要介紹了Python使用bs4獲取58同城城市分類(lèi)的方法,涉及Python使用BeautifulSoup庫(kù)解析html頁(yè)面的技巧,需要的朋友可以參考下
    2015-07-07
  • python使用tqdm庫(kù)實(shí)現(xiàn)循環(huán)打印進(jìn)度條

    python使用tqdm庫(kù)實(shí)現(xiàn)循環(huán)打印進(jìn)度條

    tqdm是一個(gè)用于在Python中添加進(jìn)度條的庫(kù),它可以很容易地集成到while循環(huán)中,這篇文章主要介紹了python循環(huán)打印進(jìn)度條,需要的朋友可以參考下
    2023-05-05
  • 利用Python?Matlab繪制曲線圖的簡(jiǎn)單實(shí)例

    利用Python?Matlab繪制曲線圖的簡(jiǎn)單實(shí)例

    們經(jīng)常會(huì)遇到這種情況,有一個(gè)數(shù)學(xué)函數(shù),我們希望了解他的圖像,這個(gè)時(shí)候使用python 的matplotlib就可以幫助我們,下面這篇文章主要介紹了利用Python?Matlab繪制曲線圖的相關(guān)資料,需要的朋友可以參考下
    2021-12-12
  • python函數(shù)的定義和調(diào)用案例講解

    python函數(shù)的定義和調(diào)用案例講解

    函數(shù)通常來(lái)說(shuō)就是帶名字的代碼塊,用于完成具體的工作,需要使用的時(shí)候調(diào)用即可,這不僅提高代碼的復(fù)用性,而且條理更清晰,函數(shù)定義使用def關(guān)鍵字創(chuàng)建函數(shù),下面通過(guò)本文給大家講解python函數(shù)的定義和調(diào)用,感興趣的朋友一起看看吧
    2024-06-06
  • Python 實(shí)現(xiàn)鏈表實(shí)例代碼

    Python 實(shí)現(xiàn)鏈表實(shí)例代碼

    這篇文章主要介紹了Python 實(shí)現(xiàn)鏈表實(shí)例代碼的相關(guān)資料,需要的朋友可以參考下
    2017-04-04
  • Python常用數(shù)據(jù)分析模塊原理解析

    Python常用數(shù)據(jù)分析模塊原理解析

    這篇文章主要介紹了Python常用數(shù)據(jù)分析模塊原理解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-07-07
  • 簡(jiǎn)單的Python調(diào)度器Schedule詳解

    簡(jiǎn)單的Python調(diào)度器Schedule詳解

    這篇文章主要介紹了簡(jiǎn)單的Python調(diào)度器Schedule詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-08-08
  • python管理包路徑之pycharm自動(dòng)解決包路徑注冊(cè)

    python管理包路徑之pycharm自動(dòng)解決包路徑注冊(cè)

    這篇文章主要介紹了python本管理包路徑之pycharm自動(dòng)解決包路徑注冊(cè),文章通過(guò)圍繞主題展開(kāi)詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下
    2022-09-09
  • Python進(jìn)程multiprocessing.Process()的使用解讀

    Python進(jìn)程multiprocessing.Process()的使用解讀

    這篇文章主要介紹了Python進(jìn)程multiprocessing.Process()的使用,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2024-02-02

最新評(píng)論