快捷導(dǎo)航

XML解析四種方式代碼示例詳解

更新時(shí)間：2020年12月04日 11:29:55 作者：codedot

這篇文章主要介紹了XML解析四種方式代碼示例詳解,文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下

XML是一種通用的數(shù)據(jù)交換格式,它的平臺(tái)無關(guān)性、語(yǔ)言無關(guān)性、系統(tǒng)無關(guān)性、給數(shù)據(jù)集成與交互帶來了極大的方便。XML在不同的語(yǔ)言環(huán)境中解析方式都是一樣的,只不過實(shí)現(xiàn)的語(yǔ)法不同而已。

XML的解析方式分為四種：1、DOM解析；2、SAX解析；3、JDOM解析；4、DOM4J解析。其中前兩種屬于基礎(chǔ)方法，是官方提供的平臺(tái)無關(guān)的解析方式；后兩種屬于擴(kuò)展方法，它們是在基礎(chǔ)的方法上擴(kuò)展出來的，只適用于java平臺(tái)。

針對(duì)以下XML文件，會(huì)對(duì)四種方式進(jìn)行詳細(xì)描述：

<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
  <book id="1">
    <name>冰與火之歌</name>
    <author>喬治馬丁</author>
    <year>2014</year>
    <price>89</price>
  </book>
  <book id="2">
    <name>安徒生童話</name>
    <year>2004</year>
    <price>77</price>
    <language>English</language>
  </book>  
</bookstore>

一、DOM解析

　　DOM的全稱是Document Object Model，也即文檔對(duì)象模型。在應(yīng)用程序中，基于DOM的XML分析器將一個(gè)XML文檔轉(zhuǎn)換成一個(gè)對(duì)象模型的集合（通常稱DOM樹），應(yīng)用程序正是通過對(duì)這個(gè)對(duì)象模型的操作，來實(shí)現(xiàn)對(duì)XML文檔數(shù)據(jù)的操作。通過DOM接口，應(yīng)用程序可以在任何時(shí)候訪問XML文檔中的任何一部分?jǐn)?shù)據(jù)，因此，這種利用DOM接口的機(jī)制也被稱作隨機(jī)訪問機(jī)制。

　　DOM接口提供了一種通過分層對(duì)象模型來訪問XML文檔信息的方式，這些分層對(duì)象模型依據(jù)XML的文檔結(jié)構(gòu)形成了一棵節(jié)點(diǎn)樹。無論XML文檔中所描述的是什么類型的信息，即便是制表數(shù)據(jù)、項(xiàng)目列表或一個(gè)文檔，利用DOM所生成的模型都是節(jié)點(diǎn)樹的形式。也就是說，DOM強(qiáng)制使用樹模型來訪問XML文檔中的信息。由于XML本質(zhì)上就是一種分層結(jié)構(gòu)，所以這種描述方法是相當(dāng)有效的。

　　DOM樹所提供的隨機(jī)訪問方式給應(yīng)用程序的開發(fā)帶來了很大的靈活性，它可以任意地控制整個(gè)XML文檔中的內(nèi)容。然而，由于DOM分析器把整個(gè)XML文檔轉(zhuǎn)化成DOM樹放在了內(nèi)存中，因此，當(dāng)文檔比較大或者結(jié)構(gòu)比較復(fù)雜時(shí)，對(duì)內(nèi)存的需求就比較高。而且，對(duì)于結(jié)構(gòu)復(fù)雜的樹的遍歷也是一項(xiàng)耗時(shí)的操作。所以，DOM分析器對(duì)機(jī)器性能的要求比較高，實(shí)現(xiàn)效率不十分理想。不過，由于DOM分析器所采用的樹結(jié)構(gòu)的思想與XML文檔的結(jié)構(gòu)相吻合，同時(shí)鑒于隨機(jī)訪問所帶來的方便，因此，DOM分析器還是有很廣泛的使用價(jià)值的。

優(yōu)點(diǎn)：

形成了樹結(jié)構(gòu)，有助于更好的理解、掌握，且代碼容易編寫。
解析過程中，樹結(jié)構(gòu)保存在內(nèi)存中，方便修改。

缺點(diǎn)：

由于文件是一次性讀取，所以對(duì)內(nèi)存的耗費(fèi)比較大。
如果XML文件比較大，容易影響解析性能且可能會(huì)造成內(nèi)存溢出。

以下是解決代碼：

import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.springframework.core.io.Resource;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public final class DomParseHelper {

  private DomParseHelper(){}

  public static void domParseXml() {
    //創(chuàng)建一個(gè)DocumentBuilderFactory的對(duì)象
    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    try {
      //創(chuàng)建一個(gè)DocumentBuilder的對(duì)象
      DocumentBuilder db = dbf.newDocumentBuilder();
      //通過DocumentBuilder對(duì)象的parser方法加載books.xml文件到當(dāng)前項(xiàng)目下
      Resource resource = new org.springframework.core.io.ClassPathResource("books.xml");
      Document document = db.parse(resource.getURI().toString());
      //獲取所有book節(jié)點(diǎn)的集合
      NodeList bookList = document.getElementsByTagName("book");
      //通過nodelist的getLength()方法可以獲取bookList的長(zhǎng)度
      System.out.println("一共有" + bookList.getLength() + "本書");
      //遍歷每一個(gè)book節(jié)點(diǎn)
      for (int i = 0; i < bookList.getLength(); i++) {
        System.out.println("=================下面開始遍歷第" + (i + 1) + "本書的內(nèi)容=================");
        //通過 item(i)方法 獲取一個(gè)book節(jié)點(diǎn)，nodelist的索引值從0開始
        Node book = bookList.item(i);
        //獲取book節(jié)點(diǎn)的所有屬性集合
        NamedNodeMap attrs = book.getAttributes();
        System.out.println("第 " + (i + 1) + "本書共有" + attrs.getLength() + "個(gè)屬性");
        //遍歷book的屬性
        for (int j = 0; j < attrs.getLength(); j++) {
          //通過item(index)方法獲取book節(jié)點(diǎn)的某一個(gè)屬性
          Node attr = attrs.item(j);
          //獲取屬性名
          System.out.print("屬性名：" + attr.getNodeName());
          //獲取屬性值
          System.out.println("--屬性值" + attr.getNodeValue());
        }
        //解析book節(jié)點(diǎn)的子節(jié)點(diǎn)
        NodeList childNodes = book.getChildNodes();
        //遍歷childNodes獲取每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)名和節(jié)點(diǎn)值
        System.out.println("第" + (i + 1) + "本書共有" +
            childNodes.getLength() + "個(gè)子節(jié)點(diǎn)");
        for (int k = 0; k < childNodes.getLength(); k++) {
          //區(qū)分出text類型的node以及element類型的node
          if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {
            //獲取了element類型節(jié)點(diǎn)的節(jié)點(diǎn)名
            System.out.print("第" + (k + 1) + "個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)名："
                + childNodes.item(k).getNodeName());
            //獲取了element類型節(jié)點(diǎn)的節(jié)點(diǎn)值
            System.out.println("--節(jié)點(diǎn)值是：" + childNodes.item(k).getFirstChild().getNodeValue());
            //System.out.println("--節(jié)點(diǎn)值是：" + childNodes.item(k).getTextContent());
          }
        }
        System.out.println("======================結(jié)束遍歷第" + (i + 1) + "本書的內(nèi)容=================");
      }
    } catch (ParserConfigurationException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    } catch (SAXException e) {
      e.printStackTrace();
    }
  }
}

二、SAX解析

SAX的全稱是Simple APIs for XML，也即XML簡(jiǎn)單應(yīng)用程序接口。與DOM不同，SAX提供的訪問模式是一種順序模式，這是一種快速讀寫XML數(shù)據(jù)的方式。當(dāng)使用SAX分析器對(duì)XML文檔進(jìn)行分析時(shí)，會(huì)觸發(fā)一系列事件，并激活相應(yīng)的事件處理函數(shù)，應(yīng)用程序通過這些事件處理函數(shù)實(shí)現(xiàn)對(duì)XML文檔的訪問，因而SAX接口也被稱作事件驅(qū)動(dòng)接口。

優(yōu)點(diǎn)：

采用事件驅(qū)動(dòng)模式，對(duì)內(nèi)存耗費(fèi)比較小。
適用于只處理XML文件中的數(shù)據(jù)時(shí)。

缺點(diǎn)：

編碼比較麻煩
很難同時(shí)訪問XML文件中的多處不同數(shù)據(jù)。

以下是解析代碼

Book.java

public class Book {
  private String id;
  private String name;
  private String author;
  private String year;
  private String price;
  private String language;

  public String getId() {
    return id;
  }

  public void setId(String id) {
    this.id = id;
  }

  public String getName() {
    return name;
  }

  public void setName(String name) {
    this.name = name;
  }

  public String getAuthor() {
    return author;
  }

  public void setAuthor(String author) {
    this.author = author;
  }

  public String getYear() {
    return year;
  }

  public void setYear(String year) {
    this.year = year;
  }

  public String getPrice() {
    return price;
  }

  public void setPrice(String price) {
    this.price = price;
  }

  public String getLanguage() {
    return language;
  }

  public void setLanguage(String language) {
    this.language = language;
  }
}

SAXParserHandler.java

import java.util.ArrayList;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class SAXParserHandler extends DefaultHandler {
  String value = null;
  Book book = null;
  private ArrayList<Book> bookList = new ArrayList();
  public ArrayList<Book> getBookList() {
    return bookList;
  }

  int bookIndex = 0;
  /**
   * 用來標(biāo)識(shí)解析開始
   */
  @Override
  public void startDocument() throws SAXException {
    super.startDocument();
    System.out.println("SAX解析開始");
  }

  /**
   * 用來標(biāo)識(shí)解析結(jié)束
   */
  @Override
  public void endDocument() throws SAXException {
    super.endDocument();
    System.out.println("SAX解析結(jié)束");
  }

  /**
   * 解析xml元素
   */
  @Override
  public void startElement(String uri, String localName, String qName,
               Attributes attributes) throws SAXException {
    //調(diào)用DefaultHandler類的startElement方法
    super.startElement(uri, localName, qName, attributes);
    if (qName.equals("book")) {
      bookIndex++;
      //創(chuàng)建一個(gè)book對(duì)象
      book = new Book();
      //開始解析book元素的屬性
      System.out.println("======================開始遍歷某一本書的內(nèi)容=================");
      //不知道book元素下屬性的名稱以及個(gè)數(shù)，如何獲取屬性名以及屬性值
      int num = attributes.getLength();
      for(int i = 0; i < num; i++){
        System.out.print("book元素的第" + (i + 1) + "個(gè)屬性名是："
            + attributes.getQName(i));
        System.out.println("---屬性值是：" + attributes.getValue(i));
        if (attributes.getQName(i).equals("id")) {
          book.setId(attributes.getValue(i));
        }
      }
    }
    else if (!qName.equals("name") && !qName.equals("bookstore")) {
      System.out.print("節(jié)點(diǎn)名是：" + qName + "---");
    }
  }

  @Override
  public void endElement(String uri, String localName, String qName)
      throws SAXException {
    //調(diào)用DefaultHandler類的endElement方法
    super.endElement(uri, localName, qName);
    //判斷是否針對(duì)一本書已經(jīng)遍歷結(jié)束
    if (qName.equals("book")) {
      bookList.add(book);
      book = null;
      System.out.println("======================結(jié)束遍歷某一本書的內(nèi)容=================");
    }
    else if (qName.equals("name")) {
      book.setName(value);
    }
    else if (qName.equals("author")) {
      book.setAuthor(value);
    }
    else if (qName.equals("year")) {
      book.setYear(value);
    }
    else if (qName.equals("price")) {
      book.setPrice(value);
    }
    else if (qName.equals("language")) {
      book.setLanguage(value);
    }
  }

  @Override
  public void characters(char[] ch, int start, int length)
      throws SAXException {
    super.characters(ch, start, length);
    value = new String(ch, start, length);
    if (!value.trim().equals("")) {
      System.out.println("節(jié)點(diǎn)值是：" + value);
    }
  }

}

SAXParseHelper.java

import java.io.IOException;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.springframework.core.io.ClassPathResource;
import org.springframework.core.io.Resource;
import org.xml.sax.SAXException;

public final class SAXParseHelper {

  private SAXParseHelper() {
  }

  public static void saxParseXml() {
    //創(chuàng)建一個(gè)SAXParserFactory工廠對(duì)象
    SAXParserFactory factory = SAXParserFactory.newInstance();

    try {
      //通過工廠對(duì)象獲取SAXParser解析器
      SAXParser parser = factory.newSAXParser();
      //使用SAXParserHandler解析xml
      Resource resource = new ClassPathResource("books.xml");
      SAXParserHandler handler = new SAXParserHandler();
      parser.parse(resource.getURI().toString(), handler);
      System.out.println("~！~！~！共有" + handler.getBookList().size() + "本書");
      for (Book book : handler.getBookList()) {
        System.out.println(book.getId());
        System.out.println(book.getName());
        System.out.println(book.getAuthor());
        System.out.println(book.getYear());
        System.out.println(book.getPrice());
        System.out.println(book.getLanguage());
        System.out.println("----finish----");
      }
    } catch (ParserConfigurationException e) {
      e.printStackTrace();
    } catch (SAXException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    }
  }
}

三、JDOM解析

特征：

僅使用具體類，而不使用接口。
API大量使用了Collections類。

添加Maven依賴

<dependency>
<groupId>jdom</groupId>
<artifactId>jdom</artifactId>
<version>1.1</version>
</dependency>

以下是解析的具體代碼：

import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.List;
import org.jdom.Attribute;
import org.jdom.Document;
import org.jdom.Element;
import org.jdom.JDOMException;
import org.jdom.input.SAXBuilder;
import org.springframework.core.io.ClassPathResource;

public final class JDOMParseHelper {

  private JDOMParseHelper(){}

  public static void jDOMParseXml(){
    List<Book> booksList = new ArrayList();
    // 進(jìn)行對(duì)books.xml文件的JDOM解析
    // 準(zhǔn)備工作
    // 1.創(chuàng)建一個(gè)SAXBuilder的對(duì)象
    SAXBuilder saxBuilder = new SAXBuilder();
    InputStream in;
    try {
      // 2.創(chuàng)建一個(gè)輸入流，將xml文件加載到輸入流中
      ClassPathResource resource = new ClassPathResource("books.xml");
      in = resource.getInputStream();
      InputStreamReader isr = new InputStreamReader(in, "UTF-8");
      // 3.通過saxBuilder的build方法，將輸入流加載到saxBuilder中
      Document document = saxBuilder.build(isr);
      // 4.通過document對(duì)象獲取xml文件的根節(jié)點(diǎn)
      Element rootElement = document.getRootElement();
      // 5.獲取根節(jié)點(diǎn)下的子節(jié)點(diǎn)(直接子節(jié)點(diǎn))的List集合
      List<Element> bookList = rootElement.getChildren();
      // 繼續(xù)進(jìn)行解析
      for (Element book : bookList) {
        Book bookEntity = new Book();
        System.out.println("======開始解析第" + (bookList.indexOf(book) + 1) + "書======");
        // 解析book的屬性集合
        List<Attribute> attrList = book.getAttributes();
        // //知道節(jié)點(diǎn)下屬性名稱時(shí)，獲取節(jié)點(diǎn)值
        // book.getAttributeValue("id");
        // 遍歷attrList(針對(duì)不清楚book節(jié)點(diǎn)下屬性的名字及數(shù)量)
        for (Attribute attr : attrList) {
          // 獲取屬性名
          String attrName = attr.getName();
          // 獲取屬性值
          String attrValue = attr.getValue();
          System.out.println("屬性名：" + attrName + "----屬性值：" + attrValue);
          if (attrName.equals("id")) {
            bookEntity.setId(attrValue);
          }
        }
        // 對(duì)book節(jié)點(diǎn)的子節(jié)點(diǎn)的節(jié)點(diǎn)名以及節(jié)點(diǎn)值的遍歷
        List<Element> bookChilds = book.getChildren();
        for (Element child : bookChilds) {
          System.out.println("節(jié)點(diǎn)名：" + child.getName() + "----節(jié)點(diǎn)值："
              + child.getValue());
          if (child.getName().equals("name")) {
            bookEntity.setName(child.getValue());
          }
          else if (child.getName().equals("author")) {
            bookEntity.setAuthor(child.getValue());
          }
          else if (child.getName().equals("year")) {
            bookEntity.setYear(child.getValue());
          }
          else if (child.getName().equals("price")) {
            bookEntity.setPrice(child.getValue());
          }
          else if (child.getName().equals("language")) {
            bookEntity.setLanguage(child.getValue());
          }
        }
        System.out.println("======結(jié)束解析第" + (bookList.indexOf(book) + 1) + "書======");
        booksList.add(bookEntity);
        System.out.println(booksList.size());
        System.out.println(booksList.get(0).getId());
        System.out.println(booksList.get(0).getName());

      }
    } catch (FileNotFoundException e) {
      e.printStackTrace();
    } catch (JDOMException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    }
  }
}

四、DOM4J解析

特征：

DOM的一種智能分支，它合并了許多超出基本XML文檔表示的功能。
它使用接口和抽象基本類方法。
具有性能優(yōu)異、靈活性好、功能強(qiáng)大和極端易用的特點(diǎn)。
是一個(gè)開放源碼的文件

添加Maven依賴

<dependency>
<groupId>org.dom4j</groupId>
<artifactId>dom4j</artifactId>
<version>2.1.3</version>
</dependency>

以下是解析的代碼：

import java.io.IOException;
import java.util.Iterator;
import java.util.List;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.springframework.core.io.ClassPathResource;
import org.springframework.core.io.Resource;

public final class DOM4JParseHelper {
  private DOM4JParseHelper() {
  }

  public static void dom4jParseXml() {
    // 解析books.xml文件
    // 創(chuàng)建SAXReader的對(duì)象reader
    SAXReader reader = new SAXReader();
    try {
      // 通過reader對(duì)象的read方法加載books.xml文件,獲取docuemnt對(duì)象。
      Resource resource = new ClassPathResource("books.xml");
      Document document = reader.read(resource.getFile());
      // 通過document對(duì)象獲取根節(jié)點(diǎn)bookstore
      Element bookStore = document.getRootElement();
      // 通過element對(duì)象的elementIterator方法獲取迭代器
      Iterator it = bookStore.elementIterator();
      // 遍歷迭代器，獲取根節(jié)點(diǎn)中的信息（書籍）
      while (it.hasNext()) {
        System.out.println("=====開始遍歷某一本書=====");
        Element book = (Element) it.next();
        // 獲取book的屬性名以及 屬性值
        List<Attribute> bookAttrs = book.attributes();
        for (Attribute attr : bookAttrs) {
          System.out.println("屬性名：" + attr.getName() + "--屬性值：" + attr.getValue());
        }
        Iterator itt = book.elementIterator();
        while (itt.hasNext()) {
          Element bookChild = (Element) itt.next();
          System.out.println("節(jié)點(diǎn)名：" + bookChild.getName() + "--節(jié)點(diǎn)值：" + bookChild.getStringValue());
        }
        System.out.println("=====結(jié)束遍歷某一本書=====");
      }
    } catch (DocumentException | IOException e) {
      e.printStackTrace();
    }
  }
}

五、總結(jié)

　　DOM4J性能最好，連Sun的JAXM也在用DOM4J。目前許多開源項(xiàng)目中大量采用DOM4J，例如大名鼎鼎的Hibernate也用DOM4J來讀取XML配置文件。如果不考慮可移植性，那就采用DOM4J。

JDOM和DOM在性能測(cè)試時(shí)表現(xiàn)不佳，在測(cè)試10M文檔時(shí)內(nèi)存溢出。在小文檔情況下還值得考慮使用DOM和JDOM。雖然JDOM的開發(fā)者已經(jīng)說明他們期望在正式發(fā)行版前專注性能問題，但是從性能觀點(diǎn)來看，它確實(shí)沒有值得推薦之處。另外，DOM仍是一個(gè)非常好的選擇。DOM實(shí)現(xiàn)廣泛應(yīng)用于多種編程語(yǔ)言。它還是許多其它與XML相關(guān)的標(biāo)準(zhǔn)的基礎(chǔ)，因?yàn)樗将@得W3C推薦（與基于非標(biāo)準(zhǔn)的Java模型相對(duì)），所以在某些類型的項(xiàng)目中可能也需要它（如在JavaScript中使用DOM）。

SAX表現(xiàn)較好，這要依賴于它特定的解析方式－事件驅(qū)動(dòng)。一個(gè)SAX檢測(cè)即將到來的XML流，但并沒有載入到內(nèi)存（當(dāng)然當(dāng)XML流被讀入時(shí)，會(huì)有部分文檔暫時(shí)隱藏在內(nèi)存中）。

以上就是本文的全部?jī)?nèi)容，希望對(duì)大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章: