XML解析四種方式代碼示例詳解
XML是一種通用的數(shù)據(jù)交換格式,它的平臺(tái)無關(guān)性、語言無關(guān)性、系統(tǒng)無關(guān)性、給數(shù)據(jù)集成與交互帶來了極大的方便。XML在不同的語言環(huán)境中解析方式都是一樣的,只不過實(shí)現(xiàn)的語法不同而已。
XML的解析方式分為四種:1、DOM解析;2、SAX解析;3、JDOM解析;4、DOM4J解析。其中前兩種屬于基礎(chǔ)方法,是官方提供的平臺(tái)無關(guān)的解析方式;后兩種屬于擴(kuò)展方法,它們是在基礎(chǔ)的方法上擴(kuò)展出來的,只適用于java平臺(tái)。
針對(duì)以下XML文件,會(huì)對(duì)四種方式進(jìn)行詳細(xì)描述:
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book id="1">
<name>冰與火之歌</name>
<author>喬治馬丁</author>
<year>2014</year>
<price>89</price>
</book>
<book id="2">
<name>安徒生童話</name>
<year>2004</year>
<price>77</price>
<language>English</language>
</book>
</bookstore>
一、DOM解析
DOM的全稱是Document Object Model,也即文檔對(duì)象模型。在應(yīng)用程序中,基于DOM的XML分析器將一個(gè)XML文檔轉(zhuǎn)換成一個(gè)對(duì)象模型的集合(通常稱DOM樹),應(yīng)用程序正是通過對(duì)這個(gè)對(duì)象模型的操作,來實(shí)現(xiàn)對(duì)XML文檔數(shù)據(jù)的操作。通過DOM接口,應(yīng)用程序可以在任何時(shí)候訪問XML文檔中的任何一部分?jǐn)?shù)據(jù),因此,這種利用DOM接口的機(jī)制也被稱作隨機(jī)訪問機(jī)制。
DOM接口提供了一種通過分層對(duì)象模型來訪問XML文檔信息的方式,這些分層對(duì)象模型依據(jù)XML的文檔結(jié)構(gòu)形成了一棵節(jié)點(diǎn)樹。無論XML文檔中所描述的是什么類型的信息,即便是制表數(shù)據(jù)、項(xiàng)目列表或一個(gè)文檔,利用DOM所生成的模型都是節(jié)點(diǎn)樹的形式。也就是說,DOM強(qiáng)制使用樹模型來訪問XML文檔中的信息。由于XML本質(zhì)上就是一種分層結(jié)構(gòu),所以這種描述方法是相當(dāng)有效的。
DOM樹所提供的隨機(jī)訪問方式給應(yīng)用程序的開發(fā)帶來了很大的靈活性,它可以任意地控制整個(gè)XML文檔中的內(nèi)容。然而,由于DOM分析器把整個(gè)XML文檔轉(zhuǎn)化成DOM樹放在了內(nèi)存中,因此,當(dāng)文檔比較大或者結(jié)構(gòu)比較復(fù)雜時(shí),對(duì)內(nèi)存的需求就比較高。而且,對(duì)于結(jié)構(gòu)復(fù)雜的樹的遍歷也是一項(xiàng)耗時(shí)的操作。所以,DOM分析器對(duì)機(jī)器性能的要求比較高,實(shí)現(xiàn)效率不十分理想。不過,由于DOM分析器所采用的樹結(jié)構(gòu)的思想與XML文檔的結(jié)構(gòu)相吻合,同時(shí)鑒于隨機(jī)訪問所帶來的方便,因此,DOM分析器還是有很廣泛的使用價(jià)值的。
優(yōu)點(diǎn):
- 形成了樹結(jié)構(gòu),有助于更好的理解、掌握,且代碼容易編寫。
- 解析過程中,樹結(jié)構(gòu)保存在內(nèi)存中,方便修改。
缺點(diǎn):
- 由于文件是一次性讀取,所以對(duì)內(nèi)存的耗費(fèi)比較大。
- 如果XML文件比較大,容易影響解析性能且可能會(huì)造成內(nèi)存溢出。
以下是解決代碼:
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.springframework.core.io.Resource;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public final class DomParseHelper {
private DomParseHelper(){}
public static void domParseXml() {
//創(chuàng)建一個(gè)DocumentBuilderFactory的對(duì)象
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
try {
//創(chuàng)建一個(gè)DocumentBuilder的對(duì)象
DocumentBuilder db = dbf.newDocumentBuilder();
//通過DocumentBuilder對(duì)象的parser方法加載books.xml文件到當(dāng)前項(xiàng)目下
Resource resource = new org.springframework.core.io.ClassPathResource("books.xml");
Document document = db.parse(resource.getURI().toString());
//獲取所有book節(jié)點(diǎn)的集合
NodeList bookList = document.getElementsByTagName("book");
//通過nodelist的getLength()方法可以獲取bookList的長度
System.out.println("一共有" + bookList.getLength() + "本書");
//遍歷每一個(gè)book節(jié)點(diǎn)
for (int i = 0; i < bookList.getLength(); i++) {
System.out.println("=================下面開始遍歷第" + (i + 1) + "本書的內(nèi)容=================");
//通過 item(i)方法 獲取一個(gè)book節(jié)點(diǎn),nodelist的索引值從0開始
Node book = bookList.item(i);
//獲取book節(jié)點(diǎn)的所有屬性集合
NamedNodeMap attrs = book.getAttributes();
System.out.println("第 " + (i + 1) + "本書共有" + attrs.getLength() + "個(gè)屬性");
//遍歷book的屬性
for (int j = 0; j < attrs.getLength(); j++) {
//通過item(index)方法獲取book節(jié)點(diǎn)的某一個(gè)屬性
Node attr = attrs.item(j);
//獲取屬性名
System.out.print("屬性名:" + attr.getNodeName());
//獲取屬性值
System.out.println("--屬性值" + attr.getNodeValue());
}
//解析book節(jié)點(diǎn)的子節(jié)點(diǎn)
NodeList childNodes = book.getChildNodes();
//遍歷childNodes獲取每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)名和節(jié)點(diǎn)值
System.out.println("第" + (i + 1) + "本書共有" +
childNodes.getLength() + "個(gè)子節(jié)點(diǎn)");
for (int k = 0; k < childNodes.getLength(); k++) {
//區(qū)分出text類型的node以及element類型的node
if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {
//獲取了element類型節(jié)點(diǎn)的節(jié)點(diǎn)名
System.out.print("第" + (k + 1) + "個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)名:"
+ childNodes.item(k).getNodeName());
//獲取了element類型節(jié)點(diǎn)的節(jié)點(diǎn)值
System.out.println("--節(jié)點(diǎn)值是:" + childNodes.item(k).getFirstChild().getNodeValue());
//System.out.println("--節(jié)點(diǎn)值是:" + childNodes.item(k).getTextContent());
}
}
System.out.println("======================結(jié)束遍歷第" + (i + 1) + "本書的內(nèi)容=================");
}
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
}
}
}
二、SAX解析
SAX的全稱是Simple APIs for XML,也即XML簡單應(yīng)用程序接口。與DOM不同,SAX提供的訪問模式是一種順序模式,這是一種快速讀寫XML數(shù)據(jù)的方式。當(dāng)使用SAX分析器對(duì)XML文檔進(jìn)行分析時(shí),會(huì)觸發(fā)一系列事件,并激活相應(yīng)的事件處理函數(shù),應(yīng)用程序通過這些事件處理函數(shù)實(shí)現(xiàn)對(duì)XML文檔的訪問,因而SAX接口也被稱作事件驅(qū)動(dòng)接口。
優(yōu)點(diǎn):
- 采用事件驅(qū)動(dòng)模式,對(duì)內(nèi)存耗費(fèi)比較小。
- 適用于只處理XML文件中的數(shù)據(jù)時(shí)。
缺點(diǎn):
- 編碼比較麻煩
- 很難同時(shí)訪問XML文件中的多處不同數(shù)據(jù)。
以下是解析代碼
Book.java
public class Book {
private String id;
private String name;
private String author;
private String year;
private String price;
private String language;
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getAuthor() {
return author;
}
public void setAuthor(String author) {
this.author = author;
}
public String getYear() {
return year;
}
public void setYear(String year) {
this.year = year;
}
public String getPrice() {
return price;
}
public void setPrice(String price) {
this.price = price;
}
public String getLanguage() {
return language;
}
public void setLanguage(String language) {
this.language = language;
}
}
SAXParserHandler.java
import java.util.ArrayList;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
public class SAXParserHandler extends DefaultHandler {
String value = null;
Book book = null;
private ArrayList<Book> bookList = new ArrayList();
public ArrayList<Book> getBookList() {
return bookList;
}
int bookIndex = 0;
/**
* 用來標(biāo)識(shí)解析開始
*/
@Override
public void startDocument() throws SAXException {
super.startDocument();
System.out.println("SAX解析開始");
}
/**
* 用來標(biāo)識(shí)解析結(jié)束
*/
@Override
public void endDocument() throws SAXException {
super.endDocument();
System.out.println("SAX解析結(jié)束");
}
/**
* 解析xml元素
*/
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
//調(diào)用DefaultHandler類的startElement方法
super.startElement(uri, localName, qName, attributes);
if (qName.equals("book")) {
bookIndex++;
//創(chuàng)建一個(gè)book對(duì)象
book = new Book();
//開始解析book元素的屬性
System.out.println("======================開始遍歷某一本書的內(nèi)容=================");
//不知道book元素下屬性的名稱以及個(gè)數(shù),如何獲取屬性名以及屬性值
int num = attributes.getLength();
for(int i = 0; i < num; i++){
System.out.print("book元素的第" + (i + 1) + "個(gè)屬性名是:"
+ attributes.getQName(i));
System.out.println("---屬性值是:" + attributes.getValue(i));
if (attributes.getQName(i).equals("id")) {
book.setId(attributes.getValue(i));
}
}
}
else if (!qName.equals("name") && !qName.equals("bookstore")) {
System.out.print("節(jié)點(diǎn)名是:" + qName + "---");
}
}
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
//調(diào)用DefaultHandler類的endElement方法
super.endElement(uri, localName, qName);
//判斷是否針對(duì)一本書已經(jīng)遍歷結(jié)束
if (qName.equals("book")) {
bookList.add(book);
book = null;
System.out.println("======================結(jié)束遍歷某一本書的內(nèi)容=================");
}
else if (qName.equals("name")) {
book.setName(value);
}
else if (qName.equals("author")) {
book.setAuthor(value);
}
else if (qName.equals("year")) {
book.setYear(value);
}
else if (qName.equals("price")) {
book.setPrice(value);
}
else if (qName.equals("language")) {
book.setLanguage(value);
}
}
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
super.characters(ch, start, length);
value = new String(ch, start, length);
if (!value.trim().equals("")) {
System.out.println("節(jié)點(diǎn)值是:" + value);
}
}
}
SAXParseHelper.java
import java.io.IOException;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.springframework.core.io.ClassPathResource;
import org.springframework.core.io.Resource;
import org.xml.sax.SAXException;
public final class SAXParseHelper {
private SAXParseHelper() {
}
public static void saxParseXml() {
//創(chuàng)建一個(gè)SAXParserFactory工廠對(duì)象
SAXParserFactory factory = SAXParserFactory.newInstance();
try {
//通過工廠對(duì)象獲取SAXParser解析器
SAXParser parser = factory.newSAXParser();
//使用SAXParserHandler解析xml
Resource resource = new ClassPathResource("books.xml");
SAXParserHandler handler = new SAXParserHandler();
parser.parse(resource.getURI().toString(), handler);
System.out.println("~!~!~!共有" + handler.getBookList().size() + "本書");
for (Book book : handler.getBookList()) {
System.out.println(book.getId());
System.out.println(book.getName());
System.out.println(book.getAuthor());
System.out.println(book.getYear());
System.out.println(book.getPrice());
System.out.println(book.getLanguage());
System.out.println("----finish----");
}
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
三、JDOM解析
特征:
- 僅使用具體類,而不使用接口。
- API大量使用了Collections類。
添加Maven依賴
<dependency>
<groupId>jdom</groupId>
<artifactId>jdom</artifactId>
<version>1.1</version>
</dependency>
以下是解析的具體代碼:
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.List;
import org.jdom.Attribute;
import org.jdom.Document;
import org.jdom.Element;
import org.jdom.JDOMException;
import org.jdom.input.SAXBuilder;
import org.springframework.core.io.ClassPathResource;
public final class JDOMParseHelper {
private JDOMParseHelper(){}
public static void jDOMParseXml(){
List<Book> booksList = new ArrayList();
// 進(jìn)行對(duì)books.xml文件的JDOM解析
// 準(zhǔn)備工作
// 1.創(chuàng)建一個(gè)SAXBuilder的對(duì)象
SAXBuilder saxBuilder = new SAXBuilder();
InputStream in;
try {
// 2.創(chuàng)建一個(gè)輸入流,將xml文件加載到輸入流中
ClassPathResource resource = new ClassPathResource("books.xml");
in = resource.getInputStream();
InputStreamReader isr = new InputStreamReader(in, "UTF-8");
// 3.通過saxBuilder的build方法,將輸入流加載到saxBuilder中
Document document = saxBuilder.build(isr);
// 4.通過document對(duì)象獲取xml文件的根節(jié)點(diǎn)
Element rootElement = document.getRootElement();
// 5.獲取根節(jié)點(diǎn)下的子節(jié)點(diǎn)(直接子節(jié)點(diǎn))的List集合
List<Element> bookList = rootElement.getChildren();
// 繼續(xù)進(jìn)行解析
for (Element book : bookList) {
Book bookEntity = new Book();
System.out.println("======開始解析第" + (bookList.indexOf(book) + 1) + "書======");
// 解析book的屬性集合
List<Attribute> attrList = book.getAttributes();
// //知道節(jié)點(diǎn)下屬性名稱時(shí),獲取節(jié)點(diǎn)值
// book.getAttributeValue("id");
// 遍歷attrList(針對(duì)不清楚book節(jié)點(diǎn)下屬性的名字及數(shù)量)
for (Attribute attr : attrList) {
// 獲取屬性名
String attrName = attr.getName();
// 獲取屬性值
String attrValue = attr.getValue();
System.out.println("屬性名:" + attrName + "----屬性值:" + attrValue);
if (attrName.equals("id")) {
bookEntity.setId(attrValue);
}
}
// 對(duì)book節(jié)點(diǎn)的子節(jié)點(diǎn)的節(jié)點(diǎn)名以及節(jié)點(diǎn)值的遍歷
List<Element> bookChilds = book.getChildren();
for (Element child : bookChilds) {
System.out.println("節(jié)點(diǎn)名:" + child.getName() + "----節(jié)點(diǎn)值:"
+ child.getValue());
if (child.getName().equals("name")) {
bookEntity.setName(child.getValue());
}
else if (child.getName().equals("author")) {
bookEntity.setAuthor(child.getValue());
}
else if (child.getName().equals("year")) {
bookEntity.setYear(child.getValue());
}
else if (child.getName().equals("price")) {
bookEntity.setPrice(child.getValue());
}
else if (child.getName().equals("language")) {
bookEntity.setLanguage(child.getValue());
}
}
System.out.println("======結(jié)束解析第" + (bookList.indexOf(book) + 1) + "書======");
booksList.add(bookEntity);
System.out.println(booksList.size());
System.out.println(booksList.get(0).getId());
System.out.println(booksList.get(0).getName());
}
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (JDOMException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
四、DOM4J解析
特征:
- DOM的一種智能分支,它合并了許多超出基本XML文檔表示的功能。
- 它使用接口和抽象基本類方法。
- 具有性能優(yōu)異、靈活性好、功能強(qiáng)大和極端易用的特點(diǎn)。
- 是一個(gè)開放源碼的文件
添加Maven依賴
<dependency>
<groupId>org.dom4j</groupId>
<artifactId>dom4j</artifactId>
<version>2.1.3</version>
</dependency>
以下是解析的代碼:
import java.io.IOException;
import java.util.Iterator;
import java.util.List;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.springframework.core.io.ClassPathResource;
import org.springframework.core.io.Resource;
public final class DOM4JParseHelper {
private DOM4JParseHelper() {
}
public static void dom4jParseXml() {
// 解析books.xml文件
// 創(chuàng)建SAXReader的對(duì)象reader
SAXReader reader = new SAXReader();
try {
// 通過reader對(duì)象的read方法加載books.xml文件,獲取docuemnt對(duì)象。
Resource resource = new ClassPathResource("books.xml");
Document document = reader.read(resource.getFile());
// 通過document對(duì)象獲取根節(jié)點(diǎn)bookstore
Element bookStore = document.getRootElement();
// 通過element對(duì)象的elementIterator方法獲取迭代器
Iterator it = bookStore.elementIterator();
// 遍歷迭代器,獲取根節(jié)點(diǎn)中的信息(書籍)
while (it.hasNext()) {
System.out.println("=====開始遍歷某一本書=====");
Element book = (Element) it.next();
// 獲取book的屬性名以及 屬性值
List<Attribute> bookAttrs = book.attributes();
for (Attribute attr : bookAttrs) {
System.out.println("屬性名:" + attr.getName() + "--屬性值:" + attr.getValue());
}
Iterator itt = book.elementIterator();
while (itt.hasNext()) {
Element bookChild = (Element) itt.next();
System.out.println("節(jié)點(diǎn)名:" + bookChild.getName() + "--節(jié)點(diǎn)值:" + bookChild.getStringValue());
}
System.out.println("=====結(jié)束遍歷某一本書=====");
}
} catch (DocumentException | IOException e) {
e.printStackTrace();
}
}
}
五、總結(jié)
DOM4J性能最好,連Sun的JAXM也在用DOM4J。目前許多開源項(xiàng)目中大量采用DOM4J,例如大名鼎鼎的Hibernate也用DOM4J來讀取XML配置文件。如果不考慮可移植性,那就采用DOM4J。
JDOM和DOM在性能測(cè)試時(shí)表現(xiàn)不佳,在測(cè)試10M文檔時(shí)內(nèi)存溢出。在小文檔情況下還值得考慮使用DOM和JDOM。雖然JDOM的開發(fā)者已經(jīng)說明他們期望在正式發(fā)行版前專注性能問題,但是從性能觀點(diǎn)來看,它確實(shí)沒有值得推薦之處。另外,DOM仍是一個(gè)非常好的選擇。DOM實(shí)現(xiàn)廣泛應(yīng)用于多種編程語言。它還是許多其它與XML相關(guān)的標(biāo)準(zhǔn)的基礎(chǔ),因?yàn)樗将@得W3C推薦(與基于非標(biāo)準(zhǔn)的Java模型相對(duì)),所以在某些類型的項(xiàng)目中可能也需要它(如在JavaScript中使用DOM)。
SAX表現(xiàn)較好,這要依賴于它特定的解析方式-事件驅(qū)動(dòng)。一個(gè)SAX檢測(cè)即將到來的XML流,但并沒有載入到內(nèi)存(當(dāng)然當(dāng)XML流被讀入時(shí),會(huì)有部分文檔暫時(shí)隱藏在內(nèi)存中)。
以上就是本文的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
java發(fā)送http get請(qǐng)求的兩種方式
這篇文章主要為大家詳細(xì)介紹了java發(fā)送http get請(qǐng)求的兩種方式,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-05-05
JavaSE基礎(chǔ)之反射機(jī)制(反射Class)詳解
反射機(jī)制有什么用?通過java語言中的反射機(jī)制可以操作字節(jié)碼文件,可以讀和修改字節(jié)碼文件。所以本文將為大家講講反射機(jī)制的使用,需要的可以參考一下2022-09-09
Java使用POI從Excel讀取數(shù)據(jù)并存入數(shù)據(jù)庫(解決讀取到空行問題)
有時(shí)候需要在java中讀取excel文件的內(nèi)容,專業(yè)的方式是使用java POI對(duì)excel進(jìn)行讀取,這篇文章主要給大家介紹了關(guān)于Java使用POI從Excel讀取數(shù)據(jù)并存入數(shù)據(jù)庫,文中介紹的辦法可以解決讀取到空行問題,需要的朋友可以參考下2023-12-12
使用java數(shù)組 封裝自己的數(shù)組操作示例
這篇文章主要介紹了使用java數(shù)組 封裝自己的數(shù)組操作,結(jié)合實(shí)例形式分析了java數(shù)組索引、遍歷等相關(guān)封裝操作技巧與注意事項(xiàng),需要的朋友可以參考下2020-03-03
Spring?Boot?RestController接口輸出到終端的操作代碼
這篇文章主要介紹了Spring?Boot?RestController接口如何輸出到終端,使用?HttpServletResponse?類,可以在使用curl執(zhí)行?Spring?Boot?REST接口的同時(shí),在控制臺(tái)輸出一些信息,給運(yùn)維人員知道當(dāng)前命令執(zhí)行的狀態(tài),感興趣的朋友跟隨小編一起看看吧2023-09-09

