深入解析XML中的DTD文檔類型定義

XML 文檔類型定義,俗稱 DTD,它是一種準(zhǔn)確描述 XML 語言的方式。DTDs 根據(jù)適當(dāng) XML 語言的語法規(guī)則檢查 XML 文檔的詞匯和結(jié)構(gòu)的有效性。
XML DTD 可以指定在文檔內(nèi)部,也可以保存在獨(dú)立的文檔中然后單獨(dú)鏈接。
語法
DTD 的基本語法如下所示:
- <!DOCTYPE element DTD identifier
- [
- declaration1
- declaration2
- ........
- ]>
上述語法中:
DTD 以 <!DOCTYPE 定界符開始。
element 用于告訴解析器從指定的根元素開始解析文檔。
DTD identifier 是一個(gè)用于文檔類型定義的標(biāo)示符,它可以是一個(gè)指向系統(tǒng)中某個(gè)文件的路徑或者連接到互聯(lián)網(wǎng)上某個(gè)文件的 URL。如果 DTD 指向外部路徑,則被稱為外部子集。 _ [] 內(nèi)是一個(gè)可選的實(shí)體聲明列表,被稱為內(nèi)部子集。
內(nèi)部 DTD
如果一個(gè)元素聲明在 XML 文檔的內(nèi)部則 DTD 被稱為內(nèi)部 DTD。為了把它作為內(nèi)部 DTD,XML 聲明中的 standalone 屬性必須設(shè)置為 yes。這意味著,聲明的工作獨(dú)立于外部源。
語法
內(nèi)部 DTD 語法如下所示:
- <!DOCTYPE root-element [element-declarations]>
這里 root-element 是根元素的名稱,element-declarations 表示我們聲明的元素。
示例
下面是一個(gè)內(nèi)部 DTD 的簡單示例:
- <?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
- <!DOCTYPE address [
- <!ELEMENT address (name,company,phone)>
- <!ELEMENT name (#PCDATA)>
- <!ELEMENT company (#PCDATA)>
- <!ELEMENT phone (#PCDATA)>
- ]>
- <address>
- <name>Tanmay Patil</name>
- <company>TutorialsPoint</company>
- <phone>(011) 123-4567</phone>
- </address>
我們來看一下上面的代碼:
開始聲明 - 使用如下語句開始 XML 聲明:
- <?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
DTD - 緊跟在 XML 頭后面,_文檔類型聲明_如下,通常被稱為 DOCTYPE:
<!DOCTYPE address [
DOCTYPE 聲明在元素名稱的開頭包含一個(gè)感嘆號(!)。DOCTYPE 會通知解析器有一個(gè) DTD 與這個(gè)文檔相關(guān)聯(lián)。
DTD Body - DOCTYPE 聲明后面緊跟 DTD 體,這里我們聲明元素,屬性,實(shí)體和符號:
- <!ELEMENT address (name,company,phone)>
- <!ELEMENT name (#PCDATA)>
- <!ELEMENT company (#PCDATA)>
- <!ELEMENT phone_no (#PCDATA)>
許多元素都在這里通過 <name> 文檔詞匯聲明。<!ELEMENT name (#PCDATA)> 定義元素_名稱_為 "#PCDATA" 類型。這里 #PCDATA 意味著可解析的文本數(shù)據(jù)。
結(jié)束聲明 - 最后,DTD 的聲明部分使用方括號和尖括號(]>)閉合。這是一個(gè)有效的結(jié)束定義,后面緊跟的就是 XML 文檔內(nèi)容。
規(guī)則
文檔類型聲明必須出現(xiàn)在文檔的開頭部分(只先與 XML 頭),不允許出現(xiàn)在文檔的任意其他位置。
類似于 DOCTYPE 聲明,元素聲明必須以感嘆號開始。
文檔類型聲明中的 Name 必須與根元素的類型匹配。
外部 DTD
在外部 DTD 中元素聲明在 XML 文檔的外部。通過指定 system 屬性來訪問,這個(gè)屬性值可以是合法的 .dtd 文件或者有效的 URL。為了指示它是外部 DTD,XML 聲明的 standalone 屬性必須設(shè)置為 no。這就意味著,聲明包含來自外部源的信息。
語法
下面是外部 DTD 的語法:
<!DOCTYPE root-element SYSTEM "file-name">
這里 file-name 就是 .dtd 擴(kuò)展的文件。
示例
下面的示例展示了外部 DTD 的用法:
- <?xml version="1.0" encoding="UTF-8" standalone="no" ?>
- <!DOCTYPE address SYSTEM "address.dtd">
- <address>
- <name>Tanmay Patil</name>
- <company>TutorialsPoint</company>
- <phone>(011) 123-4567</phone>
- </address>
- DTD 文件 address.dtd 的內(nèi)容如下所示:
- <!ELEMENT address (name,company,phone)>
- <!ELEMENT name (#PCDATA)>
- <!ELEMENT company (#PCDATA)>
- <!ELEMENT phone (#PCDATA)>
類型
我們可以通過使用系統(tǒng)標(biāo)示符或者公共標(biāo)示符引用一個(gè)外部DTD。
系統(tǒng)標(biāo)示符
系統(tǒng)標(biāo)示符允許我們指定包含 DTD 聲明的外部文件的位置。語法如下:
- <!DOCTYPE name SYSTEM "address.dtd" [...]>
正如我們可以看到的,它包含 SYSTEM 關(guān)鍵字和一個(gè)指向文檔位置的 URI 引用。
公共標(biāo)示符
公共標(biāo)示符提供了一種定位 DTD 資源的機(jī)制,寫法如下:
- <!DOCTYPE name PUBLIC "-//Beginning XML//DTD Address Example//EN">
正如我們可以看到的,它以 PUBLIC 關(guān)鍵字開始,后面緊跟的是專門的標(biāo)識符。公共標(biāo)識符被用來標(biāo)識目錄中的條目。公共標(biāo)識符可以遵循任意格式,但是常用的格式是正式公用標(biāo)識符(或者 FPIs)。
聲明元素
在dtd中聲明元素(在一個(gè)xml如果一個(gè)元素想要讓它是合法的,則需要在dtd中聲明)
語法:<!ELEMENT 元素名稱 類別>和<!ELEMENT 元素名稱 (元素內(nèi)容)>這兩種方式
<!ELEMENT 元素名稱 EMPTY>
例如:
- <!ELEMENT br EMPTY>
則xml可以寫成:
- <br/>
注意點(diǎn)
在dtd中
所有的 XML 文檔(以及 HTML 文檔)均由以下簡單的構(gòu)建模塊構(gòu)成:
元素
屬性
實(shí)體
PCDATA
CDATA
下面是一些注意點(diǎn):
(1)實(shí)體是用來定義普通文本的變量。實(shí)體引用是對實(shí)體的引用。
大多數(shù)同學(xué)都了解這個(gè) HTML 實(shí)體引用:" "。這個(gè)“無折行空格”實(shí)體在 HTML 中被用于在某個(gè)文檔中插入一個(gè)額外的空格。
當(dāng)文檔被 XML 解析器解析時(shí),實(shí)體就會被展開。
(2) PCDATA
PCDATA 的意思是被解析的字符數(shù)據(jù)(parsed character data)。
可把字符數(shù)據(jù)想象為 XML 元素的開始標(biāo)簽與結(jié)束標(biāo)簽之間的文本。
PCDATA 是會被解析器解析的文本。這些文本將被解析器解析成實(shí)體以及標(biāo)記。
文本中的標(biāo)簽會被當(dāng)作標(biāo)記來處理,而實(shí)體會被展開。
不過,被解析的字符數(shù)據(jù)不應(yīng)當(dāng)包含任何 &、< 或者 > 字符;需要使用 &、< 以及 > 實(shí)體來分別替換它們。
(3)CDATA
CDATA 的意思是字符數(shù)據(jù)(character data)。
CDATA 是不會被解析器解析的文本。在這些文本中的標(biāo)簽不會被當(dāng)作標(biāo)記來對待,其中的實(shí)體也不會被展開。
相關(guān)文章
- 這篇文章主要介紹了XML代碼編寫的編碼與驗(yàn)證問題,與HTML類似,XML文件的編碼也能在序言部分被指定,需要的朋友可以參考下2016-02-15
- 這篇文章主要介紹了XML中的處理指令,處理指令在XML中并不常用,稍作了解即可,需要的朋友可以參考下2016-02-15
- 這篇文章主要介紹了XML對代碼中的空白處理,文中介紹到了XML書寫中的有效空白與無效空白的區(qū)分,需要的朋友可以參考下2016-02-14
深入解析XML中的字符實(shí)體與字符數(shù)據(jù)
這篇文章主要介紹了XML中的字符實(shí)體與字符數(shù)據(jù),文中所說的CDATA片段即是指字符數(shù)據(jù)即不由解析器解析的文本塊,需要的朋友可以參考下2016-02-14- 這篇文章主要介紹了詳解XML中的代碼注釋書寫方法,文章中總結(jié)了注釋使用的一些注意點(diǎn),比如XML不支持嵌套注釋等,需要的朋友可以參考下2016-02-14
- 這篇文章主要介紹了XML中的屬性學(xué)習(xí)教程,包括使用屬性將數(shù)據(jù)存儲在子元素中的例子,需要的朋友可以參考下2016-02-14
- 這篇文章主要介紹了XML中的標(biāo)簽與元素的使用,是XML入門學(xué)習(xí)中的基礎(chǔ)知識,需要的朋友可以參考下2016-02-14
- 這篇文章主要介紹了XML中的文檔與聲明用法,是XML入門學(xué)習(xí)中的基礎(chǔ)知識,需要的朋友可以參考下2016-02-04
- 這篇文章主要介紹了XML標(biāo)記語言的基本概念及語法入門教程,XML同時(shí)也被廣泛用作標(biāo)記數(shù)據(jù)來作為XML數(shù)據(jù)交換格式,需要的朋友可以參考下2016-02-04