XML CDATA
所有 XML 文檔中的文本均會(huì)被解析器解析。
只有 CDATA 區(qū)段(CDATA section)中的文本會(huì)被解析器忽略。
PCDATA
PCDATA 指的是被解析的字符數(shù)據(jù)(Parsed Character Data)。
XML 解析器通常會(huì)解析 XML 文檔中所有的文本。
當(dāng)某個(gè) XML 元素被解析時(shí),其標(biāo)簽之間的文本也會(huì)被解析:
<message>此文本也會(huì)被解析</message>
解析器之所以這么做是因?yàn)?XML 元素可包含其他元素,就像這個(gè)例子中,其中的 <name> 元素包含著另外的兩個(gè)元素(first 和 last):
<name><first>Bill</first><last>Gates</last></name>
而解析器會(huì)把它分解為像這樣的子元素:
<name> <first>Bill</first> <last>Gates</last> </name>
轉(zhuǎn)義字符
非法的 XML 字符必須被替換為實(shí)體引用(entity reference)。
假如您在 XML 文檔中放置了一個(gè)類似 "<" 字符,那么這個(gè)文檔會(huì)產(chǎn)生一個(gè)錯(cuò)誤,這是因?yàn)榻馕銎鲿?huì)把它解釋為新元素的開始。因此你不能這樣寫:
<message>if salary < 1000 then</message>
為了避免此類錯(cuò)誤,需要把字符 "<" 替換為實(shí)體引用,就像這樣:
<message>if salary < 1000 then</message>
在 XML 中有 5 個(gè)預(yù)定義的實(shí)體引用:
< | < | 小于 |
> | > | 大于 |
& | & | 和號(hào) |
' | ' | 省略號(hào) |
" | " | 引號(hào) |
注釋:嚴(yán)格地講,在 XML 中僅有字符 "<"和"&" 是非法的。省略號(hào)、引號(hào)和大于號(hào)是合法的,但是把它們替換為實(shí)體引用是個(gè)好的習(xí)慣。
CDATA
術(shù)語 CDATA 指的是不應(yīng)由 XML 解析器進(jìn)行解析的文本數(shù)據(jù)(Unparsed Character Data)。
在 XML 元素中,"<" 和 "&" 是非法的。
"<" 會(huì)產(chǎn)生錯(cuò)誤,因?yàn)榻馕銎鲿?huì)把該字符解釋為新元素的開始。
"&" 也會(huì)產(chǎn)生錯(cuò)誤,因?yàn)榻馕銎鲿?huì)把該字符解釋為字符實(shí)體的開始。
某些文本,比如 JavaScript 代碼,包含大量 "<" 或 "&" 字符。為了避免錯(cuò)誤,可以將腳本代碼定義為 CDATA。
CDATA 部分中的所有內(nèi)容都會(huì)被解析器忽略。
CDATA 部分由 "<![CDATA[" 開始,由 "]]>" 結(jié)束:
<script> <![CDATA[ function matchwo(a,b) { if (a < b && a < 0) then { return 1; } else { return 0; } } ]]> </script>
在上面的例子中,解析器會(huì)忽略 CDATA 部分中的所有內(nèi)容。
關(guān)于 CDATA 部分的注釋:
CDATA 部分不能包含字符串 "]]>"。也不允許嵌套的 CDATA 部分。
標(biāo)記 CDATA 部分結(jié)尾的 "]]>" 不能包含空格或折行。