XML指南——XML 語法
更新時(shí)間:2006年09月06日 00:00:00 作者:
XML的語法規(guī)則既簡單又嚴(yán)格,非常容易學(xué)習(xí)和使用。
正因?yàn)槿绱?,編寫讀取和操作XML的軟件也是相對容易的事情。
一個(gè)XML文檔的例子
XML文檔使用了自描述的和簡單的語法。
<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>Lin</to>
<from>Ordm</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
文檔的第1行:XML聲明——定義此文檔所遵循的XML標(biāo)準(zhǔn)的版本,在這個(gè)例子里是1.0版本的標(biāo)準(zhǔn),使用的是ISO-8859-1 (Latin-1/West European)字符集。
文檔的第2行是根元素(就象是說“這篇文檔是一個(gè)便條”):
<note>
文檔的第3--6行描述了根元素的四個(gè)子節(jié)點(diǎn)(to, from, heading,和 body):
<to>Lin</to>
<from>Ordm</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
文檔的最后一行是根元素的結(jié)束:
</note>
你能從這個(gè)文檔中看出這是Ordm給Lin留的便條么?難道能不承認(rèn)XML是一種美麗的自描述語言么?
所有的XML文檔必須有一個(gè)結(jié)束標(biāo)記
在XML文檔中, 忽略結(jié)束標(biāo)記是不符合規(guī)定的。
在HTML文檔中,一些元素可以是沒有結(jié)束標(biāo)記的。下面的代碼在HTML中是完全合法的:
<p>This is a paragraph
<p>This is another paragraph
但是在XML文檔中必須要有結(jié)束標(biāo)記,象下面的例子一樣:
<p>This is a paragraph</p>
<p>This is another paragraph</p>
注意: 你可能已經(jīng)注意到了,上面例子中的第一行并沒有結(jié)束標(biāo)記。這不是一個(gè)錯(cuò)誤。因?yàn)閄ML聲明并不是XML文檔的一部分,他不是XML元素,也就不應(yīng)該有結(jié)束標(biāo)記。
XML標(biāo)記都是大小寫敏感的
這與HTML不一樣, XML標(biāo)記是大小寫敏感的。
在XML中, 標(biāo)記<Letter>與標(biāo)記<letter>是兩個(gè)不同的標(biāo)記。
因此在XML文檔中開始標(biāo)記和結(jié)束標(biāo)記的大小寫必須保持一致。
<Message>This is incorrect</message> //錯(cuò)誤的
<message>This is correct</message> //正確的
所有的XML元素必須合理包含
在XML中不允許不正確的嵌套包含。
在HTML中,允許有一些不正確的包含,例如下面的代碼可以被瀏覽器解析:
<b><i>This text is bold and italic</b></i>
在XML中所有元素必須正確的嵌套包含,上面的代碼應(yīng)該這樣寫:
<b><i>This text is bold and italic</i></b>
所有的XML文檔必須有一個(gè)根元素
XML文檔中的第一個(gè)元素就是根元素。
所有XML文檔都必須包含一個(gè)單獨(dú)的標(biāo)記來定義,所有其他元素的都必須成對的在根元素中嵌套。XML文檔有且只能有一個(gè)根元素。
所有的元素都可以有子元素,子元素必須正確的嵌套在父元素中,下面的代碼可以形象的說明:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
屬性值必須使用引號""
在XML中,元素的屬性值沒有引號引著是不符合規(guī)定的。
如同HTML一樣,XML元素同樣也可以擁有屬性。XML元素的屬性以名字/值成對的出現(xiàn)。XML語法規(guī)范要求XML元素屬性值必須用引號引著。請看下面的兩個(gè)例子,第一個(gè)是錯(cuò)誤的,第二個(gè)是正確的。
<?xml version="1.0" encoding="ISO-8859-1"?>
<note date=12/11/99>
<to>Lin</to>
<from>Ordm</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
<?xml version="1.0" encoding="ISO-8859-1"?>
<note date="12/11/99">
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
第一個(gè)文檔的錯(cuò)誤之處是屬性值沒有用引號引著。
正確的寫法是: date="12/11/99". 不正確的寫法: date=12/11/99.
使用XML,空白將被保留
在XML文檔中,空白部分不會(huì)被解析器自動(dòng)刪除。
這一點(diǎn)與HTML是不同的。在HTML中,這樣的一句話:
"Hello my name is Ordm"將會(huì)被顯示成:“Hello my name is Ordm”,
因?yàn)镠TML解析器會(huì)自動(dòng)把句子中的空白部分去掉。
使用XML, CR / LF 被轉(zhuǎn)換為 LF
使用 XML, 新行總是被標(biāo)識為 LF(Line Feed,換行)。
你知道打字機(jī)是什么么?呵呵,打字機(jī)是在上個(gè)世紀(jì)里使用的一種專門打字的機(jī)器。^&^
當(dāng)你用打字機(jī)敲完一行字后,你通常不得不再把打字頭移動(dòng)到紙的左端。
在Windows應(yīng)用程序中,文本中的新行通常標(biāo)識為 CR LF (carriage return, line feed,回車,換行)。在Unix應(yīng)用程序中,新行通常標(biāo)識為 LF。還有一些應(yīng)用程序只使用CR來表示一個(gè)新行。
XML中的注釋
在XML中注釋的語法基本上和HTML中的一樣。
<!-- 這是一個(gè)注釋 -->
XML并沒有什么特別的哦
XML確實(shí)沒有什么特別的地方。他只是一些用尖括號擴(kuò)在一起的普通的純文本。
編輯普通文本的軟件也可以編輯XML文檔。
然而在一個(gè)支持XML的應(yīng)用程序中,XML標(biāo)記往往對應(yīng)著特殊的操作,有些標(biāo)記可能是可見的,而有些標(biāo)記則可能不會(huì)顯示出來,而不會(huì)有什么特殊的操作。
相關(guān)文章
怎樣才能用js生成xmldom對象,并且在firefox中也實(shí)現(xiàn)xml數(shù)據(jù)島?
怎樣才能用js生成xmldom對象,并且在firefox中也實(shí)現(xiàn)xml數(shù)據(jù)島?...2006-12-12存儲(chǔ)于xml中需要的HTML轉(zhuǎn)義代碼
在數(shù)據(jù)提交到數(shù)據(jù)庫之前的簡單HTML字符轉(zhuǎn)意,防止javascript惡意代碼,因?yàn)轫?xiàng)目中用到了輸出為xml,所以在輸出之前還要進(jìn)行二次轉(zhuǎn)意,把數(shù)據(jù)庫中之前加入的<br>轉(zhuǎn)義為正常。2009-11-11