PHP4和PHP5版本下解析XML文檔的操作方法實例分析
本文實例講述了PHP4和PHP5版本下解析XML文檔的操作方法。分享給大家供大家參考,具體如下:
在PHP網站開發(fā)與建設過程中,時常會碰到需要對XML文檔進行解析,PHP4版本自帶了XML解析器(sax),PHP5版本增加了SimpleXML(基于dom)的XML擴展,對XML的解析更是非常方便,今天和大家分享下在不同環(huán)境下對XML文檔進行解析的方法。
XML文檔
<?xml version="1.0" encoding="gbk"?> <LeapsoulXML> <LeapsoulInfo> <name>Leapsoul-PHP網站開發(fā)</name> <website>http://www.dbjr.com.cn</website> <description>分享PHP網站開發(fā)與建設的樂趣,教你如何建立網站</description> <bloger>David</bloger> <date>2009-05-13</date> <qq>QQ:154130270</qq> </LeapsoulInfo> <LeapsoulInfo> <name>Leapsoul-PHP網站開發(fā)</name> <website>http://www.dbjr.com.cn</website> <description>分享PHP網站開發(fā)與建設的樂趣,教你如何建立網站</description> <bloger>David</bloger> <date>2009-05-13</date> <qq>QQ:154130270</qq> </LeapsoulInfo> </LeapsoulXML>
PHP5版本下SimpleXML的使用方法
$info=simplexml_load_file('leapsoulcn.xml'); print_r($info); $name=$info->LeapsoulInfo[0]->name; echo$name; foreach($info->LeapsoulInfoas$LeapsoulInfo) { echo$LeapsoulInfo->name."<br />"; echo$LeapsoulInfo->website."<br />"; echo$LeapsoulInfo->description."<br />"; echo$LeapsoulInfo->bloger."<br />"; echo$LeapsoulInfo->date."<br />"; echo$LeapsoulInfo->qq."<br />"; } foreach($info->xpath('//name')as$value){ echo$value.'<br />'; } foreach($info->LeapsoulInfo[0]->children()as$value){ echo$value->getName(); echo$value.'<br />'; } $info->LeapsoulInfo[0]->addChild('msn','MSN:davidfaithman@hotmail.com'); $info->asXML('leapsoulcn.xml');
代碼注釋
第1行:simplexml_load_file:讀取一個xml文檔作為操作對象,可以讀取本地或者遠程xml文檔;simplexml_load_string:讀取一個xml字符串作為操作的對象
第3行:如果不清楚如何獲取某個節(jié)點的信息,可用print_r函數打印輸出查看具體的結構,simplexml解析返回的對象具有數組結構。
第5~8行:以對象方式讀取某個XML文檔節(jié)點信息,讀取方式:句柄->節(jié)點元素名->子節(jié)點,如果相同的節(jié)點元素有多個,則以數組(array)方式讀取
注:由于simplexml解析返回的信息是UTF8格式的,如果網站使用的是GBK的,則需要轉碼,你可以使用iconv函數或者其他的utf8與gbk轉換函數進行操作,如:$name = iconv('utf-8′,'gbk',$name);
第9~17行:以遍歷的形式,讀取所有元素下的子節(jié)點信息
第19~21行:simplexml的xpath函數是用來查詢XML數據的,比如這里查詢的是所有name節(jié)點的值
第23~26行:children函數是用來找尋某個特定節(jié)點下所有子節(jié)點的值。getName函數用來獲得每個子節(jié)點的元素名稱
第28~29行:addChild函數用來在某個特定節(jié)點下增加一個子節(jié)點;asXML函數對已做過改動的XML文檔進行保存
點擊查看更多SimpleXML函數說明。
PHP4版本自帶的XML函數解析方法
function doStartElement($xmlParser,$name,$attr) { //對開始元素的處理 } function doEndElement($xmlParser,$name) { //對結尾元素的處理 } function doStringData($xmlParser,$data) { //對元素間的字符數據的處理 } $xmlObj = xml_parser_create("UTF-8"); xml_set_element_handler($xmlObj,"doStartElement","doEndElement"); xml_set_character_data_handler($xmlObj,"doStringData"); xml_parse($xmlObj,file_get_contents("leapsoulcn.xml")); xml_parser_free($xmlObj);
代碼注釋
第1~15行:定義開始元素,結尾元素以及元素間字符數據的處理函數
第16行:建立一個新的XML解析器并返回可被其它XML函數使用的資源句柄,輸入默認編碼方式為 “ISO-8859-1”。同時,支持的編碼方式還有“UTF-8”和 “US-ASCII”,輸出數據編碼方式是和xml_parser_create函數處定義相一致。
第18行:建立起始和終止元素處理器
第20行:建立字符數據處理器,處理元素之間的相關數據
注:XML語法解析器不會加上或者去掉任何空格,空格的取舍將由開發(fā)者自己決定。
第22行:啟動解析器xml_parse函數第二個參數是字符型的,所以需要讀取相關的XML文檔信息,此處我用的是file_get_contents函數,本地遠程都可行,當然你也可以使用fopen函數
第24行:XML解析完成后,釋放解析器占用的內存
自帶的XML函數解析思路
第一步:自定義開始元素,結尾元素以及元素間字符數據的處理函數;
第二步:建立一個XML解析器;
第三步:建立起始和終止元素處理器;
第四步:建立字符數據處理器,處理元素之間的相關數據;
第五步:啟動解析器;
第六步:XML解析完成后,釋放解析器占用的內存。
總結:
總的來說PHP自帶的XML解析器使用起來相當繁瑣,需要有較強的邏輯,而且如果XML文檔結構不同,元素、字符等3個函數需要重新定義,而在PHP5版本增加了SimpleXML擴展后,XML解析起來非常簡單,當然如果你需要進行更復雜的XML文檔解析操作,你也可以下載安裝并使用libxml,功能相當強。
PS:這里再為大家提供幾款關于xml操作的在線工具供大家參考使用:
在線XML/JSON互相轉換工具:
http://tools.jb51.net/code/xmljson
在線格式化XML/在線壓縮XML:
http://tools.jb51.net/code/xmlformat
XML在線壓縮/格式化工具:
http://tools.jb51.net/code/xml_format_compress
XML代碼在線格式化美化工具:
http://tools.jb51.net/code/xmlcodeformat
更多關于PHP相關內容感興趣的讀者可查看本站專題:《PHP針對XML文件操作技巧總結》、《PHP數組(Array)操作技巧大全》、《php字符串(string)用法總結》、《PHP錯誤與異常處理方法總結》、《PHP基本語法入門教程》、《php面向對象程序設計入門教程》、《php+mysql數據庫操作入門教程》及《php常見數據庫操作技巧匯總》
希望本文所述對大家PHP程序設計有所幫助。
相關文章
PHP 開發(fā)環(huán)境配置(Zend Server安裝)
運行安裝文件(ZendServer-CE-php-5.3.2-5.0.1-Windows_x86.exe)開始安裝,選項請參照我的選擇。2010-04-04php+jQuery遞歸調用POST循環(huán)請求示例
這篇文章主要介紹了php+jQuery遞歸調用POST循環(huán)請求,結合實例形式分析了php+jQuery的ajax方法遞歸調用與json轉換技巧,需要的朋友可以參考下2016-10-10