php使用simple_html_dom解析HTML示例
本文實(shí)例講述了php使用simple_html_dom解析HTML的方法。分享給大家供大家參考,具體如下:
今天寫(xiě)了兩個(gè)爬蟲(chóng), 一個(gè)使用Python, 一個(gè)使用PHP, 說(shuō)實(shí)在, 兩個(gè)實(shí)現(xiàn)的方式都很方便.
下面說(shuō)一下使用simple_html_dom這個(gè)開(kāi)源類(lèi)來(lái)解析HTML代碼:
1. 下載simple_html_dom:
http://sourceforge.net/projects/simplehtmldom/files/
或者點(diǎn)擊此處本站下載。
2. 用法示例:
<?php // example of how to use basic selector to retrieve HTML contents include('../simple_html_dom.php'); // get DOM from URL or file $html = file_get_html('http://www.google.com/'); // find all link foreach($html->find('a') as $e) echo $e->href . '<br>'; // find all image foreach($html->find('img') as $e) echo $e->src . '<br>'; // find all image with full tag foreach($html->find('img') as $e) echo $e->outertext . '<br>'; // find all div tags with id=gbar foreach($html->find('div#gbar') as $e) echo $e->innertext . '<br>'; // find all span tags with class=gb1 foreach($html->find('span.gb1') as $e) echo $e->outertext . '<br>'; // find all td tags with attribite align=center foreach($html->find('td[align=center]') as $e) echo $e->innertext . '<br>'; // extract text from table echo $html->find('td[align="center"]', 1)->plaintext.'<br><hr>'; // extract text from HTML echo $html->plaintext; ?>
更多關(guān)于PHP相關(guān)內(nèi)容感興趣的讀者可查看本站專(zhuān)題:《PHP編碼與轉(zhuǎn)碼操作技巧匯總》、《php面向?qū)ο蟪绦蛟O(shè)計(jì)入門(mén)教程》、《PHP數(shù)學(xué)運(yùn)算技巧總結(jié)》、《PHP數(shù)組(Array)操作技巧大全》、《php字符串(string)用法總結(jié)》、《PHP數(shù)據(jù)結(jié)構(gòu)與算法教程》、《php程序設(shè)計(jì)算法總結(jié)》、《php正則表達(dá)式用法總結(jié)》及《php常見(jiàn)數(shù)據(jù)庫(kù)操作技巧匯總》
希望本文所述對(duì)大家PHP程序設(shè)計(jì)有所幫助。
相關(guān)文章
PHP入門(mén)之常量簡(jiǎn)介和系統(tǒng)常量
PHP常量是一個(gè)簡(jiǎn)單值的標(biāo)識(shí)符(名字)。如同其名稱(chēng)所暗示的,在腳本執(zhí)行期間該值不能改變(除了所謂的魔術(shù)常量,它們其實(shí)不是常量)2014-05-05PHP下SSL加密解密、驗(yàn)證、簽名方法(很簡(jiǎn)單)
這篇文章主要介紹了PHP下SSL加密解密、驗(yàn)證、簽名方法,方法很簡(jiǎn)單,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2015-12-12php運(yùn)行時(shí)動(dòng)態(tài)創(chuàng)建函數(shù)的方法
這篇文章主要介紹了php運(yùn)行時(shí)動(dòng)態(tài)創(chuàng)建函數(shù)的方法,涉及php流程語(yǔ)句與create_function函數(shù)的使用技巧,需要的朋友可以參考下2015-03-03php+xml結(jié)合Ajax實(shí)現(xiàn)點(diǎn)贊功能完整實(shí)例
這篇文章主要介紹了php+xml結(jié)合Ajax實(shí)現(xiàn)點(diǎn)贊功能的方法,以一個(gè)完整實(shí)例形式詳細(xì)分析了XML文件、html頁(yè)面以及Ajax結(jié)合php實(shí)現(xiàn)點(diǎn)贊功能的技巧,非常具有實(shí)用價(jià)值,需要的朋友可以參考下2015-01-01用php過(guò)濾危險(xiǎn)html代碼的函數(shù)
用PHP過(guò)濾html里可能被利用來(lái)引入外部危險(xiǎn)內(nèi)容的代碼。有些時(shí)候,需要讓用戶(hù)提交html內(nèi)容,以便豐富用戶(hù)發(fā)布的信息,當(dāng)然,有些可能造成顯示頁(yè)面布局混亂的代碼也在過(guò)濾范圍內(nèi)。2008-07-07