php使用simple_html_dom解析HTML示例
本文實(shí)例講述了php使用simple_html_dom解析HTML的方法。分享給大家供大家參考,具體如下:
今天寫了兩個(gè)爬蟲, 一個(gè)使用Python, 一個(gè)使用PHP, 說實(shí)在, 兩個(gè)實(shí)現(xiàn)的方式都很方便.
下面說一下使用simple_html_dom這個(gè)開源類來解析HTML代碼:
1. 下載simple_html_dom:
http://sourceforge.net/projects/simplehtmldom/files/
或者點(diǎn)擊此處本站下載。
2. 用法示例:
<?php // example of how to use basic selector to retrieve HTML contents include('../simple_html_dom.php'); // get DOM from URL or file $html = file_get_html('http://www.google.com/'); // find all link foreach($html->find('a') as $e) echo $e->href . '<br>'; // find all image foreach($html->find('img') as $e) echo $e->src . '<br>'; // find all image with full tag foreach($html->find('img') as $e) echo $e->outertext . '<br>'; // find all div tags with id=gbar foreach($html->find('div#gbar') as $e) echo $e->innertext . '<br>'; // find all span tags with class=gb1 foreach($html->find('span.gb1') as $e) echo $e->outertext . '<br>'; // find all td tags with attribite align=center foreach($html->find('td[align=center]') as $e) echo $e->innertext . '<br>'; // extract text from table echo $html->find('td[align="center"]', 1)->plaintext.'<br><hr>'; // extract text from HTML echo $html->plaintext; ?>
更多關(guān)于PHP相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《PHP編碼與轉(zhuǎn)碼操作技巧匯總》、《php面向?qū)ο蟪绦蛟O(shè)計(jì)入門教程》、《PHP數(shù)學(xué)運(yùn)算技巧總結(jié)》、《PHP數(shù)組(Array)操作技巧大全》、《php字符串(string)用法總結(jié)》、《PHP數(shù)據(jù)結(jié)構(gòu)與算法教程》、《php程序設(shè)計(jì)算法總結(jié)》、《php正則表達(dá)式用法總結(jié)》及《php常見數(shù)據(jù)庫操作技巧匯總》
希望本文所述對(duì)大家PHP程序設(shè)計(jì)有所幫助。
相關(guān)文章
PHP下SSL加密解密、驗(yàn)證、簽名方法(很簡(jiǎn)單)
這篇文章主要介紹了PHP下SSL加密解密、驗(yàn)證、簽名方法,方法很簡(jiǎn)單,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2015-12-12php運(yùn)行時(shí)動(dòng)態(tài)創(chuàng)建函數(shù)的方法
這篇文章主要介紹了php運(yùn)行時(shí)動(dòng)態(tài)創(chuàng)建函數(shù)的方法,涉及php流程語句與create_function函數(shù)的使用技巧,需要的朋友可以參考下2015-03-03php+xml結(jié)合Ajax實(shí)現(xiàn)點(diǎn)贊功能完整實(shí)例
這篇文章主要介紹了php+xml結(jié)合Ajax實(shí)現(xiàn)點(diǎn)贊功能的方法,以一個(gè)完整實(shí)例形式詳細(xì)分析了XML文件、html頁面以及Ajax結(jié)合php實(shí)現(xiàn)點(diǎn)贊功能的技巧,非常具有實(shí)用價(jià)值,需要的朋友可以參考下2015-01-01