欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

PHP抓取網(wǎng)頁、解析HTML常用的方法總結(jié)

 更新時間:2015年07月01日 15:59:17   投稿:junjie  
這篇文章主要介紹了PHP抓取網(wǎng)頁、解析HTML常用的方法總結(jié),本文只是對可以實現(xiàn)這兩個需求的方法作了總結(jié),只介紹方法,不介紹如何實現(xiàn),需要的朋友可以參考下

概述

爬蟲是我們在做程序時經(jīng)常會遇到的一種功能。PHP有許多開源的爬蟲工具,如snoopy,這些開源的爬蟲工具,通常能幫我們完成大部分功能,但是在某種情況下,我們需要自己實現(xiàn)一個爬蟲,本篇文章對PHP實現(xiàn)爬蟲的方式做個總結(jié)。

PHP實現(xiàn)爬蟲主要方法

1.file()函數(shù)
2.file_get_contents()函數(shù)
3.fopen()->fread()->fclose()方式
4.curl方式
5.fsockopen()函數(shù),socket方式
6.使用開源工具,如:snoopy

PHP解析XML或HTML主要方式

1.正則表達式
2.PHP DOMDocument對象
3.插件,如:PHP Simple HTML DOM Parser

總結(jié)

這里對PHP實現(xiàn)爬蟲的方式做個簡單得總結(jié),本篇設(shè)計到得內(nèi)容還有很多,稍后會對PHP解析HTML和XML的方式做個總結(jié)。

相關(guān)文章

最新評論