欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

PHP抓取網(wǎng)頁(yè)、解析HTML常用的方法總結(jié)

 更新時(shí)間:2015年07月01日 15:59:17   投稿:junjie  
這篇文章主要介紹了PHP抓取網(wǎng)頁(yè)、解析HTML常用的方法總結(jié),本文只是對(duì)可以實(shí)現(xiàn)這兩個(gè)需求的方法作了總結(jié),只介紹方法,不介紹如何實(shí)現(xiàn),需要的朋友可以參考下

概述

爬蟲是我們?cè)谧龀绦驎r(shí)經(jīng)常會(huì)遇到的一種功能。PHP有許多開源的爬蟲工具,如snoopy,這些開源的爬蟲工具,通常能幫我們完成大部分功能,但是在某種情況下,我們需要自己實(shí)現(xiàn)一個(gè)爬蟲,本篇文章對(duì)PHP實(shí)現(xiàn)爬蟲的方式做個(gè)總結(jié)。

PHP實(shí)現(xiàn)爬蟲主要方法

1.file()函數(shù)
2.file_get_contents()函數(shù)
3.fopen()->fread()->fclose()方式
4.curl方式
5.fsockopen()函數(shù),socket方式
6.使用開源工具,如:snoopy

PHP解析XML或HTML主要方式

1.正則表達(dá)式
2.PHP DOMDocument對(duì)象
3.插件,如:PHP Simple HTML DOM Parser

總結(jié)

這里對(duì)PHP實(shí)現(xiàn)爬蟲的方式做個(gè)簡(jiǎn)單得總結(jié),本篇設(shè)計(jì)到得內(nèi)容還有很多,稍后會(huì)對(duì)PHP解析HTML和XML的方式做個(gè)總結(jié)。

相關(guān)文章

最新評(píng)論