php中抓取網(wǎng)頁內(nèi)容的實例詳解
php中抓取網(wǎng)頁內(nèi)容的實例詳解
方法一:
使用file_get_contents方法實現(xiàn)
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml"; $html = file_get_contents($url); //如果出現(xiàn)中文亂碼使用下面代碼 //$getcontent = iconv("gb2312", "utf-8",$html); echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";
代碼很簡單,一看就懂,不解釋了。
方法二:
使用curl實現(xiàn)
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml"; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); $html = curl_exec($ch); curl_close($ch); echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
加上這句代碼,表示如果請求被重定向時,可以訪問到最終的請求頁面,不然請求的結(jié)果會顯示如下內(nèi)容:
<head><title>Object moved</title></head> <body><h1>Object Moved</h1>This object may be found <a href="some link." rel="external nofollow" >here</a>.</body>
如意疑問請留言或者到本站社區(qū)交流討論,感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!
相關(guān)文章
PHP實現(xiàn)限制IP訪問及提交次數(shù)的方法詳解
這篇文章主要介紹了PHP實現(xiàn)限制IP訪問及提交次數(shù)的方法,涉及php針對客戶端來訪IP的獲取、判斷以及結(jié)合session記錄IP訪問次數(shù)等相關(guān)操作技巧,需要的朋友可以參考下2017-07-07php curl常見錯誤:SSL錯誤、bool(false)
在命令行中使用curl調(diào)用跳過SSL證書檢查的方法,需要的朋友可以參考下。2011-12-12PHP設(shè)計模式之結(jié)構(gòu)模式的深入解析
本篇文章是對PHP設(shè)計模式中的結(jié)構(gòu)模式進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-06-06php實現(xiàn)專業(yè)獲取網(wǎng)站SEO信息類實例
這篇文章主要介紹了php實現(xiàn)專業(yè)獲取網(wǎng)站SEO信息類,實例分析了seoreport類針對網(wǎng)站SEO信息檢查與獲取的技巧,非常具有實用價值,需要的朋友可以參考下2015-04-04php實現(xiàn)轉(zhuǎn)換html格式為文本格式的方法
這篇文章主要介紹了php實現(xiàn)轉(zhuǎn)換html格式為文本格式的方法,通過一個自定義函數(shù)實現(xiàn)針對HTML標(biāo)簽的過濾,涉及php正則替換的相關(guān)操作技巧,需要的朋友可以參考下2016-05-05