thinkphp 抓取網(wǎng)站的內(nèi)容并且保存到本地的實(shí)例詳解
thinkphp 抓取網(wǎng)站的內(nèi)容并且保存到本地的實(shí)例詳解
我需要寫這么一個(gè)例子,到電子課本網(wǎng)下載一本電子書。
電子課本網(wǎng)的電子書,是把書的每一頁當(dāng)成一個(gè)圖片,然后一本書就是有很多張圖片,我需要批量的進(jìn)行下載圖片操作。
下面是代碼部分:
public function download() {
$http = new \Org\Net\Http();
$url_pref = "http://www.dzkbw.com/books/rjb/dili/xc7s/";
$localUrl = "Public/bookcover/";
$reg="|showImg\('(.+)'\);|";
$i=1;
do {
$filename = substr("000".$i,-3).".htm";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url_pref.$filename);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$html = curl_exec($ch);
curl_close($ch);
$result = preg_match_all($reg,$html,$out, PREG_PATTERN_ORDER);
if($result==1) {
$picUrl = $out[1][0];
$picFilename = substr("000".$i,-3).".jpg";
$http->curlDownload($picUrl, $localUrl.$picFilename);
}
$i = $i+1;
} while ($result==1);
echo "下載完成";
}
我這里是以人教版地理七年級(jí)地理上冊(cè)為例子 http://www.dzkbw.com/books/rjb/dili/xc7s/001.htm
網(wǎng)頁是從001.htm開始,然后數(shù)字一直加
每個(gè)網(wǎng)頁里面都有一張圖,就是對(duì)應(yīng)課本的內(nèi)容,以圖片的形式展示課本內(nèi)容
我的代碼是做了一個(gè)循環(huán),從第一頁開始抓,一直抓到找不到網(wǎng)頁里的圖片為止
抓到網(wǎng)頁的內(nèi)容后,把網(wǎng)頁里面的圖片抓取到本地服務(wù)器
抓取后的實(shí)際效果:

以上就是thinkphp 抓取網(wǎng)站的內(nèi)容并且保存到本地的實(shí)例詳解,如有疑問請(qǐng)留言或者到本站社區(qū)交流討論,感謝閱讀,希望能幫助到大家,謝謝大家對(duì)本站的支持!
- 基于ThinkPHP5框架使用QueryList爬取并存入mysql數(shù)據(jù)庫操作示例
- php使用QueryList輕松采集js動(dòng)態(tài)渲染頁面方法
- jquery+thinkphp實(shí)現(xiàn)跨域抓取數(shù)據(jù)的方法
- thinkphp5 URL和路由的功能詳解與實(shí)例
- ThinkPHP5查詢數(shù)據(jù)及處理結(jié)果的方法小結(jié)
- TP5(thinkPHP5)框架基于ajax與后臺(tái)數(shù)據(jù)交互操作簡單示例
- thinkphp5.1 文件引入路徑問題及注意事項(xiàng)
- thinkPHP5(TP5)實(shí)現(xiàn)改寫跳轉(zhuǎn)提示頁面的方法
- tp5(thinkPHP5)框架數(shù)據(jù)庫Db增刪改查常見操作總結(jié)
- thinkphp5 加載靜態(tài)資源路徑與常量的方法
- tp5(thinkPHP5)框架實(shí)現(xiàn)多數(shù)據(jù)庫查詢的方法
- TP5框架使用QueryList采集框架爬小說操作示例
相關(guān)文章
PHP得到某段時(shí)間區(qū)間的時(shí)間戳 php定時(shí)任務(wù)
linux 定時(shí)掃描,若有滿足條件的用戶,則發(fā)送短信2012-04-04
PHP使用CURL獲取302跳轉(zhuǎn)后的地址實(shí)例
這篇文章主要介紹了PHP使用CURL獲取302跳轉(zhuǎn)后的地址實(shí)例,需要的朋友可以參考下2014-05-05
YII動(dòng)態(tài)模型(動(dòng)態(tài)表名)支持分析
這篇文章主要介紹了YII動(dòng)態(tài)模型(動(dòng)態(tài)表名)支持,分析了動(dòng)態(tài)模型的原理并結(jié)合實(shí)例形式給出了相關(guān)使用方法,需要的朋友可以參考下2016-03-03
PHP使用Redis實(shí)現(xiàn)Session共享的實(shí)現(xiàn)示例
這篇文章主要介紹了PHP使用Redis實(shí)現(xiàn)Session共享的實(shí)現(xiàn)示例,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2019-05-05

