分享PHP源碼批量抓取遠(yuǎn)程網(wǎng)頁圖片并保存到本地的實現(xiàn)方法
做為一個仿站工作者,當(dāng)遇到網(wǎng)站有版權(quán)時甚至加密的時候,WEBZIP也熄火,怎么扣取網(wǎng)頁上的圖片和背景圖片呢。有時候,可能會想到用火狐,這款瀏覽器好像一個強大的BUG,文章有版權(quán),屏蔽右鍵,火狐絲毫也不會被影響。
但是作為一個熱愛php的開發(fā)者來說,更多的是喜歡自己動手。所以,我就寫出了下面的一個源碼,php遠(yuǎn)程抓取圖片小程序??梢宰x取css文件并抓取css代碼中的背景圖片,下面這段代碼也是針對抓取css中圖片而編寫的。
<?php header("Content-Type: text/html; charset=utf-8"); error_reporting(E_ERROR|E_WARNING); //全局配置 $fromFile = "aaa.css"; //要抓取的文件 $savePath = "ttttttttt"; //保存路徑 $fromDomain = "http://www.xxx.com/"; //要抓取的域名 //讀取css樣式并且分離出所有image的url $str = file_get_contents($fromFile); $strArr = explode("url(",$str); $i = 0; foreach($strArr as $val){ $val1 = explode(")",$val); if(strpos($val1[0],'jpg')||strpos($val1[0],'png')||strpos($val1[0],'gif')) $imgUrl[$i++] = $val1[0]; } //PS:上面可以用正則的,但是我覺得這樣也不錯 //開始抓取 foreach($imgUrl as $url){ if($url=="") continue; $filename = $savePath.$url; $url = $fromDomain.$url; getImage($url,$filename); } function getImage($url,$filename){ ob_start(); $context = stream_context_create( array ( 'http' => array ( 'follow_location' => false // don't follow redirects ) ) ); //請確保php.ini中的fopen wrappers已經(jīng)激活 readfile( $url,false,$context); $img = ob_get_contents(); ob_end_clean(); $fp2 = @fopen($filename,"a"); fwrite($fp2,$img); fclose($fp2); echo $filename." ok √<br/>"; } ?>
然后沒有意外的話,你會發(fā)現(xiàn),你指定的文件夾下面已經(jīng)滿滿的都是圖片了,哈哈..
ps:php獲取遠(yuǎn)程圖片并下載保存到本地
分享一個利用php獲取遠(yuǎn)程圖片并將遠(yuǎn)程圖片下載保存到本地的函數(shù)代碼:
/* *功能:php完美實現(xiàn)下載遠(yuǎn)程圖片保存到本地 *參數(shù):文件url,保存文件目錄,保存文件名稱,使用的下載方式 *當(dāng)保存文件名稱為空時則使用遠(yuǎn)程文件原來的名稱 */ function getImage($url,$save_dir='',$filename='',$type=0){ if(trim($url)==''){ return array('file_name'=>'','save_path'=>'','error'=>1); } if(trim($save_dir)==''){ $save_dir='./'; } if(trim($filename)==''){//保存文件名 $ext=strrchr($url,'.'); if($ext!='.gif'&&$ext!='.jpg'){ return array('file_name'=>'','save_path'=>'','error'=>3); } $filename=time().$ext; } if(0!==strrpos($save_dir,'/')){ $save_dir.='/'; } //創(chuàng)建保存目錄 if(!file_exists($save_dir)&&!mkdir($save_dir,0777,true)){ return array('file_name'=>'','save_path'=>'','error'=>5); } //獲取遠(yuǎn)程文件所采用的方法 if($type){ $ch=curl_init(); $timeout=5; curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout); $img=curl_exec($ch); curl_close($ch); }else{ ob_start(); readfile($url); $img=ob_get_contents(); ob_end_clean(); } //$size=strlen($img); //文件大小 $fp2=@fopen($save_dir.$filename,'a'); fwrite($fp2,$img); fclose($fp2); unset($img,$url); return array('file_name'=>$filename,'save_path'=>$save_dir.$filename,'error'=>0); }
以上內(nèi)容是小編給大家分享的PHP源碼批量抓取遠(yuǎn)程網(wǎng)頁圖片并保存到本地的實現(xiàn)方法,希望大家喜歡。
相關(guān)文章
php實現(xiàn)統(tǒng)計IP數(shù)及在線人數(shù)的示例代碼
這篇文章主要介紹了php實現(xiàn)統(tǒng)計IP數(shù)及在線人數(shù)的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-07-07php實現(xiàn)mysql數(shù)據(jù)庫備份類
備份程序一共只有兩個類:數(shù)據(jù)庫備份器(DbBak)和表備份器(TableBak): 這個程序僅僅備份和恢復(fù)數(shù)據(jù),使用方法很簡單,實例化DbBak,然后調(diào)用bakupDb和restoreDb方法:2008-03-03利用PHP繪圖函數(shù)實現(xiàn)簡單驗證碼功能的方法
下面小編就為大家?guī)硪黄肞HP繪圖函數(shù)實現(xiàn)簡單驗證碼功能的方法。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2016-10-10PHP 面向?qū)ο蟪绦蛟O(shè)計(oop)學(xué)習(xí)筆記 (二) - 靜態(tài)變量的屬性和方法及延遲綁定
靜態(tài)變量的類型關(guān)鍵字是static。本文主要是學(xué)習(xí)php中靜態(tài)屬性和靜態(tài)方法的使用方法和基本的示例以及延遲綁定2014-06-06