分享PHP源碼批量抓取遠(yuǎn)程網(wǎng)頁圖片并保存到本地的實(shí)現(xiàn)方法
做為一個(gè)仿站工作者,當(dāng)遇到網(wǎng)站有版權(quán)時(shí)甚至加密的時(shí)候,WEBZIP也熄火,怎么扣取網(wǎng)頁上的圖片和背景圖片呢。有時(shí)候,可能會想到用火狐,這款瀏覽器好像一個(gè)強(qiáng)大的BUG,文章有版權(quán),屏蔽右鍵,火狐絲毫也不會被影響。
但是作為一個(gè)熱愛php的開發(fā)者來說,更多的是喜歡自己動手。所以,我就寫出了下面的一個(gè)源碼,php遠(yuǎn)程抓取圖片小程序??梢宰x取css文件并抓取css代碼中的背景圖片,下面這段代碼也是針對抓取css中圖片而編寫的。
<?php
header("Content-Type: text/html; charset=utf-8");
error_reporting(E_ERROR|E_WARNING);
//全局配置
$fromFile = "aaa.css"; //要抓取的文件
$savePath = "ttttttttt"; //保存路徑
$fromDomain = "http://www.xxx.com/"; //要抓取的域名
//讀取css樣式并且分離出所有image的url
$str = file_get_contents($fromFile);
$strArr = explode("url(",$str);
$i = 0;
foreach($strArr as $val){
$val1 = explode(")",$val);
if(strpos($val1[0],'jpg')||strpos($val1[0],'png')||strpos($val1[0],'gif'))
$imgUrl[$i++] = $val1[0];
}
//PS:上面可以用正則的,但是我覺得這樣也不錯(cuò)
//開始抓取
foreach($imgUrl as $url){
if($url=="") continue;
$filename = $savePath.$url;
$url = $fromDomain.$url;
getImage($url,$filename);
}
function getImage($url,$filename){
ob_start();
$context = stream_context_create(
array (
'http' => array (
'follow_location' => false // don't follow redirects
)
)
);
//請確保php.ini中的fopen wrappers已經(jīng)激活
readfile( $url,false,$context);
$img = ob_get_contents();
ob_end_clean();
$fp2 = @fopen($filename,"a");
fwrite($fp2,$img);
fclose($fp2);
echo $filename." ok √<br/>";
}
?>
然后沒有意外的話,你會發(fā)現(xiàn),你指定的文件夾下面已經(jīng)滿滿的都是圖片了,哈哈..
ps:php獲取遠(yuǎn)程圖片并下載保存到本地
分享一個(gè)利用php獲取遠(yuǎn)程圖片并將遠(yuǎn)程圖片下載保存到本地的函數(shù)代碼:
/*
*功能:php完美實(shí)現(xiàn)下載遠(yuǎn)程圖片保存到本地
*參數(shù):文件url,保存文件目錄,保存文件名稱,使用的下載方式
*當(dāng)保存文件名稱為空時(shí)則使用遠(yuǎn)程文件原來的名稱
*/
function getImage($url,$save_dir='',$filename='',$type=0){
if(trim($url)==''){
return array('file_name'=>'','save_path'=>'','error'=>1);
}
if(trim($save_dir)==''){
$save_dir='./';
}
if(trim($filename)==''){//保存文件名
$ext=strrchr($url,'.');
if($ext!='.gif'&&$ext!='.jpg'){
return array('file_name'=>'','save_path'=>'','error'=>3);
}
$filename=time().$ext;
}
if(0!==strrpos($save_dir,'/')){
$save_dir.='/';
}
//創(chuàng)建保存目錄
if(!file_exists($save_dir)&&!mkdir($save_dir,0777,true)){
return array('file_name'=>'','save_path'=>'','error'=>5);
}
//獲取遠(yuǎn)程文件所采用的方法
if($type){
$ch=curl_init();
$timeout=5;
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
$img=curl_exec($ch);
curl_close($ch);
}else{
ob_start();
readfile($url);
$img=ob_get_contents();
ob_end_clean();
}
//$size=strlen($img);
//文件大小
$fp2=@fopen($save_dir.$filename,'a');
fwrite($fp2,$img);
fclose($fp2);
unset($img,$url);
return array('file_name'=>$filename,'save_path'=>$save_dir.$filename,'error'=>0);
}
以上內(nèi)容是小編給大家分享的PHP源碼批量抓取遠(yuǎn)程網(wǎng)頁圖片并保存到本地的實(shí)現(xiàn)方法,希望大家喜歡。
相關(guān)文章
php中文驗(yàn)證碼實(shí)現(xiàn)示例分享
這篇文章主要介紹了使用php實(shí)現(xiàn)中文驗(yàn)證碼,代碼簡單,大家可以直接使用2014-01-01
PHP的error_reporting錯(cuò)誤級別變量對照表
這篇文章主要介紹了PHP的error_reporting錯(cuò)誤級別變量對照表,需要的朋友可以參考下2014-07-07
php實(shí)現(xiàn)統(tǒng)計(jì)IP數(shù)及在線人數(shù)的示例代碼
這篇文章主要介紹了php實(shí)現(xiàn)統(tǒng)計(jì)IP數(shù)及在線人數(shù)的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-07-07
php實(shí)現(xiàn)mysql數(shù)據(jù)庫備份類
備份程序一共只有兩個(gè)類:數(shù)據(jù)庫備份器(DbBak)和表備份器(TableBak): 這個(gè)程序僅僅備份和恢復(fù)數(shù)據(jù),使用方法很簡單,實(shí)例化DbBak,然后調(diào)用bakupDb和restoreDb方法:2008-03-03
利用PHP繪圖函數(shù)實(shí)現(xiàn)簡單驗(yàn)證碼功能的方法
下面小編就為大家?guī)硪黄肞HP繪圖函數(shù)實(shí)現(xiàn)簡單驗(yàn)證碼功能的方法。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2016-10-10
PHP 面向?qū)ο蟪绦蛟O(shè)計(jì)(oop)學(xué)習(xí)筆記 (二) - 靜態(tài)變量的屬性和方法及延遲綁定
靜態(tài)變量的類型關(guān)鍵字是static。本文主要是學(xué)習(xí)php中靜態(tài)屬性和靜態(tài)方法的使用方法和基本的示例以及延遲綁定2014-06-06
詳解php幾行代碼實(shí)現(xiàn)CSV格式文件輸出
本篇文章主要介紹了詳解php幾行代碼實(shí)現(xiàn)CSV格式文件輸出,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2017-07-07

