利用php抓取蜘蛛爬蟲(chóng)痕跡的示例代碼
前言
相信許多的站長(zhǎng)、博主可能最關(guān)心的無(wú)非就是自己網(wǎng)站的收錄情況,一般情況下我們可以通過(guò)查看空間服務(wù)器的日志文件來(lái)查看搜索引擎到底爬取了我們哪些個(gè)頁(yè)面,不過(guò),如果用php代碼分析web日志中蜘蛛爬蟲(chóng)痕跡,是比較好又比較直觀方便操作的!下面是示例代碼,有需要的朋友們下面來(lái)一起看看吧。
示例代碼
<?php //獲取蜘蛛爬蟲(chóng)名或防采集 function isSpider(){ $bots = array( 'Google' => 'googlebot', 'Baidu' => 'baiduspider', 'Yahoo' => 'yahoo slurp', 'Soso' => 'sosospider', 'Msn' => 'msnbot', 'Altavista' => 'scooter ', 'Sogou' => 'sogou spider', 'Yodao' => 'yodaobot' ); $userAgent = strtolower($_SERVER['HTTP_USER_AGENT']); foreach ($bots as $k => $v){ if (strstr($v,$userAgent)){ return $k; break; } } return false; } //獲取哪種蜘蛛爬蟲(chóng)后保存蜘蛛痕跡。 //根據(jù)采集時(shí)HTTP_USER_AGENT是否為空來(lái)防止采集 //抓蜘蛛爬蟲(chóng) $spi = isSpider(); if($spi){ $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); $file = 'robot.txt'; $time = date('Y-m-d H:i:s',mktime()); $handle = fopen($file,'a+'); $PR = $_SERVER['REQUEST_URI']; fwrite($handle, "Time:{$time} ROBOT:{$spi} AGENT:{$tlc_thispage} URL:{$PR} \n\r"); fclose($handle); } ?>
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作能帶來(lái)一定的幫助,如果有問(wèn)題大家可以留言交流。
相關(guān)文章
php面向?qū)ο笾械哪g(shù)方法中文說(shuō)明
這篇文章主要介紹了php面向?qū)ο笾械哪g(shù)方法中文說(shuō)明,明白這些方法才好寫(xiě)面向?qū)ο蟪绦颍枰呐笥芽梢詤⒖枷?/div> 2014-03-03ThinkPhP+Apache+PHPstorm整合框架流程圖解
這篇文章主要介紹了ThinkPhP+Apache+PHPstorm整合框架流程圖解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-11-11PHP新特性之字節(jié)碼緩存和內(nèi)置服務(wù)器
這篇文章主要介紹了PHP新特性之字節(jié)碼緩存和內(nèi)置服務(wù)器的相關(guān)資料,需要的朋友可以參考下2017-08-08一個(gè)好用的PHP驗(yàn)證碼類實(shí)例分享
這篇文章主要介紹了一個(gè)好用的PHP驗(yàn)證碼類實(shí)例,有需要的朋友可以參考一下2013-12-12ThinkPHP實(shí)現(xiàn)二級(jí)循環(huán)讀取的方法
這篇文章主要介紹了ThinkPHP實(shí)現(xiàn)二級(jí)循環(huán)讀取的方法,是ThinkPHP基于數(shù)組的數(shù)據(jù)庫(kù)操作中非常常見(jiàn)的技巧,需要的朋友可以參考下2014-11-11PHP實(shí)現(xiàn)Javascript中的escape及unescape函數(shù)代碼分享
這篇文章主要介紹了PHP實(shí)現(xiàn)Javascript中的escape及unescape函數(shù)代碼分享,本文給出兩個(gè)實(shí)現(xiàn)版本,需要的朋友可以參考下2015-02-02Laravel 5框架學(xué)習(xí)之路由、控制器和視圖簡(jiǎn)介
這篇文章主要介紹了Laravel 5框架學(xué)習(xí)之路由、控制器和視圖簡(jiǎn)介,十分的細(xì)致全面,需要的朋友可以參考下2015-04-04Zend Framework教程之路由功能Zend_Controller_Router詳解
這篇文章主要介紹了Zend Framework教程之路由功能Zend_Controller_Router,詳細(xì)分析了路由功能Zend_Controller_Router的原理,使用技巧與相關(guān)注意事項(xiàng),需要的朋友可以參考下2016-03-03最新評(píng)論