我在服務器上有每天切割nginx日志的習慣，所以針對每天各大搜索引擎來訪，總能記錄一些404頁面信息，傳統(tǒng)上我只是偶爾分析下日志，但是對于很多日志信息的朋友，人工來篩選可能不是一件容易的事情，這不我個人自己慢慢研究了一點點，針對谷歌、百度、搜搜、360搜索、宜搜、搜狗、必應等搜索引擎的404訪問生成為一個txt文本文件，直接上代碼test.php。

復制代碼代碼如下:

<?php

//訪問test.php?s=google

$domain='http://www.dbjr.com.cn';

$spiders=array('baidu'=>'Baiduspider','360'=>'360Spider',

'google'=>'Googlebot','soso'=>'Sosospider','sogou'=>

'Sogou web spider','easou'=>'EasouSpider','bing'=>'bingbot');

$path='/home/nginx/logs/'.date('Y/m/').(date('d')-1).'/access_www.txt';

$s=$_GET['s'];

if(!array_key_exists($s,$spiders)) die();

$spider=$spiders[$s];

$file=$s.'_'.date('ym').(date('d')-1).'.txt';

if(!file_exists($file)){

    $in=file_get_contents($path);

    $pattern='/GET (.*) HTTP\/1.1" 404.*'.$spider.'/';

    preg_match_all ( $pattern , $in , $matches );

    $out='';

    foreach($matches[1] as $k=>$v){

        $out.=$domain.$v."\r\n";

    }

    file_put_contents($file,$out);

}

$url=$domain.'/silian/'.$file;

echo $url;

好就這樣了。沒有什么高深的技術(shù)，只有動手寫的過程。

您可能感興趣的文章:

相關(guān)文章

ThinkPHP內(nèi)置jsonRPC的缺陷分析
這篇文章主要介紹了ThinkPHP內(nèi)置jsonRPC的缺陷,以實例形式詳細分析了ThinkPHP內(nèi)置jsonRPC校驗的缺陷與解決方法,具有一定的參考借鑒價值,需要的朋友可以參考下
2014-12-12
淺談php數(shù)組array_change_key_case() 函數(shù)和array_chunk()函數(shù)
下面小編就為大家?guī)硪黄獪\談php數(shù)組array_change_key_case() 函數(shù)和array_chunk()函數(shù)。小編覺得挺不錯的，現(xiàn)在就分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2016-10-10
php序列化函數(shù)serialize() 和 unserialize() 與原生函數(shù)對比
這篇文章主要介紹了php序列化函數(shù)serialize() 和 unserialize() 與php原生序列化方法對比，有需要的小伙伴可以參考下。
2015-05-05
使用php偽造referer的方法利用referer防止圖片盜鏈
當瀏覽器向web服務器發(fā)送請求的時候，一般會帶上Referer，告訴服務器我是從哪個頁面鏈接過來的，服務器籍此可以獲得一些信息用于處理,不過這個Referer是可以偽造，下面看一個示例，大家就明白了
2014-01-01
ThinkPHP CURD方法之limit方法詳解
這篇文章主要介紹了ThinkPHP CURD方法的limit方法,需要的朋友可以參考下
2014-06-06
laravel多視圖共享數(shù)據(jù)實例代碼
頁面視圖用于顯示文檔所有內(nèi)容在整個頁面的分布狀況和整個文檔在每一頁上的位置,并可對其進行編輯操作,具有真正的“所見即所得”的顯示效果,下面這篇文章主要給大家介紹了關(guān)于laravel多視圖共享數(shù)據(jù)的相關(guān)資料,需要的朋友可以參考下
2021-08-08
PHP多線程批量采集下載美女圖片的實現(xiàn)代碼(續(xù))
之前寫過一篇《PHP批量采集下載美女圖片》文中主要采用file_get_content做采集圖片，今天發(fā)現(xiàn)采集了400張圖片居然需要70分鐘以上，真是難以忍受
2013-06-06
Yii1.1中通過Sql查詢進行的分頁操作方法
這篇文章主要介紹了Yii1.1中通過Sql查詢進行的分頁操作方法,非常不錯，具有參考借鑒價值，需要的朋友可以參考下
2017-03-03
PHP 搜索查詢功能實現(xiàn)
這篇文章主要介紹了PHP 搜索查詢功能的實現(xiàn)代碼,非常不錯，具有參考借鑒價值，需要的朋友可以參考下
2016-11-11
php5 apache 2.2 webservice 創(chuàng)建與配置(java)
要運行wsCaller.jar 要選安裝jdk 如果沒有安裝jdk 則wsCaller.jar 會以壓縮包的形式顯示
2011-01-01