php采集時被封ip的解決方法
更新時間:2010年08月29日 14:48:23 作者:
最近各種網(wǎng)站的采集程序?qū)懙谋容^多,遇到在采某網(wǎng)站時采到100多條時突然發(fā)現(xiàn)對方的網(wǎng)站打不開了,猜到肯定被封ip了,用了代理還是會封,這不是辦法。
在網(wǎng)上找了一些資料都沒有找到,功夫不負(fù)有心人啊,在找的時侯有一個人提到了用搜索引擎爬蟲蜘蛛的USERAGENT。雖然只提到一點點我還是想到了,列出我的解決方法,
1.使用Snoopy或curl傳搜索引擎爬蟲的USERAGENT值。
查看搜索引擎爬蟲的USERAGENT值:http://www.dbjr.com.cn/yunying/29357.html
2.使用Snoopy或curl傳referer值。
如:$snoopy->referer = 'http://www.google.com';
$header[] = "Referer: http://www.google.com/";
3.使用Snoopy或curl代理。
如:$snoopy->proxy_host = "59.108.44.41";
$snoopy->proxy_port = "3128";
4.使用Snoopy或curl防造IP。
如:$snoopy->rawheaders['X_FORWARDED_FOR'] = '127.0.0.1';
5.用php與一個重起路由的程序,這樣就會獲得新的ip地址。
6.如果發(fā)現(xiàn)重起路由還是顯示被封,有可能對方封了你的mac地址,現(xiàn)在路由器都有偽造MAC的功能,可以寫程序或手動修改路由器的MAC地址,網(wǎng)上也有專門修改網(wǎng)卡mac地址的工具。
1.使用Snoopy或curl傳搜索引擎爬蟲的USERAGENT值。
查看搜索引擎爬蟲的USERAGENT值:http://www.dbjr.com.cn/yunying/29357.html
2.使用Snoopy或curl傳referer值。
如:$snoopy->referer = 'http://www.google.com';
$header[] = "Referer: http://www.google.com/";
3.使用Snoopy或curl代理。
如:$snoopy->proxy_host = "59.108.44.41";
$snoopy->proxy_port = "3128";
4.使用Snoopy或curl防造IP。
如:$snoopy->rawheaders['X_FORWARDED_FOR'] = '127.0.0.1';
5.用php與一個重起路由的程序,這樣就會獲得新的ip地址。
6.如果發(fā)現(xiàn)重起路由還是顯示被封,有可能對方封了你的mac地址,現(xiàn)在路由器都有偽造MAC的功能,可以寫程序或手動修改路由器的MAC地址,網(wǎng)上也有專門修改網(wǎng)卡mac地址的工具。
相關(guān)文章
PHP實現(xiàn)的權(quán)重算法示例【可用于游戲根據(jù)權(quán)限來隨機物品】
這篇文章主要介紹了PHP實現(xiàn)的權(quán)重算法,可用于游戲根據(jù)權(quán)限來隨機物品,涉及php數(shù)組遍歷、隨機數(shù)處理及數(shù)值運算相關(guān)操作技巧,需要的朋友可以參考下2019-02-02解析centos中Apache、php、mysql 默認(rèn)安裝路徑
本篇文章是對centos下Apache、php、mysql 默認(rèn)安裝路徑進行了詳細(xì)的分析介紹,需要的朋友參考下2013-06-06