PHP實(shí)現(xiàn)抓取迅雷VIP賬號的方法
本文實(shí)例講述了PHP實(shí)現(xiàn)抓取迅雷VIP賬號的方法。分享給大家供大家參考。具體如下:
看了@Jinn_Wei Python版本的抓取賬號,于是順手寫了個PHP版本
PS1:代碼沒經(jīng)過優(yōu)化,只實(shí)現(xiàn)了基本的功能
PS2:代碼中使用了Snoopy
PS3:測試地址:http://xunlei.kphcdr.com
<?php /** * 抓取愛密碼迅雷VIP賬號 * @author kphcdr@163.com */ header("Content-type: text/html; charset=UTF-8"); include 'Snoopy.php'; $url = 'http://www.521xunlei.com/forum-xunleihuiyuan-1.html'; //找出匹配的網(wǎng)址 $snoopy = new Snoopy(); $result = $snoopy->fetchlinks($url)->getResults(); foreach($result as $key=>$val) { if(FALSE === strpos($val, 'thread-')) { unset($result[$key]); } else { if(!strpos($val, '-1-1.html')) { unset($result[$key]); } } } $real = new Snoopy(); $result = array_values(array_unique($result)); $text = $real->fetchtext($result[1])->getResults(); $text = iconv('gbk','UTF-8//IGNORE',$text); //匹配出需要的內(nèi)容 $pattern = '/^迅雷會員賬號|迅雷共享賬號+[a-zA-Z0-9_]{4,15}+:+[0-9]+愛密碼分享密碼+[a-zA-Z0-9_]{4,20}\s/'; preg_match_all($pattern,$text,$return); foreach($return[0] as $a) { echo $a; echo '<br />'; }
Snoopy-1.2.3.tar.gz點(diǎn)擊此處本站下載。
希望本文所述對大家的php程序設(shè)計(jì)有所幫助。
相關(guān)文章
PHP的偽隨機(jī)數(shù)與真隨機(jī)數(shù)詳解
這篇文章主要介紹了PHP的偽隨機(jī)數(shù)與真隨機(jī)數(shù)詳解,本文首先講解了真隨機(jī)數(shù)和偽隨機(jī)數(shù)的相關(guān)概念,并給出了比用mt_rand()函數(shù)產(chǎn)生更好的偽隨機(jī)數(shù)的一段例子代碼,需要的朋友可以參考下2015-05-05php ss7.5的數(shù)據(jù)調(diào)用 (筆記)
這里不再多說 這里只說 ss7.5的數(shù)據(jù)調(diào)用 不管是外部的 還是內(nèi)部的2010-03-03PHP、Nginx、Apache中禁止網(wǎng)頁被iframe引用的方法
這篇文章主要介紹了PHP、Nginx、Apache中禁止網(wǎng)頁被iframe引用的方法,使用X-Frame-Options實(shí)現(xiàn),需要的朋友可以參考下2014-06-06