PHP配合fiddler抓包抓取微信指數(shù)小程序數(shù)據(jù)的實(shí)現(xiàn)方法分析
本文實(shí)例講述了PHP配合fiddler抓包抓取微信指數(shù)小程序數(shù)據(jù)的實(shí)現(xiàn)方法。分享給大家供大家參考,具體如下:
這兩天研究了下微信指數(shù)這個(gè)東西。要抓取呢,按照一般思路的話,那就是使用fiddler抓取手機(jī)包,然后進(jìn)行分析獲取地址然后請(qǐng)求就可以了。
這么想你是沒錯(cuò),如果你果斷這么做了,那就是too yang too simple了。大家可以看下,微信抓取有以下幾個(gè)步驟:
1、開始登陸小程序
2、獲取訪問(wèn)需要的令牌
3、那這令牌去獲取數(shù)據(jù)
首先的難點(diǎn)就是小程序的登陸那一步。你得先登陸了微信之后才可以訪問(wèn)小程序,因?yàn)樾〕绦蚴腔谖⑿艁?lái)運(yùn)行的。所以,你登錄的時(shí)候需要用到一個(gè)微信內(nèi)部生成的js_code這個(gè)值。光是這一步就是一個(gè)深不見底的巨坑。
好吧,億分之一概率的情況下,你獲取了這個(gè)值,之后就是獲取search_key這個(gè)值,還有就是一個(gè)UNIX時(shí)間戳。
完事你就可以盡情的獲取你想要的數(shù)據(jù)了??????
少年,做人還是要穩(wěn)重點(diǎn)的。。。微信有一個(gè)訪問(wèn)限制的系統(tǒng)。請(qǐng)求到一定的頻次,會(huì)提示操作頻繁的。所以你費(fèi)好大勁完事之后,還是沒有什么太實(shí)際的結(jié)果。
網(wǎng)上有一個(gè)解決方案是這樣的,就是用lua語(yǔ)言配合觸動(dòng)精靈寫一個(gè)操作微信的腳本,類似自動(dòng)搶紅包那樣的。完事用這個(gè)腳本來(lái)自動(dòng)輸入關(guān)鍵詞進(jìn)行查詢,完事再使用抓包工具獲取這些請(qǐng)求內(nèi)容。
關(guān)于使用抓包工具獲取請(qǐng)求內(nèi)容不太清楚的親們,可以參考:http://www.dbjr.com.cn/article/177679.htm
先不說(shuō)這種方案的成功率。咱們先來(lái)說(shuō)說(shuō)效率問(wèn)題。難不成,你這樣做,微信就不會(huì)限制你的請(qǐng)求???
還有就是學(xué)習(xí)一門語(yǔ)言的各種成本。。。
所以,本人使用PHP結(jié)合fiddler抓包工具,設(shè)計(jì)了一個(gè)簡(jiǎn)單,易學(xué)的抓取數(shù)據(jù)的方案。容我一一道來(lái):
首先就是配置fiddler可以把抓取的數(shù)據(jù)保存到本地。
參考鏈接:http://www.dbjr.com.cn/article/177679.htm
這是用來(lái)獲取訪問(wèn)令牌的,核心PHP代碼如下:
function get_search_key($path) { $file = fopen($path, "r"); $user=array(); $i=0; while(! feof($file)) { $user[$i]= mb_convert_encoding ( fgets($file), 'UTF-8','Unicode'); $i++; } fclose($file); $user=array_filter($user); foreach ($user as $item_u => $value_u) { if(strstr($value_u,"search_key=")){ $temp[] = $value_u; } } $end_url = end($temp); $reg = "#openid=[a-zA-Z0-9]++_[a-zA-Z0-9]++&search_key=\d++_\d++#isU"; preg_match_all($reg,$end_url,$time); return $time[0][0]; }
輸入保存文件的地址,得到返回值,拿著這個(gè)返回值,來(lái)進(jìn)行請(qǐng)求,就可以獲取你想要的數(shù)據(jù)了。
不過(guò),這玩意也是有缺陷。首先就是配置手機(jī)連接電腦,關(guān)于這個(gè),我后期會(huì)在評(píng)論里補(bǔ)充上。再來(lái)就是配置fiddler保存包到本地文件。還有就是需要手機(jī)訪問(wèn)小程序之后程序才能運(yùn)行成功。比較麻煩。
更多關(guān)于PHP相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《php socket用法總結(jié)》、《php字符串(string)用法總結(jié)》、《PHP數(shù)學(xué)運(yùn)算技巧總結(jié)》、《php面向?qū)ο蟪绦蛟O(shè)計(jì)入門教程》、《PHP數(shù)組(Array)操作技巧大全》、《PHP數(shù)據(jù)結(jié)構(gòu)與算法教程》、《php程序設(shè)計(jì)算法總結(jié)》及《PHP網(wǎng)絡(luò)編程技巧總結(jié)》
希望本文所述對(duì)大家PHP程序設(shè)計(jì)有所幫助。
相關(guān)文章
php實(shí)現(xiàn)通用的信用卡驗(yàn)證類
這篇文章主要介紹了php實(shí)現(xiàn)通用的信用卡驗(yàn)證類,涉及信用卡的規(guī)則與php字符串操作的相關(guān)技巧,具有一定參考借鑒價(jià)值,文中有英文原文注釋說(shuō)明,有助于更直觀的了解源碼相關(guān)信息,需要的朋友可以參考下2015-03-03linux系統(tǒng)上支持php的 iconv()函數(shù)的方法
iconv函數(shù)庫(kù)能夠完成各種字符集間的轉(zhuǎn)換,是php編程中不可缺少的基礎(chǔ)函數(shù)庫(kù)。2011-10-10PHP中文URL編解碼(urlencode()rawurlencode()
PHP中對(duì)于URL進(jìn)行編碼,可以使用 urlencode() 或者 rawurlencode(),二者的區(qū)別是前者把空格編碼為 '+',而后者把空格編碼為 '%20',不過(guò)應(yīng)該注意的是,在編碼時(shí)應(yīng)該只對(duì)部分URL編碼,否則URL中的冒號(hào)和反斜杠也會(huì)被轉(zhuǎn)義。2010-07-07PHP session常見問(wèn)題集錦及解決辦法總結(jié)
PHP session常見問(wèn)題集錦及解決辦法總結(jié)...2007-03-03php調(diào)用MySQL存儲(chǔ)過(guò)程的方法集合(推薦)
本篇文章是對(duì)php調(diào)用MySQL存儲(chǔ)過(guò)程的方法進(jìn)行了集合與匯總,需要的朋友參考下2013-07-07php-fpm.conf配置文件中文說(shuō)明詳解及重要參數(shù)說(shuō)明
本文主要介紹了php-fpm.conf配置文件的中文說(shuō)明詳解以及php-fpm.conf重要參數(shù)配置說(shuō)明,最后有一個(gè)監(jiān)控php-fpm進(jìn)程運(yùn)行狀態(tài)的頁(yè)面代碼實(shí)例2018-10-10PHP通過(guò)header實(shí)現(xiàn)文本文件下載的代碼
所謂實(shí)現(xiàn)文本文件的下載就是說(shuō)當(dāng)我們點(diǎn)擊一個(gè)文本文件的鏈接的時(shí)候不是打開這個(gè)文件,而是彈出一個(gè)下載對(duì)話框讓我們下載2010-08-08