通過Python實現自動填寫調查問卷
0X00 前言
快開學了,看到空間里面各種求填寫調查問卷的,我才想起來貌似我也還沒做。對于這種無意義的問卷,我是不怎么感冒的,所以我打算使用”特技”來完成,也就是python,順便重新復習一下python,真的好久沒用了。下面,表演開始……
0X01代碼編寫思路
首先先創(chuàng)建一份問卷
我們隨便填寫一個問卷并提交,在提交之前開啟Burpsuite截獲數據包
對于截獲的數據包進行分析,有的被url編碼了不利于分析,可以使用Burpsuite編碼模塊解碼替換,這樣就好分析了
通過觀察可以發(fā)現,post了一串奇怪的數據submitdata=1$2}2$3}3$3}4$4}5$3}6$2}7$4}8$2}9$3}10$3。仔細分析可看出數據大概是這個意思submitdata=題號$選項號}題號$選項號}題號$選項號}……..
利用這些信息就可以開始編寫python程序了
運行結果如下
貌似網站還有其他反爬蟲機制,在連續(xù)提交幾個表單之后,就出現了驗證碼。難道此時我們還要給程序添加上識別驗證碼的功能?其實不必,我們可以先分析一下剛剛Burpsuite截獲的header信息,來看看到底網站是通過什么方式,識別出我們是用爬蟲來提交問卷的。
通過一番測試,我發(fā)現當我連續(xù)提交3份問卷,再換一個IP提交3個問卷,也就是連續(xù)提交了6份問卷,并沒有觸發(fā)網站的反爬蟲機制。所以我們可以猜測對方基于IP提交問卷的頻率來識別爬蟲程序的??吹竭@里,大家可能會想,我們可以通過網上的免費代理來提交問卷。例如這些
那是不是意味著我們還要往python代碼中添加提取免費代理IP的功能呢?NO NO NO!換個思路,在CTF比賽中會遇到一種題目,例如你的IP是來自德國的才可以拿到flag。所以,我們的思路就是進行數據包頭欺騙,偽造我們的IP,騙過服務器。下面來說說偽造IP的幾種方式。
X-Client-IP:1.1.1.1 X-Remote-IP:2.2.2.2 X-Remote-Addr:3.3.3.3 X-Originating-IP:4.4.4.4 X-Forwarded-For:5.5.5.5
我們每個都嘗試一下,然后在后臺統(tǒng)計那里可以看到我們的問卷來源
這里我們發(fā)現用X-Forwarded-For可以繞過,按我們就用這種方法在header信息中添加X-Forwarded-For字段,所以修改后的腳本如下
運行結果如下
再到后臺看看統(tǒng)計信息
至此,我們算是完美的解決任務了。如果大家想去掉調查問卷中國外的IP地址,可以收集一下中國的IP地址段,然后添加進程序,處理一下即可。
0X02總結
大家平常可以把學到的東西用到實際生活中,遇到困難的時候不要慌,多思考,找到最優(yōu)的解決方法。例如上面,我并沒有在代碼中添加驗證碼識別模塊,也沒有通過走代理的方式來繞過網站的反爬蟲機制,而是通過分析網站的反爬蟲機制,并且使用所學的安全知識(HTTP頭欺騙)輕松解決問題,使用最短的代碼完美完成任務。
相關文章
Python內建模塊collections實現特殊容器數據類型
collections模塊是Python的內建模塊之一,它實現了特殊的容器數據類型,提供了Python內建的數據類型dict、list、set、和tuple的高效替代選擇2023-06-06深入理解Python虛擬機之進程、線程和協(xié)程區(qū)別詳解
在本篇文章當中深入分析在 Python 當中 進程、線程和協(xié)程的區(qū)別,這三個概念會讓人非常迷惑,如果沒有深入了解這三者的實現原理,只是看一些文字說明,也很難理解,在本篇文章當中我們將通過分析部分源代碼來詳細分析一下這三者根本的區(qū)別是什么,需要的朋友可以參考下2023-10-10