Python程序中設(shè)置HTTP代理
0x00 前言
大家對(duì)HTTP代理應(yīng)該都非常熟悉,它在很多方面都有著極為廣泛的應(yīng)用。HTTP代理分為正向代理和反向代理兩種,后者一般用于將防火墻后面的服務(wù)提供給用戶訪問(wèn)或者進(jìn)行負(fù)載均衡,典型的有Nginx、HAProxy等。本文所討論的是正向代理。
HTTP代理最常見(jiàn)的用途是用于網(wǎng)絡(luò)共享、網(wǎng)絡(luò)加速和網(wǎng)絡(luò)限制突破等。此外,HTTP代理也常用于Web應(yīng)用調(diào)試、Android/IOS APP 中所調(diào)用的Web API監(jiān)控和分析,目前的知名軟件有Fiddler、Charles、Burp Suite和mitmproxy等。HTTP代理還可用于請(qǐng)求/響應(yīng)內(nèi)容修改,在不改變服務(wù)端的情況下為Web應(yīng)用增加額外的功能或者改變應(yīng)用行為等。
0x01 HTTP代理是什么
HTTP代理本質(zhì)上是一個(gè)Web應(yīng)用,它和其他普通Web應(yīng)用沒(méi)有根本區(qū)別。HTTP代理收到請(qǐng)求后,根據(jù)Header中Host字段的主機(jī)名和Get/POST請(qǐng)求地址綜合判斷目標(biāo)主機(jī),建立新的HTTP請(qǐng)求并轉(zhuǎn)發(fā)請(qǐng)求數(shù)據(jù),并將收到的響應(yīng)數(shù)據(jù)轉(zhuǎn)發(fā)給客戶端。
如果請(qǐng)求地址是絕對(duì)地址,HTTP代理采用該地址中的Host,否則使用Header中的HOST字段。做一個(gè)簡(jiǎn)單測(cè)試,假設(shè)網(wǎng)絡(luò)環(huán)境如下:
192.168.1.2 Web服務(wù)器 192.168.1.3 HTTP代理服務(wù)器
使用telnet進(jìn)行測(cè)試
$ telnet 192.168.1.3 GET / HTTP/1.0 HOST: 192.168.1.2
注意最后需要連續(xù)兩個(gè)回車(chē),這是HTTP協(xié)議要求。完成后,可以收到 http://192.168.1.2/ 的頁(yè)面內(nèi)容。下面做一下調(diào)整,GET請(qǐng)求時(shí)帶上絕對(duì)地址
$ telnet 192.168.1.3 GET http://httpbin.org/ip HTTP/1.0 HOST: 192.168.1.2
注意這里同樣設(shè)置了HOST為192.168.1.2,但運(yùn)行結(jié)果卻返回了 http://httpbin.org/ip 頁(yè)面的內(nèi)容,也就是公網(wǎng)IP地址信息。
從上面的測(cè)試過(guò)程可以看出,HTTP代理并不是什么很復(fù)雜的東西,只要將原始請(qǐng)求發(fā)送到代理服務(wù)器即可。在無(wú)法設(shè)置HTTP代理的情況下,對(duì)于少量Host需要走HTTP代理的場(chǎng)景來(lái)說(shuō),最簡(jiǎn)單的方式就是將目標(biāo)Host域名的IP指向代理服務(wù)器,可以采取修改hosts文件的方式來(lái)實(shí)現(xiàn)。
0x02 Python程序中設(shè)置HTTP代理
urllib2/urllib 代理設(shè)置
urllib2
是Python標(biāo)準(zhǔn)庫(kù),功能很強(qiáng)大,只是使用起來(lái)稍微麻煩一點(diǎn)。在Python 3中,urllib2不再保留,遷移到了urllib模塊中。urllib2中通過(guò)ProxyHandler來(lái)設(shè)置使用代理服務(wù)器。
proxy_handler = urllib2.ProxyHandler({'http': '121.193.143.249:80'}) opener = urllib2.build_opener(proxy_handler) r = opener.open('http://httpbin.org/ip') print(r.read())
也可以用install_opener將配置好的opener安裝到全局環(huán)境中,這樣所有的urllib2.urlopen都會(huì)自動(dòng)使用代理。
urllib2.install_opener(opener) r = urllib2.urlopen('http://httpbin.org/ip') print(r.read())
在Python 3中,使用urllib。
proxy_handler = urllib.request.ProxyHandler({'http': 'http://121.193.143.249:80/'}) opener = urllib.request.build_opener(proxy_handler) r = opener.open('http://httpbin.org/ip') print(r.read())
requests 代理設(shè)置
requests是目前最優(yōu)秀的HTTP庫(kù)之一,也是我平時(shí)構(gòu)造http請(qǐng)求時(shí)使用最多的庫(kù)。它的API設(shè)計(jì)非常人性化,使用起來(lái)很容易上手。給requests設(shè)置代理很簡(jiǎn)單,只需要給proxies設(shè)置一個(gè)形如 {'http': 'x.x.x.x:8080', 'https': 'x.x.x.x:8080'} 的參數(shù)即可。其中http和https相互獨(dú)立。
In [5]: requests.get('http://httpbin.org/ip', proxies={'http': '121.193.143.249:80'}).json() Out[5]: {'origin': '121.193.143.249'}
可以直接設(shè)置session的proxies屬性,省去每次請(qǐng)求都要帶上proxies參數(shù)的麻煩。
s = requests.session() s.proxies = {'http': '121.193.143.249:80'} print(s.get('http://httpbin.org/ip').json())
0x03 HTTP_PROXY / HTTPS_PROXY 環(huán)境變量
urllib2 和 Requests 庫(kù)都能識(shí)別 HTTP_PROXY 和 HTTPS_PROXY 環(huán)境變量,一旦檢測(cè)到這些環(huán)境變量就會(huì)自動(dòng)設(shè)置使用代理。這在用HTTP代理進(jìn)行調(diào)試的時(shí)候非常有用,因?yàn)椴挥眯薷拇a,可以隨意根據(jù)環(huán)境變量來(lái)調(diào)整代理服務(wù)器的ip地址和端口。*nix中的大部分軟件也都支持HTTP_PROXY環(huán)境變量識(shí)別,比如curl、wget、axel、aria2c等。
$ http_proxy=121.193.143.249:80 python -c 'import requests; print(requests.get("http://httpbin.org/ip").json())' {u'origin': u'121.193.143.249'} $ http_proxy=121.193.143.249:80 curl httpbin.org/ip { "origin": "121.193.143.249" }
在IPython交互環(huán)境中,可能經(jīng)常需要臨時(shí)性地調(diào)試HTTP請(qǐng)求,可以簡(jiǎn)單通過(guò)設(shè)置 os.environ['http_proxy'] 增加/取消HTTP代理來(lái)實(shí)現(xiàn)。
In [245]: os.environ['http_proxy'] = '121.193.143.249:80' In [246]: requests.get("http://httpbin.org/ip").json() Out[246]: {u'origin': u'121.193.143.249'} In [249]: os.environ['http_proxy'] = '' In [250]: requests.get("http://httpbin.org/ip").json() Out[250]: {u'origin': u'x.x.x.x'}
0x04 MITM-Proxy
MITM 源于 Man-in-the-Middle Attack,指中間人攻擊,一般在客戶端和服務(wù)器之間的網(wǎng)絡(luò)中攔截、監(jiān)聽(tīng)和篡改數(shù)據(jù)。
mitmproxy 是一款Python語(yǔ)言開(kāi)發(fā)的開(kāi)源中間人代理神器,支持SSL,支持透明代理、反向代理,支持流量錄制回放,支持自定義腳本等。功能上同Windows中的 Fiddler 有些類(lèi)似,但mitmproxy是一款console程序,沒(méi)有GUI界面,不過(guò)用起來(lái)還算方便。使用mitmproxy可以很方便的過(guò)濾、攔截、修改任意經(jīng)過(guò)代理的HTTP請(qǐng)求/響應(yīng)數(shù)據(jù)包,甚至可以利用它的scripting API,編寫(xiě)腳本達(dá)到自動(dòng)攔截修改HTTP數(shù)據(jù)的目的。
# test.py def response(flow): flow.response.headers["BOOM"] = "boom!boom!boom!"
上面的腳本會(huì)在所有經(jīng)過(guò)代理的Http響應(yīng)包頭里面加上一個(gè)名為BOOM的header。用 mitmproxy -s 'test.py' 命令啟動(dòng)mitmproxy,curl驗(yàn)證結(jié)果發(fā)現(xiàn)的確多了一個(gè)BOOM頭。
$ http_proxy=localhost:8080 curl -I 'httpbin.org/get' HTTP/1.1 200 OK Server: nginx Date: Thu, 03 Nov 2016 09:02:04 GMT Content-Type: application/json Content-Length: 186 Connection: keep-alive Access-Control-Allow-Origin: * Access-Control-Allow-Credentials: true BOOM: boom!boom!boom! ...
顯然mitmproxy腳本能做的事情遠(yuǎn)不止這些,結(jié)合Python強(qiáng)大的功能,可以衍生出很多應(yīng)用途徑。除此之外,mitmproxy還提供了強(qiáng)大的API,在這些API的基礎(chǔ)上,完全可以自己定制一個(gè)實(shí)現(xiàn)了特殊功能的專(zhuān)屬代理服務(wù)器。
經(jīng)過(guò)性能測(cè)試,發(fā)現(xiàn)mitmproxy的效率并不是特別高。如果只是用于調(diào)試目的那還好,但如果要用到生產(chǎn)環(huán)境,有大量并發(fā)請(qǐng)求通過(guò)代理的時(shí)候,性能還是稍微差點(diǎn)。我用twisted實(shí)現(xiàn)了一個(gè)簡(jiǎn)單的proxy,用于給公司內(nèi)部網(wǎng)站增加功能、改善用戶體驗(yàn),以后有機(jī)會(huì)再和大家分享。
- 批量獲取及驗(yàn)證HTTP代理的Python腳本
- Python3.4實(shí)現(xiàn)從HTTP代理網(wǎng)站批量獲取代理并篩選的方法示例
- Python request設(shè)置HTTPS代理代碼解析
- 對(duì)python使用http、https代理的實(shí)例講解
- Python代碼實(shí)現(xiàn)http/https代理服務(wù)器的腳本
- python爬蟲(chóng)http代理使用方法
- Python異步爬蟲(chóng)requests和aiohttp中代理IP的使用
- python使用aiohttp通過(guò)設(shè)置代理爬取基金數(shù)據(jù)簡(jiǎn)單示例
- 解決python異步框架aiohttp無(wú)法使用本地代理問(wèn)題
- python做http代理請(qǐng)求的項(xiàng)目實(shí)踐
相關(guān)文章
Python lambda表達(dá)式filter、map、reduce函數(shù)用法解析
這篇文章主要介紹了Python lambda表達(dá)式filter、map、reduce函數(shù)用法解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-09-09python 使用tkinter與messagebox寫(xiě)界面和彈窗
這篇文章主要介紹了python 使用tkinter與messagebox寫(xiě)界面和彈窗,文章內(nèi)容詳細(xì),具有一的的參考價(jià)值,需要的小伙伴可以參考一下2022-03-03詳解Python requests 超時(shí)和重試的方法
這篇文章主要介紹了詳解Python requests 超時(shí)和重試的方法,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2018-12-12PyQt QListWidget修改列表項(xiàng)item的行高方法
今天小編就為大家分享一篇PyQt QListWidget修改列表項(xiàng)item的行高方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-06-06python隨機(jī)生成指定長(zhǎng)度密碼的方法
這篇文章主要介紹了python隨機(jī)生成指定長(zhǎng)度密碼的方法,涉及Python操作字符串的技巧,非常具有實(shí)用價(jià)值,需要的朋友可以參考下2015-04-04python 循環(huán)結(jié)構(gòu)練習(xí)題
這篇文章主要給大家分享的是python 循環(huán)結(jié)構(gòu)練習(xí)題,求兩個(gè)數(shù)最大公約數(shù)、整數(shù)反轉(zhuǎn):如12345,輸出54321等多個(gè)練習(xí)題,需要的朋友可以參考一下2021-11-11詳解Python編程中基本的數(shù)學(xué)計(jì)算使用
這篇文章主要介紹了Python編程中基本的數(shù)學(xué)計(jì)算使用,其中重點(diǎn)講了除法運(yùn)算及相關(guān)division模塊的使用,需要的朋友可以參考下2016-02-02python數(shù)據(jù)分析之如何刪除value=0的行
這篇文章主要給大家介紹了關(guān)于python數(shù)據(jù)分析之如何刪除value=0的行的相關(guān)資料,文中通過(guò)實(shí)例代碼以及圖文介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用Python具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2022-12-12