python小程序?qū)崿F(xiàn)刷票功能詳解
刷票一般要突破以下限制:
1、驗(yàn)證碼識(shí)別
2、同一ip不可連續(xù)投票
解決辦法
1、用tesseract工具,鏈接在此 https://code.google.com/p/tesseract-ocr/ (人人還是加不了https鏈接)
2、使用代理,國(guó)內(nèi)可以的代理服務(wù)器可以從這里找到 http://cn-proxy.com/
程序語(yǔ)言當(dāng)然用python
瀏覽器投票的流程如下
1、向服務(wù)器發(fā)送請(qǐng)求,服務(wù)器返回驗(yàn)證碼和表單
2、填好表單,發(fā)送到服務(wù)器
可以用firefox+httpfox插件查看整個(gè)事件過(guò)程,以及發(fā)送請(qǐng)求的POST和GET數(shù)據(jù)格式
使用python的urllib2庫(kù)實(shí)現(xiàn)上述過(guò)程
1、向服務(wù)器請(qǐng)求驗(yàn)證碼
可以用
import urllib urllib.urlretrieve(imgurl,imgfile)#imgurl可以從頁(yè)面源代碼找到
但是由于每次請(qǐng)求服務(wù)器,都會(huì)重新生成驗(yàn)證碼,所以這樣請(qǐng)求道的驗(yàn)證碼即便識(shí)別出來(lái),再POST進(jìn)去時(shí)也會(huì)提示錯(cuò)誤。解決辦法時(shí)使用cookie
import cookie import urllib2 cookiejar=cookielib.MozillaCookieJar(cookieFilename) opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookiejar)) response=opener.open(imgurl)
如果需要使用代理服務(wù)器,則可以這樣寫
import cookie import urllib2 proxy_line='127.0.0.1:8087' cookieFilename='cookie.txt' cookiejar=cookielib.MozillaCookieJar(cookieFilename) opener=urllib2.build_opener(urllib2.ProxyHandler({'http':proxy_line}),urllib2.HTTPCookieProcessor(cookieFileJar)) response=opener.open(imgurl,timeout=2)#設(shè)置超時(shí)時(shí)間
這樣就是以本機(jī)8087端口帶有cookie驗(yàn)證訪問(wèn)服務(wù)器,下一步識(shí)別出驗(yàn)證碼,依然帶cookie POST進(jìn)服務(wù)器即可。
2、保存驗(yàn)證碼到本地
上面response即返回得到的驗(yàn)證碼二進(jìn)制流,寫入文件用下面代碼
content=response.read() fp=file(imgfile,'wb')#將二進(jìn)制圖片保存 fp.write(content) fp.close()
3、驗(yàn)證碼識(shí)別
驗(yàn)證碼識(shí)別用tesseract,由于tesseract沒有提供python接口,這里用系統(tǒng)調(diào)用外部命令
用法為
import os imgfile='img.jpg' out
用python刷票代碼如下
# -*- coding: utf-8 -*- import os import urllib import urllib2 import string import socks import httplib2 import cookielib import time import random tes='tesseract.exe' filepath='./' imgurl='http://example.com/vote/img.jsp' myurl="http://example.com/vote" voteInfoId='xxxxxxxx' headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:25.0) Gecko/20100101 Firefox/25.0'}#, # 'Cookie':'324E661DE12427BD71CE63DF436A80D1'} imgfile=filepath + '/img.jpg' outfile=filepath + '/out' proxy_file=filepath+'/proxy.txt' user_file=filepath+'/user2.txt' cookieFilename=filepath +'/cookies.txt' #myproxy_line='211.142.236.137:80' #cookieJarFileLWP=cookielib.LWPCookieJar(cookieFilename) cookieFileJar=cookielib.FileCookieJar(cookieFilename) #opener=urllib2.build_opener(urllib2.ProxyHandler({'http':myproxy_line}),urllib2.HTTPCookieProcessor(cookieMozillaJar)) opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieFileJar)) f_user=open(user_file) f_proxy=open(proxy_file) proxy_all=f_proxy.read().split('\n') f_user=open(user_file) user_all=f_user.read().split('\n') count=1 cookieFileJar=cookielib.FileCookieJar(cookieFilename)#使用cookie登陸 while True: i=random.randint(1,100) j=random.randint(1,60) #print user_all.length() user_line=user_all[i] myproxy_line=proxy_all[j] for myproxy_line in [myproxy_line]:#f_proxy: #使用代理和cookie opener=urllib2.build_opener(urllib2.ProxyHandler({'http':myproxy_line}),urllib2.HTTPCookieProcessor(cookieFileJar)) try: response2=opener.open(imgurl,timeout=1)#返回二進(jìn)制圖片 except Exception,e: print 'I can not connect the server,try again' continue content=response2.read() fp=file(imgfile,'wb')#將二進(jìn)制圖片保存 fp.write(content) fp.close() outcmd="%s %s %s -l eng digits -psm 7" %(tes,imgfile,outfile) print 'I begin to recognize the CAPTCHA code ..' os.system(outcmd) code_file=open(filepath+'/out.txt') mycode_line=code_file.readline() code_file.close() if len(mycode_line)<=3: print 'I guess the CAPTCHA code is %s,but I think it\'s error.' % (mycode_line) continue mycode=mycode_line[0:4] print 'I guess the CAPTCHA code is %s' % (mycode) mylist=user_line.split('----') proxy_list=myproxy_line.split(':') myid=mylist[0]#.decode('utf-8') myname=mylist[1]#.decode('utf-8') mycomm=mylist[2]#.decode('utf-8') data={'method':'vote', 'voteInfoId':voteInfoId, 'forward':'***', 'info1':myid, 'info2':myname, 'info3':mycomm, 'inputCode':mycode, 'submit':'確定'} print 'Now I begin to vote...' print 'the user is %s' % (myid) print 'the name is %s' % (myname) print 'the comment is %s' % (mycomm) post_data=urllib.urlencode(data) try: response=opener.open(myurl,post_data) except Exception,e: print 'I can\'t connect the server ,so vote is failure' continue content=response.read() #img_req=opener.open(imgurl) #cookieFileJar.save(cookieFilename) #req=opener.open(myurl,post_data) #req=urllib2.Request(myurl,data=post_data,headers=headers) fp=file('test.html','w') print 'I put the received html to the file test.html' fp.write(content) fp.close() #outcmd="%s %s %s" %(tes,imgfile,outfile) #count+=1 #print cookieFileJar
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python實(shí)現(xiàn)多線程/多進(jìn)程的TCP服務(wù)器
這篇文章主要為大家詳細(xì)介紹了Python實(shí)現(xiàn)多線程/多進(jìn)程的TCP服務(wù)器,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-09-09Python測(cè)試線程應(yīng)用程序過(guò)程解析
這篇文章主要介紹了Python測(cè)試線程應(yīng)用程序過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-12-12Python使用missingno模塊輕松處理數(shù)據(jù)缺失
missingno是一個(gè)基于Python的開源數(shù)據(jù)可視化工具,旨在幫助數(shù)據(jù)分析師和科學(xué)家更好地理解和處理數(shù)據(jù)缺失,下面我們就來(lái)看看如何使用missingno處理數(shù)據(jù)缺失吧2024-02-02pytorch張量和numpy數(shù)組相互轉(zhuǎn)換
在使用pytorch作為深度學(xué)習(xí)的框架時(shí),經(jīng)常會(huì)遇到張量tensor和矩陣numpy的類型的相互轉(zhuǎn)化的問(wèn)題,本文主要介紹了pytorch張量和numpy數(shù)組相互轉(zhuǎn)換,感興趣的可以了解一下2024-02-02python自制簡(jiǎn)易mysql連接池的實(shí)現(xiàn)示例
本文主要介紹了python自制簡(jiǎn)易mysql連接池的實(shí)現(xiàn)示例,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-11-11一文帶你安裝opencv與常用庫(kù)(保姆級(jí)教程)
Python OpenCV是一種流行的計(jì)算機(jī)視覺庫(kù),使用它可以進(jìn)行圖像處理、視頻處理等操作,下面這篇文章主要給大家介紹了關(guān)于安裝opencv與常用庫(kù)的相關(guān)資料,需要的朋友可以參考下2023-05-05解決pandas無(wú)法在pycharm中使用plot()方法顯示圖像的問(wèn)題
今天小編就為大家分享一篇解決pandas無(wú)法在pycharm中使用plot()方法顯示圖像的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-05-05