python小程序?qū)崿F(xiàn)刷票功能詳解
刷票一般要突破以下限制:
1、驗證碼識別
2、同一ip不可連續(xù)投票
解決辦法
1、用tesseract工具,鏈接在此 https://code.google.com/p/tesseract-ocr/ (人人還是加不了https鏈接)
2、使用代理,國內(nèi)可以的代理服務(wù)器可以從這里找到 http://cn-proxy.com/
程序語言當(dāng)然用python
瀏覽器投票的流程如下
1、向服務(wù)器發(fā)送請求,服務(wù)器返回驗證碼和表單
2、填好表單,發(fā)送到服務(wù)器
可以用firefox+httpfox插件查看整個事件過程,以及發(fā)送請求的POST和GET數(shù)據(jù)格式
使用python的urllib2庫實現(xiàn)上述過程
1、向服務(wù)器請求驗證碼
可以用
import urllib urllib.urlretrieve(imgurl,imgfile)#imgurl可以從頁面源代碼找到
但是由于每次請求服務(wù)器,都會重新生成驗證碼,所以這樣請求道的驗證碼即便識別出來,再POST進(jìn)去時也會提示錯誤。解決辦法時使用cookie
import cookie import urllib2 cookiejar=cookielib.MozillaCookieJar(cookieFilename) opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookiejar)) response=opener.open(imgurl)
如果需要使用代理服務(wù)器,則可以這樣寫
import cookie import urllib2 proxy_line='127.0.0.1:8087' cookieFilename='cookie.txt' cookiejar=cookielib.MozillaCookieJar(cookieFilename) opener=urllib2.build_opener(urllib2.ProxyHandler({'http':proxy_line}),urllib2.HTTPCookieProcessor(cookieFileJar)) response=opener.open(imgurl,timeout=2)#設(shè)置超時時間
這樣就是以本機(jī)8087端口帶有cookie驗證訪問服務(wù)器,下一步識別出驗證碼,依然帶cookie POST進(jìn)服務(wù)器即可。
2、保存驗證碼到本地
上面response即返回得到的驗證碼二進(jìn)制流,寫入文件用下面代碼
content=response.read() fp=file(imgfile,'wb')#將二進(jìn)制圖片保存 fp.write(content) fp.close()
3、驗證碼識別
驗證碼識別用tesseract,由于tesseract沒有提供python接口,這里用系統(tǒng)調(diào)用外部命令
用法為
import os imgfile='img.jpg' out
用python刷票代碼如下
# -*- coding: utf-8 -*- import os import urllib import urllib2 import string import socks import httplib2 import cookielib import time import random tes='tesseract.exe' filepath='./' imgurl='http://example.com/vote/img.jsp' myurl="http://example.com/vote" voteInfoId='xxxxxxxx' headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:25.0) Gecko/20100101 Firefox/25.0'}#, # 'Cookie':'324E661DE12427BD71CE63DF436A80D1'} imgfile=filepath + '/img.jpg' outfile=filepath + '/out' proxy_file=filepath+'/proxy.txt' user_file=filepath+'/user2.txt' cookieFilename=filepath +'/cookies.txt' #myproxy_line='211.142.236.137:80' #cookieJarFileLWP=cookielib.LWPCookieJar(cookieFilename) cookieFileJar=cookielib.FileCookieJar(cookieFilename) #opener=urllib2.build_opener(urllib2.ProxyHandler({'http':myproxy_line}),urllib2.HTTPCookieProcessor(cookieMozillaJar)) opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieFileJar)) f_user=open(user_file) f_proxy=open(proxy_file) proxy_all=f_proxy.read().split('\n') f_user=open(user_file) user_all=f_user.read().split('\n') count=1 cookieFileJar=cookielib.FileCookieJar(cookieFilename)#使用cookie登陸 while True: i=random.randint(1,100) j=random.randint(1,60) #print user_all.length() user_line=user_all[i] myproxy_line=proxy_all[j] for myproxy_line in [myproxy_line]:#f_proxy: #使用代理和cookie opener=urllib2.build_opener(urllib2.ProxyHandler({'http':myproxy_line}),urllib2.HTTPCookieProcessor(cookieFileJar)) try: response2=opener.open(imgurl,timeout=1)#返回二進(jìn)制圖片 except Exception,e: print 'I can not connect the server,try again' continue content=response2.read() fp=file(imgfile,'wb')#將二進(jìn)制圖片保存 fp.write(content) fp.close() outcmd="%s %s %s -l eng digits -psm 7" %(tes,imgfile,outfile) print 'I begin to recognize the CAPTCHA code ..' os.system(outcmd) code_file=open(filepath+'/out.txt') mycode_line=code_file.readline() code_file.close() if len(mycode_line)<=3: print 'I guess the CAPTCHA code is %s,but I think it\'s error.' % (mycode_line) continue mycode=mycode_line[0:4] print 'I guess the CAPTCHA code is %s' % (mycode) mylist=user_line.split('----') proxy_list=myproxy_line.split(':') myid=mylist[0]#.decode('utf-8') myname=mylist[1]#.decode('utf-8') mycomm=mylist[2]#.decode('utf-8') data={'method':'vote', 'voteInfoId':voteInfoId, 'forward':'***', 'info1':myid, 'info2':myname, 'info3':mycomm, 'inputCode':mycode, 'submit':'確定'} print 'Now I begin to vote...' print 'the user is %s' % (myid) print 'the name is %s' % (myname) print 'the comment is %s' % (mycomm) post_data=urllib.urlencode(data) try: response=opener.open(myurl,post_data) except Exception,e: print 'I can\'t connect the server ,so vote is failure' continue content=response.read() #img_req=opener.open(imgurl) #cookieFileJar.save(cookieFilename) #req=opener.open(myurl,post_data) #req=urllib2.Request(myurl,data=post_data,headers=headers) fp=file('test.html','w') print 'I put the received html to the file test.html' fp.write(content) fp.close() #outcmd="%s %s %s" %(tes,imgfile,outfile) #count+=1 #print cookieFileJar
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python實現(xiàn)多線程/多進(jìn)程的TCP服務(wù)器
這篇文章主要為大家詳細(xì)介紹了Python實現(xiàn)多線程/多進(jìn)程的TCP服務(wù)器,具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-09-09Python使用missingno模塊輕松處理數(shù)據(jù)缺失
missingno是一個基于Python的開源數(shù)據(jù)可視化工具,旨在幫助數(shù)據(jù)分析師和科學(xué)家更好地理解和處理數(shù)據(jù)缺失,下面我們就來看看如何使用missingno處理數(shù)據(jù)缺失吧2024-02-02pytorch張量和numpy數(shù)組相互轉(zhuǎn)換
在使用pytorch作為深度學(xué)習(xí)的框架時,經(jīng)常會遇到張量tensor和矩陣numpy的類型的相互轉(zhuǎn)化的問題,本文主要介紹了pytorch張量和numpy數(shù)組相互轉(zhuǎn)換,感興趣的可以了解一下2024-02-02解決pandas無法在pycharm中使用plot()方法顯示圖像的問題
今天小編就為大家分享一篇解決pandas無法在pycharm中使用plot()方法顯示圖像的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-05-05