python小程序?qū)崿F(xiàn)刷票功能詳解
刷票一般要突破以下限制:
1、驗(yàn)證碼識(shí)別
2、同一ip不可連續(xù)投票
解決辦法
1、用tesseract工具,鏈接在此 https://code.google.com/p/tesseract-ocr/ (人人還是加不了https鏈接)
2、使用代理,國(guó)內(nèi)可以的代理服務(wù)器可以從這里找到 http://cn-proxy.com/
程序語言當(dāng)然用python
瀏覽器投票的流程如下
1、向服務(wù)器發(fā)送請(qǐng)求,服務(wù)器返回驗(yàn)證碼和表單
2、填好表單,發(fā)送到服務(wù)器
可以用firefox+httpfox插件查看整個(gè)事件過程,以及發(fā)送請(qǐng)求的POST和GET數(shù)據(jù)格式
使用python的urllib2庫(kù)實(shí)現(xiàn)上述過程
1、向服務(wù)器請(qǐng)求驗(yàn)證碼
可以用
import urllib urllib.urlretrieve(imgurl,imgfile)#imgurl可以從頁(yè)面源代碼找到
但是由于每次請(qǐng)求服務(wù)器,都會(huì)重新生成驗(yàn)證碼,所以這樣請(qǐng)求道的驗(yàn)證碼即便識(shí)別出來,再POST進(jìn)去時(shí)也會(huì)提示錯(cuò)誤。解決辦法時(shí)使用cookie
import cookie import urllib2 cookiejar=cookielib.MozillaCookieJar(cookieFilename) opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookiejar)) response=opener.open(imgurl)
如果需要使用代理服務(wù)器,則可以這樣寫
import cookie
import urllib2
proxy_line='127.0.0.1:8087'
cookieFilename='cookie.txt'
cookiejar=cookielib.MozillaCookieJar(cookieFilename)
opener=urllib2.build_opener(urllib2.ProxyHandler({'http':proxy_line}),urllib2.HTTPCookieProcessor(cookieFileJar))
response=opener.open(imgurl,timeout=2)#設(shè)置超時(shí)時(shí)間
這樣就是以本機(jī)8087端口帶有cookie驗(yàn)證訪問服務(wù)器,下一步識(shí)別出驗(yàn)證碼,依然帶cookie POST進(jìn)服務(wù)器即可。
2、保存驗(yàn)證碼到本地
上面response即返回得到的驗(yàn)證碼二進(jìn)制流,寫入文件用下面代碼
content=response.read() fp=file(imgfile,'wb')#將二進(jìn)制圖片保存 fp.write(content) fp.close()
3、驗(yàn)證碼識(shí)別
驗(yàn)證碼識(shí)別用tesseract,由于tesseract沒有提供python接口,這里用系統(tǒng)調(diào)用外部命令
用法為
import os imgfile='img.jpg' out
用python刷票代碼如下
# -*- coding: utf-8 -*-
import os
import urllib
import urllib2
import string
import socks
import httplib2
import cookielib
import time
import random
tes='tesseract.exe'
filepath='./'
imgurl='http://example.com/vote/img.jsp'
myurl="http://example.com/vote"
voteInfoId='xxxxxxxx'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:25.0) Gecko/20100101 Firefox/25.0'}#,
# 'Cookie':'324E661DE12427BD71CE63DF436A80D1'}
imgfile=filepath + '/img.jpg'
outfile=filepath + '/out'
proxy_file=filepath+'/proxy.txt'
user_file=filepath+'/user2.txt'
cookieFilename=filepath +'/cookies.txt'
#myproxy_line='211.142.236.137:80'
#cookieJarFileLWP=cookielib.LWPCookieJar(cookieFilename)
cookieFileJar=cookielib.FileCookieJar(cookieFilename)
#opener=urllib2.build_opener(urllib2.ProxyHandler({'http':myproxy_line}),urllib2.HTTPCookieProcessor(cookieMozillaJar))
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieFileJar))
f_user=open(user_file)
f_proxy=open(proxy_file)
proxy_all=f_proxy.read().split('\n')
f_user=open(user_file)
user_all=f_user.read().split('\n')
count=1
cookieFileJar=cookielib.FileCookieJar(cookieFilename)#使用cookie登陸
while True:
i=random.randint(1,100)
j=random.randint(1,60)
#print user_all.length()
user_line=user_all[i]
myproxy_line=proxy_all[j]
for myproxy_line in [myproxy_line]:#f_proxy:
#使用代理和cookie
opener=urllib2.build_opener(urllib2.ProxyHandler({'http':myproxy_line}),urllib2.HTTPCookieProcessor(cookieFileJar))
try:
response2=opener.open(imgurl,timeout=1)#返回二進(jìn)制圖片
except Exception,e:
print 'I can not connect the server,try again'
continue
content=response2.read()
fp=file(imgfile,'wb')#將二進(jìn)制圖片保存
fp.write(content)
fp.close()
outcmd="%s %s %s -l eng digits -psm 7" %(tes,imgfile,outfile)
print 'I begin to recognize the CAPTCHA code ..'
os.system(outcmd)
code_file=open(filepath+'/out.txt')
mycode_line=code_file.readline()
code_file.close()
if len(mycode_line)<=3:
print 'I guess the CAPTCHA code is %s,but I think it\'s error.' % (mycode_line)
continue
mycode=mycode_line[0:4]
print 'I guess the CAPTCHA code is %s' % (mycode)
mylist=user_line.split('----')
proxy_list=myproxy_line.split(':')
myid=mylist[0]#.decode('utf-8')
myname=mylist[1]#.decode('utf-8')
mycomm=mylist[2]#.decode('utf-8')
data={'method':'vote',
'voteInfoId':voteInfoId,
'forward':'***',
'info1':myid,
'info2':myname,
'info3':mycomm,
'inputCode':mycode,
'submit':'確定'}
print 'Now I begin to vote...'
print 'the user is %s' % (myid)
print 'the name is %s' % (myname)
print 'the comment is %s' % (mycomm)
post_data=urllib.urlencode(data)
try:
response=opener.open(myurl,post_data)
except Exception,e:
print 'I can\'t connect the server ,so vote is failure'
continue
content=response.read()
#img_req=opener.open(imgurl)
#cookieFileJar.save(cookieFilename)
#req=opener.open(myurl,post_data)
#req=urllib2.Request(myurl,data=post_data,headers=headers)
fp=file('test.html','w')
print 'I put the received html to the file test.html'
fp.write(content)
fp.close()
#outcmd="%s %s %s" %(tes,imgfile,outfile)
#count+=1
#print cookieFileJar
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python實(shí)現(xiàn)多線程/多進(jìn)程的TCP服務(wù)器
這篇文章主要為大家詳細(xì)介紹了Python實(shí)現(xiàn)多線程/多進(jìn)程的TCP服務(wù)器,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-09-09
Python使用missingno模塊輕松處理數(shù)據(jù)缺失
missingno是一個(gè)基于Python的開源數(shù)據(jù)可視化工具,旨在幫助數(shù)據(jù)分析師和科學(xué)家更好地理解和處理數(shù)據(jù)缺失,下面我們就來看看如何使用missingno處理數(shù)據(jù)缺失吧2024-02-02
pytorch張量和numpy數(shù)組相互轉(zhuǎn)換
在使用pytorch作為深度學(xué)習(xí)的框架時(shí),經(jīng)常會(huì)遇到張量tensor和矩陣numpy的類型的相互轉(zhuǎn)化的問題,本文主要介紹了pytorch張量和numpy數(shù)組相互轉(zhuǎn)換,感興趣的可以了解一下2024-02-02
python自制簡(jiǎn)易mysql連接池的實(shí)現(xiàn)示例
本文主要介紹了python自制簡(jiǎn)易mysql連接池的實(shí)現(xiàn)示例,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-11-11
一文帶你安裝opencv與常用庫(kù)(保姆級(jí)教程)
Python OpenCV是一種流行的計(jì)算機(jī)視覺庫(kù),使用它可以進(jìn)行圖像處理、視頻處理等操作,下面這篇文章主要給大家介紹了關(guān)于安裝opencv與常用庫(kù)的相關(guān)資料,需要的朋友可以參考下2023-05-05
解決pandas無法在pycharm中使用plot()方法顯示圖像的問題
今天小編就為大家分享一篇解決pandas無法在pycharm中使用plot()方法顯示圖像的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-05-05

