談談Python進行驗證碼識別的一些想法

更新時間：2016年01月25日 10:26:02 作者：Manning

關于python驗證碼識別，主要方法有幾類：一類是通過對圖片進行處理，然后利用字庫特征匹配的方法，一類是圖片處理后建立字符對應字典，還有一類是直接利用ocr模塊進行識別。不管是用什么方法，都需要首先對圖片進行處理，于是試著對下面的驗證碼進行分析

用python加“驗證碼”為關鍵詞在baidu里搜一下，可以找到很多關于驗證碼識別的文章。我大體看了一下，主要方法有幾類：一類是通過對圖片進行處理，然后利用字庫特征匹配的方法，一類是圖片處理后建立字符對應字典，還有一類是直接利用ocr模塊進行識別。不管是用什么方法，都需要首先對圖片進行處理，于是試著對下面的驗證碼進行分析。

一、圖片處理

這個驗證碼中主要的影響因素是中間的曲線，首先考慮去掉圖片中的曲線。考慮了兩種算法：
第一種是首先取到曲線頭的位置，即x=0時，黑點的位置。然后向后移動x的取值，觀察每個x下黑點的位置，判斷前后兩個相鄰黑點之間的距離，如果距離在一定范圍內(nèi)，可以基本判斷該點是曲線上的點，最后將曲線上的點全部繪成白色。試了一下這種方法，結果得到的圖片效果很一般，曲線不能完全去除，而且容量將字符的線條去除。
第二種考慮用單位面積內(nèi)點的密度來進行計算。于是首先計算單位面積內(nèi)點的個數(shù)，將單位面積內(nèi)點個數(shù)少于某一指定數(shù)的面積去除，剩余的部分基本上就是驗證碼字符的部分。本例中，為了便于操作，取了5*5做為單位范圍，并調(diào)整單位面積內(nèi)點的標準密度為11。處理后的效果：

二、字符驗證

這里我使用的方法是利用pytesser進行ocr識別，但由于這類驗證碼字符的不規(guī)則性，使得驗證結果的準確性并不是很高。具體哪位大牛，有什么好的辦法，希望能給指點一下。

三、準備工作與代碼實例

1、PIL、pytesser、tesseract

(1)安裝PIL：下載地址：http://www.pythonware.com/products/pil/
(2)pytesser:下載地址：http://code.google.com/p/pytesser/,下載解壓后直接放在代碼相同的文件夾下，即可使用。
(3)Tesseract OCR engine下載：http://code.google.com/p/tesseract-ocr/，下載后解壓，找到tessdata文件夾，用其替換掉pytesser解壓后的tessdata文件夾即可。

2、具體代碼

#encoding=utf-8
###利用點的密度計算
import Image,ImageEnhance,ImageFilter,ImageDraw
import sys
from pytesser import *
#計算范圍內(nèi)點的個數(shù)
def numpoint(im):
w,h = im.size
data = list( im.getdata() )
mumpoint=0
for x in range(w):
for y in range(h):
if data[ y*w + x ] !=255:#255是白色
mumpoint+=1
return mumpoint
#計算5*5范圍內(nèi)點的密度
def pointmidu(im):
w,h = im.size
p=[]
for y in range(0,h,5):
for x in range(0,w,5):
box = (x,y, x+5,y+5)
im1=im.crop(box)
a=numpoint(im1)
if a<11:##如果5*5范圍內(nèi)小于11個點，那么將該部分全部換為白色。
for i in range(x,x+5):
for j in range(y,y+5):
im.putpixel((i,j), 255)
im.save(r'img.jpg')
def ocrend():##識別
image_name = "img.jpg"
im = Image.open(image_name)
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save("1.tif")
print image_file_to_string('1.tif') 
if __name__=='__main__':
image_name = "1.png"
im = Image.open(image_name)
im = im.filter(ImageFilter.DETAIL)
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
##a=remove_point(im)
pointmidu(im)
ocrend()

本人的這個方法，最終識別率確實不高，寫出來，哪位高手有好的思路或者做法，望不惜賜教！

您可能感興趣的文章: