欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python+Opencv身份證號碼區(qū)域提取及識別實現(xiàn)

 更新時間:2020年08月25日 10:08:35   作者:Meteor Lee  
這篇文章主要介紹了Python+Opencv身份證號碼區(qū)域提取及識別實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

前端時間智能信息處理實訓(xùn),我選擇的課題為身份證號碼識別,對中華人民共和國公民身份證進行識別,提取并識別其中的身份證號碼,將身份證號碼識別為字符串的形式輸出?,F(xiàn)在實訓(xùn)結(jié)束了將代碼發(fā)布出來供大家參考,識別的方式并不復(fù)雜,并加了一些注釋,如果有什么問題可共同討論。最后重要的事情說三遍:請勿直接抄襲,請勿直接抄襲,請勿直接抄襲!尤其是我的學(xué)弟學(xué)妹們,還是要自己做的,小心直接拿我的用被老師發(fā)現(xiàn)了挨批^_^。

實訓(xùn)環(huán)境:CentOS-7.5.1804 + Python-3.6.6 + Opencv-3.4.1

做測試用的照片以及數(shù)字識別匹配使用的模板(自制)提供給大家,通過查詢得到,身份證號碼使用的字體格式為OCR-B 10 BT格式,實訓(xùn)中用到的身份證圖片為訓(xùn)練測試圖片,有一部分是老師當(dāng)時直接給出的,還有一部分是我自己用自己身份證做的測試和從網(wǎng)上找到了一張,由于部分身份證號碼不是標(biāo)準(zhǔn)字體格式,對識別造成影響,所以有部分圖片我還提前ps了一下。

流程圖

前期處理的部分不在描述,流程圖和代碼注釋中都有。其實整個過程并不是很復(fù)雜,本來想過在數(shù)字識別方面用現(xiàn)成的一些方法,或者想要嘗試用到卷積神經(jīng)網(wǎng)絡(luò)(CNN)然后做訓(xùn)練集來識別。后來在和老師交流的時候,老師給出建議可以嘗試使用特征點匹配或者其他類方法。根據(jù)最后數(shù)字分割出來單獨顯示的效果,想到了一個適合于我代碼情況的簡單方法。

建立一個標(biāo)準(zhǔn)號碼庫(利用上面自制模板數(shù)字分割后獲得),然后用每一個號碼圖片與庫中所有標(biāo)準(zhǔn)號碼圖片做相似度匹配,和哪一個模板相似度最高,則說明該圖片為哪一位號碼。在將模板號碼分割成功后,最關(guān)鍵的一步就是進行相似度匹配。為提高匹配的精確度和效率,首先利用cv.resize()將前面被提取出的每位身份證號碼以及標(biāo)準(zhǔn)號碼庫中的號碼做圖像大小調(diào)整,統(tǒng)一將圖像均調(diào)整為12x18像素的大小,圖像大小的選擇是經(jīng)過慎重的考慮的,如果太大則計算過程耗時,如果過小則可能存在較大誤差。匹配的具體方案為:記錄需要識別的圖片與每個模板圖片中有多少位置的像素點相同,相同的越多,說明相似度越高,也就最有可能是某個號碼。最終將18位號碼都識別完成后,得到的具體的相似度矩陣。

具體代碼如下所示:

import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt

# 將身份證號碼區(qū)域從身份證中提取出
def Extract(op_image, sh_image):

 binary, contours, hierarchy = cv.findContours(op_image,
  cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)
 contours.remove(contours[0])
 max_x, max_y, max_w, max_h = cv.boundingRect(contours[0])
 color = (0, 0, 0)
 for c in contours:
 x, y, w, h = cv.boundingRect(c)
 cv.rectangle(op_image, (x, y), (x + w, y + h), color, 1)
 cv.rectangle(sh_image, (x, y), (x + w, y + h), color, 1)
 if max_w < w:
  max_x = x
  max_y = y
  max_w = w
  max_h = h
 cut_img = sh_image[max_y:max_y+max_h, max_x:max_x+max_w]
 cv.imshow("The recognized enlarged image", op_image)
 cv.waitKey(0)
 cv.imshow("The recognized binary image", sh_image)
 cv.waitKey(0)
 return cut_img

# 號碼內(nèi)部區(qū)域填充(未繼續(xù)是用此方法)
def Area_filling(image, kernel):
 # The boundary image
 iterate = np.zeros(image.shape, np.uint8)
 iterate[:, 0] = image[:, 0]
 iterate[:, -1] = image[:, -1]
 iterate[0, :] = image[0, :]
 iterate[-1, :] = image[-1, :]
 while True:
 old_iterate = iterate
 iterate_dilation = cv.dilate(iterate, kernel, iterations=1)
 iterate = cv.bitwise_and(iterate_dilation, image)
 difference = cv.subtract(iterate, old_iterate)
 # if difference is all zeros it will return False
 if not np.any(difference):
  break
 return iterate

# 將身份證號碼區(qū)域再次切割使得一張圖片一位號碼
def Segmentation(cut_img, kernel, n):
 #首先進行一次號碼內(nèi)空白填充(效果不佳,放棄)
 #area_img = Area_filling(cut_img, kernel)
 #cv.imshow("area_img", area_img)
 #cv.waitKey(0)
 #dilate = cv.dilate(area_img, kernel, iterations=1)
 #cv.imshow("dilate", dilate)
 #cv.waitKey(0)

 cut_copy = cut_img.copy()
 binary, contours, hierarchy = cv.findContours(cut_copy, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)
 contours.remove(contours[0])
 for c in contours:
 x, y, w, h = cv.boundingRect(c)
 for i in range(h):
  for j in range(w):
  # 把首次用findContours()方法識別的輪廓內(nèi)區(qū)域置黑色
  cut_copy[y + i, x + j] = 0
  # cv.rectangle(cut_copy, (x, y), (x + w, y + h), color, 1)
 cv.imshow("Filled image", cut_copy)
 cv.waitKey(0)

 # 嘗試進行分割
 binary, contours, hierarchy = cv.findContours(cut_copy, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)
 #tmp_img = cut_img.copy()
 # 如果識別的輪廓數(shù)量不是n+1位(首先是一個整個區(qū)域的輪廓,然后是n位號碼各自的輪廓,身份證和匹配模板分割均用此方法)
 while len(contours)!=n+1:
 if len(contours) < n+1:
  # 如果提取的輪廓數(shù)量小于n+1, 說明可能有兩位數(shù)被識別到一個輪廓中,做一次閉運算,消除數(shù)位之間可能存在的連接部分,然后再次嘗試提取
  #cut_copy = cv.dilate(cut_copy, kernel, iterations=1)
  cut_copy = cv.morphologyEx(cut_copy, cv.MORPH_CLOSE, kernel)
  cv.imshow("cut_copy", cut_copy)
  cv.waitKey(0)
  # 再次嘗試提取身份證區(qū)域的輪廓并將輪廓內(nèi)區(qū)域用黑色覆蓋
  binary, contours, hierarchy = cv.findContours(cut_copy, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)
  # 去掉提取出的第一個輪廓(第一個輪廓為整張圖片)
  contours.remove(contours[0])
  for c in contours:
  x, y, w, h = cv.boundingRect(c)
  for i in range(h):
   for j in range(w):
   cut_copy[y + i, x + j] = 0
   # cv.rectangle(cut_copy, (x, y), (x + w, y + h), color, 1)
  cv.imshow("Filled image", cut_copy)
  cv.waitKey(0)
  #如果findContours()結(jié)果為n,跳出
  if len(contours) == n:
  break

 elif len(contours) > n+1:
  # 如果提取的輪廓數(shù)量大于n+1, 說明可能有一位數(shù)被識別到兩個輪廓中,做一次開運算,增強附近身份證區(qū)域部分之間的連接部分,然后再次嘗試提取
  #cut_copy = cv.erode(cut_copy, kernel, iterations=1)
  cut_copy = cv.morphologyEx(cut_copy, cv.MORPH_OPEN, kernel2)
  cv.imshow("cut_copy", cut_copy)
  cv.waitKey(0)
  #再次嘗試提取身份證區(qū)域的輪廓并將輪廓內(nèi)區(qū)域用黑色覆蓋
  binary, contours, hierarchy = cv.findContours(cut_copy, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)
  #去掉提取出的第一個輪廓(第一個輪廓為整張圖片)
  contours.remove(contours[0])
  for c in contours:
  x, y, w, h = cv.boundingRect(c)
  for i in range(h):
   for j in range(w):
   cut_copy[y + i, x + j] = 0
   # cv.rectangle(cut_copy, (x, y), (x + w, y + h), color, 1)
  #cv.imshow("cut_copy", cut_copy)
  #cv.waitKey(0)
  if len(contours) == n:
  break
 # 上述while()中循環(huán)完成后,處理的圖像基本滿足分割要求,進行最后的提取分割
 binary, contours, hierarchy = cv.findContours(cut_copy, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)
 contours.remove(contours[0])
 color = (0, 0, 0)
 for c in contours:
 x, y, w, h = cv.boundingRect(c)
 for i in range(h):
  for j in range(w):
  cv.rectangle(cut_copy, (x, y), (x + w, y + h), color, 1)
  cv.rectangle(cut_img, (x, y), (x + w, y + h), color, 1)

 cv.imshow("Filled image", cut_copy)
 cv.waitKey(0)
 cv.imshow("cut_img", cut_img)
 cv.waitKey(0)
 #print('number:', len(contours))
 # Returns the result of the split
 return contours
 #return cut_img

# Sort排序方法,先將圖像分割,由于分割的先后順序不是按照從左往右,根據(jù)橫坐標(biāo)大小將每位身份證號碼圖片進行排序
def sort(contours, image):
 tmp_num = []
 x_all = []
 x_sort = []
 for c in contours:
 x, y, w, h = cv.boundingRect(c)
 # 使用x坐標(biāo)來確定身份證號碼圖片的順序,把個圖片坐標(biāo)的x值放入x_sort中
 x_sort.append(x)
 # 建立一個用于索引x坐標(biāo)的列表
 x_all.append(x)
 tmp_img = image[y+1:y+h-1, x+1:x+w-1]
 tmp_img = cv.resize(tmp_img, (40, 60))
 cv.imshow("Number", tmp_img)
 cv.waitKey(0)
 # 將分割的圖片縮小至12乘18像素的大小,標(biāo)準(zhǔn)化同時節(jié)約模板匹配的時間
 tmp_img = cv.resize(tmp_img, (12, 18))
 tmp_num.append(tmp_img)
 # 利用x_sort排序,用x_all索引,對身份證號碼圖片排序
 x_sort.sort()
 num_img = []
 for x in x_sort:
 index = x_all.index(x)
 num_img.append(tmp_num[index])
 # 返回排序后圖片列表
 return num_img

# 圖像識別方法
def MatchImage(img_num, tplt_num):
 # IDnum用于存儲最終的身份證字符串
 IDnum = ''
 # 身份證號碼18位
 for i in range(18):
 # 存儲最大相似度模板的索引以及最大相似度
 max_index = 0
 max_simil = 0
  # 模板有1~9,0,X共11個
 for j in range(11):
  # 存儲身份證號碼圖片與模板之間的相似度
  simil = 0
  for y in range(18):
  for x in range(12):
   # 如果身份證號碼圖片與模板之間對應(yīng)位置像素點相同,simil 值自加1
   if img_num[i][y,x] == tplt_num[j][y,x]:
   simil+=1
  if max_simil < simil:
  max_index = j
  max_simil = simil
  print(str(simil)+' ',end='')
 if max_index < 9:
  IDnum += str(max_index+1)
 elif max_index == 9:
  IDnum += str(0)
 else:
  IDnum += 'X'
 print()
 return IDnum

# 最終效果展示
def display(IDnum, image):
 image = cv.resize(image, (960, 90))
 plt.figure(num='ID_Number')
 plt.subplot(111), plt.imshow(image, cmap='gray'), plt.title(IDnum, fontsize=30), plt.xticks([]), plt.yticks([])
 plt.show()


if __name__ == '__main__':
 # 一共三張做測試用身份證圖像
 path = 'IDcard01.jpg'
 #path = 'IDcard02.png'
 #path = 'IDcard.jpg'
 id_card = cv.imread(path, 0)
 cv.imshow('Original image', id_card)
 cv.waitKey(0)
 # 將圖像轉(zhuǎn)化成標(biāo)準(zhǔn)大小
 id_card = cv.resize(id_card,(1200, 820))
 cv.imshow('Enlarged original image', id_card)
 cv.waitKey(0)
 # 圖像二值化
 ret, binary_img = cv.threshold(id_card, 127, 255, cv.THRESH_BINARY)
 cv.imshow('Binary image', binary_img)
 cv.waitKey(0)

 # RECTANGULAR
 kernel = cv.getStructuringElement(cv.MORPH_RECT, (3, 3))
 # RECTANGULAR
 kernel2 = cv.getStructuringElement(cv.MORPH_DILATE, (5, 5))
 #close_img = cv.morphologyEx(binary_img, cv.MORPH_CLOSE, kernel)
 # The corrosion treatment connects the ID Numbers
 erode = cv.erode(binary_img, kernel, iterations=10)
 cv.imshow('Eroded image', erode)
 cv.waitKey(0)

 cut_img = Extract(erode, binary_img.copy())
 cv.imshow("cut_img", cut_img)
 cv.waitKey(0)

 # 存儲最終分割的輪廓
 contours = Segmentation(cut_img, kernel, 18)
 # 對圖像進行分割并排序
 img_num = sort(contours, cut_img)

 # 識別用的模板
 tplt_path = '/home/image/Pictures/template.jpg'
 tplt_img = cv.imread(tplt_path, 0)
 #cv.imshow('Template image', tplt_img)
 #cv.waitKey(0)

 ret, binary_tplt = cv.threshold(tplt_img, 127, 255, cv.THRESH_BINARY)
 cv.imshow('Binary template image', binary_tplt)
 cv.waitKey(0)

 # 與身份證相同的分割方式
 contours = Segmentation(binary_tplt, kernel, 11)
 tplt_num = sort(contours, binary_tplt)
 # 最終識別出的身份證號碼
 IDnum = MatchImage(img_num, tplt_num)
 print('\nID_Number is:', IDnum)
 # 圖片展示
 display(IDnum, cut_img)

效果展示:

到此這篇關(guān)于Python+Opencv身份證號碼區(qū)域提取及識別實現(xiàn)的文章就介紹到這了,更多相關(guān)Python+Opencv身份證號碼區(qū)域提取及識別內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 詳解python的變量緩存機制

    詳解python的變量緩存機制

    這篇文章主要介紹了python的變量緩存機制,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-01-01
  • python統(tǒng)計函數(shù)庫scipy.stats的用法解析

    python統(tǒng)計函數(shù)庫scipy.stats的用法解析

    今天小編就為大家分享一篇python統(tǒng)計函數(shù)庫scipy.stats的用法解析,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-02-02
  • python如何利用cv2.rectangle()繪制矩形框

    python如何利用cv2.rectangle()繪制矩形框

    cv2.rectangle這個函數(shù)的作用是在圖像上繪制一個簡單的矩形,下面這篇文章主要給大家介紹了關(guān)于python如何利用cv2.rectangle()繪制矩形框的相關(guān)資料,文中通過示例代碼介紹的非常詳細,需要的朋友可以參考下
    2022-12-12
  • 解決Python print 輸出文本顯示 gbk 編碼錯誤問題

    解決Python print 輸出文本顯示 gbk 編碼錯誤問題

    這篇文章主要介紹了解決Python print 輸出文本顯示 gbk 編碼錯誤問題,本文給出了三種解決方法,需要的朋友可以參考下
    2018-07-07
  • Python實現(xiàn)將Excel轉(zhuǎn)換為json的方法示例

    Python實現(xiàn)將Excel轉(zhuǎn)換為json的方法示例

    這篇文章主要介紹了Python實現(xiàn)將Excel轉(zhuǎn)換為json的方法,涉及Python文件讀寫及格式轉(zhuǎn)換相關(guān)操作技巧,需要的朋友可以參考下
    2017-08-08
  • Python實現(xiàn)自動運行代碼的方法詳解

    Python實現(xiàn)自動運行代碼的方法詳解

    在軟件開發(fā)和數(shù)據(jù)科學(xué)領(lǐng)域,自動運行代碼是提高效率和確保一致性的關(guān)鍵,本文將深入探討如何使用Python實現(xiàn)自動運行代碼的各種方法,希望對大家有所幫助
    2023-12-12
  • 使用pycharm生成代碼模板的實例

    使用pycharm生成代碼模板的實例

    今天小編就為大家分享一篇使用pycharm生成代碼模板的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-05-05
  • python實現(xiàn)從本地攝像頭和網(wǎng)絡(luò)攝像頭截取圖片功能

    python實現(xiàn)從本地攝像頭和網(wǎng)絡(luò)攝像頭截取圖片功能

    這篇文章主要介紹了python實現(xiàn)從本地攝像頭和網(wǎng)絡(luò)攝像頭截取圖片功能 ,文中給大家提到了python , opencv 打開網(wǎng)絡(luò)攝像頭讀取圖像的實現(xiàn)代碼,需要的朋友可以參考下
    2019-07-07
  • Python制作圣誕樹和圣誕樹詞云

    Python制作圣誕樹和圣誕樹詞云

    本文主要介紹了利用Python制作三種不同形狀的圣誕樹和圣誕樹詞云,文中的示例代碼講解詳細,對我們學(xué)習(xí)Python有一定的幫助,快跟隨小編一起學(xué)習(xí)吧
    2021-12-12
  • 用Python編寫腳本使IE實現(xiàn)代理上網(wǎng)的教程

    用Python編寫腳本使IE實現(xiàn)代理上網(wǎng)的教程

    這篇文章主要介紹了用Python編寫腳本使IE實現(xiàn)代理上網(wǎng)的教程,“著名的”goagent代理也是基于同樣原理實現(xiàn),需要的朋友可以參考下
    2015-04-04

最新評論