基于OpenCV(python)的實(shí)現(xiàn)文本分割之垂直投影法
在我的上一篇博客中講述了水平投影法取出文本行圖像的實(shí)現(xiàn),在這里將用垂直投影法對(duì)文本行的每個(gè)字符進(jìn)行分割。下圖是用水平投影法切割的文本行:
文本分割的原理如下,先用水平投影取出單一文本行,接著使用垂直投影法達(dá)到對(duì)單個(gè)字符進(jìn)行分割。
代碼如下:
import numpy as np import cv2 def get_vvList(list_data): #取出list中像素存在的區(qū)間 vv_list=list() v_list=list() for index,i in enumerate(list_data): if i>0: v_list.append(index) else: if v_list: vv_list.append(v_list) #list的clear與[]有區(qū)別 v_list=[] return vv_list if __name__=='__main__': img_bgr=cv2.imread('./testImg/2.png',1) if not img_bgr is None: img=img_bgr.copy() img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) #二值化 t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY) ''' 垂直投影為從上往下投射,統(tǒng)計(jì)每一列的黑色像素總數(shù) ''' rows,cols=binary.shape ver_list=[0]*cols for j in range(cols): for i in range(rows): if binary.item(i,j)==0: ver_list[j]=ver_list[j]+1 ''' 對(duì)ver_list中的元素進(jìn)行篩選,可以去除一些噪點(diǎn) ''' ver_arr=np.array(ver_list) ver_arr[np.where(ver_arr<1)]=0 ver_list=ver_arr.tolist() #繪制垂直投影 img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255 for j in range(cols): pt1=(j,rows-1) pt2=(j,rows-1-ver_list[j]) cv2.line(img_white,pt1,pt2,(0,),1) cv2.imshow('垂直投影',img_white) cv2.waitKey(0) #切割單一字符 vv_list=get_vvList(ver_list) for i in vv_list: img_ver=img_bgr[:,i[0]:i[-1]] cv2.imshow('單一字符',img_ver) cv2.waitKey(0)
運(yùn)行程序,垂直投影圖像如下圖所示:
分割的單一字符如下圖:
單個(gè)數(shù)字已經(jīng)正確分割出來(lái)了。
到此這篇關(guān)于基于OpenCV(python)的實(shí)現(xiàn)文本分割之垂直投影法的文章就介紹到這了,更多相關(guān)OpenCV垂直投影 內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
pandas把所有大于0的數(shù)設(shè)置為1的方法
今天小編就為大家分享一篇pandas把所有大于0的數(shù)設(shè)置為1的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01python3.6 實(shí)現(xiàn)AES加密的示例(pyCryptodome)
本篇文章主要介紹了python3.6 實(shí)現(xiàn)AES加密的示例(pyCryptodome),小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2018-01-01Python利用臨時(shí)文件實(shí)現(xiàn)數(shù)據(jù)的保存
tempfile模塊專(zhuān)門(mén)用于創(chuàng)建臨時(shí)文件和臨時(shí)目錄,它既可以在?UNIX?平臺(tái)上運(yùn)行良好,也可以在?Windows?平臺(tái)上運(yùn)行良好。本文將利用tempfile模塊創(chuàng)建臨時(shí)文件來(lái)保存數(shù)據(jù),感興趣的可以了解一下2022-07-07Django實(shí)現(xiàn)單用戶(hù)登錄的方法示例
這篇文章主要介紹了Django實(shí)現(xiàn)單用戶(hù)登錄的方法示例,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2019-03-03Python3使用pandas模塊讀寫(xiě)excel操作示例
這篇文章主要介紹了Python3使用pandas模塊讀寫(xiě)excel操作,簡(jiǎn)單講述了pandas的功能、并結(jié)合實(shí)例形式分析了Python3使用pandas模塊進(jìn)行Excel文件的讀取與寫(xiě)入相關(guān)操作技巧,需要的朋友可以參考下2018-07-07Pytorch對(duì)Himmelblau函數(shù)的優(yōu)化詳解
今天小編就為大家分享一篇Pytorch對(duì)Himmelblau函數(shù)的優(yōu)化詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02編寫(xiě)自定義的Django模板加載器的簡(jiǎn)單示例
這篇文章主要介紹了編寫(xiě)自定義的Django模板加載器的簡(jiǎn)單示例,Django是各色人氣Python框架中最為著名的一個(gè),需要的朋友可以參考下2015-07-07python爬蟲(chóng)開(kāi)發(fā)之PyQuery模塊詳細(xì)使用方法與實(shí)例全解
這篇文章主要介紹了python爬蟲(chóng)開(kāi)發(fā)之PyQuery模塊詳細(xì)使用方法與實(shí)例全解,需要的朋友可以參考下2020-03-03