OpenCV(python)版實(shí)現(xiàn)文本分割之水平投影法
對(duì)于如下一張圖片,如何將文本區(qū)域分割成一行一行的了?
在文本分割領(lǐng)域中有一種很優(yōu)秀的算法:投影法,包括水平投影法和垂直投影法。本文主要講述水平投影法,水平投影法可以理解為一束光線從圖像的左側(cè)向右邊進(jìn)行照射,每一條光線可以理解為圖像的一行,計(jì)算每一行上圖像的黑色像素點(diǎn),從而可以對(duì)圖像進(jìn)行分割。
import numpy as np import cv2 def get_vvList(list_data): #取出list中像素存在的區(qū)間 vv_list=list() v_list=list() for index,i in enumerate(list_data): if i>0: v_list.append(index) else: if v_list: vv_list.append(v_list) #list的clear與[]有區(qū)別 v_list=[] return vv_list if __name__=='__main__': img_bgr=cv2.imread('./testImg/1.png',1) if not img_bgr is None: img=img_bgr.copy() img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) #二值化 t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY) ''' 水平投影從左向右投射,計(jì)算每一行的黑色像素總數(shù) ''' rows,cols=binary.shape hor_list=[0]*rows for i in range(rows): for j in range(cols): #統(tǒng)計(jì)每一行的黑色像素總數(shù) if binary.item(i,j)==0: hor_list[i]=hor_list[i]+1 ''' 對(duì)hor_list中的元素進(jìn)行篩選,可以去除一些噪點(diǎn) ''' hor_arr=np.array(hor_list) hor_arr[np.where(hor_arr<5)]=0 hor_list=hor_arr.tolist() #繪制水平投影 img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255 for i in range(rows): pt1=(cols-1,i) pt2=(cols-1-hor_list[i],i) cv2.line(img_white,pt1,pt2,(0,),1) cv2.imshow('水平投影',img_white) cv2.waitKey(0) #取出各個(gè)文字區(qū)間 vv_list=get_vvList(hor_list) for i in vv_list: img_hor=img_bgr[i[0]:i[-1],:,:] cv2.imshow('文本行',img_hor) cv2.waitKey(0)
運(yùn)行上述代碼,可以看到水平投影的效果。
根據(jù)投影法的特征,可以很容易就將上述文本分割成文本行,如下圖所示:
到此這篇關(guān)于OpenCV(python)版實(shí)現(xiàn)文本分割之水平投影法的文章就介紹到這了,更多相關(guān)OpenCV水平投影 內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python光學(xué)仿真學(xué)習(xí)Gauss高斯光束在空間中的分布
這篇文章主要介紹了Python光學(xué)仿真學(xué)習(xí)中Gauss高斯光束在空間中的分布理解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2021-10-10探索Python庫(kù)coconut輕松地編寫函數(shù)式代碼實(shí)例
本文將介紹Python Coconut的基本概念、語(yǔ)法特性和實(shí)際應(yīng)用,同時(shí)提供豐富的示例代碼,以幫助大家更好地理解和應(yīng)用這個(gè)強(qiáng)大的工具2024-01-01pyinstaller打包python3.6和PyQt5中各種錯(cuò)誤的解決方案匯總
pyinstaller是打包python很方便的一個(gè)套件,我們可以很輕易地使用他,下面這篇文章主要給大家介紹了關(guān)于pyinstaller打包python3.6和PyQt5中各種錯(cuò)誤解決的相關(guān)資料,需要的朋友可以參考下2022-08-08Python連接MySQL并使用fetchall()方法過(guò)濾特殊字符
這篇文章主要介紹了Python連接MySQL的方法并講解了如何使用fetchall()方法過(guò)濾特殊字符,示例環(huán)境為Ubuntu操作系統(tǒng),需要的朋友可以參考下2016-03-03Python制作數(shù)據(jù)預(yù)測(cè)集成工具(值得收藏)
這篇文章主要介紹了Python如何制作數(shù)據(jù)預(yù)測(cè)集成工具,幫助大家進(jìn)行大數(shù)據(jù)預(yù)測(cè),感興趣的朋友可以了解下2020-08-08