OpenCV(python)版實現(xiàn)文本分割之水平投影法
對于如下一張圖片,如何將文本區(qū)域分割成一行一行的了?

在文本分割領域中有一種很優(yōu)秀的算法:投影法,包括水平投影法和垂直投影法。本文主要講述水平投影法,水平投影法可以理解為一束光線從圖像的左側向右邊進行照射,每一條光線可以理解為圖像的一行,計算每一行上圖像的黑色像素點,從而可以對圖像進行分割。
import numpy as np
import cv2
def get_vvList(list_data):
#取出list中像素存在的區(qū)間
vv_list=list()
v_list=list()
for index,i in enumerate(list_data):
if i>0:
v_list.append(index)
else:
if v_list:
vv_list.append(v_list)
#list的clear與[]有區(qū)別
v_list=[]
return vv_list
if __name__=='__main__':
img_bgr=cv2.imread('./testImg/1.png',1)
if not img_bgr is None:
img=img_bgr.copy()
img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
#二值化
t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY)
'''
水平投影從左向右投射,計算每一行的黑色像素總數(shù)
'''
rows,cols=binary.shape
hor_list=[0]*rows
for i in range(rows):
for j in range(cols):
#統(tǒng)計每一行的黑色像素總數(shù)
if binary.item(i,j)==0:
hor_list[i]=hor_list[i]+1
'''
對hor_list中的元素進行篩選,可以去除一些噪點
'''
hor_arr=np.array(hor_list)
hor_arr[np.where(hor_arr<5)]=0
hor_list=hor_arr.tolist()
#繪制水平投影
img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255
for i in range(rows):
pt1=(cols-1,i)
pt2=(cols-1-hor_list[i],i)
cv2.line(img_white,pt1,pt2,(0,),1)
cv2.imshow('水平投影',img_white)
cv2.waitKey(0)
#取出各個文字區(qū)間
vv_list=get_vvList(hor_list)
for i in vv_list:
img_hor=img_bgr[i[0]:i[-1],:,:]
cv2.imshow('文本行',img_hor)
cv2.waitKey(0)
運行上述代碼,可以看到水平投影的效果。

根據(jù)投影法的特征,可以很容易就將上述文本分割成文本行,如下圖所示:

到此這篇關于OpenCV(python)版實現(xiàn)文本分割之水平投影法的文章就介紹到這了,更多相關OpenCV水平投影 內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
探索Python庫coconut輕松地編寫函數(shù)式代碼實例
本文將介紹Python Coconut的基本概念、語法特性和實際應用,同時提供豐富的示例代碼,以幫助大家更好地理解和應用這個強大的工具2024-01-01
pyinstaller打包python3.6和PyQt5中各種錯誤的解決方案匯總
pyinstaller是打包python很方便的一個套件,我們可以很輕易地使用他,下面這篇文章主要給大家介紹了關于pyinstaller打包python3.6和PyQt5中各種錯誤解決的相關資料,需要的朋友可以參考下2022-08-08
Python連接MySQL并使用fetchall()方法過濾特殊字符
這篇文章主要介紹了Python連接MySQL的方法并講解了如何使用fetchall()方法過濾特殊字符,示例環(huán)境為Ubuntu操作系統(tǒng),需要的朋友可以參考下2016-03-03
Python制作數(shù)據(jù)預測集成工具(值得收藏)
這篇文章主要介紹了Python如何制作數(shù)據(jù)預測集成工具,幫助大家進行大數(shù)據(jù)預測,感興趣的朋友可以了解下2020-08-08

