Python實(shí)現(xiàn)投影法分割圖像示例(二)
在上篇博客中,我們已經(jīng)實(shí)現(xiàn)了水平投影和垂直投影圖的繪制。接下來(lái),我們可以根據(jù)獲得的投影數(shù)據(jù)進(jìn)行圖像的分割,該法用于文本分割較多,所以此處依然以上次的圖為例。
先把上次的兩幅圖搬過(guò)來(lái),方便講解。

上面兩圖分別從垂直和水平方向描述了圖像中文本的分布。我們想象一下,將兩幅圖重疊起來(lái)(當(dāng)然這里比例要調(diào)整下),那么我們就能得到四個(gè)重疊的白塊,而這些白塊所處的位置正是原圖中文本的位置。所以接下來(lái)的任務(wù)就是,找出這些白塊的坐標(biāo),此處白塊近似矩形,所以我們要求矩形的四個(gè)坐標(biāo)。
下面看代碼。
#根據(jù)水平投影值選定行分割點(diǎn)
inline = 1
start = 0
j = 0
for i in range(0,height):
if inline == 1 and z[i] >= 150 : #從空白區(qū)進(jìn)入文字區(qū)
start = i #記錄起始行分割點(diǎn)
print i
inline = 0
elif (i - start > 3) and z[i] < 150 and inline == 0 : #從文字區(qū)進(jìn)入空白區(qū)
inline = 1
hfg[j][0] = start - 2 #保存行分割位置
hfg[j][1] = i + 2
j = j + 1
確定行分割點(diǎn)的原理就是判斷每一行的像素點(diǎn)數(shù)是否足夠。我們可以從水平投影圖中看出,白塊是有文字的地方(原圖是黑字白底,只是畫(huà)投影圖時(shí)選用白塊黑底),即前面幾行,灰度值為0的點(diǎn)的個(gè)數(shù)N很少,所以當(dāng)遇到文字區(qū)時(shí),N會(huì)很大,根據(jù)這一點(diǎn),我們確定進(jìn)入文字區(qū)的坐標(biāo)(A1,B1)。然后,當(dāng)從文字區(qū)出來(lái)時(shí),N又變的很小,我們?cè)儆浵滤淖鴺?biāo)(A1,B2)。同理,我們可以確定列分割點(diǎn)。
incol = 1
start1 = 0
j1 = 0
z1 = hfg[p][0]
z2 = hfg[p][1]
for i1 in range(0,width):
if incol == 1 and v[i1] >= 20 : #從空白區(qū)進(jìn)入文字區(qū)
start1 = i1 #記錄起始列分割點(diǎn)
incol = 0
elif (i1 - start1 > 3) and v[i1] < 20 and incol == 0 : #從文字區(qū)進(jìn)入空白區(qū)
incol = 1
lfg[j1][0] = start1 - 2 #保存列分割位置
lfg[j1][1] = i1 + 2
l1 = start1 - 2
l2 = i1 + 2
j1 = j1 + 1
最后根據(jù)矩形的坐標(biāo)將文本在圖中框出來(lái)。附上完整代碼。
import cv2
import numpy
img = cv2.imread('D:/0.jpg',cv2.COLOR_BGR2GRAY)
height, width = img.shape[:2]
#print height, width
#resized = cv2.resize(img, (2*width,2*height), interpolation=cv2.INTER_CUBIC)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
(_, thresh) = cv2.threshold(gray, 140, 255, cv2.THRESH_BINARY)
#使文字增長(zhǎng)成塊
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (2, 2))#形態(tài)學(xué)處理,定義矩形結(jié)構(gòu)
closed = cv2.erode(thresh, None, iterations = 7)
#cv2.imshow('erode',closed)
height, width = closed.shape[:2]
#print height, width
z = [0]*height
v = [0]*width
hfg = [[0 for col in range(2)] for row in range(height)]
lfg = [[0 for col in range(2)] for row in range(width)]
box = [0,0,0,0]
#水平投影
a = 0
emptyImage1 = numpy.zeros((height, width, 3), numpy.uint8)
for y in range(0, height):
for x in range(0, width):
cp = closed[y,x]
#if np.any(closed[y,x]):
if cp == 0:
a = a + 1
else :
continue
z[y] = a
#print z[y]
a = 0
#根據(jù)水平投影值選定行分割點(diǎn)
inline = 1
start = 0
j = 0
for i in range(0,height):
if inline == 1 and z[i] >= 150 : #從空白區(qū)進(jìn)入文字區(qū)
start = i #記錄起始行分割點(diǎn)
#print i
inline = 0
elif (i - start > 3) and z[i] < 150 and inline == 0 : #從文字區(qū)進(jìn)入空白區(qū)
inline = 1
hfg[j][0] = start - 2 #保存行分割位置
hfg[j][1] = i + 2
j = j + 1
#對(duì)每一行垂直投影、分割
a = 0
for p in range(0, j):
for x in range(0, width):
for y in range(hfg[p][0], hfg[p][1]):
cp1 = closed[y,x]
if cp1 == 0:
a = a + 1
else :
continue
v[x] = a #保存每一列像素值
a = 0
#print width
#垂直分割點(diǎn)
incol = 1
start1 = 0
j1 = 0
z1 = hfg[p][0]
z2 = hfg[p][1]
for i1 in range(0,width):
if incol == 1 and v[i1] >= 20 : #從空白區(qū)進(jìn)入文字區(qū)
start1 = i1 #記錄起始列分割點(diǎn)
incol = 0
elif (i1 - start1 > 3) and v[i1] < 20 and incol == 0 : #從文字區(qū)進(jìn)入空白區(qū)
incol = 1
lfg[j1][0] = start1 - 2 #保存列分割位置
lfg[j1][1] = i1 + 2
l1 = start1 - 2
l2 = i1 + 2
j1 = j1 + 1
cv2.rectangle(img, (l1, z1), (l2, z2), (255,0,0), 2)
cv2.imshow('result', img)
cv2.waitKey(0)
代碼中注釋掉的一些代碼,有的是我做的一些小變動(dòng),有的是觀察中間值。大家可自行查看。
最后放上結(jié)果圖。

由于文本的坐標(biāo)已經(jīng)有了,還可以把這些文本塊截取下來(lái),用一下PIL或者OPENCV就好了,此處就不做了。
以上這篇Python實(shí)現(xiàn)投影法分割圖像示例(二)就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Keras中 ImageDataGenerator函數(shù)的參數(shù)用法
這篇文章主要介紹了Keras中 ImageDataGenerator函數(shù)的參數(shù)用法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-07-07
python項(xiàng)目打包成exe和安裝包的方法步驟
本文主要介紹了python項(xiàng)目打包成exe和安裝包的方法步驟,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2023-03-03
python?實(shí)現(xiàn)dcmtk關(guān)聯(lián)pacs功能推送下拉影像(推薦)
這篇文章主要介紹了python?實(shí)現(xiàn)dcmtk關(guān)聯(lián)pacs功能?推送下拉影像,包含dcmtk關(guān)聯(lián)pacs技術(shù)筆記等相關(guān)知識(shí),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-10-10
python linecache 處理固定格式文本數(shù)據(jù)的方法
今天小編就為大家分享一篇python linecache 處理固定格式文本數(shù)據(jù)的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01
python實(shí)現(xiàn)的多線程端口掃描功能示例
這篇文章主要介紹了python實(shí)現(xiàn)的多線程端口掃描功能,結(jié)合實(shí)例形式分析了Python基于socket的端口掃描具體步驟與相關(guān)操作技巧,需要的朋友可以參考下2017-01-01
Python3 使用map()批量的轉(zhuǎn)換數(shù)據(jù)類(lèi)型,如str轉(zhuǎn)float的實(shí)現(xiàn)
今天小編就為大家分享一篇Python3 使用map()批量的轉(zhuǎn)換數(shù)據(jù)類(lèi)型,如str轉(zhuǎn)float的實(shí)現(xiàn),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-11-11

