如何利用Python 進(jìn)行邊緣檢測
為何檢測邊緣?
我們首先應(yīng)該了解的問題是:“為什么要費(fèi)盡心思去做邊緣檢測?”除了它的效果很酷外,為什么邊緣檢測還是一種實(shí)用的技術(shù)?為了更好地解答這個(gè)問題,請仔細(xì)思考并對比下面的風(fēng)車圖片和它的“僅含邊緣的圖”:
可以看到,左邊的原始圖像有著各種各樣的色彩、陰影,而右邊的“僅含邊緣的圖”是黑白的。如果有人問,哪一張圖片需要更多的存儲(chǔ)空間,你肯定會(huì)告訴他原始圖像會(huì)占用更多空間。這就是邊緣檢測的意義:通過對圖片進(jìn)行邊緣檢測,丟棄大多數(shù)的細(xì)節(jié),從而得到“更輕量化”的圖片。
因此,在無須保存圖像的所有復(fù)雜細(xì)節(jié),而 “只關(guān)心圖像的整體形狀” 的情況下,邊緣檢測會(huì)非常有用。
如何進(jìn)行邊緣檢測 —— 數(shù)學(xué)
在討論代碼實(shí)現(xiàn)前,讓我們先快速瀏覽一下邊緣檢測背后的數(shù)學(xué)原理。作為人類,我們非常擅長識(shí)別圖像中的“邊”,那如何讓計(jì)算機(jī)做到同樣的事呢?
首先,假設(shè)有一張很簡單的圖片,在白色背景上有一個(gè)黑色的正方形:
在這個(gè)例子中,由于處理的是黑白圖片,因此我們可以考慮將圖中的每個(gè)像素的值都用 0(黑色) 或 1(白色) 來表示。除了黑白圖片,同樣的理論也完全適用于彩色圖像。
現(xiàn)在,我們需要判斷上圖中綠色高亮的像素是不是這個(gè)圖像邊緣的一部分。作為人類,我們當(dāng)然可以認(rèn)出它是圖像的邊緣;但如何讓計(jì)算機(jī)利用相鄰的像素來得到同樣的結(jié)果呢?
我們以綠色高亮的像素為中心,設(shè)定一個(gè) 3 x 3 像素大小的小框,在圖中以紅色示意。接著,對這個(gè)小方框“應(yīng)用”一個(gè)過濾器(filter):
上圖展示了我們將要“應(yīng)用”的過濾器。乍一看上去很神秘,讓我們仔細(xì)研究它做的事情:當(dāng)我們說 “將過濾器應(yīng)用于一小塊局部像素塊” 時(shí),具體是指紅色框中的每個(gè)像素與過濾器中與之位置對應(yīng)的像素進(jìn)行相乘。因此,紅色框中左上角像素值為 1,而過濾器中左上角像素值為 -1,它們相乘得到 -1,這也就是結(jié)果圖中左上角像素顯示的值。結(jié)果圖中的每個(gè)像素都是用這種方式得到的。
下一步是對過濾結(jié)果中的所有像素值求和,得到 -4。請注意,-4 其實(shí)是我們應(yīng)用這個(gè)過濾器可獲得的“最小”值(因?yàn)樵紙D片中的像素值只能在 0 到 1 之間)。因此,當(dāng)獲得 -4 這個(gè)最小值的時(shí)候,我們就能知道,對應(yīng)的像素點(diǎn)是圖像中正方形頂部豎直方向邊緣的一部分。
為了更好地掌握這種變換,我們可以看看將此過濾器應(yīng)用于圖中正方形底邊上的一個(gè)像素會(huì)發(fā)生什么:
可以看到,我們得到了與前文相似的結(jié)果,相加之后得到的結(jié)果是 4,這是應(yīng)用此過濾器能得到的最大值。因此,由于我們得到了 4 這一最大值,可以知道這個(gè)像素是圖像中正方形底部豎直方向邊緣的一部分。
為了把這些值映射到 0-1 的范圍內(nèi),我們可以簡單地給其加上 4 再除以 8,這樣就能把 -4 映射成 0(黑色),把 4 映射成 1(白色)。因此,我們將這種過濾器稱為縱向 Sobel 過濾器,可以用它輕松檢測圖像中垂直方向的邊緣。
那如何檢測水平方向的邊緣呢?只需簡單地將縱向過濾器進(jìn)行轉(zhuǎn)置(按照其數(shù)值矩陣的對角線進(jìn)行翻轉(zhuǎn))就能得到一個(gè)新的過濾器,可以用于檢測水平方向的邊緣。
如果需要同時(shí)檢測水平方向、垂直方向以及介于兩者之間的邊緣,我們可以把縱向過濾器得分和橫向過濾器得分進(jìn)行結(jié)合,這個(gè)步驟在后面的代碼中將有所體現(xiàn)。
希望上文已經(jīng)講清楚了這些理論!下面看一看代碼是如何實(shí)現(xiàn)的。
如何進(jìn)行邊緣檢測 —— 代碼
首先進(jìn)行一些設(shè)置:
%matplotlib inline import numpy as np import matplotlib.pyplot as plt # 定義縱向過濾器 vertical_filter = [[-1,-2,-1], [0,0,0], [1,2,1]] # 定義橫向過濾器 horizontal_filter = [[-1,0,1], [-2,0,2], [-1,0,1]] # 讀取紙風(fēng)車的示例圖片“pinwheel.jpg” img = plt.imread('pinwheel.jpg') # 得到圖片的維數(shù) n,m,d = img.shape # 初始化邊緣圖像 edges_img = img.copy()
你可以把代碼中的“pinwheel.jpg”替換成其它你想要找出邊緣的圖片文件!需要確保此文件和代碼在同一工作目錄中。
接著編寫邊緣檢測代碼本身:
%matplotlib inline import numpy as np import matplotlib.pyplot as plt # 定義縱向過濾器 vertical_filter = [[-1,-2,-1], [0,0,0], [1,2,1]] # 定義橫向過濾器 horizontal_filter = [[-1,0,1], [-2,0,2], [-1,0,1]] # 讀取紙風(fēng)車的示例圖片“pinwheel.jpg” img = plt.imread('pinwheel.jpg') # 得到圖片的維數(shù) n,m,d = img.shape # 初始化邊緣圖像 edges_img = img.copy() # 循環(huán)遍歷圖片的全部像素 for row in range(3, n-2): for col in range(3, m-2): # 在當(dāng)前位置創(chuàng)建一個(gè) 3x3 的小方框 local_pixels = img[row-1:row+2, col-1:col+2, 0] # 應(yīng)用縱向過濾器 vertical_transformed_pixels = vertical_filter*local_pixels # 計(jì)算縱向邊緣得分 vertical_score = vertical_transformed_pixels.sum()/4 # 應(yīng)用橫向過濾器 horizontal_transformed_pixels = horizontal_filter*local_pixels # 計(jì)算橫向邊緣得分 horizontal_score = horizontal_transformed_pixels.sum()/4 # 將縱向得分與橫向得分結(jié)合,得到此像素總的邊緣得分 edge_score = (vertical_score**2 + horizontal_score**2)**.5 # 將邊緣得分插入邊緣圖像中 edges_img[row, col] = [edge_score]*3 # 對邊緣圖像中的得分值歸一化,防止得分超出 0-1 的范圍 edges_img = edges_img/edges_img.max()
有幾點(diǎn)需要注意:
在圖片的邊界像素上,我們無法創(chuàng)建完整的 3 x 3 小方框,因此在圖片的四周會(huì)有一個(gè)細(xì)邊框。
既然是同時(shí)檢測水平方向和垂直方向的邊緣,我們可以直接將原始的縱向得分與橫向得分分別除以 4(而不像前文描述的分別加 4 再除以 8)。這個(gè)改動(dòng)無傷大雅,反而可以更好地突出圖像的邊緣。
將縱向得分與橫向得分結(jié)合起來時(shí),有可能會(huì)導(dǎo)致最終的邊緣得分超出 0-1 的范圍,因此最后還需要重新對最終得分進(jìn)行標(biāo)準(zhǔn)化。
在更復(fù)雜的圖片上運(yùn)行上述代碼:
得到邊緣檢測的結(jié)果:
以上就是本文的全部內(nèi)容了!希望你了解到了一點(diǎn)新知識(shí)
到此這篇關(guān)于如何利用Python 進(jìn)行邊緣檢測的文章就介紹到這了,更多相關(guān)python 邊緣檢測內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python腳本實(shí)現(xiàn)datax全量同步mysql到hive
這篇文章主要和大家分享一下mysql全量同步到hive自動(dòng)生成json文件的python腳本,文中的示例代碼講解詳細(xì),有需要的小伙伴可以參加一下2024-10-10python自動(dòng)導(dǎo)入包的實(shí)現(xiàn)
本文主要介紹了python自動(dòng)導(dǎo)入包的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-04-04python 2.7 檢測一個(gè)網(wǎng)頁是否能正常訪問的方法
今天小編就為大家分享一篇python 2.7 檢測一個(gè)網(wǎng)頁是否能正常訪問的方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-12-12python光學(xué)仿真通過菲涅耳公式實(shí)現(xiàn)波動(dòng)模型
這篇文章主要介紹了python光學(xué)仿真通過菲涅耳公式實(shí)現(xiàn)波動(dòng)模型的示例解析原理,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2021-10-10python將dict中的unicode打印成中文實(shí)例
這篇文章主要介紹了python將dict中的unicode打印成中文實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05Python?獲取指定開頭指定結(jié)尾所夾中間內(nèi)容(推薦)
獲取文章中指定開頭、指定結(jié)尾中所夾的內(nèi)容。其中,開頭和結(jié)尾均有多種,但最多也就十幾種,所以代碼還是具有可行性的,今天小編給大家介紹通過Python?獲取指定開頭指定結(jié)尾所夾中間內(nèi)容,感興趣的朋友一起看看吧2023-02-02命令行運(yùn)行Python腳本時(shí)傳入?yún)?shù)的三種方式詳解
這篇文章主要介紹了命令行運(yùn)行Python腳本時(shí)傳入?yún)?shù)的三種方式詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-10-10