OpenCV實(shí)戰(zhàn)記錄之基于分水嶺算法的圖像分割
0. 前言
分水嶺變換是一種流行的圖像處理算法,用于快速將圖像分割成同質(zhì)區(qū)域。分水嶺變換主要基于以下思想:當(dāng)圖像被視為拓?fù)涓〉駮r(shí),均質(zhì)區(qū)域?qū)?yīng)于相對(duì)平坦且由陡峭的邊緣界定的盆地。算法的原始版本傾向于過(guò)度分割圖像,從而產(chǎn)生多個(gè)小區(qū)域,因此 OpenCV
中實(shí)現(xiàn)了該算法的改進(jìn)版本,通過(guò)使用一組預(yù)定義的標(biāo)記來(lái)指導(dǎo)圖像分割區(qū)域的定義。
1. 分水嶺算法
分水嶺分割可以通過(guò)使用 cv::watershed
函數(shù)實(shí)現(xiàn),函數(shù)的輸入是一個(gè) 32
位有符號(hào)整數(shù)標(biāo)記圖像,其中每個(gè)非零像素表示一個(gè)標(biāo)簽。
通過(guò)標(biāo)記圖像中已知屬于給定區(qū)域的一些像素,利用初始標(biāo)記,分水嶺算法可以確定其他像素所屬的區(qū)域。
(1) 首先,將標(biāo)記圖像讀取為灰度圖像,然后將其轉(zhuǎn)換為整數(shù)類型:
class WatershedSegmentater { private: cv::Mat markers; public: void setMarkers(const cv::Mat& markerImage) { // 轉(zhuǎn)換數(shù)據(jù)類型 markerImage.convertTo(markers, CV_32S); } cv::Mat process(const cv::Mat& image) { // 應(yīng)用分水嶺算法 cv::watershed(image, markers); return markers; }
有多種獲取標(biāo)記的方式,例如,使用預(yù)處理步驟識(shí)別出屬于感興趣對(duì)象的某些像素,然后利用分水嶺算法根據(jù)初始標(biāo)記分割完整的對(duì)象。在本節(jié)中,我們將使用二值圖像來(lái)識(shí)別相應(yīng)原始圖像中的動(dòng)物。因此,從二值圖像中,我們需要識(shí)別屬于前景(動(dòng)物)的像素和屬于背景(主要是雪地)的像素,我們用標(biāo)簽 255
標(biāo)記前景像素,用標(biāo)簽 128
標(biāo)記背景像素,其他像素則標(biāo)記為 0
。
(2) 初始二值圖像包含過(guò)多屬于圖像各個(gè)部分的白色像素,為了只保留屬于重要對(duì)象的像素,我們首先需要腐蝕該圖像:
// 消除噪音 cv::Mat fg; cv::erode(binary, fg, cv::Mat(), cv::Point(-1, -1), 4);
結(jié)果如下圖所示:
(3) 圖中仍然存在一些屬于背景(雪地)的像素,我們通過(guò)對(duì)原始二值圖像進(jìn)行膨脹來(lái)選擇幾個(gè)屬于背景的像素:
// 標(biāo)記圖像像素 cv::Mat bg; cv::dilate(binary, bg, cv::Mat(), cv::Point(-1, -1), 4); cv::threshold(bg, bg, 1, 128, cv::THRESH_BINARY_INV);
結(jié)果如下圖所示,黑色像素對(duì)應(yīng)于背景像素:
(4) 將這些圖像組合起來(lái)形成標(biāo)記圖像:
cv::Mat markers(binary.size(), CV_8U, cv::Scalar(0)); markers = fg+bg;
我們使用重載的 +
運(yùn)算符來(lái)組合圖像,得到用作分水嶺算法的輸入:
(5) 在這個(gè)輸入圖像中,白色區(qū)域?qū)儆谇熬皩?duì)象,灰色區(qū)域是背景的一部分,黑色區(qū)域則屬于未知標(biāo)簽,得到分割結(jié)果如下:
// 創(chuàng)建分水嶺分割對(duì)象 WatershedSegmentater segmenter; segmenter.setMarkers(markers); segmenter.process(image);
更新標(biāo)記圖像,以便為黑色區(qū)域中的像素重新分配標(biāo)簽,而屬于邊界的像素的值為 -1
。結(jié)果標(biāo)簽圖像如下:
圖像中對(duì)象邊緣的可視化結(jié)果如下圖所示:
2. 分水嶺算法直觀理解
我們使用拓?fù)鋱D進(jìn)行類比,為了創(chuàng)建分水嶺分割,我們從級(jí)別 0
開始注水,隨著水位逐漸增加,就形成了集水盆地。這些盆地的大小也會(huì)逐漸增加,兩個(gè)不同盆地的水最終會(huì)匯合,發(fā)生這種情況時(shí),會(huì)創(chuàng)建一個(gè)分水嶺,以將兩個(gè)盆地分開。一旦水位達(dá)到最高水位,這些水域和分水嶺就形成了分水嶺分割。
在注水過(guò)程中最初會(huì)產(chǎn)生許多小盆地,當(dāng)這些盆地進(jìn)行合并時(shí),會(huì)創(chuàng)建許多分水嶺線,從而導(dǎo)致圖像被過(guò)度分割。為了克服這個(gè)問(wèn)題,已經(jīng)提出了多種改進(jìn)算法,在 OpenCV
調(diào)用 cv::watershed
函數(shù)時(shí),注水過(guò)程從一組預(yù)定義的標(biāo)記像素開始,根據(jù)分配給初始標(biāo)記的值對(duì)盆地進(jìn)行標(biāo)記,當(dāng)具有相同標(biāo)簽的兩個(gè)盆地合并時(shí),不會(huì)創(chuàng)建分水嶺,從而防止過(guò)度分割,更新輸入標(biāo)記圖像以獲得最終的分水嶺分割。用戶可以輸入帶有任意數(shù)量的標(biāo)簽和未知標(biāo)簽的標(biāo)記圖像,標(biāo)記圖像的像素類型為為 32
位有符號(hào)整數(shù),以便能夠定義超過(guò) 255
個(gè)標(biāo)簽。cv::watershed
函數(shù)還允許返回與分水嶺關(guān)聯(lián)的像素(使用特殊值 -1
進(jìn)行標(biāo)記)。
為了便于顯示結(jié)果,我們引入兩種特殊的方法。第一個(gè)方法 getSegmentation()
通過(guò)閾值返回標(biāo)簽圖像,分水嶺值為 0
:
// 返回結(jié)果 cv::Mat getSegmentation() { cv::Mat tmp; markers.convertTo(tmp, CV_8U); return tmp; }
第二種方法 getWatersheds()
返回的圖像中,分水嶺線使用值 0
進(jìn)行標(biāo)記,圖像的其余部分像素值為 255
,可以使用 cv::convertTo
方法實(shí)現(xiàn):
// 返回分水嶺 cv::Mat getWatersheds() { cv::Mat tmp; markers.convertTo(tmp,CV_8U,255,255); return tmp; }
在轉(zhuǎn)換之前應(yīng)用線性變換,可以將像素值 -1
轉(zhuǎn)換為 0
( − 1 × 255 + 255 = 0 -1\times 255+255=0 −1×255+255=0)。由于將有符號(hào)整數(shù)轉(zhuǎn)換為無(wú)符號(hào)字符時(shí)需應(yīng)用飽和操作,大于 255
的像素值將轉(zhuǎn)換為 255
。
我們也可以通過(guò)許多不同的方式獲得標(biāo)記圖像。例如,可以令用戶以交互方式在圖像中標(biāo)記屬于對(duì)象和背景的像素區(qū)域;或者,如果我們需要識(shí)別位于圖像中心的物體,可以輸入一個(gè)中心區(qū)域標(biāo)有特定標(biāo)簽的圖像,且圖像背景標(biāo)記帶有另一個(gè)標(biāo)簽,可以按以下方式創(chuàng)建標(biāo)記圖像:
// 標(biāo)記背景像素 cv::Mat imageMask(image.size(), CV_8U, cv::Scalar(0)); cv::rectangle(imageMask, cv::Point(5, 5), cv::Point(image.cols-5, image.rows-5), cv::Scalar(255), 3); // 標(biāo)記前景像素 cv::rectangle(imageMask, cv::Point(image.cols/2-10, image.rows/2-10), cv::Point(image.cols/2+10, image.rows/2+10), cv::Scalar(1), 10);
如果我們將此標(biāo)記圖像疊加在測(cè)試圖像上,可以得到以下圖像:
生成的分水嶺圖像如下圖所示:
3. 完整代碼
頭文件 (watershedSegmentation.h
) 完整代碼如下:
#if !defined WATERSHS #define WATERSHS #include <opencv2/core/core.hpp> #include <opencv2/imgproc/imgproc.hpp> class WatershedSegmentater { private: cv::Mat markers; public: void setMarkers(const cv::Mat& markerImage) { // 轉(zhuǎn)換數(shù)據(jù)類型 markerImage.convertTo(markers, CV_32S); } cv::Mat process(const cv::Mat& image) { // 應(yīng)用分水嶺算法 cv::watershed(image, markers); return markers; } // 返回結(jié)果 cv::Mat getSegmentation() { cv::Mat tmp; markers.convertTo(tmp, CV_8U); return tmp; } // 返回分水嶺 cv::Mat getWatersheds() { cv::Mat tmp; markers.convertTo(tmp,CV_8U,255,255); return tmp; } }; #endif
主文件 (segment.cpp
) 完整代碼如下所示:
#include <iostream> #include <opencv2/core/core.hpp> #include <opencv2/highgui/highgui.hpp> #include <opencv2/imgproc/imgproc.hpp> #include "watershedSegmentation.h" int main() { // 讀取輸入圖像 cv::Mat image = cv::imread("1.png"); if (!image.data) return 0; cv::namedWindow("Original Image"); cv::imshow("Original Image",image); // 讀取二值圖像 cv::Mat binary; binary = cv::imread("binary.png", 0); cv::namedWindow("Binary Image"); cv::imshow("Binary Image", binary); // 消除噪音 cv::Mat fg; cv::erode(binary, fg, cv::Mat(), cv::Point(-1, -1), 4); cv::namedWindow("Foreground Image"); cv::imshow("Foreground Image", fg); // 標(biāo)記圖像像素 cv::Mat bg; cv::dilate(binary, bg, cv::Mat(), cv::Point(-1, -1), 4); cv::threshold(bg, bg, 1, 128, cv::THRESH_BINARY_INV); cv::namedWindow("Background Image"); cv::imshow("Background Image", bg); cv::Mat markers(binary.size(), CV_8U, cv::Scalar(0)); markers = fg+bg; cv::namedWindow("Markers"); cv::imshow("Markers", markers); // 創(chuàng)建分水嶺分割對(duì)象 WatershedSegmentater segmenter; segmenter.setMarkers(markers); segmenter.process(image); cv::namedWindow("Segmentation"); cv::imshow("Segmentation", segmenter.getSegmentation()); cv::namedWindow("Watersheds"); cv::imshow("Watersheds", segmenter.getWatersheds()); // 打開另一張圖像 image = cv::imread("3.png"); // 標(biāo)記背景像素 cv::Mat imageMask(image.size(), CV_8U, cv::Scalar(0)); cv::rectangle(imageMask, cv::Point(5, 5), cv::Point(image.cols-5, image.rows-5), cv::Scalar(255), 3); // 標(biāo)記前景像素 cv::rectangle(imageMask, cv::Point(image.cols/2-10, image.rows/2-10), cv::Point(image.cols/2+10, image.rows/2+10), cv::Scalar(1), 10); segmenter.setMarkers(imageMask); segmenter.process(image); cv::rectangle(image, cv::Point(5, 5), cv::Point(image.cols-5, image.rows-5), cv::Scalar(255, 255, 255), 3); cv::rectangle(image, cv::Point(image.cols/2-10, image.rows/2-10), cv::Point(image.cols/2+10, image.rows/2+10), cv::Scalar(1, 1, 1), 10); cv::namedWindow("Image with marker"); cv::imshow("Image with marker", image); cv::namedWindow("Watershed"); cv::imshow("Watershed", segmenter.getWatersheds()); cv::waitKey(); return 0; }
總結(jié)
到此這篇關(guān)于OpenCV實(shí)戰(zhàn)記錄之基于分水嶺算法的圖像分割的文章就介紹到這了,更多相關(guān)OpenCV分水嶺算法的圖像分割內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python3實(shí)現(xiàn)網(wǎng)頁(yè)版raspberry pi(樹莓派)小車控制
這篇文章主要為大家詳細(xì)介紹了python3實(shí)現(xiàn)網(wǎng)頁(yè)版raspberry pi(樹莓派)小車控制,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-02-02python中使用zip函數(shù)出現(xiàn)<zip object at 0x02A9E418>錯(cuò)誤的原因
這篇文章主要介紹了python中使用zip函數(shù)出現(xiàn)<zip object at 0x02A9E418>錯(cuò)誤的原因分析及解決方法,需要的朋友可以參考下2018-09-09用Python代碼自動(dòng)生成文獻(xiàn)的IEEE引用格式的實(shí)現(xiàn)
這篇文章主要介紹了用Python代碼自動(dòng)生成文獻(xiàn)的IEEE引用格式的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03Python實(shí)現(xiàn)提取語(yǔ)句中的人名
這篇文章主要為大家介紹一個(gè)小工具:可以將語(yǔ)句中的人名提取出來(lái)。文中的示例代碼簡(jiǎn)潔易懂,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2022-01-01Pandas Series如何轉(zhuǎn)換為DataFrame
這篇文章主要介紹了Pandas Series如何轉(zhuǎn)換為DataFrame問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-08-08Python 實(shí)現(xiàn)遙感影像波段組合的示例代碼
這篇文章主要介紹了Python 實(shí)現(xiàn)遙感影像波段組合的示例代碼,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08