快捷導(dǎo)航

c/c++的opencv圖像金字塔縮放實(shí)現(xiàn)

更新時(shí)間：2025年05月31日 09:23:01 作者：whoarethenext

本文主要介紹了c/c++的opencv圖像金字塔縮放實(shí)現(xiàn),通過對(duì)原始圖像進(jìn)行連續(xù)的下采樣或上采樣操作,生成一系列不同分辨率的圖像,具有一定的參考價(jià)值,感興趣的可以了解一下

圖像金字塔是計(jì)算機(jī)視覺中一種重要且基礎(chǔ)的多尺度表示方法。它通過對(duì)原始圖像進(jìn)行連續(xù)的下采樣（縮?。┗蛏喜蓸樱ǚ糯螅┎僮?，生成一系列不同分辨率的圖像。這些圖像按尺寸大小排列，形似金字塔，故此得名。圖像金字塔在諸如特征檢測、圖像分割、目標(biāo)識(shí)別和圖像融合等任務(wù)中扮演著關(guān)鍵角色。

本文將重點(diǎn)介紹如何使用 OpenCV C++ API 中的函數(shù)來實(shí)現(xiàn)圖像金字塔的基本縮放操作：下采樣和上采樣。

圖像金字塔簡介

圖像金字塔通常包含兩種主要類型：

高斯金字塔 (Gaussian Pyramid)：用于圖像的下采樣。在每一層，圖像首先經(jīng)過高斯模糊處理，然后去除偶數(shù)行和偶數(shù)列，從而將圖像尺寸減半。
拉普拉斯金字塔 (Laplacian Pyramid)：用于圖像重建，可以從高斯金字塔中恢復(fù)圖像。它存儲(chǔ)了高斯金字塔中相鄰層之間的差異信息。

本文主要關(guān)注構(gòu)成高斯金字塔基礎(chǔ)的下采樣 (cv::pyrDown) 和其逆操作的上采樣 (cv::pyrUp)。

圖像下采樣 (cv::pyrDown)

cv::pyrDown 函數(shù)用于將輸入圖像的寬度和高度都縮小一半。

函數(shù)原型：

void cv::pyrDown(InputArray src, OutputArray dst, const Size& dstsize = Size(), int borderType = BORDER_DEFAULT);

src: 輸入圖像。
dst: 輸出圖像，其尺寸將是輸入圖像的一半（除非指定了 dstsize）。
dstsize: 可選參數(shù)，指定輸出圖像的尺寸。如果未指定（默認(rèn)），則輸出圖像尺寸計(jì)算為 Size((src.cols+1)/2, (src.rows+1)/2)。通常我們讓其自動(dòng)計(jì)算。
borderType: 像素外推方法，用于處理邊界（一般使用默認(rèn)值）。

工作原理：
cv::pyrDown 的典型實(shí)現(xiàn)步驟如下：

對(duì)輸入圖像應(yīng)用高斯濾波器（通常是 5 × 5 5 \times 55×5 的核）。
對(duì)濾波后的圖像進(jìn)行下采樣，即刪除所有偶數(shù)行和偶數(shù)列。

圖像上采樣 (cv::pyrUp)

cv::pyrUp 函數(shù)用于將輸入圖像的寬度和高度都放大一倍。這個(gè)操作試圖從一個(gè)較低分辨率的圖像重建一個(gè)較高分辨率的圖像，但通常會(huì)伴隨一些模糊，因?yàn)樗鼰o法憑空創(chuàng)造細(xì)節(jié)。

函數(shù)原型：

void cv::pyrUp(InputArray src, OutputArray dst, const Size& dstsize = Size(), int borderType = BORDER_DEFAULT);

src: 輸入圖像。
dst: 輸出圖像，其尺寸將是輸入圖像的兩倍（除非指定了 dstsize）。
dstsize: 可選參數(shù)，指定輸出圖像的尺寸。如果未指定（默認(rèn)），則輸出圖像尺寸計(jì)算為 Size(src.cols*2, src.rows*2)。通常我們讓其自動(dòng)計(jì)算。
borderType: 像素外推方法（一般使用默認(rèn)值）。

工作原理：
cv::pyrUp 的典型實(shí)現(xiàn)步驟如下：

將輸入圖像的尺寸擴(kuò)大兩倍，新增的行和列通常用0填充（或者其他插值方式）。
對(duì)擴(kuò)大后的圖像應(yīng)用高斯濾波器（與 pyrDown 中使用的核類似，但通常乘以4以保持亮度范圍）。這一步是為了平滑由于插入0值而產(chǎn)生的塊狀效應(yīng)。

C++ OpenCV 代碼示例

下面的 C++ 代碼演示了如何加載一張圖像，對(duì)其進(jìn)行下采樣，然后再對(duì)下采樣后的圖像進(jìn)行上采樣，并顯示結(jié)果。

#include <opencv2/imgproc.hpp>
#include <opencv2/highgui.hpp>
#include <iostream>

int main(int argc, char** argv) {
    // 檢查命令行參數(shù)
    if (argc != 2) {
        std::cout << "用法: " << argv[0] << " <圖片路徑>" << std::endl;
        return -1;
    }

    // 1. 加載源圖像
    cv::Mat srcImage = cv::imread(argv[1], cv::IMREAD_COLOR);
    if (srcImage.empty()) {
        std::cerr << "錯(cuò)誤: 無法加載圖像 " << argv[1] << std::endl;
        return -1;
    }
    std::cout << "原始圖像尺寸: " << srcImage.cols << "x" << srcImage.rows << std::endl;

    // 2. 圖像下采樣 (縮小一半)
    cv::Mat downsampledImage;
    cv::pyrDown(srcImage, downsampledImage);
    std::cout << "下采樣后圖像尺寸: " << downsampledImage.cols << "x" << downsampledImage.rows << std::endl;

    // 3. 圖像上采樣 (放大一倍，基于下采樣后的圖像)
    cv::Mat upsampledImage;
    cv::pyrUp(downsampledImage, upsampledImage);
    std::cout << "上采樣后圖像尺寸: " << upsampledImage.cols << "x" << upsampledImage.rows << std::endl;
    
    // 4. 為了比較，我們也可以對(duì)原始圖像直接進(jìn)行一次上采樣
    cv::Mat upsampledOriginalImage;
    cv::pyrUp(srcImage, upsampledOriginalImage);
    std::cout << "原始圖像直接上采樣后尺寸: " << upsampledOriginalImage.cols << "x" << upsampledOriginalImage.rows << std::endl;


    // 5. 顯示圖像
    cv::imshow("原始圖像", srcImage);
    cv::imshow("下采樣圖像 (pyrDown)", downsampledImage);
    cv::imshow("上采樣圖像 (pyrUp on downsampled)", upsampledImage);
    cv::imshow("原始圖像直接上采樣 (pyrUp on original)", upsampledOriginalImage);

    cv::waitKey(0); // 等待按鍵
    cv::destroyAllWindows(); // 關(guān)閉所有窗口

    return 0;
}

代碼解釋

包含頭文件：
- opencv2/imgproc.hpp: 包含了圖像處理函數(shù)，如 pyrDown 和 pyrUp。
- opencv2/highgui.hpp: 包含了圖像的顯示和加載函數(shù)，如 imread, imshow, waitKey。
- iostream: 用于控制臺(tái)輸出。
加載圖像：使用 cv::imread() 從命令行參數(shù)指定的路徑加載圖像。
cv::pyrDown(srcImage, downsampledImage);：對(duì)原始圖像 srcImage 進(jìn)行下采樣，結(jié)果存儲(chǔ)在 downsampledImage 中。輸出圖像的寬高大約是輸入圖像的一半。
cv::pyrUp(downsampledImage, upsampledImage);：對(duì)之前下采樣得到的 downsampledImage 進(jìn)行上采樣，結(jié)果存儲(chǔ)在 upsampledImage 中。輸出圖像的寬高大約是輸入圖像的兩倍。注意，upsampledImage 的尺寸應(yīng)該與 srcImage 的尺寸大致相同（由于整數(shù)除法可能存在1個(gè)像素的差異），但其內(nèi)容會(huì)比原始圖像模糊，因?yàn)橄虏蓸舆^程丟失了信息。
顯示圖像：使用 cv::imshow() 分別顯示原始圖像、下采樣后的圖像以及上采樣后的圖像。cv::waitKey(0) 使程序暫停，直到用戶按下任意鍵。

編譯與運(yùn)行

要編譯以上 C++ 代碼，你需要安裝好 OpenCV，并有一個(gè) C++ 編譯器（如 g++）。

編譯命令示例 (Linux/macOS):

g++ image_pyramid.cpp -o image_pyramid_app `pkg-config --cflags --libs opencv4` -std=c++11

(如果你的 pkg-config 配置的是 opencv 而不是 opencv4，請(qǐng)相應(yīng)修改。-std=c++11 或更高版本均可。)

運(yùn)行命令:

./image_pyramid_app <你的圖片路徑.jpg>

例如：

./image_pyramid_applena.png

應(yīng)用場景 ???

圖像金字塔在許多計(jì)算機(jī)視覺算法中都有廣泛應(yīng)用：

多尺度特征檢測：如 SIFT、SURF 等算法會(huì)在圖像金字塔的不同層上檢測特征，以實(shí)現(xiàn)尺度不變性。
圖像融合：例如，將多張不同曝光的圖像融合成一張高動(dòng)態(tài)范圍 (HDR) 圖像。
目標(biāo)檢測：在不同尺度上搜索目標(biāo)，以適應(yīng)目標(biāo)大小的變化。
圖像分割：先在低分辨率圖像上進(jìn)行粗略分割，然后逐步優(yōu)化到高分辨率。
視頻壓縮和流媒體：根據(jù)帶寬和設(shè)備能力提供不同分辨率的視頻流。

總結(jié)

cv::pyrDown 和 cv::pyrUp 是 OpenCV 中實(shí)現(xiàn)圖像金字塔縮放的基礎(chǔ)操作。它們簡單易用，且是許多高級(jí)圖像處理和計(jì)算機(jī)視覺算法的重要組成部分。通過理解和運(yùn)用這些函數(shù)，開發(fā)者可以有效地處理和分析不同尺度下的圖像信息。

到此這篇關(guān)于c/c++的opencv圖像金字塔縮放實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)opencv圖像金字塔縮放內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: