快捷導(dǎo)航

C++使用OpenCV進(jìn)行物體識別與檢測的三種方法

更新時間：2025年04月03日 08:46:02 作者：威哥說編程

物體識別與檢測是計算機視覺中的核心任務(wù)之一,它被廣泛應(yīng)用于自動駕駛、安防監(jiān)控、圖像分析等領(lǐng)域,通過物體檢測技術(shù),計算機能夠從圖像中識別出特定的物體或目標(biāo),本文將介紹如何使用 C++ 和 OpenCV 庫進(jìn)行物體識別與檢測,需要的朋友可以參考下

1. OpenCV 環(huán)境配置回顧

在進(jìn)行物體識別與檢測之前，需要先確保安裝并配置好 OpenCV 庫。如果你還沒有配置 OpenCV，可以參考以下步驟：

安裝 OpenCV：你可以通過官網(wǎng)下載安裝包，或者使用 vcpkg 或 conan 等包管理工具來安裝 OpenCV。
配置 IDE：確保 IDE（如 Visual Studio 或 CLion）正確設(shè)置了 OpenCV 的路徑，包含頭文件路徑和庫文件路徑。

2. Haar 特征分類器

Haar 特征分類器是一種基于機器學(xué)習(xí)的物體檢測方法，最早用于人臉檢測。OpenCV 提供了預(yù)訓(xùn)練的 Haar 分類器模型，可以快速進(jìn)行人臉、眼睛、行人等物體的檢測。

人臉檢測

OpenCV 提供了多個預(yù)訓(xùn)練的分類器，如 haarcascade_frontalface_default.xml 用于人臉檢測。我們可以直接加載這個分類器進(jìn)行人臉檢測。

#include <opencv2/opencv.hpp>
using namespace cv;
 
int main() {
    // 讀取輸入圖像
    Mat image = imread("people.jpg");
 
    if (image.empty()) {
        std::cout << "Error loading image!" << std::endl;
        return -1;
    }
 
    // 將圖像轉(zhuǎn)換為灰度圖
    Mat grayImage;
    cvtColor(image, grayImage, COLOR_BGR2GRAY);
 
    // 加載預(yù)訓(xùn)練的人臉分類器
    CascadeClassifier faceCascade;
    if (!faceCascade.load("haarcascade_frontalface_default.xml")) {
        std::cout << "Error loading cascade file!" << std::endl;
        return -1;
    }
 
    // 檢測人臉
    std::vector<Rect> faces;
    faceCascade.detectMultiScale(grayImage, faces);
 
    // 繪制矩形框標(biāo)記人臉
    for (size_t i = 0; i < faces.size(); i++) {
        rectangle(image, faces[i], Scalar(0, 255, 0), 2);
    }
 
    // 顯示檢測結(jié)果
    imshow("Detected Faces", image);
    waitKey(0);
 
    return 0;
}

CascadeClassifier::load() 方法用于加載預(yù)訓(xùn)練的 Haar 分類器文件。
detectMultiScale() 方法用于檢測圖像中的人臉，返回值是一個 Rect 向量，包含檢測到的人臉矩形區(qū)域。
rectangle() 方法用來在圖像上繪制矩形框。

其他分類器

OpenCV 提供了多種 Haar 分類器，用于檢測眼睛、上半身、下半身等物體。例如：

CascadeClassifier eyeCascade;
eyeCascade.load("haarcascade_eye.xml");
eyeCascade.detectMultiScale(grayImage, eyes);

3. HOG 特征與行人檢測

HOG（Histogram of Oriented Gradients）特征是另一種常用于物體檢測的技術(shù)，特別適用于行人檢測。OpenCV 中提供了一個 HOGDescriptor 類，用于提取 HOG 特征，并結(jié)合支持向量機（SVM）進(jìn)行行人檢測。

行人檢測

#include <opencv2/opencv.hpp>
#include <opencv2/objdetect.hpp>
using namespace cv;
 
int main() {
    // 讀取輸入圖像
    Mat image = imread("people.jpg");
 
    if (image.empty()) {
        std::cout << "Error loading image!" << std::endl;
        return -1;
    }
 
    // 創(chuàng)建 HOG 描述符
    HOGDescriptor hog;
    hog.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector());
 
    // 檢測圖像中的行人
    std::vector<Rect> foundLocations;
    hog.detectMultiScale(image, foundLocations);
 
    // 在圖像中繪制檢測到的行人位置
    for (size_t i = 0; i < foundLocations.size(); i++) {
        rectangle(image, foundLocations[i], Scalar(0, 255, 0), 2);
    }
 
    // 顯示檢測結(jié)果
    imshow("Detected People", image);
    waitKey(0);
 
    return 0;
}

HOGDescriptor 是用于提取 HOG 特征的 OpenCV 類，detectMultiScale() 方法用來進(jìn)行行人檢測。
getDefaultPeopleDetector() 是一個預(yù)訓(xùn)練的行人檢測器。

4. 基于深度學(xué)習(xí)的物體檢測

除了傳統(tǒng)的機器學(xué)習(xí)方法，基于深度學(xué)習(xí)的物體檢測已經(jīng)成為主流。OpenCV 支持通過深度學(xué)習(xí)框架（如 Caffe、TensorFlow、ONNX）加載并使用預(yù)訓(xùn)練的深度學(xué)習(xí)模型進(jìn)行物體檢測。

使用預(yù)訓(xùn)練模型進(jìn)行物體檢測

以 YOLO（You Only Look Once）為例，YOLO 是一個非常流行的實時物體檢測模型，它能夠同時檢測圖像中的多個物體并返回類別與位置。OpenCV 支持加載和使用 YOLO 模型進(jìn)行物體檢測。

下載 YOLO 模型：
- 下載 YOLOv3 權(quán)重文件（yolov3.weights）和配置文件（yolov3.cfg）。
- 下載 COCO 類別文件（coco.names）。
使用 YOLO 模型進(jìn)行物體檢測：

#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
using namespace cv;
using namespace cv::dnn;
 
int main() {
    // 加載 YOLO 模型
    Net net = readNet("yolov3.weights", "yolov3.cfg");
    std::vector<String> outNames = net.getUnconnectedOutLayersNames();
 
    // 加載類別名稱
    std::ifstream ifs("coco.names");
    std::vector<std::string> classes;
    std::string line;
    while (getline(ifs, line)) {
        classes.push_back(line);
    }
 
    // 讀取輸入圖像
    Mat image = imread("image.jpg");
 
    // 轉(zhuǎn)換圖像為 YOLO 輸入格式
    Mat blob = blobFromImage(image, 1 / 255.0, Size(416, 416), Scalar(), true, false);
 
    // 設(shè)置網(wǎng)絡(luò)輸入
    net.setInput(blob);
 
    // 獲取 YOLO 輸出
    std::vector<Mat> outs;
    net.forward(outs, outNames);
 
    // 處理輸出
    for (size_t i = 0; i < outs.size(); i++) {
        Mat detectionMat = outs[i];
        for (int j = 0; j < detectionMat.rows; j++) {
            // 提取檢測框信息（置信度、類標(biāo)簽、邊界框）
            float confidence = detectionMat.at<float>(j, 4);
            if (confidence > 0.5) {  // 只顯示置信度大于 0.5 的檢測結(jié)果
                int classId = -1;
                float maxClassConf = -1;
                for (int k = 5; k < detectionMat.cols; k++) {
                    if (detectionMat.at<float>(j, k) > maxClassConf) {
                        maxClassConf = detectionMat.at<float>(j, k);
                        classId = k - 5;
                    }
                }
 
                // 計算邊界框
                int x = int(detectionMat.at<float>(j, 0) * image.cols);
                int y = int(detectionMat.at<float>(j, 1) * image.rows);
                int width = int(detectionMat.at<float>(j, 2) * image.cols);
                int height = int(detectionMat.at<float>(j, 3) * image.rows);
 
                // 繪制邊界框
                rectangle(image, Rect(x, y, width, height), Scalar(0, 255, 0), 2);
                putText(image, classes[classId], Point(x, y - 5), FONT_HERSHEY_SIMPLEX, 1, Scalar(0, 255, 0), 2);
            }
        }
    }
 
    // 顯示檢測結(jié)果
    imshow("YOLO Object Detection", image);
    waitKey(0);
 
    return 0;
}