欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python OpenCV機器學(xué)習(xí)之圖像識別詳解

 更新時間:2022年01月26日 15:32:50   作者:一個熱愛學(xué)習(xí)的深度渣渣  
OpenCV中也提供了一些機器學(xué)習(xí)的方法,例如DNN等。本文將為大家詳細介紹一下OpenCV中利用機器學(xué)習(xí)實現(xiàn)的一些圖片識別功能:人臉識別、車牌識別等,感興趣的可以了解一下

背景

OpenCV中也提供了一些機器學(xué)習(xí)的方法,例如DNN;本篇將簡單介紹一下機器學(xué)習(xí)的一些應(yīng)用,對比傳統(tǒng)和前沿的算法,能從其中看出優(yōu)劣;

一、人臉識別

主要有以下兩種實現(xiàn)方法:

1、哈爾(Haar)級聯(lián)法:專門解決人臉識別而推出的傳統(tǒng)算法;

實現(xiàn)步驟:

創(chuàng)建Haar級聯(lián)器;

導(dǎo)入圖片并將其灰度化;

調(diào)用函數(shù)接口進行人臉識別;

函數(shù)原型:

detectMultiScale(img,scaleFactor,minNeighbors)

scaleFactor:縮放尺寸;

minNeighbors:最小像素值;

代碼案例:

# 創(chuàng)建Haar級聯(lián)器
facer = cv2.CascadeClassifier('./haarcascades/haarcascade_frontalface_default.xml')
# 導(dǎo)入人臉圖片并灰度化
img = cv2.imread('p3.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 調(diào)用接口
faces = facer.detectMultiScale(gray, 1.1, 5)

for (x,y,w,h) in faces:
? ? cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)

cv2.imshow('img', img)
cv2.waitKey()

結(jié)論:Haar級聯(lián)法對于完整臉部的檢測效果還是不錯的,但對于不完整臉部識別效果差,這可能也是傳統(tǒng)算法的一個缺陷所在,泛化能力比較差;

拓展:Haar級聯(lián)器還可以對臉部中細節(jié)特征進行識別

代碼如下:

# 創(chuàng)建Haar級聯(lián)器
facer = cv2.CascadeClassifier('./haarcascades/haarcascade_frontalface_default.xml')
eyer = cv2.CascadeClassifier('./haarcascades/haarcascade_eye.xml')
# 導(dǎo)入人臉圖片并灰度化
img = cv2.imread('p3.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 調(diào)用接口
faces = facer.detectMultiScale(gray, 1.1, 5)
i = 0
for (x,y,w,h) in faces:
? ? cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)
? ? ROI_img = img[y:y+h, x:x+w]
? ? eyes = eyer.detectMultiScale(ROI_img, 1.1, 5)
? ? for (x,y,w,h) in eyes:
? ? ? ? cv2.rectangle(ROI_img, (x,y), (x+w, y+h), (0,255,0), 2)
? ? i += 1
? ? name = 'img'+str(i)
? ? cv2.imshow(name, ROI_img)
cv2.waitKey()

總結(jié):Haar級聯(lián)器提供了多種臉部屬性的識別,眼睛鼻子嘴巴都可以,但效果不一定那么準確;

二、車牌識別

結(jié)構(gòu):Haar+Tesseract車牌識別;

說明:Haar級聯(lián)器僅用于定位車牌的位置,Tesseract用于提取其中的內(nèi)容;

實現(xiàn)步驟:

1、Haar級聯(lián)器定位車牌位置;

2、車牌預(yù)處理操作(二值化、形態(tài)學(xué)、濾波去噪、縮放);

3、調(diào)用Tesseract進行文字識別;

注意:這里需要預(yù)先安裝Tesseract;

代碼案例:

import pytesseract
# 創(chuàng)建Haar級聯(lián)器
carer = cv2.CascadeClassifier('./haarcascades/haarcascade_russian_plate_number.xml')
# 導(dǎo)入人臉圖片并灰度化
img = cv2.imread('chinacar.jpeg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 調(diào)用接口?
cars = carer.detectMultiScale(gray, 1.1, 3)
for (x,y,w,h) in cars:
? ? cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)
# 提取ROI
roi = gray[y:y+h, x:x+w]
# 二值化
ret, roi_bin = cv2.threshold(roi, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# 文字識別
pytesseract.pytesseract.tesseract_cmd = r"D:\Tesseract_OCR\tesseract.exe"
text = pytesseract.image_to_string(roi, lang='chi_sim+eng',config='--psm 8 --oem 3')
print(text)
cv2.putText(img, text, (20,100), cv2.FONT_HERSHEY_SIMPLEX, 2, (0,0,255), 3)
cv2.imshow('img', img)
cv2.waitKey()

結(jié)論:車牌的位置檢測比較準確,但Tesseract的識別并不那么準確,可能用ORC識別會準確一些;當(dāng)然識別的準確率也和圖像處理后比較模糊有關(guān),做一些處理能夠提升文字的識別率;

三、DNN圖像分類

DNN為深度神經(jīng)網(wǎng)絡(luò),并且是全連接的形式;

注意:OpenCV能夠使用DNN模型,但并不能訓(xùn)練;

DNN使用步驟:

讀取模型,得到網(wǎng)絡(luò)結(jié)構(gòu);

讀取數(shù)據(jù)(圖片或視頻)

將圖片轉(zhuǎn)成張量,送入網(wǎng)絡(luò);

模型輸出結(jié)果;

函數(shù)原型:

導(dǎo)入模型:readNet(model,[config])

圖像轉(zhuǎn)張量:blobFromImage(image,scalefactor,size,mean,swapRB,crop)

送入網(wǎng)絡(luò):net.setInput(blob)

模型推理:net.forward()

代碼案例:

# 導(dǎo)入模型
config = "./model/bvlc_googlenet.prototxt"
model = "./model/bvlc_googlenet.caffemodel"
net = dnn.readNetFromCaffe(config, model)

# 加載圖片,轉(zhuǎn)成張量
img = cv2.imread('./smallcat.jpeg')
blob = dnn.blobFromImage(img, 1.0, (224,224), (104,117,123))

# 模型推理
net.setInput(blob)
r = net.forward()
idxs = np.argsort(r[0])[::-1][:5]

# 分類結(jié)果展示
path = './model/synset_words.txt'
with open(path, 'rt') as f:
? ? classes = [x[x.find(" ")+1:]for x in f]
for (i, idx) in enumerate(idxs):
# 將結(jié)果展示在圖像上
? ? if i == 0:
? ? ? ? text = "Label: {}, {:.2f}%".format(classes[idx],
? ? ? ? ? ? r[0][idx] * 100)
? ? ? ? cv2.putText(img, text, (5, 25), ?cv2.FONT_HERSHEY_SIMPLEX,
? ? ? ? ? ? 0.7, (0, 0, 255), 2)
# 顯示圖像
cv2.imshow("Image", img)
cv2.waitKey(0)

結(jié)論:實際上有了模型之后,推理的步驟并不復(fù)雜,難點在于前處理與后處理;往往圖像的處理上的錯誤,或者是對結(jié)果的處理問題,會導(dǎo)致結(jié)果不符,這是需要特別注意的;

到此這篇關(guān)于Python OpenCV機器學(xué)習(xí)之圖像識別詳解的文章就介紹到這了,更多相關(guān)OpenCV 圖像識別內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python3.x讀寫文件及BOM處理詳解

    python3.x讀寫文件及BOM處理詳解

    這篇文章主要為大家詳細介紹了python3.x讀寫文件及BOM處理的相關(guān)知識,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2024-01-01
  • pandas?實現(xiàn)?in?和?not?in?的用法及使用心得

    pandas?實現(xiàn)?in?和?not?in?的用法及使用心得

    pandas按條件篩選數(shù)據(jù)時,除了使用query()方法,還可以使用isin和對isin取反進行條件篩選,今天通過本文給大家介紹pandas?實現(xiàn)?in?和?not?in?的用法及使用心得,感興趣的朋友跟隨小編一起看看吧
    2023-01-01
  • opencv 圖像禮帽和圖像黑帽的實現(xiàn)

    opencv 圖像禮帽和圖像黑帽的實現(xiàn)

    這篇文章主要介紹了opencv 圖像禮帽和圖像黑帽的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-07-07
  • 樹莓派中python獲取GY-85九軸模塊信息示例

    樹莓派中python獲取GY-85九軸模塊信息示例

    本文內(nèi)容是樹莓派中python獲取GY-85九軸模塊信息的示例,這里使用Python的curses包開發(fā)cli窗口程序,用來實時刷新傳感器的讀數(shù),下面看代碼
    2013-12-12
  • flask與數(shù)據(jù)庫的交互操作示例

    flask與數(shù)據(jù)庫的交互操作示例

    這篇文章主要為大家介紹了flask與數(shù)據(jù)庫的交互操作示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-08-08
  • Python繪制簡單散點圖的方法

    Python繪制簡單散點圖的方法

    這篇文章主要為大家詳細介紹了Python繪制簡單散點圖的方法,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-04-04
  • Python + OpenCV 實現(xiàn)LBP特征提取的示例代碼

    Python + OpenCV 實現(xiàn)LBP特征提取的示例代碼

    這篇文章主要介紹了Python + OpenCV 實現(xiàn)LBP特征提取的示例代碼,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • 如何查看python中安裝庫的文件位置

    如何查看python中安裝庫的文件位置

    這篇文章主要介紹了查看python中安裝庫的文件位置的方法,python自帶標(biāo)準庫位置在安裝環(huán)境的lib文件夾下的.py文件都是,在環(huán)境的lib文件夾中,本文給大家詳細講解需要的朋友可以參考下
    2022-11-11
  • VSCode基礎(chǔ)使用與VSCode調(diào)試python程序入門的圖文教程

    VSCode基礎(chǔ)使用與VSCode調(diào)試python程序入門的圖文教程

    這篇文章主要介紹了VSCode基礎(chǔ)使用+VSCode調(diào)試python程序入門圖文教程,本文通過圖文并茂的形式給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-03-03
  • ​如何愉快地遷移到 Python 3

    ​如何愉快地遷移到 Python 3

    如今 Python 成為機器學(xué)習(xí)和大量使用數(shù)據(jù)操作的科學(xué)領(lǐng)域的主流語言; 它擁有各種深度學(xué)習(xí)框架和完善的數(shù)據(jù)處理和可視化工具。這篇文章主要介紹了遷移到 Python 3的方法,需要的朋友可以參考下
    2019-04-04

最新評論