Opencv實現(xiàn)傾斜圖片轉正示例
今天是我們來玩一個釘子。通過一個釘子來學習一個opencv中的一個函數(shù),這個函數(shù)我網(wǎng)上也有搜過,不過遺憾的是,各路好手都是寫的是有點不堪入目,現(xiàn)在這個學習氛圍是越來越差了,很多人都直接復制粘貼別人的東西,自己也沒有理解,也沒有辨別是非的能力,所謂的拿來主義有時候真的是要不得的。知其然也要知其所以然。所以你很多時候遇到問題去網(wǎng)上搜索的時候,你會發(fā)現(xiàn)瀏覽器上面一排網(wǎng)頁,好多內容都是相同,甚至是錯的,這樣很不好。
閑話不多說,我們今天通過一個實例來,講解一個網(wǎng)上很多人都沒搞清楚的函數(shù)cv2.minAreaRect()
我們用到圖片
我們要做的事情是將這個釘子轉成水平放心放置,然后摳出釘子的區(qū)域,就像下面這個樣子
實現(xiàn)步驟:
1.灰度化+二值化,效果圖如下
2.找輪廓,cv2.findcounters(),這樣的圖我們肯定會找到很多輪廓,所以我們可以通過面積來篩選出自己想要的那個輪廓,這里我們選擇最大的輪廓,也就是釘子的輪廓,看看效果(紅線就是哦我們找到的輪廓點然后連接起來的)
3.找這個輪廓的最小外接矩形(帶角度),這個就是最關鍵的了,也就是我們開頭提到的cv2.minAreaRect(),我們要對他的返回值了如執(zhí)掌。先看看效果呢(藍線就是我們找到的最小外接矩形)
這個時候你會說,這有什么難的,我們來細細看一下,cv2.minAreaRect()的返回值是什么
box= cv2.minAreaRect(counter) print(box)
我們看看這個返回值是一個元組
((257.3854675292969, 292.03851318359375), (454.5963439941406, 140.96072387695312), 48.21548080444336)
元組的第一個元素是這個最小外接矩形的中心點坐標
元組的第二個元素是也是一個元組,這個元組是最小外接矩形的兩個邊長(注意是兩個邊長,并不是寬高),這個時候你就會問了,這有什么區(qū)別,看上去是沒什么區(qū)別,其實是由返回順序的,有的時候長的那條邊在這個元組的第一個元素位置,有的時候長的那條邊在這個元組的第二個元素位置。不信我在給你看一個返回值
((290.1945495605469, 256.9798889160156), (140.9435577392578, 460.39862060546875), 49.1729850769043)
元組的第三個元素是一個浮點數(shù),這個浮點數(shù)也就是這個外接矩形的角度,那么,這個角度又是哪個邊的與X軸的角度呢?答案是要根據(jù)第二個元組的值長短邊的順序來決定的,這個角度始終是第二元組中第一個元素對應的那條邊和x的夾角。而且這個角度永遠是大于0的。網(wǎng)上有人說是-90-90°,說實話,經(jīng)過測試,我們見到負角度的,那些人可能試都沒試吧。也就是這個角度。
我想我已經(jīng)說明白了
4.根據(jù)得到的中心點和角度以及第二個元組的值的大小就可以開始旋轉了
值得注意的是,opencv中旋轉是逆時針旋轉,所以在旋轉的時候要注意旋轉的角度,看看效果
5.有中心點和兩條邊長的大小,我們就可以開始摳圖了,看看效果
至此Mission accomplished。
我們上代碼吧
# -*- coding: utf-8 -*- # @Time : 2022/7/25 15:51 # @Author : guligedong import cv2 import os import numpy as np base_folder = r'F:\mvtec_anomaly_detection\screw\test\good' for i in os.listdir(base_folder): img_path = os.path.join(base_folder, i) if img_path.split('.')[-1] == 'db': continue print(img_path) img = cv2.imread(img_path) img = cv2.resize(img,(512,512)) img_h,img_w = img.shape[:2] gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) _,bi_img = cv2.threshold(gray_img,127,255,cv2.THRESH_BINARY_INV) counters,_ = cv2.findContours(bi_img,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE) for index,counter in enumerate(counters): if cv2.contourArea(counter) > 10000 : cv2.drawContours(img,counters,index,(0,0,255),1) box= cv2.minAreaRect(counter) print(box) boxs= cv2.boxPoints(box) boxs = np.int0([boxs]) print(boxs) cv2.polylines(img, boxs, isClosed=True, color=(255, 125, 125), thickness=1) cv2.imshow('img', img) # cv2.waitKey() center_x,center_y = int(box[0][0]),int(box[0][1]) lenth1, lenth2 = int(box[1][0]), int(box[1][1]) print(lenth1, lenth2) angle = box[2] print(angle) if lenth1 > lenth2: angle = angle else: angle = -(90 - angle) rotate_matrix = cv2.getRotationMatrix2D(center=(center_x,center_y),angle=angle,scale=1) rotated_image = cv2.warpAffine(src=img, M=rotate_matrix, dsize=(img_w, img_h)) cv2.imshow('Rotated image', rotated_image) y_start = center_y - min(lenth1, lenth2) // 2 if center_y - min(lenth1, lenth2) // 2 > 0 else 0 y_end = center_y + min(lenth1, lenth2) // 2 if center_y + min(lenth1, lenth2) // 2 < img_h else img_h x_start = center_x - max(lenth1, lenth2) // 2 if center_x - max(lenth1, lenth2) // 2 >0 else 0 x_end = center_x + max(lenth1, lenth2) // 2 if center_x + max(lenth1, lenth2) // 2 <img_w else img_w crop_image = rotated_image[y_start:y_end,x_start:x_end] cv2.imshow('crop_image', crop_image) cv2.waitKey()
這個數(shù)據(jù)是mvtec_anomaly_detection數(shù)據(jù)集中的釘子的數(shù)據(jù)集,大家可以網(wǎng)上找資源試一試小效果,關鍵是要自己理解這個邏輯。
到此這篇關于Opencv實現(xiàn)傾斜圖片轉正示例的文章就介紹到這了,更多相關Opencv 傾斜圖片轉正內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Python實現(xiàn)把json格式轉換成文本或sql文件
這篇文章主要介紹了Python實現(xiàn)把json格式轉換成文本或sql文件,本文直接給出代碼實例,需要的朋友可以參考下2015-07-07python數(shù)據(jù)挖掘使用Evidently創(chuàng)建機器學習模型儀表板
在本文中,我們將探索 Evidently 并創(chuàng)建交互式報告/儀表板。有需要的朋友歡迎大家收藏學習,希望能夠有所幫助,祝大家多多進步早日升職加薪2021-11-11