欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

一文學(xué)會(huì)使用OpenCV構(gòu)建文檔掃描儀

 更新時(shí)間:2022年11月03日 10:31:06   作者:woshicver  
本文將使用 OpenCV,創(chuàng)建一個(gè)簡(jiǎn)單的文檔掃描儀,就像常用的攝像頭掃描儀應(yīng)用程序一樣,這篇文章主要給大家介紹了關(guān)于使用OpenCV構(gòu)建文檔掃描儀的相關(guān)資料,需要的朋友可以參考下

介紹

在本文中,我們將使用 OpenCV 庫(kù)來(lái)開發(fā) Python 文檔掃描器。

OpenCV 的簡(jiǎn)要概述: OpenCV 是一個(gè)開源庫(kù),用于各種計(jì)算機(jī)語(yǔ)言的圖像處理,包括 Python、C++ 等。它可用于檢測(cè)照片(例如使用人臉檢測(cè)系統(tǒng)的人臉) 。

要了解更多關(guān)于 OpenCV 的信息,你可以在此處參考他們的官方文檔:https://pypi.org/project/opencv-python/

我們的軟件應(yīng)該能夠正確對(duì)齊文檔,檢測(cè)捕獲圖像的邊界,提升文檔的質(zhì)量,并最終提供更好的圖像作為輸出。本質(zhì)上,我們將輸入一個(gè)文檔,即用相機(jī)拍攝的未經(jīng)編輯的圖像。OpenCV 將處理該圖像。

a467315da3dd1a6882e5c83a6ddaf721.png

我們的基本工作流程是:

  • 形態(tài)學(xué)運(yùn)算

  • 邊緣和輪廓檢測(cè)

  • 識(shí)別角點(diǎn)

  • 轉(zhuǎn)變視角

執(zhí)行形態(tài)學(xué)操作

形態(tài)學(xué):是一系列圖像處理程序和算法,根據(jù)圖像的高度和寬度來(lái)處理圖片。最重要的是它們的大小,而不是它們的相對(duì)像素值排序。

kernel = np.ones((5,5),np.uint8)
img = cv2.morphologyEx(img, cv2.MORPH_CLOSE, kernel, iterations= 3)

我們可以使用morphologyEx() 函數(shù)執(zhí)行操作。Morphology 中的“close”操作與Erosion相同,在此之前是Dilation過(guò)程。

ced8defcc550a98af5e83c5b337adbaa.jpeg

我們將創(chuàng)建一個(gè)空白文檔,因?yàn)樵谔幚磉吘墪r(shí)圖片里的內(nèi)容會(huì)妨礙你,我們不想冒險(xiǎn)刪除它們。

從捕獲的圖像中刪除背景

照片中非我們拍攝對(duì)象的部分也必須刪除。與裁剪圖像類似,我們將只專注于維護(hù)圖像所需的部分??梢允褂肎rabCut庫(kù)。

GrabCut 在接收到輸入圖片及其邊界后,剔除邊界外的所有元素。

為了利用 GrabCut 來(lái)識(shí)別背景,我們還可以為用戶提供手動(dòng)設(shè)置文檔邊框的選項(xiàng)。

不過(guò),目前,GrabCut 將能夠通過(guò)從圖像的每個(gè)角落取 20 個(gè)像素作為背景來(lái)自動(dòng)識(shí)別前景。

mask = np.zeros(img.shape[:2],np.uint8)
bgdModel = np.zeros((1,65),np.float64)
fgdModel = np.zeros((1,65),np.float64)
rect = (20,20,img.shape[1]-20,img.shape[0]-20)
cv2.grabCut(img,mask,rect,bgdModel,fgdModel,5,cv2.GC_INIT_WITH_RECT)
mask2 = np.where((mask==2)|(mask==0),0,1).astype('uint8')
img = img*mask2[:,:,np.newaxis]

這里的“rect”變量表示我們?cè)敢夥蛛x的邊界。你可能會(huì)遇到部分背景進(jìn)入線條內(nèi)部的情況,但這是可以接受的。我們的目標(biāo)是對(duì)象的任何部分都不應(yīng)超出邊界。

9406bf755b210f0709cbb75a9ded98f5.png

邊緣和輪廓檢測(cè)

我們目前擁有一份與原始文件大小相同的空白文件。同樣,我們將進(jìn)行邊緣檢測(cè)。我們將為此使用Canny函數(shù)。

為了清理文檔的噪聲,我們還使用了高斯模糊。

(注意:Canny 函數(shù)僅適用于灰度圖像,因此如果圖像尚不存在,則將圖像轉(zhuǎn)換為灰度)。

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray = cv2.GaussianBlur(gray, (11, 11), 0)
# Edge Detection.
canny = cv2.Canny(gray, 0, 200)
canny = cv2.dilate(canny, cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (5, 5)))

我們?cè)谧詈笠恍蟹糯罅藞D像。

在此之后,我們可以繼續(xù)進(jìn)行輪廓檢測(cè):

我們只會(huì)記錄最大的輪廓并在一個(gè)新的空白文檔上進(jìn)行交互。

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray = cv2.GaussianBlur(gray, (11, 11), 0)
# Edge Detection.
canny = cv2.Canny(gray, 0, 200)
canny = cv2.dilate(canny, cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (5, 5)))

482b0adb55f787b82543be306330d182.png

識(shí)別角點(diǎn)

我們將使用已經(jīng)注意到的四個(gè)角對(duì)齊紙張。使用“ Douglas-Peucker ”方法和approxPolyDp()函數(shù)。

con = np.zeros_like(img)
# Loop over the contours.
for c in page:
  # Approximate the contour.
  epsilon = 0.02 * cv2.arcLength(c, True)
  corners = cv2.approxPolyDP(c, epsilon, True)
  # If our approximated contour has four points
  if len(corners) == 4:
      break
cv2.drawContours(con, c, -1, (0, 255, 255), 3)
cv2.drawContours(con, corners, -1, (0, 255, 0), 10)
corners = sorted(np.concatenate(corners).tolist())
for index, c in enumerate(corners):
  character = chr(65 + index)
  cv2.putText(con, character, tuple(c), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 1, cv2.LINE_AA)

d019e613c11f668b9b4466c1e746b807.png

標(biāo)準(zhǔn)化四點(diǎn)定位

def order_points(pts):
    rect = np.zeros((4, 2), dtype='float32')
    pts = np.array(pts)
    s = pts.sum(axis=1)
    rect[0] = pts[np.argmin(s)]
    rect[2] = pts[np.argmax(s)]
    diff = np.diff(pts, axis=1)
    rect[1] = pts[np.argmin(diff)]
    rect[3] = pts[np.argmax(diff)]
    return rect.astype('int').tolist()

尋找目的地坐標(biāo):

最后一組坐標(biāo)可以改變圖像的視角。如果從通常的視角以一定角度拍攝,這將很有幫助。

(tl, tr, br, bl) = pts
# Finding the maximum width.
widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))
widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))
maxWidth = max(int(widthA), int(widthB))
# Finding the maximum height.    
heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))
heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))
maxHeight = max(int(heightA), int(heightB))
# Final destination co-ordinates.
destination_corners = [[0, 0], [maxWidth, 0], [maxWidth, maxHeight], [0, maxHeight]]

透視變換

源照片的坐標(biāo)現(xiàn)在必須與我們事先發(fā)現(xiàn)的目標(biāo)坐標(biāo)對(duì)齊。完成此階段后,圖像看起來(lái)就像是從紙張的正上方拍攝的一樣。

# Getting the homography.
M = cv2.getPerspectiveTransform(np.float32(corners), np.float32(destination_corners))
final = cv2.warpPerspective(orig_img, M, (destination_corners[2][0], destination_corners[2][1]), flags=cv2.INTER_LINEAR)

現(xiàn)在很明顯,以一定角度拍攝的圖像現(xiàn)在已經(jīng)被完美地掃描出來(lái)了。

測(cè)試觀察

已經(jīng)在許多不同方向的照片上測(cè)試了這些代碼,你也可以這樣做。在每個(gè)樣例上,它都表現(xiàn)出色。

即使圖像的背景是白色(即類似于頁(yè)面本身顏色的顏色),GrabCut 也有效且清晰地定義了邊界線。

結(jié)論

本教程教我們?nèi)绾问褂?OpenCV 快速輕松地創(chuàng)建文檔掃描儀。

總結(jié):

上傳圖片后,執(zhí)行了:

生成與原始文件高度和寬度相同的空白文檔的形態(tài)學(xué)操作

從圖像中刪除了背景。

檢測(cè)到圖像中的輪廓和邊界。

檢測(cè)到的圖像角點(diǎn),以矩形的形式

變換圖像的透視圖(如果有)

此文檔掃描儀的一些限制: 即使文檔的一部分在捕獲時(shí)位于邊界框架之外,該項(xiàng)目也應(yīng)正常運(yùn)行。但它也會(huì)導(dǎo)致不準(zhǔn)確的透視變換。

廣泛使用的文檔掃描儀應(yīng)用程序采用了幾種深度學(xué)習(xí)算法,因?yàn)樗鼈兊慕Y(jié)果更加徹底和準(zhǔn)確。

到此這篇關(guān)于使用OpenCV構(gòu)建文檔掃描儀的文章就介紹到這了,更多相關(guān)OpenCV構(gòu)建文檔掃描儀內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 節(jié)日快樂(lè)! Python畫一棵圣誕樹送給你

    節(jié)日快樂(lè)! Python畫一棵圣誕樹送給你

    節(jié)日快樂(lè)!這篇文章主要介紹了如何使用Python畫一棵圣誕樹,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2019-12-12
  • Python 監(jiān)測(cè)文件是否更新的方法

    Python 監(jiān)測(cè)文件是否更新的方法

    今天小編就為大家分享一篇Python 監(jiān)測(cè)文件是否更新的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-06-06
  • 基于python實(shí)現(xiàn)百度語(yǔ)音識(shí)別和圖靈對(duì)話

    基于python實(shí)現(xiàn)百度語(yǔ)音識(shí)別和圖靈對(duì)話

    這篇文章主要介紹了基于python實(shí)現(xiàn)百度語(yǔ)音識(shí)別和圖靈對(duì)話,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-11-11
  • Python sqlite3查詢操作過(guò)程解析

    Python sqlite3查詢操作過(guò)程解析

    這篇文章主要介紹了Python sqlite3查詢操作過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-02-02
  • tensorflow實(shí)現(xiàn)邏輯回歸模型

    tensorflow實(shí)現(xiàn)邏輯回歸模型

    這篇文章主要為大家詳細(xì)介紹了tensorflow實(shí)現(xiàn)邏輯回歸模型的相關(guān)資料,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-09-09
  • 快速解決pandas.read_csv()亂碼的問(wèn)題

    快速解決pandas.read_csv()亂碼的問(wèn)題

    今天小編就為大家分享一篇快速解決pandas.read_csv()亂碼的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-06-06
  • 詳解Python中的join()函數(shù)的用法

    詳解Python中的join()函數(shù)的用法

    這篇文章主要介紹了詳解Python中的join()函數(shù)的用法,join()函數(shù)主要用來(lái)拼接字符串,是Python學(xué)習(xí)當(dāng)中的基礎(chǔ)知識(shí),需要的朋友可以參考下
    2015-04-04
  • django中row語(yǔ)法詳解

    django中row語(yǔ)法詳解

    在Django模板中,使用{{ row }}語(yǔ)法可以輸出列表row的所有元素,但是如果你想要輸出列表中的某個(gè)元素,需要使用下標(biāo)來(lái)訪問(wèn)它,這篇文章主要介紹了django中row語(yǔ)法詳解,需要的朋友可以參考下
    2023-06-06
  • Django單元測(cè)試的具體使用

    Django單元測(cè)試的具體使用

    Django提供了一套強(qiáng)大的測(cè)試工具來(lái)幫助開發(fā)者編寫和運(yùn)行單元測(cè)試,本文就來(lái)介紹一下Django中的單元測(cè)試,包括測(cè)試原理、編寫測(cè)試用例和運(yùn)行測(cè)試,感興趣的可以了解一下
    2023-11-11
  • 使用Python批量壓縮tif文件操作步驟

    使用Python批量壓縮tif文件操作步驟

    Tif文件是柵格數(shù)據(jù)最常用的一種格式。圖像數(shù)據(jù)區(qū)以位圖的方式進(jìn)行數(shù)據(jù)的表示。因此Tif文件可以進(jìn)行壓縮,常用的壓縮方式有LZW、RAW、RLE、CCITT等
    2021-09-09

最新評(píng)論