運(yùn)用python去除圖片水印
由于圖片水印的種類(lèi)有很多,今天我們先講最簡(jiǎn)單的一種。
即上圖中的①類(lèi)水印,這種水印存在白色背景上的文檔里,水印是灰色,需要保留的文字是黑色。
這種通常可以進(jìn)行簡(jiǎn)單的亮度/對(duì)比度轉(zhuǎn)換,直到水印消失并降低亮度以進(jìn)行補(bǔ)償[1]。參考別人的方法,我發(fā)現(xiàn)可以用多種方法去除水印。大致原理比較相似,下面先講OpenCV的方法。
OpenCV + Numpy
本方法需要使用的庫(kù):cv2、numpy。cv2是基于OpenCV的圖像處理庫(kù),可以對(duì)圖像進(jìn)行腐蝕,膨脹等操作;Numpy這是一個(gè)強(qiáng)大的處理矩陣和維度運(yùn)算的庫(kù)。
函數(shù)簡(jiǎn)介
介紹一下cv2的三個(gè)基本函數(shù):使用
img = cv2.imread('test.png') cv2.imshow('test.png',img) cv2.waitKey(0) cv2.imwrite('test_2.png', img)
對(duì)于Numpy呢,則要用到np.clip()
,它是一個(gè)截取函數(shù),用于截取數(shù)組中小于或者大于某值的部分,并使得被截取部分等于固定值。
np.clip(a, a_min, a_max, out=None):
具體用法:
可以看到,數(shù)組x中的所有數(shù)限定到范圍0和5之間。為啥要介紹這些函數(shù)呢,接著往下看。
色彩轉(zhuǎn)換
回到本文一開(kāi)始,我們想去除文檔圖片中的水印。
上圖中我選取了三個(gè)點(diǎn),這三個(gè)像素點(diǎn)分別對(duì)應(yīng)背景白色、黑色字體以及灰色的水印。
我們現(xiàn)在要做的事,就是想辦法把水印轉(zhuǎn)換成白色背景。換言之,就是把圖片中[217,217,217]的像素點(diǎn)轉(zhuǎn)換成[255,255,255]。
當(dāng)然這個(gè)[217,217,217]也不是固定的,只是一個(gè)范圍。為了方便調(diào)整,我選取了一些像素點(diǎn),做了一個(gè)線性回歸。
希望把圖片整體的像素顏色做一個(gè)改變,原有黑色字體盡量跟原來(lái)一致,而水印部分則一定要≥255,然后就可以通過(guò)np.clip()
限定區(qū)間,使之都變成[255,255,255]。
說(shuō)干就干
import cv2 import numpy as np img = cv2.imread('test.png') new = np.clip(1.4057577998008846*img-38.33089999653017, 0, 255).astype(np.uint8) cv2.imwrite('removed.png', new)
下面我們看看調(diào)整后的效果(左側(cè)是轉(zhuǎn)換前,右側(cè)是轉(zhuǎn)換后)。
左:轉(zhuǎn)換前 右:轉(zhuǎn)換后
處理效果還是不錯(cuò)的,說(shuō)明對(duì)于這類(lèi)文檔圖片水印,通過(guò)幾行Python代碼就可以輕松去除水印。
不過(guò)通過(guò)線性回歸改變整體圖片顏色,也會(huì)影響原有的黑色文本,導(dǎo)致其顏色發(fā)生了微微變化。
那我們能不能簡(jiǎn)單粗暴一點(diǎn)!只改變水印的顏色呢?
也可以試試。
PIL + itertools
PIL也是一個(gè)Python 圖像處理庫(kù),其中Image模塊是在Python PIL圖像處理中常見(jiàn)的模塊,對(duì)圖像進(jìn)行基礎(chǔ)操作的功能基本都包含于此模塊內(nèi)。
itertools
之前更是被我們稱(chēng)為一個(gè)零差評(píng)的Python內(nèi)置庫(kù)。其中itertools.product
用來(lái)產(chǎn)生多個(gè)列表和迭代器的(積)。
還是跟之前一個(gè)原理,我們希望將圖片中[217,217,217]的像素點(diǎn)轉(zhuǎn)換成[255,255,255]。
那就簡(jiǎn)單粗暴一點(diǎn),也就是像素值相加大概600(217+217+217)以上的像素點(diǎn),都改成[255,255,255]就好了。
from itertools import product from PIL import Image img = Image.open('test.png') width, height = img.size for pos in product(range(width), range(height)): if sum(img.getpixel(pos)[:3]) > 600: img.putpixel(pos, (255,255,255)) img.save('removed_1.png')
運(yùn)行結(jié)果,對(duì)比一下。
左:轉(zhuǎn)換前 右:轉(zhuǎn)換后
與第一種方法對(duì)比,肉眼也沒(méi)看出來(lái)太明顯差別。
那大家就喜歡那種方法就用哪個(gè)吧!
到此這篇關(guān)于運(yùn)用python去除圖片水印的文章就介紹到這了,更多相關(guān)python去除圖片水印內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python使用unittest進(jìn)行有效測(cè)試的示例詳解
這篇文章主要介紹了如何使用?unittest?來(lái)編寫(xiě)和運(yùn)行單元測(cè)試,希望通過(guò)閱讀本文,大家能了解?unittest?的基本使用方法,以及如何使用?unittest?中的斷言方法和測(cè)試用例組織結(jié)構(gòu)2023-06-06python獲取響應(yīng)某個(gè)字段值的3種實(shí)現(xiàn)方法
這篇文章主要介紹了python獲取響應(yīng)某個(gè)字段值的3種實(shí)現(xiàn)方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-04-04django admin管理工具自定義時(shí)間區(qū)間篩選器DateRangeFilter介紹
這篇文章主要介紹了django admin管理工具自定義時(shí)間區(qū)間篩選器DateRangeFilter介紹,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-05-05Python使用dis模塊把Python反編譯為字節(jié)碼的用法詳解
通常來(lái)說(shuō)Python的性能或代碼質(zhì)量的評(píng)估可以通過(guò)dis模塊獲取到對(duì)應(yīng)的字節(jié)碼指令來(lái)進(jìn)行評(píng)估,因而這里我們就來(lái)看一下Python使用dis模塊把Python反編譯為字節(jié)碼的用法詳解:2016-06-06利用pycharm調(diào)試ssh遠(yuǎn)程程序并實(shí)時(shí)同步文件的操作方法
這篇文章主要介紹了利用pycharm調(diào)試ssh遠(yuǎn)程程序并實(shí)時(shí)同步文件的操作方法,本篇文章提供了利用pycharm遠(yuǎn)程調(diào)試程序的方法,且使用的編譯器可以是服務(wù)器中的虛擬環(huán)境的編譯器,可以實(shí)時(shí)同步本地與服務(wù)器的文件內(nèi)容,需要的朋友可以參考下2022-11-11使用 Python 創(chuàng)建一個(gè)基于規(guī)則的聊天機(jī)器人
這篇文章主要介紹了使用 Python 創(chuàng)建一個(gè)基于規(guī)則的聊天機(jī)器人,使用 Python 創(chuàng)建一個(gè)簡(jiǎn)單的基于規(guī)則的聊天機(jī)器人 聊天機(jī)器人本身是一種機(jī)器或軟件,它通過(guò)文本或句子模仿人類(lèi)交互。 簡(jiǎn)而言之,可以使用類(lèi)似于與人類(lèi)對(duì)話的軟件進(jìn)行聊天。2021-10-10