Python編寫一個驗證碼圖片數(shù)據(jù)標注GUI程序附源碼

更新時間：2019年12月09日 10:19:28 作者：州的先生

這篇文章主要介紹了Python編寫一個驗證碼圖片數(shù)據(jù)標注GUI程序,本文給大家附上小編精心整理的源碼，需要的朋友可以參考下

做驗證碼圖片的識別，不論是使用傳統(tǒng)的ORC技術，還是使用統(tǒng)計機器學習或者是使用深度學習神經(jīng)網(wǎng)絡，都少不了從網(wǎng)絡上采集大量相關的驗證碼圖片做數(shù)據(jù)集樣本來進行訓練。

采集驗證碼圖片，可以直接使用Python進行批量下載，下載完之后，就需要對下載下來的驗證碼圖片進行標注。一般情況下，一個驗證碼圖片的文件名就是圖片中驗證碼的實際字符串。

在不借助工具的情況下，我們對驗證碼圖片進行上述標注的流程是：

1、打開圖片所在的文件夾；
2、選擇一個圖片；
3、鼠標右鍵重命名；
4、輸入正確的字符串；
5、保存

州的先生親身體驗，一個驗證碼完成數(shù)據(jù)的標注，大概需要10到20秒。大量的時間浪費在了重復地進行鼠標右鍵重命名操作了。于是，使用Qt的Python封裝包——PyQt5，編寫了一個小工具，方便進行驗證碼圖片的數(shù)據(jù)標注，節(jié)省時間，珍惜生命。

程序的運行如下動圖所示：

下面我們來了解一下如何編寫這個驗證碼圖片數(shù)據(jù)標注程序。

首先，我們來構建一個圖形界面。這個圖形界面里面包含了一個圖像展示控件、一個文本輸入控件、四個按鈕控件?；诖耍覀冞x擇三個布局來排列圖形界面的布局。圖形界面窗口中的核心控件是一個QWidget()，其布局層設置為網(wǎng)格布局QGridLayout()。在其中放置三個控件：圖像展示控件QWidget()、文本輸入控件QLineText()、四個按鈕組QWidget()。

同時，圖像展示控件QWidget()用水平布局層QHBoxLayout()包含一個QLabel()標簽來占位；按鈕組控件QWidget()用一個垂直布局層QVBoxLayout()將4個按鈕控件QPushButton()添加進去。最后，代碼如下所示：

class ImgTag(QtWidgets.QMainWindow):
 def __init__(self):
 super().__init__()
 self.setWindowTitle("驗證碼圖片標注 州的先生 zmister.com")
 # 主控件和主控件布局
 self.main_widget = QtWidgets.QWidget()
 self.main_layout = QtWidgets.QGridLayout()
 self.main_widget.setLayout(self.main_layout)

 # 圖像展示控件
 self.img_widget = QtWidgets.QWidget()
 self.img_layout = QtWidgets.QHBoxLayout()
 self.img_widget.setLayout(self.img_layout)
 # 標簽占位
 self.img_view = QtWidgets.QLabel("請選擇一個文件夾！")
 self.img_view.setAlignment(QtCore.Qt.AlignCenter)
 self.img_layout.addWidget(self.img_view)

 # 圖像標注控件
 self.img_input = QtWidgets.QLineEdit()

 # 控制按鈕控件
 self.opera_widget = QtWidgets.QWidget()
 self.opera_layout = QtWidgets.QVBoxLayout()
 self.opera_widget.setLayout(self.opera_layout)
 # 各個按鈕
 self.select_img_btn = QtWidgets.QPushButton("選擇目錄")
 self.previous_img_btn = QtWidgets.QPushButton("上一張")
 self.previous_img_btn.setEnabled(False)
 self.next_img_btn = QtWidgets.QPushButton("下一張")
 self.next_img_btn.setEnabled(False)
 self.save_img_btn = QtWidgets.QPushButton("保存")
 self.save_img_btn.setEnabled(False)
 # 添加按鈕到布局
 self.opera_layout.addWidget(self.select_img_btn)
 self.opera_layout.addWidget(self.previous_img_btn)
 self.opera_layout.addWidget(self.next_img_btn)
 self.opera_layout.addWidget(self.save_img_btn)

 # 將控件添加到主控件布局層
 self.main_layout.addWidget(self.img_widget,0,0,4,4)
 self.main_layout.addWidget(self.opera_widget,0,4,5,1)
 self.main_layout.addWidget(self.img_input,4,0,1,4)

 # 狀態(tài)欄
 self.img_total_current_label = QtWidgets.QLabel()
 self.img_total_label = QtWidgets.QLabel()
 self.statusBar().addPermanentWidget(self.img_total_current_label)
 self.statusBar().addPermanentWidget(self.img_total_label, stretch=0) # 在狀態(tài)欄添加永久控件

 # 設置UI界面核心控件
 self.setCentralWidget(self.main_widget)

運行上述代碼，我們可以得到以下如下圖所示的圖形界面：

下面，我們?yōu)檫@個靜態(tài)的圖形界面添加事件響應。

二、選擇目錄讀取文件

首先，我們來實現(xiàn)“選擇目錄”按鈕的功能。這個按鈕點擊之后，需要打開文件夾選擇框，然后在選擇一個文件夾之后，自動讀取文件夾內(nèi)的圖片文件，并將第一張圖片顯示到圖形展示控件上。

在這里，我們通過QFileDialog.getExistingDirectory()來實現(xiàn)調(diào)用文件夾對話框，其會返回所選擇文件夾路徑的字符串。然后通過os模塊的listdir()方法，獲取文件夾下所有的文件，對其進行遍歷，提取出圖片文件，將這些圖片文件添加到一個新的列表中。代碼如下所示：

# 選擇目錄按鈕
def select_img_click(self):
 self.dir_path = QtWidgets.QFileDialog.getExistingDirectory(self,'選擇文件夾')
 # print(self.dir_path)
 dir_list = os.listdir(self.dir_path)
 img_list = []
 for dir in dir_list:
 suffix_list = ['jpg','png','jpeg','bmp',]
 if dir.split('.')[-1].lower() in suffix_list:
  img_list.append(dir)

接著，我們繼續(xù)遍歷這個列表，生成一個圖片的索引字典，用于記錄每個圖片的順序信息，方便進行上一張、下一張按鈕的切換操作。

# 圖像文件索引字典
self.img_index_dict = dict()
for i,d in enumerate(img_list):
 self.img_index_dict[i] = d
self.current_index = 0 # 當前的圖像索引
# 當前圖片文件路徑
self.current_filename = os.path.join(
 self.dir_path,self.img_index_dict[self.current_index]
)

然后，借助QImage()類實例化一個Qt的圖像，在圖像占位標簽中通過setPixmap設置顯示圖像。

# 實例化一個圖像
image = QtGui.QImage(self.current_filename)
self.img_width = image.width() # 圖片寬度
self.img_height = image.height() # 圖片高度
self.img_scale = 1
self.image = image.scaled(self.img_width*self.img_scale,self.img_height*self.img_scale)

# 在img_view控件中顯示圖像
self.img_view.setPixmap(QtGui.QPixmap.fromImage(self.image))

接著再設置文本輸入框的內(nèi)容、獲取文本輸入框的焦點并全選文本輸入框的內(nèi)容：

# 設置img_input控件文本內(nèi)容
self.img_input.setText(self.current_text)
self.img_input.setFocus() # 獲取輸入框焦點
self.img_input.selectAll() # 全選文本

最后在狀態(tài)欄設置圖片數(shù)量的信息，包括當前圖片和圖片總數(shù)：

# 設置狀態(tài)欄 圖片數(shù)量信息
self.img_total_current_label.setText("{}".format(self.current_index+1))
self.img_total_label.setText("/{total}".format(total=len(img_list)))

以上這些代碼都是寫在select_img_click()方法操作。在完成select_img_click()這個方法的編寫后，我們將其綁定到“選擇目錄”的點擊信號上：

self.select_img_btn.clicked.connect(self.select_img_click)

這樣，就實現(xiàn)了選擇目錄，并顯示目錄中的第一張圖片的功能。效果如下動圖所示：

下面，我們再來實現(xiàn)下一張圖片的按鈕功能

三、切換下一張圖片

要切換下一張圖片，我們首先需要將當前顯示的圖片重命名為文本輸入框中的內(nèi)容：

# 下一張圖片
def next_img_click(self):
 # 修改當前圖像文件名
 new_tag = self.img_input.text() # 獲取當前輸入框內(nèi)容
 current_img = self.img_index_dict[self.current_index] # 獲取當前圖片名稱
 try:
 os.rename(
  os.path.join(self.dir_path,current_img),
  os.path.join(self.dir_path,new_tag+'.'+current_img.split('.')[-1])
 ) # 修改文件名
 self.img_index_dict[self.current_index] = new_tag+'.'+current_img.split('.')[-1]
 except FileExistsError as e: # 同名文件異常
 print(repr(e))
 QtWidgets.QMessageBox.information(
  self, '提示', '已存在同名文件！',
  QtWidgets.QMessageBox.Ok
 )

接下來，將圖片當前索引變量值加1，通過這個索引值獲取到下一張圖片的文件名，再按照之前的方式將其讀取為圖像并顯示在標簽占位控件上，同時更新狀態(tài)欄的信息：

# 當前圖像索引加1
self.current_index += 1
if self.current_index in self.img_index_dict.keys():
 # 當前圖片文件路徑
 self.current_filename = os.path.join(
 self.dir_path, self.img_index_dict[self.current_index]
 )
 # 實例化一個圖像
 image = QtGui.QImage(self.current_filename)
 self.img_width = image.width() # 圖片寬度
 self.img_height = image.height() # 圖片高度
 self.img_scale = 1
 self.image = image.scaled(self.img_width * self.img_scale, self.img_height * self.img_scale)

 # 在img_view控件中顯示圖像
 self.img_view.setPixmap(QtGui.QPixmap.fromImage(self.image))
 # 當前文件名
 self.current_text = self.img_index_dict[self.current_index].split('.')[0]
 # 設置img_input控件文本內(nèi)容
 self.img_input.setText(self.current_text)
 self.img_input.setFocus() # 獲取輸入框焦點
 self.img_input.selectAll() # 全選文本

 # 設置狀態(tài)欄
 self.img_total_current_label.setText(str(self.current_index+1))
else:
 self.current_index -=1
 QtWidgets.QMessageBox.information(
 self,'提示','所有圖片已標注完！',
 QtWidgets.QMessageBox.Ok
 )

這樣，調(diào)用next_img_click()方法，我們就可以切換下一張圖片。我們將其綁定在“下一張”按鈕、“保存”按鈕和文本輸入框的回車信號上，就可以實現(xiàn)點擊“下一張”按鈕、“保存”按鈕或是在標注完一個數(shù)據(jù)后直接回車就能切換到下一張圖片：

self.next_img_btn.clicked.connect(self.next_img_click)
self.save_img_btn.clicked.connect(self.next_img_click)
self.img_input.returnPressed.connect(self.next_img_click) # 回車事件綁定

這樣，切換下一張圖片的功能也實現(xiàn)了，其效果如下動圖所示：

四、切換上一張圖片

有時候我們需要返回前面標注的圖片，這時候切換上一張圖片的功能也是很有必要的。切換上一張圖片的邏輯與切換下一張圖片的邏輯基本一致，只是需要將圖像的索引值減1：

# 上一張圖片
def previous_img_click(self):
 # 修改當前圖像文件名
 new_tag = self.img_input.text() # 獲取當前輸入框內(nèi)容
 current_img = self.img_index_dict[self.current_index] # 獲取當前圖片名稱
 try:
 os.rename(
  os.path.join(self.dir_path, current_img),
  os.path.join(self.dir_path, new_tag + '.' + current_img.split('.')[-1])
 ) # 修改文件名
 self.img_index_dict[self.current_index] = new_tag + '.' + current_img.split('.')[-1]
 except FileExistsError as e: # 同名文件異常
 print(repr(e))
 QtWidgets.QMessageBox.information(
  self, '提示', '已存在同名文件！',
  QtWidgets.QMessageBox.Ok
 )

 # 當前圖像索引加1
 self.current_index -= 1
 if self.current_index in self.img_index_dict.keys():
 # 當前圖片文件路徑
 self.current_filename = os.path.join(
  self.dir_path, self.img_index_dict[self.current_index]
 )
 # 實例化一個圖像
 image = QtGui.QImage(self.current_filename)
 self.img_width = image.width() # 圖片寬度
 self.img_height = image.height() # 圖片高度
 self.img_scale = 1
 self.image = image.scaled(self.img_width * self.img_scale, self.img_height * self.img_scale)

 # 在img_view控件中顯示圖像
 self.img_view.setPixmap(QtGui.QPixmap.fromImage(self.image))
 # 當前文件名
 self.current_text = self.img_index_dict[self.current_index].split('.')[0]
 # 設置img_input控件文本內(nèi)容
 self.img_input.setText(self.current_text)
 self.img_input.setFocus() # 獲取輸入框焦點
 self.img_input.selectAll() # 全選文本

 # 設置狀態(tài)欄
 self.img_total_current_label.setText(str(self.current_index + 1))
 else:
 self.current_index += 1
 QtWidgets.QMessageBox.information(
  self, '提示', '圖片列表到頂了！',
  QtWidgets.QMessageBox.Ok
 )

可以看到，這和切換下一張圖片的代碼幾乎是一致的，因為其核心邏輯本來就是一樣的，我們將“上一張”按鈕的點擊信號綁定在這個方法上，就可以實現(xiàn)切換上一張圖片的功能了：

self.previous_img_btn.clicked.connect(self.previous_img_click)

其效果如下動圖所示：

五、圖片縮放

到這里，我們的驗證碼圖片數(shù)據(jù)標注程序基本上已經(jīng)完成了，但是突然發(fā)現(xiàn)，有些驗證碼圖片很變態(tài)，它的干擾線和干擾點簡直讓人無法看清它到底是什么字符，這樣的情況下可能需要把圖片放大或縮小一點，方便我們確認驗證碼圖片上的信息，所以，我們的程序還需要一個圖片縮放功能。最終，我們實現(xiàn)的效果是，按住Ctrl+鼠標滾輪，滾輪向上，圖片放大，滾輪向下，圖片縮小。這是通過重寫鼠標滾輪事件來實現(xiàn)的：

# 重寫鼠標滾輪事件
def wheelEvent(self, event):
 # 如果按住了Ctrl
 if event.modifiers() == QtCore.Qt.ControlModifier:
 try:
  delta = event.angleDelta().y()
  if delta &gt; 0:
  self.img_scale += 0.25
  self.image_scaled = self.image.scaled(self.img_width * self.img_scale, self.img_height * self.img_scale)
  self.img_view.setPixmap(QtGui.QPixmap.fromImage(self.image_scaled))
  self.statusBar().showMessage("當前圖片縮放比例為：{}%".format(self.img_scale * 100))
  elif delta &lt; 0:
  if self.img_scale &gt; 0.25:
   self.img_scale -= 0.25
   self.image_scaled = self.image.scaled(self.img_width * self.img_scale, self.img_height * self.img_scale)
   self.img_view.setPixmap(QtGui.QPixmap.fromImage(self.image_scaled))
   self.statusBar().showMessage("當前圖片縮放比例為：{}%".format(self.img_scale * 100))
 except Exception as e:
  print(traceback.print_exc())
  print(repr(e))

最后，這樣圖片縮放的功能也實現(xiàn)了，其效果如下所示：

六、程序完整代碼

以上，我們的圖片驗證碼數(shù)據(jù)標注程序就完全編寫好了，基于此，我們可以進一步使用Pyinstaller等打包工具，將其打包為二進制的可執(zhí)行文件，方便傳播使用。

源碼下載地址：鏈接: https://pan.baidu.com/s/1FadzPC2FoIJNPMCmpYBKRg 提取碼: e4w4

總結

以上所述是小編給大家介紹的Python編寫一個驗證碼圖片數(shù)據(jù)標注GUI程序附源碼，希望對大家有所幫助，如果大家有任何疑問請給我留言，小編會及時回復大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持！
如果你覺得本文對你有幫助，歡迎轉(zhuǎn)載，煩請注明出處，謝謝！

您可能感興趣的文章:

關于django 1.10 CSRF驗證失敗的解決方法
今天小編就為大家分享一篇關于django 1.10 CSRF驗證失敗的解決方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-08-08
Python中的with語句與上下文管理器學習總結
在Python中作為上下文管理器的對象可以使用with語句,提供上下文管理器的contextlib模塊的使用則是Python編程中的高級技巧,下面我們就來詳細整理一下Python中的with語句與上下文管理器學習總結:
2016-06-06
Python實現(xiàn)處理逆波蘭表達式示例
這篇文章主要介紹了Python實現(xiàn)處理逆波蘭表達式操作,結合實例形式分析了逆波蘭表達式的概念、原理及Python針對逆波蘭表達式的定義與計算相關操作技巧,需要的朋友可以參考下
2018-07-07
Python實現(xiàn)帶百分比的進度條
本文給大家匯總介紹了3種使用Python實現(xiàn)帶百分比進度條的代碼，非常的簡單實用，有需要的小伙伴可以參考下
2016-06-06
python socket模塊創(chuàng)建和使用套接字示例詳解
這篇文章主要為大家介紹了python socket模塊來創(chuàng)建和使用套接字示例詳解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪
2023-06-06
如何在Flask中實現(xiàn)數(shù)據(jù)分組流程詳解
在Flask中，數(shù)據(jù)分組是指將一組數(shù)據(jù)按照某種方式進行分類，以便更好地對數(shù)據(jù)進行處理和展示，可以使用Python內(nèi)置的itertools模塊中的groupby方法，或者使用SQL語句中的GROUP?BY子句來實現(xiàn)數(shù)據(jù)分組，這篇文章介紹了在Flask中實現(xiàn)數(shù)據(jù)分組，感興趣的同學可以參考下文
2023-05-05
windows環(huán)境下tensorflow安裝過程詳解
這篇文章主要為大家詳細介紹了windows環(huán)境下tensorflow安裝過程，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-03-03
Python使用folium excel繪制point
今天小編就為大家分享一篇關于Python使用folium excel繪制point，小編覺得內(nèi)容挺不錯的，現(xiàn)在分享給大家，具有很好的參考價值，需要的朋友一起跟隨小編來看看吧
2019-01-01
一文帶你理解Python中面向?qū)ο缶幊蘋OP的概念
在Python中,面向?qū)ο缶幊蹋∣OP）是一種在編程中使用對象和類的編程范式,它旨在實現(xiàn)現(xiàn)實世界的實體,下面我們就一起來看看它的相關知識吧
2023-08-08
python使用socket進行簡單網(wǎng)絡連接的方法
這篇文章主要介紹了python使用socket進行簡單網(wǎng)絡連接的方法,實例分析了Python使用socket的基本技巧,非常具有實用價值,需要的朋友可以參考下
2015-04-04