Python文字截圖識別OCR工具實例解析
一、簡介
你一定用過那種“OCR神器”,可以把圖片中的文字提取出來,極大的提高工作效率。
今天,我們就來做一款實時截圖識別的小工具。顧名思義,運行程序時,可以實時把你截出來的圖片中的文字識別出來。
二、模塊
import keyboard # 用于監(jiān)控鍵盤按下,觸發(fā)事件(pip install keyboard) import time from aip import AipOcr # 調(diào)用百度接口(pip install baidu-aip) from PIL import ImageGrab # 用于保存屏幕截圖
三、獲取百度應用接口
AI開放平臺文檔中心
查看python語言的SDK文檔
點擊右上角(控制臺),登錄自己的百度賬號,創(chuàng)建“文字識別”的應用
四、代碼實現(xiàn)
#! /usr/bin/env python3 # -*- coding:utf-8 -*- # Author : MaYi # Blog : http://www.cnblogs.com/mayi0312/ # Date : 2020-03-02 # Name : test_ocr # Software : PyCharm # Note : 用Python開發(fā)截圖識別OCR小工具 import keyboard # 用于監(jiān)控鍵盤按下,觸發(fā)事件(pip install keyboard) import time from aip import AipOcr # 調(diào)用百度接口(pip install baidu-aip) from PIL import ImageGrab # 用于保存屏幕截圖 # 百度識別接口配置信息 APP_ID = '你的App ID' API_KEY = '你的API Key' SECRET_KEY = '你的Secret Key' while True: # 1、利用QQ截圖到剪貼板 # 輸入鍵盤的觸發(fā)事件 keyboard.wait(hotkey="ctrl+alt+a") keyboard.wait(hotkey="enter") time.sleep(0.1) # 2、保存截圖 image = ImageGrab.grabclipboard() image.save("screen.png") # 3、利用百度API識別截圖中的文字 client = AipOcr(APP_ID, API_KEY, SECRET_KEY) with open("screen.png", 'rb') as f: image = f.read() # 調(diào)用百度API通用文字識別(高精度版),提取圖片中的內(nèi)容 text = client.basicAccurate(image) result = text["words_result"] for i in result: print(i["words"]) # 我是分隔線 print("-" * 50)
運行結(jié)果預覽:
五、總結(jié)
1)等待用戶截圖
2)保存截圖到當前目錄
3)識別截圖中的文本
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
python3 dict ndarray 存成json,并保留原數(shù)據(jù)精度的實例
今天小編就為大家分享一篇python3 dict ndarray 存成json,并保留原數(shù)據(jù)精度的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-12-12Python的Bottle框架中實現(xiàn)最基本的get和post的方法的教程
這篇文章主要介紹了Python的Bottle框架中實現(xiàn)最基本的get和post的方法的教程,Bottle框架在Python開發(fā)者中的人氣很高,需要的朋友可以參考下2015-04-04關(guān)于初始種子自動選取的區(qū)域生長實例(python+opencv)
今天小編就為大家分享一篇關(guān)于初始種子自動選取的區(qū)域生長實例(python+opencv),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-01-01如何打包Python Web項目實現(xiàn)免安裝一鍵啟動的方法
這篇文章主要介紹了如何打包Python Web項目,實現(xiàn)免安裝一鍵啟動,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-05-05