Python3.7 + Yolo3實現(xiàn)識別語音播報功能
一、利用Python調(diào)用系統(tǒng)win10的文字轉(zhuǎn)語音
首先下載需要用到的庫:pip install pyttsx3 -i https://mirrors.aliyun.com/pypi/simple/
接下來直接上代碼:
import win32com.client as win # SpVoice類是支持語音合成(TTS)的核心類。通過SpVoice對象調(diào)用TTS引擎,從而實現(xiàn)朗讀功能 speak = win.Dispatch("SAPI.SpVoice") # 完成將文本信息轉(zhuǎn)換為語音并按照指定的參數(shù)進行朗讀。 # 該方法有Text和Flags兩個參數(shù),分別指定要朗讀的文本和朗讀方式(同步或異步等)。 speak.Speak("come on") speak.Speak("你好")
最后運行代碼,就會聽到系統(tǒng)傳出來的聲音,讀出了 come on 和 你好。
二、開始使用Yolo識別,利用語音播報返回出來
開始之前我們先得解析出來Yolo3的代碼,從而獲取到被識別出來的物體標簽。
首先我們找到一個coco_classes.txt
,發(fā)現(xiàn)里面有很多的英文單詞,這些就是準備識別匹配的標簽了。
然后我們在找到y(tǒng)olo.py,發(fā)現(xiàn)的我們的coco_classes.txt
被傳入進來了
關(guān)鍵的來了,我們通過Ctrl + F 搜索一下classes_path
這個Key,發(fā)現(xiàn)這幾行代碼
這里就是讀取了存放標簽的那個文本,進行了處理,并且返回了名字。
最后找到這一行代碼,此處代碼就是一開始進行識別的時候,我們的控制臺打印出來的代碼。
運行代碼的時候發(fā)現(xiàn),打印的這個label,就是識別出的物體的標簽了。
這個時候我們就可以將我們的語音播報的代碼添加進行,把label傳入進去,就會發(fā)現(xiàn)識別出來的物體就會通過語音返回。
Time~
到此這篇關(guān)于Python3.7 + Yolo3識別 語音播報的文章就介紹到這了,更多相關(guān)Python識別語音內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python文件操作的基礎(chǔ)詳細講解(write、read、readlines、readline)
使用python來讀寫文件是非常簡單的操作,下面這篇文章主要給大家介紹了關(guān)于python文件操作的基礎(chǔ)詳細資料,包括write、read、readlines、readline等相關(guān)操作,文中通過示例代碼介紹的非常詳細,需要的朋友可以參考下2022-04-04記錄一下scrapy中settings的一些配置小結(jié)
這篇文章主要介紹了記錄一下scrapy中settings的一些配置小結(jié),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-09-09如何利用python的tkinter實現(xiàn)一個簡單的計算器
這篇文章主要給大家介紹了關(guān)于如何利用python的tkinter實現(xiàn)一個簡單的計算器的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04Python selenium環(huán)境搭建實現(xiàn)過程解析
這篇文章主要介紹了Python selenium環(huán)境搭建實現(xiàn)過程解析,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-09-09Python加密方法小結(jié)【md5,base64,sha1】
這篇文章主要介紹了Python加密方法,結(jié)合實例形式總結(jié)分析了md5,base64,sha1的簡單加密方法,需要的朋友可以參考下2017-07-07