Python如何實(shí)現(xiàn)文本轉(zhuǎn)語音
準(zhǔn)備
我測試使用的Python版本為2.7.10,如果你的版本是Python3.5的話,這里就不太適合了。
使用Speech API
原理
我們的想法是借助微軟的語音接口,所以我們肯定是要進(jìn)行調(diào)用 相關(guān)的接口。所以我們需要安裝pywin32來幫助我們完成這一個(gè)底層的交互。
示例代碼
import win32com.client speaker = win32com.client.Dispatch("SAPI.SpVoice") speaker.Speak("Hello, it works!")
小總結(jié)
是的,調(diào)用接口來實(shí)現(xiàn)語音功能就是這么簡單,但是我們不得不來聊一聊這種方式的缺點(diǎn)。
對(duì)中文支持的不夠好,僅僅是這一點(diǎn),估計(jì)在中國沒幾個(gè)用它的了。
還有就是語速不能很好的控制
pyttsx方式
原理
pyttsx 是Python的一個(gè)關(guān)于文字轉(zhuǎn)語音方面的很不錯(cuò)的庫。我們還可以借助pyttsx來實(shí)現(xiàn)在線朗讀rfc文件或者本地文件等等,最為關(guān)鍵的是,它對(duì)中文支持的還是不錯(cuò)的。
示例代碼
# coding:utf-8 import sys reload(sys) sys.setdefaultencoding('utf8') # __author__ = '郭 璞' # __date__ = '2016/8/6' # __Desc__ = 文字轉(zhuǎn)語音輸出 import pyttsx engine = pyttsx.init() engine.say('hello world') engine.say('你好,郭璞') engine.runAndWait() # 朗讀一次 engine.endLoop()
小總結(jié)
使用pyttsx,我們可以借助其強(qiáng)大的API來實(shí)現(xiàn)我們基本的業(yè)務(wù)需求。很酷吧。
pyttsx深入研究
做完上面的小實(shí)驗(yàn),你肯定會(huì)覺得怎么這么不過癮呢?
別擔(dān)心,下面我們就一起走進(jìn)pyttsx的世界,深入的研究一下其工作原理吧。
語音引擎工廠
類似于設(shè)計(jì)模式中的“工廠模式”,pyttsx通過初始化來獲取語音引擎。當(dāng)我們第一次調(diào)用init操作的時(shí)候,會(huì)返回一個(gè)pyttsx的engine對(duì)象,再次調(diào)用的時(shí)候,如果存在engine對(duì)象實(shí)例,就會(huì)使用現(xiàn)有的,否則再重新創(chuàng)建一個(gè)。
pyttsx.init([driverName : string, debug : bool]) → pyttsx.Engine
從方法聲明上來看,第一個(gè)參數(shù)指定的是語音驅(qū)動(dòng)的名稱,這個(gè)在底層適合操作系統(tǒng)密切相關(guān)的。如下:
1.drivename:由pyttsx.driver模塊根據(jù)操作系統(tǒng)類型來調(diào)用,默認(rèn)使用當(dāng)前操作系統(tǒng)可以使用的最好的驅(qū)動(dòng)
sapi5 - SAPI5 on Windows
nsss - NSSpeechSynthesizer on Mac OS X
espeak - eSpeak on every other platform
2.debug: 這第二個(gè)參數(shù)是指定要不要以調(diào)試狀態(tài)輸出,建議開發(fā)階段設(shè)置為True
引擎接口
要想很好的運(yùn)用一個(gè)庫,不了解其API是不行的。下面來看看pyttsx。engine.Engine的引擎API。
方法簽名 | 參數(shù)列表 | 返回值 | 簡單釋義 |
connect(topic : string, cb : callable) | topic:要描述的事件名稱;cb:回調(diào)函數(shù) | → dict | 在給定的topic上添加回調(diào)通知 |
disconnect(token : dict) | token:回調(diào)失聯(lián)的返回標(biāo)記 | Void | 結(jié)束連接 |
endLoop() | None | → None | 簡單來說就是結(jié)束事件循環(huán) |
getProperty(name : string) | name有這些枚舉值“rate, vioce,vioces,volumn | → object | 獲取當(dāng)前引擎實(shí)例的屬性值 |
setProperty(name : string) | name有這些枚舉值“rate, vioce,vioces,volumn | → object | 設(shè)置當(dāng)前引擎實(shí)例的屬性值 |
say(text : unicode, name : string) | text:要進(jìn)行朗讀的文本數(shù)據(jù); name: 關(guān)聯(lián)發(fā)音人,一般用不到 | → None | 預(yù)設(shè)要朗讀的文本數(shù)據(jù),這也是“萬事俱備,只欠東風(fēng)”中的“萬事俱備” |
runAndWait() | None | → None | 這個(gè)方法就是“東風(fēng)”了。當(dāng)事件隊(duì)列中事件全部清空的時(shí)候返回 |
startLoop([useDriverLoop : bool]) | useDriverLoop:是否啟用驅(qū)動(dòng)循環(huán) | → None | 開啟事件隊(duì)列 |
元數(shù)據(jù)音調(diào)
在pyttsx.voice.Voice中,處理合成器的發(fā)音。
age
發(fā)音人的年齡,默認(rèn)為None
gender
以字符串為類型的發(fā)音人性別: male, female, or neutral.默認(rèn)為None
id
關(guān)于Voice的字符串確認(rèn)信息. 通過 pyttsx.engine.Engine.setPropertyValue()來設(shè)置活動(dòng)發(fā)音簽名. 這個(gè)屬性總是被定義。
languages
發(fā)音支持的語言列表,如果沒有,則為一個(gè)空的列表。
name
發(fā)音人名稱,默認(rèn)為None.
更多測試
朗讀文本
import pyttsx engine = pyttsx.init() engine.say('Sally sells seashells by the seashore.') engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()
事件監(jiān)聽
import pyttsx def onStart(name): print 'starting', name def onWord(name, location, length): print 'word', name, location, length def onEnd(name, completed): print 'finishing', name, completed engine = pyttsx.init() engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()
打斷發(fā)音
import pyttsx def onWord(name, location, length): print 'word', name, location, length if location > 10: engine.stop() engine = pyttsx.init() engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()
更換發(fā)音人聲音
engine = pyttsx.init() voices = engine.getProperty('voices') for voice in voices: engine.setProperty('voice', voice.id) engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()
語速控制
engine = pyttsx.init() rate = engine.getProperty('rate') engine.setProperty('rate', rate+50) engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()
音量控制
engine = pyttsx.init() volume = engine.getProperty('volume') engine.setProperty('volume', volume-0.25) engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()
執(zhí)行一個(gè)事件驅(qū)動(dòng)循環(huán)
engine = pyttsx.init() def onStart(name): print 'starting', name def onWord(name, location, length): print 'word', name, location, length def onEnd(name, completed): print 'finishing', name, completed if name == 'fox': engine.say('What a lazy dog!', 'dog') elif name == 'dog': engine.endLoop() engine = pyttsx.init() engine.say('The quick brown fox jumped over the lazy dog.', 'fox') engine.startLoop()
使用一個(gè)外部的驅(qū)動(dòng)循環(huán)
engine = pyttsx.init() engine.say('The quick brown fox jumped over the lazy dog.', 'fox') engine.startLoop(False) # engine.iterate() must be called inside externalLoop() externalLoop() engine.endLoop()
總結(jié)
以上就是Python如何實(shí)現(xiàn)文本轉(zhuǎn)語音的全部內(nèi)容,看完了上面的講述,是不是感覺Python實(shí)現(xiàn)文本轉(zhuǎn)語音還是蠻簡單的?那么,大家快來嘗試嘗試吧。希望本文對(duì)大家學(xué)習(xí)Python有所幫助。
相關(guān)文章
Python實(shí)現(xiàn)JavaBeans流程詳解
這篇文章主要介紹了Python實(shí)現(xiàn)JavaBeans流程,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)吧2023-01-01Python 比較兩個(gè)數(shù)組的元素的異同方法
下面小編就為大家?guī)硪黄狿ython 比較兩個(gè)數(shù)組的元素的異同方法。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2017-08-08對(duì)pytorch中x = x.view(x.size(0), -1) 的理解說明
這篇文章主要介紹了對(duì)pytorch中x = x.view(x.size(0), -1) 的理解說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-03-03Python筆記之Scipy.stats.norm函數(shù)使用解析
這篇文章主要介紹了Python筆記之Scipy.stats.norm函數(shù)使用,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-02-02