python騰訊語音合成實現(xiàn)過程解析
一、騰訊語音合成介紹
騰訊云語音合成技術(TTS)可以將任意文本轉(zhuǎn)化為語音,實現(xiàn)讓機器和應用張口說話。 騰訊TTS技術可以應用到很多場景,比如,移動APP語音播報新聞;智能設備語音提醒;依靠網(wǎng)上現(xiàn)有節(jié)目或少量錄音,快速合成明星語音,降低邀約成本;支持車載導航語音合成的個性化語音播報。(廢話一大堆)。。。
二、騰訊語音合成python SDK文檔
安裝 Python SDK 前,先獲取安全憑證。在第一次使用云 API 之前,用戶首先需要在騰訊云控制臺上申請安全憑證,安全憑證包括 SecretID 和 SecretKey, SecretID 是用于標識 API 調(diào)用者的身份,SecretKey 是用于加密簽名字符串和服務器端驗證簽名字符串的密鑰。SecretKey 必須嚴格保管,避免泄露。
通過 pip 安裝(推薦)
您可以通過 pip 安裝方式將騰訊云 API Python SDK 安裝到您的項目中,如果您的項目環(huán)境尚未安裝 pip,請詳細參見 pip官網(wǎng) 安裝。
通過pip方式安裝請在命令行中執(zhí)行以下命令:
pip install tencentcloud-sdk-python
請注意,如果同時有 python2 和 python3 環(huán)境, python3 環(huán)境需要使用 pip3 命令安裝。
三、騰訊語音合成
# !/usr/bin/env python 2 # -*- coding: utf-8 -*-
from base64 import b64decode
from uuid import uuid4
from tencentcloud.common import credential
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.aai.v20180522.models import TextToVoiceRequest
from tencentcloud.aai.v20180522.aai_client import AaiClient
try:
# 實例化一個認證對象,入?yún)⑿枰獋魅腧v訊云賬戶secretId,secretKey
cred = credential.Credential("你的secretID", "你的secretKey")
# 實例化要進行語音合成請求的client對象
client = AaiClient(cred, 'ap-shanghai')
# 實例化一個請求對象
req = TextToVoiceRequest()
# 請求對象屬性封裝
req.Text = '先帝創(chuàng)業(yè)未半而中道崩殂' # type: str # 要合成語音的文本
req.SessionId = uuid4() # type: int # 一次請求對應一個SessionId,會原樣返回,建議傳入類似于uuid的字符串防止重復
req.ModelType = 1 # type: int # 模型類型,默認值為1
req.Volume = 5.0 # type: float # 音量大小,范圍:[0,10],分別對應10個等級的音量,默認為0
req.Speed = 0.6 # type: float # 語速,范圍:[-2,2],分別對應不同語速:0.6倍,0.8倍,1.0倍,1.2倍,1.5倍,默認為0
req.ProjectId = 10086 # type: int # 項目id,用戶自定義,默認為0
req.VoiceType = 0 # type: int # 音色0:女聲1,親和風格(默認) 音色1:男聲1,成熟風格 音色2:男聲2,成熟風格
req.PrimaryLanguage = 1 # type: int # 主語言類型1:中文,最大100個漢字(標點符號算一個漢字)語言類型2:英文,最大支持400個字母(標點符號算一個字母)
req.SampleRate = 16000 # type: int # 音頻采樣率,16000:16k,8000:8k,默認16k
# 通過client對象調(diào)用想要訪問的接口,需要傳入請求對象
rep = client.TextToVoice(req)
# rep為響應對象
print(rep)
"""
{
"Audio": "UklGRlR/AABXQVZFZm10IBAAAAABAAEAgD4AAAB9AAACABAAZGF0YSx9AAD+////AQD//wAAAAAAAAIAAQADAAMABgAEAAYABQAGAAUABwAIAAgACQAAE......AAgACAAEAAgADAAIAAwACAAQAAwACAAIAAgADAAMAAgACAAIAAwABAAAAAAAAAAAAAAD/////AAAAAAAA//8AAP///v/9//7//v///////v8AAP///////wAA/////wAA/////wAAAAAAAAAAAAAAAAAAAAAAAAAA",
"RequestId": "9a7a1615-3e09-4db2-8032-5c6f497f7e6a",
"SessionId": "session-1234"
}
Audio對應的值為經(jīng)過base64編碼,
RequestId為返回的唯一請求id,
SessionId為發(fā)送請求時傳入的id即uuid4()
"""
# content為base64解碼后的二進制流
content = b64decode(rep.Audio)
# I/O操作
with open('voice.wav', 'wb') as f:
f.write(content)
except TencentCloudSDKException as e:
print(e)
四、騰訊語音合成使用后感受
首先,在代碼層次上講,官方壓根沒有合成示例文檔啊(咆哮ing),全自己摸索的啊(咆哮ing),SDK都開發(fā)出來了,示例代碼給一下能死啊(咆哮ing),怪不得沒人用啊(咆哮ing)!
第二,還是在代碼層次上講,源碼中TextToVoiceRequest()類,在__init__()方法中就不能直接封裝屬性啊(咆哮ing),有些沒有自定制但都是默認的直接填上不就行了啊(咆哮ing),懶死你啊,非得一行一行自己加屬性啊(咆哮ing),看到的同學務必要修改這個類的__init__()方法,要不然就像示例代碼中那樣麻煩。
第三,在合成效果上講,聲音難聽爆了有木有,語音文件還得解碼再I/O,吃飽了撐的了啊,還是那句話:怪不得沒人用,百度語音合成效果比你強多了。
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
- 關于Python調(diào)用百度語音合成SDK實現(xiàn)文字轉(zhuǎn)音頻的方法
- Python調(diào)用訊飛語音合成API接口來實現(xiàn)文字轉(zhuǎn)語音
- Python人工智能語音合成實現(xiàn)案例詳解
- Python語音合成的項目實戰(zhàn)(PyQt5+pyttsx3)
- 基于Python實現(xiàn)語音合成小工具
- 基于Python編寫一個語音合成系統(tǒng)
- Python實現(xiàn)語音合成功能詳解
- python3實現(xiàn)語音轉(zhuǎn)文字(語音識別)和文字轉(zhuǎn)語音(語音合成)
- Python實現(xiàn)語音識別和語音合成功能
- Python中edge-tts實現(xiàn)便捷語音合成
相關文章
Python?xpath,JsonPath,bs4的基本使用
這篇文章主要介紹了Python?xpath,JsonPath,bs4的基本使用,文章圍繞主題展開詳細的內(nèi)容介紹,具有一定的參考價值,感興趣的小伙伴可以參考一下2022-07-07
Python?Numpy布爾數(shù)組在數(shù)據(jù)分析中的應用小結
本文深入探討了Python的Numpy庫中的布爾數(shù)組功能,介紹了布爾運算、布爾索引的使用方法,并通過示例展示了如何在數(shù)據(jù)分析中利用布爾數(shù)組進行數(shù)據(jù)篩選和處理,感興趣的朋友一起看看吧2024-09-09
中秋節(jié)老家要貼對聯(lián)之python無線對聯(lián)生成器
適逢中秋老家居然有在中秋貼對聯(lián)的習俗,于是自己開機立馬寫了一個對聯(lián)生成器,文中給大家介紹的非常詳細,對大家的學習或工作具有參考價值2021-09-09
python中sort sorted reverse reversed函數(shù)的區(qū)別說明
這篇文章主要介紹了python中sort sorted reverse reversed函數(shù)的區(qū)別說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05

