通過Python的speech_recognition庫將音頻文件轉為文字
前言
大家好,我是空空star,本篇給大家分享一下通過Python的speech_recognition庫將音頻文件轉為文字。
上一篇已經(jīng)介紹了相關的庫speech_recognition
。
一、音頻準備
這里我們通過gTTS先生成一段音頻,gTTS相關的介紹可以看博主之前寫的博客。
from gtts import gTTS local = '/Users/kkstar/Downloads/video/' text = '大家好,我是空空star,本篇給大家分享一下音頻轉文字,這是通過speech_recognition轉換的文字。' language = "zh-cn" tts = gTTS(text=text, lang=language) tts.save(local+"audio_gtts_0509.mp3")
二、音頻聲音
音頻轉文字_0509
三、格式轉換
mp3轉為wav。
這里不能只改后綴,需要用音頻轉換工具轉換下。
audio_gtts_0509.mp3->audio_gtts_0509.wav
四、音頻轉文字
1.引入庫
import speech_recognition as sr import speech_recognition as sr
2.定義音頻路徑
local = '/Users/kkstar/Downloads/video/'
3.創(chuàng)建一個Recognizer對象
r = sr.Recognizer()
4.打開音頻文件,將音頻文件讀入Recognizer對象
音頻文件必須是wav的格式
# 打開音頻文件 with sr.AudioFile(local+'audio_gtts_0509.wav') as source: # 將音頻文件讀入Recognizer對象 audio = r.record(source)
5.嘗試使用Google Web API將語音轉換為文字
try: text = r.recognize_google(audio, language='zh-CN') print('轉換結果:', text) except sr.UnknownValueError: print('無法識別語音') except sr.RequestError as e: print('無法連接到Google Web API. {0}'.format(e))
6.轉換結果
轉換結果: 大家好我是空空Store本篇給大家分享一下音頻轉文字這是通過Keep下劃線recognition轉換的文字
Process finished with exit code 0
總結
recognize_google
: recognize_google() 是Google提供的一種語音識別API,可以識別音頻文件或麥克風錄制的語音,并將其轉換為文本。在Python中,可以使用SpeechRecognition庫中的recognize_google()方法來調用該API。
到此這篇關于通過Python的speech_recognition庫將音頻文件轉為文字的文章就介紹到這了,更多相關Python音頻文件轉為文字內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
python openpyxl方法 zip函數(shù)用法及說明
這篇文章主要介紹了python openpyxl方法 zip函數(shù)用法及說明,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-05-05python3使用tkinter實現(xiàn)ui界面簡單實例
使用tkinter創(chuàng)建一個小窗口,布置2個按鈕,一個btn關閉窗口,另一個btn用于切換執(zhí)行傳入的2個函數(shù),簡單的小代碼,大家參考使用吧2014-01-01解決pycharm 遠程調試 上傳 helpers 卡住的問題
今天小編就為大家分享一篇解決pycharm 遠程調試 上傳 helpers 卡住的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06