其原理是對音視頻文件進行語音活動檢測以查找說話的區(qū)域,然后并行調(diào)用 Google Web Speech API 進行轉(zhuǎn)錄,(可選)翻譯成目標語言,并將結(jié)果存儲下來。 autosub3 基于autosub,升級到 python 3.X 版本,并添加了對 windows 系統(tǒng)的支持。 安裝 依賴ffmpeg 進行音頻提取,需要自己手動安裝,并添加到系統(tǒng)環(huán)境變量中。
www.dbjr.com.cn/article/2048...htm 2025-5-28