匯幫音頻大師 v3.8.5.0 官方安裝版
24MB / 02-16
星優(yōu)音頻助手(格式轉(zhuǎn)換/壓縮/分割/變速)V2.1.0 官方安裝版
774KB / 06-13
音頻修復(fù)iZotope RX 11 Audio Editor Advanced v11.2.0 免安裝綠
1.9GB / 11-18
aiXdsp Intuition Compressor(音頻壓縮器) v3.0.3 免費(fèi)安裝版 附
24MB / 03-05
削波效果器插件Yum Audio Crispy Clip Light v1.1.2 官方免費(fèi)安
22.5MB / 02-29
Anemond Factoid(音頻剪輯插件) v2.0.1 免費(fèi)安裝版 附圖文教程
26.3MB / 02-26
TBProAudio ABLM(音頻增益控制插件) v2.2.4 免費(fèi)安裝版 附圖文安
5.30MB / 02-22
伴奏與人聲一鍵分離工具Ultimate Vocal Remover GUI(UVR5) v5.6.
8.1GB / 03-13
Steinberg WaveLab Elements(音頻編輯/母帶處理軟件) v12.0.10
368MB / 02-11
JMG Sound BITPUNK(模擬復(fù)古數(shù)字音頻失真效果的插件) v1.2 安裝
16MB / 02-04
-
-
-
訊飛語(yǔ)音助手(鼠標(biāo)/鍵盤語(yǔ)音錄入與翻譯) v4.2.33.20 免費(fèi)安裝版 音頻處理 / 360MB
-
-
ACE Studio(AI歌聲合成)v1.9.9 官方安裝版 音頻處理 / 213MB
-
易譜ziipoo軟件 v2.7.1.9 linux版 音頻處理 / 328MB
-
iZotope Tonal Balance Control 2(色調(diào)平衡控制插件) v2.10.0 免 音頻處理 / 61.7MB
-
Adobe Audition 2025(Au2025) v25.2.0.123 中文免費(fèi)安裝正式版 6 音頻處理 / 733MB
-
Native Instruments Kontakt 8 v8.3.0 最新中文綠色免費(fèi)版 音頻處理 / 1.2GB
-
Native Instruments Kontakt 8 v8.3.0 完整安裝免費(fèi)版(附文件+教 音頻處理 / 1.2GB
詳情介紹
FasterWhisperGUI是一款帶有 PySide6 的 fast_whisper 的 GUI 軟件,你可以將音頻或視頻文件轉(zhuǎn)錄為srt/txt/smi/vtt/lrc文件,將在線OpenAI-whisper模型轉(zhuǎn)換為ct2格式,并且提供VAD模型和whisper模型的所有參數(shù),目前支持whisperX,Democs 模型,whisper large-v3模型。
聽到Whisper,這個(gè)大家可能有點(diǎn)熟悉,這是OpenAI做的一個(gè)神經(jīng)網(wǎng)絡(luò)模型,可以在本地實(shí)時(shí)語(yǔ)音轉(zhuǎn)文字,用來(lái)翻譯和做字幕等,之前給大家介紹過一款叫做Constme-Whisper的軟件,可以快速進(jìn)行離線語(yǔ)音文字識(shí)別,還有GPU加速等等。
而faster-whisper-GUI增添了更多的特性,可以快速把音視頻文件轉(zhuǎn)成srt/txt/smi/vtt/lrc,支持Demucs、FastWhiper和whisperX、VAD-model這些技術(shù),簡(jiǎn)單來(lái)說(shuō),支持的可調(diào)整的選項(xiàng)要比之前推薦的工具更多一點(diǎn)。
由于這類工具離線處理的特點(diǎn),所以體積都比較大,faster-whisper-GUI的本體有1.6個(gè)G,安裝完之后的占用又是6個(gè)多G,而且還不包括后續(xù)添加模型的大小,建議大家體驗(yàn)的時(shí)候,裝在空間富裕的盤里。
如果是分離音頻和背景音樂的話,直接把文件丟進(jìn)來(lái)就行,試了一下效果還不錯(cuò),也可以單獨(dú)設(shè)置輸出的內(nèi)容。
其他的就需要加載一下額外模型了,把模型加載的時(shí)候需要注意,有個(gè)處理設(shè)備的選項(xiàng),CPU還是CUDA,如果你用的不是英偉達(dá)的顯卡,選擇自動(dòng)就好了,不然會(huì)提示加載失敗。
模型也有多重選擇,如果上面帶有V3標(biāo)志,記得把這個(gè)開關(guān)打開。
模型也有多重選擇,如果上面帶有V3標(biāo)志,記得把這個(gè)開關(guān)打開。
來(lái)試試語(yǔ)音轉(zhuǎn)文字,如果你覺得自己的設(shè)備處理等待時(shí)間有點(diǎn)長(zhǎng),在軟件執(zhí)行的時(shí)候可以掛在后臺(tái)和切換到其他界面,在它的詳情頁(yè)面能看到輸出的具體信息,它的正確率還是比較高的,中英文混合與首字母大小寫這些細(xì)節(jié)都有。
這類機(jī)器識(shí)別和人一樣,識(shí)別率還不能做到100%正確,識(shí)別完之后,會(huì)有一些錯(cuò)誤需要手動(dòng)調(diào)整,在faster-whisper-GUI里,它會(huì)自己跳轉(zhuǎn)到字幕制作的界面,可以快速瀏覽調(diào)整,在這里分割不同說(shuō)話人的文本等等
在設(shè)置里面,還有許多細(xì)節(jié)可以調(diào)整,調(diào)整音頻的默認(rèn)語(yǔ)言和翻譯,以及各種防止幻聽的參數(shù)。
這個(gè)功能在一些視頻編輯軟件還是需要收費(fèi)的,或者需要云端處理,識(shí)別的準(zhǔn)確率也就那樣。
更新日志
0.8.0 改動(dòng)
修復(fù)沒有贊助渠道的 bug #126
升級(jí) faster-whisper 到 1.02 版本
添加 distil-large-v3 模型在線模式支持 #130
最新的 Distil-Whisper 模型 distil-large-v3 本質(zhì)上是為與 OpenAI 順序算法配合使用而設(shè)計(jì)的。
支持初始化更多 whisper 模型參數(shù)
音頻分段設(shè)置
max_new_tokens: 每個(gè)區(qū)塊生成的新令牌的最大數(shù)量。如果未設(shè)置,最大值將通過默認(rèn)的 max_size 設(shè)置。
chunk_length: 音頻段的長(zhǎng)度。如果不是 None,它將覆蓋 FeatureExtractor 的默認(rèn)chunk_size。
clip_timestamps: 逗號(hào)分隔的要處理的剪輯的時(shí)間戳列表(以秒為單位)開始,結(jié)束,開始,結(jié)束......。最后一個(gè)結(jié)束時(shí)間戳默認(rèn)為文件的結(jié)束。如果使用 clip_timestamps,將忽略 VAD 設(shè)置。
幻聽參數(shù)
hallucination_silence_threshold: 當(dāng) word_timestamps 為 True 時(shí),當(dāng)檢測(cè)到可能的幻覺時(shí),跳過長(zhǎng)于此閾值(以秒為單位)的靜默期。
其他設(shè)置
hotwords: 為模型提供的熱詞/提示短語(yǔ)。如果 prefix 不是 None,則無(wú)效。 你可以輸入提示詞,類似于:“the video is about comfyUI”。
常規(guī)
language_detection_threshold: 如果語(yǔ)言標(biāo)記的最大概率高于此值,則會(huì)檢測(cè)為該語(yǔ)言。
language_detection_segments: 語(yǔ)言檢測(cè)需要考慮的分段數(shù)量。
其他新特性:https://github.com/SYSTRAN/faster-whisper/releases/tag/v1.0.2
修復(fù) 復(fù)制字幕 功能的 bug
更新一些 UI 文字
停用 轉(zhuǎn)寫參數(shù) 頁(yè)面的 保存參數(shù)、讀取參數(shù) 功能
起止時(shí)間、說(shuō)話人 列居中顯示
升級(jí) pytorch 到 2.3.0 , CUDA12
提示
軟件需要完全卸載舊版之后安裝新版(cache文件夾可不做清理)
需要安裝 ffmpeg
使用 V3 模型時(shí),如果頻繁出現(xiàn)顯存溢出,請(qǐng)嘗試更新顯卡驅(qū)動(dòng)程序到最新或者回退到上一個(gè)穩(wěn)定版本,當(dāng)前版本(2024.5.29)測(cè)試結(jié)果穩(wěn)定。
下載地址
人氣軟件
最強(qiáng)伴奏與人聲一鍵分離工具Ultimate Vocal Remover GUI(UVR5) v
PreSonus Studio One 6 Professional V6.6.2 中文永久免費(fèi)版(附
IBM ViaVoice Pro v9.1 簡(jiǎn)體中文版
Studio One6機(jī)架效果包插件 V6.0.2 中文免費(fèi)版(附使用教程)
Adobe Audition 2024(Au2024) v24.6.0.069 中文安裝免費(fèi)版 64位
PreSonus Studio One Pro 7 v7.1.1 中文完整免費(fèi)版(附安裝教程)
大餅AI變聲 v2.5.0 官方安裝版
阿里開源語(yǔ)音模型CosyVoice 0721 整合包 免費(fèi)版
終極伴奏人聲提取工具 Ultimate Vocal Remover(UVR) v5.5.1 中文
iZotope RX6 Audio Editor Advanced(音頻修復(fù)工具) v6.0 安裝特
相關(guān)文章
-
FL Studio20插件包 V20.8 最新免費(fèi)版
FL Studio20插件包是一款針對(duì)水果軟件所推出的輔助插件全集。該插件包包含了多種實(shí)用插件套裝,包含Maximus全功能壓限器、Harmor強(qiáng)大的加/減法合成器、音頻編輯和錄音體插...
-
JZAudioMaster 金舟音頻大師 v2.1.8 綠色免費(fèi)版
金舟音頻大師有豐富的功能可以使用,可滿足您的各種音頻處理需求,為用戶提供強(qiáng)大的音頻處理和編輯功能,助您輕松完成各種音頻項(xiàng)目,這款軟件中有豐富的專業(yè)功能可以讓大家...
-
Steinberg Cubase Pro v14.0.20 x64 中文完整免費(fèi)版(Team V.R/R2R)
Cubase 14 Pro 是一次重大的更新,涵蓋了在音序器各個(gè)方面的眾多改進(jìn),Cubase 14 通過開創(chuàng)性的功能、簡(jiǎn)化的工作流程和直觀的設(shè)計(jì)解鎖新的創(chuàng)作可能性,以提升您的音樂制作體...
-
MP3剪切工具(Abelssoft MP3 Cutter Pro) v9.9.0 綠色免費(fèi)版
Abelssoft MP3 Cutter 綠色版是款簡(jiǎn)單好用的 MP3 文件剪切工具,能夠幫助廣大用戶以簡(jiǎn)便的方式,快速地將 MP3 文件剪切為多分片段,使其能夠更好進(jìn)行提取或上傳等操作,同...
-
Adobe Audition 2025(Au2025) v25.0 中文綠色免費(fèi)版 64位
Adobe Audition 一個(gè)專業(yè)的音頻工作站。 用業(yè)界最好的數(shù)字音頻編輯軟件建立、混合和設(shè)計(jì)音效效果。 Audition是一個(gè)綜合工具集,內(nèi)含多軌、波形和頻譜顯示,用于建立、混合...
-
MP3提取轉(zhuǎn)換器 V1.3.1 官方安裝版
MP3提取轉(zhuǎn)換器電腦端使用的格式轉(zhuǎn)換工具,支持裁剪、合并、鈴聲、調(diào)速、音量調(diào)節(jié)等多項(xiàng)功能,本站提供的是這款軟件的安裝版本...
下載聲明
☉ 解壓密碼:www.dbjr.com.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個(gè)軟件總是不能下載的請(qǐng)?jiān)谠u(píng)論中留言,我們會(huì)盡快修復(fù),謝謝!
☉ 下載本站資源,如果服務(wù)器暫不能下載請(qǐng)過一段時(shí)間重試!或者多試試幾個(gè)下載地址
☉ 如果遇到什么問題,請(qǐng)?jiān)u論留言,我們定會(huì)解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請(qǐng)購(gòu)買正版。
☉ 本站提供的FasterWhisperGUI(音頻處理工具) v0.8.0 安裝免費(fèi)版資源來(lái)源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。