欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

FasterWhisperGUI(音頻處理工具) v0.8.0 安裝免費(fèi)版

FasterWhisperGUI下載

  • 軟件大?。?span>1.7GB
  • 軟件語(yǔ)言:簡(jiǎn)體中文
  • 軟件類型:國(guó)產(chǎn)軟件
  • 軟件授權(quán):免費(fèi)軟件
  • 軟件類別:音頻處理
  • 應(yīng)用平臺(tái):Windows平臺(tái)
  • 更新時(shí)間:2024-07-03
  • 網(wǎng)友評(píng)分:
360通過 騰訊通過 金山通過

情介紹

FasterWhisperGUI是一款帶有 PySide6 的 fast_whisper 的 GUI 軟件,你可以將音頻或視頻文件轉(zhuǎn)錄為srt/txt/smi/vtt/lrc文件,將在線OpenAI-whisper模型轉(zhuǎn)換為ct2格式,并且提供VAD模型和whisper模型的所有參數(shù),目前支持whisperX,Democs 模型,whisper large-v3模型。

聽到Whisper,這個(gè)大家可能有點(diǎn)熟悉,這是OpenAI做的一個(gè)神經(jīng)網(wǎng)絡(luò)模型,可以在本地實(shí)時(shí)語(yǔ)音轉(zhuǎn)文字,用來(lái)翻譯和做字幕等,之前給大家介紹過一款叫做Constme-Whisper的軟件,可以快速進(jìn)行離線語(yǔ)音文字識(shí)別,還有GPU加速等等。

而faster-whisper-GUI增添了更多的特性,可以快速把音視頻文件轉(zhuǎn)成srt/txt/smi/vtt/lrc,支持Demucs、FastWhiper和whisperX、VAD-model這些技術(shù),簡(jiǎn)單來(lái)說(shuō),支持的可調(diào)整的選項(xiàng)要比之前推薦的工具更多一點(diǎn)。 

由于這類工具離線處理的特點(diǎn),所以體積都比較大,faster-whisper-GUI的本體有1.6個(gè)G,安裝完之后的占用又是6個(gè)多G,而且還不包括后續(xù)添加模型的大小,建議大家體驗(yàn)的時(shí)候,裝在空間富裕的盤里。 

如果是分離音頻和背景音樂的話,直接把文件丟進(jìn)來(lái)就行,試了一下效果還不錯(cuò),也可以單獨(dú)設(shè)置輸出的內(nèi)容。 

其他的就需要加載一下額外模型了,把模型加載的時(shí)候需要注意,有個(gè)處理設(shè)備的選項(xiàng),CPU還是CUDA,如果你用的不是英偉達(dá)的顯卡,選擇自動(dòng)就好了,不然會(huì)提示加載失敗。

模型也有多重選擇,如果上面帶有V3標(biāo)志,記得把這個(gè)開關(guān)打開。

模型也有多重選擇,如果上面帶有V3標(biāo)志,記得把這個(gè)開關(guān)打開。

來(lái)試試語(yǔ)音轉(zhuǎn)文字,如果你覺得自己的設(shè)備處理等待時(shí)間有點(diǎn)長(zhǎng),在軟件執(zhí)行的時(shí)候可以掛在后臺(tái)和切換到其他界面,在它的詳情頁(yè)面能看到輸出的具體信息,它的正確率還是比較高的,中英文混合與首字母大小寫這些細(xì)節(jié)都有。

這類機(jī)器識(shí)別和人一樣,識(shí)別率還不能做到100%正確,識(shí)別完之后,會(huì)有一些錯(cuò)誤需要手動(dòng)調(diào)整,在faster-whisper-GUI里,它會(huì)自己跳轉(zhuǎn)到字幕制作的界面,可以快速瀏覽調(diào)整,在這里分割不同說(shuō)話人的文本等等 

在設(shè)置里面,還有許多細(xì)節(jié)可以調(diào)整,調(diào)整音頻的默認(rèn)語(yǔ)言和翻譯,以及各種防止幻聽的參數(shù)。 

這個(gè)功能在一些視頻編輯軟件還是需要收費(fèi)的,或者需要云端處理,識(shí)別的準(zhǔn)確率也就那樣。

更新日志

0.8.0 改動(dòng)

修復(fù)沒有贊助渠道的 bug #126

升級(jí) faster-whisper 到 1.02 版本

添加 distil-large-v3 模型在線模式支持 #130

最新的 Distil-Whisper 模型 distil-large-v3 本質(zhì)上是為與 OpenAI 順序算法配合使用而設(shè)計(jì)的。

支持初始化更多 whisper 模型參數(shù)

音頻分段設(shè)置

max_new_tokens: 每個(gè)區(qū)塊生成的新令牌的最大數(shù)量。如果未設(shè)置,最大值將通過默認(rèn)的 max_size 設(shè)置。

chunk_length: 音頻段的長(zhǎng)度。如果不是 None,它將覆蓋 FeatureExtractor 的默認(rèn)chunk_size。

clip_timestamps: 逗號(hào)分隔的要處理的剪輯的時(shí)間戳列表(以秒為單位)開始,結(jié)束,開始,結(jié)束......。最后一個(gè)結(jié)束時(shí)間戳默認(rèn)為文件的結(jié)束。如果使用 clip_timestamps,將忽略 VAD 設(shè)置。

幻聽參數(shù)

hallucination_silence_threshold: 當(dāng) word_timestamps 為 True 時(shí),當(dāng)檢測(cè)到可能的幻覺時(shí),跳過長(zhǎng)于此閾值(以秒為單位)的靜默期。

其他設(shè)置

hotwords: 為模型提供的熱詞/提示短語(yǔ)。如果 prefix 不是 None,則無(wú)效。 你可以輸入提示詞,類似于:“the video is about comfyUI”。

常規(guī)

language_detection_threshold: 如果語(yǔ)言標(biāo)記的最大概率高于此值,則會(huì)檢測(cè)為該語(yǔ)言。

language_detection_segments: 語(yǔ)言檢測(cè)需要考慮的分段數(shù)量。

其他新特性:https://github.com/SYSTRAN/faster-whisper/releases/tag/v1.0.2

修復(fù) 復(fù)制字幕 功能的 bug

更新一些 UI 文字

停用 轉(zhuǎn)寫參數(shù) 頁(yè)面的 保存參數(shù)、讀取參數(shù) 功能

起止時(shí)間、說(shuō)話人 列居中顯示

升級(jí) pytorch 到 2.3.0 , CUDA12

提示

軟件需要完全卸載舊版之后安裝新版(cache文件夾可不做清理)

需要安裝 ffmpeg

使用 V3 模型時(shí),如果頻繁出現(xiàn)顯存溢出,請(qǐng)嘗試更新顯卡驅(qū)動(dòng)程序到最新或者回退到上一個(gè)穩(wěn)定版本,當(dāng)前版本(2024.5.29)測(cè)試結(jié)果穩(wěn)定。

載地址

下載錯(cuò)誤?【投訴報(bào)錯(cuò)】

FasterWhisperGUI(音頻處理工具) v0.8.0 安裝免費(fèi)版

      氣軟件

      關(guān)文章

      • FL Studio20插件包 V20.8 最新免費(fèi)版

        FL Studio20插件包是一款針對(duì)水果軟件所推出的輔助插件全集。該插件包包含了多種實(shí)用插件套裝,包含Maximus全功能壓限器、Harmor強(qiáng)大的加/減法合成器、音頻編輯和錄音體插...

      • JZAudioMaster 金舟音頻大師 v2.1.8 綠色免費(fèi)版

        金舟音頻大師有豐富的功能可以使用,可滿足您的各種音頻處理需求,為用戶提供強(qiáng)大的音頻處理和編輯功能,助您輕松完成各種音頻項(xiàng)目,這款軟件中有豐富的專業(yè)功能可以讓大家...

      • Steinberg Cubase Pro v14.0.20 x64 中文完整免費(fèi)版(Team V.R/R2R)

        Cubase 14 Pro 是一次重大的更新,涵蓋了在音序器各個(gè)方面的眾多改進(jìn),Cubase 14 通過開創(chuàng)性的功能、簡(jiǎn)化的工作流程和直觀的設(shè)計(jì)解鎖新的創(chuàng)作可能性,以提升您的音樂制作體...

      • MP3剪切工具(Abelssoft MP3 Cutter Pro) v9.9.0 綠色免費(fèi)版

        Abelssoft MP3 Cutter 綠色版是款簡(jiǎn)單好用的 MP3 文件剪切工具,能夠幫助廣大用戶以簡(jiǎn)便的方式,快速地將 MP3 文件剪切為多分片段,使其能夠更好進(jìn)行提取或上傳等操作,同...

      • Adobe Audition 2025(Au2025) v25.0 中文綠色免費(fèi)版 64位

        Adobe Audition 一個(gè)專業(yè)的音頻工作站。 用業(yè)界最好的數(shù)字音頻編輯軟件建立、混合和設(shè)計(jì)音效效果。 Audition是一個(gè)綜合工具集,內(nèi)含多軌、波形和頻譜顯示,用于建立、混合...

      • MP3提取轉(zhuǎn)換器 V1.3.1 官方安裝版

        MP3提取轉(zhuǎn)換器電腦端使用的格式轉(zhuǎn)換工具,支持裁剪、合并、鈴聲、調(diào)速、音量調(diào)節(jié)等多項(xiàng)功能,本站提供的是這款軟件的安裝版本...

      載聲明

      ☉ 解壓密碼:www.dbjr.com.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
      ☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
      ☉ 如果這個(gè)軟件總是不能下載的請(qǐng)?jiān)谠u(píng)論中留言,我們會(huì)盡快修復(fù),謝謝!
      ☉ 下載本站資源,如果服務(wù)器暫不能下載請(qǐng)過一段時(shí)間重試!或者多試試幾個(gè)下載地址
      ☉ 如果遇到什么問題,請(qǐng)?jiān)u論留言,我們定會(huì)解決問題,謝謝大家支持!
      ☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請(qǐng)購(gòu)買正版。
      ☉ 本站提供的FasterWhisperGUI(音頻處理工具) v0.8.0 安裝免費(fèi)版資源來(lái)源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。