Whispe本地語(yǔ)音轉(zhuǎn)文字工具 v1.8.1 官方綠色免費(fèi)版
359KB / 03-14
Buzz(離線語(yǔ)音轉(zhuǎn)文字工具) v0.7.0 免費(fèi)安裝版
166MB / 02-16
小圓象語(yǔ)音文字轉(zhuǎn)換 v2.2.1 官方安裝版
1.21MB / 10-30
火山引擎神經(jīng)網(wǎng)絡(luò)語(yǔ)音合成工具 v0.1 中文免費(fèi)綠色版
12.9MB / 10-10
AI配音專家V2版(文字轉(zhuǎn)語(yǔ)音) 2.1.0 免安裝綠色版 BY吾愛(ài)破解
182MB / 11-03
智能識(shí)別(文字語(yǔ)音識(shí)別) V3.50 綠色免費(fèi)版
32MB / 08-30
轉(zhuǎn)轉(zhuǎn)大師文字轉(zhuǎn)語(yǔ)音 V1.0.0.8 官方安裝版
34.2MB / 01-06
轉(zhuǎn)易俠語(yǔ)音轉(zhuǎn)文字 v2.0.0.2 官方安裝版
35.6MB / 02-26
小七文字轉(zhuǎn)語(yǔ)音 v2.3 免費(fèi)綠色版
38.3MB / 06-17
飛轉(zhuǎn)文字轉(zhuǎn)語(yǔ)音 v1.7.9 官方安裝版
835KB / 06-29
-
-
-
訊飛語(yǔ)音助手(鼠標(biāo)/鍵盤(pán)語(yǔ)音錄入與翻譯) v4.2.33.20 免費(fèi)安裝版 音頻處理 / 360MB
-
-
ACE Studio(AI歌聲合成)v1.9.9 官方安裝版 音頻處理 / 213MB
-
易譜ziipoo軟件 v2.7.1.9 linux版 音頻處理 / 328MB
-
iZotope Tonal Balance Control 2(色調(diào)平衡控制插件) v2.10.0 免 音頻處理 / 61.7MB
-
Adobe Audition 2025(Au2025) v25.2.0.123 中文免費(fèi)安裝正式版 6 音頻處理 / 733MB
-
Native Instruments Kontakt 8 v8.3.0 最新中文綠色免費(fèi)版 音頻處理 / 1.2GB
-
Native Instruments Kontakt 8 v8.3.0 完整安裝免費(fèi)版(附文件+教 音頻處理 / 1.2GB
詳情介紹
Constme-Whisper是一款本地離線語(yǔ)音轉(zhuǎn)文字工具,支持 GPU、支持實(shí)時(shí)語(yǔ)音轉(zhuǎn)換。Whisper是由 OpenAI 訓(xùn)練并開(kāi)源的神經(jīng)網(wǎng)絡(luò),在英語(yǔ)語(yǔ)音識(shí)別方面的穩(wěn)健性和準(zhǔn)確性接近人類水平whisper.cpp 項(xiàng)目是將 Whisper 移植到 C/C++ 中,而今天介紹的 Const-me/Whisper 項(xiàng)目則是 whisper.cpp 在 Windows 上的實(shí)現(xiàn),并增加了顯卡的支持,使得速度大幅提升。歡迎需要此款工具的朋友前來(lái)下載使用。
軟件介紹
Constme-Whisper是OpenAI的Whisper自動(dòng)語(yǔ)音識(shí)別ASR模型的衍生項(xiàng)目。
Constme-Whisper可以在Windows上使用,支持高性能GPGPU處理,可以利用GPU加速處理。
本體是個(gè)啟動(dòng)器,需要結(jié)合一個(gè)語(yǔ)言識(shí)別模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large)使用,模型越大,效果越好,但相對(duì)的速度也更慢。
軟件特點(diǎn)
基于DirectCompute的與供應(yīng)商無(wú)關(guān)的GPGPU;該技術(shù)的另一個(gè)名稱是“Direct3D 11 中的計(jì)算著色器”
純C++實(shí)現(xiàn),除了基本的操作系統(tǒng)組件外,沒(méi)有運(yùn)行時(shí)依賴關(guān)系
比OpenAI的實(shí)現(xiàn)快得多。
混合 F16 / F32 精度:Windows 需要自 D3D 版本 10.0 起支持緩沖區(qū)R16_FLOAT
內(nèi)置性能探查器,用于測(cè)量單個(gè)計(jì)算著色器的執(zhí)行時(shí)間
內(nèi)存使用率低
用于音頻處理的媒體基礎(chǔ),支持大多數(shù)音頻和視頻格式(Ogg Vorbis除外), 以及大多數(shù)在Windows上運(yùn)行的音頻捕獲設(shè)備(除了一些專業(yè)設(shè)備,它們只實(shí)現(xiàn)ASIO API)。
用于音頻捕獲的語(yǔ)音活動(dòng)檢測(cè)。
易于使用的 COM 樣式 API,nuget 上提供的慣用 C# 包裝器
提供預(yù)構(gòu)建的二進(jìn)制文件
下載 Whisper 模型
而 Const-me 的這個(gè)名為 Whisper 的項(xiàng)目,目前僅提供 Windows 版本,使用簡(jiǎn)單,需要先下載模型:
開(kāi)發(fā)者推薦 ggml-medium.bin,因?yàn)橐恢痹谑褂眠@個(gè)模型進(jìn)行測(cè)試,1.53 GB 大小。
使用 Whisper
在 Model Path 里面選擇你下載的模型,然后選擇 GPU 就能進(jìn)入軟件了。
之后,就可以選擇通過(guò)麥克風(fēng)實(shí)時(shí)轉(zhuǎn)換,或者使用音頻文件比如 MP3 來(lái)轉(zhuǎn)換為文字了:
青小蛙隨便測(cè)試了一個(gè)極客灣的視頻(僅下載了音頻),效果如下:
準(zhǔn)確度很高,基本上比較滿意。
由于是在虛擬機(jī)中測(cè)試,顯卡性能有限,所以時(shí)間不具有參考性。
不過(guò),開(kāi)發(fā)者的測(cè)試是在裝有 GeForce 1080Ti GPU 的臺(tái)式電腦上,中型模型,3 分 24 秒語(yǔ)音使用 PyTorch 和 CUDA 轉(zhuǎn)錄需要 45 秒,但使用這個(gè)和 DirectCompute 只需要 19 秒。而 @JoeCubber 同學(xué)測(cè)試的是 11:31 分鐘的音頻,耗時(shí)1分26秒完成。
當(dāng)然,你需要有顯卡。
實(shí)在是沒(méi)想到,挖礦之后,顯卡又有了用武之地。
更新日志
更新了文檔和 GUI 中的模型源 URL
可靠性增強(qiáng),麥克風(fēng)捕獲不太可能轉(zhuǎn)換到“停滯”狀態(tài)并丟棄音頻
注意:
需要不低于Win8.1的64位Windows
文件main.exe為命令行調(diào)用工具
下載地址
Constme-Whisper(離線語(yǔ)音識(shí)別轉(zhuǎn)文字) v1.12 綠色免費(fèi)版(含完整模型)
人氣軟件
最強(qiáng)伴奏與人聲一鍵分離工具Ultimate Vocal Remover GUI(UVR5) v
PreSonus Studio One 6 Professional V6.6.2 中文永久免費(fèi)版(附
IBM ViaVoice Pro v9.1 簡(jiǎn)體中文版
Studio One6機(jī)架效果包插件 V6.0.2 中文免費(fèi)版(附使用教程)
Adobe Audition 2024(Au2024) v24.6.0.069 中文安裝免費(fèi)版 64位
PreSonus Studio One Pro 7 v7.1.1 中文完整免費(fèi)版(附安裝教程)
大餅AI變聲 v2.5.0 官方安裝版
阿里開(kāi)源語(yǔ)音模型CosyVoice 0721 整合包 免費(fèi)版
終極伴奏人聲提取工具 Ultimate Vocal Remover(UVR) v5.5.1 中文
iZotope RX6 Audio Editor Advanced(音頻修復(fù)工具) v6.0 安裝特
相關(guān)文章
-
FL Studio20插件包 V20.8 最新免費(fèi)版
FL Studio20插件包是一款針對(duì)水果軟件所推出的輔助插件全集。該插件包包含了多種實(shí)用插件套裝,包含Maximus全功能壓限器、Harmor強(qiáng)大的加/減法合成器、音頻編輯和錄音體插...
-
JZAudioMaster 金舟音頻大師 v2.1.8 綠色免費(fèi)版
金舟音頻大師有豐富的功能可以使用,可滿足您的各種音頻處理需求,為用戶提供強(qiáng)大的音頻處理和編輯功能,助您輕松完成各種音頻項(xiàng)目,這款軟件中有豐富的專業(yè)功能可以讓大家...
-
Steinberg Cubase Pro v14.0.20 x64 中文完整免費(fèi)版(Team V.R/R2R)
Cubase 14 Pro 是一次重大的更新,涵蓋了在音序器各個(gè)方面的眾多改進(jìn),Cubase 14 通過(guò)開(kāi)創(chuàng)性的功能、簡(jiǎn)化的工作流程和直觀的設(shè)計(jì)解鎖新的創(chuàng)作可能性,以提升您的音樂(lè)制作體...
-
MP3剪切工具(Abelssoft MP3 Cutter Pro) v9.9.0 綠色免費(fèi)版
Abelssoft MP3 Cutter 綠色版是款簡(jiǎn)單好用的 MP3 文件剪切工具,能夠幫助廣大用戶以簡(jiǎn)便的方式,快速地將 MP3 文件剪切為多分片段,使其能夠更好進(jìn)行提取或上傳等操作,同...
-
Adobe Audition 2025(Au2025) v25.0 中文綠色免費(fèi)版 64位
Adobe Audition 一個(gè)專業(yè)的音頻工作站。 用業(yè)界最好的數(shù)字音頻編輯軟件建立、混合和設(shè)計(jì)音效效果。 Audition是一個(gè)綜合工具集,內(nèi)含多軌、波形和頻譜顯示,用于建立、混合...
-
MP3提取轉(zhuǎn)換器 V1.3.1 官方安裝版
MP3提取轉(zhuǎn)換器電腦端使用的格式轉(zhuǎn)換工具,支持裁剪、合并、鈴聲、調(diào)速、音量調(diào)節(jié)等多項(xiàng)功能,本站提供的是這款軟件的安裝版本...
下載聲明
☉ 解壓密碼:www.dbjr.com.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個(gè)軟件總是不能下載的請(qǐng)?jiān)谠u(píng)論中留言,我們會(huì)盡快修復(fù),謝謝!
☉ 下載本站資源,如果服務(wù)器暫不能下載請(qǐng)過(guò)一段時(shí)間重試!或者多試試幾個(gè)下載地址
☉ 如果遇到什么問(wèn)題,請(qǐng)?jiān)u論留言,我們定會(huì)解決問(wèn)題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請(qǐng)購(gòu)買正版。
☉ 本站提供的Constme-Whisper(離線語(yǔ)音識(shí)別轉(zhuǎn)文字) v1.12 綠色免費(fèi)版(含完整模型)資源來(lái)源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。