CapsWriter一款本地離線語音輸入識(shí)別工具,通過本軟件可幫助用戶快速高效的對(duì)輸入的語音進(jìn)行識(shí)別并導(dǎo)出。在CapsWriter軟件中用戶只需按下caps鍵即可進(jìn)行語音的輸入,軟件會(huì)自動(dòng)的對(duì)內(nèi)容進(jìn)行識(shí)別,識(shí)別結(jié)果會(huì)以彩色顯示。
軟件介紹
這是 CapsWriter 簡陋的離線版,一個(gè) PC 端的語音輸入工具。
運(yùn)行后,只要按下鍵盤上的 大寫鎖定鍵,就會(huì)開始錄音,當(dāng)你松開 大寫鎖定鍵 時(shí),就會(huì)識(shí)別你的錄音,并將識(shí)別結(jié)果立刻輸入。
安裝方法
安裝 Python 后,在 cmd 窗口進(jìn)入本文件夾,運(yùn)行 pip install -r requirements.txt 安裝依賴
sherpa-onnx-bin 文件夾中已經(jīng)放置了在 Win10-64 端預(yù)先編譯的 sherpa-onnx 二進(jìn)制。
其它系統(tǒng)暫時(shí)需要按照 sherpa-onnx — sherpa 1.2 documentation 編譯后,放入 sherpa-onnx-bin 文件夾。
使用說明
運(yùn)行 01sherpa-onnx-server.py 腳本,會(huì)載入 Paraformer 模型識(shí)別模型(這會(huì)占用1GB的內(nèi)存,載入時(shí)長約十幾秒)
運(yùn)行 02-CapsWriter-client.py 腳本,它會(huì)打開系統(tǒng)默認(rèn)麥克風(fēng),開始監(jiān)聽按鍵
按住 CapsLock 鍵,錄音開始,松開 CapsLock 鍵,錄音結(jié)束,識(shí)別結(jié)果立馬被輸入(錄音時(shí)長短于0.3秒不算)
注意事項(xiàng)
目前使用的模型是 Paraformer 非實(shí)時(shí)模型,即錄完再轉(zhuǎn),因此錄音時(shí)間越長,上屏延遲越大。
主流性能的 Windows 筆記本,RTF 大約 0.06,即大約每 10s 錄音需 0.6s 轉(zhuǎn)錄時(shí)長。
本地模型對(duì)算力要求非常低,基本無需擔(dān)心性能問題
暫不支持標(biāo)點(diǎn)符號(hào),暫不支持逆標(biāo)準(zhǔn)化(如把中文數(shù)字轉(zhuǎn)阿拉伯?dāng)?shù)字)
為方便用戶檢查錄音質(zhì)量、識(shí)別效果,腳本默認(rèn)開啟了保存錄音,所有都被保存在了 audios 文件夾
標(biāo)簽: 語音識(shí)別
下載地址
精品推薦
-
Razer雷蛇雷音免激活碼專業(yè)版
詳情 -
Voicemod
詳情 -
超級(jí)音效變聲器軟件
詳情 -
Equalizer APO
詳情 -
Voicemeeter Banana
詳情 -
Virtual Audio Cable(虛擬聲卡)
詳情 -
iZotope RX7漢化中文破解版
詳情 -
錄音啦
詳情 -
studio one3機(jī)架中文破解版
詳情 -
VOCALOID5音源
詳情 -
iZotope RX7人聲提取軟件漢化中文版
詳情 -
Diamond Cut Audio Restoration Tools(音頻修復(fù)軟件)
詳情 -
logic pro x
詳情 -
FxSound漢化特別版
詳情 -
寒龍音頻音效大師
詳情 -
PreSonus Studio One 5
詳情
網(wǎng)友評(píng)論