场景:Win11
内容本地部署,不跟网络有通信传输关于内容的东西
可选择声音来源( 3.5mm 麦克风,USB 麦克风,蓝牙麦克风这些设备)
后台常驻
只要有声音来源(普通话)就转换成文字,上屏,而不管当前焦点是什么程序,什么窗口
使用者就可以用 3.5mm 带 PTT 功能的麦克风,辅助打中文字,按下 PTT 键,说话,就把文字粘上去了
有这样的本地部署程序吗?
看过迅飞有这样类似功能的键盘、鼠标硬件产品,但是 OP 不想因为这个联他们家的服务器,和大多数人用 RIME 小狼毫一样的原因,所以就不考虑联网功能的其它品牌现成产品了。。。
如果没有合适的,OP 真要这么实现,那么各位可以指教 OP ,有什么现成的套件带 SDK ,提供开发接口,可以很接近地去实现呢?
![]() | 1 codehz 325 天前 win10/11 不是自带一个语音转文字吗,那玩意是可以断网运行的啊,初次使用需要下载模型,下载完了就是纯本地的 |
2 SzgSw5zGyN1iy OP @codehz #1 这个以前有用过,WSR 在以后版本的 WIN11 还会变化( 22H3 已经提到后继版本会移除这个功能),这些先不管,场景是要按物理按键,不用鼠标对准悬浮工具条点击开始,点击结束 想要有一个后台长久拾音转换实现 |
3 SzgSw5zGyN1iy OP 上面打错字了,是 23H2 版本 |
4 katwalk 325 天前 有现成的,但是是按住键盘按键 |
5 hj18 325 天前 whisper 可以吗?我用过,本地部署。 |
6 SzgSw5zGyN1iy OP |
![]() | 7 debuggerx 325 天前 阿里的 FunASR 可以本地部署,cpu 版本实测效果还不错,就是相比成熟的 ASR 云服务可定制性差一点。 https://github.com/modelscope/FunASR/blob/main/README_zh.md |
![]() | 8 Do1phln 324 天前 PaddleSpeech 之前本地部署过一次,效果还可以,就是对算力可能有一定要求 |
9 Hozoy 324 天前 我倒是想更进一步,可以做到实时语音转文字并且根据上下文拟人双语翻译的 |
![]() | 10 hellomacos 324 天前 |