这两天试用了几个语音输入法,最后选择了闪电说。 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
f1ynnv2
V2EX    输入法

这两天试用了几个语音输入法,最后选择了闪电说。

  •  
  •   f1ynnv2 5 天前 888 次点击
    简单说明一下近期试用的几个语音输入法,最先用的是 Typeless ,这个输入效果可以说是目前所有语音输入法里面效果最好的,尤其是中英文混输。而且让我特别震惊的是,我说的一些夹带的一些行业里老外的名字居然全也能识别对了。另外这软件从完成度来说各种细节非常完善,到目前为止都没遇到什么不爽的地方。唯一美中不足的可能就是两点,一是年费太贵,每个月 12 刀,还是挺肉疼的。第二个是它不太适合用来日常聊天,AI 味太重,当然用来 Vibe coding 是最合适的了。

    其次是闪电说/Lazytyper/Sayso 这类支持 SenseVoce Small 本地模型 + 各种在线语音识别模型包括 LLM 的后起之秀。因为都是调用相同的模型,我猜表现应该都差不多,为什么说我猜?因为我只跑起来了闪电说和 Sayso 两个,Sayso 印象不太记得了好像用着不顺手就卸载了。

    闪电说先用了本地模型,响应很快,感觉也够用,但是使用本地模型的时候要占用 800M 左右的内存,使用在线模型(我使用的是豆包流式 2.0+seed 2.0 lite)只占用不超过 50M 内存。所以这类输入法其实挺有优势的,在网络不佳的地方可以临时用离线模型应对,网络好的地方使用在线模型省内存就等于省电。而且对于注重隐私的人来说,可以完全使用本地模型。闪电说比较令人诟病的是不能关闭语音助手,感觉很鸡肋的功能(我猜后面可能会往这块里面加增值功能吧,所以强推)。另外闪电说和很多国产软件一样,主要功能强大+细节有待打磨。比如多屏的时候经常不显示语音提示框,语音识别吞首字等等。感觉这些都是些小问题,就看开发者是否能及时修复了。

    Lazytyper 试了半天也没下载成功 SenseVoice 模型就放弃了,想添加豆包模型试试也一直报错(奇怪的是相同的 appid 和 token 在闪电说里就正常),如果配置好模型我觉得应该和闪电说类似吧。不过简短试用的时候发现 Lazytyper 无法绑定 Fn + Space 组合键,这也是让我直接放弃进一步尝试的原因。 因为我用的京造键盘上有一个语音输入键,就是绑定的 Fn + Sapce 键,可以无缝绑定到 Typeless 、闪电说,但是就是绑定不到 Lazytyper 上。

    另外还试用了 AutoGLM ,整体来说中文识别效果不错,但是中英文混合识别不太行,明显不如豆包流式识别 2.0 。另外之前是能绑定 Fn + Sapce 组合键的但是会存在个小 bug 就是按下语音输入键(实际上就是这两个组合键)会立刻输入一个空格,所以每次用 AutoGLM 语入的时候,在开头和结尾都会有一个多余的空格。。群里给 AutoGLM 反馈了这个问题,他们发了个新版本解决了,解决的办法是禁止绑定 Fn+Space 组合键。。。。我????于是就卸载了 AutoGLM

    最近几天也高频的使用了 macOS 上微信的语音输入,尤其是看到它支持跨窗口的语音识别,还着实兴奋了一会,觉得可以不用安装其他语音输入法了,直接用微信的就行。但这两天实际使用下来,发现它只在纯中文,而且是比较短的内容识别的时候效果还可以。一旦输入大段或者是几段文字,就会有很多词是错误的。你基本上要回去改个五六处才能发出去,这样就感觉效率非常低了,感觉比 autoglm 和闪电说都差很大一些,更不用说和 typeless 相比了。如果是再夹杂着英文,那简直就是灾难。所以我的感觉微信这个只适合简短的聊天的时候使用吧。和上面其他输入法感觉完全不是同一个水平的。

    我最后的选择是使用闪电说,然后用豆包的大语言流式识别 2.0 模型。优势是有的时候笔记本在外面网络不好的时候可以用离线模型,但大部分时间就可以直接用豆包的这个语音识别模型。豆包的这个语音识别模型应该是公认的中文效果最好的,虽然中英文输入还有待提高。另外,闪电说结合 Karabiner-Elements 可以把苹果键盘的 Dictation 语音输入键映射到 FN ,然后直接使用这个键来控制语音识别,用起来还挺方便的。
    10 条回复    2026-03-01 16:14:59 +08:00
    coffeesun
        1
    coffeesun  
       5 天前 via Android
    这种最终会联网的,即便用的是离线,我担心的是只要最终联网,仍会把所有以往记录上传,因为毕竟文字占用很小,加个密上传,谁能知道呢
    root71370
        2
    root71370  
       5 天前 via Android
    豆包输入法发语音是真的很强
    billytom
        3
    billytom  
       4 天前
    语音输入+大模型输入都用国内的 AI ,你们也真是敢。。。

    到时候注册手机号+个人记忆一关联,它比你妈你老婆你自己都懂你
    signal
        4
    signal  
       4 天前
    我一直用的 LazyTyper 直接本地模型很爽的
    oldcai
        5
    oldcai  
    PRO
       4 天前
    @billytom LazyTyper 支持好几个本地 ASR 模型,和好几个国外有数据法律合规的 API 提供商。

    支持 Fn 作为快捷键,还支持鼠标,甚至蓝牙耳机播放键都可以作为快捷键
    f1ynnv2
        6
    f1ynnv2  
    OP
       4 天前
    @oldcai 是的 LazyTyper 支持的离线模型非丰富,可能是我没点对地方,都下载不成功。 快捷键看起来也很丰富,甚至支持鼠标按键绑定,但是键盘上的组合键如果能绑定 Fn+Space 就好了。
    locoz
        7
    locoz  
       4 天前 via Android
    闪电说有一点比较烦,就是它没有办法接自己部署的其他模型,只能用它自己集成那个,或者就是选择特定的线上模型。但实际上我感觉我自己部署那个千问三 TTS 的效果是挺好的,准确度会比它自己集成那个高很多,面对嘈杂环境的场景,效果也更好。
    f1ynnv2
        8
    f1ynnv2  
    OP
       4 天前
    locoz
        9
    locoz  
       4 天前 via Android
    @f1ynnv2 #8 我的意思是闪电说他没有办法去设置使用自己部署的模型。哦前面还说错了,是千问的 ASR ,不是 TTS 。
    Astralume
        10
    Astralume  
       4 天前 via iPhone
    再等豆包的 Mac 版本好久了,什么时候能出啊,我就抛弃其他语音输入法了
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1084 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 24ms UTC 18:43 PVG 02:43 LAX 10:43 JFK 13:43
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86