
1 fulln 3 天前 可以接个本地部署的 whisper ,音频模型一般比较小, 再接个免费的 LLM 如小米, |
2 MindMindMax 3 天前 MacOS 内置语音输入,免费 |
3 Hilong 3 天前 |
4 tianyu1718 OP @fulln 推荐用 sota 模型,警惕沉默成本 二楼那哥们的方案走内置语音,免费,但效果拉 |
5 tianyu1718 OP @MindMindMax 那效果我受不了啊,你试试我这个方案,真的不一样,完全停不下来 |
6 tianyu1718 OP @Hilong 已修复,感谢反馈 |
7 MindMindMax 3 天前 @tianyu1718 不想花钱,ASR 需求刚性较弱 |
8 Hilong 3 天前 @tianyu1718 #6 能支持一下本地的语音模型吗,我本地部署了 whisper |
9 dufu1991 3 天前 由于选择困难症,打开百炼一大堆模型,不知道选择哪个,然后就没心思继续下去了。这些大厂做产品的能不能把我当成傻子,还要我一个一个去了解你这么多模型的各项区别,太高看我了。 |
10 tianyu1718 OP @dufu1991 不需要选模型,我都给你选好了,你去申请个 key 填进去就行了,百炼乱七八糟的非常难看 |
11 tianyu1718 OP @tianyu1718 妈的,百炼这设计的跟脑残一样,我刚看这哥们说找不到,我寻思去找个 url ,结果我也迷路了 阿里云百炼->API 参考(这里有个指引,点北京或者新加坡)->创建业务空间,创建 API Key 相比于 openrouter ,这就跟吃屎一样,不过这模型确实不错 |
12 tianyu1718 OP @Hilong 不知道你本地部署的服务支不支持流式语音识别,源代码我开放了,你直接拉到本地让 AI 帮你扩展试试 |
13 dingawm 2 天前 你 vibe 用语音是只在家里吗?在公司或者外面没办法用吧 |
14 ahu 2 天前 闪电说,纯本地的 |