
1 TimePPT PRO 拥抱脸上很多呀,找几个支持中文的试试应该能找到 https://huggingface.co/models?pipeline_tag=automatic-speech-recognition&sort=trending |
2 wangxiaodong 2025 年 9 月 2 日 离线工具的受制于 AI 大模型体量,估计都不怎么样,还得是 Google Gemini 的普通话云端 STT 效果比较好,网上甚至有免费识别声音并直接生成字幕的,你可以试试看: https://passed.app/main/more/online/speech-to-text/ |
3 ejin 2025 年 9 月 2 日 说到这个来个题外话,腾讯混元(元宝) app 识别率还行,虽然识别中英文混合的容易出错,但是它总是瞎编最后一句话。。。。我每次都眼睁睁看着他瞎编的最后一句话。。。。 |
4 woshizhuwow 2025 年 9 月 2 日 我一直用这个当输入法,用起来感觉效果还蛮不错,可以试试 https://github.com/HaujetZhao/CapsWriter-Offline |
5 avrillavigne 2025 年 9 月 2 日 用的 faster whisper 吗 |
6 Alexf4 2025 年 9 月 2 日 阿里的几个开源的模型识别的效果还行。 |
| img src="https://cdn.v2ex.com/avatar/82f0/79e3/686591_normal.png?m=1767671056" class="avatar" border="0" align="default" alt="supermama" data-uid="686591" /> | 7 supermama 2025 年 12 月 7 日 群主最后选了哪个开源的 语音转文本模型 |