

1 Daybyedream 4 天前 我现在转文字都白嫖千问 APP 里的 视频都不传直接提取音频发过去还是很快处理好的。 |
2 andyskaura OP @Daybyedream 大模型还是太权威了 我用 Whisper 本地识别,如果不做降噪和切片,和上下文优化,识别准度还差很大意思 |
3 arcsin1 4 天前 Whisper 本地识别 只能做些简单的。毕竟量不够 |
4 wednesdayco 4 天前 ?我刚给我对象弄了一个这个的 demo |
5 cairnechen 4 天前 memo ? |
6 indexError 3 天前 via Android 先别写了 认真的,再去做做调查 |
7 superhuai 3 天前 有没有好兄弟试试 AV |
8 Daybyedream 3 天前 @andyskaura 主要不着急不是批量自动化的话,千问客户端,音视频里转文字上传之后够用还方便的。我一般也推荐别人用这个。 |
9 andyskaura OP |
10 andyskaura OP @Daybyedream #8 忘 @了 |