有兄弟做过 AI Translator 没有?用什么 LLM 和框架, 效果怎么样?谢谢了! - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ChatGOP
V2EX    问与答

有兄弟做过 AI Translator 没有?用什么 LLM 和框架, 效果怎么样?谢谢了!

  •  
  •   ChatGOP 123 天前 1036 次点击
    这是一个创建于 123 天前的主题,其中的信息可能已经有所发展或是发生改变。
    9 条回复    2025-06-10 20:58:48 +08:00
    wyntalgeer
        1
    wyntalgeer  
       123 天前
    16B 以下的小模型都行
    ChatGOP
        2
    ChatGOP  
    OP
       123 天前
    @wyntalgeer 可以实时翻译吗?可以 text->voice 以及 voice->text 翻译吗?
    wyntalgeer
        3
    wyntalgeer  
       123 天前
    @ChatGOP Text-To-Text 没有问题。你说的 text->voice 是 TTS 看一下酒馆,voice->text 是 STT 我不了解是否有现成的方案
    TTS 和 STT 如果做产品,那都是要自建的
    Ta0Ta0Ta0
        4
    Ta0Ta0Ta0  
       123 天前
    看啥场景,在中英文翻译上,NMT 足够了,上 LLM 有点奢侈。
    ChatGOP
        5
    ChatGOP  
    OP
       123 天前
    @Ta0Ta0Ta0 一般文件翻译 LLM 和 NMT 哪个好些? NMT 可以做到实时吗?
    conhost
        6
    conhost  
       123 天前
    @ChatGOP text->voice 以及 voice->text 翻译目前还没有现成的方案,还处于研究阶段,如果你不介意质量也可以用。现有的这些翻译是通过文本翻译前面或后面加 TTS 或者 ASR 实现。
    另外通用领域 NMT 与 LLM 的效果是持平甚至不如的,某些特定领域可能 NMT 的效果会好一点。另外不太明白你这个实时指的是什么?
    ChatGOP
        7
    ChatGOP  
    OP
       123 天前
    @conhost 看到 Google TTS 和 Google STT 都有, 可精度不高。 实时指的是比如 Chatbot 里面打一段文字,立即就翻译出来了。有必要从 BERT 转换成 GPT 吗?
    conhost
        8
    conhost  
       123 天前
    @ChatGOP TTS 和 STT 技术是现成的,就是工程构建的过程。另外你说的实时的话,不进行特定优化的话,NMT 的翻译一句话的时延大概在 500ms ,LLM 采用的是相同的解码方案,解码时间也差不多,但是 LLM 模型更大,计算更耗时。但是现在硬件设备针对 LLM 也有一定的针对性的优化,所以基本上是能保证的。
    pike0002
        9
    pike0002  
       123 天前
    用 Google Gemini 就可以吧,1.5 Flash 都是免费的(不是特别长的话,特别长可以截断分批处理),2.0 也不是很贵。如果要转 voice ,可能就是先用 Gemini 翻完再用 TTS (知识比较有机器感)?

    我使用 Gemini 比较多,觉得效果比较好。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2539 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 04:40 PVG 12:40 LAX 21:40 JFK 00:40
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86