有没有办法让 AI 不胡扯 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
koto
V2EX    OpenAI

有没有办法让 AI 不胡扯

  •  
  •   koto 2024-04-20 19:30:26 +08:00 2433 次点击
    这是一个创建于 616 天前的主题,其中的信息可能已经有所发展或是发生改变。
    比如我用 AI 学外语,让 AI 讲一个选择题,或者给我符合特定规律的词汇表。AI 偶尔会自由发挥,内容虽然看起来丰富,但有小错误。比如明明是动词它告诉我这是副词的情况。
    另外去问 AI 的一些问题,AI 看似回答的,而且道理似乎通,其实是错的。

    有没有办法,或者某些 AI 工具虽然可以蠢一点,但是不会胡扯或犯错的呢?
    9 条回复    2024-04-23 13:02:20 +08:00
    lithiumii
        1
    lithiumii  
       2024-04-20 19:38:46 +08:00 via Android
    简单来说就是让它概括你提供的资料,而不是让它回答你的问题
    Rorysky
        2
    Rorysky  
       2024-04-20 19:40:44 +08:00
    ai 幻觉现象是早期的技术难点
    geelaw
        3
    geelaw  
       2024-04-20 20:15:55 +08:00
    古代人曾经认为日心说是胡扯,所以即使是人,想要准确定义“胡扯”还是很困难的。另外有一些工作 https://arxiv.org/abs/2401.11817 传达的信息是:LLM provably hallucinates. 但我本人没有认真读过这篇文章,所以它的形式化模型是否适合用来解释 LLM ,我无定论。
    xmuli
        4
    xmuli  
       2024-04-21 10:51:08 +08:00 via iPhone   1
    AI 的缺陷 1. 不知道自己的能力边界 2.也不知道物理世界的真实规矩 ---from 某外籍院士的前几天的分享
    xmuli
        5
    xmuli  
       2024-04-21 10:56:00 +08:00 via iPhone   1
    估计一段时间内无法彻底解决,若是做某垂直领域,可微调和迭代训练,努力提高正确率,用户感受体验截然不同。 一般通用模型正确率可达到 85 分,上而到 95 就需堆叠人力资源,也能做到,于是一个商业产品就出现了。
    shuson
        6
    shuson  
       2024-04-22 11:52:09 +08:00
    用 lora 重新训练一个或者简单做个 RAG
    BlackSiao
        7
    BlackSiao  
       2024-04-22 15:20:08 +08:00   1
    这里涉及到一点微调的方面了,最简单的办法就是调用 LLM 的时候把温度调低点,看看能不能满足你的需求;其次就是做个 RAG ,提前把相应的知识存好让它到时候随机应变调用。不过最经济的办法应该还是去网上搜一下有没有人已经根据你的需求调出一个特定的项目来,比如学外语的肯定有很多已调好的
    darson
        8
    darson  
       2024-04-23 09:44:19 +08:00   1
    最近看了 hinton 的一个演讲,他说幻觉是所有神经网络的特性,可以降低但是无法杜绝。人也不例外,人对于短期发生的事情通常能够比较准确的召回,但是对于长期之前的事,事实上经常会对没发生过的事情深信不疑。例如曼德拉效应,或者孟子的故天将降大任于‘斯’人也 vs 故天将降大任于‘是’人也。所以比较简单的做法就是提供上下文,让 LLM 从中去找答案并提供出处。
    MapleEve
        9
    MapleEve  
       2024-04-23 13:02:20 +08:00
    人也会有幻觉,AI 出幻觉是这个模型还太垃圾
    你让 Opus 跑推理看看,幻觉概率很低很低
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2664 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 24ms UTC 07:05 PVG 15:05 LAX 23:05 JFK 02:05
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86