现在是不是到了给 AI 底层植入类似机器人三定律之类东西的时候了? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
xFrank
V2EX    问与答

现在是不是到了给 AI 底层植入类似机器人三定律之类东西的时候了?

  •  1
     
  •   xFrank 2 月 25 日 670 次点击
    另外,这个从技术上有可能实现么?
    6 条回复    2026-02-25 17:57:48 +08:00
    momocraft
        1
    momocraft  
       2 月 25 日
    路会很长, 现在的 LLM 连指示和数据都不区分
    sddyzm
        2
    sddyzm  
       2 月 25 日 via iPhone
    目测不可能,只能给像人一样的环境上的物理限制
    dobelee
        3
    dobelee  
       2 月 25 日
    看看最近 openai 、claude 、grok 、openclaw 的各种争议和官司,你觉得有可能吗?
    现在的 AI 也无法准确判断,比如昨天 openclaw 删库的事件。

    另外,即使 AI 最终彻底解决幻觉,也难以做到三定律。
    如电车难题和罐中脑。为了执行<不让人类受到"任何"伤害>,而囚禁保护人类,是否合理。
    cmdOptionKana
        4
    cmdOptionKana  
       2 月 25 日 via Android
    看了原著,这个设定本身就是自相矛盾的,是很巧妙的小说技巧,可以让故事很有趣,但这个在现实中是没有意义的。
    Zhuzhuchenyan
        5
    Zhuzhuchenyan  
       2 月 25 日
    最简单的拒绝回答都做不到
    换句话说,只要模型开源,总有方法越狱的
    参考: https://huggingface.co/blog/mlabonne/abliteration
    xFrank
        6
    xFrank  
    OP
       2 月 25 日
    @cmdOptionKana 我说的是类似,总要有些“底层代码”来防止 AI 不能干某些事
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5896 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 06:34 PVG 14:34 LAX 22:34 JFK 01:34
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86