Musk 搞出来 Grok 好像效果很不错,免费版感觉比 Claude 付费版 Sonnet 还强,至少没有那么经常胡说八道 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
drymonfidelia
V2EX    程序员

Musk 搞出来 Grok 好像效果很不错,免费版感觉比 Claude 付费版 Sonnet 还强,至少没有那么经常胡说八道

  •  1
     
  •   drymonfidelia 363 天前 4041 次点击
    这是一个创建于 363 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我给 Claude 贴了一段我写的有 Bug 的 Unity 代码,他乱改了一遍,然后我觉得是调用顺序的问题,不太熟悉 Unity 的生命周期,问它哪个事件先触发,他按照我有 Bug 的代码一本正经地胡编了一个错的顺序,别的我不知道,它把 Start 放在 Awake 前面我还是看出它在胡说了,重问还是一样。

    发给 Grok ,Grok 知道要上网搜索,一下就找出了 Bug 还给出了文档地址

    19 条回复    2024-12-31 12:04:28 +08:00
    dobelee
        1
    dobelee  
       363 天前 via iPhone
    grok 总体可以的,t1 梯队,但该有的问题也不少,也是几大里交互最粗糙的。黑五刚订阅了 x 没过两天就惨遭背刺,12 月的 app 也鸽了。
    R4rvZ6agNVWr56V0
        2
    R4rvZ6agNVWr56V0  
       363 天前
    没感觉,还是觉得 Claude Sonnet 3.5 更胜一筹
    iorilu
        3
    iorilu  
       363 天前
    模型 100 多 G 阿, 怎么跑的
    yuhaofe
        4
    yuhaofe  
       362 天前
    Grok 某些方面确实强一些,问了一个现实中的数学问题,只有 grok 在我纠正一次之后答对,gpt4o 、sonnet3.5 、gemini1.5pro 连续引导多次给的答案还是错的

    问题如下,大家也可以试试:
    tangle 是一种玩具,由多个弧形的塑料节段连接而成,首尾相连,每个节段可以 360 度旋转,每段是一个 1/4 圆环形状,两端有连接结构,可以和相邻段扣合,横截面是圆形。
    假设它有 18 个节段,任选一个段,它与左右相邻的分别 3 个段在任意空间角度都不会在非连接面上发生相撞,与剩下的 11 个段都有可能相撞发出声音,如果我想通过包裹塑料套让它静音,我至少要包裹多少段?

    正确答案是 12 ,每包裹两段空出一段

    P.S. 其实第二段话的前提也不该给,只留下最后的问题,但得把 tangle 的空间特性完全描述清楚,不太现实,AI 也答不上来
    R4rvZ6agNVWr56V0
        5
    R4rvZ6agNVWr56V0  
       362 天前   1
    @yuhaofe 我尝试了 o1 ,回答最终结果是:最少需要包裹 14 段才能避免任何碰撞发出声音。
    R4rvZ6agNVWr56V0
        6
    R4rvZ6agNVWr56V0  
       362 天前   1
    @yuhaofe grok 我也试过了,最终回答是:至少需要包裹 6 个节段来确保玩具在旋转时不会发出声音。
    yuhaofe
        7
    yuhaofe  
       362 天前
    @GeekGao 我是纠正了一次(指出它的方案里可能相撞的段),grok 给出了正确的数字和方案,虽然解释有一点小问题,其他模型不管怎么纠正给的都是错的
    tt83
        8
    tt83  
       362 天前
    跟 twitter 绑一起很烦,分散注意力
    sonu648
        9
    sonu648  
       362 天前 via iPhone
    4UyQY0ETgHMs77X8
        10
    4UyQY0ETgHMs77X8  
       362 天前   1
    试了下 o1 ,第一次 18 ,我质疑后回答 12 ,再次质疑后回答仍旧 12 ,询问是否确定依然回答 12 ,当我说这是不对的时最后回答了 9 ,图片地址 http://img.oneself.icu/uploads/676f852e02589_image.png ,再次否定 9 然后又给出了 12 的答案
    yuhaofe
        11
    yuhaofe  
       362 天前
    @q1102389095 感觉就是因为这个问题是个首尾相连的环形,需要一定的迭代思考,AI 很难一次性答对,有了一次错误的思考结果之后,才更容易推理出正确的答案。
    ffgrinder
        12
    ffgrinder  
       362 天前 via iPhone   1
    @yuhaofe 说句实话,你这个描述和问题都挺抽象的,我看了半天,又去搜索了这个玩具的实物,才理解了你的 360 度是基于哪个轴,而且作为一个硬物体,我不理解你说的静音又是什么,我更倾向于你的问题出的有问题
    yuhaofe
        13
    yuhaofe  
       362 天前
    @ffgrinder 理解问题也是 AI 能力的一环,AI 的训练数据里关于 tangle 的信息也不少,而且我第二段给出的信息其实也足够了,就算不是 tangle 也应该能算出来
    最理想的情况下我问出“我想通过包裹塑料套让 tangle 玩具静音,我至少要包裹多少段?”这个一句话,AI 就应该能答上来
    yuhaofe
        14
    yuhaofe  
       362 天前
    @ffgrinder 我的问题其实来自于很实际的场景,tangle 可以在 18 个段的连接下任意扭曲,扭曲过程中硬塑料段就可能碰到一起发出声音(忽略轻微关节旋转噪音的情况下),在图书馆、办公室场景下就不合适拿出来把玩
    tangle 官方有推出包裹硅胶的静音版,段相撞时几乎没有声音,但在国内没有直接卖的,我就想到了这个问题,不过确实是有实物拿在手里才好验证 AI 的答案,很难凭空想象
    yuhaofe
        15
    yuhaofe  
       361 天前
    @GeekGao
    @sonu648
    @q1102389095
    @ffgrinder

    完了,12 好像也不是正确答案,至少这个方案不对
    目前唯一能确定的是连续包裹 14 段是可行的,剩下的 4 段互相不会相撞,与包裹了的 14 段相撞时也不会发出声音
    R4rvZ6agNVWr56V0
        16
    R4rvZ6agNVWr56V0  
       361 天前   1
    @yuhaofe 哈哈哈哈哈 ,有点意思
    yuhaofe
        17
    yuhaofe  
       361 天前
    @ffgrinder 我抽象成下面这个问题还是没有 AI 能直接完全答对,而且看它们对问题本身的理解都是没问题的

    一个环形由 18 个段构成,每个段都和其前 3 段、后 3 段不存在吸引关系,与剩下的 11 个段存在互相吸引关系,通过标记一个段可以使其丧失与其他所有段的互相吸引关系,至少需要标记多少段才可以让所有段之间都不存在吸引关系?
    sonu648
        18
    sonu648  
       360 天前 via iPhone   1
    4UyQY0ETgHMs77X8
        19
    4UyQY0ETgHMs77X8  
       359 天前
    《实践是检验真理的唯一标准》
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     967 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 30ms UTC 19:27 PVG 03:27 LAX 11:27 JFK 14:27
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86