Claude Opus 似乎是官方降智了,洗车题失败 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
germain
V2EX    Claude

Claude Opus 似乎是官方降智了,洗车题失败

  •  
  •   germain 10 小时 58 分钟前 2445 次点击
    如图
    16 条回复    2026-04-09 14:33:49 +08:00
    b309f3337
        1
    b309f3337  
       10 小时 26 分钟前   1
    我最近也发感觉 opus 4.5 好像有点变傻了,以前让它做的很多功能一次性就能解决了,甚至超出我的预料,最近好几次也不算是很复杂的问题,来回好几次都搞不定
    murmur
        2
    murmur  
       10 小时 22 分钟前   2
    这题我见过攻击性最强的回答是米哈游那个 AI ,直接扛着车去
    germain
        3
    germain  
    OP
       10 小时 12 分钟前
    @b309f3337 甚至有几个 Opus 没能干净解决的历史问题我用免费的 qwen3.6 plus 搞定了,这几天 Claude 问题一堆,还有很多 billing 相关的问题他们的那个 fin bot 无法解决,说让我等真人 email 联系,都一周过去了,音讯全无


    @murmur 这题是快速验证模型真正算力的最简单方法了,不过这扛过去的模型我是不大敢用,怕闪着钱包
    jchencode
        4
    jchencode  
       10 小时 1 分钟前   1
    Opus 确实降智了,应该是跟新出的 Glasswing 有关系,Glasswing 吃掉了很多算力。

    而且,Glasswing 模型推理能力比 Opus 高出几十个百分点。。。。

    [img]https://ft.wzznft.com/i/2026/04/09/e4iicp.jpg[/img]
    99185302
        5
    99185302  
       9 小时 56 分钟前   1
    @b309f3337 跟 GPT 和 Gemini 聊过这种问题,得出的结果都差不多,后台会有一个叫"用户画像"的用户数据,模型会根据这个用户画像决定第一时间调用的算力和子模型。简单点说就是如果用户画像倾向于逻辑和推理,那模型会优先调用逻辑和推型的子模型会给到更高的算力;如果用户画像倾向于闲聊的话,就会优先调用简单的聊天子模型,只需要低算力就足够的这种。还有就是别拿这种问题去测试 AI ,你测试越多,就越会变傻,闲聊越多也会越来越傻。
    letwewell
        6
    letwewell  
       9 小时 30 分钟前
    对牛弹琴不能怪牛听不懂,只怪弹琴的人有问题
    csfreshman
        7
    csfreshman  
       9 小时 8 分钟前   1
    估计算力不够,新出的模型,延迟发布,会不会是算力不够导致的? opus 4.6 使用没这个感觉,洗车问题也回答正确。
    satoru
        8
    satoru  
       9 小时 2 分钟前   2
    最官方 status https://status.claude.com/ 最近故障好多
    gitdoit
        9
    gitdoit  
       8 小时 47 分钟前   1
    最近确实变蠢了,一个小需求干的一塌糊涂,我还以为用错模型了
    chtcrack
        10
    chtcrack  
       8 小时 22 分钟前
    @murmur 哈哈哈,这个 AI 有自己独特的想法,有前途..
    germain
        11
    germain  
    OP
       8 小时 20 分钟前
    大家感觉都差不多,这个月的额度用光之后我换 Codex 用一段时间看看
    hadi
        12
    hadi  
       8 小时 2 分钟前
    Effort Level 现在默认是 Medium ,好像还有一个设置也调整过,有检查过吗?
    germain
        13
    germain  
    OP
       7 小时 27 分钟前
    @hadi 我懒人,所以设置都固定在 claude.md 里,就算官方改了他们的默认设置,CC 也都会恢复到我自己的设置
    q534
        14
    q534  
       5 小时 21 分钟前
    @germain #13 怎么做到 Effort Level 设置在 claude.md 中的
    wsbqdyhm
        15
    wsbqdyhm  
       4 小时 59 分钟前 via iPhone
    @99185302 #5 你好,你是什么大模型,今天天气怎么样,
    vsomeone
        16
    vsomeone  
       4 小时 22 分钟前
    @hadi 没用哈,effort level 调到 high 乃至 max 都没用,就是降智了。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3490 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 10:56 PVG 18:56 LAX 03:56 JFK 06:56
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86