Claude Opus 似乎是官方降智了，洗车题失败

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

如图

Claude

Opus

失败

16 条回复 2026-04-09 14:33:49 +08:00

b309f3337

10 小时 26 分钟前

我最近也发感觉 opus 4.5 好像有点变傻了，以前让它做的很多功能一次性就能解决了，甚至超出我的预料，最近好几次也不算是很复杂的问题，来回好几次都搞不定

murmur

10 小时 22 分钟前

这题我见过攻击性最强的回答是米哈游那个 AI ，直接扛着车去

germain

10 小时 12 分钟前

@b309f3337 甚至有几个 Opus 没能干净解决的历史问题我用免费的 qwen3.6 plus 搞定了，这几天 Claude 问题一堆，还有很多 billing 相关的问题他们的那个 fin bot 无法解决，说让我等真人 email 联系，都一周过去了，音讯全无

@murmur 这题是快速验证模型真正算力的最简单方法了,不过这扛过去的模型我是不大敢用，怕闪着钱包

jchencode

10 小时 1 分钟前

Opus 确实降智了，应该是跟新出的 Glasswing 有关系，Glasswing 吃掉了很多算力。

而且，Glasswing 模型推理能力比 Opus 高出几十个百分点。。。。

[img]https://ft.wzznft.com/i/2026/04/09/e4iicp.jpg[/img]

99185302

9 小时 56 分钟前

@b309f3337 跟 GPT 和 Gemini 聊过这种问题，得出的结果都差不多，后台会有一个叫"用户画像"的用户数据，模型会根据这个用户画像决定第一时间调用的算力和子模型。简单点说就是如果用户画像倾向于逻辑和推理，那模型会优先调用逻辑和推型的子模型会给到更高的算力；如果用户画像倾向于闲聊的话，就会优先调用简单的聊天子模型，只需要低算力就足够的这种。还有就是别拿这种问题去测试 AI ，你测试越多，就越会变傻，闲聊越多也会越来越傻。