
想咨询一下各位最近使用的这几个模型体感哪个更强呢?
Agent 场景,主要是 tool using/vibe coding
入围的:
如果还有推荐的也可以写(比如 chatgpt )
由于 prompt 其实和模型是较为绑定的(这个很类似当年针对某个芯片版本写的汇编优化,当芯片/编译器版本换了,方法也就失灵了),所以希望选择一个半年内持续使用的模型。希望了解一下大家目前在 tool using/vibe coding 哪个更方便?
公司生产场景,部署在美东
目前在 openrouter 平台,有什么更好的平台也推荐。
参考:
1 yusf 7 天前 Claude + Chatgpt 家的,自己模型还是要配自家的工具才厉害 |
2 SingeeKing PRO 我的选择 - 日常 GPT-5.3-Codex (xhigh) - 疑难杂症 GPT-5.2 (xhigh) - 超级疑难杂症 GPT-5.2 Pro |
3 iamnotcodinggod 7 天前 Claude code default 就行了,让它灵活在 opus 和 sonnet 之间切换,碰不到 5 小时限制。如果纯用 Opus ,大概一个半小时就会碰到。 碰到了就转 Codex 5.2 最高 reasoning effort. |
4 maolon 7 天前 这个都不用问的, 全自主 agent 和超长程任务(> 15hr 持续执行)用 gpt 系列( 5.2 high/xhigh and/or 5.3 codex high/xhigh ), copilot 模式(你和 agent 合作写)用 claude 的 sonnet 4.6 + opus 4.6, 另外建议搭配各家自己的套餐使用(也就是 codex 用 gpt 订阅,cc 用 claude 订阅),以及 opus 价格非常高,注意使用限制 |
5 Bad0Guy 7 天前 我直接在 cli 里让 Gemini/codex/cc 通过 mcp 分工,只用 sonnet/opus 的话额度烧得很快,而且不一定能一次就达到你要的效果 |
6 doraemonki 6 天前 @Bad0Guy 老哥 mcp 用的啥 |
7 mogutouer 6 天前 Opus 断层领先,这一点疑问也没有 |
9 issakchill 6 天前 GLM 5 Kimi k2.5 MiniMax M2.5 Chatgpt 5.3 这几个都用过 Chatgpt 5.3 比其余 3 个好太多 |
10 Tink PRO Kimi 我感觉是国内还算很不错的 |
11 andy101wong 6 天前 via Android 国产 kimi 模型不错。 其他国产除了 deepseek 都是 pr 。 分析类的用 gemini ,代码有钱 claude ,没钱 gpt |
13 Bad0Guy 6 天前 @doraemonki 或者你可以直接问 grok ,twitter 上有没有类似的开发者帖子里贴出来的 mcp 项目 |
14 raycool 6 天前 就用 GPT5.3-codex 感觉不错。 价格适中,也没比 claude 差太多。 |
15 koodai 4 天前 via iPhone 有没有那种理由模型,自动分析问题,并选择最经济但最有品质的后端模型来回复。 最好上下文能自动提炼并根据情况判断附加有用且浓缩的必要信息。 是不是就可以大幅节省并且高效交付了 |
16 soulflysimple123 4 天前 gpt5.3-codex 吧,老项目上绣花要的是一个"稳"字 |