
1 bbbblue 6 小时 38 分钟前 跑分的话是 GPT-5 mini 推理 medium 的一些跑分在 minimax m2/qwen3 coder 那一档 你可以搜下 SWE-rebench |
2 wilddog OP @bbbblue 嗯,评分我知道,主要是问问有没有老哥实际 code 过的,输出的实际能力如何,因为我还看到有人说 Grok code fast 不错,不过我今天试用下来 Grok 一直限流没用成 |
3 codehz 5 小时 36 分钟前 via Android Grok code fast 输出 patch 正确性高(甚至比付费的 codex 还好),但是复杂任务不是很行,raptor mini 是微调的 gpt 5 mini ,能解决一定程度的复杂问题,但速度太慢,用于编写代码不是很稳定,我建议是免费的话就用 raptor 做 plan ,然后 grok 执行计划() |
5 burnsby 16 分钟前 我直说了, 哪怕你使用 GP 里面的 Opus 4.5 模型, 它也是个弱智, 我用 OpenSpec 来开发功能, 在完成任务的时候它居然给我任务列表都改掉了 |
6 labubu 14 分钟前 同问付费里面的哪个好用 |