MiniMax-M2.7-highspeed 模型真的一般般

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

请不要在回答技术问题时复制粘贴 AI 生成的内容

昨天要增加一个新功能，改动比较多，尤其是前端。
于是我用 opus4.6 让 superpowers:brainstorming 开始规划，他分析所有相关不相关的文件，最后整理出一个非常详细的开发设计，以及开发任务，每个大任务还分了几个小任务，任务里都有改哪些文件改什么地方怎么改怎么验证，只需要照着任务指引做就行了。

前段时间因为玩龙虾，开了 minimax 那个 98 的极速版 token plan 。

然后我想着任务都规划的这么细了，让 MiniMax-M2.7-highspeed 干一干试试呗。

晚上 10 点开始，我想着改动也不大就十几个文件，搞一个来小时绝对可以了吧，于是切到 minimax ，开启 agent team 开干。开始感觉还挺好，十几个 agent 五颜六色的在跑，各种开发各种 review ，我心想国产大模型也没他们说的那么不堪嘛，好赖有个平替，以后 opus 规划，minimax 执行好像也挺不错。

框框不到一个小时任务全跑完了，给我报告说所有任务都完成了。

于是我就打开测试一下，后端除了数据库没导入，有些字段类型错误，也没啥问题，花了十几二十分钟来回对话他给修好了，API 没问题了，毕竟接口调整不大就改几个返回格式。

问题出在前端，前端需要增加一个侧滑抽屉，兼容 H5 和 APP 以及 PC 端，滑出来的位置总是不对，内容滑动和多平台兼容也有问题，然后还有很多大小位置滑动显示等等问题，完全没法用。

于是我就跟他说有什么什么问题，然后他哼哧哼哧改，如此反复又反复对话光是我给他说问题就用了将近 100M 的 tokens

上头了，最后折腾到凌晨快 2 点还是一堆问题。

实在顶不住了，git 重置，切到 sonnet 不到半个小时完美完成任务，几个小问题对话了几次就搞定了。

最后发布上线，折腾到凌晨 3 点。

第二天直接买 VPS 固定 IP ，新卡新号升级到 claude max ，要不是最近大封号，我之前的被封了，然后试了一大堆中转站体验实在一般般，并且最近封号很多都不能用或者是逆向的，都不会想到要折腾这国产模型。

总结就是，跑分多牛逼都没用，任务分的多细都没用，因为最终执行是靠模型能力去执行的，不要想着 opus 做规划国产模型来执行，这条路行不通的。我之前还测试 claude 开发完，让国产模型（ k2.5 ）去跑测试，测都测不明白，按钮外到姥姥家了跟我报告说 UI 测试通过还跟我说非常整齐。

截止到今天，真正的生产力，现在唯二的选择还是 cluade （ opus,sonnet ）和 codex （ gpt5.4 ），大家还是克服困难想尽办法用上 claude 。其他大家试都不用试了，纯浪费时间浪费精力，一个月多花一千几百大家多睡几个好觉吧。