MiniMax-M2.7-highspeed 模型真的一般般 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
mogutouer
V2EX    程序员

MiniMax-M2.7-highspeed 模型真的一般般

  •  
  •   mogutouer 3 月 25 日 3523 次点击
    昨天要增加一个新功能,改动比较多,尤其是前端。
    于是我用 opus4.6 让 superpowers:brainstorming 开始规划,他分析所有相关不相关的文件,最后整理出一个非常详细的开发设计,以及开发任务,每个大任务还分了几个小任务,任务里都有改哪些文件改什么地方怎么改怎么验证,只需要照着任务指引做就行了。

    前段时间因为玩龙虾,开了 minimax 那个 98 的极速版 token plan 。

    然后我想着任务都规划的这么细了,让 MiniMax-M2.7-highspeed 干一干试试呗。

    晚上 10 点开始,我想着改动也不大就十几个文件,搞一个来小时绝对可以了吧,于是切到 minimax ,开启 agent team 开干。开始感觉还挺好,十几个 agent 五颜六色的在跑,各种开发各种 review ,我心想国产大模型也没他们说的那么不堪嘛,好赖有个平替,以后 opus 规划,minimax 执行好像也挺不错。

    框框不到一个小时任务全跑完了,给我报告说所有任务都完成了。

    于是我就打开测试一下,后端除了数据库没导入,有些字段类型错误,也没啥问题,花了十几二十分钟来回对话他给修好了,API 没问题了,毕竟接口调整不大就改几个返回格式。

    问题出在前端,前端需要增加一个侧滑抽屉,兼容 H5 和 APP 以及 PC 端,滑出来的位置总是不对,内容滑动和多平台兼容也有问题,然后还有很多大小位置滑动显示等等问题,完全没法用。

    于是我就跟他说有什么什么问题,然后他哼哧哼哧改,如此反复又反复对话光是我给他说问题就用了将近 100M 的 tokens

    上头了,最后折腾到凌晨快 2 点还是一堆问题。

    实在顶不住了,git 重置,切到 sonnet 不到半个小时完美完成任务,几个小问题对话了几次就搞定了。

    最后发布上线,折腾到凌晨 3 点。

    第二天直接买 VPS 固定 IP ,新卡新号升级到 claude max ,要不是最近大封号,我之前的被封了,然后试了一大堆中转站体验实在一般般,并且最近封号很多都不能用或者是逆向的,都不会想到要折腾这国产模型。

    总结就是,跑分多牛逼都没用,任务分的多细都没用,因为最终执行是靠模型能力去执行的,不要想着 opus 做规划国产模型来执行,这条路行不通的。我之前还测试 claude 开发完,让国产模型( k2.5 )去跑测试,测都测不明白,按钮外到姥姥家了跟我报告说 UI 测试通过还跟我说非常整齐。

    截止到今天,真正的生产力,现在唯二的选择还是 cluade ( opus,sonnet )和 codex ( gpt5.4 ),大家还是克服困难想尽办法用上 claude 。其他大家试都不用试了,纯浪费时间浪费精力,一个月多花一千几百大家多睡几个好觉吧。

    34 条回复    2026-04-05 00:31:23 +08:00
    imik
        1
    imik  
       3 月 25 日
    幸亏没手贱花几十块钱试一下
    weixiaoyun
        2
    weixiaoyun  
       3 月 25 日
    op 图中是什么软件统计的?
    onedge
        3
    onedge  
       3 月 25 日
    实测不如 m2.5 的智力,我感觉 2.7 路子走偏了,太往工具链方向了,计划,复盘,疑难杂症攻坚能力真的不如 m2.5 我已经用回 2.5 (做执行和日常非编程任务)了
    mogutouer
        4
    mogutouer  
    OP
       3 月 25 日
    @weixiaoyun #2 ccusage 统计的数据,写了个 chrome 插件方便自己看
    onedge
        5
    onedge  
       3 月 25 日
    可以试试我自己 vibe 的工具,实时对话 review ,没办法消除但可以降低一定的幻觉,总体上对输出是有提升的
    https://github.com/timwuhaotian/the-pair
    欢迎 contribute
    wengjin456123
        6
    wengjin456123  
       3 月 25 日
    我基本全用 codex + copilot pro+的 claude 模型,kimi2.5 + GLM 用来打辅助任务,国产执行力 kimi 和 glm 好一点,minimax 模型太小
    ktyang
        7
    ktyang  
       3 月 25 日
    vps 固定 ip 搭梯子么?还是什么其他的防风操作?
    kanchi240
        8
    kanchi240  
       3 月 25 日
    @mogutouer 卡在支付,请问 OP 是什么法子
    KisekiRemi
        9
    KisekiRemi  
       3 月 25 日
    确实如此,刚好你说的都用过,体感一致(笑)
    Tzu
        10
    Tzu  
       3 月 25 日
    @wengjin456123 能细说下怎么个操作流程吗
    cokey
        11
    cokey  
       3 月 25 日   1
    MiniMax 2.5 就是蒸馏版 Claude 4.5 sonnet ,本来就更弱
    MiniMax 2.7 就是 2.5 的基础上加了点 工具链 的训练数据搞出来的,智商没有提升
    mogutouer
        12
    mogutouer  
    OP
       3 月 25 日
    @kanchi240 #8 走 appstore 礼品卡
    @ktyang #7 固定 ip ,设好规则,对 claude 所有服务都走这个 IP ,目前用了大概一周还没封
    leegradyllljjjj
        13
    leegradyllljjjj  
       3 月 25 日
    有没有便宜量大的
    JoeDH
        14
    JoeDH  
       3 月 25 日
    国产最强的就是 kimi k2.5 ,但是经过 cursor 用大量的用户数据 RL 训练出来的 composer 2 比 claude opus 4.6 还弱一点,国产模型提升空间还很大
    ProphetN
        15
    ProphetN  
       3 月 25 日
    230B 的总参数,10B 的激活参数。这模型有尝试的必要?
    gosidealone
        16
    gosidealone  
       3 月 25 日
    @JoeDH kimi2.5 比 glm5 强吗
    yanguangs
        17
    yanguangs  
       3 月 25 日
    用了 3 天, 实际效果明显不如 minimax m2.5

    轴的厉害, 已经到我都知道原因, 只是懒得写代码,直接知道模型去写

    笨到累心的程度.
    Sezxy
        18
    Sezxy  
       3 月 25 日
    你就说它快不快吧
    qxmqh
        19
    qxmqh  
       3 月 25 日
    请用真 AI 。 国内这帮没有一个能打的,kimi2.5 也是个半吊子。国内这帮 各种分数排名高高的,真实使用起来简直无语。全是假的。
    maoqiucute
        20
    maoqiucute  
       3 月 25 日
    信国产模型的这辈子有了
    jeeyong
        21
    jeeyong  
       3 月 25 日
    我是冲着 100t/s 去的. 极速 plus 版, 199 那个.
    实际后半夜,大约在 80-90t/s
    晚上 6-8 点在 60t/s
    我发现全网没有测试他速度的人啊...就是是否真的能到 100t/s
    mogutouer
        22
    mogutouer  
    OP
       3 月 25 日
    @jeeyong #21 速度快是真的,但没有 sonnet 快,速度快有啥用呢
    ggBalloon
        23
    ggBalloon  
       3 月 25 日
    固定是什么 IP ?机房 IP ?
    nabanbaba
        24
    nabanbaba  
       3 月 25 日
    想着跑 openclaw ,弄个国产模型 codingplan 去跑。有推荐的吗。。。
    mogutouer
        25
    mogutouer  
    OP
       3 月 25 日   1
    @ggBalloon #23 机房的,已经第四天了,没啥事,手机号,账号注册 IP ,手机登录,appstore 账号,都在一个国家,应该没事
    ggBalloon
        26
    ggBalloon  
       3 月 25 日
    @mogutouer #25 6 手机号都能搞到
    106npo
        27
    106npo  
       3 月 25 日 via Android
    @jeeyong 这个速度是从首 token 开始算的,但它不保证首 token 啥时候出来 只要不返回首 token 就没开始算速度
    tlerbao
        28
    tlerbao  
       3 月 26 日
    国产都是狗屎,我在另外一个帖子说国产不行,几个人还 tm 不乐意,天天就 tm 知道赢麻了,又 tm 赢麻了
    Macyou
        29
    Macyou  
       3 月 26 日 via Android
    @jeeyong m2.7 发布之前可以的 发布之后全部速度打对折了 极速版跑不过 50
    Macyou
        30
    Macyou  
       3 月 26 日 via Android
    @yanguangs 2.7 最大的问题还不是说智商的问题,而是说它经常不管指令的
    MorningBOBO
        31
    MorningBOBO  
       3 月 26 日
    @yanguangs 非常同意你的说法
    jeeyong
        32
    jeeyong  
       3 月 30 日
    @Macyou 是说上下文一长, 他就会遗忘之前的约束是吧? 我在 cherry Studio 用的时候, 基本都是在 80 ~ 90.
    lxsasmadaocn
        33
    lxsasmadaocn  
       6 天前
    2.7 老是鬼打墙,自顾自钻牛角尖,还会自作主张,和国外模型差多了,唯一优点就是快
    dobelee
        34
    dobelee  
       3 天前
    MiniMax 你看他便宜,实际智商堪忧,解决很多简单问题都要循环几遍,消耗更多 token 。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3374 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 31ms UTC 12:59 PVG 20:59 LAX 05:59 JFK 08:59
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86