DeepSeek V4 Pro:处于前沿的首个中文模型 - V2EX
请不要在回答技术问题时复制粘贴 AI 生成的内容
fragmede

DeepSeek V4 Pro:处于前沿的首个中文模型

  •  
  •   fragmede 11 days ago 5849 views

    https://foodtruckbench.com/blog/deepseek-v4-pro

    5 次运行全部成功。中位数投资回报率( ROI )高达 +1,257%。中位数净资产达 $27,142 。 首个跻身 Opus 4.6 、GPT-5.2 和 Grok 4.3 (最新版)同等 ROI 梯队的中国模型; 在所有受测的高级模型中,其运行表现最为出色且稳定性最高。

    18 replies    2026-05-11 09:46:32 +08:00
    LunarConcerto
        1
    LunarConcerto  
       11 days ago
    没看懂这个测试基准是啥
    xmsl
        2
    xmsl  
       11 days ago   2
    只要定语足够多,那就是第一!
    mingtdlb
        3
    mingtdlb  
       11 days ago   1
    所以这么看,deepseekv4Pro 还不如 GPT5.5Instant
    TimeNewRome
        4
    TimeNewRome  
       11 days ago
    不是很明白,这个是回测还是实盘?如果是回测就没什么意义,实盘的话,我将 all in 。
    FantaMole
        5
    FantaMole  
       11 days ago
    看完了,原来是一套餐车模拟 benchmark ,这个测评内容还蛮有意思的,但我觉得论坛里面大多数人更需要量化模拟 benchmark

    不过我觉得这套东西改一改之后可以推销给勇哥餐饮创业说,我觉得来连线的绝大多数都需要这么一套东西来帮他们整理一下脑子里的开店思路
    fuchish112
        6
    fuchish112  
       11 days ago
    不看,反正官方说了不如 opus4.6 ,我只用来辅助或者交叉验证,写确定的,不复杂的代码用它也足够了
    RuralHunter
        7
    RuralHunter  
       11 days ago
    翻译错了,人家说的是第一个中国顶尖模型,不是中文模型
    jetsung
        8
    jetsung  
       11 days ago
    标题的 Chinese 并不是指“中文”吧?我觉得应该指“中国模型”

    直接在 Grok 让它总结:“总结一下这篇文章: https://foodtruckbench.com/blog/deepseek-v4-pro”
    它说的是“DeepSeek V4 Pro 是首款进入前沿水平的 中国模型( Chinese model ,由中国团队开发)。”
    它甚至还拿来跟它家的 Grok 4.3 对比,得出的结论“两者中位净资产和 ROI 非常接近,但 DeepSeek V4 Pro 明显更稳”。笑死。
    shintendo
        9
    shintendo  
       11 days ago   4
    @xmsl 不是,这不就一个定语吗
    Nzelites
        10
    Nzelites  
       11 days ago   1
    @xmsl 一个也多吗?还是我们中文理解不一样你看除了不止一个
    TtNnTt
        11
    TtNnTt  
       10 days ago
    v4 难产多久了才发,就第一了
    sampeng
        12
    sampeng  
       10 days ago via iPhone
    这没意义…要把时间拉长到一年实盘,一进一个不吭声
    Wuuuu
        13
    Wuuuu  
       10 days ago
    没看错的话,中文模型里面 GLM 5.1 KIMI 2.6 ,甚至 Minimax 2.7 这些新一代的都没测试过啊,Claude Opus 4.7 也没有
    jimrok
        14
    jimrok  
       10 days ago
    这测试预览版,6 月会发 4.1 的升级版。
    Moonkin
        15
    Moonkin  
       10 days ago via Android
    便宜就是第一
    lixuda
        16
    lixuda  
       10 days ago
    回测没有任何意义
    pagxir
        17
    pagxir  
       9 days ago via Android
    有没有可能模型已经带了回测的数据了。不跑实盘完全没有任何可比性
    xmsl
        18
    xmsl  
       9 days ago
    @shintendo 我有明确表明他有很多个了吗?
    这是充分非必要条件
    About     Help     Advertise     Blog     API     FAQ     Solana     5261 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSIN: 3.9.8.5 63ms UTC 07:37 PVG 15:37 LAX 00:37 JFK 03:37
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86