openai 上线了 o3-mini - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ddddd0
V2EX    OpenAI

openai 上线了 o3-mini

  •  
  •   ddddd0 254 天前 7163 次点击
    这是一个创建于 254 天前的主题,其中的信息可能已经有所发展或是发生改变。
    29 条回复    2025-02-02 13:59:07 +08:00
    Vneix
        1
    Vneix  
       254 天前 via Android   1
    看了下,免费用户点击输入框的 reason 后也能体验到。

    这是对 deepseek 的反击吗?
    ovtfkw
        2
    ovtfkw  
       254 天前 via iPhone
    o3minihigh 强于现在的 o1 吗
    zaizaizai2333
        3
    zaizaizai2333  
       254 天前
    mini 肯定是小模型喽,还是免费 R1 香

    o3mini (high) 看上去和 o1 水平差不多。
    zaizaizai2333
        4
    zaizaizai2333  
       254 天前   2
    尽量不给 openAI 提供训练数据。

    它发展得再好也不愿意开源一点点模型,哪怕是去年的稍微过时的模型,只进不出的巨兽太贪婪了,还时不时搞小动作降智。太葛朗台了。
    fcoo
        5
    fcoo  
       254 天前   5
    要不是 deepseek 还不知道什么时候给上线新模型,一直压箱底,慢慢的放,也开始学老黄刀法了。
    竞争对用户最好的,希望以后有更多更强开源模型出现
    zaizaizai2333
        6
    zaizaizai2333  
       254 天前
    As part of this upgrade, we’re tripling the rate limit for Plus and Team users from 50 messages per day with o1-mini to 150 messages per day with o3-mini.

    一天 150 条 messages 限制。一个小模型还对订阅用户限制这么多。葛朗台+夏洛克
    randychoi
        7
    randychoi  
       253 天前 via Android
    @ovtfkw 根据 livebeach 的数据, o1综合能力最强,翻译能力 o3 mini high 不如 4o 。编程能力 o1 mini high 最强
    dji38838c
        8
    dji38838c  
       253 天前   1
    @randychoi livebench 吧?
    lnmxy
        9
    lnmxy  
       253 天前
    closeai:葛朗台+夏洛克
    7LM4liVHIyzvtMyO
        10
    7LM4liVHIyzvtMyO  
       253 天前
    @dji38838c 为什么我看 openai 自己发的那篇报告中是 o3 mini 的数学能力最强了.https://openai.com/index/openai-o3-mini/
    xbox360
        11
    xbox360  
       253 天前
    #10
    @466162659

    我是免费用户用的是 o3-mini,开启了推理.





    3.11 和 3.9 哪个大?



    ChatGPT

    我在比较 3.11 和 3.9 的大小时,3.11 略大。这个差距可能是微不足道的,但显示了微调的重要性。

    比较两个数

    让我看看,3.11 和 3.9 哪个大。显然,3.11 明显大于 3.9 ,很容易比较出哪个数更大。

    3.11 比 3.9 大。
    eventlooped
        12
    eventlooped  
       253 天前
    感谢 deepseek ~
    lyanforever
        13
    lyanforever  
       253 天前
    感谢 deepseek ,以后能用上更便宜的 chatgpt
    FightPig
        14
    FightPig  
       253 天前
    openai: 其实我早就做了,只是被友商捷足先登了
    randychoi
        15
    randychoi  
       253 天前 via Android
    @xbox360 @7LM4liVHIyzvtMyO 根据 livebench 的数据,o1 数学是最强的,其次是 deepseek r1 ,排第三是 o3 mini high
    randychoi
        16
    randychoi  
       253 天前 via Android
    o3 min high:
    @xbox360 比较这两个数时,我们可以先看整数部分:

    3.11 的整数部分是 3

    3.9 的整数部分也是 3


    由于整数部分相同,我们再比较小数部分。

    3.11 的小数部分是 0.11

    3.9 的小数部分是 0.9 ,可以写成 0.90


    显然,0.90 > 0.11 ,所以 3.9 大于 3.11 。
    Kisesy
        17
    Kisesy  
       253 天前
    @randychoi 好奇这类把 0.9 写为 0.90 再比较的 AI ,遇到:"3.111 和 3.9 哪个大?" 会怎么比较
    Kisesy
        18
    Kisesy  
       253 天前
    哦,也许又会把 3.9 写成 3.900 吧
    YsHaNg
        19
    YsHaNg  
       253 天前 via iPhone
    @Kisesy pi 和 3.9 哪个大
    bccah
        20
    bccah  
       253 天前 via Android
    @FightPig 什么地方先等了?
    Censhuang
        21
    Censhuang  
       253 天前
    问:纯数字含义,3.11 与 3.9 哪个大
    比较数字大小
    我正在比较数字 3.11 和 3.9

    评估数字的大小
    3.11 比 3.9 大。这一点是有结论的。

    3.11 大于 3.9 。因为从数字的角度来看,3.11 比 3.9 大,尽管它们都以 3 开头,但 11 比 9 更大。
    FlashEcho
        22
    FlashEcho  
       253 天前
    @ovtfkw #2 我丢了几个常用的问题(主要是 cs 相关的问题)给 poe 上的 o3-mini-high ,比 o1-preview 都差远了
    JoeDH
        23
    JoeDH  
       253 天前
    还是 ds 用的爽
    Cbdy
        24
    Cbdy  
       253 天前
    ds 给的压力不小啊
    randychoi
        25
    randychoi  
       253 天前 via iPhone
    问:ChatGPT, 如何看待 deepseek ?

    o3 mini high: “从报道中可以看出,DeepSeek 的出现代表了中国在人工智能领域取得了不容忽视的进展,并对长期以来由美国主导的 AI 生态构成了挑战。以下几点是常见的看法:
    1. 技术进步与成本优势
    DeepSeek 的新模型在推理能力上取得了突破,同时在研发成本和计算资源消耗上比一些美国顶级模型更为经济,这表明中国在利用有限资源实现高性能 AI 方面具有一定优势。
    2. 全球竞争格局的变化
    这一进展不仅仅是技术上的突破,更反映了中美在科技领域的竞争正在加剧。DeepSeek 的出现促使全球重新审视人工智能的研发模式和投资逻辑,说明未来 AI 领域将会有更多竞争者涌现,市场格局可能发生深刻变化。
    3. 争议与挑战
    同时,关于 DeepSeek 的争议也不少:例如是否在研发过程中借鉴或“借用了”美国已有技术、是否真正具备原创性,以及由于政治和监管等原因在某些话题上的自我审查问题。这些争议不仅涉及技术本身,也关系到知识产权保护、国际贸易和技术伦理等更广泛的问题。
    4. 长远影响尚需观察
    尽管 DeepSeek 显示出一定的技术实力,但它是否能在长期内引领行业,或只是一次赶超尝试,还需要市场和时间来检验。毕竟,成功的 AI 生态系统不仅仅依靠模型本身的性能,还涉及到应用、数据、生态圈构建以及用户体验等多个层面。

    总体来说,DeepSeek 可以被看作是中国在全球 AI 竞争中迈出的重要一步,它既展示了潜在的技术实力,也提醒我们未来技术竞争中会面临更多复杂而多元的挑战。”

    o1: “从公开信息和媒体报道来看,DeepSeek 的出现确实在技术界和投资界引发了极大关注。以下是我对 DeepSeek 的一些观察与思考:

    1. **技术实力与创新性**
    - DeepSeek 在“推理”方面的进展,表明它并非仅仅是追随者,在某些技术环节上还有自己的突破。它能在有限的计算资源和相对低的成本下,训练出与一些领先模型性能相当的系统,这一点值得业界关注。
    - 不过,仍有分析认为 DeepSeek 的核心技术和方法在一定程度上借鉴或复用现有的大模型成果,尚未展现出全新的颠覆性创新。同时,有关它是否未经授权使用他人模型或数据的调查也在进行中,如果属实,则会影响其声誉与后续发展。

    2. **芯片和算力的制约**
    - 美国对中国的高端芯片出口管制,原本旨在限制中国在人工智能领域的快速追赶。但 DeepSeek 的出现,说明企业也会通过各种方式(包括改进算法、寻求替代硬件或绕过渠道)来降低对顶尖芯片的依赖。
    - 这给美国和其他国家的芯片与云服务供应商带来新的思考:如果中国在算法层面大幅提升效率,那么对昂贵 GPU 或高端芯片的需求量是否会受到影响,仍需在后续观察。

    3. **商业与市场影响**
    - DeepSeek 的新模型发布后,一些投资者担忧可能导致对昂贵 AI 芯片需求的下降,进而让英伟达等公司股价出现剧烈波动。但也有“杰文斯悖论”的观点,认为当训练和应用成本下降后,AI 可能会被广泛应用,最终反而推动更多芯片采购。
    - 不管怎样,DeepSeek 让市场看到了“中国 AI 追赶速度”超出预期,刺激了全球对 AI 竞争格局的新一轮讨论。

    4. **审查与自由度**
    - 有证据显示,DeepSeek 的对话模型会对中国政府视为敏感的话题进行审查,自我审查或拒绝回答。技术上的进步不一定意味着在信息层面有更大的自由或开放。如果在全球范围内推广,内容审查机制可能会影响它在海外市场的接受度。

    5. **对整个 AI 生态的启示**
    - DeepSeek 事件带来的最大启示在于:规模化的算力投入并不是唯一的成功路径。对算法效率、模型训练方式、数据质量的创新同样重要。
    - 也凸显了 AI 领域的“全球化”与“本土化”交织:一方面,中国企业对海外技术和开源成果有高度依赖;另一方面,不同国家的监管与政策环境会反作用于技术与商业模式。

    **总结来说**,DeepSeek 的出现既展示了中国 AI 公司在短期内实现大模型技术突破的可能性,也暴露了在知识产权、审查制度等方面的争议。它很可能在某些细分领域为行业带来新的竞争与活力,但要在全球市场上保持长期领先,还需要更多原创性突破与更开放的环境。对整个 AI 行业而言,DeepSeek 的案例提供了一个信号:技术与创新在地缘政治和商业利益的博弈中,将继续以非常快的速度演进和扩散。”

    o3mini high 有点答非所问。和 livebench 测试的一样,o1 的语言理解能力最强:D
    randychoi
        26
    randychoi  
       253 天前 via iPhone
    @chesha1 估计用英文提问更好吧:D
    JiRouWaZi
        27
    JiRouWaZi  
       253 天前
    @randychoi residential ip, 你用英文提问也是垃圾
    chtcrack
        28
    chtcrack  
       252 天前
    @Kisesy DS-R1:
    3.111 和 3.9 比较时:

    整数部分相同:两者整数部分均为 3 。

    比较小数第一位:

    3.111 的小数第一位是 1

    3.9 的小数第一位是 9

    9 > 1 ,因此 3.9 > 3.111

    结论:3.9 更大。
    小数比较时,若整数部分相同,直接按小数位从左到右依次对比即可,无需补零对齐位数。

    chatgpt-03mini:
    比较数字大小

    我在想 3.111 和 3.9 哪个更大。

    对比数字大小

    3.111 和 3.9 哪个更大?这是一道基础的比较问题。3.111 数值略大,可能因为小数点后准确度较高。

    3.111 比 3.9 大。你可以把 3.9 看作 3.900 ,然后比较小数部分:3.111 和 3.900 ,显然 111 大于 900 。所以 3.111 大于 3.9 。
    arischow
        29
    arischow  
       252 天前
    能不能拿 AI do some real work
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     899 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 22:34 PVG 06:34 LAX 15:34 JFK 18:34
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86