
首先是在 b 站刷到了这个 OpenAI 员工翁家翌的访谈视频:
翁家翌:OpenAI ,GPT ,强化学习,Infra ,后训练,天授,tuixue ,开源,CMU ,清华| WhynotTV Podcast #4
访谈视频中翁家翌提到他是 OpenAI 的 infra ( LLM 基础设施)建设的,在他的观点看来,哪家 ai 公司更有能力看的并不是谁家的模型又上了 Benchmark 排行榜第一名,而是公司内部的 infra 的对于 llm 的迭代速度。
视频中他提到,OpenAI 内部用于训练 ChatGPT 的 infra 已经是三年前搭建的了,而他们仍然还在准备新一代的 infra ,这是 OpenAI 面对 DeepSeek, Gemini, Claude 时较为乏力的原因,这些后来者的 infra 比 OpenAI 的更加先进,这意味着他们可以更快地对 LLM 进行迭代。
随后又刷到了美国战争部长去 SpaceX 向 Elon Musk 取经的视频:
美国防部长走访马斯克星舰基地!要把第一性原理搬到五角大楼!
Musk 的 SpaceX 或者说 Tesla 的成功原因,一个是他的“第一性原理”,另一个就是他的“快速迭代理论”。
快速迭代理论说的是:并不是从一开始就做一个完美的产品,而是先做一个差不多的产品,然后用最快速度去逼近完美。
而 Musk 的星舰基地,就是一个快速迭代的平台,这个星舰基地有充足的资源让他可以不断试错不断发射失败,发射失败的速度越快,他距离成功的速度也就越快。
同理,回到 LLM 的迭代中,各家 AI 公司其实真正需要的不是一个牛逼的算法或者架构,而是可以最短时间内验证一个 idea 的能力,任何人有 idea 或者算法都可以在最短时间内集成到产品中去,从而判断是否可以加强产品能力。
这也是 DeepSeek 在 2025 年初能够释放重磅炸弹的原因,幻方量化有足够的 infra ,才能实现他们各种颠覆性的 ideas 。
LLM 的 infra 是 AI 公司的算力基建和训练管道,而对于普通程序员或者独立开发者来说,其实 idea 并不重要,因为这个世界上有太多的 idea 了,在 idea 落地之前,没人知道这个 idea 能否成功,重要的是实现 idea 的 infra ,也就是现在的 coding agent 。
因此,作为开发者,在 2026 年,一个 idea 落地的效率大大提高,因此没有必要再去问值不值得做,而是先 vibe coding 一个最简单的核心出来,然后看市场反馈,如果反馈好那么使用快速迭代理论来疯狂地接近成功。
另外再举一些生活中的例子,比如你想开一家咖啡馆,而你本身并没有开咖啡馆的经验,你要做的不是花几十万重金盘下一个店面装修再购买数万元的设备,而是使用最低成本:买二手设备,租便宜店面,先简单装修等等压缩成本的方式开一家咖啡馆,然后看自己能不能开好这家咖啡馆,如果营业不下去了就倒闭,然后总结经验,继续开始下一次试错。
到目前为止想的就这么多,本想用 AI 优化一下排版,但是不希望 AI 代理我的语言输出,大家将就看吧。
1 sillydaddy 3 小时 34 分钟前 讨论一个实际问题: 那比如说,我现在真的在做一个 youtube 频道,在做它的第一个视频,关于加密货币的 AMM 机制,也可以说 V 币的科普的。现在遇到的问题是,我科普这个东西,需要做 8 ~ 9 个动画,每个动画都比较耗费时间(甚至需要自己编写的软件去做),那这些动画是不是要做呢?还是直接讲解概念呢? |
2 zzlyzq 3 小时 7 分钟前 可以先写一个 text ,需要有哪些东西。(当你写完后,可能注意力会下降,需要休息) 过了一天,你发现,你可以再丰富些内容。(做完后,可能又需要休息一下) 过了一周,你发现,还可以优化,那就再优化一下。 |
3 zisen OP @sillydaddy 快速迭代理论的第一步就是做一个不完美且低成本的产品(视频),然后依赖快速迭代来接近完美。 你的第一条视频必须是低成本的,在做视频的角度上来看,就是时间成本,**你需要规划一定的时间,规定自己必须要在这个时间内产出第一条视频。** 你的核心目标是做一个自媒体,而不是做一个动画软件,因此你首先要将动画的实现约束在现成的动画软件例如基础的 PowerPoint ,高级一点的可以直接做 flash 或者直接让 agent 生成前端动画页面,而你的重心应该放在如何让观众能更好地理解你要讲解的知识,也就是加密货币的原理讲解上面。 另外也可以采用“第一性原理”的角度来看,就是这个动画效果是不是非得用专业软件制作才能让观众理解你要讲的内容,如果不是,那么没必要走学习成本或开发成本高的路径。 在你上传完第一个加密货币的视频后,观察观众的反馈(大部分时候没有观众,可以拉身边的朋友或者直接在 v 站发帖推广,据我观察到的 v 站大部分朋友都会认真地提建议),然后基于反馈来进行迭代。 另外说一下快速迭代中的迭代速度这一点,迭代速度确实基于 infra 的成熟程度,这里 infra 可以是你自制的动画软件,但前提是,你搭建的 infra 是逻辑清晰,稳定有效的可以用于快速迭代的一个基础设施,如果你只是想试试自媒体起一个号看看效果而不是想辞职全职做自媒体,那么这个动画软件是彻底没必要的。如果真的到了要开发动画软件的地步,也可以基于快速迭代理论来开发,这里就不细说了。 Musk 曾经在 2017 年开发 Tesla Model 3 的时候,搞了一整套自动化机器人流程,结果这些流程差点让 Tesla 破产,因为这些机器人机械臂并没有像他预期的那样高效率的工作而是不断地出现小 bug ,而修复机器人产线 bug 远比人工来得慢,最后他把机器人产线拆除,重新使用人工来组装 Tesla 。这个例子换到你的例子里面,就是你的动画软件大概率不能助力你的视频产出,而你会消耗大量的精力在开发动画软件上面。你需要等到视频制作流程成熟稳定后,开始考虑使用软件来自动化迭代你的视频。 |
4 sillydaddy 2 小时 36 分钟前 @zisen 感谢你的详细回复。最后的马斯克的例子让人印象深刻。 低成本这块我确实做的很不好。你说的对,我的核心目标是自媒体,更准确的说是将自己的想法表达出来,确实如此。但正因为如此,所以我觉得第一个视频或者第一百个视频的受欢迎与否,不影响这个核心的目标。所以我才去做用于快速表达的工具的,也就是上面提到的软件。结果一做就是几个月,用玩笑话就是为了一碗醋包一顿饺子。但要是从核心目的来看,它并没有问题为的是快速表达出想法。 在尝试做的第一个视频中,这样的图画了有 9 个左右: ![]() 然后为了构建这个动画,在自己制作的软件中,建了这么些节点图: ![]() 这成本确实高的离谱,但我其实是寄希望在,这些高成本的东西,到后面能越来越流畅快速和低成本。其实我也不太肯定这一点。 我刚才也跟 AI 讨论了一下,它确实提到了一点,可以尝试现有的,例如 Manim 这个开源的数学动画制作软件,而不是自己去建这样一个软件。一下子击中了我的要害:我确实没有尝试用 Manim 这个东西。 我写到这里感觉自己确实有些在重蹈 Musk 的覆辙。当时想的仅仅是 Manim 是专为数学可视化而生的(其实这点我都不是很肯定),而自己的工具是较为通用的。。 |
5 sillydaddy 2 小时 25 分钟前 刚才说漏了一点,做自己的工具,核心目的是为了快速表达,例如使用 node-based 这样的工具,而 Manim 这样的编程工具,不符合自己的要求。当然,这是自己的一个假设( node-based 的工具可以更快表达)。总之这里的逻辑很乱,总感觉快速迭代,就卡在这个自己认定需要长期打磨的工具上面了。 |
6 sillydaddy 2 小时 22 分钟前 我发现这里的核心矛盾点了:自己认定这个工具需要长期打磨,但这个工具前期不好用,导致效率慢(比学其他软件,或者使用现成的 Manim 更慢)。这时候该怎么办? |
7 zisen OP @sillydaddy 如果你的核心目标还是自媒体而不是开发动画软件,从低成本角度考虑,建议搁置现在这个自制的动画软件,用现成的工具(我经常看的一个讲 LLM 原理的博主[飞天闪客]( https://www.youtube.com/@%E9%A3%9E%E5%A4%A9%E9%97%AA%E5%AE%A2)就是用 PowerPoint 做动画的,你可以看看他的置顶视频,我觉得能把 LLM 原理讲明白的动画用来讲解加密货币应该没什么问题。 如果你仍然不肯放弃自研动画软件,可以看看下面的话: 依然从 Musk 的例子来套用你的现状,他在造车流程非常成熟之后,在上海超级工厂搭建初期,依然没有直接全套使用机器人自动化,而是采用人机协同来规避 bug ,等到人机协同成熟后,他再慢慢将人替换为机器,最终实现全套机械化产线。 因此关于你的动画软件,你可以先实现一个 MVP 来制作 9 个图里都会出现的重复的动画,然后结合人工 PowerPoint 编排去实现一些现阶段只会使用一次的效果。而不是从一开始就寄希望于你的动画软件可以完美实现所有你期待的动画效果。等到后期你的视频内容越来越多,有大量的讲解开始需要重复的动画效果,这个时候你再去给你的软件加上这些动画效果。 看得出来你是一个完美主义者,认为磨刀不误砍柴工,但如果你真的要做自媒体,那我建议你不要再去打磨这个动画软件了,除非你的目标变成开发一款动画软件。 |