vibe-coding 一时爽,一直 vibe-coding 呢? - V2EX
请不要在回答技术问题时复制粘贴 AI 生成的内容
dsd2077

vibe-coding 一时爽,一直 vibe-coding 呢?

  •  1
     
  •   dsd2077
    PRO
    dsd2077 10h 6m ago 1843 views

    昨天碰到一个音画不同步问题(数字人说话时一旦声音和画面出现了细微的偏差,整个视频看起来就非常奇怪,嘴型对不上),恁是 vibe 了一整天都没解决。有时候通过 vibe coding 来解决问题,就像是在抽盲盒。由于音视频开发的细节太多,导致 AI 没办法很细致地解决延迟、同步问题。这咋整呢?要么就自己一行一行地去看代码、梳理逻辑,要么就继续 vibe coding 碰概率。而且我发现 vibe coding 到最后真的什么都学不到,没有任何技术上的成长。唯一的收获可能就是做出了一个产品,或者实现了某一个功能。如果将来 AI 能够短时间变得更聪明倒还好,这样大家也不用再关心技术问题了。如果没有的话,或者像自动驾驶从 L2 到 L4 这么缓慢进步,一直 vibe coding 是一件对职业发展很不利的事情,长期如此技术成长基本上就停滞了。所以我觉得现阶段还是非常有必要去搞清楚技术原理,理解架构。并在此基础上去用 AI 来加速开发,而不是一直 vibe coding 下去,什么都不管。如果只是写一个网页、一个插件或者一个简单的 app 或者快速出原型,倒是无关紧要。但如果是像 CyberVerse 这样想要持续更新的项目,这种方式一定是不可持续的,欠下的技术债,终有一天要还。今天开始认真地研究代码、研究逻辑,把 bug 找出来。

    19 replies    2026-05-24 19:13:44 +08:00
    teaguexiao
        1
    teaguexiao  
       9h 43m ago   2
    同感,vibe coding 出原型、验证想法超爽,但遇到音视频同步这类底层问题,不懂原理就真的只能靠抽卡。我现在的方式是先把核心链路的代码读懂,理解了再让 AI 来加速,这样出了 bug 至少知道往哪查。
    FH0
        2
    FH0  
       9h 24m ago
    如果问题有复现方法的话那应该是能解决的。

    我之前遇到过一个音频的问题,是一个 HDMI IN -> I2S+MIPI -> PCM+HEVC -> MAC -> MAC -> PCM+HEVC -> I2S+HDMI -> HDMI OUT 的项目中,关键是如何量化问题。

    我遇到的问题是声音听着时不时有一点“细小的爆破音”,但这个东西和 AI 说它是不懂的,用 Audacity 和 AI 一起研究了很久,发现是波形频率突变导致人耳听到了异常的声音,然后让 AI 自己定位这个突变是从哪个环节产生的就好了。
    lujiaosama
        4
    lujiaosama  
       9h 18m ago
    这个抽卡的体验让我想起了 Claude 3.7 的时候,AI 不够聪明,就是靠一遍一遍的重复推倒来逼近想要的结果。抽了一天最后发现完全不可用的时候那个挫败感,空虚感太强烈了。在完全不懂的领域里纯靠 AI CODING,出点小 BUG 都没有信心能快速定位进行修改。
    kujo
        5
    kujo  
       9h 16m ago
    屎山比人堆的快多了,崩盘的概率变大
    s3040608090
        6
    s3040608090  
       9h 5m ago
    这种时候我一般会先尽可能告诉模型问题的复现逻辑(或者可能无法精准复现),然后告诉模型,在你觉得可能的地方打 log ,我把看到的告诉你。一般两三轮下来就解决了。
    otakustay
        7
    otakustay  
       8h 44m ago
    你有架起来让 Agent 自己能够去“看”视频确定是不是同步的系统吗,有的话你应该任务放在那,说明白几分几秒是典型的不同步,要彻底解决且采样其它位置也要同步,直接证 Agent 自己干就好了
    ebushicao
        8
    ebushicao  
       8h 16m ago   1
    你没理解 vibe coding 也是一门技术,很多时候你 vibe 无法解决是因为你 vibe 方面的技术不行,不是你应该回归古法编程。你什么都学不到也没有任何技术上的成长是因为你就没认真对待 vibe coding ,潜意识觉得 vibe coding 就是写点提示词把什么都交给 AI 做。

    你觉得现阶段有必要去搞清楚技术原理和理解架构,说明你觉得 vibe coding 不需要搞清楚,但这明显是错的,恰恰 vibe coding 更需要搞清楚技术原理和理解架构,而且 vibe coding 让你有更多的时间可以搞清楚。
    dsd2077
        9
    dsd2077  
    OP
    PRO
       8h 15m ago via Android
    @otakustay 有的,我用 codex computer use 搭了一套完整的端到端测试框架。但是不得行,因为音画不同步是非常细微的问题,可能就差几十毫秒。而且也不是每次都有,AI 根本捕捉不到
    所以我觉得我差一套链路监控方案,今天试试
    otakustay
        10
    otakustay  
       7h 40m ago
    @dsd2077 不能稳定复现、不能高效观测(比如非得肉眼看视频,不能从音轨和时间帧上看)那就麻烦了,人来做也挺麻烦的……
    rick13
        11
    rick13  
       5h 14m ago
    我完全不会 ios 开发,刚指挥 codex 做了一个简单的数据运动输出导出的功能,我确实什么都没学到,但问题是我也不想学 ios 开发
    zhangleijuly
        12
    zhangleijuly  
       5h 14m ago
    其实你的情况不就是个反例吗,vibe coding 能够帮很多人开发自己原本写不了的代码,但是 vibe coding 遇到解决不了的问题的时候就需要人知道解决方法指导 AI 去做才行。最后你自己去研究代码和逻辑也说明了我们仍然需要关注技术问题,只不过更多需要关注 AI 解决不了或者解决不好的问题。
    xiaomushen
        13
    xiaomushen  
       4h 20m ago
    隔一个月要停一天,手工清理对齐一下
    someonelikeyouah
        14
    someonelikeyouah  
       4h 19m ago
    感觉也没必要去 完全读懂源代码,只是我的个人看法,有的时候训练自己收缩问题的能力也是非常好的,当然了读懂源码是第一性原理对吧,这本身也是个收缩过程,如果可以把问题一步步压缩 其实 llm 也能帮你找出问题(再强调一遍,我是猜的,我没遇到过这么高端的东西
    zainJJ
        15
    zainJJ  
       4h 1m ago
    我觉得 8 楼很对,vibe coding 是很重要的翻译技术。 对我来说就是把需求翻译给 ai ,越详细越能接近需求,理解架构原理也是为了能翻译的更准确,出现的问题能描述的更清楚
    dsd2077
        16
    dsd2077  
    OP
    PRO
       2h 50m ago via Android
    @xiaomushen 好建议
    dsd2077
        17
    dsd2077  
    OP
    PRO
       2h 47m ago via Android
    @zhangleijuly 嗯,是这样的。关注解决不了的问题。
    dsd2077
        18
    dsd2077  
    OP
    PRO
       2h 46m ago via Android
    @rick13 前期不用学,快速出 demo 是对的。
    davidqw
        19
    davidqw  
       2h 39m ago
    一直爽啊,之前遇到音视频不同步,agent 发现 aac 不行,要转为 wav 后才可以逐帧调整不会多出几十 ms ,自己发现后就把格式给转了。
    About     Help     Advertise     Blog     API     FAQ     Solana     3111 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 82ms UTC 13:53 PVG 21:53 LAX 06:53 JFK 09:53
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86