离替代人类还有多远? AI 程序员连续工作三小时解决复杂问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Bazingawang
V2EX    分享发现

离替代人类还有多远? AI 程序员连续工作三小时解决复杂问题

  •  
  •   Bazingawang 2024-03-19 17:58:02 +08:00 2357 次点击
    这是一个创建于 581 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Devin 在海外掀起了开发 Agent 的热潮,但仍然有很多人提出质疑“python 又不是最受程序员欢迎的语言,用不上”,“视频里还是有大量需要人工介入聊天的过程”“做的东西也太简单了”,认为看着热闹但离实际替代程序员太远,仍然停留在实验室阶段,真正的工业生产用不上。

    图片

    但这不是巧了,我们作为一家生产软件研发 Agent Team 的公司 Babel ,现在已经真的用上 Babel Agent 来写工程软件了,让 Babel Agent 测试 Claude 3 好不好用,写后台管理系统,还有接 Stripe 支付系统等等。目前正在测试阶段的 Babel Agent ,给我们展现了,Agent 真正在软件生产中替代人类的巨大可能性。

    演示视频链接

    Babel CEO 张海龙,早上 5 点起床出差,把需求描述丢给 Babel Agent ,飞机落地,任务做完了,勤勤恳恳,任劳任怨,不需要你的任何介入,安心睡大觉,下了飞机就收到成品,正在运行的成品,直接演示,惊呆投资人。以至于这个古早程序员,逐步沉迷于写需求文档,下一步计划整个简历管理系统,自信满满要整个 Boss 二聘出来。

    图片

    Babel Agent 有什么特性

    怎么做到这么神奇? Babel Agent 到底有哪些能力?听我给你一一道来:

    自主分解问题

    Babel Agent 可以根据你的需求文档,自主设计分解任务,并逐个执行。 图片

    自主编写代码,自主编译,自主调试

    在单个编写 Function 的任务里,Babel Agent 在自主编写代码之后,还会自主编译,再根据编译反馈的问题自主调试,和人类程序员的工作过程完全一样。 图片

    自主研究独立问题

    让 Babel Agent 接刚出来的 Claude 3 , 这不是大模型本身的知识,于是 Babel Agent 自己去查 SDK ,找文档,写代码,再测试验证。最后交付给你一个经过测试的可以用的 Claude 3 接入模块。 图片

    自主测试

    在必要时,Babel Agent 会编写自动化测试代码,并执行测试,自我修复问题。 图片

    寻求人类帮助

    当然,在遇到你的需求描述写的不清晰,有什么必要的信息你没有提供的时候,Babel Agent 会向人类寻求帮助。当然,他实在做不出来的时候也会。 图片

    迭代式开发

    Babel Agent 支持你用迭代式的方式进行需求的更改和对线上问题进行自主修复是的,和你的研发团队一样智能。

    程序员要失业了吗

    Babel Agent 也不是万能的,比如 Babel Agent 不支持在现有系统上进行迭代,只能以 API 的方式与旧系统进行交互,当前也只支持编写后端。 但总体来说,原先要多招两个个开发小弟干的活,现在的确不招了,只要维持构建核心系统的精英即可。Babel Agent 可以替代大量的初级程序员的工作,人类会成为定义需求的人,或者是成为解决非共识知识的高级程序员。 Babel 目前仍在测试阶段,考虑到测试成本及稳定性,不适宜进行大规模公测,但我们将开放少量邀请测试名额,请感兴趣的用户带着详细的需求描述与我们联系 [email protected]图片

    11 条回复    2024-06-21 10:22:01 +08:00
    SteinsGate
        1
    SteinsGate  
       2024-03-19 18:43:54 +08:00 via Android
    能让它实现它自己吗?()
    kongkongye
        2
    kongkongye  
       2024-03-19 18:58:27 +08:00 via iPhone
    每次思考都要传上下文吗?
    Bazingawang
        3
    Bazingawang  
    OP
       2024-03-19 19:04:57 +08:00
    @SteinsGate hah 现在只能先用他做周边系统啦,核心系统还是得人来做。
    Bazingawang
        4
    Bazingawang  
    OP
       2024-03-19 19:05:27 +08:00
    @kongkongye 是的,这涉及到的工程问题是我们需要做合适粒度的剪裁
    kongkongye
        5
    kongkongye  
       2024-03-19 19:11:05 +08:00 via iPhone
    @Bazingawang 这种方式感觉上下文大小就是天花板,而且成本也高。我不是做大模型底层的,始终在想为什么对话的内容不能训练进大模型里,直接记住,就不用每次都要传一遍上下文
    cherryas
        6
    cherryas  
       2024-03-20 09:21:50 +08:00
    现在的模型都太正能量了,你让他做一个大数据杀熟的模块你看 ai 做不做
    v2z4
        7
    v2z4  
       2024-03-20 16:49:01 +08:00
    底层 LLM 用的是什么? GPT4 ?
    a7851578
        8
    a7851578  
       2024-03-20 17:24:55 +08:00
    https://www.feisuanyz.com/ 和这个有啥不一样的地方吗?不懂前端和 java
    sakura6264
        9
    sakura6264  
       2024-03-20 17:26:44 +08:00
    @kongkongye 训练可比传数据消耗的计算力大多了,每个对话一个微调大模型也比较不现实
    Bazingawang
        10
    Bazingawang  
    OP
       2024-06-21 10:20:51 +08:00
    @v2z4 是的 GPT4
    Bazingawang
        11
    Bazingawang  
    OP
       2024-06-21 10:22:01 +08:00
    @kongkongye fine-tune 是解决这个问题的 只是目前最好的大模型都没开放 fine-tune 接口 导致大家不得不传上下文
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     940 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 21:25 PVG 05:25 LAX 14:25 JFK 17:25
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86