各位有使用 LLM 操作浏览器完成业务自动化的 MCP 方案吗 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
Sh1xin
V2EX    程序员

各位有使用 LLM 操作浏览器完成业务自动化的 MCP 方案吗

  •  
  •   Sh1xin 12 天前 1716 次点击
    传统 RPA 需要对每一步进行明确,有时候 web 突然前端元素变化一点,RPA 就会出问题。运维、开发成本还是比较高。所以我想试一下直接使用 AI 来操作。
    方案测试:chrome-mcp-server
    结果:可以完成基本动作,但是速度比较慢,简单的登录-点击-获取 table 。LLM 会反复调用 agent ,几个当前先进的模型 gpt5,grok4 等都是同样的问题,非常浪费 token 。
    所以想问下有没有其他好的方案,
    11 条回复    2025-10-24 09:42:45 +08:00
    xuelang
        1
    xuelang  
       12 天前
    试了一圈,没发现有啥能用的
    loloX
        2
    loloX  
       12 天前
    换个思路呗,你让 AI 给更新自动化测试的脚本。把两个版本不同的 HTML 代码都喂给 AI ,让 AI 发现差异,然后更新旧的脚本。
    Sh1xin
        4
    Sh1xin  
    OP
       12 天前
    @loloX 我是做业务流程自动化,不是测试自动化。比如现在有一个业务需求是登录系统 A ,然后点击菜单栏"信息录入",然后在出现的表格上面把 excel 信息录入进去。
    loloX
        5
    loloX  
       12 天前
    但是落实到结果难道不都是编写自动化脚本吗?
    kxg3030
        6
    kxg3030  
       12 天前
    使用模拟浏览器操作都比使用 mcp 快,我只用 mcp 来做逆向
    SuperDaniel313
        7
    SuperDaniel313  
       12 天前
    https://github.com/SuperDaniel-cn/anbao-scripts

    来试试吗?我刚发的版
    MCP 我尝试集成过了,拿来玩儿是没问题,但是想拿来干活基本上不可能。自动化脚本的一大特点就是要求稳定性,AI 这个阶段谈稳定性太早了。
    换一个思路,用 AI 来编码,然后快速出脚本,这样稳定性和效率就可以兼得了。
    Sh1xin
        8
    Sh1xin  
    OP
       12 天前
    @SuperDaniel313 这不就是传统 RPA 的业务场景
    chaoshui
        9
    chaoshui  
       12 天前
    不如换个思路,让 LLM 帮你写代码,LLM 真要替代传统的 RPA ,使用成本和稳定性是绕不过去的两大难题
    SuperDaniel313
        10
    SuperDaniel313  
       12 天前   1
    @Sh1xin #8 LLM 不是烧 token 的问题,是稳定性的问题。
    如果你是想 LLM 能像实习生一样,多教几次就能熟练、稳定的执行指令,现阶段不可能啊。LLM 参与自动化任务本身就是最大的不稳定因素,这和自动化要求的稳定相违背的,更别提高效了。

    LLM 要反复试错才能解决问题,这在编码领域已经充分验证了呀,一句话丢给 LLM ,等会来看项目已经是一坨屎了,只有时刻盯着才能把项目写出来。只能提效,如果稳定性稍差,反而降效。

    业务场景如果要引入自动化往往已经是稳定的业务流,在追求高效了。这不是探索性质的任务。

    比如你当前的困境是网页元素变动导致脚本失效,想引入 LLM 来做代替。

    这个方案我尝试过,纯脚本或者纯 LLM 都有各自缺点,混合型是不错的路子,比如脚本无法继续的时候,调 LLM 出来救场。LLM 此时的作用是拟人进行高级决策判断。想法蛮好的,但只要用过几次就知道,理想和现实的差距还是蛮大的,最终我放弃集成了。

    业务问题就用业务方式解决,技术还没到这个阶段的时候,引入这种不完善的技术反而让业务开展充满阻碍。

    LLM 在当下这个场景里,快速编码是更具备价值的能力,你的脚本失效,如果往常需要更多时间来编码,现在用 LLM 只需要自己定位问题,想好解决思路,然后让 LLM 编码,你来快速交付。这样就能更大程度的发挥业务价值,否则 LLM 真能代替你了,那下岗也不远了。
    realJamespond
        11
    realJamespond  
       11 天前
    chrome devtools 和微软的 playwright mcp
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1011 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 18:56 PVG 02:56 LAX 10:56 JFK 13:56
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86