
原谅我有一点点标题党,但我确实迫不及待想先简单介绍一下:browserwing 。他能做什么呢?目前浏览器上普通流程范围能做的事情他就能做,比如:
注意了,下面只是随便举例子,不是说他只能做这些,理论上任何网站他都可以。
获取信息类:
执行操作类:
而且可以规划和自动执行不同操作,比如:帮我看看各个平台关于 gpt5.2 的讨论,总结一下,然后通过微信发给我。
你是不是觉得完成上述事情,像市面上所有的 AI 浏览器或者 AI Agent 一样要:
browserwing 解决的就是这些问题,那些困住你的不能真正实现 AI 浏览器自动化的问题。
而且,现在已经开源了,完全开源免费。
github 地址:https://github.com/browserwing/browserwing
如果你喜欢或觉得有用的话恳请帮忙 star 一个呀。晚点我会开文章更具体介绍场景,背景,还有具体的实现方案和未来规划。

我是 Glenn ,一个有编程基础的 vibe 工程师。希望做出大家喜欢好用的产品。
我还有另外一个产品:Modern Mermaid ,一个很好看好用的 mermaid 流程图设计网站,喜欢的也可以点点赞收藏起来。
github: https://github.com/gotoailab/modern_mermaid
网站:https://modern-mermaid.live

更多信息,请关注我的社交媒体:
1 xiao3vv PRO 看起来不错,我先试用一下 |
3 kamilic 7 天前 如何解决 captcha ? |
5 dawee2y 7 天前 标题党必____! |
6 chenzw2 7 天前 这个不就是自动化测试中的录制和重放功能吗? |
8 plane OP @chenzw2 重放这个交给大模型调度了。当前还只是支持简单录制,但后续可以做更复杂的编排,还可以参考 claude skill 。可以理解为一个概念就是每个平台都有一个 skill 来帮你执行更复杂的任务,比如 github skill ,bilibili skill 。 |
9 FFM 7 天前 小红书 web 版的反爬非常狠,很难有一个长期稳定的方案。而且大部分内容网站未来都会快速升级这类防御,不然都给 AI 免费做嫁衣了。 |
10 FFM 7 天前 我感觉这类浏览器 agent 的最终解决方案是 OCR 搞定一切,而不是现在跟那么多网页元素斗智斗勇。OP 可以关注下 OCR 领域的进展。 |
11 plane OP @FFM 是吗。听说 https://github.com/xpzouying/xiaohongshu-mcp 这个稳定运行一年了。我实践下来暂时也没有遇到封号或者别的问题。可能只是简单用,不要大规模爬还好吧。我这个不是为了做大规模爬虫的。 |
12 plane OP @FFM 那是肯定的,只是要等模型能力增强和算力成本下降,ocr 或者这些方案从能用到能便宜好用还要一段时间。目前也能做,但都是:慢 + 贵。如果有好用能用的,我也不用自己做了。 |
13 ga9 7 天前 请问下,有没有专门的开源工具,是专门做发表知乎/csdn/v2ex/reddit/公众号等等各个平台文章... |
15 datiewang 7 天前 别的不说,“真正能用不是玩具”这句话已经把我的 AI PTSD 给看出来了。 |