大家在实现 AI Agent 的时候都用什么框架呢? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
chman
V2EX    程序员

大家在实现 AI Agent 的时候都用什么框架呢?

  •  
  •   chman 2 天前 2962 次点击
    问题 1:
    最近做一个项目,需要用做一个类似医生的 AI Agent ,需要大模型根据每一步的结果决定下一步的检查,自主规划、循环思考。
    病人描述自己的病情,医生自主规划检查的方案,我们会提供 MCPTools 供医生使用,这些 Tools 包括:血液检查、B 超、X 光等等。医生 Agent 会根据每一步的结果决定下一步的检查,直到找到病因,得出结论。
    我们目前使用 OpenManus ,效果还行,但是感觉还有较大的优化空间,现在的框架也比较多,请教下足智多谋的 v 友,有没有更好的选择?

    问题 2:
    在问题 1 中,我们寄希望于病人能一次性、全面、准确地描述出自己的症状,然后医生 AI 才开始行动。
    但是现实情况,往往并不是这样的,我们去看病,在前期问诊过程中,病人往往无法做到一次性、全面、准确地描述出自己的症状,医生往往需要多轮提问,才能回去足够的信息,才能开始检查。

    [问诊阶段]
    医生:哪里不舒服?
    病人:头疼

    医生:哪个部位?
    病人:额头

    医生:痛了好久了?
    病人:前天开始痛的

    医生:怎么个痛法?针刺、盾击、闷痛、跳动痛
    病人:闷痛

    医生:表面痛还是里面痛
    病人:表面靠里一点点

    医生:了解了,开个脑电图。
    [问诊阶段结束]

    如果我们要实现这个 AI 自主规划检查之前的循环对话问诊,有没有现成的方案?还是说需要自己手搓。
    21 条回复    2025-12-23 15:24:53 +08:00
    aeron
        1
    aeron  
       2 天前
    自己手搓吧,
    litchinn
        2
    litchinn  
       2 天前
    感觉框架解决不了你的问题,你要的是提示词
    beginor
        3
    beginor  
       2 天前
    bleaker
        4
    bleaker  
       2 天前
    有语音对话需求的话,可以考虑 https://github.com/TEN-framework/ten-framework
    leehaoze98
        5
    leehaoze98  
       2 天前
    1. 如果是要纯 Agent 的话,类似于 AgentScope 的都可以,只用基础能力,需要自定义的 Agent 流程基于框架开发。
    2. 问题 2 ,倒是也可以直接让 Agent 去收集。如果收集的信息可以根据场景枚举的话,应该可以简单套个 LLM 做一下,现成的方案就不太熟悉了

    最后一般医疗场景用 workflow 的比较多一些,也可以考虑下 LangGraph ,纯 Agent 的话不太敢给用户用呀
    vonfry
        6
    vonfry  
       2 天前
    核心不是框架,是你的业务逻辑如何拆解成逐步执行的逻辑与分发。另外现在大部分框架都是做简单原型还行,但复杂需求都要东改西改,不如手搓方便。
    liu731
        7
    liu731  
    PRO
       2 天前
    我的理解是 OP 需要 Embedding 检查报告,然后结合 Prompt 生成回答。
    mufanzz
        8
    mufanzz  
       2 天前
    Spirng AI Alibaba
    Eino
    chenglus
        9
    chenglus  
       2 天前
    微软有个以强化学习思路训练 agent 的框架: https://github.com/microsoft/agent-lightning

    应该可以用到
    etnperlong
        10
    etnperlong  
       2 天前
    如果有复杂工作流,目前用的是 Mastra.ai ;语音框架用的是 Livekit.io
    mmdsun
        11
    mmdsun  
       2 天前 via iPhone
    有语言要求不? Spirng AI 的工具调用可以支持多轮循环、或者 Recursive Advisor 也就是循环的 Agent 调用。

    感觉你的场景多轮函数调用就可以,可以手动控制:
    https://docs.spring.io/spring-ai/reference/api/tools.html#_user_controlled_tool_execution


    还有个 Embabel Agent ,也是 jvm 系语言,可以用的 agent 框架。
    littleshy
        12
    littleshy  
       2 天前
    https://github.com/microsoft/agent-framework
    这个可以一试了,我们已经在从 dify 逐步迁移了。
    daodao
        13
    daodao  
       2 天前
    当然首选 langchain langgraph...
    v2gba
        14
    v2gba  
       2 天前
    ( off-topic )你让我想到了 https://xiaoce.fun/guessdisease
    crackidz
        15
    crackidz  
       2 天前
    我现在第一步都是先尝试用 Claude Code 实现,如果还有问题就使用 pydantic ai
    TabGre
        16
    TabGre  
       2 天前 via iPhone
    Claude agent sdk or ai sdk
    highkay
        17
    highkay  
       2 天前
    例如 langgraph 的 react agent ,这种 case 主要是靠提示词( ooda )驱动 agentic 的诊断过程,workflow 其实不太好做。而且生产用的话,不要去搞什么多智能体,复杂,浪费 token ,不好调试,反正缺点远远大于优点。
    d0r1an
        18
    d0r1an  
       2 天前 via iPhone
    https://github.com/boxlite-labs/boxlite
    我现在正在基于这个项目开发一个全自主框架中
    JustRuning
        19
    JustRuning  
       2 天前
    同医疗行业小作坊,已调研使用以下 Agent 框架参考
    **Python 生态:**
    1. Langgraph ;
    Tips: 已用于生产环境。
    优点:生态成熟,稳定,支持多种 Memory 驱动、文档最佳实践齐全
    缺点:调试繁琐、性能较弱、有学习成本
    https://www.langchain.com/langgraph

    2. CrewAI
    优点:编排 Agent 开发快速效率高,支持多 Agent 适合快速编排
    缺点:学习曲线稍陡
    https://github.com/crewAIInc/crewAI

    **Golang 生态:**
    1. adk-go Google AI 生态;正在研究测试阶段
    优点:Google Gemini 生态
    缺点:目前功能还比较少,缺少社区活跃度。
    https://github.com/google/adk-go

    2. Eino 字节出品;
    优点: 像是抄的 Langgraph ,如果会 Langgraph 很容易上手,思想相通。官方也说了 Eino ADK 对齐 google adk go
    缺点:文档不够细,有些时候理解一个功能,反而去看 Langgraph 就理解了。
    https://github.com/cloudwego/eino

    PS: 由于团队成员大多数是 Gopher ,不愿意学习 Python, 没办法只好调研了 Golang 生态; 目前计划使用 Eino

    最后一点小经验:如果 Agent 功能简单 workflow 不复杂,不建议使用复杂状态机难调试,可以使用简单的 CrewAI, pydantic AI 已经能满足大多数简单任务 Agentic 需求。
    ihainan
        20
    ihainan  
       2 天前
    既然都用 OpenManus 了,我觉得你可以考虑 Claude Agent SDK ,模型可以换成国产模型,接入你的 MCP 或者干脆写一个 Agent Skill 。
    visper
        21
    visper  
       1 天前
    看到一个号称生产里面严格控制不让 ai 乱回答的。不过没用过。看自己介绍起来感觉不错。https://github.com/emcie-co/parlant
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1242 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 17:29 PVG 01:29 LAX 09:29 JFK 12:29
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86