打算用 AI 来做企业知识库,最佳的组合是什么? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
BruceXu
V2EX    Local LLM

打算用 AI 来做企业知识库,最佳的组合是什么?

  •  
  •   BruceXu 265 天前 2851 次点击
    这是一个创建于 265 天前的主题,其中的信息可能已经有所发展或是发生改变。

    公司有个类似维修智能助手的小程序,用来给服务工程师提供设备维修指南的.

    之前是固定问题+回答,体验不太好,这次想用 AI 知识库来做.

    知识库已经梳理结构并用 md 格式保存.

    尝试了 ollama 本地部署 DeepseekR1 的 7B 版本+AnythingLLM.
    不知道是 7B 版本不行还是 AnythingLLM 的嵌入模型垃圾.回答完全不是知识库的内容.

    于是找了个叫 Cherry Studio 的软件,用硅基流动 api 使用在线满血版 DeepseekR1,嵌入模型用的 BAAI/bge-m3(不知道是个什么模型),效果强了不少,回答基本符合知识库了.

    新的问题: R1 思考太慢了,基本上耗时 1 分钟-5 分钟.不太能接受. 换 V3 的话,回答又没那么准确了,常常会遗漏知识库中的部分内容.

    我想换其他模型试试,但是考虑到 deepseek 是目前唯一可以本地部署的模型,换其他的可能不方便企业做私有化部署.

    有没有大佬在这方面比较有经验的,求指点.

    20 条回复    2025-09-12 15:04:18 +08:00
    poorLi
        1
    poorLi  
       265 天前
    先用 Coze 试试效果
    tigerstudent
        2
    tigerstudent  
       265 天前
    腾讯出了个 IMA 知识库,把文档丢进去就可以随便提问了,还支持共享知识库
    zhangH258
        3
    zhangH258  
       265 天前
    至少需要 32B ,7 不行
    waityan
        4
    waityan  
       265 天前
    企业知识库的话,可以试下 fastgpt 、dify ,用社区版就行了
    isSamle
        5
    isSamle  
       265 天前
    qwen2.5 不行吗?
    Unmurphy
        6
    Unmurphy  
       265 天前
    同遇到这样的诉求
    BruceXu
        7
    BruceXu  
    OP
       265 天前
    @isSamle #5 这个还没试过...大模型太多了.之前只用过 gpt4,现在还在尝试 deepseek 中.
    isSamle
        8
    isSamle  
       265 天前
    Ollama 部署,几个切换着试一下,DS 个人感觉有点嗦
    zgzhang
        9
    zgzhang  
       265 天前
    dify+ds:32B ,基本可用,而且 dify 的知识库基本开箱即用
    shiny
        10
    shiny  
    PRO
       265 天前
    dify 多找几个 API 接入测效果,不一定要在 deepseek 一棵树上吊死
    lxqxqxq
        11
    lxqxqxq  
       265 天前
    https://help.aliyun.com/zh/model-studio/getting-started/ 百炼 我们刚落地 需求跟你差不多
    BruceXu
        12
    BruceXu  
    OP
       265 天前
    @lxqxqxq #11 大概看了下,感觉阿里腾讯都有类似的产品了.这个支持本地部署不?企业的知识库传到外网还是不太合适.
    SwordSong
        13
    SwordSong  
       265 天前
    最少 32B 的 LLM 才能有脑子调用知识库
    lxqxqxq
        14
    lxqxqxq  
       265 天前
    @xubingok #12 本地部署去魔搭社区看看,但是不建议 哈哈哈哈 能用云商就用云商
    mumbler
        15
    mumbler  
       265 天前
    flashai.com.cn 提供的整合包,一键部署本地大模型+知识库,无需任何配置,也不需要懂技术,要什么模型有什么模型
    BruceXu
        16
    BruceXu  
    OP
       265 天前
    @mumbler #15 兄弟,别的不说,这个真的是垃圾.我下载安装了,就是个半成品...连菜单都没做完.
    litchinn
        17
    litchinn  
       265 天前
    可以试试调整下 RAG chunking
    coefu
        18
    coefu  
       265 天前
    qwq 32B int 4 + bge-m3 ,并发不大的话 32G vram 够够的。不过得分卡跑。
    akira
        19
    akira  
       253 天前
    本地化部署是需要 小钱钱的。。。 安全 - 性能 - 费用 3 者不可兼得
    GavinY
        20
    GavinY  
       80 天前
    我现在用
    Cherry Studio + Qwen3-embedding-8B + Qwen3-reranker-8B 做本地的知识库。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3205 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 11:32 PVG 19:32 LAX 03:32 JFK 06:32
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86