需求:
看好多方案,ragflow fastgpt langchain-chatchat ,不知道实际用起来如何?或者有其他推荐的方案?
ChatGPT-Next-Web-langchain 感觉在上游的简单前端框架下加 rag 的逻辑,还是有点勉强了。
update: 现在ragflow等已经支持graphrag了(dify不支持)。更好的rag策略还包括,anthropic的contextual-retrieval 等等。
对比使用来看,传统直接做分割的确实存在很多问题痛点。
1 mumbler 2024-07-14 13:53:32 +08:00 个人用吗,可以试试 flashai.com.cn 的云端版,开箱即用,支持 mac 和 win ,本地知识库+本地向量化,另外还有带本地大模型版本 |
2 GrayXu OP @mumbler #1 谢谢,这个方案看上去限制蛮多的,付费了也只有 8b 的模型。我们已经有 embedding, rerank, chat 的完整 api 服务了。 |
3 lixen9 2024-07-14 14:52:56 +08:00 ![]() fastgpt 试用过感觉还行,蛮符合你的需求来着,开源版本即可 |
4 GrayXu OP @lixen9 #3 谢谢 试了一圈 fastgpt 确实是最好上手的。看了下小规模使用下,开源版本没啥问题,就是配置系统比较麻烦 XD |
![]() | 6 echoless 2024-07-14 17:17:54 +08:00 embed, rerank 这些 api 你是用的开源的么? 我倒是想整合 RAG 这些到 https://github.com/swuecho/chat (只有 chat 功能) 然后可以(optional) 配置 embed, rerank API. |
8 GrayXu OP ![]() @echoless #6 你可以关注下 siliconflow ,最近上了 embedding ,后面会上 rerank 。 |
9 pieerepeng 2024-07-14 20:09:12 +08:00 ![]() |
10 SoloKing 2024-07-14 20:34:13 +08:00 via Android ![]() dify+1 |
![]() | 11 wm5d8b 2024-07-15 08:43:01 +08:00 via Android 模型不在本地部署,全用 api ,钱包它同意嘛 本地用 ollama 部署挺简单的,就是大概 12G 显存得 24 小时处于 standby 状态 |
![]() | 13 zqqian 2024-07-19 10:54:53 +08:00 所以楼主最后调研的结果是什么,能说一下吗? |
14 GrayXu OP @zqqian #13 FastGPT ,感觉是满足功能需求的最轻的选择了。问题的话,还是存在一些小 bug ,然后看上去他们社区版维护的比较随意。 |
![]() | 17 skykk1op 303 天前 楼主有调研结果吗?我需要一个部署在本地的知识库 |
18 yibo2018 158 天前 需要+1 |