Dify外挂RagFlow「开挂模式」!实测:图片/表格/公式三杀原生!

向量数据库大模型机器学习

写在前面

  • RAGFlow 适合处理特别复杂的文档和非结构化数据。
  • Dify 适合 多模型协作和复杂业务流程的场景。

Dify + 外挂知识库,两者结合是截至目前,当前较多开发者会考虑的方式。

本文将详细介绍4个部分:Dify配置、RagFlow配置(白嫖服务器)、Dify外挂RagFLow、三个维度实测(图、表、公式)

1.Dify配置

picture.image详见 Dify-v1.13的安装与配置

2.RagFlow配置

环境配置 和 创建知识库

白嫖50000分钟 腾讯云Cloud Stutio
腾讯云网址[1]:https://ide.cloud.tencent.com/dashboard/workspace

每个月使用不超出额度,下个月还能有50000分钟。
每个月50000分钟是什么概念?
1个月 = 602430=43200分钟。即每个月都可以白嫖。
推荐囊中羞涩的小伙伴们上手体验~

picture.image

新建工作空间,导入ragflowgit仓库

或 自己的RagFlow地址 [3] :https://github.com/LGRY/ragflow.git

  • 规格配置选4核以上picture.image

查看docker\docker-compose.yaml配置,80:80的第一个80表示宿主主机的端口,若clone的是官方仓库,后面打开也是80端口。
本教程中改为3000,后面打开就是3000端口。
若你的difyRagFlow在同一主机,需考虑端口冲突等问题,RagFlow是需要修改第一个80和443为其他端口的。picture.image

启动RagFlowpicture.image

新建知识库

picture.image

选择切片方法(这篇文档是手册类型的,所以选Manual方法)

picture.image

上传数据集

picture.image

解析成功并记住这串id: 46040c86160c11f0b95a0242ac120006

picture.image

3.Dify外挂RAGFlow

3.1 配置外部知识库 API

RAGFlow 两处红色 信息,对应配置到 Dify 两处绿色 处。

注:API Endpoint是由 RAGFlow的ip地址+/api/v1/dify 两部分组成

picture.image

能保存成功,就说明添加知识库API成功了

3.2 创建外部知识库

选择知识库API--填入对应知识库id--点击连接picture.image

4.三个维度问答实测

Dify内置知识库问答 vs 外挂RagFlow知识库

picture.image📊 对比实验设计: 用同一份《2024航空发动机排放测量和评估》PDF(含30张图表/136个公式)进行解析测试

4.1 表问答

先看正确答案picture.image

4.2 图问答

先看正确答案picture.image

4.3 公式问答

先看正确答案picture.image

各位看官,对比结果不用多说了吧

需要测试文件的,后台私信发送:“航空”领取

参考资料

[1] 腾讯云网址: https://ide.cloud.tencent.com/dashboard/workspace

[2] RagFlow官方地址: https://github.com/infiniflow/ragflow.git

picture.image

picture.image

点击下方卡片 关注我们

picture.image

  
📢【三连好运 福利拉满】📢  
  
🌟 若本日推送有收获:  
👍 点赞 → 小手一抖,bug没有  
📌 在看 → 一点扩散,知识璀璨  
📥 收藏 → 代码永驻,防止迷路  
🍻 分享 → 传递战友,功德+999  
🔔 关注 → 关注“AI早高峰”,追更不迷路,干货永同步  
  
💬 若有槽点想输出:  
👉 评论区已铺好红毯,等你来战!  

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
CV 技术在视频创作中的应用
本次演讲将介绍在拍摄、编辑等场景,我们如何利用 AI 技术赋能创作者;以及基于这些场景,字节跳动积累的领先技术能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论