Dify AI工作流学习系列之v0.15.0:全新父子检索策略 - 更精准,更全面的知识检索

向量数据库大模型云存储

前言✨

2025年无疑将会是AI Agent应用爆发的一年,以dify为代表的工作流应用平台无疑是AI从业者们开创道路上的开山巨斧。Dify 最新发布的 v0.15.0 版本已经上线,包含了大量的错误修复、功能升级和优化增强,旨在为您带来更加流畅、高效的开发体验。让我们一起来看看这个版本有哪些令人兴奋的新变化吧!


新功能

🧑‍🧑‍🧒‍🧒 父子检索机制

在本次更新中,我们引入了全新的父子检索机制(Parent-child Retrieval),采用两层级的层次化方法,巧妙地平衡了精确匹配与全面上下文信息之间的权衡。这一机制显著提升了 RAG 系统中 AI 生成响应的质量与准确性。

picture.image

picture.image

主要亮点:

块编辑与预览展示 :全新设计的块编辑和预览功能,为用户带来更好的阅读和编辑体验。即使是没有技术背景的用户,也能轻松理解和操作两层父子结构。

独立优化子块检索效率 :用户现在可以独立优化子块的检索效率,而无需更改父块作为大型语言模型(LLM)的内容。

索引模式规则更新 :一旦索引模式从“经济模式”升级到“高质量模式”,将无法降级,确保数据检索的一致性和可靠性。

知识库中的文档批量操作 :支持文档的批量启用、禁用、删除和归档功能,大大简化了大规模文档管理的操作流程。


改进与优化

多版本工作流管理

在此次更新中,多版本工作流管理得到了显著提升。现在您可以更高效地管理多个工作流版本,确保项目的灵活性和可维护性。

UI/UX 无障碍调整

为了提升用户体验,我们对界面和用户交互进行了多项无障碍优化。例如,将部分 div 元素替换为 button ,增强了用户的互动性和导航便捷性,使界面更加友好和易用。

数据库与内存优化

数据库和内存的优化不仅提升了系统性能,还减少了数据加载和检索时可能遇到的问题。这些优化将为您的开发工作带来更多便捷。

流模式支持增强

我们增强了对流模式、错误反馈和令牌处理的支持,这将显著改善您的编码体验。多位贡献者共同努力,确保在各种开发场景下,Dify 都能提供稳定、高效的支持。


🛠️ 错误修复

多项拼写错误与错误处理改进

本次版本修复了大量拼写错误,改进了错误处理机制,解决了工作流中的多种问题。例如修复了工具无法运行和 HTTP 方法大小写敏感的问题,清理了异常处理,使您的工作流运行更加顺畅。

更好的错误管理

在多个组件中,我们改进了错误管理机制,包括对无效 URL、文件上传、JSON 解析和缺失 ID 的更好处理。这些改进将大大提升系统的稳定性和可靠性。

默认值修复与 URL 格式优化

我们修复了 Google Storage 配置的默认值问题,并优化了 URL 格式,确保 Docker Compose 的兼容性。让系统运行更加顺畅。


⚙️ 重构与其他任务

代码重构与可维护性提升

为了提升代码的可读性和可维护性,我们进行了全面的代码重构。例如,使用 tiktoken 进行令牌计算,清理了未使用的导入,确保代码库更加简洁高效。

国际化支持优化

我们为国际用户带来了大量本地化改进,包括错误信息和本地化内容的修正。确保了 Dify 在全球范围内的良好体验。


其他更新

新模型与语音支持

新增了更经济且具备长上下文处理能力的 Qwen2.5-72B-Instruct 模型,以及来自 siliconflow 的多种语音模型。这些新模型将为您的应用提供更多样化的支持。

文档解析相关 Bug 修复

我们修复了与文档解析相关的多个 Bug,确保数据格式的完整性。解决了这些问题,让您的数据处理更加可靠。


🔧 升级指南

Docker Compose 部署

重要提醒: docker-legacy 目录中的文件将不再维护并将从仓库中移除。如果您仍在使用这些文件,请尽快切换到新版本。

升级步骤:

(1) 备份自定义的 docker-compose YAML 文件(可选)


            
cd docker
            
cp docker-compose.yaml docker-compose.yaml.$(date +%s).bak
        

(2) 获取主分支的最新代码


          
git checkout main
          
git pull origin main
      

(3) 停止服务


        
            

          docker compose down
        
      

(4) 备份数据


        
            

          tar -cvf volumes-$(date +%s).tgz volumes
        
      

(5) 升级服务


        
            

          docker compose up -d
        
      

源代码部署

升级步骤:

(1) 停止 API 服务器、Worker 和 Web 前端服务器。

(2) 获取发布分支的最新代码


        
            

          git checkout 0.15.0
        
      

(3) 更新 Python 依赖


          
cd api
          
poetry install
      

(4) 运行迁移脚本


        
            

          poetry run flask db upgrade
        
      

(5) 重新启动 API 服务器、Worker 和 Web 前端服务器。


🔍 更新内容详情

本次更新修复和新增了众多功能,具体包括但不限于:

错误修复

在 Sentry 集成中忽略 FileNotFoundError 错误(@laipz8200, #12023)

修正 workflow_trace 方法中的 session 拼写错误(@You-keitou, #12031)

替换通用异常为具体错误类(@laipz8200, #12036)

修复迭代节点中无法使用数组文件的问题(@laipz8200, #12035)

调整模态背景颜色(@YIXIAO0, #12042)

其他多项拼写错误和逻辑问题修正

新功能

为所有类型检查引入 mypy(@yihong0618, #10921)

增强父子检索支持(@WTW0313, #12086)

添加反馈创建中的内容参数(@laipz8200, #12077)

改进文件上传错误处理(@laipz8200, #12132)

增加对 Qwen2.5-72B-Instruct 和 siliconflow 语音模型的支持(@senseb, #12415, #12425)

重构与优化

使用 tiktoken 进行令牌计算,提升代码可读性(@laipz8200, #12416)

清理未使用的导入,精简代码库(@bowenliang123, #11922)

优化数据库使用,提升性能(@laipz8200, #12071)


📢 立即升级,体验全新功能!

Dify v0.15.0 版本已经准备就绪,赶快按照我们的升级指南进行升级,体验全新的功能和优化吧!无论您是通过 Docker 部署还是源码部署,我们都为您准备了详细的步骤,确保升级过程顺利无忧。

了解更多技术细节: https://mp.weixin.qq.com/s/YCvxXVjKjIeOpTNf4NRkYQ

声明

本文由山行翻译整理自:https://github.com/langgenius/dify/releases,如果对您有帮助,请帮忙点赞、关注、收藏。后续山行将持续关注以dify为代表的AI工作流应用。

0
0
0
0
关于作者
相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论