设计自己的满血版DeepSeek-R1+知识库

大模型向量数据库云存储

企业有大量长期沉淀下来的私域知识,比如规章制度、招投标书、客户服务资料,销售文案等等。

Coze中有三种格式接入企业知识:

picture.image

  • 文本 :

将文档、URL、三方数据源上传为文本知识库后,用户发送消息时,智能体能够引用文本知识中的内容回答用户问题。

  • 表格 :

用户上传表格后,支持按照表格的某列来匹配合适的行给智能体引用,同时也支持基于自然语言对数据库进行查询和计算。

  • 照片 :

照片上传到知识库后自动/手动添加语义描述,智能体可以基于照片的描述匹配到最合适的照片

在本合集《动手设计智能体:Coze版》中,企业员工AI助理智能体是以 RAG 的方式接入企业私域知识,以此而引发的 大模型知识、知识库知识、插件知识的冲突, 在后文有讨论解决方案, 同时,关于RAG的发展历程:从 RAG启蒙 、到 高级RAG之36技 ,再到 未来Agentic RAG ,PaperAgent进行 概括性 梳理:

一、RAG启蒙

大模型RAG核心浓缩成两个核心阶段:

  • 检索阶段 :

模型首先从外部知识库中检索与输入文本相关的信息。这个知识库可以是对大规模文本数据集进行索引处理后形成的数据库。

  • 生成阶段 :

将检索到的信息作为输入,到一个生成模型中(如 Qwen 、 DeepSeek V3/R1 ),这个生成模型会基于输入信息,生成最终的响应或文本。

picture.image

二、高级RAG之36技

从架构、模块、技术三个维度了概况了大模型高级RAG全过程之技术要点,一个框架、9个模块、36种技术,涉及Query理解、Query路由、索引、Query检索、重排、生成、评估与框架、RAG新技术等9个模块。

一张全景框架图,梳理了9个模块,36种技术

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论