raptor + graphrag = HiRAG,开源~

向量数据库大模型关系型数据库

论文笔记, 标题:Retrieval-Augmented Generation with Hierarchical Knowledge, 代码开源:https://github.com/hhy-huang/HiRAG

  • raptor的特色应该就是聚类【向量空间距离】,抽象更高级的特征。
  • graphrag的特色是通过实体连接起不同位置的关系【物理连接】,得到实体级别更丰富特征。

二者结合一下,应该就是这篇文章的核心要点了。

相似或者相关的实体,可能没有一个有效的物理连接,所以graphrag没法将他们聚类成社区。 那不如给实体聚类,抽象一层出2级实体。 这个层级可以持续上去,一个簇的描述,可以用LLM总结。越往上,就越抽象,这个符合raptor的理念。

picture.image

  1. 抽图谱,三元组

picture.image

  1. 实体表征,GMM聚类

picture.image

picture.image

  1. 合并

picture.image

具体怎么检索就不重要了,离线数据都弄好了,在线的还不就在这上边折腾。

整体上,效果变好、token消耗多不少。

picture.image

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
vivo 容器化平台架构与核心能力建设实践
为了实现规模化降本提效的目标,vivo 确定了基于云原生理念构建容器化生态的目标。在容器化生态发展过程中,平台架构不断演进,并针对业务的痛点和诉求,持续完善容器化能力矩阵。本次演讲将会介绍 vivo 容器化平台及主要子系统的架构设计,并分享重点建设的容器化核心能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论