近期RAG这块比较火热的方向当属GraphRAG,微软GraphRAG项目自2024.7.3日开源以来,两周内,收获10.9k星星,可见其火热,同时,它既不是第一个也不会是最后一个开源的GrapRAG项目:
- 2024.3.15日LangChain发布Graph RAG实战教程
- 2024.6.24日 蚂蚁首个开源Graph RAG框架
蚂蚁首个对外开源的Graph RAG框架采用全自主的开源产品:DB-GPT(RAG的AI工程框架)+ OpenSPG(知识图谱系统)+ TuGraph(图存储系统)。
Vector | Graph:蚂蚁首个开源Graph RAG框架设计解读
- 2024.7.9日 LlamaIndex发文介绍了Property Graphs,属性图索引通过使用标签属性图表示,解决了传统知识图谱无法为节点和关系分配标签和属性,无法将文本节点表示为向量嵌入,无法进行向量和符号检索的问题,提供了更丰富的建模、存储和查询能力。
RAG+Graph新的打开方式:Property Graphs
- 2024.7.11日Neo4j CEO发表GraphRAG长篇科普长文: GraphRAG宣言。
随后Neo4j于13日开源了 基于LLM提取知识图谱的生成器:llm-graph-builder
github:https://github.com/neo4j-labs/llm-graph-builder
- 2024.7.14日 开源项目Camel宣布在其框架中引入Graph RAG Agent!目前并开源了知识图谱抽取的 Prompt,组合使用UnstructuredIO和neo4j实现节点和关系抽取。
教程:https://colab.research.google.com/drive/1IyttIWlsJKGWtWpc-QXDGbVok8fbud\_j
- 2024.7.14日 LlamaIndex中初步实现了微软GraphRAG的一些模块:图形生成,构建图形和社区摘要;基于社区的检索,使用社区摘要并汇总中间答案。
- 未完待续,欢迎留言补充......
对于Graph与LLM结合的方式,一种类似于传统KBQA那种,还有一种就是当前比较流行的方式社区挖掘+LLM。
对于第二种方式, PaperAgent专栏 以微软GraphRAG项目为例进行了详细的实战讲解,部分效果图如下:
打印图谱:
[['阿根廷', '队员', '梅西', '梅西是阿根廷球队队员'],
['阿根廷', '赛事结果', '哥伦比亚', '阿根廷击败哥伦比亚赢得美洲杯'],
['阿根廷', '队员', '劳塔罗马丁内斯', '劳塔罗马丁内斯帮助阿根廷获胜'],
['阿根廷', '获得者', '美洲杯冠军奖杯', '阿根廷赢得2022年美洲杯冠军'],
['球迷的不守规矩行为', '后果', '被驱逐出场或逮捕', '违规行为的处理'],
...
打印社区摘要:
print(community_summary)
{0: '当球迷参与不守规矩的行为时,可能会面临严重的后果,主要包括被赛事组织者驱逐出场,或者由警方介入导致被捕。这种处理方式旨在维护比赛秩序,对违规行为进行有效管控。',
1: '1. 罗伯托·加纳乔对南美足联的评价表现出深深的失望,主要由于他们对球员家属的不公待遇。\n2. 南美足联的行为引发了罗伯托·加纳乔的负面情绪,他对此感到失望,这起因于他们对待球员家庭的不当行为。',
2: '1. BBA在中国汽车市场面临来自多个竞争者的挑战,如宾利和劳斯莱斯,它们都与BBA处于同一级别的竞争中。\n2. 宾利和劳斯莱斯都是BBA在中国市场的主要竞争对手,表明豪华车市场的竞争激烈。\n3. BBA不仅在中国市场参与竞争,还直接与像宾利和劳斯莱斯这样的高端品牌进行同级别较量。',
3: '1. 阿根廷在美洲杯比赛中对阵哥伦比亚,最终取得胜利,赢得冠军。\n2. 阿根廷与哥伦比亚在美洲杯决赛中对决,阿根廷成功击败对手。\n3. 阿根廷对阵哥伦比亚,赛事结果显示阿根廷赢得了美洲杯。\n4. 在美洲杯的较量中,阿根廷作为对手对阵哥伦比亚,并获得了胜利。',
4: '"阿根廷队赢得两次冠军奖杯,分别是作为获得者在美洲杯赛事中荣获冠军。"',
5: '1. 梅西作为队员关联于阿根廷,表明他是阿根廷国家队的一员。\n2. 同样地,梅西也被确认为阿根廷球队的队员。'}
RAG专栏 之详情,可试看:
https://docs.qq.com/aio/DR0dBWm9WYlJNckxw
推荐阅读
- • 对齐LLM偏好的直接偏好优化方法:DPO、IPO、KTO
- • 2024:ToB、Agent、多模态
- • RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG!
- • Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1.2万字,20+文献,27张图)
欢迎关注我的公众号“ PaperAgent ”, 每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。