RAG：困境求生 - 文章 - 开发者社区

2024即将结束，回望这两年了，大模型RAG的发展可谓跌宕起伏：

2023年进入RAG萌芽期，摸索前进；
2024上半年RAG到达狂热顶点；
2024下半年实际落地情况并不理想，渐入困境：一周出demo，半年不交付。

Hype Cycle（技术成熟度曲线），当前RAG逐渐进入狂热之后的低谷期

picture.image

展望2025年：RAG回归理性。

找到最小业务切入点，明确需求，定好指标
做好RAG落地标杆，毕竟谁都不愿意当小白鼠
仍然关注新技术

这两年，大模型RAG技术侧也经历了快速发展：

2023年RAG模块迭代：朴素RAG->高级RAG->模块化RAG
2024年RAG框架演化：RAG-> MM-RAG/GraphRAG->Agentic RAG

7种大模型RAG技术架构

picture.image

Naive RAG框架

直接从文档中检索块（Chunks），然后使用查询（Query）通过向量数据库进行检索。结合检索到的上下文（Retrieved context）和查询，通过生成模型（如LLM）生成响应。

picture.image

Retrieve-and-rerank框架

高级RAG技术可以在流程的各个阶段部署。像元数据过滤和文本块分割这样的 预检索策略 ，来提高检索效率和相关性。采用更先进的 检索技术 ，如结合相似性搜索和关键词搜索优势的混合搜索。最后，使用 排名模型 重新对检索结果进行排序，并使用在特定领域数据上 微调的生成性LLM ，有助于提高生成结果的质量。

picture.image

MM-RAG框架（多模态RAG）

当前的RAG系统仅基于文本，这使得无法利用在现实世界多模态文档中扮演关键角色的视觉信息，如布局和图像。

MM-RAG框架通过直接将文档图像嵌入到VLM中来检索和生成信息，从而绕过了传统的文本解析阶段。

告别文档解析，VisRAG带飞RAG，性能飙升37%

一种支持4种多模态RAG技术的引擎：VARAG

Graph RAG框架

GraphRAG的优势在于可以回答涉及整个外部知识库的问题并得出结论，最大的问题在于：难落地。

picture.image

重磅！微软开源GraphRAG项目

微软LazyGraphRAG：新一代超低成本RAG

LightRAG将GraphRAG落地门槛打下来了！

KAG开源了，知识增强掀翻RAG，性能翻倍

Hybrid RAG框架

结合了多种检索技术，可能包括文本检索和图检索，以提高检索的准确性和效率。

GraphRAG与VectorRAG我都选：HybridRAG

Agentic RAG框架

AI Agent是可以解释信息、制定计划和做出决策的自主系统。当添加到RAG流程中时，Agent可以重新制定用户查询，Agentic RAG还可以处理需要多步骤推理的更复杂查询。

再见RAG，你好Agentic RAG！

picture.image

Multi-Agent RAG框架

单智能体系统也有其局限性，因为它仅限于一个Agent进行推理、检索和答案生成。因此，将多个智能体链入Multi-Agent RAG应用是有益的。

再见RAG，你好Agentic RAG！

picture.image


            
Vanilla RAG: https://weaviate.io/blog/introduction-to-rag
            
Advanced RAG: https://weaviate.io/blog/advanced-rag
            
Multimodal RAG: https://weaviate.io/blog/multimodal-rag
            
Agentic RAG:https://weaviate.io/blog/what-is-agentic-rag