RAGLAB、TC-RAG、CommunityKG-RAG、W-RAG:这周怎么这么多RAG?

大模型关系型数据库算法
RAGLAB、TC-RAG、CommunityKG-RAG、W-RAG:这周怎么这么多RAG?

picture.image

如遇添加问题,请加vx: iamxxn886

RAGLAB:一款模块化、研究导向的统一框架,专为增强检索生成设计。

发布时间:2024 年 08 月 21 日

开源软件 人工智能

RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation

大型语言模型 (LLM) 在对话、推理和知识保留方面表现出色,但仍面临幻觉和知识实时更新等挑战。为解决这些问题,研究者采用检索增强生成 (RAG) 技术,但 RAG 的发展受限于缺乏算法比较和开源工具的透明度。为此,我们推出 RAGLAB,一个模块化、研究导向的开源库,重现 6 种算法并构建全面研究生态。借助 RAGLAB,我们在 10 个基准上公平对比 6 种算法,助力研究人员高效评估和创新算法。

https://arxiv.org/abs/2408.11381

利用 RAG 和 LLM 进行少量样本上下文学习,实现基于证据的事实核查

发布时间:2024 年 08 月 21 日

社交媒体 信息安全

Evidence-backed Fact Checking using RAG and Few-Shot In-Context Learning with LLMs

社交媒体上的错误信息泛滥,使得在线声明的事实核查变得至关重要。手动验证每条声明极为困难,因此我们设计了一个自动化系统来应对这一挑战。该系统利用 Averitec 数据集评估声明的真实性,并提供支持证据。通过 Retrieve and Generate (RAG) 流程,我们从知识库中提取相关证据,结合声明输入 LLM 进行分类。此外,我们还评估了 LLM 的少量样本 In-Context Learning (ICL) 能力。我们的系统在 'Averitec' 评分上比基线提升了 22%,所有代码将在 GitHub 上公开。

https://arxiv.org/abs/2408.12060

picture.image

picture.image

PermitQA:风电场选址与许可领域中检索增强生成的评估基准

发布时间:2024 年 08 月 21 日

PermitQA: A Benchmark for Retrieval Augmented Generation in Wind Siting and Permitting domain

在 NLP 和文本生成的快速发展领域,RAG 通过利用用户指定数据库中的信息,为提升生成文本的质量和可靠性开辟了新途径。为了评估和比较不同 RAG 配置的性能,基准测试至关重要。本文中,我们提出了一种基于人机协作的自动问答生成框架,用于创建领域相关的 RAG 基准。作为案例研究,我们介绍了 PermitQA,这是首个针对风电场选址和许可领域的基准,涵盖了多个与风能环境影响相关的科学文档。我们的框架通过多样化的评估指标和多层次复杂度的问题类型,系统地评估了 RAG 的性能,并展示了不同模型在此基准上的表现。

https://arxiv.org/abs/2408.11800

picture.image

picture.image

多跳问答中的分层检索增强生成模型与重新思考机制

发布时间:2024 年 08 月 20 日

问答系统 信息检索

Hierarchical Retrieval-Augmented Generation Model with Rethink for Multi-hop Question Answering

多跳问答(QA)系统需整合多条信息进行复杂推理,但现有系统常遇过时信息、上下文限制及准确性与数量间的权衡难题。为此,我们创新提出 HiRAG 框架,含分解、定义、检索、过滤、总结五大模块,并采用分层检索策略,融合文档级稀疏与块级密集检索优势。同时,我们改进单候选检索法,并构建索引与档案维基语料库,以应对知识过时与不足。实验显示,HiRAG 在多数据集上超越前沿模型,其代码已公开于 GitHub。

https://arxiv.org/abs/2408.11875

RAG 系统的挑战与突破:应对讽刺的新方法

发布时间:2024 年 08 月 20 日

人工智能

Reading with Intent

RAG 系统通过整合外部信息源,如维基百科和开放互联网,来提升知识语言模型的能力。然而,这些系统在处理人类交流的复杂性,尤其是讽刺,方面遇到了挑战。本文通过生成讽刺段落并测试其对 RAG 系统性能的影响,引入了一个提示系统来增强模型对讽刺的理解和响应生成能力,并通过消融研究验证了方法的有效性,显著提升了 RAG 系统处理讽刺内容的能力。

https://arxiv.org/abs/2408.11189

picture.image

picture.image

LegalBench-RAG:法律领域检索增强生成基准

发布时间:2024 年 08 月 19 日

人工智能

LegalBench-RAG: A Benchmark for Retrieval-Augmented Generation in the Legal Domain

RAG 系统在 AI 法律应用中展现出巨大潜力,但现有基准如 LegalBench 主要评估 LLM 的生成能力,忽略了检索环节的评估。为此,我们推出了 LegalBench-RAG,首个专注于法律领域 RAG 系统检索性能的基准。该基准强调从法律文档中精准提取关键文本片段,避免因检索大量不精确信息而超出上下文限制,从而降低处理成本和延迟,并防止 LLM 遗忘或产生错误信息。此外,精准检索有助于 LLM 为最终用户生成准确引用。LegalBench-RAG 数据集包含 6,858 个由法律专家人工标注的查询-答案对,覆盖超过 7900 万字符,并提供轻量级版本 LegalBench-RAG-mini 以支持快速实验。该基准的推出为提升法律领域 RAG 系统性能提供了关键工具,其数据集已在 GitHub 公开发布。

https://arxiv.org/abs/2408.10343

利用主题嵌入提升文档检索效率

发布时间:2024 年 08 月 19 日

文档检索 信息技术

Enhanced document retrieval with topic embeddings

随着检索增强生成(RAG)的兴起,文档检索系统再次成为焦点。RAG 架构相较于仅依赖 LLM 的应用,幻觉率更低。但检索机制的准确性仍是提升效率的关键瓶颈。特别是在语料库中包含多个相关但不同主题的文档时,检索性能往往不尽如人意。为此,我们创新性地提出了一种考虑文档主题信息的向量化方法,并在 RAG 框架下进行了评估。同时,本文还探讨了评估 RAG 系统所面临的挑战,直击当前问题的核心。

https://arxiv.org/abs/2408.10435

优化旅游 LLM:提升准确性与个性化体验

发布时间:2024 年 08 月 21 日

旅游业 文化旅游

RAG-Optimized Tourism LLMs: Enhancing Accuracy and Personalization

随着社会经济的进步,旅游业已成为满足人们精神需求的关键途径,为行业带来新机遇。然而,现有大型语言模型在个性化推荐和内容生成方面存在局限,有时甚至产生误导性信息。为此,我们提出基于检索增强生成技术的旅游模型优化方案,通过构建详尽的旅游观点数据库并运用向量化技术,大幅提升检索精准度。RAG 技术的引入有效消除了内容生成中的幻觉现象,使模型在内容流畅性、准确性和相关性上均有显著提升。这项研究不仅展示了 RAG 技术在文化旅游信息处理和数据分析中的应用潜力,更为智能文化旅游服务系统的构建提供了坚实的理论与技术支撑。

https://arxiv.org/abs/2408.12003

TC-RAG:探索图灵完备 RAG 在医疗大型语言模型系统中的应用案例

发布时间:2024 年 08 月 17 日

人工智能

TC-RAG:Turing-Complete RAG's Case study on Medical LLM Systems

在提升领域特定大型语言模型 (LLM) 的探索中,检索增强生成 (RAG) 崭露头角,旨在解决幻觉、知识陈旧及专业查询中的知识局限等问题。然而,现有 RAG 方法因忽视关键的系统状态变量而受限,这些变量对自适应控制、检索终止及系统收敛至关重要。本文中,我们提出 TC-RAG 框架,通过集成图灵完备系统有效管理状态变量,显著提升知识检索的效率与准确性。借助具备自适应检索、推理与规划功能的内存堆栈系统,TC-RAG 不仅实现了检索过程的精准控制,还通过推入与弹出操作有效减少了错误知识的累积。在医学领域的实证研究中,基于真实医疗数据集的实验显示,TC-RAG 在准确性上超越现有方法达 7.20% 以上。相关数据集与代码已公开于 https://github.com/Artessay/SAMA.git。

https://arxiv.org/abs/2408.09199

picture.image

基于 Llama 的 CI/CD 问答聊天机器人开发:爱立信实践案例

发布时间:2024 年 08 月 17 日

软件开发 通信技术

Developing a Llama-Based Chatbot for CI/CD Question Answering: A Case Study at Ericsson

本文分享了我们在爱立信开发基于 Llama 的 CI/CD 问答聊天机器人的经验。该机器人采用 RAG 模型,专门针对爱立信的 CI/CD 文档特性,以提升回答的准确性和相关性。实证评估显示,结合 BM25 和嵌入检索器的集成检索器性能最佳。在与 72 个 CI/CD 问题和答案的基准对比中,我们的聊天机器人配置在 61.11%的问题上提供了完全正确的答案,26.39%的问题上提供了部分正确的答案,12.50%的问题上提供了错误的答案。通过错误分析,我们探讨了不准确的原因,并提出了改进建议。此外,我们还总结了经验教训,并指出了未来提升聊天机器人准确性的方向。

https://arxiv.org/abs/2408.09277

picture.image

picture.image

CommunityKG-RAG:借助知识图谱的社区结构,提升事实核查中的检索增强生成技术

发布时间:2024 年 08 月 16 日

知识图谱 事实核查

CommunityKG-RAG: Leveraging Community Structures in Knowledge Graphs for Advanced Retrieval-Augmented Generation in Fact-Checking

尽管 LLM 和 RAG 系统有所发展,但它们在事实核查中的表现常因缺乏与实体关系和社区结构的整合而受限。为此,我们推出了 CommunityKG-RAG,这一创新的零-shot 框架通过整合社区结构与 KG 和 RAG 系统,大幅提升了事实核查的效率。CommunityKG-RAG 无需额外训练即可适应新领域和查询,其利用 KG 中社区结构的多跳特性,显著提高了信息检索的准确性和相关性。实验结果显示,CommunityKG-RAG 超越了传统方法,为事实核查提供了一个强大、可扩展且高效的解决方案,标志着该领域的重大进步。

https://arxiv.org/abs/2408.08535

picture.image

picture.image

元知识在增强检索型大型语言模型中的应用

发布时间:2024 年 08 月 16 日

人工智能 信息技术

Meta Knowledge for Retrieval Augmented Large Language Models

RAG 技术通过增强 LLM 的上下文相关信息,提升了其处理时效性和领域特定问题的能力,但构建高效综合多样化文档信息的 RAG 系统仍具挑战。我们创新性地将传统“检索-阅读”流程升级为“准备-重写-检索-阅读”框架,通过生成元数据和合成问答,以及引入元知识摘要,实现了对知识库的专家级理解。研究显示,增强查询在性能上显著超越传统 RAG 方法,且元知识查询进一步提升了检索和答案质量。该方法成本低廉,适应性强,为 RAG 流程的性能提升开辟了新路径。

https://arxiv.org/abs/2408.09017

MuRAR:一款简洁高效的多模态问答框架,集检索与答案优化于一体

发布时间:2024 年 08 月 16 日

MuRAR: A Simple and Effective Multimodal Retrieval and Answer Refinement Framework for Multimodal Question Answering

近期,检索增强生成 (RAG) 技术在问答任务中表现卓越,但多数研究仍局限于文本答案。尽管有研究涉足多模态数据,但在生成详尽的多模态答案方面仍有欠缺,尤其是在概念解释或步骤指导方面。这种能力在企业聊天机器人和教育系统等场景中尤为重要。为此,我们提出了 MuRAR 框架,通过整合多模态数据并优化答案,生成连贯的多模态答案。该框架易于扩展,适用于企业聊天机器人,且人类评估显示,其生成的多模态答案比纯文本答案更实用、更易懂。

https://arxiv.org/abs/2408.08521

picture.image

picture.image

W-RAG:开放域问答中的弱监督密集检索技术

发布时间:2024 年 08 月 15 日

问答系统 信息检索

W-RAG: Weakly Supervised Dense Retrieval in RAG for Open-domain Question Answering

在开放领域问答等知识密集型任务中,大型语言模型常因仅依赖内部知识而难以生成准确答案。为此,检索增强生成系统通过外部信息检索来强化模型,使检索器成为核心组件。尽管密集检索性能卓越,但其训练因缺乏真实证据而受阻,主要原因是人工标注成本高昂。本文提出 W-RAG,利用模型排序能力为密集检索训练生成弱标签数据。我们通过评估模型基于问题和段落生成正确答案的概率,对 BM25 检索的 top-KK段落重新排序,并将最高排名的段落作为正训练样本。实验显示,与基线模型相比,我们的方法在检索和问答性能上均有显著提升。

https://arxiv.org/abs/2408.08444

picture.image

picture.image

Retail-GPT:借助 RAG 技术打造电商智能聊天助手

发布时间:2024 年 08 月 15 日

电子商务

Retail-GPT: leveraging Retrieval Augmented Generation (RAG) for building E-commerce Chat Assistants

本研究推出 Retail-GPT,一款基于 RAG 的开源聊天机器人,通过引导用户选择商品和协助购物车操作,提升零售电商的用户体验。该系统跨平台、适应性强,不局限于特定聊天应用或商业场景。Retail-GPT 能进行自然对话,理解用户需求,检查商品库存,并管理购物车,旨在成为虚拟销售助手,并在多样化的零售业务中验证其效用。

https://arxiv.org/abs/2408.08925

图检索增强生成技术综述

发布时间:2024 年 08 月 15 日

知识图谱 人工智能

Graph Retrieval-Augmented Generation: A Survey

近期,RAG 技术在无需重新训练的情况下,成功应对了 LLM 的诸多挑战。通过引入外部知识库,RAG 显著提升了 LLM 输出的质量,有效解决了“幻觉”、领域知识缺失及信息过时等问题。然而,数据库中实体关系的复杂性对 RAG 构成了挑战。GraphRAG 技术应运而生,它利用实体间的结构信息,实现更精准的检索,增强关系知识的捕捉,并生成更符合上下文的响应。鉴于 GraphRAG 的独特优势,本文首次系统梳理了其方法论,涵盖了基于图的索引、图引导的检索及图增强的生成等关键环节。我们详细介绍了各阶段的核心技术与训练策略,并探讨了 GraphRAG 在下游任务、应用领域、评估体系及工业实践中的表现。最后,我们展望了未来的研究方向,旨在激发更多探索,推动该领域的持续发展。

https://arxiv.org/abs/2408.08921


0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
CV 技术在视频创作中的应用
本次演讲将介绍在拍摄、编辑等场景,我们如何利用 AI 技术赋能创作者;以及基于这些场景,字节跳动积累的领先技术能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论