能将大模型RAG流程可视化的开源工具—RAGxplorer

向量数据库小程序混合云

前言

2023年是AI迅猛发展的一年,2024年将是AI应用元年,将会有一大批优秀的AI原生应用涌现。RAG作为AI原生应用的一项关键技术,也将会高速发展。本文主要介绍一款可以将RAG可视化的工具。

对RAG概念不太熟悉的同学可以看一下笔者之前的文章:

RAG——使用检索增强生成构建特定行业的大型语言模型

一款可创建和定制自己的RAG流水线的AI应用—RAGs

langchain中的召回增强生成(RAG)一览

如何用知识图谱和Llama-Index来实现RAG?

GenAI——LLM结合图谱RAG和LangChain实战指南

大型语言模型(LLMS)、可检索式增强生成(RAG)和AI缺失的存储层

RAGxplorer 🦙🦺

picture.image

RAGxplorer是一个交互式的streamlit工具,用于支持构建基于检索增强生成(Retrieval Augmented Generation, RAG)的应用程序,通过可视化文档块和嵌入空间中的查询来实现。

演示 🔎

Streamlit应用程序

⚠️由于基础设施限制,这个免费托管的演示可能偶尔会停机。最佳体验是克隆这个仓库,并在本地运行。

picture.image

特点 ✨

文档上传 :用户可以上传PDF文档。 •块配置 :配置块大小和重叠的选项。 •嵌入模型选择all-MiniLM-L6-v2text-embedding-ada-002。 •向量数据库创建 :使用Chroma构建向量数据库。 •查询扩展 :生成子问题和假设答案,以增强检索过程。 •交互式可视化 :使用Plotly来可视化块。

本地安装 ⚙️

要运行RAGxplorer,请确保已安装Python,然后安装必要的依赖项:


        
            

          pip install -r requirements-local-deployment.txt
        
      

提示

⚠️ 不要使用requirements.txt。那是为了免费的streamlit部署能够运行。该文件包括额外的pysqlite3-binary依赖。

⚠️ 如果对故障排除有帮助,该应用程序是使用Python 3.11构建的。

使用 🏎️

1.设置OPENAI_API_KEY(必需)和NYSCALE_API_KEY(如果您需要anyscale)。复制.streamlit/secrets.example.toml文件到.streamlit/secrets.toml并填写值。

2.要启动应用程序,请运行:


        
            

          streamlit run app.py
        
      

3.您可能需要注释掉/移除app.py中的第5-7行。


          
import('pysqlite3')
          
import sys
          
sys.modules['sqlite3'] = sys.modules.pop('pysqlite3')
      

注意

这个仓库目前链接到streamlit演示,并且这些行是由于免费streamlit部署环境中的运行时添加的。参见这里[1].

引用

更多信息请参考:https://github.com/gabrielchua/RAGxplorer

References

[1] https://github.com/gabrielchua/RAGxplorer

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动客户端性能优化最佳实践
在用户日益增长、需求不断迭代的背景下,如何保证 APP 发布的稳定性和用户良好的使用体验?本次分享将结合字节跳动内部应用的实践案例,介绍应用性能优化的更多方向,以及 APM 团队对应用性能监控建设的探索和思考。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论