实操Deepseek接入个人知识库 - 文章 - 开发者社区

picture.image

向AI转型的程序员都关注公众号机器学习AI算法工程

为什么要尝试给DeepSeek添加本地知识库呢？或许在我们OA系统中会出现一个AI小助手，我们会问它差旅费报销流程怎么走、合同流程怎么走、负责某某业务的同事的联系方式等等。当然，这应该是最简单的应用场景。时代变了！以前需要找好多个部门的专业人士了解的信息，未来用AI工具就能快速获取，并且是提炼总结后的内容。要实现这些功能，必然需要提供相关的资料内容，这就得有一个知识库。

一、Cherry-Studio版接入

先说明下文中的这种方式一般

只 适合用于个人使用

，企业内要使用，建议使用Docker+Dify去部署使用。

　　要接入本地模型的话，需要先下载和部署好本地模型， 这个是本地部署Deepseek的教程：

本地部署 DeepSeek：小白也能轻松搞定！

如果你有API key的话也可以调在线模型，或者你本地电脑下载了其他模型的话，也可以进行切换对应模型

下载安装Cherry-Studio

　　部署完本地Deepseek后就使用Cherry-Studio进行创建知识库，首先先下载Cherry-Studio，官网地址：https://cherry-ai.com/

　　下载好后进行安装Cherry-Studio。

下载嵌入模型BGE-M3

　　进入Ollama官网：https://ollama.com/search，点击Models后输入 BGE

搜索

picture.image

选择进入BGE后，点击复制下载命令

picture.image

打开CMD终端命令，粘贴下载命令，回车下载

picture.image

配置CherryStudio

打开CherryStudio客户端，点击设置-->打开Ollama-->选择模型

picture.image

将Deepseek和BGE模型添加进去

picture.image

添加本地知识库

添加知识库，嵌入模型有多个的话自己选择一个好用的就可以，这里示例是BGE-M3

picture.image

将自己的本地文件添加到知识库中，这里除了可以添加文件，还可以设置本地的文件目录或者网址、网站、笔记等作为知识库的来源。

picture.image

添加好本地知识库后，开始提问，我这里的测试知识库文件是txt的，内容也很少，提问小李的电话是多少。

picture.image

　　选好知识库后一定要变亮了才是选择上了，亮了后就回车提问。

picture.image

根据我的提问，模型从本地知识库中检索回答出来了正确答案。

picture.image

到了这里可能会有人很兴奋，立马心血来潮就想建立一个自己的私有知识库，等等，先别急，我再给你看下另外一个测试效果。

这里我是用的信息管理工程师的官方教材，比如：这里信息化政策法规和标准规范6个要素，我就针对这个提问。

picture.image

这里我已经上传好了本地文件

picture.image

提问：信息化政策法规和标准规范6个要素是什么？

picture.image

　　发现回答的和本地知识库的没有一点关联性。看到这里很多人很失望，但是原因是什么呢？

　　不是大模型不行，而是我们部署的 大模型参数太低 ，比如我这个测试的大模型就是最小的1.5B的，所以它的智商就在那里。我看了网上其他一些人的测试，如果要效果比较好的，就需要32B或者70B的效果就会好很多，但是也不要期待值过高，本地版始终很难和Deepseek官方版那么流畅和智能，即使你是用的671B的也是一样，因为这个还是需要专业人士不断地进行一些针对性的调优和校正。

　　当然如果是个人或者企业在资源充足以及要求隐私性比较强的情况下还是可以在本地部署一个32B以上的进行使用的，一些简单的需求它还是可以处理的，如果是671B全参数完整版，那还是很厉害的。还有Cherry-Studio这个工具还集成了很多其他的AI模型，如果你有API key的话也可以调在线模型，或者你本地电脑下载了其他模型的话，也可以进行切换对应模型，具体功能大家可以自己摸索。

二.

AnythingLLM 版接入

AnythingLLM是一个全栈应用程序，您可以使用现成的商业大语言模型或流行的开源大语言模型，再结合向量数据库解决方案构建一个私有ChatGPT，不再受制于人：您可以本地运行，也可以远程托管，并能够与您提供的任何文档智能聊天。AnythingLLM将您的文档划分为称为 workspaces (工作区)的对象。工作区的功能类似于线程，同时增加了文档的容器化。工作区可以共享文档，但工作区之间的内容不会互相干扰或污染，因此您可以保持每个工作区的上下文清晰。

AnythingLLM在它的官网 (https://anythingllm.com/) 上下载对应的系统版本安装即可。表面上看它是一个桌面应用程序，实际是可以部署到自己服务器上作为一个BS应用来使用。

Ollama

AnythingLLM支持多种大语言模型，因为前一段时间在本地安装了Ollama部署了deepseek R1的14b版本。