主要介绍用DeepSeek快速搭建个人知识库,附详细教程。关键词:DeepSeek、知识库、向量、嵌入模型
背景
为什么你需要一个个人知识库?
在日常工作和学习中,我们常常会积累大量的文档、代码、笔记等资料。如果没有一个统一的存储和检索系统,这些资料很容易变得杂乱无章,查找起来费时费力。
别慌,这次我们用DeepSeek快速搭建自己的个人知识库,实现本地上传文档,量化成知识库,通过智能助手快速回复。
主要目的:
- 集中管理:将所有资料统一存储,避免散落各处。
- 快速检索:通过智能搜索,快速定位你需要的信息。
- 高效学习:通过结构化存储,提升学习和工作效率。
前言
上一篇 《
3分钟搞定DeepSeek本地化安装部署,小白也能看懂! 》主要介绍DeepSeek本地化部署,说实在的,个人电脑16GB内存+10G GPU. 运行14b 大模型,还是相当卡。因此搭建知识库时不建议本地化部署。当然个人为了数据安全,可以选择。
本文主要介绍,网页版DeepSeek搭建知识库。
演示效果
搭建知识库
1、下载安装 Cherry Studio
https://cherry-ai.com/download.html
如果存在报错,我将对应的安装包放在了网盘中,可以直接取网盘下载。
链接: https://pan.baidu.com/s/17R2W6dC40IKqDk-3wGyqqw?pwd=yyds 提取码: yyds
无脑安装,比较简单,这里不在赘述。
2、知识库教程
官网介绍了MacOs版本的教程,
详细步骤可参考:https://docs.cherry-ai.com/advanced-basic/knowledge-base
为方便读者使用,这里作者给出Windows版本的详细教程。
实现步骤
1、添加对话模型
- 左下角设置-添加, 如何查找模型名称往下看
- 从图中硅基流动文档中查找
- 复制 deepseek-ai/DeepSeek-R1 添加到对应框自动识别
2、登录/注册「硅基流动」
登录地址:https://cloud.siliconflow.cn/
新用户注册即送2000万Tokens。如果你是新用户不需要购买,直接按照教程操作
3、点击此处,生成API秘钥
可直接跳转到和1 登录/注册「硅基流动」 的地址,先登录注册(如果操作了1 请忽略)
4、生成并复制 API秘钥
5、配置API秘钥
回到Cherry Studio,配置API秘钥,点击右侧检查,选择对应模型
注意:最好检查一下,要不后边报错连接失败
现在有了R1会话模型,我们需要添加一个嵌入模型。
说明:对话模型和嵌入模型的区别?
- 对话模型
对话模型就是能和人聊天的模型。
比如你问一个聊天机器人“今天天气怎么样?”它会回答“今天天气很好,适合出门。”它的任务就是根据你的问题,生成一个合适的回答。
- 嵌入模型
嵌入模型是把文字变成数字向量的模型。这是生成知识库的内核
例子:比如“苹果”这个词,嵌入模型会把它变成一个数字向量,比如 [0.1, 0.2, 0.3]。如果“苹果”和“水果”语义相近,它们的向量也会很接近,比如 [0.1, 0.2, 0.3] 和 [0.12, 0.21, 0.31]。这样,计算机就可以通过向量来理解它们的关系。
6、添加嵌入模型
我们使用免费的BAAI/bge-m3测试使用
添加一个嵌入模型
这个不需要API秘钥。
现在有了我们选择的嵌入模型,接下来创建知识库。
7、新建知识库
- 知识库入口:在 CherryStudio 左侧工具栏,点击知识库图标
- 添加知识库:点击添加,添加名称,开始创建知识库;
8、添加文件并向量化
9、添加助手并配置对应模型
- 新添加一个知识库助手
- 配置对应模型
10、对话中引用知识库生成回复
11、验证效果
可以看到和本地文档中的内容一样
小结
-
如果个人数据不涉及数据泄露的问题,可以使用网页版,因为本地由于电脑配置不够可能导致卡顿
-
搭建自己的知识库方便检索
-
有问题欢迎来聊,哈哈~~
最后给大家推荐一个招聘小程序,里面有海量的招聘岗位,小厂、中厂、大厂都有,大家可以投递一下试试 。
此外,苏三最近建了一个DeepSeek交流群,欢迎一些志同道合的小伙伴扫描进群:
也可以直接加我微信,备注:deepseek,即可进群。