大家好,我是R哥。

今天继续聊聊 DeepSeek R1,不过这次我们要搭配 Cherry Studio 来打造一个本地知识库,让 AI 更懂你、更贴合你的需求。

相比于上一期的 DeepSeek R1 + ima 个人知识库,这次的方案更强大,支持的格式更多,还能方便地管理和检索你的知识内容,简直不要太香!

Cherry Studio 的介绍及安装使用看这篇:《DeepSeek R1 + Ollama + Cherry Studio 实现本地化部署 + 可视化访问,真的太香了!

1、知识库的痛点

在实际工作和学习中,我们经常需要查阅各种资料,比如技术文档、论文、书籍、博客等等。

如果这些资料散落在不同的文件夹分布在不同的云存储,甚至存储在各种笔记软件,查找起来就很麻烦。而且,如果这些知识点能跟 AI 结合,实现智能搜索和内容生成,那工作效率肯定会大大提升。

上一期的 DeepSeek R1 + ima 个人知识库,它知识库的文档全在云上,对于数据比较敏感的人/公司来说可能是个隐患,这时候搭建一个本地 AI 知识库就尤为重要了。

这就是我们今天要解决的问题:如何用 DeepSeek R1 + Cherry Studio 搭建一个本地 AI 知识库,让 AI 帮你管理和搜索你的知识!

2、Cherry Studio 知识库

介绍

Cherry Studio 目前已上线知识库功能,支持多种格式文件的导入和网页导入等来搭建个性化知识库。搭配 DeepSeek R1 之后,我们可以让 AI 在我们的知识库里搜索内容,并提供更加贴合个人需求的回答。

最最重要的是,Cherry Studio 数据本地储存,无需担心隐私泄露!

Cherry Studio 知识库中添加的数据全部存储在本地,不会上传到任何第三方服务器,在添加过程中会复制一份文档放在 Cherry Studio 数据存储目录,并且支持本地部署的模型调用。

知识库处理流程图如下:

知识库处理流程图

向量数据库:https://turso.tech/libsql

当文档被添加到 Cherry Studio 知识库之后,文件会被切分为若干个片段,然后这些片段会交给嵌入模型进行处理,当使用大模型进行问答的时候,会查询和问题相关的文本片段一并交个大语言模型处理

如果对数据隐私有要求,建议使用本地嵌入数据库和本地大语言模型。

配置模型

上面说到了,AI 知识库需要一个嵌入模型进行分段处理,所以它需要一个嵌入模型。

我们可以在 Ollama 中筛选嵌入模型:

https://ollama.com/search?c=embedding

然后我们以 bge-m3 为例进行下载:

ollama pull bge-m3

下载成功后可以使用 ollama list 列出模型:

$ ollama list
NAME               ID              SIZE      MODIFIED
bge-m3:latest      790764642607    1.2 GB    19 hours ago
deepseek-r1:14b    ea35dfe18182    9.0 GB    4 weeks ago

然后回到 Cherry Studio 模型服务中,把推理模型和嵌入模型都添加进来:

创建知识库

比如,我添加一个文章知识库:

CherryStudio 支持多种添加数据的方式:

  • 文件夹目录: 可以添加整个文件夹目录,该目录下支持格式的文件会被自动向量化。
  • 网址链接: 支持网址 url。
  • 站点地图: 支持 xml 格式的站点地图。
  • 纯文本笔记: 支持输入纯文本的自定义内容。

我这里上传了一些我写的 DeepSeek 文章:

当文件等资料向量化完成后,即可进行搜索,点击下面的「搜索知识库」按钮可以搜索知识库:

基于知识库对话

在助手对话框中选择刚创建的「文章」知识库进行对话:

问它一个问题:

deepseek是什么,300字总结

如图所示,它参考了我们指定的文章知识库进行思考和输出内容:

3、总结

以上,我们通过 DeepSeek R1 + Cherry Studio,我们实现了一个本地 AI 知识库:

  • 读取本地文档(Markdown、PDF、Word、TXT)
  • 智能搜索知识点(基于 Cherry Studio)
  • AI 生成智能回答(基于 DeepSeek R1)
  • 完全本地化运行(数据安全,不依赖外网)

相比于之前分享的ima 云知识库方案,这种本地 AI 知识库既能保护数据隐私,又能让 AI 变得更懂你。

这样,我们可以把所有的文档、笔记、网站都添加到本地知识库中,方便我们进行搜索、总结、对话、写作等操作,真的太香了!

未完待续,公众号持续分享「DeepSeek」及 AI 实战干货,关注「AI技术宅」公众号和我一起学 AI。

最后,如果你还没用过 DeepSeek,清华大学出的《DeepSeek 从入门到精通》推荐你好好看看吧,质量非常高,从原理到应用实践,写得非常好。

版权声明: 本文系公众号 "AI技术宅" 原创,转载、引用本文内容请注明出处,抄袭、洗稿一律投诉侵权,后果自负,并保留追究其法律责任的权利。

更多文章推荐:

1.Spring Boot 3.x 教程,太全了!

2.3,000+ 道 Java面试题及答案整理(最新版)

3.免费获取 IDEA 激活码的 7 种方式(最新版)

4.Java & DeepSeek & AI 学习资料分享

5.程序员精美简历模板分享

觉得不错,别忘了随手点赞+转发哦!


Java技术栈
12.8k 声望31.4k 粉丝