大家好,我是R哥。
今天继续聊聊 DeepSeek R1,不过这次我们要搭配 Cherry Studio 来打造一个本地知识库,让 AI 更懂你、更贴合你的需求。
相比于上一期的 DeepSeek R1 + ima 个人知识库,这次的方案更强大,支持的格式更多,还能方便地管理和检索你的知识内容,简直不要太香!
Cherry Studio 的介绍及安装使用看这篇:《DeepSeek R1 + Ollama + Cherry Studio 实现本地化部署 + 可视化访问,真的太香了!》
1、知识库的痛点
在实际工作和学习中,我们经常需要查阅各种资料,比如技术文档、论文、书籍、博客等等。
如果这些资料散落在不同的文件夹、分布在不同的云存储,甚至存储在各种笔记软件,查找起来就很麻烦。而且,如果这些知识点能跟 AI 结合,实现智能搜索和内容生成,那工作效率肯定会大大提升。
上一期的 DeepSeek R1 + ima 个人知识库,它知识库的文档全在云上,对于数据比较敏感的人/公司来说可能是个隐患,这时候搭建一个本地 AI 知识库就尤为重要了。
这就是我们今天要解决的问题:如何用 DeepSeek R1 + Cherry Studio 搭建一个本地 AI 知识库,让 AI 帮你管理和搜索你的知识!
2、Cherry Studio 知识库
介绍
Cherry Studio 目前已上线知识库功能,支持多种格式文件的导入和网页导入等来搭建个性化知识库。搭配 DeepSeek R1 之后,我们可以让 AI 在我们的知识库里搜索内容,并提供更加贴合个人需求的回答。
最最重要的是,Cherry Studio 数据本地储存,无需担心隐私泄露!
在 Cherry Studio 知识库中添加的数据全部存储在本地,不会上传到任何第三方服务器,在添加过程中会复制一份文档放在 Cherry Studio 数据存储目录,并且支持本地部署的模型调用。
知识库处理流程图如下:
向量数据库:https://turso.tech/libsql
当文档被添加到 Cherry Studio 知识库之后,文件会被切分为若干个片段,然后这些片段会交给嵌入模型进行处理,当使用大模型进行问答的时候,会查询和问题相关的文本片段一并交个大语言模型处理
如果对数据隐私有要求,建议使用本地嵌入数据库和本地大语言模型。
配置模型
上面说到了,AI 知识库需要一个嵌入模型进行分段处理,所以它需要一个嵌入模型。
我们可以在 Ollama 中筛选嵌入模型:
https://ollama.com/search?c=embedding
然后我们以 bge-m3
为例进行下载:
ollama pull bge-m3
下载成功后可以使用 ollama list
列出模型:
$ ollama list
NAME ID SIZE MODIFIED
bge-m3:latest 790764642607 1.2 GB 19 hours ago
deepseek-r1:14b ea35dfe18182 9.0 GB 4 weeks ago
然后回到 Cherry Studio 模型服务中,把推理模型和嵌入模型都添加进来:
创建知识库
比如,我添加一个文章知识库:
CherryStudio 支持多种添加数据的方式:
- 文件夹目录: 可以添加整个文件夹目录,该目录下支持格式的文件会被自动向量化。
- 网址链接: 支持网址 url。
- 站点地图: 支持 xml 格式的站点地图。
- 纯文本笔记: 支持输入纯文本的自定义内容。
我这里上传了一些我写的 DeepSeek 文章:
当文件等资料向量化完成后,即可进行搜索,点击下面的「搜索知识库」按钮可以搜索知识库:
基于知识库对话
在助手对话框中选择刚创建的「文章」知识库进行对话:
问它一个问题:
deepseek是什么,300字总结
如图所示,它参考了我们指定的文章知识库进行思考和输出内容:
3、总结
以上,我们通过 DeepSeek R1 + Cherry Studio,我们实现了一个本地 AI 知识库:
- 读取本地文档(Markdown、PDF、Word、TXT)
- 智能搜索知识点(基于 Cherry Studio)
- AI 生成智能回答(基于 DeepSeek R1)
- 完全本地化运行(数据安全,不依赖外网)
相比于之前分享的ima 云知识库方案,这种本地 AI 知识库既能保护数据隐私,又能让 AI 变得更懂你。
这样,我们可以把所有的文档、笔记、网站都添加到本地知识库中,方便我们进行搜索、总结、对话、写作等操作,真的太香了!
未完待续,公众号持续分享「DeepSeek」及 AI 实战干货,关注「AI技术宅」公众号和我一起学 AI。
最后,如果你还没用过 DeepSeek,清华大学出的《DeepSeek 从入门到精通》推荐你好好看看吧,质量非常高,从原理到应用实践,写得非常好。
版权声明: 本文系公众号 "AI技术宅" 原创,转载、引用本文内容请注明出处,抄袭、洗稿一律投诉侵权,后果自负,并保留追究其法律责任的权利。
更多文章推荐:
觉得不错,别忘了随手点赞+转发哦!
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。