SpringBoot项目mysql+ES库集成DeepSeek在实现知识库时向量化存储和检索失败。如何在离线环境向量化?

SpringBoot项目mysql+ES库集成DeepSeek在实现知识库时向量化存储和检索失败。

现在我有一个项目涉及了商业合同管理,客户要求集成DeepSeek能够根据他的提问检索到相关的合同并根据合同内容回答。当前程序使用mysql存储合同基本信息使用ES存储合同内容,合同数量很多不能全部作为知识库提供给DeepSeek,我计划先将合同内容向量化后存储到ES中,客户提问时将问题向量化后检索有关的合同内容,最后将有关的合同作为知识库和客户的提问交给DeepSeek处理。
现在问题产生的文本向量化上,我找不到有效的向量化方案。
希望能有人提供可用的方案。
要求:不能连接外网

我在网络上找到方案都需要连接外网,或者用到其他AI或向量数据库,但客户环境是不能连接外网的。

阅读 358
2 个回答
新手上路,请多包涵

为什么不能用向量库
milvus做一个非结构数据相似性搜索不是很方便?

你的问题是如何解决向量存储的问题吗?为我看你说你本地是有大模型的,所以应该不存在向量序列化这个问题。

如果你完全没办法再安装别的向量数据库了,那唯一的办法可能就是 pgvector 这个是 postgresql 的插件,直接帮你把向量的功能结合到 postgres 数据库中了。

当然你如果一定要用 MySQL 那就没办法了,MySQL 的功能太弱了很多没办法支持这种新技术。

我这儿有一个把 AI 结合到后台管理系统中的开源脚手架,我用的就是 pgvector,具体有代码也有演示系统,你看看这种向量化搜索是不是你想要的?

🧠 通过 AI 驱动的 Java&Vue 开源脚手架
https://github.com/ccmjga/zhilu-admin
https://admin.mjga.cc

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题