使用 LangChain 和由 Ollama 驱动的本地语言模型构建 RAG 应用程序

发布于 9 月 5 日

主要观点：本地大型语言模型（LLMs）对开发者和组织有显著优势，如增强数据隐私和离线功能，且本地运行可完全控制模型行为等，生态已成熟，有多种本地 LLM 选项及与常见 AI 框架的集成。
关键信息：

介绍用本地 LLM 结合 Azure Cosmos DB 进行检索增强生成（RAG）场景，包括设置 Ollama、Azure Cosmos DB、加载数据、运行向量搜索和 RAG 查询等步骤。
Ollama 安装简单，支持多种模型，硬件需求因模型而异，CPU 或 GPU 执行效果不同。
Azure Cosmos DB 可使用模拟器进行本地开发，也可使用云服务，配置 SSL 证书等。
数据加载过程读取文档生成嵌入并存储在 Cosmos DB 中，可通过脚本进行操作和验证。
向量搜索和 RAG 查询可通过配置环境变量和运行相应脚本实现，可调整返回结果数量等。
重要细节：
安装 Ollama 命令及启动服务命令，下载特定模型的命令及所需时间。
Azure Cosmos DB 模拟器的 Docker 拉取和运行命令，配置 SSL 证书的步骤。
数据加载脚本的环境变量设置及执行过程，确认数据加载成功的方法。
向量搜索和 RAG 查询脚本的环境变量设置及示例输出，可修改返回结果数量等。

阅读 3