使用提示工程和检索增强生成（RAG）减少幻觉

发布于 2025-07-02

主要观点：大型语言模型（LLMs）生成内容能力有优缺点，需确保其工作完美并生成简洁内容，文中介绍降低其幻觉的两种主要方法。
关键信息：

介绍了提示工程（Prompt Engineering），包括设置系统提示（如设定角色、边界、增强安全性等），需先识别用例、约束边界和呈现要求。
阐述了检索增强生成（Retrieval-Augmented Generation，RAG），包含知识库（KB）数据同步（利用 AWS OpenSearch 存储生成的嵌入向量等）、嵌入模型（使用 Amazon Titan Embedding 模型创建向量嵌入）、知识库创建、RAG 库（高效执行各种操作）、输出生成（在相关信息丰富下生成输出）。
重要细节：
系统提示中不同设置的作用，如设定角色可让模型在特定空间生成内容，设定边界可明确生成范围等。
AWS OpenSearch 用于存储生成的嵌入向量及同步源数据，Amazon Titan Embedding 模型用于创建向量嵌入，OpenSearch 提供多种服务器less 能力。
RAG 库接收用户查询进行 KB 查询并检索相关块用于丰富提示，让 LLM 生成更准确输出。最后提到还尝试用 LLM 作为评判者评估生成内容以确保公平性。

阅读 302