人工智能|RAG 检索增强生成

现有的 ChatGPT 的大语言模型中，虽然它本身的功能已经非常强悍了，但是它依然存在一些致命的问题：

那么大模型 LLM 如何解决这些问题，使其生成的内容质量更高，就成了一个难题。

而 RAG（Retrieval-Augmented Generation），通过将检索模型和生成模型（LLM）结合在一起，即可提高了生成内容的相关性和质量。

RAG 技术的主要应用场景为：

问答系统（QA Systems）：RAG 可以用于构建强大的问答系统，能够回答用户提出的各种问题。它能够通过检索大规模文档集合来提供准确的答案，无需针对每个问题进行特定训练。
文档生成和自动摘要（Document Generation and Automatic Summarization）：RAG 可用于自动生成文章段落、文档或自动摘要，基于检索的知识来填充文本，使得生成的内容更具信息价值。
智能助手和虚拟代理（Intelligent Assistants and Virtual Agents）：RAG 可以用于构建智能助手或虚拟代理，结合聊天记录回答用户的问题、提供信息和执行任务，无需进行特定任务微调。
信息检索（Information Retrieval）：RAG 可以改进信息检索系统，使其更准确深刻。用户可以提出更具体的查询，不再局限于关键词匹配。
知识图谱填充（Knowledge Graph Population）：RAG 可以用于填充知识图谱中的实体关系，通过检索文档来识别和添加新的知识点。

在这里插入图片描述

从上图可能很多同学非常好奇，大模型是如何与“外挂”数据库进行交互的。不是说大模型不能联网吗？其实大模型和数据库的交互，也是通过提示词完成的。

在这里插入图片描述

当然在以上实现过程中，可能会有数据信息极为庞大，而且冗余，如果直接发给大模型，上下文也会极为庞大。所以通常在这种情况下，会对数据库内的数据做一个预处理。让其变的易检索。这个预处理的过程，就使用了向量数据库以及embedding。

如下这张图便是 RAG 的完整过程：

在这里插入图片描述

LangChain 包括 ChatGPT 的官方 assistant 的 Retrieval 其实都利用了 RAG 的原理。在后续的课程中会有更深入的实战应用。比如打造垂直领域内容的问答机器人。