从简单查找到代理推理：智能检索增强生成（RAG）系统的兴起 - SegmentFault 思否

从简单查找到代理推理：智能检索增强生成（RAG）系统的兴起

发布于 2025-08-26

主要观点：

检索增强生成（RAG）是大型语言模型的技术，可通过将外部数据检索纳入生成过程来增强文本生成。
从简单 RAG 到 Agentic RAG 等一系列架构不断演进，各架构解决特定问题，如记忆上下文、智能检索源、处理模糊查询等。
不同 RAG 架构适用于不同应用需求，简单架构易实现适用于简单任务，高级架构能力强但更复杂，需根据实际情况选择。

关键信息：

简单 RAG 从静态知识源检索相关文档生成基于检索信息的响应，存在无记忆上下文的局限性。
带记忆的简单 RAG 增加记忆组件，可保留先前交互信息，解决基本 RAG 的上下文限制。
分支 RAG 可将查询路由到不同知识源，提高检索效率和相关性。
HyDe 在搜索知识库前创建假设文档嵌入，引导检索相关文档，解决模糊或难匹配查询问题。
自适应 RAG 根据查询复杂度调整检索策略，优化速度与深度的平衡。
纠错 RAG 对检索到的文档进行自我检查和精炼，解决检索信息误导或不足的问题。
自驱动 RAG 在生成答案时进行自我检索，解决答案构建中不可预见的信息需求。
智能体 RAG 作为高级多智能体检索架构，可进行多步推理并与多个数据源或工具交互，处理复杂查询。

重要细节：

简单 RAG 工作流为用户提供查询，系统从数据库检索相关文档，LLM 基于这些文档生成响应，适用于有界静态信息集的领域。
带记忆的简单 RAG 工作流为用户提交查询，系统先访问记忆获取先前信息，再检索新信息，生成包含过去和新信息的答案，适用于聊天机器人等场景。
分支 RAG 工作流为分析用户查询，决定最相关的知识源，仅查询所选源并生成答案，适用于处理多个领域或大型异构语料库。
HyDe 工作流为用户提供提示，系统生成假设文档表示并转换为嵌入向量，检索相似的实际文档，用于研究等场景。
自适应 RAG 工作流为用户提交查询，分析其复杂度并选择不同检索模式，根据查询调整检索量和来源，适用于企业搜索等场景。
纠错 RAG 工作流为检索后将文档分解为知识条并评估相关性，若不满足阈值则进行额外检索，适用于高风险或准确性关键的应用。
自驱动 RAG 工作流为用户提问，系统初始检索后在生成答案时检测知识差距，自我检索补充信息，适用于探索性任务等场景。
智能体 RAG 工作流为用户提交复杂查询，系统激活为代理生成多个子任务，各子代理检索或计算后由元代理合成最终答案，适用于开放研究等场景。

From Simple Lookups to Agentic Reasoning: The Rise of Smart RAG Systems

https://dzone.com/articles/rag-architectures-evolution-simple-to-agentic

阅读 176

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。