领域驱动的 RAG：通过分布式所有权构建准确的企业知识系统 - SegmentFault 思否

领域驱动的 RAG：通过分布式所有权构建准确的企业知识系统

发布于 2025-05-06

主要观点：

作为行业领先的银行科技供应商，虽创新快但文档管理存在挑战，之前知识共享和培训项目效果不佳，决定用检索增强生成（RAG）工具。
重新分配 RAG 实施的所有权给销售工程团队，各领域专家负责监督和微调，通过系统提示工程确保准确性和相关性。
采用元数据驱动方法，因单纯将知识纳入大语言模型（LLM）效果不佳且成本高，元数据可组织和关联信息，提高信息检索精度。
探索三种扩展 RAG 系统的方法，包括同时搜索所有应用、基于元数据自动选择相关应用、用户手动选择应用，以提高效率和准确性。
从设计到实施，构建完整的 RAG 应用，包括基础架构、分布式 RAG 系统、三种查询路径、UML 集成以增强知识表示、应用架构和管理等方面。
进行性能评估，采用分类器路由和全面覆盖两种方法，评估四个关键指标，发现分类质量重要、专业模型优于综合查询、人类监督仍有价值。

关键信息：

行业领先的银行科技供应商，代码库和产品丰富但文档管理有问题。
用 RAG 工具辅助销售工程师和客户架构师获取准确技术信息。
重新分配 RAG 所有权给销售工程团队，各专家负责各自领域。
元数据驱动方法，生成和利用元数据提高信息检索精度。
扩展 RAG 系统的三种方法及应用架构管理。
性能评估的方法和关键发现，如分类质量影响答案质量等。

重要细节：

之前知识共享和培训项目因文档碎片化和专业知识孤立效果不佳。
RAG 结合检索和生成模型，当前 LLM 技术有低准确性和“幻觉”问题。
各领域专家通过系统提示工程“调优”RAG 应用，控制信息检索。
元数据生成过程及包含的内容，如总结文档、关键词等。
扩展 RAG 系统的三种方法的具体操作和优势。
RAG 应用的基础架构，包括 Flask 应用、分布式 RAG 系统等。
三种查询路径的实现方式及 API 端点处理。
UML 集成的方式及对知识表示的增强作用。
性能评估的四个关键指标的定义和计算方式。
性能评估的关键发现及结论，如分类器准确性的重要性等。

Domain-Driven RAG: Building Accurate Enterprise Knowledge Systems Through Distributed Ownership

https://www.infoq.com/articles/domain-driven-rag/

阅读 27

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。