Anthropic 推出上下文检索技术(Contextual Retrieval)
Anthropic 宣布了一项名为上下文检索(Contextual Retrieval)的技术,这是人工智能系统与大规模知识库交互方面的重大进展。该技术通过在处理文本片段之前为其添加上下文信息,解决了检索增强生成(Retrieval-Augmented Generation, RAG)系统中常见的上下文丢失问题。
上下文检索的组成与优势
上下文检索技术由两部分组成:
- 上下文嵌入(Contextual Embeddings):通过嵌入技术丰富文本片段的语义信息。
- 上下文BM25(Contextual BM25):基于传统的BM25算法改进,结合嵌入技术的扩展上下文信息。这种双重方法通过提升语义理解和精确词汇匹配,显著减少了检索失败率。
性能提升
- 仅使用上下文嵌入时,检索失败率降低了35%。
- 结合上下文嵌入和上下文BM25时,检索失败率降低了49%。
- 通过添加重排序步骤,错误率进一步降低,最高可达67%。
其他创新:提示缓存(Prompt Caching)
Anthropic 还引入了提示缓存功能,通过缓存文档片段并减少重复处理,显著降低了处理成本。该功能允许从提示的特定前缀恢复处理,从而优化API使用,减少重复任务或具有一致元素的提示的处理时间和成本。
应用领域
上下文检索技术已在多个领域展现出显著效果,成为处理大规模数据集的企业的重要工具。
社区反响
AI 社区对上下文检索技术表现出极大热情,认为其有潜力重新定义AI系统管理和解释数据的方式,特别是在减少上下文丢失和增强AI响应可靠性方面。例如:
- Christophe Bouvard称其为“增强版的RAG”。
- Kamesh.eth认为该技术是“扩展AI系统到大规模知识库的游戏规则改变者”。
总结
上下文检索技术为AI更智能地处理信息树立了先例,有望推动更加自主和上下文感知的AI系统的发展。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用@来通知其他用户。