头图

OpenSPG 是一个语义增强的可编程知识图谱:https://github.com/OpenSPG/openspg

KAG 是一个知识增强生成的专业领域知识服务框架,KAG 依赖 OpenSPG 提供的引擎依赖适配、逻辑推理执行等能力:https://github.com/OpenSPG/KAG

🌟 欢迎大家 Star 关注~

2025 年 1 月 7 日,OpenSPG/KAG 正式发布 v0.6 版本,此次发布带来多个功能更新,包括摘要生成类任务支持、垂域 Schema 管理、可视化知识探查等;用户体验上,提供知识库任务的断点续跑机制,新增用户登录与权限体系、优化构建任务调度;开发者模式下支持不同阶段配置不同模型、支持 schema-constraint 模式抽取等,极大地提升了系统的灵活性、易用性、性能和安全性,为用户提供一个更加强大,且适应多样化应用场景的知识管理平台。

新增功能

1、摘要生成类任务支持

不牺牲多跳事实推理精度的情况下,原生支持摘要生成任务。

在 CSQA 数据集上,全面性、多样性、赋权性等指标弱于 LightRAG (-1.2/10),事实性指标优于 LightRAG(+0.1/10);在 hotpotqa, twowiki, musique 等多跳问答数据集上,鉴于 LightRAG、GraphRAG 均未提供事实问答的测评入口,使用默认入口测试 EM 指标接近 0。

KAG 量化评测结果,可参考 KAG 代码仓库 examples/csqa/READEME.md 按步骤复现。

2、领域 Schema 管理

产品侧提供 SPG Schema 管理能力,支持用户根据通过自定义 Schema 以优化知识库构建&推理问答的效果。

3、知识探查

新增知识探查功能,实现知识库数据的可视化查询分析,并提供HttpAPI 与其它系统对接。

4、知识库构建支持挂载领域知识(开发者模式)

开发者模式下,支持将领域知识(领域词汇、词条间关系)注入知识库中,可显著提升知识库构建、推理问答效果(医疗场景下有10%+ 的提升)。

5、构建链路增加知识对齐组件

KAG-Builder 提供默认的知识对齐组件,并内嵌无效数据过滤、相似实体链指等功能,以优化图谱的结构和数据质量。

用户体验优化

1、断点续跑

产品模式、开发者模式下,分别提供文件级别、Chunk 级别的知识库构建任务的断点续跑能力,以降低任务失败后全量重跑所带来的时间和tokens 消耗。

2、用户登录&权限体系

提供用户登录&权限体系,防止未经授权的知识库数据访问和操作。

3、知识库构建任务调度优化

提供基于数据库的知识库构建任务调度能力,避免容器重启后任务异常或者中断。

4、支持不同阶段配置不同模型(开发者模式)

提供基于注册器的组件管理机制,允许用户通过配置文件实例化组件对象,支持用户开发&嵌入自定义组件到KAG-Builder、KAG-Solver 工作流 中,同时在工作流的不同阶段配置不同规模的大模型,以提升整体的推理问答性能。

5、Markdown、PDF、Word 文件版面分析优化

Markdown、pdf、word 等文件优先根据文件章节划分Chunk,以实现同一chunk 的内容更内聚。

6、项目全局配置及知识库配置

提供知识库全局配置功能,统一设置存储引擎、生成模型、表示模型的访问信息。

7、支持 Schema-constraint 模式的抽取链接(开发者模式)

提供 Schema-constraint 模式,知识库构建阶段,严格按照 Schema 的定义进行操作,从而实现更细粒度和更复杂的知识抽取。

未来规划

  1. 更多的效果量化榜单发布(包括医疗、事理图谱、金融研报等场景的知识推理);
  2. 复杂推理能力,子问题级领域知识精准注入,持续提升检索、推理的覆盖率和准确率;
  3. 产品体验持续提升。

目前 KAG 还处于早期阶段,诚邀对知识服务和知识图谱技术感兴趣的用户和开发者加入我们,共建新一代 AI 引擎框架。我们建立了 OpenSPG 技术交流群,欢迎大家添加小助手微信加入:jqzn-robot。


可信AI进展
1 声望4 粉丝

致力于最新可信人工智能技术的传播和开源技术的培育,覆盖大规模图学习,因果推理,知识图谱,大模型等技术领域,欢迎关注。