头图

本文来自一位海外开发者的社区投稿,如果你也在使用 KAG,欢迎参与社区的有奖征文活动

作者:Lemos Franco Alejandro,阿根廷圣托马斯德阿基诺大学毕业,选择来到中国发展,目前是一名具有 4 年经验的前端开发工程师,从事 CRUD 操作、电子商务平台以及 ASP.NET 框架开发。同时,编写数据处理和任务自动化的脚本,探索它们在人工智能相关项目中的应用。希望通过合作完成具有挑战性的项目,并扩展对新兴技术的知识,继续在软件开发领域成长。

人工智能发展浪潮下,知识增强生成模型(KAG)已成为一个重要的技术前沿。作为知识图谱研究爱好者,我认为蚂蚁 OpenSPG 的最新 KAG 展现出很强的创造力,其能够改变生成模型与专业上下文数据之间的互动,特别是逻辑推理和自然语言响应处理技术中的标准被 OpenSPG-KAG 推向一个新的高度。

1 什么是 KAG?

KAG 是一个以创建和操作知识图谱为核心的框架。知识图谱是数据之间相互关联的可视化和结构化表示,对于搜索引擎、推荐系统和机器学习等应用至关重要。KAG 的目标是提供一个强大的平台,使开发者能够:

  • 轻松构建图谱;
  • 通过增强算法丰富数据;
  • 集成人工智能,以进行更精确的推理。

通过理解 KAG,可以明显看出,这个框架旨在帮助从初学者到专业开发者,在项目中创造更优的解决方案。它在简便性和集成方面的优势,使其成为下一代基于数据的应用程序的前景工具。

关键特性

开放标准兼容性:KAG 基于开放标准,便于与 Neo4j 和 GraphQL 等工具的互操作性。这使得开发者能够无缝地将 KAG 集成到现有的技术生态系统中。

可扩展性:KAG 旨在处理从小型数据集到企业级图谱的各种规模,确保无论项目的大小如何,都能提供最佳性能。

原生 AI 集成:支持先进的语言模型,使得图谱中的节点能够通过推理来丰富信息。这简化了诸如在大数据量中识别隐藏模式等复杂任务。

易于使用:提供直观的 API 和结构良好的文档,使得即使是初学者也能轻松上手。其设计的清晰性确保了高效且无障碍的工作流。

多语言支持:KAG 支持英语和普通话,定位为一个真正全球化的工具,连接来自不同地区的开发者。

2 使用 OpenSPG-KAG 的经验

自从开始使用 OpenSPG-KAG 以来,我对很多方面感到惊讶。首先是我能够快速设置一个基础图谱。文档显然是为了简化学习过程,提供了切实可行的示例,直截了当。

我特别强调的一点是与语言模型的集成能力。这让我能够自动生成看似无关的数据之间的关系,而在其他系统如 RAG(检索增强生成)中,这通常更加僵化或需要更多的预配置。此外,KAG 执行复杂操作的速度也很快,这为用户提供了流畅而令人满意的体验。

然而,我注意到一些内部工具,如数据可视化工具,如果使用更现代的界面效果应该会更好。尽管它们是可用的,但与一些成熟的专门用于可视化图谱的工具相比,它们显得有些原始。此外,在将 KAG 与海外现有解决方案集成时,遇到了一些挑战,这可能是未来版本需要改进的地方。

另一个显著的优势是 KAG 提供的定制化程度。从节点配置到关系处理方式,这个框架提供了详细的控制,这在类似产品中是少见的。当我与其他 RAG 方法进行比较时,KAG 凭借更深层次的数据处理脱颖而出,而许多 RAG 则仅仅优先考虑快速的信息检索。

第一步是通过 Docker Compose 安装 KAG,这大大简化了过程。Docker Compose 使得服务和容器的管理变得高效,非常适合测试或开发项目。借助这个工具,整个安装过程只需要几个命令,而无需进行复杂的手动配置。

这种方法还让我确保测试环境是可复制和模块化的,便于未来对系统进行修改或更新。

get docker-compose.yaml file

curl -sSL https://raw.githubusercontent.com/OpenSPG/openspg/refs/heads/master/dev/release/docker-compose.yml -o docker-compose.yml

docker compose -f docker-compose.yml up -d

请在此添加图片描述

在环境配置完成后,我通过地址 http://127.0.0.1:8887 访问了 KAG 的图形界面。这个界面作为管理和自定义系统所有方面的中心点。

进入后,我找到了设置系统的主要选项,如创建新的知识库。从这里开始了更详细的配置过程。

在继续创建知识库之前,定义两个关键组件是至关重要的:

我决定使用 llama3.2 3b,这是一个紧凑高效的模型,适用于资源有限的环境或像这样的测试项目。尽管存在更先进的模型,我选择了这个,因为它在性能和易用性之间取得了良好的平衡。

ollama run llama3.2

对于嵌入,我选择了 bge-m3,因为它因其高精度和与 KAG 的兼容性而被高度推荐。该模型保证了对加载到系统中的内容进行高质量的向量表示,从而提高了在问答任务中的信息检索能力。

ollama run bge-m3

作为此步骤的一部分,我还在 Docker 中安装了 Ollama 和 KAG。这为系统增加了灵活性,使我能够管理额外的模型并在一个环境中进行不同配置的实验。

一旦定义了主要组件,我开始创建和配置我的第一个知识库。这个知识库作为主存储库,用于存储处理过的数据和系统生成的向量表示。

KAG 的界面让我能够为知识库命名、定义初始参数并连接之前选择的模型。这个步骤对系统开始处理我计划加载的信息至关重要。

请在此添加图片描述

请在此添加图片描述

为了测试系统的功能,我上传了一个与医学相关的简单 PDF 文件。这个文件作为训练和评估 KAG 在实际任务中表现的基础材料。

请在此添加图片描述

在这个步骤中,系统处理了文件内容,从文本中生成了嵌入。这样,PDF 中的信息就完全被索引并准备好供后续查询。

配置完成后,我进入了 KAG 的问答部分。这个功能允许直接与知识库互动,根据加载的数据获取特定的答案。

为了测试系统,我提出了一个关于 PDF 医学内容的简单问题。KAG 通过生成一个概念图来回答,不仅包含了答案,还可视化了文本中关键思想之间的联系。

请在此添加图片描述

这个初步结果令人满意,确认了初始配置和所选模型都按预期工作。

请在此添加图片描述

完成这个基础测试后,我发现了几个扩展 KAG 使用的机会:

  • 使用更复杂和多样化的数据进行测试,如数据库或多个文档。
  • 尝试其他语言模型和嵌入,比较结果。
  • 探索将 KAG 与外部工具集成,以自动化工作流。

3 评估与比较

请在此添加图片描述

在蚂蚁集团知识图谱团队对 HotpotQA 和 2WikiMultiHopQA 等数据集的测试中,KAG 在 F1 分数等指标上表现出显著的改进(在某些情况下提升了高达 33.5%)。与 HippoRAG 等其他方法相比,KAG 在电子政务和电子健康等实际应用中提供了质的飞跃。从我的角度来看,将逻辑推理和语义集成到复杂系统中的能力是其关键差异化优势。

请在此添加图片描述

KAG 所采用的多步检索方法在应用于不同数据集时,证明其优于单步检索方法。这凸显了其在分析和建立文档之间的有意义连接方面的先进能力,使其能够更深入、更精确地推理现有信息。

在我的经验中,许多基于 RAG 的工具在适应高专业化领域时存在困难,在这些领域,上下文细节至关重要。KAG 不仅解决了这个问题,还通过应用逻辑规则和基于图谱的推理将其转化为竞争优势。

GraphRAG:KAG 采用了一种强大的结构化信息检索方法(例如,数据库、表格、文档),该方法直接与生成模型集成。相比之下,GraphRAG 专注于知识图谱,虽然它对复杂关系很有用,但管理起来可能更加困难,并且没有 KAG 那样直接和清晰的集成方式。此外,KAG 在外部知识源的灵活性方面表现更好,因为它不限于图谱结构。它可以处理多种数据源,而 GraphRAG 则仅限于图谱领域,这可能不适用于某些类型的应用。

HippoRAG:虽然 HippoRAG 在改善长期记忆方面表现出色,KAG 通过持续地将外部知识集成到生成回答中,进一步提升了这一能力。HippoRAG 适用于长时间对话,但 KAG 通过结合不断流入的上下文数据与强大的知识库,能够更有效地生成回答。

NativeRAG:这种方法更为直接,通过整合信息检索和生成过程,避免了复杂的中间步骤,从而提高了效率。然而,这可能会限制其在处理复杂情况时的精确度和能力。相比之下,KAG 更为复杂地处理结构化知识的集成,这使得它在精确度和灵活性上表现得更好,尽管它的复杂度略高。

LightRAG:旨在轻量化和提高速度,适用于优先考虑速度且资源有限的应用。然而,在基于深入精确知识的生成质量和精度方面,KAG 更为优越。LightRAG 为了提高效率,牺牲了一部分质量,而 KAG 在不大幅牺牲速度的情况下,保持了较高的精度和上下文理解。

KAG:KAG 被定位为生成精确且具有上下文相关性的文本的最强大选项,这得益于其有效整合外部知识源的能力。与 GraphRAG、HippoRAG、NativeRAG 和 LightRAG 等模型不同,这些模型在效率、复杂关系或记忆等方面具有优势,KAG 则凭借其处理多样化和结构化知识的能力脱颖而出,提供更精确且具有丰富上下文的回答。其对外部数据集成的重视不仅提高了精度,还在多种应用中提供了更高的灵活性,使其成为与其他专门化模型相比,更全面且适应性强的解决方案。

4 批判性思考

从用户和开发者的角度来看,我认为 KAG 算法创造力与结构化知识的协同,是对多种行业的适应性以及对上下文相关性的重视,使其在面对更为通用的替代方案时具有竞争优势。然而,这不仅仅是技术上的优势,更是对技术与实际应用之间关系的重新定义。

在一个精确度和相关性至关重要的生态系统中,KAG 被定位为推动人工智能在传统上对这些技术持保留态度的行业中的应用的催化剂。它的发展仍在继续,我会持续关注,不仅因为它的技术影响,还因为它改变工业范式的能力。

此外,我认为 OpenSPG 的 KAG 的影响力不会仅限于其在企业中的应用。开源代码和模块化的设计可能会激发新一代协作工具的出现,惠及独立用户和各行各业。这突显了在研究和开发中持续领导的重要性,特别是在人工智能进展具有深远社会和伦理意义的当下。

5 未来展望

展望未来,KAG 有机会巩固其作为一个更加多功能和易于访问的框架的地位。有几个关键领域,KAG 的开发可以继续加强。

简化实施过程: 最重要的期望之一是创建工具和指南,以减少初始配置的复杂性。这将有助于中小型企业的采用,尤其是那些没有专业技术团队,但需要类似 OpenSPG KAG 提供的功能的企业。

优化逻辑推理: KAG 可以进行对话任务和处理自然语言回答的过程,能够更好地进行推理并提供更具逻辑性的回答。

作为一名海外开发者,使用中国本土的工具 KAG 是一次具有启发性的体验。这个框架不仅体现了中国的技术进步,还展示了其融入全球软件领域的承诺。尽管仍有一些需要改进的地方,例如某些内部工具的用户界面,KAG 具有成为知识图谱领域标杆的巨大潜力。

与其他 RAG 方法相比,KAG 凭借其从构建到高级数据推理的全面方法脱颖而出。它处理大规模信息的能力以及多语言支持使其成为该领域的革命性工具。

随着社区的不断发展和对创新的持续关注,KAG 有望挑战当前知识建模领域的局限性。如果你正在寻找一个结合了简洁性、可扩展性和人工智能的现代框架,我鼓励你尝试 KAG。谁知道呢!也许你会发现一款能改变你在项目中处理数据方式的工具。


END

目前 KAG 还处于早期阶段,诚邀对知识服务和知识图谱技术感兴趣的用户和开发者加入我们,共建新一代 AI 引擎框架。我们建立了 OpenSPG 技术交流群,欢迎大家添加小助手微信加入:jqzn-robot。

GitHub

OpenSPG 是一个语义增强的可编程知识图谱:https://github.com/OpenSPG/openspg

KAG 是一个知识增强生成的专业领域知识服务框架,KAG 依赖 OpenSPG 提供的引擎依赖适配、逻辑推理执行等能力:https://github.com/OpenSPG/KAG/

🌟 欢迎大家 Star 关注~


可信AI进展
1 声望4 粉丝

致力于最新可信人工智能技术的传播和开源技术的培育,覆盖大规模图学习,因果推理,知识图谱,大模型等技术领域,欢迎关注。