初学者入门知识图谱必看的能力:推理

摘要:本文从知识推理的基本概念出发,通俗易懂得介绍了知识图谱知识推理的应用和方法。

本文分享自华为云社区《0基础入门知识图谱的超能力——知识推理》,作者:Cheri Chen。

一、知识推理的概念

推理是运用逻辑思维能力,从已有的知识出发,得出未知的、隐性的知识。

具体到知识图谱中,所谓的知识推理,就是利用图谱中现有的知识(三元组),得到一些新的实体间的关系或者实体的属性(三元组)。如下图所示:假如原来的知识图谱中有这样两个三元组,<姚明,妻子,叶莉>和<姚明,女儿,姚沁蕾>,通过知识推理,可以得到<姚明,女儿,姚沁蕾>。
image.png

二、知识推理的应用

知识补全

实际构建的知识图谱,通常存在不完备的问题,即部分关系或属性会缺失。知识补全呢,就是通过算法,补全知识图谱中缺失的属性或者关系。

如下图所示,以“姚沁蕾的妈妈是谁”为例。有一条常识是 “父亲的妻子是妈妈”,则可依据该常识,推理出姚沁蕾的妈妈是叶莉,进而补全“姚沁蕾”和“叶莉”之间的关系,提升我们这个简单的人物关系知识图谱的完备性。
image.png

知识纠错

实际构建的知识图谱还可能存在错误知识。其中,实体的类型、实体间的关系、实体属性值均可能存在错误。知识图谱的纠错是一个极具挑战的任务。这些错误会影响知识图谱质量,进而影响基于知识图谱的应用。

我们可以通过推理进行知识图谱纠错(如下图)。比如,在某个影视知识图谱中,虚线框中的实体《春光灿烂猪八戒》,其类型为“电影“。它的属性有集数,主题曲、片尾曲等。而其他同为”电影“类别的实体,其属性多包含上映时期、票房,且大多没有集数这个属性。则推理可知,《春光灿烂猪八戒》这个实体的类型大概率存在错误,其正确类型应该是电视剧。
image.png

推理问答

基于知识图谱的推理问答也是知识图谱推理的典型应用。基于知识图谱的问答,一般简称为KBQA。与传统的信息检索式问答相比,KBQA可以具备一定的推理能力,这是它的优势。基于知识图谱的推理问答,通常应用于涉及多个实体,多个关系,多跳,比较等相对复杂的问答场景中。

比如,“刘德华主演的电影中豆瓣评分大于8分的有哪些?“这样的问题。需要机器对该问题进行解析、理解,在知识图谱中完成查询、推理、比较动作,找到《天下无贼》和《无间道》作为答案返回(如下图所示)。
image.png

三、知识推理的方法

基于本体的推理

本体是对领域中概念和概念之间关系的描述。基于本体的推理是利用本体已经蕴含的语义和逻辑,来对实体类型以及实体之间的关系进行推理。本体的描述形式是有规范的。RDFS、OWL等是一类满足特定规范和讲究的用来表述本体的语言。

以RDFS为例:RDFS定义了一组用于资源描述的词汇:包括class,domain,range等。其本身就蕴含了简单的语义和逻辑。我们可以利用这些语义和逻辑进行推理。

如下图中左侧的例子,谷歌的类型是一家人工智能公司,而人工智能公司又是高科技公司的子类,那么可推理,谷歌的也是一家高科技公司。右侧例子中,定义了投资这种关系的domain是投资人,range是公司。可以简单的认为,投资这种关系的头节点都是投资人这种类型、尾节点都是公司这种类型。假设现在有一条事实是大卫 切瑞顿 投资 谷歌 。则可以推理出,大卫 切瑞顿的类型是投资人。这两个例子呢,便是利用了RDFS本身蕴含的语义和逻辑,来进行推理。
image.png

基于规则的推理

基于规则的推理就是说,可以抽象出一系列的规则,将这些规则应用于知识图谱中,进行补全纠错。这种思路也是很简单、直观的。基于规则的推理的优点是,推理结果精准,并且具有可解释性。因此规则推理在学术界和工业界都有广泛的应用。

图中的例子,是人工定义了一些规则,包括“B是A的妻子,则A是B的丈夫”、“B是A的女儿,则A是B的父亲”等等。运用这些规则来进行推理,进而补全知识图谱的缺失关系。我们可以利用这些规则,推理出“米歇尔的丈夫是奥巴马”、“玛利亚的父亲是奥巴马”等新的知识。
image.png

基于表示学习的推理

前两种方法:本体推理和规则推理,都是基于离散符号的知识表示来推理的。它们具有强逻辑约束,准确度高、易于解释等优点。但是不易于扩展。基于表示学习的推理,通过映射函数,将离散符号映射到向量空间进行数值表示,同时捕捉实体和关系之间的关联,再在映射后的向量空间中进行推理。
image.png

知识图谱是由实体和关系组成,通常采用三元组的形式表示:head(头实体),relation(实体的关系),tail(尾实体) ,简写为(h,r,t)。知识表示学习任务就是学习h,r,t的向量表示。如下图所示,不同的点表示了不同的知识。我们可以找到一个合适的映射函数,让距离较近的点,在语义上也是相似的。

基于表示学习的推理比较抽象和复杂,这里举个简单的例子,推理“姚沁蕾的出生地是哪儿”。

假设我们已经找到了一个完美的映射函数,可以把知识图谱和一段包含相关信息的文本映射到同一向量空间。再对这些向量进行计算,比如把“姚沁蕾”、“在”、“当地医院”、“出生”几个向量简单相加后,到达了“休斯顿”这个向量,则可以推理出姚沁蕾的出生地是休斯顿。
image.png

[2021华为云 AI 实战营]——六大实战营课程单元制,随进随学,供大家免费学习。

点击关注,第一时间了解华为云新鲜技术~


开发者之家
华为云开发者社区,提供全面深入的云计算前景分析、丰富的技术干货、程序样例,分享华为云前沿资讯动态...

生于云,长于云,让开发者成为决定性力量

1.3k 声望
1.7k 粉丝
0 条评论
推荐阅读
【贺】来自开发者的点赞,华为云开发者联盟入选 2022 中国技术品牌影响力企业榜
2023 年 1 月 4 日,中国技术先锋年度评选 | 2022 中国技术品牌影响力企业榜单正式发布。作为中国领先的新一代开发者社区,SegmentFault 思否依托数百万开发者用户数据分析,各科技企业在国内技术领域的行为及影...

华为云开发者联盟阅读 349

高效数据运营赋能数字化转型研讨会暨《DataOps 实践手册》新书发布会 预约通道开启!
隆重预告高效数据运营赋能数字化转型研讨会暨《DataOps 实践手册》新书发布会 主办单位:机械工业出版社举办时间:2023 年 1 月 10 日 8:30-12:00会议背景随着数据呈指数级增长,机器学习(ML)和人工智能(AI)...

MissD阅读 3.6k

DeepMind 发布强化学习通用算法 DreamerV3,AI 成精自学捡钻石
内容一览:强化学习是多学科领域的交叉产物,其本质是实现自动决策且可做连续决策。本文将介绍 DeepMind 最新研发成果:扩大强化学习应用范围的通用算法 DreamerV3。关键词:强化学习 DeepMind 通用算法

超神经HyperAI1阅读 434

封面图
AIGC神器CLIP:技术详解及应用示例
编者按:上一期,我们介绍了Diffusion模型的发展历程、核心原理及其对AIGC发展的推动作用。本期,我们将共同走进另一项AI重要突破——CLIP,著名的DALLE和Stable Diffusion均采用了CLIP哦。

Baihai_IDP1阅读 910

封面图
一文详解AI模型部署策略
编者按:模型部署是AI开发生产流程中的重要步骤。对于许多组织而言,选择最佳的模型部署策略以扩展到生产级系统,都是一项复杂且具有挑战的工作。今天IDP将和大家一同,跟随Yashawi Nayak,全面了解模型部署策略...

Baihai_IDP1阅读 531

封面图
90 后学霸博士 8 年进击战,用机器学习为化学工程研究叠 BUFF
本文首发自公众号:HyperAI 超神经 内容一览:ScienceAI 作为近两年的技术热点,引起了业界广泛关注和讨论。本文将围绕 ScienceAdvances 的一篇论文,介绍如何利用机器学习,对燃煤电厂的胺排放量进行预测。 关键...

超神经HyperAI1阅读 485

使用OpenGPT(ChatGPT)搭建 QQ 机器人
一个服务器:Windos,Centos,Ubuntu环境:Python一个 QQ 号用作机器人一个 OpenAI 账号 (注册教程自行搜索)

JanYork_小简阅读 1.6k

生于云,长于云,让开发者成为决定性力量

1.3k 声望
1.7k 粉丝
宣传栏