人工智能导论-第2章知识表示和知识图谱
- 格式:docx
- 大小:50.48 KB
- 文档页数:6
知识图谱与知识表示随着人类社会的不断发展,我们的知识面也在不断拓宽。
越来越多的信息需要人们去学习、研究、整理和理解。
然而,知识的范围之广,形式之多,使得我们不得不依靠计算机技术来帮助我们去管理和利用这些知识。
知识图谱和知识表示就是其中两种比较重要的技术手段。
本篇文章就会对这两种技术进行更加详细的介绍和探讨。
一、什么是知识图谱?知识图谱(Knowledge Graph)是一种将数据以图形方式表示的技术,可以将实体、关系和属性组织成一种结构化的知识表达形式。
简单来说,知识图谱是一种类似于我们脑海中的抽象概念的东西,它并不是现实中的一件具体事物,而是对现实世界的一种抽象和概括。
知识图谱的核心是实体、关系和属性三个元素。
1. 实体在知识图谱中,实体是指现实中可命名或可分类的事物,例如人名、机构名、地名、事件名等。
实体也可以是抽象的,例如学术领域的术语、孔子思想中的“仁”等等。
知识图谱中都可以以实体的形式进行表示。
2. 关系知识图谱中,关系就是连接实体的桥梁,表达实体之间的联系。
例如,“爸爸”和“儿子”之间存在一个“亲属关系”;“北京”和“上海”之间存在一个“相邻关系”。
在知识图谱中,对于每个关系,都有一定的约束条件,例如“父亲-儿子”关系是一种对称关系,而“父亲-女儿”关系则是一种非对称关系。
3. 属性实体可以拥有若干个属性,用于表达它们的特征、状态、属性等。
属性可以是数值型的、字符型的、布尔型的、时间型的等等。
例如,一个人实体可以拥有“姓名”属性和“出生日期”属性等。
通过实体、关系和属性这三个元素,知识图谱可以更加清晰的表达现实世界中的知识,让计算机可以从中理解现实世界中的各种事物之间的关系和联系。
二、什么是知识表示?知识表示(Knowledge Representation)是另外一种由计算机技术服务于人类知识管理的重要手段。
它的目标是将自然语言表述的知识转化为计算机可处理的表达方式,即形式语言。
这样,计算机可以更加方便的进行知识的表示、推理、推断等操作。
人工智能之知识图谱Research Report of Knowledge Graph目录图表目录 (4)摘要 (6)1.概念篇 (7)1.1.知识图谱概念和分类 (7)1.1.1.知识图谱的概念 (7)1.1.2.知识图谱的分类 (3)1.2.知识工程发展历程 (3)1.3.知识图谱的知识图谱 (6)2.技术人才篇 (10)2.1.知识表示与建模 (11)2.1.1.知识表示模型 (11)2.1.2.知识表示学习 (12)2.1.3.知识表示与建模人才介绍 (12)2.2.知识获取 (19)2.2.1.实体识别与链接 (19)2.2.2.实体关系学习 (20)2.2.3.事件知识学习 (21)2.2.4.知识获取人才介绍 (22)2.3.知识融合 (29)2.3.1.本体匹配 (30)2.3.2.实例匹配 (30)2.3.3.知识融合人才介绍 (30)2.4.知识图谱查询和推理计算 (36)2.4.1.知识推理 (36)2.4.2.知识存储和查询 (37)2.4.3.知识查询与推理人才介绍 (38)2.5.知识应用 (44)2.5.1.典型应用 (44)2.5.2.通用和领域知识图谱 (45)2.5.3.知识应用人才介绍 (46)2.6.高引学者及论文介绍 (51)2.6.1.高引学者介绍 (51)2.6.2.高引论文介绍 (56)2.7.会议奖项介绍 (57)3.应用篇 (67)3.1.通用知识图谱应用 (67)3.2.3.企业商业 (70)3.2.4.创业投资 (71)3.2.5.生物医疗 (72)4.趋势篇 (73)参考文献 (76)附录 (78)图表目录图 1 知识工程发展历程 (3)图 2 Knowledge Graph 知识图谱 (9)图 3 知识图谱细分领域学者选取流程图 (10)图 4 基于离散符号的知识表示与基于连续向量的知识表示 (11)图 5 知识表示与建模领域全球知名学者分布图 (13)图 6 知识表示与建模领域全球知名学者国家分布统计 (13)图7 知识表示与建模领域中国知名学者分布图 (14)图8 知识表示与建模领域各国知名学者迁徙图 (14)图9 知识表示与建模领域全球知名学者h-index 分布图 (15)图10 知识获取领域全球知名学者分布图 (23)图11 知识获取领域全球知名学者分布统计 (23)图12 知识获取领域中国知名学者分布图 (23)图13 知识获取领域各国知名学者迁徙图 (24)图14 知识获取领域全球知名学者h-index 分布图 (24)图15 语义集成的常见流程 (29)图16 知识融合领域全球知名学者分布图 (31)图17 知识融合领域全球知名学者分布统计 (31)图18 知识融合领域中国知名学者分布图 (31)图19 知识融合领域各国知名学者迁徙图 (32)图20 知识融合领域全球知名学者h-index 分布图 (32)图21 知识查询与推理领域全球知名学者分布图 (39)图22 知识查询与推理领域全球知名学者分布统计 (39)图23 知识查询与推理领域中国知名学者分布图 (39)图24 知识表示与推理领域各国知名学者迁徙图 (40)图25 知识查询与推理领域全球知名学者h-index 分布图 (40)图26 知识应用领域全球知名学者分布图 (46)图27 知识应用领域全球知名学者分布统计 (46)图28 知识应用领域中国知名学者分布图 (47)图29 知识应用领域各国知名学者迁徙图 (47)图30 知识应用领域全球知名学者h-index 分布图 (48)图31 行业知识图谱应用 (68)图32 电商图谱Schema (69)图33 大英博物院语义搜索 (70)图34 异常关联挖掘 (70)图35 最终控制人分析 (71)图36 企业社交图谱 (71)图37 智能问答 (72)图38 生物医疗 (72)图39 知识图谱领域近期热度 (75)图40 知识图谱领域全局热度 (75)表1 知识图谱领域顶级学术会议列表 (10)表2 知识图谱引用量前十论文 (56)表3 常识知识库型指示图 (67)摘要知识图谱(Knowledge Graph)是人工智能重要分支知识工程在大数据环境中的成功应用,知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。
人工智能导论课参考答案第2章第2章知识表示方法部分参考答案2.8 设有如下语句,请用相应的谓词公式分别把他们表示出来:(1) 有的人喜欢梅花,有的人喜欢菊花,有的人既喜欢梅花又喜欢菊花。
解:定义谓词P(x):x是人L(x,y):x喜欢y其中,y的个体域是{梅花,菊花}。
将知识用谓词表示为:( x )(P(x)→L(x, 梅花)∨L(x, 菊花)∨L(x, 梅花)∧L(x, 菊花))(2) 有人每天下午都去打篮球。
解:定义谓词P(x):x是人B(x):x打篮球A(y):y是下午111 P(x):x 是人L(x, y):x 喜欢y将知识用谓词表示为:(x) (P(x)∧L(x,pragramming)→L(x, computer))2.9 用谓词表示法求解机器人摞积木问题。
设机器人有一只机械手,要处理的世界有一张桌子,桌上可堆放若干相同的方积木块。
机械手有4个操作积木的典型动作:从桌上拣起一块积木;将手中的积木放到桌之上;在积木上再摞上一块积木;从积木上面拣起一块积木。
积木世界的布局如下图所示。
图 机器人摞积木问题 C AB A B C解:(1) 先定义描述状态的谓词CLEAR(x):积木x上面是空的。
ON(x, y):积木x在积木y的上面。
ONTABLE(x):积木x在桌子上。
HOLDING(x):机械手抓住x。
HANDEMPTY:机械手是空的。
其中,x和y的个体域都是{A, B, C}。
问题的初始状态是:ONTABLE(A)ONTABLE(B)ON(C, A)CLEAR(B)CLEAR(C)HANDEMPTY问题的目标状态是:ONTABLE(C)ON(B, C)ON(A, B)CLEAR(A)2HANDEMPTY(2) 再定义描述操作的谓词在本问题中,机械手的操作需要定义以下4个谓词:Pickup(x):从桌面上拣起一块积木x。
Putdown(x):将手中的积木放到桌面上。
Stack(x, y):在积木x上面再摞上一块积木y。
知识图谱⽂献综述(第⼆章知识表⽰学习)第⼆章知识表⽰学习1. 任务定义、⽬标和研究意义 知识表⽰是知识获取与应⽤的基础,因此知识表⽰学习问题,是贯穿知识库的构建与应⽤全过程的关键问题。
⼈们通常以⽹络的形式组织知识库中的知识,⽹络中每个节点代表实体(⼈名、地名、机构名、概念等),⽽每条连边则代表实体间的关系。
然⽽,基于⽹络形式的知识表⽰⾯临诸多挑战性难题,主要包括如下两个⽅⾯: (1)计算效率问题。
基于⽹络的知识表⽰形式中,每个实体均⽤不同的节点表⽰。
当利⽤知识库计算实体间的语义或推理关系时,往往需要⼈们设计专门的图算法来实现,存在可移植性差的问题。
更重要的,基于图的算法计算复杂度⾼,可扩展性差,当知识库规模达到⼀定规模时,就很难较好地满⾜实时计算的需求。
(2)数据稀疏问题。
与其他类型的⼤规模数据类似,⼤规模知识库也遵守长尾分布,在长尾部分的实体和关系上,⾯临严重的数据稀疏问题。
例如,对于长尾部分的罕见实体,由于只有极少的知识或路径涉及它们,对这些实体的语义或推理关系的计算往往准确率极低。
近年来,以深度学习[Bengio, et al., 2009]为代表的表⽰学习[Bengio, et al., 2013]技术异军突起,在语⾳识别、图像分析和⾃然语⾔处理领域获得⼴泛关注。
表⽰学习旨在将研究对象的语义信息表⽰为稠密低维实值向量。
在该低维向量空间中,两个对象距离越近,则说明其语义相似度越⾼。
知识表⽰学习,则是⾯向知识库中的实体和关系进⾏表⽰学习。
知识表⽰学习实现了对实体和关系的分布式表⽰,它具有以下主要优点:(1)显著提升计算效率。
知识库的三元组表⽰实际就是基于独热表⽰的。
如前所分析的,在这种表⽰⽅式下,需要设计专门的图算法计算实体间的语义和推理关系,计算复杂度⾼,可扩展性差。
⽽表⽰学习得到的分布式表⽰,则能够⾼效地实现语义相似度计算等操作,显著提升计算效率。
(2)有效缓解数据稀疏。
由于表⽰学习将对象投影到统⼀的低维空间中,使每个对象均对应⼀个稠密向量,从⽽有效缓解数据稀疏问题,这主要体现在两个⽅⾯。