知识表示与产生式系统
- 格式:doc
- 大小:24.50 KB
- 文档页数:3
人工智能中知识的表示法
在人工智能领域,知识的表示是将信息组织成可供计算机理解和处理的形式的过程。
不同的问题和应用需要不同的知识表示方法。
以下是一些常见的知识表示方法:
谓词逻辑:使用谓词和逻辑运算符表示事实和关系。
一阶逻辑和高阶逻辑是常见的形式。
图表示法:使用图结构表示对象和它们之间的关系。
图可以是有向图或无向图,节点表示实体,边表示关系。
框架表示法: 将知识组织成框架或者类似于面向对象编程中的类的结构。
每个框架包含关于实体或概念的属性和关系。
语义网络:与图表示法相似,语义网络使用节点表示概念,边表示关系,但通常具有更丰富的语义。
产生式系统:使用规则的集合,每个规则描述了在特定条件下执行的操作。
用于表示推理和问题解决的过程。
向量表示法: 将实体和概念表示为向量,例如词嵌入(Word Embeddings)用于表示单词,将语义相近的单词映射到相似的向量空间位置。
本体论:使用本体来描述概念、实体和它们之间的关系。
本体是一种形式化的知识表示,用于共享和集成信息。
模型表示法:使用数学模型表示知识,例如概率图模型、
贝叶斯网络等。
这些模型可以用于推理、学习和决策。
神经网络表示法:利用神经网络来学习和表示知识,例如深度学习中的各种神经网络结构。
产生式系统产生式系统(production system)由波斯特(Post)于1943年提出的产生式规则(production rule)而得名。
人们用这种规则对符号进行置换运算。
1965年美国的纽厄尔和西蒙利用这个原理建立了一个人类的认知模型。
同年,斯坦福大学利用产生式系统结构设计出第一个专家系统DENDRAL。
产生式系统用来描述若干个不同的以一个基本概念为基础的系统。
这个基本概念就是产生式规则或产生式条件和操作对的概念。
在产生式系统中,论域的知识分为两部分:用事实表示静态知识,如事物、事件和它们之间的关系;用产生式规则表示推理过程和行为。
由于这类系统的知识库主要用于存储规则,因此有吧这类系统称为基于规则的系统(rule-based system)。
1、产生式系统的基本要素1.1产生式系统的组成产生式系统由三部分组成,即总数据库(Global Database),产生式规则库(Set of Product Rules)和控制策略(Control Strategies),各部分之间的关系如图1所示。
图1.产生式系统的主要组成1.1.1总数据库(Global Database)总数据库又称综合数据库、上下文、黑板等,用于存放求解过程中各种当前信息的数据结构,如问题的初始状态、事实或证据、中间推理结论和最后结果等,其中的数据是产生式规矩的处理对象。
数据库中的数据根据应用的问题不同,可以使常量、变量、谓词、表结构、图像等等。
例如,关于动物世界的产生式系统有如下数据库:…(Mammal Dog)(Eat Dog Meat)…从另一个角度,数据库可视为推理过程中间结果的存储池。
随着中间结果的不断加入,是数据库描述的问题状态逐步转变为目标状态。
1.1.2 规则库(Set of Product Rules)产生式规则库是某领域知识用规则形式表示的集合,其中包含将问题从初始状态转换到目标状态的所有变换规则。
当产生式规则中某条规则的前提与数据总库中的事实相匹配时,该规则库就被激活,并把其结论作为新的事实存入总数据库。
常用的知识表示方法知识表示方法是人工智能中一个非常重要的领域,其主要目的是设计一种计算机程序,使其能够利用已有的知识去推理、学习和解决新问题。
在现代人工智能系统中,有许多常用的知识表示方法,包括逻辑表示、产生式表示、框架表示、语义网络表示、神经网络表示、本体表示等等。
下面将分别对这些知识表示方法展开详细的描述。
1. 逻辑表示逻辑表示是指使用逻辑语句来描述知识的方式。
这种表示方法最早应用于人工智能领域,它使用命题逻辑、谓词逻辑、模态逻辑等形式化逻辑体系来表达知识。
逻辑表示法的优点是表达简单直观,易于推理,而且能够容易地与其它知识表示方法相结合。
该方法的主要缺点是计算复杂度较高,不适用于大规模的知识表示。
2. 产生式表示产生式表示法是一种基于规则的知识表示方法,它通过一系列的规则来描述问题解决过程。
规则通常由条件和结果两部分组成,当条件满足时,就会执行规则,得到相应的输出结果。
产生式表示法的优点是表达简单易懂,适合大规模知识的表示和处理。
该方法的主要缺点是规则的编写和管理比较困难,而且可能出现死循环等问题。
3. 框架表示框架表示法是一种以对象为中心的知识表示方法,它通过描述事物的属性、关系、功能等方面来构建一个框架模型,从而达到表示知识的目的。
框架表示法的优点是具有良好的结构、易于维护和扩展。
该方法的主要缺点是无法处理复杂的关系和不确定性,而且不适用于处理嵌套结构。
4. 语义网络表示语义网络表示法是一种以图形为基础的知识表示方法,它通过节点和边的组合来描述概念、关系和属性等知识。
语义网络表示法的优点是视觉化表达直观,易于理解和调试,适用于复杂的知识系统。
该方法的主要缺点是不适用于大量数据的处理,因为图形结构比较复杂,计算开销较大。
5. 基于案例的表示基于案例的表示法是一种通过描述已有的实例来表达知识的方法,它将具体的案例作为基本单位,通过比较和分析不同案例之间的相似性和差异性来实现知识的表示和推理。
产生式系统产生式系统(production system)由波斯特(Post)于1943年提出的产生式规则(production rule)而得名。
人们用这种规则对符号进行置换运算。
1965年美国的纽厄尔和西蒙利用这个原理建立了一个人类的认知模型。
同年,斯坦福大学利用产生式系统结构设计出第一个专家系统DENDRAL。
产生式系统用来描述若干个不同的以一个基本概念为基础的系统。
这个基本概念就是产生式规则或产生式条件和操作对的概念。
在产生式系统中,论域的知识分为两部分:用事实表示静态知识,如事物、事件和它们之间的关系;用产生式规则表示推理过程和行为。
由于这类系统的知识库主要用于存储规则,因此有吧这类系统称为基于规则的系统(rule-based system)。
1、产生式系统的基本要素1.1产生式系统的组成产生式系统由三部分组成,即总数据库(Global Database),产生式规则库(Set of Product Rules)和控制策略(Control Strategies),各部分之间的关系如图1所示。
图1.产生式系统的主要组成1.1.1总数据库(Global Database)总数据库又称综合数据库、上下文、黑板等,用于存放求解过程中各种当前信息的数据结构,如问题的初始状态、事实或证据、中间推理结论和最后结果等,其中的数据是产生式规矩的处理对象。
数据库中的数据根据应用的问题不同,可以使常量、变量、谓词、表结构、图像等等。
例如,关于动物世界的产生式系统有如下数据库:…(Mammal Dog)(Eat Dog Meat)…从另一个角度,数据库可视为推理过程中间结果的存储池。
随着中间结果的不断加入,是数据库描述的问题状态逐步转变为目标状态。
1.1.2 规则库(Set of Product Rules)产生式规则库是某领域知识用规则形式表示的集合,其中包含将问题从初始状态转换到目标状态的所有变换规则。
当产生式规则中某条规则的前提与数据总库中的事实相匹配时,该规则库就被激活,并把其结论作为新的事实存入总数据库。
知识表⽰的⽅法——逻辑表⽰法、产⽣式表⽰法、框架表⽰法、语义⽹络表⽰法、⾯向对象表⽰知识表⽰的⽅法知识表⽰⽅法种类繁多,通常有直接表⽰、逻辑表⽰、产⽣式规则表⽰法、语义⽹络表⽰法、框架表⽰法、脚本表⽰⽅法、过程表⽰、混合型知识表⽰⽅法、⾯向对象的表⽰⽅法等。
在本⽂中,着重介绍⽬前使⽤较多的知识表⽰⽅法。
⽬前使⽤较多的知识表⽰⽅法主要有:逻辑表⽰法、产⽣式表⽰法、框架表⽰法、语义⽹络表⽰法、⾯向对象表⽰等等。
2.3.2.1 ⼀阶谓词逻辑表⽰法[45]通过引⼊谓词、函数来对知识加以形式化描述,获得有关的逻辑公式,进⽽以机器内部代码表⽰的⼀种⽅法。
谓词逻辑是⼀种形式语⾔,它与⼈类的⾃然语⾔⽐较接近,是⽬前能够表达⼈类思维活动的⼀种最精确的语⾔,它具有丰富的表达能⼒,因⽽可以表⽰⼤量常识知识。
它具有简单、⾃然、精确、灵活、容易实现等特点。
⼀阶谓词的⼀般形式为 P(x1, x2 (x)n)。
其中,P 是谓词,x1, x2 (x)n是常量、变元或函数。
谓词逻辑适⽤于表⽰事物的状态、属性、概念等事实性的知识,也可以⽤来表⽰事物间关系的知识,即规则。
例如:物体 A 在物体 B 的上⾯,可以表⽰为:On(A,B);物体 A 是书,可以表⽰为:book(A);书 A 在书 B 上,可以表⽰为:On(book(A),book(B))。
⼀阶谓词逻辑表⽰法的局限性在于它难以表达不确定性知识和启发性知识,推理⽅法在事实较多时易于出现组合爆炸,且推理过程繁杂、效率低。
2.3.2.2 产⽣式表⽰法多数较为简单的专家系统(Expert System)都是以产⽣式表⽰知识,相应的系统被称作产⽣式系统。
产⽣式系统,由知识库和推理机组成。
其中知识库由事实库和规则库组成。
事实库是已知事实的集合,规则库是产⽣式规则的集合。
规则则是产⽣式规则。
规则库蕴涵着将问题从初始状态转换到解状态的那些变换规则,规则库是专家系统的核⼼部分。
规则可以表⽰成与或树的形式,基于事实库中的事实通过与或树求值的过程就是推理。
产生式系统的组成产生式系统是人工智能领域中一种重要的知识表示和推理方法。
它由一组产生式规则组成,每条规则由前件和后件构成,表示了一种条件-动作对。
产生式系统通过匹配规则的前件,选择合适的规则并执行相应的动作,从而实现推理和问题求解的过程。
一、产生式系统的基本组成1.1 前件:前件是规则中的条件部分,用于描述问题的特征和条件。
在问题求解过程中,产生式系统会根据输入的问题描述和已知条件,匹配规则的前件,以确定适用的规则。
1.2 后件:后件是规则中的动作部分,用于描述问题求解的结果和推理的结论。
当规则的前件与当前问题描述匹配成功时,产生式系统会执行规则的后件,得到相应的结果或结论。
1.3 规则库:规则库是产生式系统中存储规则的地方,它由一组产生式规则组成。
规则库中的规则根据具体问题的特点和需求,经过人工设计和编写,用于描述问题的解决思路和推理过程。
1.4 控制策略:控制策略是产生式系统中的重要组成部分,它决定了规则的执行顺序和方式。
控制策略可以根据不同的问题和应用需求进行调整和优化,以提高系统的推理效率和准确性。
二、产生式系统的工作原理产生式系统的工作原理可以简单描述为以下几个步骤:2.1 初始化:产生式系统在开始工作之前,需要初始化系统的状态和规则库。
初始化包括设置系统的初始状态和加载规则库。
2.2 匹配规则:产生式系统根据当前问题描述和已知条件,匹配规则库中的规则的前件。
匹配可以基于规则的特征和条件进行,也可以基于问题描述和已知条件的匹配度进行。
2.3 选择规则:当有多条规则的前件与当前问题描述匹配成功时,产生式系统需要根据一定的策略选择合适的规则。
选择规则可以基于规则的优先级、匹配度等进行。
2.4 执行规则:选择合适的规则后,产生式系统执行规则的后件,得到相应的结果或推理结论。
执行规则可以包括修改系统状态、生成新的问题描述、输出结果等。
2.5 更新状态:在执行规则后,产生式系统会更新系统的状态和问题描述。
知识表⽰之⼆——产⽣式规则表⽰法 产⽣式知识表⽰法是常⽤的知识表⽰⽅式之⼀。
它是依据⼈类⼤脑记忆模式中的各种知识之间的⼤量存在的因果关系,并以“IF-THEN”的形式,即产⽣式规则表⽰出来的。
这种形式的规则捕获了⼈类求解问题的⾏为特征,并通过认识--⾏动的循环过程求解问题。
⼀个产⽣是系统由规则库、综合数据库和控制机构三个基本部分组成。
产⽣式规则表⽰法具有⾮常明显的优点:⾃然性好,产⽣式表⽰⽤“IF-THEN ”的形式表⽰知识,这种表⽰与⼈类的判断性知识基本⼀致,直观,⾃然,便于推理;除了对系统的总体结构、各部分互相作⽤的⽅式及规则的表⽰形式有明确规定以外,对系统的其他实现细节都没有具体规定,这是设计者们在开发实⽤系统时具有较⼤灵活性,可以根据需求采⽤适当的实现技术,特别是可以把对求解问题有意义的各种启发式知识引⼊到系统中;表⽰的格式固定,形式单⼀,规则间相互独⽴,整个过程只是前件匹配,后件动作。
匹配提供的信息只有成功与失败,匹配⼀般⽆递归,没有复杂的计算,所以系统容易建⽴;由于规则库中的知识具有相同的格式,并且全局数据库可以被所有的规则访问,因此规则可以被统⼀处理;模块性好,产⽣式规则是规则中最基本的知识单元,各规则之间只能通过全局数据量发⽣联系,不能互相调⽤,增加了规则的模块性,有利于对知识的增加、删除和修改;产⽣式表⽰法既可以表⽰确定的知识单元,⼜可以表⽰不确定性知识;既有利于表⽰启发式知识,⼜可以⽅便地表⽰过程性知识;既可以表⽰领域知识,⼜可以表⽰元知识。
但是,产⽣式规则表⽰法也存在着下列缺点:推理效率低下:由于规则库中的知识都有统⼀格式,并且规则之间的联系必须以全局数据库为媒介,推理过程是⼀种反复进⾏的“匹配--冲突消除--执⾏”的过程。
⽽且在每个推理周期,都要不断地对全部规则的条件部分进⾏搜索和模式匹配,从原理上讲,这种做法必然会降低推理效率,⽽且随着规模数量的增加,效率低的缺点会越来越突出,甚⾄会出现组合爆炸问题。
程序性知识的表征形式程序性知识的表征形式(1)产⽣式⽇常活动中通常包含着⼀些决策,⽐如:如果⼝渴,我就找⽔喝;如果学习累了,就听听⾳乐调节⼀下;考试中如果不知道这道题的答案,就先放下它做下⾯的题……做出这些决策时,通常需要先确定当时的情境和条件,然后采取相应的⾏动。
认知⼼理学家称这些“条件—⾏动”规则为产⽣式(production),它表明了所要进⾏的活动以及发⽣这种活动的条件,是程序性知识的基本单元。
表7-2为产⽣式的⼏个样例,其中第⼀个是使⽤强化程式的产⽣式,第⼆个是对三⾓形进⾏分类的产⽣式,第三个是表⽰⼈观看房内东西的产⽣式。
表7-2 ⽤产⽣式表征的程序性知识样例从表7-2可见,⼀个产⽣式从内容上看,包含条件部分和⾏动部分;从形式上看,包含如果(If)部分和那么(Then)部分。
If部分规定了要执⾏⼀系列特定的⾏动必须满⾜或必须存在的条件,Then部分列出了在符合这些条件时将要执⾏或激活的⾏动。
⼀个产⽣式的语句越多,表明这⼀产⽣式越复杂。
对产⽣式作仔细考察可发现,它具有如下⼀些特点。
⾸先,产⽣式的条件部分可分为内部条件和外部条件,⾏动部分也可分为内部⾏动和外部⾏动。
如在表7-2的“使⽤强化”这⼀产⽣式中,第⼀个条件为个⼈⽬的,它属于个体内部的条件,不能为别⼈所看到或认同;但第⼆个条件则存在于个体的外部,别⼈既可观察到也可认同。
在表7-2的“鉴别三⾓形”这⼀产⽣式中,第⼀个⾏动属于个体内部的⼼理活动,即此时个体对看到的特定图形作出某种⼼理表述(分类);⽽第⼆个⾏动“说出‘三⾓形’”则属于外部⾏动,即个体向环境输出某种信息。
认知⼼理学家对产⽣式中的内外条件和内外⾏动作出区分,是为了便于提出⼀些仅含内部条件及仅含内部⾏动的产⽣式规则。
也就是说,有些产⽣式只负责处理不可观察的内⼼活动。
当我们将⼀系列这类产⽣式连接起来,就有可能模拟⼈在从事复杂认知活动(如问题解决、阅读理解等)时的⼀系列⼼理步骤。
可以认为,产⽣式为描述⼈的内部认知活动提供了⼀种有⼒的⼿段。
一、知识表示
1、知识表示的目的知识表示的重要性(为什么要研究知识表示?)
通过知识的有效表示,使人工智能程序能利用这些知识做出决策、制定计划、识别状况、分析事件以及获取结论等。
知识表示不仅是人工智能的重要研究内容,而且已经形成了一个独立的子领域(知识工程)。
2、什么是知识表示?
知识表示是知识的符号化过程
知识表示是选择合适的形式表示知识
知识表示就是将知识编码成一种适当的数据结构
3、知识的概念
4、知识的类型
5、知识表示方法
第一:利用自然语言表示知识可以吗?
困难之处:1)自然语言的二义性;2)不能很好地描述自然语言的语法和语义;3)自然语言的句子结构缺乏一致性
第二:以前用过哪些知识表示方法
1)记录和数据库系统
2)高级程序设计语言提供的数据结构:整数、实数、字符、数组、记录、指针等。
每一种语言都有自己的语法规则。
第三:如何衡量知识表示方法的优劣?
二、产生式表示法与产生式系统
(一)实验内容和目的
1. 熟悉和掌握产生式系统的运行机制;
2. 掌握基于产生式系统的正向推理的基本方法。
3. 系统可以识别老虎、金钱豹、斑马、长颈鹿、企鹅、信天翁这6种
动物。
其规则库包含15条规则
(二)实验要求
1. 能根据输入的动物特征判断是那种动物或给出相应的回答,如果根据
初始输入的动物特征不能判断,则可以动态由用户增加新动物特征来
判断属于那种动物---第一种方法
2. 能根据输入的动物特征判断是那种动物或给出相应的回答,如果根据
初始输入的动物特征不能判断,则可以向用户提示所要识别的动物是
否具有某种特征,然后根据用户的回答继续判断属于哪种动物----第二
种方法
3. 使用C++,VC6.0编程
(三)界面要求
1、提示用户可以识别的动物以及可以输入的动物特征
2、如果有没有使用的规则,则提示用户输入新动物特征(两种方法)
3、显示最后判断出的动物名称或者本系统不能识别这种动物
4、显示解决问题的路径(规则序列)
5、界面美观实用
(四)算法设计
1、如何实现规则库和综合数据库的建立
2、正向推理过程中如何实现规则的匹配、规则的选择(冲突解决策略),
即控制系统的具体实现方法(P39)要求采用两种以上的冲突解决策
略。
(五)实验设计与结果分析
1、设计实验,分析所采用的冲突解决策略的优缺点(根据解决问题的路
径分析、综合分析)
2、设计实验,比较实验要求中,新输入动物特征的两种实现方方法的异
同。
(六)系统改进方案设计
1、能否使系统具有动态增加新规则的功能,使其更符合实际情况
2、其它
(七)实验报告内容与要求
1、介绍算法设计思想(包括第四部分的内容)
2、关键代码说明
3、实验设计与结果分析(包括第五部分的内容)
4、分析界面的优缺点
规则排序、就近排序。