第八章粗糙集决策方法

格式：ppt
大小：1.29 MB
文档页数：67

下载文档原格式

粗糙集

例
对于上表来说，U中有四个对象（概念），而现在条件集合中只有一个属性，对于U1和U2来说，它们的p不同所以可以通过p来区分，即u1,u2在p 下可区分；而U2和U3虽然是不同的对象但是在P 下却是相同的，即在p下不可区分，就成为不可区分
粗糙集：
一个集合若恰好等于基本集的任意并集称为一个清晰（crisp）集（精确集），否则称为粗糙（rough）集（不精确集）。解释：都可区分的是清晰集，有不可区分的对象为粗糙集主要特点:以不完全信息或知识去处理一些不分明现象的能力,或依据观察、度量到的某些不精确的结果而进行分类数据的能力. 粗糙集体现了集合中元素间的不可区分性. 主要优势:它不需要提供问题所需处理的数据集合之外的任何先验知识,而且与处理其它不确定性问题的理论有很强的互补性.
粗糙集理论所处理的问题
•不确定或不精确知识的表达; •经验学习并从经验中获取知识; •不一致信息的分析; •根据不确定,不完整的知识进行推理; •在保留信息的前提下进行数据化简; •近似模式分类; •识别并评估数据之间的依赖关系
三、粗糙集的应用
粗糙集理论在许多领域得到了应用： ①临床医疗诊断；
②电力系统和其他工业过程故障诊断；
3. 如果P中的任何一条属性都是不可简约的，那么就称P是独立的解释：P是独立的说明P中的任何一个属性都是必不可少的，它独立的表达一个系统分类的特征。
属性约简的算法分析：
初始状态：所有数据已存入数据库(以下为模拟数据)
u 1 2 3 4 5 6
a 1 1 0 1 1 2
b 0 0 0 1 1 1
集合O 的下逼近(即正区) 为 I 3 (O ) = PO S (O ) = {刘保,赵凯} 集合O 的负区为 N EG (O ) = {李得} 集合O 的边界区为 BND (O ) = {王治, 马丽} 集合O 的上逼近为 I 3 (O ) = PO S (O ) + BND (O ) = {刘保,赵凯,王治,马丽} 根据表1, 可以归纳出下面几条规则, 揭示了教育程度与是否能找到好工作之间的关 RUL E 1: IF (教育程度= 大学) OR (教育程度= 博士) THEN (可以找到好工作) RUL E 2: IF (教育程度= 小学) THEN (找不到好工作) RUL E 3: IF (教育程度= 高中) THEN (可能找到好工作)

粗糙集理论

1995年，ACM Communication将其列为新浮现的计算机科学的研究课题。
研究背景（续）
1998年，国际信息科学杂志（Information Sciences）为粗糙集理论的研究出了一期专辑[2，3]。第一届中国RS理论与软计算学术研讨会，于2001年5月在重庆举行。第二届中国RS理论与软计算学术研讨会，于2002年10月在苏州大学举行。第三届中国RS理论与软计算学术研讨会，于2003年8月在重庆举行。第四届中国RS理论与软计算学术研讨会，将于2004年在舟山举行。

， card X表X的基数。
可被用作Rough逻辑中的算子。
粗糙集的几种表示（续）
④在Rough集上也有元素隶属于集合的问题（与Fuzzy 集一样）。 X U 设，
card X x R x ，则 card xR
R X
0 X x 1 。

粗糙集的几种表示（续）
③
R X
card apr X card apr X

称 R (X )为X的近似精度， 0 R X 1 （粗糙程度。于是也可用 R (X ) 来定义Rough集。当 R X 1 ，称U上子集X关于U上不分明关系R是 Rough的；当 R X 1 ，称X关于R是精确的；
，
则X关于R是精确的。
相反地，Rough隶属函数可用来定义一个集合的上、下近似集及边界集
R apr X x U , X x 1
X U

R apr X x U , X x 0

R bn X x U ,0 X

粗糙集

分辨矩阵与分辨函数

由于应用之前粗糙集理论对知识系统进行约简计算量过于巨大，所以我们引入分辨矩阵与分辨函数来对知识系统进行约简
设S=(U,R,V,f)为一信息系统，R=C∪D是属性集合，自己C={ai|i=1,2,...,m} 和D={d}分别为条件属性集合决策属性集，U={x1,x2,...,xn}为论域，ak(xj) 是样本xj在属性ak上的取值。定义系统的分辨矩阵为M(S)=[mi的扩展模型

用属性相似关系代替等价关系
定义Sa(vi,vj)=1-|vi-vj|/|amax-amin|称为属性相似度，指定a的相似阈值为t(a), 当Sa(vi,vj)≥t(a)时认为vi,vj在属性a上相似。

可变精度粗糙模型
定义
1 Card ( X Y ) / Card ( X ) Card ( X ) 0 C( X , Y ) 0 Card ( X ) 0
属性值的离散化

用粗糙集进行数据处理具有无需先验知识，可从数据中获取知识生成决策规则的优点，然而由于其对应的数据应该是分散的，所以应用粗糙集处理连续型数据需要先进行离散化处理，而数据处理的结果也会对运用粗糙集处理数据的结果的精度产生影响。下面介绍几种离散化算法。
（1）等距离划分法：在每个属性上，根据用户给定的参数来把属性值简单的划分为距离相等的断点段，不考虑每个断点段中属性值个数的多少。假设某个属性的最大数属性值为xmax，最小属性值为xmin，用户给定的参数为k，则断点间隔为δ=（xmax-xmin）/k,为此得到此属性上的断点为xmin+iδ,i=0,1,...,k。这些断点间距离相等。
f M ( S ) {mij ,1 i, j n, mij }

基于粗糙集的决策方法及其在房地产预测中的应用

基于粗糙集的决策方法及其在房地产预测中的应用[摘要] 利用差别矩阵的差别元素的重要度的思想给出了信息系统属性的重要度,然后利用该重要度给出了信息系统中属性的权重,再由属性的权重给出了将信息系统转化成决策机构表的方法。

在此基础上,利用正区域的大小作为属性选择标准,给出决策树的生成算法。

将该算法运用到产品销售预测过程中,获取了一些较合理的简洁规则。

[关键词] 决策树;粗糙集;决策表;正区域1引言自从Quinlan[1,2]介绍了ID3算法以来,学者围绕该算法进行了十分广泛的研究。

ID3算法的核心是在决策树中各级节点上选择属性,用信息增益作为属性选择标准,使得生成的决策树平均深度较小,提高分类速度和准确率。

但是ID3算法本身也存在很多不足。

由波兰学者Z.Pawlak教授提出的粗糙集模型[3-5]是分析不完整、不精确信息系统的有力工具。

近年来,该模型在机器学习、数据挖掘、人工神经网络等多个领域得到了广泛的应用。

一些学者将粗糙集理论引入决策树,提出了基于粗糙集的决策树生成算法[6,7]。

在基于粗糙集的决策树生成算法中,通常用粗糙边界的大小或正区域的大小作为属性选择标准,利用ID3算法的思想递归生成决策树。

由于基于粗糙集的决策树生成算法具有理解直观、计算简单等优点,引起许多学者的关注。

在实际的数据中,有许多数据表中没有决策属性,但又要求我们从这些数据中挖掘出带有决策属性的决策规则,利用基于粗糙集的决策树生成算法生成更简洁的规则。

在此基础上,设计了一个基于粗糙集的决策规则算法,并将该算法运用到房地产信息中,获取一些较合理的简洁规则。

2属性的权重定义为了分析相关工作,我们先引入如下的基本概念。

定义1[3]一个信息系统定义为:S = (U,C,V,f),其中U = {x1,x2,…,xn｝是论域;C 为条件属性集; f:U × C → V 是信息函数,其中V = ∪Va,a∈C,Va表示属性a的值域。

每一个属性子集P?哿C决定了一个二元不可区分关系IND(P):IND(P) = {(x,y)∈U × U|?坌a∈P,f(x,a) = f(y,a)｝关系IND(P)构成了U 的一个划分,用U/IND(P)表示,简记为U/P = {P1,P2,…,Pk｝,U/P中的任何元素Pi = [x]P = {y|?坌a∈P,f(x,a) = f(y,a)｝称为等价类。

粗糙集合

什么是粗糙集合粗糙集理论及其应用摘要在很多实际系统中均不同程度地存在着不确定性因素, 采集到的数据常常包含着噪声,不精确甚至不完整. 粗糙集理论是继概率论,模糊集,证据理论之后的又一个处理不确定性的数学工具. 作为一种较新的软计算方法, 粗糙集近年来越来越受到重视, 其有效性已在许多科学与工程领域的成功应用中得到证实, 是当前国际上人工智能理论及其应用领域中的研究热点之一. 本文介绍了粗糙集理论的基本概念,特点及有关应用.关键词粗糙集, 不确定性, 数据分析, 软计算1 引言在自然科学,社会科学和工程技术的很多领域中, 都不同程度地涉及到对不确定因素和对不完备( imperfect) 信息的处理. 从实际系统中采集到的数据常常包含着噪声, 不够精确甚至不完整. 采用纯数学上的假设来消除或回避这种不确定性, 效果往往不理想, 反之, 如果正视它,对这些信息进行合适地处理, 常常有助于相关实际系统问题的解决. 多年来, 研究人员一直在努力寻找科学地处理不完整性和不确定性的有效途径. 模糊集和基于概率方法的证据理论是处理不确定信息的两种方法, 已应用于一些实际领域. 但这些方法有时需要一些数据的附加信息或先验知识, 如模糊隶属函数,基本概率指派函数和有关统计概率分布等, 而这些信息有时并不容易得到. 1982 年, 波兰学者Z. Paw lak 提出了粗糙集理论, 它是一种刻划不完整性和不确定性的数学工具, 能有效地分析不精确,不一致( incon sisten t),不完整( incomp lete) 等各种不完备的信息, 还可以对数据进行分析和推理, 从中发现隐含的知识, 揭示潜在的规律. 粗糙集理论是建立在分类机制的基础上的, 它将分类理解为在特定空间上的等价关系, 而等价关系构成了对该空间的划分.粗糙集理论将知识理解为对数据的划分, 每一被划分的集合称为概念.粗糙集理论的主要思想是利用已知的知识库, 将不精确或不确定的知识用已知的知识库中的知识来(近似) 刻画.该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确或不确定原始数据的机制, 所以这个理论与概率论, 模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性.本文简要介绍了粗糙集理论的基本概念和实际应用.2 粗糙集的理论2. 1 粗糙集理论的产生和发展在本世纪70 年代, 波兰学者Z. Paw lak 和一些波兰科学院,波兰华沙大学的逻辑学家们,一起从事关于信息系统逻辑特性的研究. 粗糙集理论就是在这些研究的基础上产生的. 1982年, Z. Paw lak 发表了经典论文Rough Set s , 宣告了粗糙集理论的诞生. 此后, 粗糙集理论引起了许多数学家,逻辑学家和计算机研究人员的兴趣, 他们在粗糙集的理论和应用方面作了大量的研究工作.1991 年Z. Paw lak 的专著和1992 年应用专集的出版, 对这一段时期理论和实践工作的成果作了较好的总结, 同时促进了粗糙集在各个领域的应用. 此后召开的与粗糙集有关的国际会议进一步推动了粗糙集的发展. 越来越多的科技人员开始了解并准备从事该领域的研究. 目前, 粗糙集已成为人工智能领域中一个较新的学术热点, 在机器学习,知识获取,决策分析,过程控制等许多领域得到了广泛的应用.2. 2 粗糙集理论所处理的问题粗糙集能有效地处理下列问题:·不确定或不精确知识的表达;·经验学习并从经验中获取知识;·不一致信息的分析;·根据不确定,不完整的知识进行推理;·在保留信息的前提下进行数据化简;·近似模式分类;·识别并评估数据之间的依赖关系2. 3 粗糙集理论的一些基本概念2. 3. 1 知识的含义"知识"这个概念在不同的范畴内有多种不同的含义. 在粗糙集理论中,"知识"被认为是一种分类能力. 人们的行为是基于分辨现实的或抽象的对象的能力, 如在远古时代, 人们为了生存必须能分辨出什么可以食用, 什么不可以食用; 医生给病人诊断, 必须辨别出患者得的是哪一种病. 这些根据事物的特征差别将其分门别类的能力均可以看作是某种"知识".2. 3. 2 不可分辨关系与基本集分类过程中, 相差不大的个体被归于同一类, 它们的关系就是不可分辨关系( indiscernability relation). 假定只用两种黑白颜色把空间中的物体分割两类, {黑色物体},{白色物体},那么同为黑色的两个物体就是不可分辨的, 因为描述它们特征属性的信息相同, 都是黑色. 如果再引入方,圆的属性, 又可以将物体进一步分割为四类: {黑色方物体},{黑色圆物体},{白色方物体},{白色圆物体}. 这时, 如果两个同为黑色方物体, 则它们还是不可分辨的. 不可分辨关系也称为一个等效关系(equivalence relationship ) , 两个白色圆物体间的不可分辨关系可以理解为它们在白,圆两种属性下存在等效关系.基本集(elementary set) 定义为由论域中相互间不可分辨的对象组成的集合, 是组成论域知识的颗粒. 不可分辨关系这一概念在粗糙集理论中十分重要, 它深刻地揭示出知识的颗粒状结构, 是定义其它概念的基础. 知识可认为是一族等效关系, 它将论域分割成一系列的等效类.2. 3. 3 集合的下逼近,上逼近及边界区粗糙集理论延拓了经典的集合论, 把用于分类的知识嵌入集合内, 作为集合组成的一部分. 一个对象a 是否属于集合X 需根据现有的知识来判断, 可分为三种情况: (1) 对象a 肯定属于集合X ; (2) 对象a 肯定不属于集X ; (3) 对象a 可能属于也可能不属于集合X . 集合的划分密切依赖于我们所掌握的关于论域的知识, 是相对的而不是绝对的.给定一个有限的非空集合U 称为论域, I 为U 中的一族等效关系, 即关于U 的知识, 则二元对K = (U , I ) 称为一个近似空间(approximation space). 设x 为U 中的一个对象, X为U 的一个子集, I (x ) 表示所有与x 不可分辨的对象所组成的集合, 换句话说, 是由x 决定的等效类, 即I (x ) 中的每个对象都与x 有相同的特征属性(attribute).集合X 关于I 的下逼近(Lower approximation) 定义为:I* (X ) = {x ∈U : I (x ) I *(X ) 实际上由那些根据现有知识判断肯定属于X 的对象所组成的最大的集合, 有时也称为X 的正区(po sit ive region) , 记作PO S (X ). 类似地, 由根据现有知识判断肯定不属于X 的对象组成的集合称为X 的负区(negat ive region) , 记作N EG (X ).集合X 关于I 的上逼近(U pper app rox im at ion) 定义为I3 (X ) = {x ∈U : I (x ) ∩ X ≠ 5 } (2)I3 (X ) 是由所有与X 相交非空的等效类I (x ) 的并集, 是那些可能属于X 的对象组成的最小集合. 显然, I3 (X ) + N EG (X ) = 论域U.集合X 的边界区(Boundary region) 定义为BND (X ) = I3 (X ) - I 3 (X ) (3)BND (X ) 为集合X 的上逼近与下逼近之差. 如果BND (X ) 是空集, 则称X 关于I 是清晰的(crisp ) ; 反之如果BND (X ) 不是空集, 则称集合X 为关于I 的粗糙集( rough set). 下逼近,上逼近及边界区等概念称为可分辨区(discern ib ility region s) , 刻划了一个边界含糊(vague) 集合的逼近特性. 粗糙程度可按按下式的计算A1= I 3 (X ) I3 (X ) , (4)式中# 表示集合# 的基数或势(cardinality) , 对有限集合表示集合中所包含的元素的个数.显然0≤A1 (X ) ≤1, 如果A1 (X ) = 1, 则称集合X 相对于I 是清晰(crisp ) 的, 如果A1 (X ) 0} (7)BND (X ) = {x ∈U : 0 < LIX(x ) < 1} (8)从上面的定义中, 可以看出粗糙集理论中"含糊"(vague) 和"不确定"(uncertain ty) 这两个概念之间的关系:"含糊"用来描述集合, 指集合的边界不清楚; 而"不确定"描述的是集合中的元素, 指某个元素是否属于某集合是不确定的.2. 4 实例下面用一个具体的实例说明粗糙集的概念. 在粗糙集中使用信息表( info rm at ion tab le) 描述论域中的数据集合. 根据学科领域的不同, 它们可能代表医疗,金融,军事,过程控制等方面的数据. 信息表的形式和大家所熟悉的关系数据库中的关系数据模型很相似, 是一张二维表1 期韩祯祥等: 粗糙集理论及其应用391995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.格, 如表一所示. 表格的数据描述了一些人的教育程度以及是否找到了较好工作, 旨在说明两者之间的关系. 其中王治,马丽, 赵凯等称为对象(objects) , 一行描述一个对象. 表中的列描述对象的属性. 粗糙集理论中有两种属性: 条件属性(condition attribute) 和决策属性(decision attribute). 本例中"教育程度"为条件属性;"是否找到了好工作"为决策属性.表1 教育程度与是否找到好工作的关系姓名教育程度是否找到了好工作王治高中否马丽高中是李得小学否刘保大学是赵凯博士是设O 表示找到了好工作的人的集合, 则O = {马丽, 刘保, 赵凯}, 设I 表示属性"教育程度"所构成的一个等效关系, 根据教育程度的不同, 该论域被分割为四个等效类: {王治, 马丽},{李得},{刘保},{赵凯}. 王治和马丽在同一个等效类中, 他们都为高中文化程度, 是不可分辨的. 则:集合O 的下逼近(即正区) 为I 3 (O ) = PO S (O ) = {刘保,赵凯}集合O 的负区为N EG (O ) = {李得}集合O 的边界区为BND (O ) = {王治, 马丽}集合O 的上逼近为I 3 (O ) = PO S (O ) + BND (O ) = {刘保,赵凯,王治,马丽}根据表1, 可以归纳出下面几条规则, 揭示了教育程度与是否能找到好工作之间的关系.RUL E 1: IF (教育程度= 大学) OR (教育程度= 博士) THEN (可以找到好工作)RUL E 2: IF (教育程度= 小学) THEN (找不到好工作)RUL E 3: IF (教育程度= 高中) THEN (可能找到好工作)从这个简单的例子中, 我们还可以体会到粗糙集理论在数据分析,寻找规律方面的作用.3 粗糙集理论的特点3. 1 粗糙集是一种软计算方法软计算(soft computing) 的概念是由模糊集创始人Zadeh[ 9 ]提出的. 软计算中的主要工具包括粗糙集,模糊逻辑(FL ),神经网络(NN ),_________概率推理(PR ),信度网络(Belief N etwo rk s), 遗传算法(GA ) 与其它进化优化算法,混沌(Chao s) 理论等. 传统的计算方法即所谓的硬计算(hard computing) , 使用精确, 固定和不变的算法来表达和解决问题. 而软计算的指导原则是利用所允许的不精确性,不确定性和部分真实性以得到易于处理,鲁棒性强和成本较低的解决方案, 以便更好地与现实系统相协调.3. 2 粗糙集理论的特点粗糙集方法的简单实用性是令人惊奇的, 它能在创立后的不长时间内得到迅速应用是因为具有以下特点[ 6～8 ]:(1) 它能处理各种数据, 包括不完整( incomplete) 的数据以及拥有众多变量的数据;(3) 它能处理数据的不精确性和模棱两可(ambiguity) , 包括确定性和非确定性的情况;(4) 它能求得知识的最小表达( reduct) 和知识的各种不同颗粒(granularity) 层次;(5) 它能从数据中揭示出概念简单, 易于操作的模式(pattern) ;(6) 它能产生精确而又易于检查和证实的规则, 特别适于智能控制中规则的自动生成.40 信息与控制27 卷1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.4 粗糙集理论的应用粗糙集理论是一门实用性很强的学科, 从诞生到现在虽然只有十几年的时间, 但已经在不少领域取得了丰硕的成果, 如近似推理,数字逻辑分析和化简,建立预测模型,决策支持,控制算法获取,机器学习算法和模式识别等等. 下面介绍一下粗糙集应用的几个主要领域.4. 1 人工神经网络训练样本集化简人工神经网络具有并行处理,高度容错和泛化能力强的特点, 适合应用在预测,复杂对象建模和控制等场合. 但是当神经网络规模较大,样本较多时, 训练时间过于漫长, 这个固有缺点是制约神经网络进一步实用化的一个主要因素. 虽然各种提高训练速度的算法不断出现, 问题远未彻底解决. 化简训练样本集, 消除冗余数据是另一条提高训练速度的途径. [ 10 ]正是沿着这条思路, 应用粗糙集化简神经网络训练样本数据集, 在保留重要信息的前提下消除了多余(superfluous) 的数据. 仿真实验表明训练速度提高了4. 77 倍, 获得了较好的效果.4. 2 控制算法获取中有很多复杂对象难于建立严格的数学模型, 这样传统的基于数学模型的控制方法就难以奏效. 模糊控制模拟人的模糊推理和决策过程, 将操作人员的控制经验总结为一系列语言控制规则, 具有鲁棒性和简单性的特点, 在工业控制等领域发展较快. 但是有些复杂对象的控制规则难以人工提取, 这样就在一定程度上限制了模糊控制的应用.粗糙集能够自动抽取控制规则的特点为解决这一难题提供了新的手段. 一种新的控制策略—模糊- 粗糙控制(fuzzy2rough control) 正悄然兴起, 成为一个有吸引力的发展方向. 应用这种控制方法, 文[11 ]研究了"小车—倒立摆系统"这一经典控制问题, 文[12 ]研究了过程控制(水泥窑炉) , 均取得了较好的控制效果. 应用粗糙集进行控制的基本思路是: 把控制过程的一些有代表性的状态以及操作人员在这些状态下所采取的控制策略都记录下来, 然后利用粗糙集理论处理这些数据, 分析操作人员在何种条件下采取何种控制策略, 总结出一系列控制规则:规则1 IF Condit ion 1 满足THEN 采取decision 1规则2 IF Condit ion 2 满足THEN 采取decision 2规则3 IF Condit ion 3 满足THEN 采取decision 3这种根据观测数据获得控制策略的方法通常被称为从范例中学习( learning from examples). 粗糙控制( rough control) 与模糊控制都是基于知识, 于规则的控制, 但粗糙控制更加简单迅速,实现容易(因为粗糙控制有时可省却模糊化及去模糊化步骤) ; 另一个优点在于控制算法可以完全来自数据本身, 所以从软件工程的角度看, 其决策和推理过程与模糊(或神经网络) 控制相比可以很容易被检验和证实(validate). 文[ 11 ]还指出在特别要求控制器结构与算法简单的场合, 更适合采取粗糙控制. 美国电力科学研究院(EPR I) 对粗糙集的应用研究的潜力对十分重视, 将其作为战略性研究开发(Strategy R&D) 项目, 在1996 年拨款196, 600 资助San Jo se 州立大学进行电力系统模糊- 粗糙控制器的研究.1 期韩祯祥等: 粗糙集理论及其应用411995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.4. 3 决策支持系统面对大量的信息以及各种不确定因素, 要作出科学,合理的决策是非常困难的. 决策支持系统是一组协助制定决策的工具, 其重要特征就是能够执行IF THEN 规则进行判断分析. 粗糙集理论可以在分析以往大量经验数据的基础上找到这些规则, 基于粗糙集的决策支持系统在这方面弥补了常规决策方法的不足, 允许决策对象中存在一些不太明确,不太完整的属性, 并经过推理得出基本上肯定的结论. 下面举一个例子, 说明粗糙集理论可以根据以往的病例归纳出诊断规则, 帮助医生作出判断. 表二描述了八个病人的症状. 从表二中可以归纳出以下几条确定的规则:表2 症状与感冒的关系病人编号病理症状诊断结果是否头痛体温是否感冒病人1 是正常否病人2 是高是病人3 是很高是病人4 否正常否病人5 否高否病人6 否很高是病人7 否高是病人8 否很高否1. IF (体温正常) THEN (没感冒)2. IF (头痛) AND (体温高) THEN (感冒)3. IF (头痛) AND (体温很高) THEN (感冒)还有几条可能的规则:4. IF (头不痛) THEN (可能没感冒)5. IF (体温高) THEN (可能感冒了)6. IF (体温很高) THEN (可能感冒了)病人 5 和病人7, 病人 6 和病人8, 症状相同, 但是一个感冒另一个却没感冒, 这种情况称为不一致( inconsistent). 粗糙集就是靠这种IF THEN 规则的形式表示数据中蕴含的知识. 希腊工业发展银行ETEV A 用粗糙集理论协助制订信贷政策, 从大量实例中抽取出的规则条理清晰, 得到了金融专家的好评[ 13 ].4. 4 从数据库中知识发现现代社会中, 随着信息产业的迅速发展, 大量来自金融,医疗,科研等不同领域的信息被存储在数据库中. 这些浩如烟海的数据间隐含着许多有价值的但鲜为人知的相关性, 例如股票的格和一些经济指数有什么关系; 手术前病人的病理指标可能与手术是否成功存在某种联系; 满足何种条件的夜空会出现彗星等天文现象等等. 由于数据库的庞大, 人工处理这些数据几乎是不可能的, 于是出现了一个新的研究方向—数据库中的知识发现(Knowledge Discovery in Databases, KDD) , 也叫做数据库(信息) 发掘(Mining) , 它是目前国际上人工智能领域中研究较为活跃的分支. 粗糙集是其中的一种重要的研究方法, 它采用的信息表与关系数据库中的关系数据模型很相似, 这样就便于将基于粗糙集的算法嵌入数据库管理系统中. 粗糙集引入核(core),化简( reduct) 等有力的概念与方法, 从数据中导出用IF THEN 规则形式描述的知识, 这些精练的知识更便于存储和使用. 美国医学工作者应用粗糙集理论对大量的病历进行分析, 发现黑人妇女患乳腺癌后的死亡率比白人妇女高. 到目前为止, 早产的预测在医学上还是比较困难的. 现有的人工预测方法准确率只有17% - 58% , 而应用粗糙集理论则可将准确率提高到68% - 90% [ 8 ].42 信息与控制27 卷1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.5 粗糙集与模糊集,证据理论及其它一些情况5. 1 粗糙集与模糊集,证据理论粗糙集与模糊集都能处理不完备( imperfect) 数据, 但方法不同, 模糊集注重描述信息的含糊(vagueness) 程度, 粗糙集则强调数据的不可辩别( indiscernibility) , 不精确( imprecision) 和模棱两可(ambiguity). 使用图像处理中的语言来作比喻, 当论述图像的清晰程度时, 粗糙集强调组成图像象素的大小, 而模糊集则强调象素存在不同的灰度. 粗糙集研究的是不同类中的对象组成的集合之间的关系, 重在分类; 模糊集研究的是属于同一类的不同对象的隶属的关系, 重在隶属的程度. 因此粗糙集和模糊集是两种不同的理论, 但又不是相互对立的, 它们在处理不完善数据方面可以互为补充.粗糙集理论与证据理论虽有一些相互交叠的地方, 但本质不同, 粗糙集使用集合的上,下逼近而证据理论使用信任函数(belief function) 作为主要工具. 粗糙集对给定数据的计算是客观的, 无须知道关于数据的任何先验知识(如概率分布等) , 而证据理论则需要假定的似然值(plausibility).5. 2 近年来召开的与粗糙集有关的国际会议相继召开的以粗糙集理论为主题的国际会议, 促进了粗糙集理论的推广. 这些会议发表了大量的具有一定学术和应用价值的论文, 方便了学术交流, 推动了粗糙集在各个科学领域的拓展和应用. 下面列出了近年召开的一些会议:· 1992 年第一届国际研讨会(Rough Set s: State of the Art and Perspectives) 在波兰Kiekrz 召开;·1993 年第二届国际研讨会(The Second International Work shop on Rough Set s and Know ledge Discovery, RSKD'93) 在加拿大Banff 召开;·1994 年第三届国际研讨会(The Third International Workshop on Rough Set s and Soft Computing, RSSC'94) 在美国San Jo se 召开;·1995 年在美国North Carolina 召开了题为"Rough Set Theo ry, RST'95"的国际会议;·1996 年第四届国际研讨会(The Fou rth In ternat ionalWo rk shop on Rough Set s, Fuzzy Set s, and Machine Discovery, RSFD'96) 在日本东京召开;·1997 年3 月在美国North Carolina 召开了第五届国际研讨会(The Fifth International Workshop on Rough Set s and Soft Computing, RSSC'97)5. 3 国际上一些有关粗糙集的软件目前, 国际上研究粗糙集的机构和个人开发了一些应用粗糙集的实用化软件, 也出现了商业化的软件. 加拿大Reduct System Inc. 公司开发的用于数据库知识发现的软件DataLogic R [ 14 ]是用C 语言开发的, 可安装在个人计算机上, 为科研领域和工业界服务.美国肯萨斯大学开发了一套基于粗糙集的经验学习系统[ 15 ] , 名为L ERS (Learning from Examples based on Rough Sets) , 它能从大量经验数据中抽取出规则. L ERS 已被美国国家航空航天管理局(NA SA) 的约翰逊(John son) 空间中心采用, 作为专家系统开发工具, 为"自由号"(Freedom ) 空间站上的医疗决策服务. 美国环境保护署(U S Environmental Protection Agency) 资助的一个项目中也采用了L ERS.波兰波兹南工业大学(Poznan University of Technology) 开发的软件RoughDA S 和1 期韩祯祥等: 粗糙集理论及其应用431995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.RoughClass, 也在不少实际领域中得到应用[ 5 ].加拿大Regina 大学开发的KDD- R 是用C 编写的, 在UN IX 环境下运行, KDD2R 基于变精度粗糙集模型[ 16 ] (V ariable Precision Rough Set, V PRS) , 通过改变粗糙程度而使数据中隐含的模式更清楚的显示出来.6 结束语粗糙集是一种较有前途的处理不确定性的方法, 相信今后将会在更多的领域中得到应用. 但是, 粗糙集理论还处在继续发展之中, 正如粗糙集理论的创立人Z. Pawlak 所指出的那样[ 8 ] , 尚有一些理论上的问题需要解决, 诸如用于不精确推理的粗糙逻辑(Rough logic) 方法, 粗糙集理论与非标准分析(Non standard analysis) 和非参数化统计(Nonparametric statistics) 等之间的关系等等. 将粗糙集与其它软计算方法(如模糊集,人工神经网络,遗传算法等) 相综合, 发挥出各自的优点, 可望设计出具有较高的机器智商(M IQ ) 的混合智能系统(Hybrid Intelligent System ) , 这是一个值得努力的方向.粗糙集理论介绍面对日益增长的数据库，人们将如何从这些浩瀚的数据中找出有用的知识？我们如何将所学到的知识去粗取精？什么是对事物的粗线条描述什么是细线条描述？粗糙集合论回答了上面的这些问题。

粗糙集 (ppt)

一、概述二、知识分类三、知识的约简四、决策表的约简五、粗糙集的扩展模型六、粗糙集的实验系统七、粒度计算简介
2
一、概述
现实生活中有许多含糊现象并不能简单地用真、假值来表示﹐如何表示和处理这些现象就成为一个研究领域。早在1904年谓词逻辑的创始人G.Frege就提出了含糊(Vague) 一词，他把它归结到边界线上，也就是说在全域上存在一些个体既不能在其某个子集上分类，也不能在该子集的补集上分类。
12
Issues in the Decision Table
• The same or indiscernible objects may be represented several times. • Some of the attributes may be superfluous.
13
不可区分性Indiscernibility
二、知识分类
为数学处理方便起见，在下面的定义中用等价关系来代替分类。一个近似空间(approximate space)（或知识库）定义为一个关系系统（或二元组）
K=(U,R)
其中U（为空集）是一个被称为全域或论域(universe) 的所有要讨论的个体的集合，R是U上等价关系的一个族集。
7
二、知识分类
设PR，且P ，P中所有等价关系的交集称为P上的一种不可区分关系(indiscernbility relation) 记作IND(P)，即
[x]IND(p)= ∩[x]R RP 注意，IND(P)也是等价关系且是唯一的。
8
二、知识分类
给定近似空间K=(U, R)，子集XU称为U上的一个概念 (concept)，形式上，空集也视为一个概念；非空子族集 PR所产生的不可区分关系IND(P)的所有等价类关系的集合即U/IND(P)，称为基本知识(basic knowledge)，相应的等价类称为基本概念(basic concept)；特别地，若关系QR，则关系Q就称为初等知识(elementary knowledge)，相应的等价类就称为初等概念(elementary concept)。根据上述定义可知，概念即对象的集合，概念的族集（分类）就是U上的知识，U上分类的族集可以认为是U上的一个知识库，或说知识库即是分类方法的集合。

粗糙集基本知识PPT课件

数据挖掘过程中数据预处理占总过程的60%的时间，通过对数据降维，去噪，类型转换等处理，改进数据的质量，提高挖掘效率。
基于粗糙集的预处理方法对决策表进行属性约简，最后进行属性值的约简。
16
核
一个属性集可能有多个约简，属性集所有约简的交集定义为核。
核的概念有两方面意义：一是可以作为所有约简的计算基础（核包含于所有约简之中）；二是核在约简中是不可消去的特征集合。
体积小大小小小小大大
5
知识和知识库
U/R1={{x1,x3,x7},{x2,x4},{x5,x6,x8}} 等价类
U/R2={{x1,x5},{x2,x6},{x4,x3,x7,x8}} 等价关系R={R1，R2}
6
决策表
决策表为 T=<U, C∪D>
论域颜色
尺寸手感
u1 u2 u3 u4 u5
u1
acd
ad
u2
acd c abcd
u3
ad
u4
abd
u5
23
感谢您的阅读收藏，谢谢！
2021/4/8
24
13
约简理论
主要思想：保持分类能力不变的条件下，删除冗余的、不必要的属性或属性值，达到知识简化的目的。
14
示例:一种动物是否是鸟类
实例集群居会飞产卵肺哺呼乳吸会游鸟泳类
实例集
群居会飞产卵肺呼吸鸟类
1
N
Y
Y
NY
1,2,7
N
Y
Y
Y
NY Y
2
N
Y
Y
NY
3,4,5,6
Y
Y
Y

数据分析知识：如何进行数据分析的粗糙集方法

数据分析知识：如何进行数据分析的粗糙集方法随着大数据时代的到来，数据分析成为了企业发展的重要一环。

然而，未经处理的原始数据往往含有大量噪音和冗余信息，这使得数据分析变得极为困难。

为了解决数据分析中的这些问题，人们常常使用基于粗糙集理论的数据分析方法。

1.粗糙集理论粗糙集理论起源于1982年波兰数学家Pawlak的论文《使用近似概念代替集合的代价》。

它是一种描述不确定性知识的数学工具，能够通过“近似概念”来解释元素之间的关系。

粗糙集理论将数据分为决策属性和条件属性两个部分。

其中，决策属性是需要预测或决策的属性，而非决策属性是用来描述数据对象的一些特征的属性，相当于是可能对决策属性产生影响的因素。

因此，利用粗糙集理论可以筛选出对决策属性最有影响的条件属性，从而对数据进行深入的分析。

2.粗糙集方法使用粗糙集方法可以分为以下几个步骤：（1）特征选取。

选择适当的特征对数据进行筛选和提取，以提高特征的关联性和效用性。

（2）分级建立概念相似度视图。

根据特征进行数据分类，并建立概念相似度视图。

相似度度量方法有欧氏距离法、曼哈顿距离法、余弦相似度法等。

（3）计算近似概念。

根据相似度视图，对目标数据进行分类，计算每个分类子集的下近似概念和上近似概念。

（4）筛选条件属性。

根据牺牲精度和保存置信度的原则，对条件属性进行筛选。

（5）数据分析。

将筛选得到的条件属性用来分析数据特点和规律。

3.粗糙集方法的优势粗糙集方法具有以下几点优势：（1）不需要对数据进行预处理。

与其他方法相比，粗糙集方法不需要对数据进行预处理，可以直接用原始数据进行分析。

（2）能处理不确定性的数据。

由于决策属性是不确定的，粗糙集方法可以适用于处理不确定性较大的数据。

（3）适用于小数据集。

粗糙集方法不需要对大数据进行处理，适合于处理小数据集。

（4）易于理解和实现。

由于粗糙集方法基于概念，因此易于理解和实现。

4.粗糙集方法的应用粗糙集方法可以应用于多个领域，如金融、医学、机器学习等。

粗糙集方法与应用

辽宁省物流航运管理系统工程重点实验室
2.2 不精确范畴、近似与粗糙集
上近似和下近似 X关于R的上近似(Upper Approximation)定义为： R X a U : a R X
R ( x ) 是所有与X相交非空的等价类[a]R的并集，是那些可能属于X的对象组成的最小集合。
粗糙集（Rough Sets）理论是由波兰数学家Pawlak Z 于1982年提出的。粗糙集方法是基于一个机构（或一组机构）关于现实的大量数据信息，以对观察和测量所得数据进行分类的能力为基础，从中发现、推理知识和分辨系统的某些特点、过程、对象等的一种方法。经过二十多年的发展以及研究的深入，粗糙集方法在理论和实际应用上都取得了长足的发展。在知识发现、数据挖掘、模式识别、故障检测、医疗诊断等领域得到了广泛应用。
辽宁省物流航运管理系统工程重点实验室
2.1 知识与不可分辨关系
不可分辨关系是物种由属性集P表达时，论域U中的等价关系。U|ind(P)表示由等价关系ind(P)划分的所有等价类，且将其定义为与等价关系P的族相关的知识，称为P基本知识。同时，也将U|ind(P)记为U|P，ind(P)的等价类称为关系P的基本概念或基本范畴。
辽宁省物流航运管理系统工程重点实验室
1.2 粗糙集的应用及与其他领域的结合
三、粗糙集与其他相关理论和领域粗糙集与模糊集、证据理论的关系粗糙集和神经网络粗糙集与遗传算法粗糙集与支持向量粗糙集与自动控制
辽宁省物流航运管理系统工程重点实验室
二、粗糙集基本理论
2.1 知识与不可分辨关系
2.2不精确范畴、近似与粗糙集
上近似和下近似当集合X能表示成基本等价类组成的并集时，则称集合X 是R可精确定义的，称作R精确集；否则，集合X是R不可精确定义的，称作R非精确集或R粗糙集。对于粗糙集可近似利用两个精确集，即下近似和上近似来描述。 X关于R的下近似(Lower Approximation)定义为： R X a U : a R X R X 是由那些根据已有知识判断肯定属于X的对象所组成的最大的集合。

理解粗糙集理论在模糊决策中的作用与优势

理解粗糙集理论在模糊决策中的作用与优势在现代社会中，决策是一项非常重要的任务。

无论是在个人生活中还是在组织和企业的运营中，我们都需要做出各种各样的决策。

然而，由于信息的不完全性和不确定性，决策往往是一个复杂而困难的过程。

为了解决这个问题，人们提出了许多决策方法和理论。

其中，粗糙集理论作为一种基于模糊数学的决策方法，被广泛应用于各个领域，并取得了显著的成果。

粗糙集理论是由波兰数学家Pawlak于1982年提出的。

它通过将数据分成不同的等价类来处理不完全和不确定的信息。

这些等价类被称为粗糙集，它们可以帮助我们理解和描述数据的不确定性和模糊性。

粗糙集理论在模糊决策中的作用主要体现在以下几个方面。

首先，粗糙集理论可以帮助我们处理不完全信息。

在真实的决策问题中，我们往往无法获取到完整和准确的信息。

然而，粗糙集理论通过将数据分成不同的等价类，可以帮助我们从不完全信息中提取出有用的知识。

这种处理不完全信息的能力使得粗糙集理论在决策中具有独特的优势。

其次，粗糙集理论可以帮助我们处理模糊信息。

在现实生活中，我们常常会遇到一些模糊的情况。

例如，在评估一个人的能力时，我们可能无法准确地给出一个确定的评分。

然而，粗糙集理论可以通过将数据分成不同的等价类，将模糊信息转化为可处理的形式。

这种处理模糊信息的能力使得粗糙集理论在决策中具有重要的应用价值。

此外，粗糙集理论还可以帮助我们发现隐藏在数据中的规律和关联。

在现代社会中，我们面临着大量的数据，这些数据往往包含着丰富的信息。

然而，由于数据的复杂性和不确定性，我们往往很难从中发现有用的规律和关联。

粗糙集理论通过将数据分成不同的等价类，可以帮助我们发现隐藏在数据中的规律和关联。

这种发现规律和关联的能力使得粗糙集理论在决策中具有重要的应用潜力。

最后，粗糙集理论还可以帮助我们进行决策的优化。

在决策过程中，我们往往需要在多个决策方案之间进行选择。

然而，由于信息的不完全性和不确定性，我们往往很难确定最优的决策方案。

经典粗糙集理论

粗糙集理论能够处理不确定性和模糊性，而神经网络则能够通过学习过程找到数据中的模式。将粗糙集与神经网络结合，可以利用粗糙集对数据的不确定性进行建模，并通过神经网络进行分类或预测。
粗糙集可以用于提取数据中的决策规则，这些规则可以作为神经网络的训练样本。通过训练，神经网络可以学习到决策规则，并用于分类或预测。
边界区域
近似集合中的不确定性区域，即既不属于正域也不属于负域的元素集合。
粗糙集的度量
精确度
描述了集合中元素被近似集合包含的程度，即属于近似集合
的元素比例。
覆盖度
描述了近似集合能够覆盖的元素数量，即近似集合的大小。
粗糙度
描述了集合被近似程度，是精确度和覆盖度的综合反映。
知识的不确定性
描述了知识表达系统中属性值的不确定性程度，与粗糙度相
经典粗糙集理论
目录
• 粗糙集理论概述 • 粗糙集的基本概念 • 粗糙集的运算与性质 • 粗糙集的决策分析 • 粗糙集与其他方法的结合 • 经典粗糙集理论案例研究
01 粗糙集理论概述
定义与特点
定义
粗糙集理论是一种处理不确定性和模糊性的数学工具，通过集合近似的方式描述知识的不完全性和不确定性。
粗糙集理论中的属性约简可以用于简化神经网络的输入特征，降低输入维度，提高分类或预测的准确率。
粗糙集与遗传算法
01
遗传算法是一种全局优化算法，能够通过模拟自然界的进化过程来寻找最优解。将粗糙集与遗传算法结合，可以利用粗糙集对数据的分类能力，结合遗传算法的全局搜索能力，寻找最优的分类规则或决策规则。
02
粗糙集可以用于生成初始的分类规则或决策规则，然后利用遗传算法对这些规则进行优化，通过选择、交叉、变异等操作，寻找最优的规则组合。

《粗糙集理论简介》课件

05
粗糙集的应用实例
数据挖掘中的粗糙集应用
分类
利用粗糙集理论对数据进行分类，通过确定数据的属性重要性和类别关系，实现高效准确的分类。
聚类
通过粗糙集理论，可以发现数据中的相似性和差异性，从而将数据分成不同的聚类。
关联规则挖掘
利用粗糙集理论，可以发现数据集中项之间的有趣关系和关联规则。
机器学习中的粗糙集应用
粗糙集的补运算
总结词
粗糙集的补运算是指求一个集合的所有可能补集的运算。
VS
详细描述
补运算在粗糙集理论中用于确定一个集合的所有可能补集。补集是指不属于该集合的所有元素组成的集合。通过补运算，我们可以了解一个集合之外的所有可能性，这在处理不确定性和模糊性时非常重要。
04
粗糙集的扩展理论
决策粗糙集
多维粗糙集
多维粗糙集是粗糙集理论在多维空间下的扩展，它考虑了多个属性或特征对数据分类的影响。多维粗糙集可以更准确地描述多维数据的分类和聚类问题，因此在处理多特征和多属性问题时具有更大的优势。
多维粗糙集的主要概念包括多维下近似、多维上近似、多维边界等，通过这些概念可以度量多维数据的不确定性，从而为多维分类和聚类提供支持。
决策分析
粗糙集理论可以用于决策支持系统，通过建立决策模型来分析不确定性和模糊性条件下的最优决策。
知识获取
粗糙集理论可以用于从数据中提取隐含的知识和规则，尤其在处理不完整和不精确信息时具有显著效果。
02
粗糙集的基本概念
知识的分类
知识表达
通过数据表中的属性值来表达知识，将对象进行分类。
概率粗糙集
概率粗糙集是粗糙集理论在概率框架下的扩展，它引入了概率测度的概念，用于描述数据的不确定性。概率粗糙集可以更准确地描述数据的不确定性和随机性，因此在处理不确定性和随机性问题时具有更大的灵活性。

粗糙集理论

定义六

，R是一个等价关系，称 RX={ x |x U |,且[x]R X } 为集合X的R下近似集；称 RX={ x |x U |,且[x]R X} 为集合X的R上近似集；称集合 BNR ( X ) RX RX 为X的R边界域；称 POSR (X)=RX 为X的R正域；称 NEGR (X)=U-RX 为X的R负域。
©
第11章
粗糙集理论: 13
上、下近似集

给定论域U，一族等价关系R将U划分为互不相交的基本等价类U/R。令 XgU为R上的一个等价关系。当能表达成某些基本等价类的并集时，称为可定义的；否则称为不可定义的。R可定义集能在这个知识库中被精确地定义，所以又称为R精确集。 R不可定义集不能在这个知识库中被精确定义，只能通过集合逼近的方式来刻画，因此也称为R粗糙集 (Roughset)。
©
第11章
粗糙集理论: 12

定义五设U是一个论域，R是U上的等价关系，U/R 表示U上由R导出的所有等价类。 [ x]R 表示包含元素x∈U的R等价类。一个知识库就是一个关系系统K ={U ,P}，其中U是论域，P是U上的一个等价类簇。如果 Q P 且 Q ，则 Q (Q的所有等价类的交也是一个等价关系)，称Q为不可分辨关系,记作IND(Q)。
粗糙集理论
粗糙集的基本概念知识表达粗糙集在数据预处理中的应用
©
第11章
粗糙集理论: 1

粗糙集理论是由波兰华沙理工大学 Pawlak 教授于 20 世纪 80 年代初提出的一种研究不完整、不确定知识和数据的表达、学习、归纳的理论方法，它是一种刻画不完整性和不确定性的数学工具，能有效地分析不精确、不一致 (inconslsteni)、不完整 (incomPlete) 等各种不完备的信息，还可以对数据进行分析和推理，从中发现隐含的知识，揭示潜在的规律。

第4讲粗糙集理论决策规则

U/ ind({R1，R2}) 或 U/ ind({R1，R3})来表达。 ❖R={R1, R2, R3}的约简是什么？ 14
4.2 检验独立与否
❖如果每一个r∈R都为R中必要的，则称R为独立的；
❖否则称R为依赖的。
❖定理：如果R是独立的，P R，
则P也是独立的。
15
4.2 检验独立与否
❖检立验的{？R1，R2}和{R1，R3}是否为独
7
3、约简与核
❖ 约简（reduct），核（core） ❖ 定义：令R为一族等价关系，r∈R，如果ind(R)= ind(R-{r})，则称r为R中不必要的；否则称r为R中必要的。如果每一个r∈R都为R中必要的，则称R为独立的；否则称R为依赖的。
定理：如果R是独立的，P R，则P也是独立的。
❖ 令C和D分别为条件属性集和决策属性集
属性子集C' C关于D的重要性定义为
C（D C‘）（C D） CC（1 D）特别当C’ {}时，属性 C关于D的重要性为 C（D ）（C D） C{（} D）
头痛否且体温很高流感否以上规则的确定性因子为0540小结7综合算例71举例患者的知识表达系统72等价关系73依赖关系74约简与核75属性的重要性76决策规则418粗糙集内涵总结求约简与核的过程知识库kur等价类uruindr比较uindruindr判别必要性独立的必要的约简所有的必要关系组成的集合核428粗糙集内涵总结求解决策规则知识表达系统suavfacdcd比较posccnd不等必要约简相对核相对重要性决策规则的确定性因子438粗糙集内涵总结名词概念决策规则448粗糙集内涵总结粗糙集智能决策数据挖掘45总结内容1回顾2引例3约简与核5依赖关系6知识表达7综合算例决策规则8粗糙集内涵总结46doyouhavemadeprogresstoday

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第3 第 3页页
本讲内容

《决策理论与方法》
粗糙集理论的基本概念完备决策系统的粗糙决策分析方法不完备决策系统的粗糙决策分析方法基于优势关系的粗糙决策分析方法基于扩展优势关系的粗糙决策分析方法
第4 第 4页页
8.1粗糙集理论的基本概念

《决策理论与方法》
8.1.1知识与知识表示
(5) X Y R( X ) R(Y ),
(6)
R( X ) R(Y )
R( X ) R( X ), R( X ) R( X ) R(R( X )) R(R( X )) R( X )
(7) R(R( X )) R(R( X )) R( X ),
X粗糙集的概念可以用下面的示意图来表示：
U / c1
2 1 4 5 6 3 7 2 8 1 4 7 2 5 8 3 6
3
1
2
3
4
8
5
6
6
7
1
4
2
8
3
5
7
1
4
5
2
8
3
7
6
第9 第 9页页
R
《决策理论与方法》
8.1.2近似与粗糙集
设 X U , R 为U 上的等价关系，当 X 能表示为某些基本范畴并时，称是 R 可定义集；否则称 X 是 R 不可定义集。 R 可定义集是论域的子集，它可在知识库中精确地定义，而 R 不可定义集不能在这个知识
POSC ( D) POSC a ( D)
S (U , C D,V , f ), 若
则称属性 a 为 C 中 D 可省略，否则
属性 a 为
C 中 D 不可省略的。 C 的
定义 8.1.9 对于一给定的决策系统，条件属性集
D
约简是 C 的一个非空子集 P 。若满足
第 19 第 19页页
a A
Va ,
Va
是属性 a 的值域； f
:U A V
为信息
函数，它为每个对象的每个属性赋予一个属性值当信息系统中属性 A C D, 其中 C 为条件属性集，
D 为决策属性集时，信息系统也称为决策系统。
第7 第 7页页
《决策理论与方法》
例8-1-1 设决策系统如下表所示，对象为8部小汽车，条件
POSC c3 ( D) POSC ( D) POSC c1 ,c2 ( D) x1 , x4 POSC ( D) POSC c3 ,c2 ( D) POSC ( D)
i
定义8.1.12 当为一个决策规则时，且和分别为
C, D A C 基本公式和 D 基本公式，
时，则
第 21 第 21页页
《决策理论与方法》
决策规则称为 CD 基本决策规则。定义8.1.18 当且仅当对于 (C , D) 中任何一 CD 决策规则
, , 蕴含时，则 CD 决策算法中的 CD
《决策理论与方法》
（1）a P, a 都是 D 不可省略的（ 2）
POSP ( D) POSC ( D)
则称 P 是 C 的一个约简。
C 中所有不可 C 中所有约简的集合记作 REDD (C )，
省略属性的集合称 C 的核，记为

CORE D (C )
8.1.5决策规则和算法
决策表中的每一个对象都可以看作是一条决策规
分别为条件属性集和决策属性集，属性子集的属性重要度定义为
第 17 第 17页页
C C
《决策理论与方法》
C,D (C) C (D) C C (D)
特别当 C a 时，属性 a C 关于 D 的重要性为
C,D (a) C (D) C a (D)
决策规则是 S 中相容的，否则是不相容的。定义8.1.19 如果一个决策表中所有的决策规则都是相容的，则决策表是相容的，否则是不相容的。
定义8.1.20 任何一个决策系统可以看做是一组“ if
第 22 第 22页页
《决策理论与方法》
… then…”的决策规则，当条件能唯一确定决策时，该条规则为确定性决策规则，否则为不确定性决策规则。
定地划入 U / D 类的对象集合。
第 16 第 16页页
《决策理论与方法》
定义 8.1.6 决策属性 D 对条件属性 C 的依赖度定义为
k C ( D) POSC ( D) U
依赖度表示在条件属性集下能够确切划入决策分类 U / D 的对象占论域中的总对象数的比率，表达了决策属性对条件属性的依赖程度。定义8.1.7 设有决策系统 S (U , C D,V , f ) 其中 C , D
R( X Y ) R( X ) R(Y )
第 12 第 12页页
《决策理论与方法》
(3) R( X Y ) R( X ) R(Y ),
R( X Y ) R( X ) R(Y )
(4) R( X Y ) R( X ) R(Y ), R( X Y ) R( X ) R(Y )
X i Yj
第 23 第 23页页
《决策理论与方法》
该规则的确定性因子为：
( X i ,Y j )
Yj X i Xi
当 ( X i , Y j ) 1 是确定性规则；当 0 ( X i , Y j ) 1 是不确定性规则。

8.1.6算例分析
考察下面决策系统进行属性约简及获取决策规则。
定义8.1.5 设有决策系统
S (U , C D,V , f ), 其中 C , D
分别为条件属性集和决策属性集，则决策属性 D 在条件属性 C 下的正域（简称 D 的 C 正域）定义为
POS C ( D) C ( X )
X U / D
D的C
正域是中通过用分类 U / C 表达的知识能够确

2. 属性约简属性约简是粗糙集理论中的核心内容之一，决
策表中的属性并不是同等重要的，甚至有些属性是冗余的，所谓属性约简，就是保持决策表条件属性
第 18 第 18页页
《决策理论与方法》
和决策属性之间的依赖关系不发生变化的前提下, 删除其中不相关的或不重要的属性。定义8.1.8 对于一给定的决策系统
R ( X ) Y U / R
R( X ) Y U / RYXΒιβλιοθήκη Y X
分别称它们为 X 的 R 下近似和 R 上近似。
下近似和上近似也可以用下面的等式表达：
第 11 第 11页页
《决策理论与方法》
R( X ) x U

[ x] R X ,

R( X ) x U
X i 和 Yj 分定义8.1.21 在决策系统中 S (U , C D,V , f ) ，
别代表 U / C 与 U / D 中各等价类。dex( X i ) 表示对等价
类 X i 的描述， dex(Y j ) 表示 Y j 对等价类的描述。
决策规则为：
dex( X i ) dex(Yi ),
c1 空间、c2 颜色、属性： c3 价格；决策属性为销售量 d
第8 第 8页页
《决策理论与方法》
在此决策系统中每个属性相当于一个等价关系，有等价关系得到的等价类为：
x , x , x , x , x , x , x , x U / c x , x , x , x , x , x , x , x U / c x , x , x , x , x , x , x , x U / C x , x , x , x , x , x , x , x U / d x , x , x , x , x , x , x , x
1.知识的含义
粗糙集方法是将数据转化为知识的一种规范的方法,

把知识视为分类的能力。
X U 称为 U 定义8.1.1 设 U 是研究对象的有限集合，
中的一个概念或范畴, U 中的一个概念族 F X 1 , X 2 ,, X n 称为关于 U 的知识，其中 X i U , X i , X i X j , i j
库中被定义。R 可定义集也称为精确集(Exact Sets),
而 R 不可定义集也称为粗糙集（Rough Sets)。
对于粗糙集可以近似地定义，我们使用粗糙集的
第 10 第 10页页
《决策理论与方法》
上近似和下近似来描述。
定义8.1.3 给定知识库 K , 对于每个子集 X U 和一个
等价关系 R, 定义两个子集：
识库就是一个系统，记为 R
U
K (U , R),
U
其中
为非空有限
集，为
上的一簇等价关系。
第6 第 6页页
《决策理论与方法》

2. 知识的表示
知识的表示通过知识表达系统来完成。知识表达系统 S 可以表达为: S (U , A,V , f ), 其中U x1 , x2 ,, xn 为对象的集合；A 为属性的非空有限集合； V 为属性值域， V
教育部高等学校管理科学与工程类学科专业教学指导委员会推荐教材
决策理论与方法
（ Decision Making Theory and Methods ）
《决策理论与方法》编写组
《决策理论与方法》
第八章粗糙集决策方法
第2 第 2页页
学习目的

《决策理论与方法》
了解知识、等价类、上近似、下近似、粗糙集、属性约简和核的概念；掌握完备决策系统和不完备决策系统的属性约简及获取决策规则的方法；掌握基于优势关系和扩展优势关系的属性约简及获取决策规则的方法。

第八章粗糙集决策方法

合集下载

粗糙集

粗糙集理论

粗糙集

基于粗糙集的决策方法及其在房地产预测中的应用

粗糙集合

粗糙集 (ppt)

粗糙集基本知识PPT课件

数据分析知识：如何进行数据分析的粗糙集方法

粗糙集方法与应用

理解粗糙集理论在模糊决策中的作用与优势

经典粗糙集理论

《粗糙集理论简介》课件

粗糙集理论

第4讲粗糙集理论决策规则

文档推荐

最新文档

第八章 粗糙集决策方法

合集下载

粗糙集

粗 糙 集 理 论

粗糙集

基于粗糙集的决策方法及其在房地产预测中的应用

粗糙集合

粗糙集 (ppt)

粗糙集基本知识PPT课件

数据分析知识：如何进行数据分析的粗糙集方法

粗糙集方法与应用

理解粗糙集理论在模糊决策中的作用与优势

经典粗糙集理论

《粗糙集理论简介》课件

粗糙集理论

第4讲粗糙集理论决策规则

文档推荐

最新文档

第八章粗糙集决策方法

粗糙集理论