粗糙集理论 PPT课件
- 格式:ppt
- 大小:1.14 MB
- 文档页数:89
绪论●20世纪80年代,波兰数学家Z.Pawlak提出粗糙集理论概率论(Probabilistic Theory)刻画概念发生的随机性(Stochastic),模糊集理论(Fuzzy Set Theory)刻画概念的模糊性(Vagueness),刻画概念的粗糙性(Coarseness),即分类能力(Classification Ability)。
粗糙集理论简称为粗集理论,粗糙集,或粗集。
●一个概念越粗糙,其分类能力越差,分类得到的对象组的颗粒(granularity)越大(越粗),对象之间的可辨识性(discernibility)越差。
相反地,一个概念越精细(fine),其分类能力越强,分类所得的对象组的颗粒越小,对象之间的可辨识性越好。
●例子图像的分辨率刻画了图像质量的粗糙程度,类似粗糙集刻画了知识或概念的粗糙程度。
图像中的分辨率越高,图像的可辨识性就越好,反之就越差。
像素灰度刻画了图像黑白的不同程度,类似模糊集刻画了概念的模糊性。
而图像上的内容则反映了某个物体出现的随机性。
第一章 知识有关知识的理论已有长远和丰富的历史,Pawlak 提议把粗集理论作为讨论知识的理论框架,特别在关注不精确知识的时候。
本章对“知识”这一术语给出形式化的定义,并讨论了它的一些基本特性。
粗集理论对知识的基本看法:知识是人类关于事物之分类能力的深层次刻画。
论域(universe of discourse ):真实世界或抽象世界被称为论域.定义1.1 设论域U 是非空有限集合,U 中元素是论域中感兴趣的对象。
对∀X ⊆ U ,称其为U 的一个概念或范畴(category )。
称U 的任意概念簇为U 的抽象知识或知识。
为便于形式推理,允许空集 ∅ 作为一个概念。
本书我们的主要兴趣在于形成某论域的一个划分(partition )或分类(classification )的概念。
(在本书中有:划分分类,划分与分类是两个等价的概念)定义1.2 U 为论域,若概念簇C = {X i | X i ⊆U ,X i ≠ ∅,i = 1,2,…,n} 满足:⑴ 对于i ,j = 1,2,…,n ,i≠j ,X i ∩X j = ∅⑵ 1 ni i X U == 则称C 为U 的一个划分或分类。
第三节粗糙集(Rough Set,RS)如果我们将研究对象看成是现象,那么我们可以将这些现象分类。
现象被分为确定现象与不确定现象。
不确定现象有分为随机现象,模糊现象和信息不全的粗糙现象。
如下所示:⎧⎪⎪⎧⎪⎪⎨⎪⎪⎨⎪⎪⎪⎪⎩⎩∈确定现象随机现象,0-1律,多种可能性满足分布规律。
现象不确定现象模糊现象,律属度Î(0,1),不是非此即彼。
粗糙现象,研究那些因为信息不充分而导致的不确定性相对于前两种现象的处理,粗糙现象是基于不完全的信息或知识去处理不分明的现象,因此需要基于观测或者测量到的部分信息对数据进行分类,这就需要与概率统计和模糊数学不同的处理手段,这就是粗糙集理论。
直观地讲,粗糙集是基于一系列既不知道多了还是少了,也不知道有用还是没用的不确定、不完整乃至于部分信息相互矛盾的1数据或者描述来对数据进行分析、推测未知信息。
下面我们对粗糙集的基本特征、以及数学符号进行简述。
1.粗糙集的特点粗糙集的特点是利用不精确、不确定、部分真实的信息来得到易于处理、鲁棒性强、成本低廉的决策方案。
因此更适合于解决某些现实系统,比如,中医诊断,统计报表的综合处理等。
粗糙集的另一个重要特点就是它只依赖于数据本身,不需要样本之外的先验知识或者附加信息,因此挑选出来的决策属性可以避免主观性,有英雄不问出身的意味。
用粗糙集来处理的数据类型包括确定性的、非确定性的、不精确的、不完整的、多变量的、数值的、非数值的。
粗糙集使用上、下近似来刻画不确定性,使得边界有了清晰的数学意义并且降低了算法设计的随意性。
3.粗糙集的基本概念粗糙集要涉及论域U(这与模糊系统相似),还要涉及属性集合R C D=(这被认为是知识,或者知识库)。
当然,也要有属性值域V,以及信息函数f:U R V⨯→的。
因此,一个信息系统S可以表示为一个四元组{}=。
在不混淆的情况下,简记为(,)S U R V f,,,=,S U R23 也称为知识库。
等价关系(通常用来代替分类)是不可或缺的概念,根据等价关系可以划论域中样本为等价类。