当前位置：文档之家› 模糊集与粗糙集的简单入门

模糊集与粗糙集的简单入门

1.前言

Zadeh在1965年创立了模糊集理论[1],Pawlak在1982年又给出了粗糙集的概念[2],模糊集理论和粗糙集理论都是研究信息系统中只是不完全,不确定问题的两种方法,是经典集合论的推广,它们各自具有优点和特点,并且分别在许多领域都有成功的应用,如模式识别、机器学习、决策分析、决策支持、知识获取、知识发现等.模糊理论是简历集合的子集边缘的病态定义模型,隶属函数多数是凭经验给出的,带有明显的主观性;粗糙集理论基于集合中对象间的不可分辨行的思想,作为一种刻画不完整想和不确定性的数学工具,它无需任何先验信息,能邮箱分析处理不精确、不完整等不完备信息,对不确定集合的分析方法是客观的.两种理论之间有着密切的关系和很强的互补性,同事粗糙集理论和模糊集理论可以进行结合,产生粗糙模糊集理论和模糊粗糙集理论,并且发挥着不同的优势.

本文在已有的模糊集理论和粗糙集理论的基础之上,分析和总结了模糊集和粗糙集理论,对二者进行了全面的比较.

2.基本概念

这部分将集中介绍模糊集和粗糙集的基本概念及其性质.

2.1模糊集

模糊理论[3][4]是一种用以数学模型来描述语意式的模糊信息的方法.模糊概念也是没有明确外延的概念.根据普通集合论的要求,一个对象对应于一个集合,要么属于,要么不属于,二者必居其一;而模糊集则通常用隶属函数表示模糊概念.

2.1.1模糊集合的基本定义

定义 1 设X 是有限非空集合,称为论域,X 上的模糊集 A 用隶属函数表示如下:

:[0,1], ()A

X x A x →→ 其中()A

x 表示元素x 隶属于模糊集合A 的程度,记X 上的模糊集合全体为()F X .

模糊集合的数学表示方式为

{(,(x))|}, ()[0,1]A

x A x X where A x =∈∈ 2.1.2模糊集合的运算

设,A B 为X 上的两个模糊集,它们的并集,交集和余集都是模糊集,且其隶属函数分别定义为

max{(),()} A

B A x B x x X =?∈ min{(),()} A

B A x B x x X =?∈ 1A

A ?=-

2.1.3 模糊集合的关系

模糊集合之间关系的表示方式,是以集合所存在的隶属函数(),()A

x B x 作为集合之间的关系表示的.

(1) 模糊集合之间的相等:

()() A

B A x B x x X =?=?∈ (2) 模糊集合之间的包含:

()() A

B A x B x x X ??≤?∈

2.1.4 截集与支集

定义2 对于()A F X ∈和任意[0,1]λ∈,定义

{}()A x A

x λλ=≥ {}()s

A x A

x λ

λ=> 分别为A 的λ截集和A 的λ强截集.特别的,当1λ=时,1A 为A 的核;当0λ=时,0s A 为A 的支集.表示为如下:

{}

1()()1core A A x A

x === {}

0()()0s support A A x A

x === 则根据上面截集的概念,模糊子集通过λ截集就变成了普通集合.截集就是将模糊集合转化为普通集合的方法,截集的概念是联系模糊集合与普通集合之间的桥梁.

2.2 粗糙集

2.2.1粗糙集合的基本定义 (1)粗糙集合提出的背景

由于经典逻辑只有真假二值之分,而在现实生活中存在许多含糊的现象,并不能简单的用真假值来表示.于是,在1904年,谓词逻辑的创始人G.frege 提出了含糊(vague)一词,他把含糊现象归结到边界线上.

1965年,L.A. Zadeh 提出Fuzzy Sets 的概念,试图通过这一理论解决G.frege 的含糊概念.Zadeh 的FS 方法是利用隶属函数描述边界上的不确定对象.

1982年,波兰华沙理工大学 Z.Pawlak 教授针对G. frege 的边界线区域思想提出了Rough Sets 理论.Pawlak 的RS 方法:把无法确认的个体都归属于边界区域,把边界区域定义为上近似集和下近似集的差集. (2)粗糙集合的定义

粗糙集理论特点是不需要预先给定默写特征或属性的数量描述,直接从给定的问题的描述集合出发,通过不可分辨关系和不可分辨类确定给定问题的近似域,找出问题内在规律.

定义 2 设(,,,)K X A V f =是一个知识库,其中X 是一个非空集合,称为论域.A C D = 是属性的非空有限集合,C 为D 的决策属性,C D =Φ ,a V 是属性

a A ∈的值域,:f X A V ?→是一个信息函数,它为每个对象赋予一个信息值.

定义 3 设X 是一个有限的非空论域,R 为X 上的等价关系,等价关系R 把集合X 划分为多个互不相交的子集,每个子集称为一个等价类,用[]R x 来表示,[]{}R x y X xRy =∈,其中x X ∈,称,x y 为关于R 的等价关系或者不可分辨关系.论域X 上的所有等价类的集合用/X R 来表示.

2.2.2 上、下近似集,粗糙度 (1)上下近似集的定义

定义4 对于任意的Y X ?,Y 的R 上、下近似集分别定义为

(){/|}R Y Z X R Z Y =∈≠Φ

(){/|}R Y Z X R Z Y =∈?

集合()posR Y 称为集合Y 的正域,()()posR Y R Y =;集合()()negR Y X R X =-称为集合Y 的负域;集合()()()bnR Y R Y R Y =-称为Y 的R 边界域.

集合的不确定性是由于边界域的存在,集合的边界域越大,精确性越低,粗糙度越大.

当()()R Y R Y =时,称Y 为R 的精确集;当()()R Y R Y ≠时,称Y 为R 的粗糙集,粗糙集可以近似使用精确集的两个上下近似集来描述. (2) 粗糙度

粗糙度是表示知识的不完全程度,由等价关系R 定义的集合X 的粗糙度为:

()1R RX

X RX

ρ=-

其中X ≠Φ,X 表示集合X 的基数.

3 研究对象、应用领域及研究方法

3.1模糊集的研究对象、应用领域及研究方法

(1) 模糊集的研究对象

模糊集研究不确定性问题,主要着眼于知识的模糊性,强调的是集合边界的不分明性.

(2) 模糊集的应用领域

模糊集理论[5]广泛应用与现代社会与生活中,主要有以下几个方面:消费电子产品、工业控制器、语音辨识、影像处理、机器人、决策分析、数据探勘、数学规划以及软件工程等等.

(3)研究方法

模糊集理论的计算方法是知识的表达和简化.从知识的“粒度”的描述上来看,模糊集是通过计算对象关于集合的隶属程度来近似描述不确定性;从集合的关系来看,模糊集强调的是集合边界上的病态定义,也即集合边界的不分明性;从研究的对象来看,模糊集研究属于同一类的不同对象间的隶属关系,强调隶属程度;从隶属函数来看,模糊集的隶属函数反映了概念的模糊性,而且模糊集的隶属函数大多是专家凭经验给出的,带有强烈的主观意志.

3.2粗糙集的研究对象、应用领域及研究方法

(1)粗糙集的研究对象[6]

粗糙集理论研究不确定性问题,基于集合中对象间的不可分辨性思想,建立集合的子集边缘的病态定义模型.

(2)粗糙集的应用领域

粗糙集理论在近些年得到飞速发展,在数据挖掘,模式识别,粗糙逻辑方面取得较大进展.与粗糙集理论相关的学科主要有以下几方面:人工智能,离散数学,概率论,模糊集理论,神经网络,计算机控制,专家系统等等[7].

(3)粗糙集的研究方法

粗糙集理论的研究方法就是对知识的含糊度的一个刻画,其计算方法主要是连续特征函数的产生.粗糙集理论研究认知能力产生的集合对象之间的不可分辨性,通过引入一对上下近似集合,用它们的差集来描述不确定的对象.从集合的关

系来看,粗糙集强调的是对象间的不可分辨性,与集合上的等价关系相联系;从研究的对象来看,粗糙集研究的是不同类对象组成的集合关系,强调分类;从隶属函数来看,粗糙集的粗糙隶属函数的计算是从被分析的数据中直接获得,是客观的[8].

4.基本研究内容

4.1 模糊集理论研究的主要内容

模糊集理论研究的内容很广泛,主要包括以下几方面:模糊控制,模糊聚类分析,模糊模式识别,模糊综合评判,模糊集的扩展. 4.1.1 模糊控制

自从Zadeh 发展出模糊集理论之后,对于不明确系统的控制有极大的贡献,自七十年代以后,便有一些实用的模糊控制器相继的完成,使得我们在控制领域中又向前迈进了一大步,在此将对模糊控制理论做一番浅介[6].

模糊控制利用模糊集理论的基本思想和理论的控制方法.在传统的控制领域里,控制系统动态模式的精确与否是影响控制优劣的最主要关键,系统动态的信息越详细,则越能达到精确控制的目的.然而,对于复杂的系统,由于变量太多,往往难以正确的描述系统的动态,于是工程师便利用各种方法来简化系统动态,以达成控制的目的,但却不尽理想.换言之,传统的控制理论对于明确系统有强而有力的控制能力,但对于过于复杂或难以精确描述的系统,则显得无能为力了.所以,模糊集理论便被用来处理这些控制问题. 4.1.2模糊聚类分析

模糊聚类分析的研究是基于模糊等价关系和以及模糊分类上的[4].主要有以下的定理以及定义.

定理1 令R 是一个模糊等价关系,并且01αβ≤<≤,则对y X ?∈有

[][]R R y y βα?.

定义 5 设数据集12{,,,}n X x x x = ,且12,,,c A A A 是其一个分类,若该分类

满足以下条件:

(1) 对k ?,存在i 使得k i x A ∈; (2) 对所以i 均有i A ≠Φ; 则称该分类是X 的一个模糊划分.

基于上面的理论,我们可以用一个划分矩阵()ik c n D d ?=来刻画数据集的分类,其中

0 , 1 , k i

ik k i x A d x A ??=?∈?

定义6 对于上面的矩阵D ,若其满足以下三个条件:

(1){}0,1ik d ∈; (2)11, c

ik i d k =

=?∑; (3)1

0, n ik k d i =>?∑;

则称D 是X 上的一个精确的c -划分矩阵.

定义7 设c 和n 时两个给定的正整数若模糊矩阵()ik c n D d ?=满足以下三个条件:

(1) []0,1ik d ∈; (2) 1

1, c

ik i d k ==?∑; (3) 1

0, n

ik k d n i =<

则称D 为X 上的一个模糊的c -划分矩阵.

定义8 设12{,,,}m n X x x x =? R ,12{,,,}m c V v v v =? R ,()ik c n D d ?=()c n ≤是X 上的一个模糊的c -划分矩阵,则

()2

(,)c

ik i k

i k J D V d v x ===-∑∑(p ∈R )

称为模糊划分上的一个聚类准则函数,这里

()1

2()2

[]

i i x x

=∑

定义9 如果对于任意的12{,,,}m n X x x x =? R ,存在****1

2{,,,}m c V v v v =? R 以及模糊的c -划分矩阵*D 使得

**(,)(,)J D V J D V ≤

对所有的12{,,,}m n X x x x =? R 以及模糊的c -划分矩阵D 都成立,则称*D 为最优模糊c -划分矩阵,*V 为一个模糊聚类中心.

4.1.3模糊模式识别

模糊模式识别是利用模糊集理论对行为的识别.根据识别模式的性质,可以将模式识别分为两类:具体事物的识别,如对文字,音乐,语言等周围事物的识别;抽象事物的识别,如对已知的一个论点或者一个问题的理解等.下面介绍一些基本的定理及定义.

定义10 清晰度增强因子:令()A F X ∈是X 上的一个模糊集,定义另外一个模糊集(2)()()I A F X ∈,其中

(2)

2() , ()[0,0.5]()()12(1()), ()(0.5,1]A x A x I A x A x A x ?∈??--∈?? 称(2)

()()I A x 为清晰度增强因子.

4.1.4模糊综合评判

模糊综合评判是利用模糊集理论对一个事物进行评价.具体的过程为:将评价目标看成是由多种因素组成的模糊集合X ,再设定这些因素所能选取的评审等级,组成评语的模糊集合(称为评判集V ),分别求出各单一因素对各个评审等级的归属程度(称为模糊矩阵D ),然后根据各个因素在评价目标中的权重分配,通过计算(称为模糊矩阵合成),求出评价的定量解值.

定义11 设:[0,1][0,1]n f →满足以下几个条件: (1)1212(,,,)n n x x x x f x x x x ====?= ;

(2)(1)(2)(1)(2)111111(,,,,,,)(,,,,,,)i i i i i n i i i n x x f x x x x x f x x x x x -+-+≤?≤ ,i ?; (3)12(,,,)n f x x x 对每个变量都是连续的; 则称f 为n -维综合函数.

常用的n -维综合函数主要有加权平均函数,几何平均函数,单因素决策函数,显著因素准则函数等等. 4.2粗糙集理论研究的主要内容

粗糙集理论作为一种数据分析处理理论,无论是在理论方面还是在应用实践方面都取得了很大的进展,展示了它光明的前景,因而其研究内容以及领域也是非常广泛的,主要包括以下几方面:变精度粗糙集,集值信息系统,粗糙集理论的应用,支持向量基等.

4.2.1变精度粗糙集

变精度粗糙集模型[9]是Pawlak 粗糙集模型的扩充,它是在基本粗糙集模型的基础上引入了β(00.5β≤<),即允许一定的错误分类率存在,这一方面完善了近似空间的概率,另一方面也有利于用粗糙集理论从认为不相关的数据集中发现相关的数据.当然,变精度粗糙集模型的主要任务是解决属性间无函数或不确定关系的数据分类问题.当0β=时,Pawlak 粗糙集模型是变精度粗糙集模型的一个特例.

4.2.2集值信息系统

集值信息系统[5]是信息系统的一般化模型,在实际应用中信息系统随着对象的变化而不断地动态变化.

(,)S X AT =是信息系统,其中X 是对象的非空有限集合,AT 是属性的非空

有限集合,对于每个a AT ∈有:a a X V →,其中a V 称为a 的值域.

每个属性子集A AT ?决定了一个不可区分关系()ind A :

(){(,)|,()()}ind A x y X X a A a x a y =∈??∈=.

关系()ind A (A AT ?)构成了X 的划分,用/()X ind A 来表示.

对于一个对象,一些属性值可能是缺省的.为了表明这种情况,通常给定一个区分值(即空值 null value )给出这些属性

定义12 如果至少有一个属性a AT ∈使得a V 含有空值,则称S 是一个不完备信息系统[5],否则称它是完备的,我们用*表示空值.

设S 是一个不完备信息系统,a AT ∈使得a V 含有空值*时,并且该空值*的取值为一个集合,该集合的元素是这个属性中其他所有可能值的集合,则S 就是集值信息系统.

下面是一个不完备信息系统的例子:

4.2.3 支持向量基

支持向量机(Support Vector Machine,SVM)[10][11]是Corinna Cortes和Vapnik8等于1995年首先提出的.SVM起初是广泛应用在神经信息处理系统(Neural Information Processing Systems,NIPS), 但是,现今,SVM 已经在所有的机器学习研究领域中起着重要作用.

SVM是一种学习系统,他利用高维空间中的线性分类器,在这个空间中建立一个最大的间隔超平面,这里的最大是基于最优化理论的.

广义的SVM起源于统计学习理论[12].

5.模糊集与粗糙集的结合

由上面的讨论可知,模糊集理论与粗糙集理论各具特点,两种理论有着很强的联系与互补性,因此将两者的特点结合起来形成研究不完全数据集的有效方法.

此外,通过模糊聚类和粗糙集两种方法进行属性的对象约简和属性约简,可以使数据得到横向和纵向两个方向上的约简,对象约简是引入了相似性的概念进行模糊聚类的过程,对象约简改变了标准粗糙集模型的不可分辨关系的确定条件;由于粗糙集所处理的都是离散数据,所以在数据分析中需要应用模糊聚类或隶属函数离散化,进而应用粗糙集理论属性约简、提取规则.所以结合模糊集、粗糙集理论能够有效地分析数据,提高生成规则的可信性和和合理性,倒出可信的规则集.

5.1模糊粗糙集及粗糙模糊集

结合模糊集和粗糙集两种理论可以得到模糊粗糙集及粗糙模糊集模型,当知识库中的知识模块是清晰的概念,而被描述的概念是一个模糊的概念,人们建立粗糙模糊集模型来解决此类问题的近似推理;当知识库中的知识模块是模糊知识,

而被近似的概念是模糊概念时,则需要建立模糊粗糙集模型,也有人将普通关系推广称模糊关系或者模糊划分而获得模糊粗糙集模型.

定义13 设R 是X 上的一个等价关系,()A F X ∈,[0,1]λ∈,模糊集A 、A λ以

及s

A λ的上下近似分别为:

(){|[]},(){|[]}R R R A x X x A R A x X x A λλλλ=∈≠Φ=∈? (){|[]},(){|[]}s s s s R R R A x X x A R A x X x A λλλλ=∈≠Φ=∈?

(){|[]},(){|[]}R R R A x X x A R A x X x A =∈≠Φ=∈?

可以验证,当A 是X 上的经典集合时,上面所介绍的上下近似就是Pawlak 意义下的上下近似.

定义14 设R 是X 上的等价关系,A 是X 的一个模糊集合,()A F X ∈,则A 关于R 的上下近似分别定义如下:

()sup{()|[]},()inf{()|[]}R R R R A x A y y x A x A y y x =∈=∈

可以看出,模糊集()A F X ∈关于等价关系R 的上下近似仍为模糊集合,若

R R A A =,则称A 是可定义的,否则称A 是粗糙集,称R A 是A 关于近似空间(,)

X R 的正域,称~R A 是A 关于(,)X R 的负域,称(~)R R A A 为A 的边界.R A 可以理解为对象x 肯定属于模糊集A 的隶属程度;R A 理解为对象x 可能属于模糊集A 的隶属程度,同样可以验证,当A 时X 上的经典集合时,就是Pawlak 意义下的上下近似.

在标准粗糙集模型中引入变精度,提高了相对近似精度,而在粗糙模糊集引入变精度,得到新定义:

()sup{()|[]()1}R R A x A y y x A y ββ=∈∧>-

()inf{()|[]()}R R A x A y y x A y ββ=∈∧≥

这样下近似集合中元素隶属度降低,而上近似的隶属度提高,提高了相对精度.

5.2粗糙隶属函数

粗糙隶属函数式借助模糊理论来研究粗糙集理论的方法,通过粗糙隶属度函数可以将粗糙集理论与模糊集理论联系起来,建立一种粗糙集理论与模糊集理论的关系,并得到一些性质.

定义15 设R 是论域X 上的一个相似关系,若A 是X 上的一个模糊集合,则

A 关于R 的一个下近似()R A 和上近似()R A 分别定义为X 上的一个模糊集合,称

为粗糙隶属度函数[5],定义为

|[]|()|[]|

R R A x A

x x = 粗糙隶属函数表示的是一个模糊概念,一般不是Zadeh 意义下的隶属函数.粗糙

隶属函数 ()A x 表示的是x 的等价类[]R x 隶属于A 的程度.

由定义14和定义15可以得到:模糊集A 的下近似且关于等价关系R 的等价类隶属于A 的程度为1;模糊集A 的上近似且关于等价关系R 的等价类隶属于A 的程度为大于0小于1,因此有:

性质1 1(){|()1,/}Core A A x A

x x X R RA ===∈= 0(){|()0,/}s support A A x A

x x X R ==>∈ (){|0()1,/}bnR A RA RA x A

x x X R =-=<<∈ (){|()0,/}negR A X RA x A

x x X R =-==∈ 性质2 []()()R y x A x A y ∈?= []()1R x A A

x ??= []()0R x A A

x =Φ?= [] []()(0,1)R R x A and x A A

x ?≠Φ?∈ 6 总结

本文系统的介绍了模糊集理论与粗糙集理论,二者研究的主要内容,以及二者的结合的相关理论.是对本学期所学的模糊计算和粗糙计算的一个简单的小结,也是我本人对该学科的一个简单的入门.

参考文献

[1] L.A.Zadeh, Fuzzy sets[J], Information and Control, 1965,8:338-353.

[2]Pawlak Z, Rough sets[J], International Journal of Computer and

Information science, 1982,1(11):341-356.

[3]胡宝清,模糊理论基础,武汉:武汉大学出版社,2010.

[4]张文修,模糊数学基础,西安:西安交通大学出版社,1984.

[5]张文修,粗糙集理论与方法,北京:科学出版社,2001

[6] https://www.doczj.com/doc/c312231901.html,/view/87377.htm

[7]K. Y. Chan, C.K. Kwong, B.Q. Hu, Market segmentation and ideal point

identification for new product design using fuzzy data compression and fuzzy clustering methods[J], Applied Soft Computing, 2012, 12, 1371-1378.

[8]Z.Pawlak, Rough sets and fuzzy sets [J], Fuzzy sets and Systems,

1985,17,99-102.

[9]Beynon M.Reducts within the variable precision rough sets model: a

further investigation[J], European Journal of Operational Research, 2001,134:592-605.

[10]邓乃扬,田英杰,数据挖掘中的新方法:支持向量基,北京:科学出版社,2004.

[11]邓乃扬,田英杰,支持向量基-理论、算法与拓展,北京:科学出版社,2009.

[12]V.Vapnik, Statistical Learning Theory, John Wiley & Sons, 1998.

基于模糊粗糙集的一种知识获取方法

2006年5月重庆大学学报(自然科学版)May2006第29卷第5期Journal of Chongqing University(Natural Science Editi on)Vol.29　No.5 文章编号:1000-582X(2006)05-0108-04 基于模糊粗糙集的一种知识获取方法3 印　勇,孙如英 (重庆大学通信工程学院,重庆　400030) 摘　要:将粗糙集理论与模糊集理论相结合,提出了一种基于模糊粗糙集的知识获取方法.该方法利用模糊集理论对决策表中连续属性进行模糊化;通过定义模糊等价类得到模糊粗糙近似空间的上、下近似,从而获取决策规则.实例验证了此方法的有效性. 关键词:模糊粗糙集;决策表;属性约简;知识获取中图分类号:TP182文献标识码:A 粗糙集理论是一种研究不精确、不确定知识的数学工具.粗糙集方法具有以下几个优点:不需要给出额外信息;简化输入信息的表达空间;算法简单,易于操作[1].由于粗糙集处理的对象是类似二维关系表的信息表,信息表中连续属性是普遍存在的,但是粗糙集的数学基础是集合论,直接处理连续属性的能力非常有限,因此连续属性的离散化是制约粗糙集理论实用化的难点.模糊集可以用来表示集合中子类边界的模糊性,是由隶属度函数来刻画的.因此将模糊集和粗糙集相结合构成模糊粗糙集可以更好地描述信息系统[2]. 笔者将模糊集与粗糙集相结合,提出了一种基于模糊粗糙集的知识获取方法,以一个实例说明了此方法的有效性. 1　模糊粗糙集及属性约简算法在粗糙集中,条件属性和决策属性都是清晰的,属性对应的是等价关系,约简处理时,对象属性值必须是经过离散化的.而在模糊粗糙集中,由于引入了模糊集合理论,条件属性和决策属性都可以是模糊的,属性对应的是相似关系,属性约简中,对象属性值可以保持原样而无须进行离散化,粗糙集离散化后的每个符号表示对应于模糊粗糙集合中单个属性下的一个模糊等价类,相应地,离散化过程也就被属性模糊化过程所代替. 1.1　基本概念定义1　一个决策表系统S=为一个信息知识表达系统,其中U≠Φ为论域;A=C∪D,C 和D分别为条件和决策属性集,且C∩D=<;V为属性的值域集,V=∪V a ,a:A,V a为a属性的值域;f为信息函数,f:U×A→V,对Πx:U,a:A,存在(f(x,a):V a . 定义2　如果满足如下条件: 自反性　μ R (u,u)=1,Πμu:U 对称性　μ R (u,v)=μR(v,u),Πu,v:U 则称模糊关系R∈F(u×u)为上的模糊相似关系. 1.2　属性模糊化在模糊粗糙集的应用中,模糊等价类的划分是必须考虑的问题.在粗糙集中,属性对应的等价类是普通集合,而在模糊粗糙集中,属性对应的等价类是模糊集,因此,往往把属性的等价类划分过程称为属性模糊化过程.在粗糙集中,每个对象属于且仅属于一个等价类,在模糊粗糙集中,每个对象可以属于多个模糊等价类.模糊等价类既可以保留同一子区间内属性值的差异性,又能体现相邻子区间内的属性值之间的过渡性. 对于决策表中任一连续属性,根据其值域的大小和属性值的分布,可以把模糊化为k个语义变量.每个语义变量具有如图1所示的隶属度函数,其中u(x)为隶属度,x为属性值.k个模糊划分的中心m i 可由Ko2 honen网络自组织映射算法确定[3].为保证模糊划分的完备性,2个相邻隶属度函数相交处的函数值取为0.5[4]. 用上述方法求出的是单个属性的模糊等价类,为 3收稿日期:2005-11-13 基金项目:重庆市应用基础研究项目(6976) 作者简介:印勇(1963-),男,重庆市人,重庆大学副教授,博士,主要从事智能信息处理和图像处理方面的研究.

粗糙集理论与应用发展

粗糙集理论与应用发展 1、引言粗糙集( roughs ets,RS)理论是20世纪80年代初由波兰科学家Pawlak提出的[1]。其主思想就是在保持分类能力不变的前提下，通过知识约简，导出概念的分类规则。它从一个新的角度将知识定义为对论域的划分能力，并将其引入数学中的等价关系来进行讨论，从而为数据分析，特别是不精确、不完整数据分析提供了一套新的数学方法。同时，粗糙集理论具有无需提供除问题所需处理的数据集合之外的任何先验信息，仅根据观测数据删除冗余信息，比较不完整知识的程度—粗糙度、属性间的依赖性与重要性，抽取分类规则等的能力。近几年，这个理论已得到空前的发展，无论在理论本身研究方面，还是在理论应用方面都取得了令人瞩目的成果。 2、粗糙集理论简介粗糙集理论是建立在分类机制的基础之上的，不可区分关系的概念是粗糙集理论的基础。信息系统S由论域U和等价关系集A构成，表示成S=(U,A)，不可区分关系ind(A)是信息系统S上的一个等价关系，它是A上全部等价关系的交集。信息系统S所表示的知识可理解为*对论域U划分的结果。不可区分关系的等价类构成了信息系统表示的知识的最小粒度，这个粒度内的对象不可区分。正是由于知识的粒度性，造成使用已有知识不能精确地表示某些概念。为此，在不可区分关系基础上定义了上下近似，使粗糙集理论能够有效地逼近这些概念。令XCU是论域上对象的一个集合，BCA是一族等价关系，CXIs表示元素x在B 下的等价类，则B( X )二 {xEU}Cxls(=X)B( X) 二

模糊集与粗糙集的简单入门

模糊集与粗糙集的简单入门 1.前言 Zadeh在1965年创立了模糊集理论[1],Pawlak在1982年又给出了粗糙集的概念[2],模糊集理论和粗糙集理论都是研究信息系统中只是不完全,不确定问题的两种方法,是经典集合论的推广,它们各自具有优点和特点,并且分别在许多领域都有成功的应用,如模式识别、机器学习、决策分析、决策支持、知识获取、知识发现等.模糊理论是简历集合的子集边缘的病态定义模型,隶属函数多数是凭经验给出的,带有明显的主观性;粗糙集理论基于集合中对象间的不可分辨行的思想,作为一种刻画不完整想和不确定性的数学工具,它无需任何先验信息,能邮箱分析处理不精确、不完整等不完备信息,对不确定集合的分析方法是客观的.两种理论之间有着密切的关系和很强的互补性,同事粗糙集理论和模糊集理论可以进行结合,产生粗糙模糊集理论和模糊粗糙集理论,并且发挥着不同的优势. 本文在已有的模糊集理论和粗糙集理论的基础之上,分析和总结了模糊集和粗糙集理论,对二者进行了全面的比较. 2.基本概念这部分将集中介绍模糊集和粗糙集的基本概念及其性质. 2.1模糊集模糊理论[3][4]是一种用以数学模型来描述语意式的模糊信息的方法.模糊概念也是没有明确外延的概念.根据普通集合论的要求,一个对象对应于一个集合,要么属于,要么不属于,二者必居其一;而模糊集则通常用隶属函数表示模糊概念.

2.1.1模糊集合的基本定义定义 1 设X 是有限非空集合,称为论域,X 上的模糊集 A 用隶属函数表示如下: :[0,1], ()A X x A x →→ 其中()A x 表示元素x 隶属于模糊集合A 的程度,记X 上的模糊集合全体为()F X . 模糊集合的数学表示方式为 {(,(x))|}, ()[0,1]A x A x X where A x =∈∈ 2.1.2模糊集合的运算设,A B 为X 上的两个模糊集,它们的并集,交集和余集都是模糊集,且其隶属函数分别定义为 max{(),()} A B A x B x x X =?∈ min{(),()} A B A x B x x X =?∈ 1A A ?=- 2.1.3 模糊集合的关系模糊集合之间关系的表示方式,是以集合所存在的隶属函数(),()A x B x 作为集合之间的关系表示的. (1) 模糊集合之间的相等: ()() A B A x B x x X =?=?∈ (2) 模糊集合之间的包含: ()() A B A x B x x X ??≤?∈

基于变精度粗糙集理论的知识约简方法

2004年1月系统工程理论与实践第1期　文章编号:100026788(2004)0120076207 基于变精度粗糙集理论的知识约简方法米据生1,2,吴伟志1,张文修1 (1.西安交通大学理学院信息与系统科学研究所,陕西西安710049;2.河北师范大学数学与信息科学学院,河北石家庄050016) 摘要:　基于变精度粗糙集理论与包含度理论,引入了不协调目标信息系统的上、下分布约简的概念,并讨论了它们之间的关系.上(下)分布约简是保持每个决策类的上(下)近似不变的最小属性集,由约简系统产生的命题规则与由原系统产生的命题规则是相容的,即约简不会改变由对象所产生的规则的决策结果.通过对这两种知识约简的等价刻画,得到了上、下分布知识约简的判定定理和可辨识属性矩阵, 从而提供了不协调目标信息系统知识约简的新方法. 关键词:　变精度粗糙集;知识约简;信息系统;协调集中图分类号:　T P18 文献标识码:　A Know ledge R educts Based on V ariab le P recisi on Rough Set T heo ry M I J u2sheng1,2,W U W ei2zh i1,ZHAN G W en2x iu1 (1.In stitu te fo r Info rm ati on and System Sciences,Facu lty of Science,X i’an J iao tong U n iversity,X i’an710049,Ch ina;2. Co llege of M athem ath is and Info rm ati on Science,H ebei N o rm al U n iversity,Sh ijiazhuang050016,Ch ina) Abstract:　T he m ain ob jective of the paper is to in troduce som e new concep ts of know ledge reducti on based on variab le p recisi on rough set theo ry such as upper distribu ti on reducti on and low er distribu ti on reducti on.T he decisi on ru les derived from the distribu ti on con sisten t set are compatib le w ith the ones derived from o riginal system.T heir equ ivalen t defin iti on s are studied.T he relati on sh i p s among alterna2 tive reducts in incon sisten t info rm ati on system s are discu ssed.T he judgem en t theo rem s and discern ib ili2 ty m atrixes w ith respect to upper and low er reducti on s are ob tained.So one can calcu lates the reducts by the discern ib ility fo rm u las.T hese resu lts are m ean ingfu l bo th in the theo ry and in app licati on s. Key words:　variab le p recisi on rough set;info rm ati on system;know ledge reducti on;con sisten t set 知识发现是人工智能的核心问题之一,它是从信息系统中识别正确、新颖、有潜在应用价值并最终可为人们所理解的模式的方法.粗糙集理论提供了知识发现的一种数学方法.由于这一理论的广泛应用,它越来越引起国际学术界的关注. 知识约简是知识发现的重要课题,因而也是粗糙集理论的核心问题之一.目前,信息系统的知识约简大多是在Paw lak粗糙集模型下进行的[1-7].Paw lak粗糙集模型的一个局限性是它所处理的分类必须是完全正确的或肯定的,因而它的分类是精确的,亦即只考虑完全“包含”与“不包含”,而没有某种程度上的“包含”与“属于”.Paw lak粗糙集模型的另一个局限性是它所处理的对象是已知的,且从模型中得到的结论仅适用于这些对象.但在实际应用中,往往需要把从小规模对象集中得到的结论应用于大规模对象集上去.Paw lak粗糙集模型的这些局限性限制了它的应用.近年来,许多学者从多方面推广了这一模型. Ziarko于1993年提出了变精度粗糙集模型.在这个模型中,给定一个阈值,当对象所在的等价类在某种程度上包含于集合X中时,就认为这个对象属于X.这一推广在应用上是非常重要的,因为在实际问题收稿日期:2002211218 资助项目:国家自然科学基金(10271039);973项目(2002CB312206) 作者简介:张文修(1940-),男,教授,博士生导师,中国数学会常务理事.研究方向:应用概率论,人工智能的数学基础等;米据生(1966-),男,副教授,博士生.研究方向:人工智能的数学基础,粗糙集与随机集;吴伟志(1964-),男,副教授,博士生.研究方向:人工智能的数学基础,粗糙集与随机集

粗糙集理论与其它不确定理论的比较分析

文章编号:1672-6197(2004)04-0007-05 粗糙集理论与其它不确定理论的比较分析程钧谟1, 綦振法1,徐福缘2,段福兴1 (1.山东理工大学管理学院,山东淄博255049;2.上海理工大学管理学院,上海200093) 摘　要:粗糙集理论作为一门新兴的不确定理论正越来越受到人们的关注.在介绍粗糙集理论基本内容的基础上,对粗糙集理论与模糊理论、随机理论、灰色理论等其它不确定理论的差异性进行了分析,同时讨论了它们之间的互补性问题并构建了相应的互补模型,最后,指出了粗糙集理论对于进一步丰富和完善不确定理论体系的重要性. 关键词:粗糙集理论;模糊理论;随机理论;灰色理论;差异性中图分类号:O159 文献标识码:A R elative analysis on rough set theory and other uncertain theories CHEN G J un 2mo 1,Q I Zhen 2fa 1,XU Fu 2yuan 2,DUAN Fu 2xing 1 (1.School of Management ,Shandong University of Technology ,Z ibo 255049,China 2.School of Management ,Shanghai University for Science and Technology ,Shanghai 200093,China ) Abstract :As a new uncertainty theory ,the rough set theory is engaging more and more people ’s attention.The basic concepts of rough set are introduced.On the base of this ,the difference be 2tween the rough theory and other uncertain theories such as fuzzy theory ,random theory and grey theory is analyzed.At the same time ,the complementary problems are discussed and the comple 2mentary models are established.At last ,the importance of the rough theory on making the indefi 2nite theory perfect is pointed out.K ey w ords :rough theory ;fuzzy theory ;random theory ;grey theory ;difference 管理活动是由一系列决策组成的.在市场竞争非常激烈的今天,无论企业或个人都经常面临复杂的决策问题,不仅需要快速做出决策,而且需要分析与解决决策问题中多重不确定性所带来的困难.一个管理者的决策有效与否,很大程度上取决于他是否拥有适应这种复杂化的决策思想和方法.目前,不确定性决策问题已普遍存在于管理科学、信息科学、系统科学、计算机科学、知识工程及可靠性技术等众多领域,其表现形式也是多种多样的,如随机性、模糊性、灰色性、粗糙性、模糊随机性、粗糙模糊性以及其它多重不确定性.虽然已有的随机理论[1]、模糊理论[2,3]、灰色理论[4]可以解决一部分随机决策、模糊收稿日期:2004-03-23 基金项目:国家863资助项目(2002AA414310);国家自然科学基金项目(70072020);山东省重点社科项目(03BJ Z12) 作者简介:程钧谟(1964-),男,教授,博士研究生. 第18卷第4期山　东　理　工　大　学　学　报(自然科学版) Vol.18No.42004年7月 Journal of Shandong University of Technology (Sci &Tech ) J ul.2004

粗糙集理论RS

RS理论一、定义：粗糙集理论，是继概率论、模糊集、证据理论之后的又一个处理不确定性的数学工具。它是当前国际上人工智能理论及其应用领域中的研究热点之一。在自然科学、社会科学和工程技术的很多领域中，都不同程度地涉及到对不确定因素和对不完备（imperfect) 信息的处理。从实际系统中采集到的数据常常包含着噪声，不够精确甚至不完整，对这些信息进行合适地处理，常常有助于相关实际系统问题的解决。二、对比的理论：模糊集和基于概率方法的证据理论是处理不确定信息的两种方法，已应用于一些实际领域。但这些方法有时需要一些数据的附加信息或先验知识，如模糊隶属函数、基本概率指派函数和有关统计概率分布等，而这些信息有时并不容易得到。概率与统计、证据理论：理论上还难以令人信服，不能处理模糊和不完整的数据。模糊集合理论：能处理模糊类数据，但要提供隶属函数（先验知识）。 RS理论与其他处理不确定和不精确问题理论的最显著的区别是：它无需提供问题所需处理的数据集合之外的任何先验信息，所以对问题的不确定性的描述或处理可以说是比较客观的。由于这个理论未能包含处理不精确或不确定原始数据的机制，所以这个理论与概率论、模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。三、不足：粗糙集理论还处在继续发展之中，尚有一些理论上的问题需要解决，诸如用于不精确推理的粗糙逻辑（Rough logic) 方法，粗糙集理论与非标准分析（Nonstandard analysis) 和非参数化统计（Nonparametric statistics）等之间的关系等。四、由来： 1982年波兰学者Z. Paw lak 提出了粗糙集理论——它是一种刻画不完整性和不确定性的数学工具，能有效地分析不精确，不一致（inconsistent)、不完整（incomplete) 等各种不完备的信息，还可以对数据进行分析和推理，从中发现隐含的知识，揭示潜在的规律。五、特点： (1) 它能处理各种数据，包括不完整（incomplete) 的数据以及拥有众多变量的数据； (2) 它能处理数据的不精确性和模棱两可（ambiguity），包括确定性和非确定性的情况； (3) 它能求得知识的最小表达（reduct) 和知识的各种不同颗粒（granularity) 层次； (4) 它能从数据中揭示出概念简单，易于操作的模式（pattern) ; (5) 它能产生精确而又易于检查和证实的规则，特别适于智能控制中规则的自动生成. 在粗糙集理论中，“知识”被认为是一种分类能力。粗糙集理论的主要思想是利用已知的知识库，将不精确或不确定的知识用已知的知识库中的知识来（近似）刻画。它的一个重要特点是具有很强的数据定性分析能力,可直接对不完整性和不确定性的数据进行分析处理,提取有用属性,简化知识表达式。六、前景将粗糙集与其它软计算方法（如模糊集，人工神经网络，遗传算法等）相综合，发挥出各自的优点，可望设计出具有较高的机器智商（MIQ) 的混合智能系统(Hybrid Intelligent System），这是一个值得努力的方向。软计算（sof t compu t ing) 的概念是由模糊集创始人Zadeh[ 9 ]提出的. 软计算中的主要工具包括粗糙集，模糊逻辑（FL),神经网络(NN），概率推理（PR），信度网络（Belief Networks），遗传算法（GA) 与其它进化优化算法，混沌（Chaos) 理论等. 传统的计算方法即所谓的硬

粗糙集理论论文

粗糙集理论浅析粗糙集理论，是继概率论、模糊集、证据理论之后的又一个处理不确定性的数学工具。作为一种较新的软计算方法，粗糙集近年来越来越受到重视，其有效性已在许多科学与工程领域的成功应用中得到证实，是当前国际上人工智能理论及其应用领域中的研究热点之一。在很多实际系统中均不同程度地存在着不确定性因素，采集到的数据常常包含着噪声，不精确甚至不完整。一、引言粗糙集作为一种处理不精确、不确定与不完全数据的新的数学理论, 最初是由波兰数学家Z. Paw lak于1982年提出的。由于最初关于粗糙集理论的研究大部分是用波兰语发表的, 因此当时没有引起国际计算机学界和数学界的重视, 研究地域也仅局限在东欧一些国家, 直到20世纪80年代末才逐渐引起各国学者的注意。近几年来, 由于它在机器学习与知识发现、数据挖掘、决策支持与分析等方面的广泛应用, 研究逐渐趋热。1992年, 第一届关于粗糙集理论国际学术会议在波兰召开。1995年,A CM Com 2m unication 将其列为新浮现的计算机科学的研究课题。1998年, 国际信息科学杂志( Infor2m ation Sciences) 还为粗糙集理论的研究出了一期专辑。粗糙集理论是建立在分类机制的基础上的, 它将分类理解为在特定空间上的等价关系, 而等价关系构成了对该空间的划分。粗糙集理论将知识理解为对数据的划分, 每一被划分的集合称为概念。粗糙集理论的主要思想是利用已知的知识库, 将不精确或不确定的知识用已知的知识库中的知识来(近似) 刻画。该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确或不确定原始数据的机制, 所以这个理论与概率论, 模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。二、基本概念粗糙集是一种较有前途的处理不确定性的方法，相信今后将会在更多的领域中得到应用. 但是，粗糙集理论还处在继续发展之中，正如粗糙集理论的创立人Z. Paw lak 所指出的那样，尚有一些理论上的问题需要解决，诸如用于不精确推理的粗糙逻辑（Rough logic) 方法，粗糙集理论与非标准分析（Nonstandard analysis) 和非参数化统计（Nonparametric statistics）等之间的关系等等. 将粗糙集与其它软计算方法（如模糊集，人工神经网络，遗传算法等）相综合，发挥出各自的优点，可望设计出具有较高的机器智商（M IQ) 的混合智能系统(Hybrid Intelligent System），这是一个值得努力的方向。三、粗糙集理论中的知识表示 “知识”这个概念在不同的范畴内有多种不同的含义。在粗糙集理论中，“知识”被认为是一种分类能力。人们的行为是基于分辨现实的或抽象的对象的

粗糙集理论第1章

绪论 ●20世纪80年代，波兰数学家Z.Pawlak提出粗糙集理论概率论(Probabilistic Theory)刻画概念发生的随机性(Stochastic)，模糊集理论(Fuzzy Set Theory)刻画概念的模糊性(Vagueness)，刻画概念的粗糙性(Coarseness)，即分类能力(Classification Ability)。粗糙集理论简称为粗集理论，粗糙集，或粗集。 ●一个概念越粗糙，其分类能力越差，分类得到的对象组的颗粒（granularity）越大（越粗），对象之间的可辨识性（discernibility）越差。相反地，一个概念越精细（fine），其分类能力越强，分类所得的对象组的颗粒越小，对象之间的可辨识性越好。 ●例子图像的分辨率刻画了图像质量的粗糙程度，类似粗糙集刻画了知识或概念的粗糙程度。图像中的分辨率越高，图像的可辨识性就越好，反之就越差。像素灰度刻画了图像黑白的不同程度，类似模糊集刻画了概念的模糊性。而图像上的内容则反映了某个物体出现的随机性。

第一章知识有关知识的理论已有长远和丰富的历史，Pawlak 提议把粗集理论作为讨论知识的理论框架，特别在关注不精确知识的时候。本章对“知识”这一术语给出形式化的定义，并讨论了它的一些基本特性。粗集理论对知识的基本看法：知识是人类关于事物之分类能力的深层次刻画。论域(universe of discourse )：真实世界或抽象世界被称为论域. 定义1.1 设论域U 是非空有限集合，U 中元素是论域中感兴趣的对象。对?X ? U ，称其为U 的一个概念或范畴（category ）。称U 的任意概念簇为U 的抽象知识或知识。为便于形式推理，允许空集 ? 作为一个概念。本书我们的主要兴趣在于形成某论域的一个划分（partition ）或分类（classification ）的概念。（在本书中有：划分分类，划分与分类是两个等价的概念）定义1.2 U 为论域，若概念簇C = {X i | X i ?U ，X i ≠ ?，i = 1，2，…，n} 满足： ⑴ 对于i ，j = 1，2，…，n ，i≠j ，X i ∩X j = ? ⑵ 1 n i i X U == 则称C 为U 的一个划分或分类。通常我们不处理论域U 上的单个分类，而是处理论域U 上的一些分类簇（划分簇）. 称U 上的一个分类簇为U 上的一个知识库。