粗糙集基本概念
- 格式:doc
- 大小:155.00 KB
- 文档页数:7
粗糙集理论
粗糙集理论
1 粗糙集的基本概念
在粗糙集理论中,我们把知识看做是⼀种能被⽤于分类对象的能⼒。
其中对象可以代表现实世界中的任意事物,包括物品、属性、概念等。
即:知识需要同现实世界中特定环境的确定对象相关联,这⼀集合称为论域。
知识与概念
令U为包含若⼲对象的⾮空有限集,也即论域,在论域中,称任意集合为⼀个概念或范畴。
特别地,我们把空集也视为⼀个概念,称之为空概念。
⽽由任意个这样的X组成的⼦集簇形成了U中抽象知识,简称为知识。
知识库
在给定论域中,任意选择⼀个等价关系集R,我们可以得到⼀个⼆元组K=<U,R>,称这样的⼆元组视为⼀个知识库(近似空间)。
在论域中,任何等价关系都能导出⼀个对论域的划分,从⽽形成了⼀个知识库。
由此,每个知识库就能够与论域中的某个等价类⼀⼀对应。
不可分辨(不可区分/不分明)关系
在给定的论域U上,任意选择⼀个等价关系集R和R的⼦集,且,则P中所有等价关系的交集依然是论域U中的等价关系,称该等价关系为P 的不可分辨关系,记作IND(P)。
并且
:表⽰⾮空⼦族集所产⽣的不分明关系IND(P)的所有等价类关系的集合,⼜称该知识为知识库K=<U,R>中关于P-基本知识(P-基本集)集合的上下近似
上近似包含了所有那些可能是属于X的元素,下近似包含了所有使⽤知识R可确切分类到X的元素。
在给定的知识库K=<U,R>中,任意选择集合,可以定于X关于知识R的上下近似。
粗糙集理论的基本概念与原理粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它的提出源于20世纪80年代初期的波兰学者Zdzisław Pawlak。
粗糙集理论的核心思想是通过将数据划分成不同的等价类,来描述和处理不完全和不确知的信息。
本文将介绍粗糙集理论的基本概念与原理。
1. 粗糙集的定义与等价关系粗糙集是指将一个数据集划分成若干个等价类,其中每个等价类称为一个粗糙集。
在粗糙集理论中,等价关系是一个重要的概念。
等价关系是指具有自反性、对称性和传递性的关系。
在粗糙集理论中,等价关系用来描述数据中的相似性和差异性。
2. 上近似集与下近似集上近似集是指在一个粗糙集中,包含了所有与该粗糙集中的元素相似的元素。
下近似集是指在一个粗糙集中,包含了所有与该粗糙集中的元素不相似的元素。
上近似集和下近似集是粗糙集理论中的两个重要概念,它们用来描述数据的粗糙性和不确定性。
3. 约简与精确度约简是粗糙集理论中的一个重要操作,它的目的是通过删除一些不必要的属性或条件,从而减少数据集的复杂性,提高数据的处理效率。
约简可以通过删除一些不重要或不相关的属性来实现。
精确度是用来评估数据集的质量和可靠性的指标,粗糙集理论通过约简来提高数据集的精确度。
4. 粗糙集与模糊集粗糙集理论与模糊集理论有一些相似之处,但也存在一些差异。
模糊集理论是一种用来处理模糊和不确定性问题的数学工具,它通过给每个元素赋予一个隶属度来描述元素的模糊性。
而粗糙集理论是一种用来处理不完全和不确知信息的数学工具,它通过将数据划分成不同的等价类来描述数据的粗糙性。
5. 粗糙集的应用领域粗糙集理论在许多领域中都有广泛的应用。
在数据挖掘领域,粗糙集理论可以用来处理不完全和不确定的数据。
在人工智能领域,粗糙集理论可以用来处理模糊和不确定性问题。
在决策支持系统领域,粗糙集理论可以用来辅助决策过程。
在模式识别领域,粗糙集理论可以用来提取和分类模式。
总结:粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它通过将数据划分成不同的等价类来描述和处理不完全和不确知的信息。
粗糙集理论简介及基本概念解析粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它由波兰学者Pawlak于1982年提出。
粗糙集理论的核心思想是通过对数据进行粗糙化处理,将不完全、不确定的信息转化为可处理的粗糙集,进而进行数据分析和决策。
粗糙集理论的基本概念包括:粗糙集、等价关系、下近似集和上近似集。
首先,粗糙集是指在不完全信息条件下,通过将数据进行粗糙化处理得到的集合。
粗糙集可以看作是原始数据的一个近似描述,它包含了原始数据的一部分信息。
粗糙集的构建是通过等价关系来实现的。
其次,等价关系是粗糙集理论中的一个重要概念。
等价关系是指在给定的数据集中,将数据划分为若干等价类的关系。
等价关系的划分可以通过相似性度量来实现,相似性度量可以是欧氏距离、余弦相似度等。
等价关系的划分可以将原始数据进行分类,从而构建粗糙集。
下面,我们来介绍下近似集和上近似集。
下近似集是指在给定的粗糙集中,对于某个特定的属性或条件,能够确定的元素的集合。
换句话说,下近似集是能够满足某个条件的元素的集合,它是粗糙集的一个子集。
而上近似集是指在给定的粗糙集中,对于某个特定的属性或条件,可能满足的元素的集合。
上近似集是包含下近似集的最小集合,它是粗糙集的一个超集。
粗糙集理论的应用非常广泛,特别是在数据挖掘和模式识别领域。
通过粗糙集理论,可以对大量的数据进行处理和分析,从中发现隐藏的规律和模式。
粗糙集理论可以用于特征选择、属性约简、数据分类等任务,为决策提供有力支持。
总结起来,粗糙集理论是一种处理不确定性和模糊性问题的数学工具。
它通过粗糙化处理将不完全、不确定的信息转化为可处理的粗糙集,进而进行数据分析和决策。
粗糙集理论的基本概念包括粗糙集、等价关系、下近似集和上近似集。
粗糙集理论在数据挖掘和模式识别领域有着广泛的应用,可以用于特征选择、属性约简、数据分类等任务。
通过粗糙集理论,我们可以更好地理解和处理不确定性和模糊性问题,为决策提供有力支持。
粗糙集理论中常见问题的解答和解决方法粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,被广泛应用于数据挖掘、模式识别和智能决策等领域。
然而,在实际应用中,粗糙集理论也会遇到一些常见问题,本文将对这些问题进行解答和解决方法的探讨。
一、粗糙集理论的基本概念和原理在介绍常见问题之前,我们先简要回顾一下粗糙集理论的基本概念和原理。
粗糙集理论是由波兰学者Pawlak于1982年提出的,它的核心思想是通过粗糙集近似描述不完备和不确定信息。
在粗糙集理论中,一个对象的属性集合可以分为确定属性和不确定属性两部分,其中确定属性是指在给定条件下可以唯一确定对象的属性,而不确定属性则是指在给定条件下无法唯一确定对象的属性。
二、粗糙集理论中的常见问题1. 属性约简问题在实际应用中,属性的数量往往非常庞大,这给数据处理和分析带来了困难。
属性约简是粗糙集理论中的一个重要问题,它的目标是从给定的属性集合中找出最小的属性子集,保持数据集的分类能力不变。
常见的属性约简算法包括基于启发式搜索的算法、基于遗传算法的算法和基于粒子群优化算法的算法等。
2. 缺失数据处理问题在实际应用中,数据集中往往存在着缺失数据,这给数据分析和挖掘带来了困难。
缺失数据处理是粗糙集理论中的一个重要问题,它的目标是通过合理的方法来填补缺失数据,以保证数据分析的准确性和可靠性。
常见的缺失数据处理方法包括基于属性约简的方法、基于相似度计算的方法和基于决策树的方法等。
3. 粗糙集分类器设计问题粗糙集分类器是粗糙集理论中的一个重要研究方向,它的目标是通过给定的属性集合和决策表,构建一个能够对未知样本进行分类的分类器。
粗糙集分类器设计问题涉及到属性选择、规则提取和决策表压缩等方面。
常见的粗糙集分类器设计方法包括基于属性约简的方法、基于粗糙集近似的方法和基于粒子群优化算法的方法等。
三、粗糙集理论中常见问题的解决方法1. 属性约简问题的解决方法属性约简问题可以通过启发式搜索算法来解决。
粗糙集理论的使用方法和步骤粗糙集理论是一种用于处理不完全、不确定和模糊信息的数学工具,它在决策分析、数据挖掘和模式识别等领域具有广泛的应用。
本文将介绍粗糙集理论的使用方法和步骤,帮助读者更好地理解和应用这一理论。
一、粗糙集理论的基本概念粗糙集理论是由波兰学者Pawlak于1982年提出的,它的核心思想是通过对数据集进行粗糙化处理,找出数据集中的重要信息,从而进行决策和分析。
在粗糙集理论中,数据集由属性和决策组成,属性是描述对象的特征,决策是对对象进行分类或判断的结果。
二、粗糙集理论的步骤1. 数据预处理:在使用粗糙集理论之前,需要对原始数据进行预处理。
预处理包括数据清洗、数据变换和数据归一化等步骤,旨在提高数据的质量和可用性。
2. 属性约简:属性约简是粗糙集理论的核心步骤之一。
在属性约简过程中,需要根据属性的重要性对属性进行选择和优化。
常用的属性约简方法有基于信息熵的属性约简和基于模糊熵的属性约简等。
3. 决策规则的生成:在属性约简完成后,可以根据属性和决策之间的关系生成决策规则。
决策规则是对数据集中的决策进行描述和判断的规则,可以帮助决策者进行决策和分析。
4. 决策规则的评价:生成的决策规则需要进行评价和优化。
常用的决策规则评价方法有支持度和置信度等指标,通过对决策规则进行评价,可以提高决策的准确性和可靠性。
5. 决策与分析:最后一步是根据生成的决策规则进行决策和分析。
根据决策规则,可以对新的数据进行分类和判断,从而帮助决策者做出正确的决策。
三、粗糙集理论的应用案例粗糙集理论在实际应用中具有广泛的应用价值。
以电商平台为例,可以使用粗糙集理论对用户行为进行分析和预测。
首先,对用户的行为数据进行预处理,包括清洗和归一化等步骤。
然后,通过属性约简找出用户行为中的关键属性,如浏览时间、购买频率等。
接下来,根据属性和决策之间的关系生成决策规则,如用户购买商品的决策规则。
最后,根据生成的决策规则对新的用户行为进行分类和分析,从而提供个性化的推荐和服务。
粗糙集理论简介及基本原理粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它由波兰数学家Pawlak于1982年提出。
粗糙集理论的核心思想是通过对数据进行粗糙化,将数据集划分为不同的等价类,以便更好地理解和描述数据的特征和规律。
粗糙集理论的基本原理是基于信息的不完备性和不确定性。
在现实世界中,我们往往无法获取到完整和精确的信息,数据中可能存在噪声、缺失或冲突等问题。
粗糙集理论通过对数据进行粗糙化,将不确定的数据转化为一组等价类,从而更好地处理这些问题。
粗糙集理论的核心概念是粗糙集和约简。
粗糙集是指在数据集中,存在一些元素无法被确定地分类到某个等价类中,即存在不确定性。
而约简则是指通过消除冗余和保留核心信息,将原始数据集简化为一个更小的等价类集合。
通过约简,我们可以减少数据集的复杂性,提取出数据中的关键特征和规律。
在粗糙集理论中,最常用的方法是基于属性约简。
属性约简是指通过选择一部分重要的属性,来代表整个数据集的特征和规律。
在实际应用中,数据集往往包含大量的属性,其中某些属性可能是冗余的或无关的。
通过属性约简,我们可以提取出最具代表性的属性,从而减少数据集的维度和复杂性。
粗糙集理论在各个领域都有广泛的应用。
在数据挖掘领域,粗糙集理论可以用于特征选择、分类和聚类等任务。
通过约简,我们可以选择出最具代表性的特征,从而提高分类和聚类的准确性和效率。
在决策支持系统中,粗糙集理论可以用于帮助决策者进行决策分析和风险评估。
通过对数据进行粗糙化和约简,我们可以更好地理解和描述决策问题,从而提供决策支持。
总之,粗糙集理论是一种处理不确定性和模糊性问题的有效工具。
它通过对数据进行粗糙化和约简,提取出数据的核心特征和规律,从而帮助我们更好地理解和处理现实世界中的复杂问题。
粗糙集理论在各个领域都有广泛的应用,为我们提供了一种全新的思维方式和分析工具。
粗糙集理论及其应用研究粗糙集理论及其应用研究引言:粗糙集理论是20世纪80年代由波兰学者泽德·帕瓦尔斯基(Zdzisław Pawlak)提出的一种处理不完全信息的数学方法。
粗糙集理论的引入为我们解决现实世界中模糊、不确定、随机等问题提供了一个简单有效的工具。
本文旨在介绍粗糙集理论的基本原理,并讨论其在数据分析、特征选择和模式识别等领域的应用研究。
一、基本原理:1.1 粗糙集的定义粗糙集是一种集合比较的数学模型,它考虑了属性之间的相互依存关系。
在一个给定的信息系统中,粗糙集可以将对象划分为等价类,每个等价类都对应于一个决策规则。
粗糙集的核心思想是通过扩充等价关系来处理不完全信息,以获得更多的可信信息。
1.2 粗糙集的属性约简属性约简是粗糙集理论的核心问题之一,主要用于减少数据集中的冗余属性。
通过属性约简,可以提高数据集的处理效率并提取出更具有实际意义的属性集。
属性约简的过程包括求解下近似、上近似以及确定决策属性等环节。
二、应用研究:2.1 数据分析粗糙集理论在数据分析中有着广泛的应用。
通过建立一个信息系统,我们可以将数据集划分为等价类,从而更好地理解数据特征之间的相互关系。
粗糙集的属性约简技术可以帮助我们减少数据集中的属性数量,提高数据分析的效率。
同时,基于粗糙集的决策规则可以为决策支持系统提供可靠的决策依据。
2.2 特征选择特征选择在数据挖掘中起着重要的作用。
通过使用粗糙集理论,我们可以从海量的特征中选择出最有价值的特征,从而提高分类器的效果。
粗糙集的属性约简方法可以帮助我们消除冗余特征,减少特征空间的维度。
同时,粗糙集的属性约简技术可以提供更好的特征排序评估指标,帮助我们找到最重要的特征组合。
2.3 模式识别粗糙集理论在模式识别中的应用也备受关注。
通过建立一个信息系统,我们可以将模式集合划分为等价类,然后根据粗糙集的思想确定决策规则。
这个过程可以帮助我们识别出不同模式之间的相似性和差异性。
粗糙集理论的入门指南粗糙集理论是数学领域中的一种理论,它源于20世纪80年代的波兰学者Zdzisław Pawlak的研究工作。
粗糙集理论被广泛应用于数据挖掘、模式识别、决策分析等领域,它提供了一种处理不完备、模糊和不确定信息的方法。
一、粗糙集理论的基本概念在了解粗糙集理论之前,我们需要了解一些基本概念。
粗糙集理论主要涉及到以下几个概念:1. 上近似和下近似:粗糙集理论中的一个核心概念是近似。
给定一个数据集,上近似是指用最少的信息来描述数据集中的对象,下近似是指用最多的信息来描述数据集中的对象。
2. 等价关系:在粗糙集理论中,等价关系是指将数据集中的对象划分为不同的等价类。
等价关系可以用来描述数据集中的相似性。
3. 决策属性:决策属性是指在数据集中用来区分不同类别的属性。
在粗糙集理论中,决策属性是决策规则的基础。
二、粗糙集理论的应用粗糙集理论在实际应用中具有广泛的应用价值。
以下是一些常见的应用领域:1. 数据挖掘:粗糙集理论可以用于数据挖掘中的特征选择和分类问题。
通过分析数据集中的属性之间的关系,可以找到最具有代表性的属性,从而提高数据挖掘的效果。
2. 模式识别:粗糙集理论可以用于模式识别中的特征提取和模式分类。
通过对数据集中的特征进行分析,可以提取出最具有代表性的特征,从而实现模式的识别。
3. 决策分析:粗糙集理论可以用于决策分析中的决策规则的生成和评估。
通过对数据集中的属性进行分析,可以生成一组决策规则,从而帮助决策者做出正确的决策。
三、粗糙集理论的优点和局限性粗糙集理论作为一种处理不完备、模糊和不确定信息的方法,具有以下优点:1. 简单易懂:粗糙集理论的基本概念和方法相对简单,易于理解和应用。
2. 适用范围广:粗糙集理论可以应用于各种领域,包括数据挖掘、模式识别、决策分析等。
然而,粗糙集理论也存在一些局限性:1. 计算复杂度高:在处理大规模数据集时,粗糙集理论的计算复杂度较高,需要消耗大量的计算资源。
如何运用粗糙集理论解决多目标优化问题引言:多目标优化问题是现实生活中常见的一类问题,例如在工程设计、金融投资和物流规划等领域都存在着需要同时优化多个目标的情况。
然而,由于多目标优化问题的复杂性,传统的优化方法往往难以找到全局最优解。
为了解决这一问题,粗糙集理论被提出并广泛应用于多目标优化问题的求解中。
本文将介绍粗糙集理论的基本概念和原理,并探讨其在多目标优化问题中的应用。
一、粗糙集理论的基本概念粗糙集理论是由波兰学者Zdzislaw Pawlak于1982年提出的一种数学工具,用于处理不确定性和不完备性信息。
粗糙集理论的核心思想是通过对数据集进行粗糙划分,找到属性间的依赖关系,从而实现对数据的分类和决策。
1.1 上近似与下近似在粗糙集理论中,上近似和下近似是两个基本概念。
上近似是指用属性集合A 来描述目标集合B的能力,即用A的属性来近似B。
下近似是指用属性集合A来刻画目标集合B的不确定性,即用A的属性来低估B。
1.2 粗糙集的约简粗糙集的约简是指在保持粗糙集属性的情况下,通过删除冗余属性来降低属性集合的复杂性。
粗糙集的约简可以提高数据集的处理效率,并减少决策过程中的不确定性。
二、粗糙集理论在多目标优化问题中的应用多目标优化问题的特点是存在多个冲突的目标,传统的优化方法往往难以找到全局最优解。
粗糙集理论通过对数据的粗糙划分和属性的约简,可以有效地处理多目标优化问题。
2.1 数据的粗糙划分粗糙集理论可以将多目标优化问题中的数据集进行粗糙划分,找到目标之间的依赖关系。
通过对数据的粗糙划分,可以降低问题的复杂性,并减少搜索空间。
2.2 属性的约简多目标优化问题中存在多个目标,每个目标都有一组属性。
粗糙集理论可以通过属性的约简,找到目标之间的关联性,从而减少目标之间的冲突。
属性的约简可以降低问题的维度,提高优化效率。
2.3 求解多目标优化问题在利用粗糙集理论求解多目标优化问题时,可以采用遗传算法、模拟退火算法等优化算法。
一种对集合A的划分就对应着关于A中元素的一个知识
面对日益增长的数据库,人们将如何从这些浩瀚的数据中找出有用的知识?我们如何将所学到的知识去粗取精?什么是对事物的粗线条描述什么是细线条描述?
粗糙集合论回答了上面的这些问题。
要想了解粗糙集合论的思想,我们先要了解一下什么叫做知识?假设有8个积木构成了一个集合A,我们记:
A={x1,x2,x3,x4,x5,x6,x7,x8},每个积木块都有颜色属性,按照颜色的不同,我们能够把这堆积木分成
R1={红,黄,兰}三个大类,那么所有
红颜色的积木构成集合X1={x1,x2,x6},
黄颜色的积木构成集合X2={x3,x4},
兰颜色的积木构成集合X3={x5,x7,x8}。
按照颜色这个属性我们就把积木集合A进行了一个划分(所谓A的划分就是指对于A中的任意一个元素必然属于且仅属于一个分类),那么我们就说颜色属性就是一种知识。
在这个例子中我们不难看到,一种对集合A的划分就对应着关于A中元素的一个知识,假如还有其他的属性,比如还有形状R2={三角,方块,圆形},大小R3={大,中,小},这样加上R1属性对A构成的划分分别为:
A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}}(颜色分类)
A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}}(形状分类)
A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}}(大小分类)
上面这些所有的分类合在一起就形成了一个基本的知识库。
那么这个基本知识库能表示什么概念呢?除了红的{x1,x2,x6}、大的{x1,x2,x5}、三角形的{x1,x2}这样的概念以外还可以表达例如
大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2},
大三角{x1,x2,x5}∩{x1,x2}={x1,x2},
兰色的小的圆形({x5,x7,x8}∩{x3,x4,x7}∩
{x3,x4,x6,x7}={x7},
兰色的或者中的积木{x5,x7,x8}∪
{x6,x8}={x5,x6,x7,x8}。
而类似这样的概念可以通过求交运算得到,比如X1与Y1的交就表示红色的三角形。
所有的这些能够用交、并表示的概念以及加上上面的三个基本知识(A/R1,A/R2.A/R3)一
起就构成了一个知识系统记为R=R1∩R2∩R3,它所决定的所有知识是
A/R={{x1,x2},{x3},{x4},{x5},{x6},{x7},{x8}}以及
A/R中集合的并。
下面考虑近似这个概念。
假设给定了一个A上的子集合X={x2,x5,x7},那么用我们的知识库中的知识应该怎样描述它呢?红色的三角?****的大圆?都不是,无论是单属性知识还是由几个知识进行交、并运算合成的知识,都不能得到这个新的集合X,于是我们只好用我们已有的知识去近似它。
也就是在所有的现有知识里面找出跟他最像的两个一个作为下近似,一个作为上近似。
于是我们选择了“兰色的大方块或者兰色的小圆形”这个概念:{x5,x7}作为X的下近似。
选择“三角形或者兰色的”
{x1,x2,x5,x7,x8}作为它的上近似,值得注意的是,下近似集是在那些所有的包含于X的知识库中的集合中求并得到的,而上近似则是将那些包含X的知识库中的集合求并得到的。
一般的,我们可以用下面的图来表示上、下近似的概念。
这其中蓝色曲线围的区域是X的区域,紫色曲线围的部分是内部参考消息,是下近似,红色曲线围的内部部分就是上近似集。
其中各个小方块可以被看成是论域上的知识系统所构成的所有划分。
整个粗集理论的核心就是上面说的有关知识、集合的划分、近似集合等等概念。
下面我们讨论一下关于粗糙集在数据库中数据挖掘的应用问题。
考虑一个数据库中的二维表如下:
可以看出,这个表就是上面的那个例子的二维表格体现,而最后一列是我们的决策属性,也就是说评价什么样的积木稳定。
这个表中的每一行表示了类似这样的信息:红色的大三角积木稳定,****的小圆形不稳定等等。
我们可以把所有的记录看成是论域
A={x1,x2,x3,x4,x5,x6,x7,x8},任意一个列表示一个属性构成了对论域的元素上的一个划分,在划分的每一个类中都具有相同的属性。
而属性可以分成两大类,一类叫做条件属性:颜色、形状、大小都是,另一类叫做决策属性:最后一列的是否稳定?下面我们考虑,对于决策属性来说是否所有的条件属性都是有用的呢?考虑所有决策属性是
“稳定”的集合{x1,x2,x5},它在知识系统A/R中的上、下近似都是{x1,x2,x5}本身,“不稳定”的集合
{x3,x4,x6,x7,x8},在知识系统A/R中的上、下近似也都是{x3,x4,x6,x7,x8}它本身。
说明该知识库能够对这个概念进行很好的描述。
下面考虑是否所有的基本知识:颜色、形状、大小都是必要的?如果我们把这个集合在知识系统中去掉颜色这个基本知识,那么知识系统变成
A/(R-R1)={{x1,x2},{x3,x4,x7},{x5},{x6},{x8}}以及这些
子集的并集。
如果用这个新的知识系统表达“稳定”概念得到上下近似仍旧都是:{x1,x2,x5},“不稳定”概念的上下近似也还是{x3,x4,x6,x7,x8},由此看出去掉颜色属性我们表达稳定性的知识不会有变化,所以说颜色属性是多余的可以删除。
如果再考虑是否能去掉大小属性呢?这个时候知识系统就变为:
A/(R-R1-R3)=A/R2={{x1,x2},{x5,x8},{x3,x4,x6,x7}}。
同样考虑“稳定”在知识系统A/R2中的上下近似分别为:{x1,x2}和{x1,x2,x5,x8},已经和原来知识系统中的上下近似不一样了,同样考虑“不稳定”的近似表示也变化了,所以删除属性“大小”是对知识表示有影响的故而不能去掉。
同样的讨论对于“形状”属性也一样,它是不能去掉的。
最后我们得到化简后的知识库R2,R3,从而能得到下
面的决策规则:大三角->稳定,大方块->稳定,小圆->不稳定,中圆->不稳定,中方块->不稳定,利用粗集的理论还可以对这些规则进一步化简得到:大->稳定,圆->不稳定,中方块->不稳定。
这就是上面这个数据表所包含的真正有用的知识,而这些知识都是从数据库有粗糙集方法自动学习得到的。
因此,粗糙集是数据库中数据挖掘的有效方法。
从上面这个例子中我们不难看出,实际上我们只要把这个数据库输入进粗糙集运算系统,而不用提供任何先验的知识,粗糙集算法就能自动学习出知识来,这正是它能够广泛应用的根源所在。
而在模糊集、可拓集等集合论中我们还要事先给定隶属函数。
目前,粗糙集理论已经广泛的应用于知识发现、数据挖掘、智能决策、电子控制等多个领域。