一种利用属性序关系的变精度粗糙集知识约简方法
- 格式:pdf
- 大小:291.52 KB
- 文档页数:4
基于遗传算法的粗糙集知识约简摘要:知识约简是粗糙集理论的核心内容之一。
本文通过知识表达系统中条件属性对决策属性的重要性,来描述由条件属性所提供的知识对整体决策的重要程度,利用遗传算法,提出一种基于遗传算法的粗糙集知识约简方法。
关键词:遗传算法;粗糙集;知识约简粗糙集理论是一种新的处理模糊和不确定性知识的数学工具。
其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。
目前粗糙集理论已被成功地应用于机器学习、决策分析、过程控制、模式识别与数据挖掘等领域,成为近年来的热点研究方向。
知识约简是粗糙集理论的核心内容之一。
众所周知,知识库中知识(属性)并不是同等重要的,甚至其中某些知识是冗余的。
知识约简,就是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的知识,使得高维数据降为低维数据,从而有效地实现数据缩减、减少冗余信息,是知识发现中的重要步骤。
1知识约简的相关概念定义1K=(U, R)为一个知识库,其中U≠是对象的有限论域,R是U上的所有等价关系的集簇。
显然,如果P∩R,P≠,则∩P(P中所有等价关系的交集)也是一个等价关系,称为P上的不可区分关系,记为ind(P)。
定义2令R为一族等价关系,R∈R,如果ind(R)=ind(R-{R}),则称R为R中不必要的;否则R为R中必要的。
定义3如果每一个R∈R都为R中必要的,则称R为独立的;否则称R为依赖的。
定义4设Q∈P,如果Q是独立的,且ind(Q)= ind(P),则称Q为P的一个约简。
显然,P可以有多种约简。
P中所有必要关系组成的集合称为P的核,记作core(P)。
核与约简有如下关系core(P)=∩red(P)其中red(P)表示P的所有约简。
定义5令K=(U,R)为一个知识库,且P,Q∩R,当时,我们称知识Q是k(0≤k≤1)度依赖于知识P的,记作P Q 。
定义6设S=(U,A,V,f )为一个知识表达系统,A=C∪D,C∩D≠,其中C和D分别条件属性集和决策属性集,属性子集C’∩C关于D的重要性为特别当C ‘={a}时,属性a∈C关于D的重要性为传统的约简算法,主要是从粗糙集的核出发,采用启发式搜索的方法构造所含条件属性最少的约简,即最小约简。
粗糙集理论简介及基本概念解析粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它由波兰学者Pawlak于1982年提出。
粗糙集理论的核心思想是通过对数据进行粗糙化处理,将不完全、不确定的信息转化为可处理的粗糙集,进而进行数据分析和决策。
粗糙集理论的基本概念包括:粗糙集、等价关系、下近似集和上近似集。
首先,粗糙集是指在不完全信息条件下,通过将数据进行粗糙化处理得到的集合。
粗糙集可以看作是原始数据的一个近似描述,它包含了原始数据的一部分信息。
粗糙集的构建是通过等价关系来实现的。
其次,等价关系是粗糙集理论中的一个重要概念。
等价关系是指在给定的数据集中,将数据划分为若干等价类的关系。
等价关系的划分可以通过相似性度量来实现,相似性度量可以是欧氏距离、余弦相似度等。
等价关系的划分可以将原始数据进行分类,从而构建粗糙集。
下面,我们来介绍下近似集和上近似集。
下近似集是指在给定的粗糙集中,对于某个特定的属性或条件,能够确定的元素的集合。
换句话说,下近似集是能够满足某个条件的元素的集合,它是粗糙集的一个子集。
而上近似集是指在给定的粗糙集中,对于某个特定的属性或条件,可能满足的元素的集合。
上近似集是包含下近似集的最小集合,它是粗糙集的一个超集。
粗糙集理论的应用非常广泛,特别是在数据挖掘和模式识别领域。
通过粗糙集理论,可以对大量的数据进行处理和分析,从中发现隐藏的规律和模式。
粗糙集理论可以用于特征选择、属性约简、数据分类等任务,为决策提供有力支持。
总结起来,粗糙集理论是一种处理不确定性和模糊性问题的数学工具。
它通过粗糙化处理将不完全、不确定的信息转化为可处理的粗糙集,进而进行数据分析和决策。
粗糙集理论的基本概念包括粗糙集、等价关系、下近似集和上近似集。
粗糙集理论在数据挖掘和模式识别领域有着广泛的应用,可以用于特征选择、属性约简、数据分类等任务。
通过粗糙集理论,我们可以更好地理解和处理不确定性和模糊性问题,为决策提供有力支持。
粗糙集理论的属性约简方法及其在实际问题中的应用引言粗糙集理论是一种基于不确定性的数据分析方法,它通过对数据集中属性之间的关系进行分析,提供了一种有效的数据降维和特征选择的方法。
在实际问题中,属性约简是粗糙集理论的一个重要应用,它可以帮助我们从大规模的数据中提取出最为关键和有价值的属性,减少数据处理的复杂性,提高数据分析的效率和准确性。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种处理不确定性信息的数学工具,主要用于数据分析和知识发现。
粗糙集理论的核心思想是基于近似和不确定性,通过对属性之间的关系进行分析,找出属性的重要性和相关性,从而对数据进行降维和特征选择。
二、属性约简方法属性约简是粗糙集理论的一个重要应用,它可以帮助我们从大规模的数据中提取出最为关键和有价值的属性,减少数据处理的复杂性,提高数据分析的效率和准确性。
常用的属性约简方法主要有以下几种:1. 正域约简:正域约简是一种基于属性重要性的约简方法,它通过计算属性的依赖度和冗余度来评估属性的重要性,从而选择出最为重要的属性。
正域约简方法在处理具有大量属性的数据集时具有较好的效果。
2. 直接约简:直接约简是一种基于属性关系的约简方法,它通过计算属性之间的相似度和相关性来选择出最为相关的属性。
直接约简方法在处理具有复杂关系的数据集时具有较好的效果。
3. 快速约简:快速约简是一种基于属性搜索的约简方法,它通过快速搜索算法来选择出最为关键的属性。
快速约简方法在处理大规模数据集时具有较好的效果。
三、属性约简方法在实际问题中的应用属性约简方法在实际问题中具有广泛的应用价值,可以帮助我们从大规模的数据中提取出最为关键和有价值的属性,减少数据处理的复杂性,提高数据分析的效率和准确性。
以下是属性约简方法在实际问题中的一些应用案例:1. 医学诊断:在医学诊断中,属性约简方法可以帮助医生从大量的医学数据中提取出最为关键和有价值的属性,辅助医生进行疾病诊断和治疗方案选择。
如何利用粗糙集理论解决大数据融合与关联规则挖掘的问题粗糙集理论是一种用于处理不确定性和不完备信息的数学工具。
在大数据时代,数据的融合和关联规则挖掘是重要的任务之一。
本文将探讨如何利用粗糙集理论解决这些问题。
一、粗糙集理论简介粗糙集理论是由波兰学者Zdzisław Pawlak于1982年提出的一种数学理论。
它通过将数据集划分为不同的等价类,来处理不确定性和不完备信息。
在粗糙集理论中,一个概念是由一个决策属性和一组条件属性来定义的。
通过条件属性的约简,可以减少数据集的复杂性,提高数据处理的效率。
二、大数据融合问题在大数据时代,我们面临着海量的数据,这些数据来自不同的来源和格式。
融合这些数据是一个挑战,因为数据的质量和一致性可能存在问题。
利用粗糙集理论可以解决这个问题。
首先,我们可以将不同来源的数据转化为粗糙集。
通过粗糙集的等价类划分,可以将相似的数据归为一类。
然后,通过条件属性的约简,可以减少数据集的复杂性,提高融合的效率。
最后,通过对等价类的比较和分析,可以找到数据之间的关联规则。
三、关联规则挖掘问题关联规则挖掘是指在大规模数据集中寻找频繁出现的数据项之间的关联关系。
利用粗糙集理论可以解决关联规则挖掘的问题。
首先,我们可以将数据集转化为粗糙集。
通过粗糙集的等价类划分,可以找到频繁出现的数据项。
然后,通过条件属性的约简,可以减少数据集的复杂性,提高挖掘的效率。
最后,通过对等价类的比较和分析,可以找到数据项之间的关联规则。
四、粗糙集理论的优势和应用粗糙集理论具有以下优势:1. 可处理不确定性和不完备信息:粗糙集理论可以处理数据中的不确定性和不完备信息,提供了一种有效的方法来处理大数据融合和关联规则挖掘问题。
2. 可提高数据处理效率:通过条件属性的约简,粗糙集理论可以减少数据集的复杂性,提高数据处理的效率。
3. 可发现隐藏的关联规则:通过对等价类的比较和分析,粗糙集理论可以发现数据项之间的隐藏关联规则。
3变精度粗糙集方法粗糙集方法是为了解决模糊或不确定性问题而发展的一种理论与方法。
在粗糙集方法中,对象的属性值可以是模糊的或精确的,而决策或分类规则可以通过属性之间的相对约束关系来确定。
本文将介绍三个常用的变精度粗糙集方法,并对其进行详细阐述。
1.粗糙集的数学模型:粗糙集的数学模型是基于信息系统理论和近似推理理论。
它可以将不精确或模糊的数据转化为一个或多个精确的决策或分类规则。
其数学模型定义了粗糙集的三个基本元素:信息系统、下近似集和上近似集。
这三个元素构成了粗糙集的主要特性和运算规则。
2.变精度粗糙集的基本概念:在粗糙集方法中,为了处理不确定性或模糊性问题,可以使用变精度技术来调整精确度。
变精度粗糙集是在标准粗糙集的基础上引入了多个精度级别的概念,从而可以根据不同的应用要求对精确度进行调整。
3.粗糙集方法的三个变精度技术:a.基于粗糙集的属性精度:在传统粗糙集方法中,属性的精确度是预先定义的,而在基于粗糙集的属性精度技术中,属性的精确度是由用户根据实际情况进行调整的。
通过调整属性的精确度,可以提高粗糙集方法的分类或决策效果。
b.基于粗糙集的决策精度:传统粗糙集方法中,决策的精确度是通过属性之间的相对约束关系来确定的。
而在基于粗糙集的决策精度技术中,可以通过调整决策的精确度来改善分类或决策结果。
这种技术常常会涉及到模糊推理或概率推理的方法。
c.基于粗糙集的规则精度:在传统粗糙集方法中,规则的精确度是预先定义的。
而在基于粗糙集的规则精度技术中,可以通过调整规则的精确度来提高分类或决策的准确性。
这种技术通常涉及到规则的修剪或合并。
总结起来,粗糙集方法是一种基于信息系统理论和近似推理理论的模糊或不确定性问题处理方法。
它的数学模型定义了信息系统、下近似集和上近似集等三个基本元素,并通过属性精度、决策精度和规则精度等三个变精度技术来提高分类或决策的准确性。
这些方法在实际应用中具有较好的效果,并逐渐成为数据挖掘和智能决策等领域的重要研究方向。
粗糙集理论及其用于属性约简在自然科学、社会科学与工程技术的很多领域中,都不同程度地涉及到对不确定因素和不完备信息的处理。
从实际系统中采集到的数据常常包含着噪声、不精确甚至不完整,采用纯数学上的假设来消除或回避这种不确定性,效果往往不理想。
多年来,研究人员们一直在努力寻找科学地处理不完整性和不确定性的有效途径,并先后提出了众多的软计算(Soft Computing)方法。
软计算的指导原则是利用所允许的不精确性、不确定性和部分真实性得到易于处理、鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调,主要工具包括粗糙集(Rough sets)、模糊逻辑(Fuzzy Logic)、神经网络(Nerve Network)、概率推理(Probability Reasoning)、信度网络(Belief Network)、遗传算法(Genetic Arithmetic)、混沌理论(Chaos)等。
粗糙集(Rough Sets,也称粗集、Rough集)理论是由波兰华沙理工大学Pawlak 教授于20 世纪80 年代初提出的一种研究不完整、不确定知识和数据的表达、学习、归纳的理论方法。
粗糙集方法的一个特点是不需要附加信息或先验知识,而这一点是其它方法无法做到的,如模糊集方法与概率统计或证据理论方法中,往往需要模糊隶属函数、基本概率指派函数(Basic Probability Assignment, BPA)和有关统计概率分布等,而这些信息有时并不容易得到。
正是基于这一优点,粗糙集理论得以迅速兴起,并逐渐成为人工智能界以及其它处理不确定性领域的研究热点。
粗糙集的研究对象是由一个多值属性集合描述的一个对象集合,对于每个对象及其属性都有一个值作为其描述符号,对象、属性和描述符号是表达决策问题的三个基本要素。
这种表达形式也可以看成为一个二维表格,即决策表;表格的行与对象相对应,各行包含了表示相应对象信息的描述符,还有关于各个对象的类别成员的信息;列对应于对象的属性,属性分为条件属性和决策属性,对象根据条件属性的不同,被划分到具有不同决策属性的决策类。
粗拙集与观点格的属性约简研究粗拙集理论是波兰数学家Pawlak 于 1982年提出的一种用于剖析数据的数学理论。
观点格理论 ( 也叫形式观点剖析 ) 是德国数学家 Wille在同一年提出的描绘观点与观点之间层次关系的形式化工具。
粗拙集理论与观点格理论作为数据剖析和知识发现的强有力工具, 愈来愈受到人工智能研究者的宽泛关注。
当前, 这两种理论已经被宽泛应用于软件工程、数据发掘、信息检索、机器学习、不确立性规则获得与决议管理等领域。
知识发现的一个重要方面就是知识约简。
本文研究信息系统属性约简和观点格属性约简 , 分别提出了鉴于闭算子的目标信息系统属性约简方法和异于文件[29]的观点格属性约简新方法。
系统研究了两个同类形式背景在同态映照下的性质。
本文的主要工作以下 :1. 提出了目标信息系统属性约简的闭算子方法。
针对协调的目标信息系统, 结构了条件属性集及其幂集上的一致关系, 议论了由这两种一致关系所导出的两个闭集族C_r 与 C_R的性质及互相之间的关系;证了然这两个闭集族相等的充足必需条件, 并给出在此条件下目标信息系统的属性约简方法 ; 证了然本文提出的属性约简与文件[12,28] 中约简定义的等价性。
2.提出了观点格属性约简的一种新方法。
针对文 [29] 所给出的观点格属性约简理论, 利用观点格中全部交不行约元得到一些极小属性集族 , 每个集族中任取一个元素而后求并集就是文[29] 中所定义的形式背景的约简。
同时给除了求属性约简的相应算法。
3. 研究了同态映照下同类形式背景各元素之间的关系。
定义了形式背景之间的同态映照。
关于无决议形式背景 , 剖析了形式背景的观点以及协召集的同态性。
关于决策形式背景 , 议论了协调性的同态不变性, 并给出了约简的同态像仍为约简的充分条件。
粗糙集理论的常见使用方法介绍粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它在数据挖掘、模式识别和人工智能等领域得到了广泛的应用。
本文将介绍粗糙集理论的常见使用方法,包括近似集的构建、属性约简和决策规则的提取。
一、近似集的构建近似集是粗糙集理论的核心概念之一,它用于描述数据集中的不确定性信息。
在实际应用中,我们通常需要根据给定的数据集构建近似集。
构建近似集的方法有多种,其中最常见的是基于属性约简的方法。
首先,我们需要将原始数据集进行离散化处理,将连续属性转换为离散属性。
然后,根据数据集中的属性之间的关系构建一个属性关系矩阵。
属性关系矩阵中的每个元素表示两个属性之间的关系强度,可以使用不同的度量方法来计算。
接下来,我们可以根据属性关系矩阵来构建近似集,其中每个近似集表示一个属性的约简。
二、属性约简属性约简是粗糙集理论中的一个重要问题,它用于减少数据集中的冗余属性,提高数据挖掘和模式识别的效率。
属性约简的目标是找到一个最小的属性子集,使得该子集能够保持数据集中的信息完整性。
属性约简的方法有多种,其中最常用的是基于启发式算法的方法。
启发式算法通过迭代搜索的方式,逐步减少属性集合的大小,直到找到一个最小的属性子集。
常见的启发式算法包括遗传算法、模拟退火算法和粒子群优化算法等。
三、决策规则的提取决策规则是粗糙集理论的另一个重要应用,它用于从数据集中提取出具有决策能力的规则。
决策规则的提取可以帮助我们理解数据集中的规律和模式,从而做出准确的决策。
决策规则的提取方法有多种,其中最常用的是基于属性约简的方法。
首先,我们可以根据属性约简的结果,将数据集划分为多个等价类。
然后,对每个等价类进行进一步分析,提取出具有决策能力的规则。
最后,通过对规则进行评估和选择,得到最终的决策规则集合。
四、案例分析为了更好地理解粗糙集理论的应用方法,我们可以通过一个案例来进行分析。
假设我们有一个销售数据集,其中包含了客户的属性信息和购买的产品信息。
第32卷第4期2008年8月江西师范大学学报(自然科学版)J cI U R N A L0FⅡA N GⅪN O R l雌L I『r qⅣER SI TY(N A l r I瓜AI.ScI E N CE)、,01.32N o.4A I l g.2008一种利用属性序关系的变精度粗糙集知识约简方法张玉琢(云南师范大学计算机科学与技术系,云南昆明650092)摘要:变粗糙集模型主要用于包含错误信息或缺失一些重要信息的决策表的知识获取.该文引入了变粗糙集模型和卢上、下分布约简和分布约简(卢约简)的概念,并讨论了它们之间的关系;通过对约简的进一步研究,得到可辩识矩阵及其特性;在此基础上提供了利用属性序关系的约简算法,并通过含有噪声的实例验证了此方法的可行性和有效性.关键词:变粗糙集模型;知识约简;决策表;协调集中图分类号:TP18文献标识码:A自波兰数学家娜l ak提出粗糙集(R S)理论以来,它已被广泛应用于模式识别,机器学习,知识获取,人工智能等领域.但经典粗糙集理论存在一些局限[1.21;对此,研究者对经典粗糙集理论进行了不同的扩展.zi ar ko教授于1993年提出的变精度粗糙集模型心J是其中重要一分支.在该模型中,给定一个阈值,当对象所在的等价类在某种程度上包含于集合j中时,就认为这个对象属于X,这个推广在应用上是非常重要的,因为在实际应用中,绝对的包含有时是不必要的.知识约简是变精度粗糙集研究的重要内容,文献[1‘5]中对此问题有所讨论.归结所讨论的约简方法大致为两大类:一类是利用属性启发式约简算法求得属性约简集,其特点是以属性重要度作为启发式信息bo;二类是利用可辨识矩阵,通过对属性组合的合取和析取操作得到一个属性约简集u圳,但当得到的可辨识矩阵维数较高时。
该算法计算复杂度高,内存消耗量大,并且如何选取满意的特征属性组合是一个待商榷的问题怛12J.本文针对这个问题,提出了一个改进算法,在得出可辩识矩阵后,利用属性序关系求约简的算法,最后,通过具体实例验证该算法的有效性.1变精度粗糙集模型定义1【4】一个信息系统s可以表示为5=(u,C U D,y,.厂),其中u表示对象的非空有限集合,U= {石l,算2,…,‰I;C表示属性的非空有限集合,C={口I,口2,…,口。
};y:U K,K是属性口f的值域;,是信息函数,表示(,×C—y,即对善i∈U,口i∈C,有“≈,口i)∈K.具有条件属性和决策属性的知识表达系统称为决策表.简记为S=(U,C U D).对B c c U D,记‰={(石,y):以膏,c)=以,,,c),c∈圳,则‰是u上的等价关系,它产生的£,划分记为:U/%:={[z]曰:茗∈U},其中[菇]口={y:(髫,,,)∈如}是龙关于曰的等价类,u/尺c={cI,c2,…,G}是条件等价类,u/勘={D l,D2,…,仇}是决策类.定义2【3】设x∈∥,占∈c,证坦k(石)={≈∈£,l[毛]∈x},凡(石)={毛∈口I[置]n x≠≯},%(x),如(x)则分别称为X关于B的下近似和上近似?收稿日期:200r7-12.22基金项目:云南省教育厅科学研究基金(5y0615D)资助项目.作者简介:张玉琢(19罅),女,重庆市人,副教授,主要从事粗糙集、数据库技术方面的研究.450江西师范大学学报(自然科学版)2008年为简单起见,定义l中令D={d},曰c c,卢∈(o.5,1),卢代表的是正确分类的比值.记觞(x)={甄∈u p(x/[≈]口≥p},璐(x)={毛∈u p(x/[毛]且≥l一卢},8幛(x)=璐(x)一盟(x),则盟(x),硒(x),毗(x)分别被称为x关于B的卢的下近似,卢的上近似和边界域.称(缒,鹂为变精度粗糙集模型(VPRs).其中p(x/[毛]B):L午*掣.p代表的是条件类中的对象被分到同一决策类中的比例的阈.v^r1‘’L押I J廿I值,当p=1.O时,变精度粗糙集模型就是经典的粗糙集模型.容易证明,变精度粗糙集模型具有下列性质:(1)盟(眈)∈璐(B);(2)1/p>卢j u=。
.V….端(易);(3)魑(Df)=瑞(毋)U础(功).注意性质(2),只有当1/p>卢时,决策类的p上近似的并是全域u,据此,可定义p不可预知区域:㈣(Ⅳ)=u一..y璐(D f),而Ⅳ=u/吼={D I,D2,…,啡}.2变精度粗糙集模型中的几种约简属性约简是根据原始信息系统的数据对可分辨对象进行分辨的最小属性集合.其目标是寻求一个最小属性集,或约简,使之能取代全部属性集,又不损失基本信息.口约简[2.6]定义的约简属性具有不稳定性,使得约简过程产生“是约简一不是约简一是约简”的跳跃过程【7J,下面引入一些知识约简概念.定义3【3】:在决策表s=(U,c U D)中,设曰c c,记磁=(盟(D1),磁(D2),…,盟(啡)),醒= (瞄(D1),瑞(D2),…,端(缉)),脚(毛)=(p(Dl/‰]B,(p(D2/[她]日,…,(p(啡/[zd]B),兢∈Ⅱ.(1)若瑶=∥,称B是s:(u,c U D)的p下分布协调集.若口是p下分布协调集,但B的任何真子集不是p下分布协调集,则B称作卢下分布约简.(2)若碥=磋,称日是s=(u,c U D)的卢上分布协调集.若B是卢上分布协调集,但曰的任何真子集不是卢上分布协调集,则日称作卢上分布约简.(3)若对V毛∈U,户B(并f)=心(髫f),称曰是s=(U,C U D)的卢分布协调集.若曰是分布协调集,但B的任何真子集不是分布协调集,则B称作分布约简.(也称为∥约简)』9,上(下)分布协调集是保持每个决策类的卢上(下)近似不变的属性集,它与C产生相容的命题规则,即在原系统和约简系统中,由同一对象产生的命题规则的决策部分相同.分布协调集是保持每个对象属于每个决策类的度的属性子集.它们的约简过程不会出现跳跃现象,可以得到稳定的约简过程【7J.定理l[3】设(u,c U D)是一决策表,那么对任意卢∈(0.5,1]分布协调集肯定是卢下,上分布协调集.证设B是一个分布协调集,则V茁∈u,有肋(茗)=户c(戈),即P(功/[茗]B)=P(毋/[菇]c)V_『≤p.因此,茗∈碥(D f)甘算∈磁(D f),所以,璐(D f)=硝(毋)V J≤p.那就是说,B是卢下分布协调集.类似的可证,B是J9上分布协调集.3基于可变精度粗糙集模型的知识约简方法设(u,c u D)是一决策表,曰∈c,V石∈u,记穆(髫)={易I z∈盟(毋)},节(石)={易I端(哆)},显然茗∈盛(9)甘易∈穆(茗),石∈砩(易)甘功∈哕(z),为了得到基于可变精度粗糙模型的知识约简方法,我们给出可辩识矩阵的概念..定义4【3】设(u,c U D)是一决策表,u/亿={c l,c2,…,c m},记D f.8={([戈]^,[,,]^):硝(z)≠秽(),),D f p={([茹]^,[,,]^):带(菇)≠罐(,,),oI(cf)是关Ci于中对象在属性口I的取值,定义硝cQ,C:,,:{?‘∈A:纵‘G’≠吼‘q’:三?三尹二乞。
≯卢c z:,2,,那么讲(cc’c f)(z=l,2)分别被称作p上分布和卢下分布辩识属性集;所=(所(cc,c f),i,.『≤m(z=l,2)分别被称作卢上分布和p下分布可辩识矩阵.第4期张玉琢:一种利用属性序关系的变精度粗糙集知识约简方法451定理2【31可辩识矩阵肼=(协(cf,q),i,_『≤m)(z=l,2)满足下列特性:(1)它们都是对称矩阵.即讲(cl,q)=讲(c!『,ci)(z=1,2);(2)主对角线上的元素都是A,即研(ci,cf)=A,V i≤m(z=l,2);(3)硝(G,q)∈(G,G)U讲(G,q)V i,s,.『≤m(z=l,2).4一种利用属性序关系的约简算法可辨识矩阵中属性组合数为1的元素为决策表的核.因辨识矩阵中凡是含有属性核的矩阵元素,都可以仅用属性核就把决策表中两对象加以区别,由此,对于含有属性核的矩阵元素而言,其属性组合中除核以外的其他特征属性是多余的,这样只对辩识矩阵讲=(D f(ci,c『),i,.『≤m)(z=1,2)中属性组合数不为1且不含核的矩阵元素进行分析.从而降低对矩阵元素的处理时间和存储空间耗费.假设(u,c)是一信息系统,n=c ar d(c),在属性c上定义一个全序关系“7c”,并把整数l至凡赋予属性集C的一个全序关系“丌”中的每个属性,从而获得一个属性的序列,本文称为属性序S:o,彻:2丌口3丌..舢k.定义5[8]M是(u,c)的可辩识矩阵元素构成的集合.定义如下集合:L(s)={艿l艿=口B,口∈c,且B c C一{口},艿∈Jj I f;艿中的属性从左至右的排列满足S}.a是艿的第一个属性,称为艿的标签属性,显然£(S)是定义在上的等价关系,并把M划分为若干等价类,记为肘/L(s)={E(1),E(2),…,E(n)},其中E(i)={艿I艿=a声,艿∈M l,非空等价类M/L(s)的标签属性的下标集合记为{[肘/£(5)]}.算法1描述如下:I nput:某个案例决策表r=(u,c{d}>,u={互l,z2,…,茹。
},c=(ol,02,口3,…,口。
).O ut put:决策表的属性约简R ed(C).S t epl令C or e(C)=声,R ed(C)=声,B=声.s t ep2构造辩识矩阵讲=(玩(ci,q),i,.『≤m(2=l,2),找出属性组合数为1的属性,即为核Cor e(C)..St e p3R ed(C)=C or e(C);B=C—C or e(C)..s t ep4将可辩识矩阵讲中包含core(c)的属性的元素赋值为o.s t ep5对st ep4所得可辩识矩阵讲得到其元素构成的集合膨.设Ⅳ=I nax{[/L(5)]},l≤J7、r≤n,其标签属性为口Ⅳ.矾i l e(肘≠i5){口Ⅳ是约简属性,R ed(∞=R ed(∞U口Ⅳ;E=l口:口n{口_l v}=≯,口∈肘},肘=层;Ⅳ’:m a)({[M/£(S)]},Ⅳ=』\r’;}St ep6输出约简集Red(C).5结论知识约简能够简化信息系统,约简是最有必要且最少的信息.由于卢的引入,变精度粗糙集模型中知识约简变得比经典粗糙集中的复杂.本文通过引入p上,下分布约简,户约简,并计论了它们间的关系;在讨论怎样得到辩识矩阵后,没有采用常用的对辩识矩阵的属性组合进行合取和析取操作的方法,而是提出一种利用属性序关系的约简算法,从而避免了前者求约简时算法计算复杂度高,内存消耗量大,如何选取满意的特征属性组合等问题,在理论及应用上都是很有意义的.参考文献:[1]B eyl舶M.R e dIIcl s w i t hi n岫vaIi出e p眦is i∞m I曲s et s咖del:A缸Il er if Iv枷gat i∞[J].Eum p咖J叫nlal 0f(唧onal Re孵arch,200l,134:592-麟.[2]Zi ar k0w.V撕abl e p琳i s i∞舢g}l s etⅡ烈l el[J].J伽nl al0f C0盯吼-缸a nds)r9t锄sci愀1993,46(1):3乒59.[3]胁¨且l l eI l g,W u W ei—z}li,孔aIl g w叶xiu.A聊ches to晰I e螈Ied删0n based∞vari枷e pl即i si叽l U ugh setⅡ10del[J].h‰枷∞s ci er耽,2004,159:255—272.[4]l nui gucl l i M.舢蕾i b眦预h州m i I l v鲥abl e pf eci si伽m l gI l s et咖l de[J].I I吐er r lal io|l al J叫nl al0f u眦“rny Fu五岫s and‰w l ed驴452江西师范大学学报(自然科学版)2008年base d sys【e【啮,2006,14(4):46l埘.[5]蔡娜,张雪峰,王宇彤.变精度粗糙集属性约简的算法[J].系统工程与电子技术,2007,29(12):2064-2067.[6]周杰,王加阳,罗安.变精度粗糙集模型约简约简层次研究[J].计算机工程与应用,20cr7,43(12):173.198.[7]周杰,王加阳,罗安.变精度粗糙集模型约简特征分析[J].计算机应用研究,2啷,24(7):10-15.[8]W鹕J∞,W鹕Ju.鼬dllc‰蛔thlm hs ed on di{姆枷t)r槭:’Ihe甜m眦es联thod[J].bmlal0f com叫凹Scie溉&’I kl啪logy,200l,16(6):镐9-50.[9]l(ry8zl ci e而∞M.col nI脚bve st ul d)r0f a he m撕ve t)rpe0f kr的枷ed妒m dI l ct j伽i I I i∞o惜i st em邓}t et鸺[J].I I吐哪枷or l al蛔l m al0f l m e m geI吐Sy栅,200l:16:105-l加.[10]z i arI【ow.A nal y幽0f岫cenai l l i血唧日t i∞i Il t I l e佃眦w oI I【0f"血bl e p嗽i si∞删g}1日et“J].胁111dal i o啮0f C0m put D∞晒,1993(18):38l396.[11]王莎莎,刘辉.一种基于启发式约简的案例故障特征优化算法[J].计算机应用,200r7,27(5):1扣1.120B.[12]米据生,吴伟志,张文修.基于变精度粗糙集理论的知识约简方法[J].系统工程理论与实践,2004,24(1):76.8.A ppr oach姻t0踟ow l edge R educt i伽of、hr i abl e PI伐i si on R0ugl lSet M odel by or der ed A t t dbut嚣2H A N G Y h.zl l∞(D E炉咖m t of c0呷u I er Sci en∞舳d T ecl I I do盯,Y l I m m N∞lal U I Ii vc商t y,l(Im面唱65∞92,0l i聃)A‰d:w h∞t ll e gi砌l deci s i∞t abl e i I l c l ud髓eⅡo璐or l a cI【s s伽舱i I I l ponaI l t inf删ion,谢able preci s i∞rou曲s et (V PR S)m odel ll a s been pm posed罄锄嘣e璐i on of dl e cl assi cal R S m odel.r11l i s paper i m l D du嘲谢abl e pr e ci si on 砌岫set(V PI峪)麒xl el.10w er di st r i but e m duct,upper di st r i but e r educt锄d di st I i but e r educt(h i8cau ed r educt)粕d r el at io璐I li p枷ng£l l锄are cl i scussed.D i scerI l i bi l it)r m a t ri x∞诵t}I r鹳p ect t0upper锄d l ow e r r e duct i ons a陀0bt ai ned.舢-鲥thrI l0f∞deD ed at t r i but es is desi印ed t o m duct㈧edge of dec i si on ca bl es.Fi m a l l y,锄既a叫)l e8how s岫“8ne w 蛔t hm i S bot ll f.e鹏i bl e锄d胡硗t i ve i n p瑚Ic t ic e.w o—s:谢abl e pr eci si叽roug}l set;l【Il洲edge reducti on;deci8i∞tabl e;唧istent set1【ey(责任编辑:冉小晓)。