一种完备的最小属性约简方法
- 格式:pdf
- 大小:220.97 KB
- 文档页数:3
基于集合枚举树的最小属性约简算法蒋瑜【摘要】为了寻找一种有效的最小属性约简方法,给出了条件属性集上的属性重要度序关系,基于此序关系构建了属性集上的集合枚举树,提出了一种快速的最小属性约简算法,该算法采用至上而下、层次优先策略搜索集合枚举树寻找属性最小约简.为了提高算法性能,该算法采用核和父集剪枝策略减少搜索空间,采用优化计算来确保同一集合的正域只计算一次.基于UCI数据的实验结果表明,该算法是有效的.【期刊名称】《计算机工程与应用》【年(卷),期】2013(049)011【总页数】4页(P101-104)【关键词】粗糙集;最小约简;集合枚举树;属性重要度;剪枝【作者】蒋瑜【作者单位】成都信息工程学院软件工程学院,成都610225【正文语种】中文【中图分类】TP311粗糙集理论是由波兰学者Pawlak于1982年提出的[1-2],是一种刻划具有不完整性和不确定性信息的全新数学工具。
其主要思想是在保证知识库的分类能力不变的前提下,通过知识约简导出问题的决策或分类规则。
知识约简问题是粗糙集理论的一个核心问题[3-4]。
所谓知识约简,就是在保证知识库分类能力不变的条件下删除其中不相关或不重要的冗余知识。
一般来讲,一个决策表的属性约简不是唯一的,通常人们往往希望能够找到一个冗余度最小的属性约简,该属性约简被称为最小属性约简。
对任一给定决策表,若属性约简算法能确保找到其最小属性约简,则该算法称为最小属性约简完备算法。
然而,S.K.M Wong和W.Ziarko已经证明了找一个决策表的最小约简是NP-hard问题[3]。
导致NP-hard问题的主要原因是属性的组合爆炸问题。
目前已存在一些属性约简算法能够找到决策表的最小属性约简[4-12],但它们要么不是完备的最小属性约简算法,要么通过穷举求出问题的所有约简或所有最小约简。
本文重新定义了属性重要度,给出了条件属性集上的序关系,基于该序关系构建集合枚举树,提出了一种基于集合枚举树的最小属性约简算法。
二进制可分辨矩阵的最小属性约简算法
李龙澍;王慧萍;徐怡
【期刊名称】《计算机技术与发展》
【年(卷),期】2010(020)006
【摘要】指出传统分辨矩阵的不足,给出了二进制可分辨矩阵的定义以及二进制可分辨矩阵元素集合的形成算法.精简了分辨矩阵元素.在此基础上,提出了一种基于二进制可分辨矩阵的最小属性约简算法.该约简算法以属性频率为选择条件,按照普通可分辨矩阵生成属性约简的原理,但以不同的形式,更少的存储空间,最终可以获得一个最小属性约简.通过对一个汽车数据库的数据进行属性约简,并将结果与其他算法的结果进行比较,证明该算法是可行有效的.
【总页数】5页(P93-96,100)
【作者】李龙澍;王慧萍;徐怡
【作者单位】安徽大学,计算机科学与技术学院,安徽,合肥,230039;安徽大学,计算机科学与技术学院,安徽,合肥,230039;安徽大学,计算机科学与技术学院,安徽,合肥,230039
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.改进的基于简化二进制分辨矩阵的属性约简方法 [J], 王亚琦;范年柏
2.基于改进的二进制分辨矩阵属性约简算法 [J], 郭洪涛;黄广君;张孝国
3.二进制分辨矩阵在连续属性约简中的研究 [J], 杨云霞;杨占勇
4.一种新的基于二进制分辨矩阵的属性约简方法 [J], 陈宸;赵军
5.一种改进的基于二进制可分辨矩阵属性约简算法 [J], 葛浩;杨传健;李龙澍
因版权原因,仅展示原文概要,查看原文内容请购买。
属性约简方法概述属性约简又称维规约或特征选择,从数学的角度考虑,就是有p 维数据 x =(x 1,x 2……x p ),通过某种方法,得到新的数据 x’=(x’1,x’2…… x’k ) , k ≤p , 新的数据在某种评判标准下,最大限度地保留原始数据的特征。
属性约简主要是为了解决高维数据计算的复杂性和准确性问题。
目标是消除冗余和不相关属性对计算过程和最终结果造成的影响。
对数据进行属性约简的意义,主要从以下几个方面考虑:a) 从机器学习的角度来看,通过属性约简去除噪音属性是非常有意义的; b) 对一些学习算法来说,训练或分类时间随着数据维数的增加而增加,经过属性约简可以降低计算复杂度,减少计算时间;c) 假如不进行属性约简,噪音或不相关属性和期望属性对分类的作用一样,就会对最终结果产生负面影响;d) 当用较多的特征来描述数据时,数据均值表现得更加相似,难以区分。
为了描述属性约简方法,这里假设数据集合为D ,D ={x 1,x 2….x n }, x i 表示D 中第i 个实例,1≤i≤n ,n 为总的实例个数。
每个实例包含p 个属性{|x i |=p }。
从机器学习的角度来看,属性约简方法可以分为监督的和非监督的两类。
下面是几种常用的方法。
(1) PCA 主成分分析主成分概念是Karl parson 于1901年最先引进。
1933年,Hotelling 把它推广到随机变量。
主成分分析把高维空间的问题转换到低维空间来处理,有效的降低了计算的复杂度。
通过主成分的提取,降低了部分冗余属性的影响,提高了计算的精度。
主成分分析的基本思想为:借助一个正交变换,将分量相关的原随机变量转换成分量不相关的新变量。
从代数角度,即将原变量的协方差阵转换成对角阵;从几何角度,将原变量系统变换成新的正交系统,使之指向样本点散布最开的正交方向,进而对多维变量系统进行降维处理[43]。
定义4-1[44]:设12(,,...,)'p X X X X =为p 维随机向量,它的第i 主成分分量可表示'i i Y u X =,i =1,2,…, p 。
一种完备的最小属性约简方法于海燕;乔晓东【期刊名称】《计算机工程》【年(卷),期】2012(038)004【摘要】为解决粗糙集中的属性约简问题,提出一种完备的最小属性约简方法.将差别矩阵中所有有关属性区分的信息都浓缩进一个差别向量组,计算每个属性在区分2个对象的属性集合中出现的概率,作为属性重要性的启发式信息,建立最小属性约简树,得到属性约简.分析结果表明,该方法可以获得所有的最小属性约简.%Attribute reduction is the basic problem of rough sets theory. A method for minimal attributes reduction in consistent decision table is proposed in this paper. The discernible information in consistent decision tables is described with discernible vector array. A minimal attribute reduction tree is generated based on the probability of the attributes which discern two objects. All minimal attribute reductions are got from minimal attributes reduction tree. The result of the method is proved to be complete and minimal.【总页数】3页(P46-48)【作者】于海燕;乔晓东【作者单位】中国科学技术信息研究所信息技术支持中心,北京100038;中国科学技术信息研究所信息技术支持中心,北京100038【正文语种】中文【中图分类】TP311.12【相关文献】1.一种改进的不完备熵属性约简在装备故障诊断中应用 [J], 苏艳琴;张光轶;徐廷学2.一种基于冲突域的不完备决策表属性约简算法 [J], 周建华;徐章艳;章晨光3.不完备决策表的一种属性约简方法 [J], 周玉华;李景杰4.不完备系统中一种增量式属性约简算法 [J], 王光琼5.不完备邻域决策粗糙集的最小化代价属性约简算法 [J], 姚晟;李初宴;吴照玉因版权原因,仅展示原文概要,查看原文内容请购买。
基于二进制可辨矩阵属性重要度的属性约简算法
汪小燕
【期刊名称】《安徽工业大学学报(自然科学版)》
【年(卷),期】2007(024)001
【摘要】粗糙集理论是一个新的数据挖掘方法,是在保持分类能力不变的情况下,利用等价类,通过属性约简和规则约简,达到挖掘知识并简化知识的目的.但属性约简是一个NP难题,需要通过启发式知识实现.文中提出了一种利用二进制可辨矩阵的属性重要度实现属性约简的算法,该算法能快速求最少属性且实现简单,并通过理论和实例证明了其正确性.
【总页数】4页(P76-78,97)
【作者】汪小燕
【作者单位】安徽工业大学,计算机学院,安徽,马鞍山,243002
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于二进制可辨矩阵的属性约简算法的改进 [J], 周海岩;杨汀
2.二进制可辨矩阵的变换及高效属性约简算法的构造 [J], 支天云;苗夺谦
3.基于核搜索和二进制可辨识矩阵的属性约简算法 [J], 崔建华;褚蕾蕾;常文波
4.一种基于二进制可辨矩阵的属性约简算法 [J], 王希雷;马永军
5.基于可辨识矩阵的属性约简算法及应用 [J], 陈志恩;田彦山;马旭
因版权原因,仅展示原文概要,查看原文内容请购买。
一种增量式约简方法求解最小顶点覆盖问题
Zhan Shanhua;Xie Xiaojun
【期刊名称】《计算机应用研究》
【年(卷),期】2018(035)012
【摘要】最小顶点覆盖问题是一个应用很广泛的NP难题,针对该问题给出一种增量式属性约简方法.首先将最小顶点覆盖问题转换为一个决策表的最小属性约简问题;利用增量式属性约简思想,随着图中边数的增多,提出一种更新最小顶点覆盖的增量式属性约简算法;该算法时间复杂度低于计算整个图的最小顶点覆盖的时间复杂度,同时针对大规模图问题,可随着边的增加动态更新最小顶点覆盖,因此降低了属性约简的方法求解最小顶点覆盖问题的运行时间.实验结果表明了该算法的可行性和有效性.
【总页数】4页(P3685-3688)
【作者】Zhan Shanhua;Xie Xiaojun
【作者单位】
【正文语种】中文
【中图分类】TP391.6
【相关文献】
1.一种求解平面图的最小顶点覆盖算法 [J], 吴春;朱国魂;谢玉忠;林宏
2.一种混合化学反应优化算法求解最小顶点覆盖问题 [J], 郑光勇;徐雨明;李肯立;孙士兵
3.一种基于粗集理论的增量式属性约简算法 [J], 高晓红;李兴奇
4.不完备系统中一种增量式属性约简算法 [J], 王光琼
5.一种高效的复杂信息系统增量式属性约简 [J], 段海玲;王光琼
因版权原因,仅展示原文概要,查看原文内容请购买。