当前位置：文档之家› 可变多粒度粗糙集模型_张明

可变多粒度粗糙集模型_张明

粗糙集属性约简matlab程序

粗糙集-属性约简-matlab程序 Data2为条件属性，decision2为决策属性 %%%my_test函数实现 clc; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%读取信息系统文件 file = textread('data2.txt','%s','delimiter','\n','whitespace',''); %读取文件信息，每一行为一个胞元 [m,n]=size(file); %胞元的大小 for i=1:m words=strread(file{i},'%s','delimiter',' ');%读取每个胞元中字符，即分解胞元为新的胞元 words=words';%转置 X{i}=words; end X=X'; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% [B,num,AT]=my_reduct(X); %信息系统的约简 ind_A T=ind(X); %信息系统的不可等价关系 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%显示约简信息系统 disp('约简后的条件系统为：'); [m,n]=size(B); for i=1:m disp(B{i}); end %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%读取决策系统文件 file = textread('decision2.txt','%s','delimiter','\n','whitespace',''); [m,n]=size(file); for i=1:m words=strread(file{i},'%s','delimiter',' '); words=words'; D{i}=words; end D=D'; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%决策系统的正域约简 X_D=X; [l,k]=size(X_D{1}); pos_d=pos(X_D,D);%正域 for i=1:m %%%%%%%%%%%%%%正域有问

粗糙集属性决策表约简算法研究

粗糙集属性决策表约简算法研究薛楠，刘守荣中国农业大学工学院，北京（100083） E-mail ：xue_nan@https://www.doczj.com/doc/d610655089.html, 摘要：本论文通过对无决策属性的粗糙集决策表的研究，按照粗糙集最小决策算法的原则，提出一种新的核属性算法和最小决策算法。实验验证，基于以上两种算法开发出的程序简单易懂，并且源代码少，能广泛适用于所有无决策属性的粗糙集决策表模型分析。关键词：粗糙集；决策属性表；核属性算法；最小决策算法中图分类号：TP301 0. 引言粗糙集理论是一种新的处理模糊和不确定性知识的数学工具，其主要思想就是在保持分类能力不变的前提下，通过知识约简，导出问题的决策或分类规则。目前粗糙集理论已被成功的应用于机器学习、决策分析、过程控制、模式识别与数据挖掘等领域。[1][2]现实中经常遇到含有大量信息的决策表，人工计算耗时耗力。本文通过对粗糙集核属性和最小决策算法的公式的研究，提出一种新的核属性算法和最小决策算法。通过编程验证，该算法能够更简捷明了的计算核属性并得出最小决策表，能够广泛适用于所有无条件属性和决策属性的粗糙集决策表模型分析。 1. 粗糙集核属性算法 1.1 粗糙集基本理论定理1设U ≠?是我们感兴趣的对象组成的有限集合，称为论域。任何子集X U ?称为U 中的一个概念和范畴。U 上的一族划分成为关于U 的一个知识库（knowledge base ）。定理2设R 是U 上的一个等价关系，U /R 表示R 的所有等价类（或者U 上的分类）构成的集合，[]R x 表示包含元素x U ∈的R 等价类。一个知识库就是一个关系系统 (,)K U R =,其中设U ≠?是非空有限集合，称为论域，R 是U 上的一个等价关系。[3] 定理3若P R ?，且P ≠?，则P ∩（P 中所有等价关系的交集）也是一个等价关系，称为P 上的不可区分(indiscernibility)关系,记为ind(P ),且有： [][]()ind P R R P x x ∈=∩

【文献综述】决策粗糙集均值模型

文献综述数学与应用数学决策粗糙集均值模型由于社会已经进入了网络信息时代，信息量不断增长（信息爆炸），并且由于人类的参与，使数据与信息系统中的不确定性更加显著（复杂系统）。面对大量的、杂乱无章的数据，人们希望能从中挖掘出潜在的、有用的信息，这给人类的智能信息处理能力提出了前所未有的挑战。由此产生了人工智能的新领域——知识发现（规则提取、数据挖掘和机器学习）。波兰数学家Pawlak于1982年发表了论文“Rough Sets”[9]提出了一种能够定量分析处理不精确、不一致、不完整信息与知识的理论——粗糙集理论。1992年，第一届关于粗糙集理论国际学术会议在波兰召开。粗糙集的主要特点是不需要预先给定所需处理的数据集合之外的任何信息，而是直接从给定问题的分类知识出发，提供潜在知识和决策支持。国内外学者对该理论进行了广泛而深入的研究，提出了许多粗糙集模型，并且已经成功应用于很多领域和开发了大量的实用系统[7]。目前，对粗糙集理论的研究集中在它的数学性质、粗糙集拓展、其它不确定方法的关系和互补、有效算法和粒度计算等方面。目前，有3个有关粗糙集的系列国际会议，即RSCTC、RSFDGrC和RSKT。中国学者在这方面虽然起步晚，但发展较快，从2001年开始每年召开中国粗糙集与软计算学术会议；2003年中国人工智能学会粗糙集与软计算专业委员会成立；一系列学术会议也有在中国召开，特别值得一提的是2010年第二届国际粗糙集理论研讨会在我校（浙江海洋学院）召开。中国第四届粗糙集与软计算会议也于2004年10月24日在我校召开，大大增加了我校在国内外的知名度。在经典粗糙集理论的研究中，Pawlak的代数粗糙集模型是研究的主要对象。粗糙集理论是建立在分类机制的基础上的。它将研究对象组成的集合称为论域，将分类理解为在论域上的等价关系，而等价关系构成了对该论域的划分。粗糙集理论将知识理解为对数据的划分,每一被划分的集合称为概念或范畴。一个等价关系对应一个划分，把论域分解成子集族，作为描述论域中任意概念的基本信息粒子。这产生了一个颗粒集合，其中一个颗粒看作一丛点（对象），因其不可区分性、相似性、接近的功能而被看做一致[24]。对于一个等价关系（划分），某些子集不能精确地由一个等价类或者几个等价类来表

粒计算下的粗糙集模型对比

Comparison of rough set model under granular computing ZHANG Xiao-feng, ZOU Hai-lin, JIA Shi-xiang (School of Information Science & Engineering, Ludong University, Yantai Shandong 264025, China) Abstract:This paper proposed the rough set model under combination granule, and compared it with that under single granular, also with rough set model under logical computing of granule, which contributed to the relationship between rough set models under combination granule, singular granules and logical computing of granules. Results show that combination granule and logical computing of granule construct a chain, which will lay a foundation for knowledge acquisition based on information granule and induction based on dynamic granule. Key words:combination granule; logical computing of granule; single granular; rough set; approximation 0 引言粒度计算是由Zadeh[1]于1996年提出,他认为,人类认识主要基于三个主要概念,即粒度、组织和因果。其中粒度计算是一把伞,涵盖了有关粒度计算的理论、方法论、技术和工具的研究,在粗糙集理论、概念格、知识工程、数据挖掘、人工智能、机器学习等领域有潜在的应用,已成为信息科学的研究热点之一[2]职称论文。粗糙集[3]定义为给定关系上集合的上近似与下近似构成的有序对,已被成功地应用于机器学习、决策分析、过程控制、模式识别和数据挖掘等领域[4]。传统的粗糙集理论是基于单一粒定义的,即静态粒。文献[5~7]提出了多粒运算下的粗糙集理论模型,即MGRS(multi-granulations rough set,MGRS),并讨论了相关的数学性质。考虑到文献[5~7]中主要讨论了集合在粒度P和Q的P+Q、P∩Q运算下的上下近似集合,本文对多粒运算下的粗糙集模型进行了进一步的讨论,并将其与单一粒度下的粗糙集模型进行了比较;同时,将多粒运算下的粗糙集模型与组合粒度下的粗糙集模型进行了?比较。 1 相关概念本章给出的相关概念对于后续部分给出的讨论是必要的。定义1 命题逻辑中,命题P和Q的合取记为P∧Q。P∧Q为真当且仅当P和Q同时为真;命题P和Q的析取记为P ∨Q,P∨Q为假当且仅当P和Q同时为假。定义2 信息系统是一个四元组(U,A,V,f)。其中,U是对象的集合,称为域(universe);A是用来描述对象的属性的集合;V 是属性集A的值域; f:U×A→V反映的是某个对象在某个属性上的取值,信息系统通常略写为(U,A)。定义3 给定一个非空的域U,U×U的子集EU×U表示域U上的一个关系。有序对(U,E)称为一个近似空间 [8](approximation space)。如果关系E满足自反性、对称性和传递性,则E称为一个等价关系[9]。等价关系E对域U可以形成一个划分,记为U/E。可以证明,等价关系和划分是等价的,即给定一个等价关系,可以构造域的划分;同样,给定域的一个划分,可以构造域上的一个等价关系。信息系统(U,A)中,如果两个体x,y∈U在属性a∈A上取值相同,则称两者在属性a上是不可分辨的。如果x,y在集合BA中的每一个属性b∈B都是不可分辨的,则称两者在集合B上是不可分辨的。与x在集合B上不可分辨的所有个体的集合称为x在集合B上生成的等价类,记为[x]?B,它可以看成是由与x不可分辨的元素构成的信息粒[8](information granule)。定理1 域U上所有元素在集合A上生成的等价类满足以下三个条件[9]: a)?x∈U,有[x]?A≠?; b)?x,y∈U,或者[x]?A=[y]?A成立,或者[x]?A∩[y]?A=?成立; c)∪x∈U[x]?A=U。