粗糙集属性约简matlab程序

格式：doc
大小：18.50 KB
文档页数：3

下载文档原格式

一种粗糙集属性约简算法

ＬｉＫａＬｉｓｕＷａｇＬｅｎｕＹｕｈｎｉ
（ｅａｍｅｔｏｏｐｔｃｅｃｎｎｉｅｒｇＢｒｎｎｔｕｅｏｅｈｏｇ，ｅｊｇ１０８）ＤｐｒｎｆＣｍｕｒＳｉｅａｄＥｇｎｅｎ，ｅｉｇＩｓｔｔｆＴｃｎｌｙＢｉｎ００１ｔｅｎｉｉｏｉ
ｔｒｕｈｅｎｉｏａｅｔｐ．ｈｅｔａｔｂｔｒｄｃｉｎｓｔｅｅｉｈａｕｉｉｎｍｕｏｖｒｇｏｅｅａｃｈｏｇｏｄｔｎｌｎｒｙＴｅｂｓｔｉｕｅｅｕｔｉｈｓｔｗｈｃｖｌｅｓｔｅｍｉｉｍｆａｅａｅｆｒｌｖｎｅｌｏｒｏｌｏｔｂｔｓＴｅｘｅｉｎｓｏｓｈｔｔａｇｔｅｔｒｆｃｉｉ．ｉａｌｉｅｒｄｃｉｎｅｕｔｏＵｆａｌｕｅｈｅｐｒｉｆｍｅｔｈｗｔａｉｃｎｅｂｔｅｅｔｔＦｎｌｔｔｅｕｔｒｓｌｆＣＩ山ｈｂ８ｓｅｖｙｙ．ｇｏｓＬｎｅ
，．
ｉｏｔｎｔｅｒ，ｅａｅｅｔｂ￣ｒｄｃｉｅｙｉｍｉｉｂａｒ，ｎｏｐｔｒｌａｃｔ￣ｕｅｎｒｉｈｏｙｔｐｐｒｇｔａｆｕｅｕｔｎｓｔｂｄｆｍａｏ－ｈｓｉｏ￣ｅｂｌ＇ｍｔｘａｄｅｍｕ￣ｅｖｎｅｏａｃｔｓｉｉｅｆｔ
１引言
粗糙集（ｏｇｔＳｔ理论是一种处理模糊和不确定知识的Ｒｕｈｅ）数学工具，早由波兰数学家ＺＰｗａ最ａ１ｋ在１８９２年提出的『 ” 。它已经在数据挖掘人智能、式识别与分类等领域获得了较模广泛的应用叩４１性约简是ＲｕｈＳｔ论研究的一个核心 ’ ３属ｏｇｅ理内容。们希望找到最佳属性约简。而Ｗｏｇ．．和Ｚａｋ．人然ｎＳＫＭｌｏｒＷ已经证明它是Ｎ－ａ问题Ｈ因而目前还没有高教的最佳Ｐｈ￣属性约简算法。过．在实际应用中，求得到相对属性约简就要可了许多研究人员已提出了属性约简算法１８。目前许多研究人员在对属性约简的研究中．约简结果的将标准定为约简后属性数最少．者是得到的规则最简，约简或或量最大。但从数据库理论的角度考虑，性的冗余、性间的属属依赖要尽可能地小。正是基于这些，文利用ＲｕｈＳｔ论，该ｏｇ理ｅ

基于粗糙集的符号与数值属性的快速约简算法

1000
2000
3000
numbers of samples
统已提示 out of memory.且在占用虚拟内存时，
(a) abalone 上的计算时间
计算速度异常变慢，计时方式来对比已不科学. 由于时间太长，abalone 未能计算完成.该方法在后面大数据实验时不作比较.
在FARNeMF与FARNeM1 的比较中（图 2），发现由于FARNeMF大量减少了样本比较次数，较大幅度地提高了计算速度图 2(c,e).例外的是图 2(a)，FARNeM1 居然比FARNeMF速度还快些.但两
性质 2： M ⊆ N ⊆ C ， X ⊆ U ，则 ∀x ∈U ，若 δ M (x) ⊆ M X 则δ N (x) ⊆ N X . 证明：由下近似定义可知 δ M (x) ⊆ X ，由性质 6 可得 δ N (x) ⊆ δM (x) ⊆ X ，从而由下近似定义得 δ N (x) ⊆ N X 由性质2中 x 任意性，可得
3) Δ(x1, x3 ) ≤ Δ(x1, x2 ) + Δ(x2 , x3 ) .
对于 N 个属性的样本集，距离常用 P 范数表示为
∑ Δ
P
(
x1
,
x
2
)
=
⎜⎜⎝⎛
N i =1
|
f (x1, ai ) −
f (x2 , ai ) |P ⎟⎟⎠⎞1/ P
其中 f (x, ai ) 为样本 x 在属性 ai 上的取值.
4. 实验分析
为测试优化算法的效果，采用 UCI 数据集作
对比实验. 所用的数据集构成如表 1 所示.
表 1 数据集描述
数据集
样本个数
数值型属性
符号型属性

基于MapReduce的高效粗糙集属性约简算法

第34卷第4期 2017年4月计算机应用与软件Computer Applications and SoftwareV o L34No. 4Apr. 2017基于MapReduce的高效粗糙集属性约简算法吕洁1刘利民1胡皎月1许志伟131(内蒙古工业大学信息工程学院内蒙古呼和浩特010080)2(中国科学院计算技术研究所北京100086)摘要针对粗糙集理论中传统的基于正域的属性约简算法和基于信息熵的属性约简算法无法得到最小约简集的问题，给出基于信息熵改进的属性约简算法，即先使用条件熵识别出重要度值最大的属性，使用正域进行约简判断。

在此基础上，设计了高效的基于M a p R e d u c e的信息熵改进属性约简算法。

以真实海量气象数据为基础, 在H a d o o p集群上实现上述算法，验证了该算法的有效性和效率。

关键词属性约简粗糙集理论信息熵中图分类号T P311文献标识码A D O I：10. 3969/j. issn. 1000-386x. 2017. 04.046EFFICIENT ROUGH SET ATTRIBUTE REDUCTION ALGORITHMBASED ON MAPREDUCELii Jie1Liu Limin1H u Jiaoyue1X u Zhiwei1’21(College of Information Engineering, Inner Mongolia University of Technology ,Huhhot 010080, Inner Mongolia, China)2 (Institute of Computing Technology ^Chinese Academy of Sciences, Beijing 100086, China)Abstract Aiming at the problem that the traditional attribute reduction algorithm based on positive domain and the attribute reduction algorithm based on information entropy can ,t get the m i n i m u m reduction set in rough set theory,an optimized attribute reduction algorithm based on information entropy is proposed. T h e conditional entropy is used to identify the attribute with the highest significance value, and the positive domain is used to the reduction judgment. O n this basis,an efficient algorithm of information entropy improved attribute reduction based on M a p R e d u c e is designed. Based on the real meteorological data, the algorithm is implemented on H a d o o p cluster, and the effectiveness and efficiency of the algorithm are verified.Keywords Attribute reduction R o u g h set theory Information entropy熵改进属性约简算法，通过真实海量气象数据，验证了〇弓丨言算法的有效性。

基于粗糙集理论的属性约简算法的实现

Ｊｎｏ６ｕｅ２０
基于粗糙集理论的属性约简算法的实现
张冬玲
（州边防指挥学校教育技术中心，东广州５０６）广广１６３
（ｄｉｇ１６ｔｍｚｌ＠２．ｏ）ｎ
摘
要：属性约简算法的实现进行讨论研究，用数学中的一些运算规律，计算机上实现布对利在
尔代数的运算。最后，结合实际的研究课题，通过运行程序，某些数据表实现属性约简。对关键词：糙集；别矩阵；粗差差别函数；属性约简；增量算法
中图分类号：Ｐｌ．３Ｔ３１１文献标识码：Ａ
ｎ×（ｎ一１／。）２
ｒ
约简通常是不唯一的。一个数据集的所有约简可以通过构造差别矩阵，由差别矩阵导出差别函数并对其化简而得到。２１差别矩阵与属性约筒．根据差别矩阵的概念，阵元素与属性约简存在着下列矩
关系
（，２）
，ｆ属于相同决策属性类
ｘ属于不同决策属性类ｊ
１粗糙集理论的相关概念
粗糙集理论是研究不完整数据及不精确知识的表达、学
２利用差别矩阵的属性约简
当前，息系统中信息膨胀主要有两个方向：向和纵信横向。向指切是属性字段的不断增加，横纵向指的是记录数的增加。在粗糙集中对于信息系统横向的约简可以称之为属性约简，向的约简可以认为是值约简。纵随着数据库系统中数据的不断增加，属性的约简相对于值的约简变得更加有效。如果某个条件属性被去除后仍有相同的等价关系的话，么这个条那件属性便是可省的。这样将大大简化数据库结构的复杂度，提高人们对隐含在数据库庞大数据量下的各种信息的认识程度，因此属性约简也就成为了目前粗糙集理论的研究热

用MATLAB实现数据挖掘的一种算法知识讲解

用M A T L A B实现数据挖掘的一种算法一、数据挖掘的目的数据挖掘(Data Mining)阶段首先要确定挖掘的任务或目的。

数据挖掘的目的就是得出隐藏在数据中的有价值的信息。

数据挖掘是一门涉及面很广的交叉学科，包括器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。

它也常被称为“知识发现”。

知识发现(KDD)被认为是从数据中发现有用知识的整个过程。

数据挖掘被认为是KDD过程中的一个特定步骤，它用专门算法从数据中抽取模式(patter，如数据分类、聚类、关联规则发现或序列模式发现等。

数据挖掘主要步骤是：数据准备、数据挖掘、结果的解释评估。

二、数据挖掘算法说明确定了挖掘任务后，就要决定使用什么样的挖掘算法。

由于条件属性在各样本的分布特性和所反映的主观特性的不同, 每一个样本对应于真实情况的局部映射。

建立了粗糙集理论中样本知识与信息之间的对应表示关系, 给出了由属性约简求约简决策表的方法。

基于后离散化策略处理连续属性, 实现离散效率和信息损失之间的动态折衷。

提出相对值条件互信息的概念衡量单一样本中各条件属性的相关性, 可以充分利用现有数据处理不完备信息系统。

本次数据挖掘的方法是两种，一是找到若干条特殊样本，而是找出若干条特殊条件属性。

最后利用这些样本和属性找出关联规则。

（第四部分详细讲解样本和属性的选择）三数据预处理过程数据预处理一般包括消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换(如把连续值数据转换为离散型数据，以便于符号归纳，或是把离散型数据转换为连续)。

本文使用的数据来源是名为“CardiologyCategorical”的excel文件中的“源数据”。

该数据表共303行，14个属性。

即共有303个样本。

将该数据表的前200行设为训练样本，剩下后的103行作为测试样本，用基于粗糙集理论的属性约简的方法生成相应的规则，再利用测试样本对这些规则进行测试。

首先对源数据进行预处理，主要包括字符型数据的转化和数据的归一化。

粗糙集属性约简的方法

ＷＡＮＧＰｉ，ＡＯＹｌ，ＶＪａｆｎ．ｗｍｅｈｄｏｔｉｕｅｒｄｃｏａｅｎｒｕｈｓｔＣｏｕｅｎｉｅｒｇａｄＡｐｅｉＺＨｕｉＬｉｎｅｇＮｅｔｏｆｔｂｔｕｔｎｂｓｄｏｏｇｅ．ｍｐｔｒｇｎｅｉｎ — ｊｎａｒｅｉＥｎｐｉａｉｎ，０２４（）１３１５ｌｔｓ２１，８２：１ —１．ｃｏＡｂｔａｔＯｂｅｔｃｓｉｃｔｎｉｓｉｔｘｅｓｅｎｏｓｎｉｖｎｎｉ．ｍｉｇａｅｉｏｓｍｗｉｎｅａｃｒａｌｓｒｃ：ｊｃｓｌｓａｉｔｃｅｃｓｉｌａｄｔｓｉｏｏｓＡｉｎｔｃｉｎｓｔｔｕｃｒｉｆｔ．ｎａ・ａｆｏｓｒｉｖｙｏｅｔｅｅｄｓｙｅｈｔｎａｏ
的决策系统，为Ｓ，｝ｄ是带不确定因子（－．）记Ｄ＝，０Ｉ＜ｔ１的结论属性，＝１示该元素对结论有完全肯定的判断，表即该
识库中的知识（属性）并不是同等重要的，还存在冗余，不利这于做出正确而简洁的决策。属性约简要求在保持知识库的分类和决策能力不变的条件下，除不相关或不重要的属性。删般而言，较优的属性约简有如下指标：简后属性个数较约少；约简后规则数目较少；最终范化规则数目较少等。已证明
Ｋｅｒｓｏｇｅ；ｅｅｄｂｌ；ｔｉｕｅｒｄｃｉｎｉｌｍｅｔｔｎｙｗｏｄ：ｒｕｈｓｔｄｐｎａｉｔａｔｂｔｅｕｔ；ｍｐｅｎａｉｉｙｒｏｏ

基于粗糙集的属性约简算法

中的对象组成的集合＋Ｘ）＝｛ ∈ ＵＩ）（Ｂ（
｝。
…
３
的上近似集Ｂ）根据知识判定可能属（，于的中的对象组成的集合ＢＸ）＝｛ ∈ Ｕｌ（ＸＢ（＂Ｘ ≠ ｝Ｘ）Ｉ１。
定义３正域
收稿日期：０ｌ３１２１－ —ｌ０基金项目：国家自然科学基金资助项目（０７０９６５４３）
ＤｃｕＤ＝Ｑ，＝）（ＣｎＤ两个不同的集合。概念２完备信息系统与不完备信息系统在决策信息系统ＤＳ＝＜，ｕＤ，，ＵＣＶＰ＞中，中每个对
１２基本定义．
Ｌ）＝｛（Ｙ∈ ＵＩ（Ｙ，）∈ Ｌ，｝Ｌ＝｛ ∈ ＵＩ（ＸＬ）｝，Ｌ＝｛ ∈ ＵＪ（Ｘ）ｎ ≠ ｝。
（）２（）３（）４
定义１不可分辨关系
限制容差关系具有自反性和对称性，是不具但有传递性。
步骤有的约简属性集都包含的不可省略属性的集合，记为ＣＲＰ）＝ｎＲＤ（ＯＥ（ＥＰ）。
步骤７将Ｒｄｅ集里的属性与ｃ集合里剩余的
属性分别结合。步骤８采用组合属性，复步骤２～６重。步骤９从Ｒｄ的尾部开始，后往前对每个ｅ从
２２知识约简算法．
ｑ｝ＩＤＢ是一个等价关系。）。（）Ｎ由这种等价关系导
出的对的划分记为ＵＩＤ（，中包含样本的／ＮＢ）其等价类记为［］。

《基于粗糙集的连续值属性约简算法研究》范文

《基于粗糙集的连续值属性约简算法研究》篇一一、引言随着大数据时代的来临，数据挖掘和知识发现成为了研究的热点。

粗糙集理论作为一种有效的数学工具，被广泛应用于数据分析和知识约简。

在处理具有连续值属性的数据时，如何有效地进行属性约简是一个重要的研究问题。

本文旨在研究基于粗糙集的连续值属性约简算法，为数据处理和知识发现提供有效的方法。

二、粗糙集理论概述粗糙集理论是一种处理不确定性和模糊性的数学工具，主要研究的是集合与集合之间的关系。

在数据挖掘和机器学习中，粗糙集理论被广泛应用于特征选择和属性约简。

粗糙集通过上下近似集来描述一个概念或集合的粒度，从而实现对数据的分析和约简。

三、连续值属性约简问题在处理具有连续值属性的数据时，传统的粗糙集理论面临着一些挑战。

连续值属性的处理需要更复杂的算法和技术。

此外，连续值属性的约简还需要考虑到数据的分布、密度、相关性等因素。

因此，如何有效地进行连续值属性的约简是一个重要的研究问题。

四、基于粗糙集的连续值属性约简算法为了解决连续值属性的约简问题，本文提出了一种基于粗糙集的连续值属性约简算法。

该算法主要包括以下步骤：1. 数据预处理：对数据进行清洗、归一化等预处理操作，以便于后续的约简操作。

2. 计算上下近似集：利用粗糙集理论，计算每个属性的上下近似集。

3. 属性重要性评估：根据上下近似集，评估每个属性的重要性。

重要性的评估可以采用信息熵、增益率等方法。

4. 属性约简：根据属性重要性的评估结果，选择一部分属性进行约简。

约简的目标是在保持数据分类能力的同时，减少属性的数量。

5. 约简结果评估：对约简结果进行评估，包括分类准确率、约简率等指标。

五、实验与分析为了验证本文提出的算法的有效性，我们进行了实验分析。

实验数据采用UCI等公开数据集。

实验结果表明，本文提出的算法可以有效地进行连续值属性的约简，且约简后的数据分类准确率较高。

此外，我们还对约简结果进行了可视化展示，以便于更好地理解约简过程和结果。

一种基于粗糙集的属性值约简方法

（兰州大学信息科学与工程学院甘肃兰州７００）３００甘肃兰州７０５）３００（兰州工业高等专科学校电子信息工程系
摘
要
利用矩阵的可操作性等优点，将决策表中的知识通过区分矩阵反映出来，对决策表的值约简操作转换为对矩阵的运算。
提出基于区分矩阵的一些重要性质及在此基础上的属性值约简方法，最后通过实验和实例验证了该算法是有效可行的。
关键词粗糙集区分矩阵属性值约简属性重要度
ＡＴＴＲＩＢＵＴＥＶＡＬＵＥＲＥＤＵＣＴＩｏＮＡＬＧｏＲＩＴＨＭＢＡＳＥＤｏＮＲｏＵＧＨＳＥＴＴＨＥｏＲＹ
ＣｈｎＸｉｏｕｅａｙｎＬａｎｈａ，ｎＣｏｇｕ
Ｋｅｗｏｄｙｒｓ
ＲｏｇｅＤｓｅｎｂｅｍａｒｘＡｔｂｔａｕｅｕｔｎＡｔｉｕｅｓｇｉｃｎｅｕｈｓｔｉｃｒａｌｔｔｉｕｅｖｌｅｒｄｃｉｉｒｏｔｂｔｉｎｆａｃｒｉ
Ｕ如果Ｖａ∈Ｐ，，都有ｆ，）＝ｆＹａ。说明仅仅根据条件（ａ（，）
０引言
粗糙集理论是一种新型的处理不确定的、模糊的和不完整
属性子集Ｐ提供的信息，无法将对象，Ｙ区分开来，称对象，Ｙ在条件属性子集Ｐ上是不可区分的，记为：Ｄ（ＩＰ）：｛，）∈ Ｎ（ＹＵ×ＵＩＶａ∈ Ｐ，）厂Ｙａ｝ＩＤ（是Ｕ上的等价关系。ａ：＿，），（ＮＰ）
信息的数学工具。在粗糙集理论中，知识被看作是关于论域的划分，是一种对对象进行分类的能力，理论是建立在集合的基该

属性约简(MATLAB算法)有实例有讲解

粗糙集属性约简注：这是我学粗糙集时老师给的作业属性约简的顺序如下：求正域、生成未经处理的区分矩阵、对区分矩阵进行化简、求核、对已经处理过的区分矩阵进行属性约简。

约简后的决策表有26行,所有12个属性都是正域中的属性，核为空程序:% main.mtic;a=[ 1,1,1,1,0,0,0,0,1,1,0,1;0,0,0,0,0,0,0,0,0,0,0,0;1,0,1,0,0,0,0,0,0,1,0,0;0,0,0,1,1,1,1,0,1,0,1,1;1,0,0,1,1,1,1,1,0,1,1,0;0,1,0,1,1,1,1,1,1,0,0,1;1,0,0,0,1,1,1,0,0,1,1,1;1,1,1,1,0,0,0,0,1,1,0,1;1,0,1,1,1,0,0,0,1,1,0,1;1,1,1,1,0,0,0,0,1,1,0,1;1,0,1,1,1,0,0,0,1,1,0,1;1,0,1,1,1,0,0,0,1,1,0,1 ];d=[1;0;0;0;0;0;0;1;1;1;1;1];pos=posCD(a,d);dismat=dismatrix(a,d,pos);dism=disbe(dismat);core=cor(dism); [red,row]=redu(dism); time=toc% dismatrix.m% 生成未经处理的区分矩阵dismatfunction dismat=dismatrix(a,d,pos)[m,n]=size(a);p=1;index1=0;index2=0;index=0;dis=-1*ones(m*(m-1)/2,n);for i=1:mfor j=i+1:mif (isxbelongtopos(i,pos)&~isxbelongtopos(j,pos))...|(~isxbelongtopos(i,pos)&isxbelongtopos(j,pos)). ..|(isxbelongtopos(i,pos)&isxbelongtopos(j,pos)&~i sxybelongtoindD(i,j,d))index2=1;endif index2==0continue;endfor k=1:nif a(i,k)~=a(j,k)dis(p,k)=1;index1=1;else dis(p,k)=0;endendif index1==1p=p+1;index=1;endindex1=0;index2=0;endendif p<=m*(m-1)/2if index==0dismat=[];return;endif dis(p,1)==-1p=p-1;endelse p=m*(m-1)/2;enddismat=dis(1:p,:);% redu.m% 对已经处理过的区分矩阵进行知识约简function [red,row]=redu(dism)[m,n]=size(dism);red=[];row=0;if m<=0return;endfor i=1:nif dism(1,i)~=0row=row+1;endendred(1:row,:)=zeros(row,n);j=1;for i=1:rowwhile dism(1,j)==0j=j+1;endred(i,j)=1;j=j+1;endtemp=[];tempdis=[];rowd=0;rowd1=0;for i=2:mj=1;while j<=rowtemp=uni(dism(i,:),red(j,:));[s,n]=size(temp);rowd1=rowd+s;tempdis(rowd+1:rowd1,:)=temp;rowd=rowd1;j=j+1;temp=[];endred=[];red=disbe(tempdis);tempdis=[];[row,n]=size(red);rowd=0;rowd1=0;end% disbe.m% 对区分矩阵或者约简矩阵进行化简即去掉包含关系function dism=disbe(dis)[m,n]=size(dis);p=m;for i=1:mif dis(i,1)~=-1for j=1:mif i~=j & dis(j,1)~=-1if dis(i,:)<=dis(j,:)dis(j,1)=-1;p=p-1;elseif dis(i,:)>=dis(j,:)dis(i,:)=dis(j,:);dis(j,1)=-1;p=p-1;endendendendenddism=ones(p,n);j=1;for i=1:pwhile j<=m & dis(j,1)==-1j=j+1;enddism(i,:)=dis(j,:);j=j+1;end% posCD.m% a为条件属性矩阵，d为决策属性向量% pos为正域,保存条件属性矩阵的索引值function pos=posCD(a,d)[m,n]=size(a);p=m;index=0;for i=1:mif a(i,1)~=-1for j=i+1:mif a(j,1)~=-1 &(a(i,:)==a(j,:)&d(i)~=d(j))a(j,1)=-1;p=p-1;index=1;endendif index==1a(i,1)=-1;p=p-1;index=0;endendendpos=zeros(p,1);i=1;for r=1:pwhile a(i,1)==-1&i<=mi=i+1;endpos(r)=i;r=r+1;i=i+1;end% cor.m% 对已经处理过的区分矩阵求核function core=cor(dism)[m,n]=size(dism);core1=zeros(1,n);number=0;for i=1:mnum=0;p=0;for j=1:nif dism(i,j)~=0num=num+1;p=j;endendif num==1core1(p)=1;number=number+1;endendif number==0core=0;elsecore=zeros(1,number);j=1;for i=1:numberwhile core1(j)==0j=j+1;endcore(i)=core1(j);j=j+1;endend% uni.m%对区分矩阵的第i行和red(j,:)运算，即将a中%所有的1分别插入到red(j,:)中，待去掉包含关系function tempred=uni(disa,red)[m,n]=size(red);num=0;for i=1:nif disa(i)~=0num=num+1;endendtempred=ones(m*num,n);temp=[];j=1;for i=1:numwhile disa(j)==0j=j+1;endtemp=red;temp(:,j)=ones(m,1);tempred((i-1)*m+1:i*m,:)=temp;j=j+1;end% isxbelongtopos.m% 判断x是否在正域pos中% x为索引值% 返回值p，如果x在pos中p=1否则p=0 function p=isxbelongtopos(x,pos)[m,n]=size(pos);p=0;if x<=0p=-1;return;endfor i=1:mif x==pos(i)p=1;break;endend% isxybelongtoindD.m% 判断x,y是否在indD中% x,y为索引值% 返回值p，如果x,y在indD中p=1否则p=0 function p=isxybelongtoindD(x,y,d)if x<=0 | x>size(d) | y<=0 | y>size(d) p=-1;return;endif d(x)==d(y)p=1;else p=0;end约简后的决策表如有侵权请联系告知删除，感谢你们的配合！。

粗糙集理论的使用方法和步骤

粗糙集理论的使用方法和步骤粗糙集理论是一种用于处理不完全、不确定和模糊信息的数学工具，它在决策分析、数据挖掘和模式识别等领域具有广泛的应用。

本文将介绍粗糙集理论的使用方法和步骤，帮助读者更好地理解和应用这一理论。

一、粗糙集理论的基本概念粗糙集理论是由波兰学者Pawlak于1982年提出的，它的核心思想是通过对数据集进行粗糙化处理，找出数据集中的重要信息，从而进行决策和分析。

在粗糙集理论中，数据集由属性和决策组成，属性是描述对象的特征，决策是对对象进行分类或判断的结果。

二、粗糙集理论的步骤1. 数据预处理：在使用粗糙集理论之前，需要对原始数据进行预处理。

预处理包括数据清洗、数据变换和数据归一化等步骤，旨在提高数据的质量和可用性。

2. 属性约简：属性约简是粗糙集理论的核心步骤之一。

在属性约简过程中，需要根据属性的重要性对属性进行选择和优化。

常用的属性约简方法有基于信息熵的属性约简和基于模糊熵的属性约简等。

3. 决策规则的生成：在属性约简完成后，可以根据属性和决策之间的关系生成决策规则。

决策规则是对数据集中的决策进行描述和判断的规则，可以帮助决策者进行决策和分析。

4. 决策规则的评价：生成的决策规则需要进行评价和优化。

常用的决策规则评价方法有支持度和置信度等指标，通过对决策规则进行评价，可以提高决策的准确性和可靠性。

5. 决策与分析：最后一步是根据生成的决策规则进行决策和分析。

根据决策规则，可以对新的数据进行分类和判断，从而帮助决策者做出正确的决策。

三、粗糙集理论的应用案例粗糙集理论在实际应用中具有广泛的应用价值。

以电商平台为例，可以使用粗糙集理论对用户行为进行分析和预测。

首先，对用户的行为数据进行预处理，包括清洗和归一化等步骤。

然后，通过属性约简找出用户行为中的关键属性，如浏览时间、购买频率等。

接下来，根据属性和决策之间的关系生成决策规则，如用户购买商品的决策规则。

最后，根据生成的决策规则对新的用户行为进行分类和分析，从而提供个性化的推荐和服务。

基于粗糙集理论的决策表属性约简算法

维普资讯
２Ｏ０７年ｌ月２第２卷第４期２
山东师范大学学报（然科学版）自ＪｕｎｌｆｈｎｏｇＮｕａＵｉｒｔ（ａｒｃｎｅｏｒａｏａｄｎｏｎｌｎｅｉＮｔａＳｉｃ）Ｓｖｓｙｕｌｅ
是属性值的集合，即属性的值域集，中是属性。其
∈Ａ的值域；是信息函数，：．厂厂Ｕ×Ａ＋，．，ｏ ∈Ｖ它指定了Ｕ中每一对象的属性值．即厂（），我们将具有条件属性和决策属
在决策表中，对于属性子集ＲｃＡ，可分辨关系１Ｄ（定义为：ＮＲ）＝｛不ＮＲ）ＩＤ（（，ＹＥＵ×ＵＩｆ，。）ＶｏＥＲ，（）：
便于叙述，设决策表中对象的个数为ｎ条件属性集合Ｃ有ｍ个属性，，其值域为有限离散集合，用Ｉ表示集合的基．并＊Ｉ由决
策属性Ｄ导出的等价类构成Ｕ的一个划分：：｛。，，，｝ … ，．在决策表Ｃ中，Ｄ若一些对象具有相同的条件属性值而属于不同的决策类，则称这些对象为不一致对象，否则称为一致性

－Ｙ）．Ｄ（是一个等价关系，厂，ｏ｝１）（Ｎ对象在属性集Ｒ上的等价类［（义为：（）ＹＩＥＵ，Ｄ（｝为方］刚定［］：｛ｙ１Ｒ）．ｙＮ
便起见，在不产生混淆的情况下用Ｒ代替１Ｄ（．ＮＲ）等价关系ＩＤ（）１Ｄ（中的等价类分别称为条件类和决策类．了ＮＣ和ＮＤ）为
但在理论上证明它们对最小约简是不完备的．文献［］５中利用区分矩阵的特性，出的算法只是针对一致性的决策表和在核提值存在的情况下才能适用；文献［］［］６和７虽然算法的效率较高，但不一定能找到系统的最小约简．因为在进行求解决策表属性约简Ｐ过程中，实际上是寻找使得所有一致性对象在Ｐ上也是一致性对象的过程．即是说在

序信息系统中变精度粗糙集属性约简的Matlab实现

变精度粗糙集属性约简的计算。当序信息系统变精度粗糙集考虑单个优势决策时，约简类型不受系统协调性的影响，因此进行了考虑单个优势决策的约简计算研究，并和可行性。
ｉｎＤｏｍｉｎａｎｃｅ－ＢａｓｅｄＶａｒｉａｂｌｅＰｒｅｃｉｓｉｏｎＲｏｕｇｈＳｅｔ
ｘｕＷｅｉ — ｈｕａ，ＺＨＡＮＧＸｉａｎ — ｔａｏ，ＷＡＮＧＱｉａｏ — ｒｏｎｇ
第２７卷第１期
Ｖｏ１．２７Ｎｏ．１
重庆理工大学学报（自然科学）
ＪｏｕｒｎａｌｏｆＣｈｏｎｇｑｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ（ＮａｔｕｒａｌＳｃｉｅｎｃｅ）
关
键
词：序信息系统；变精度；属性约简；单个优势决策
文献标识码：Ａ文章编号：１６７４— ８４２５（２０１３）０１ — ０１０７— ０９
中图分类号：ＴＰ１８
ＥｘｐｅｒｉｍｅｎｔａｌＣｏｍｐｕｔｉｎｇｏｎＡｔｔｒｉｂｕｔｅＲｅｄｕｃｔｉｏｎｂｙＭａｔｌａｂ
Ａｂｓｔｒａｃｔ：ＡｃｃｏｒｄｉｎｇｔｏｔｈｅｔｈｅｏｒｙｏｎＤｏｍｉｎａｎｃｅ — ｂａｓｅｄｖａｒｉａｂｌｅｐｒｅｃｉｓｉｏｎｒｏｕｇｈｓｅｔ，ｗｅｓｔｕｄｙａｎｄｐｒｏｇｒａｍＭａｔｌａｂｃｏｄｅｓｔｏｃｏｍｐｕｔｅｔｈｅａｔｔｒｉｂｕｔｅｒｅｄｕｃｔｉｏｎｓａｎｄｒｅａｌｉｚｅｔｈｅｖａｉａｒｂｌｅｐｒｅｃｉｓｉｏｎｒｏｕｇｈｓｅｔｉｎｏｒｄｅｒｅｄｉｎｆｏｒｍａｔｉｏｎｓｙｓｔｅｍｓ．Ｗｈｉｌｅａｓｉｎｇｌｅｄｏｍｉｎａｎｃｅｄｅｃｉｓｉｏｎｉｓｃｏｎｓｉｄｅｒｅｄｉｎａｎｏｒｄｅｒｅｄｉｎｆｏｒ．

粗糙集理论中的属性约简方法介绍

粗糙集理论中的属性约简方法介绍粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具，它在数据挖掘、机器学习和模式识别等领域得到了广泛应用。

属性约简是粗糙集理论中的一个重要概念，它能够帮助我们从大量的属性中找到最为重要的属性，减少数据处理的复杂性。

本文将介绍粗糙集理论中的一些常用属性约简方法。

1. 正域约简方法正域约简方法是粗糙集理论中最为常用的一种属性约简方法。

其基本思想是通过比较不同属性对决策类别的区分能力，来确定最为重要的属性。

具体步骤如下：首先，计算每个属性与决策类别之间的依赖度，依赖度越大表示属性对决策类别的区分能力越强。

然后，根据依赖度的大小进行排序，选择依赖度最大的属性作为初始约简。

接下来，逐步添加其他属性，并计算约简后的属性集对决策类别的依赖度。

如果添加属性后的依赖度没有显著提高，则停止添加，得到最终的约简属性集。

2. 相关属性约简方法相关属性约简方法是一种基于属性之间相关性的约简方法。

它通过计算属性之间的相关系数或互信息量来评估属性之间的相关性，并选择相关性较低的属性进行约简。

具体步骤如下：首先，计算属性之间的相关系数或互信息量。

然后，根据相关系数或互信息量的大小进行排序，选择相关性较低的属性作为初始约简。

接下来，逐步添加其他属性，并计算约简后的属性集的相关系数或互信息量。

如果添加属性后的相关性没有显著提高，则停止添加，得到最终的约简属性集。

3. 基于粒计算的约简方法基于粒计算的约简方法是一种基于粒度理论的属性约简方法。

它通过将属性集划分为不同的粒度，来减少属性的数量。

具体步骤如下：首先，将属性集划分为不同的粒度。

每个粒度包含一组相关性较高的属性。

然后，选择每个粒度中最为重要的属性作为初始约简。

接下来，逐步添加其他粒度，并计算约简后的属性集的重要性。

如果添加粒度后的重要性没有显著提高，则停止添加，得到最终的约简属性集。

4. 基于遗传算法的约简方法基于遗传算法的约简方法是一种基于进化计算的属性约简方法。

粗糙集数据分析系统的程序实现

第3 期
张雪峰等. 粗糙集数据分析系统的程序实现
67
别是基于粗糙集方法的数据知识表达和推理方法，
为专家控制系统的建立奠定了重要的基础。因此，
建立粗糙集数据分析系统是智能信息处理中的重要
研究任务。
MATLAB 是 Matri X Laborat ory（矩阵实验室）的缩写，它以复数矩阵作为基本编程单元，特别适用
设 X ，Y GU，R 是定义在 U 上的等价关系，集合 X 关于 R 的下逼近为：
R -（X ）= U｛Y GU／R ：Y 二 X ｝ R -（X ）是根据现有知识判断肯定属于 X 的对象组成的最大的集合，称为正区，记为 POS（X ）。上逼近为：R（' X ）= U｛Y GU／R ：Y nR 羊!｝，其中：! 表示为空集。R -（X ）是由所有集合 X 相交非空的等效类的并集，是那些可能属于 X 的对象组成的最小集合。集合边界区定义为：
3 .School of Mechanical engineering & Auto mation ，Nort heastern Unioersity ，Shenyang Liaoning 110004 ，P . R .China ） Receioed 17 Nooe mber 2003 ；reoised 5 APril 2004 ；accePted 1 June 2004
consi dered and conti nuous attri butes were changed i nto discrete attri butes . Two i mportant concepts of i ndiscerni bilit y relati on and relati vel y positi ve regi on were mai nl y f ocused on . Usi ng t he dependant degree of knowledge ，t he al gorit h m of rough set data anal ysis syste m was sub mitted . Compari ng t he nu mbers of reduced attri butes ，t he result of mi ni mal attri butes reducti on was selected . Progra m realizati on of many al gorit h ms of solvi ng relati ve core ，upper（lower ）approxi mati on ，eCui valence relati on ，relati vel y si gnificant degree ，relati vel y attri butes reducti on ，relati vel y val ue reducti on ，mi ni mal decisi on rules was obtai ned . The MATLAB progra ms of above fiel ds were gi ven . At last ，runni ng results of f act ual engi neeri ng syste m were promoted . Si mulati on results f or rolli ng beari ngs show t hat t he met hod i mproves t he rate of f ault diagnostic ，si mplifies t he diagnostic rules . It is obvi ousl y f act ual

粗糙集属性约简算法的实现与应用

Ｋｙｗｏｄ：ｒｕｔａｒｕｅｅｕｔｎｄｓｅｉｔｔｘｐｅｒａｎ；ｆｒｓｙｉｏａｏｅｒｓｏｇｓ；ｔｉｔｄｃｏ；ｉｍｂｌｙｍａｉ；ｒｔｔｔｏｔｎｒｔｎｍａａｅｎｓｍｈｅｔｂｒｉｃｉｒｅｍｅｅｒｆｍｉｎｇｍｅｔｙｔｓｅ
ｏａｔｂｔｅｕｔｎａｇｒｔｍｓｉｉｃｓｅ．Ｔｈｎｉｉｒａｉｅｔｓａ＋ａｄａｐｉｄｔｒｓｒｆｒｔｎｍａａｅｎｆｔｉｕｅｒｄｃｉｏｈｓｄｓｕｓｄｒｏｌｉｅ，ｔｓｅｌｄｗｉＶｕｌｚｈｉＣ＋，ｎｐｌｆｅｔｙｉｏｍａｏｎｇｍｅｔｅｏｏｎｉｓｓｅｙｔｍ．Ｓｔａｔｒａａｂｓｉｅｆｃｏｓｔａｅ玳ｐｅｒａｍｅｔｄｔｄｃｈｅｄｍｅｓｎｌｙｏａｔｄｉｒｖｈｅｅｃｅｃｆｄｔｎｌｓｓｎｒｄｒｔｅｔｎｅｏｒｕｅｔｉｎｉａｉｆｄａａｅｏｔｎｍｐｏｅｔｆｉｎｙｏａａａａｙｉｏ－ｉｅ
２ｃｏｌｆｍｐｔｒ．ＳｈｏｏＣｏｕｅ，ＨａｇｈｕＥｅｔｏｉＳｉｎｅａｄＴｃｎｌｇｉｅｓｔ，Ｈａｇｈｕ３０１，Ｃｈｎ）ｎｚｏｌｃｒｎｃｃｅｃｎｅｈｏｏｙＵｎｖｒｉｙｎｚｏ０１８ｉａ
中图法分类号：Ｐ９Ｔ３１
文献标识码：Ａ
文章编号：００７２（０）４０７— １０— ４２７０－７３００７０

表面粗糙度计算公式用matlab编程

表面粗糙度计算公式用matlab编程全文共四篇示例，供读者参考第一篇示例：表面粗糙度是描述表面几何形态的一个参数，通常用于评价工件表面的光洁度和质量。

表面粗糙度通常用Ra值（平均粗糙度）来表示，Ra值越小代表表面越光滑。

而计算表面粗糙度的公式是通过对表面的高度数据进行统计分析来得到的。

在工程领域中，粗糙度的计算是一个非常重要的问题，可以在生产加工过程中进行质量控制和优化工艺。

本文将介绍如何使用Matlab编程来计算表面粗糙度的Ra值。

Matlab是一种强大的科学计算软件，可以用来处理各种数据分析和数学运算问题。

通过编写程序来进行表面粗糙度的计算，可以提高计算效率，并且减少人为误差。

下面将介绍如何用Matlab编程实现表面粗糙度计算。

首先，我们需要获取表面的高度数据。

这些数据通常来源于表面扫描仪或者测高仪，可以保存为txt文件或者Excel文件。

在Matlab 中，我们可以使用readtable函数来读取高度数据文件，并将数据存储在一个矩阵中。

接下来，我们需要对高度数据进行处理，计算Ra值。

计算Ra值的基本步骤如下：1. 将高度数据归一化，即将数据的中心点调整到零点，以便后续计算。

2. 计算高度数据的梯度，即计算相邻两个点之间的高度差值。

3. 计算高度数据的平方，并对结果进行求和。

4. 将结果开方，得到均方根值，即Ra值。

下面是具体的Matlab编程实现代码：```matlab% 读取高度数据文件data = readtable('height_data.txt');height = table2array(data);% 归一化高度数据mean_height = mean(height);height = height - mean_height;% 计算高度数据的梯度gradient_height = diff(height);% 计算均方根值Raroughness =sqrt(sum(gradient_height.^2)/length(gradient_height));disp(['表面粗糙度Ra值为: ', num2str(roughness)]);```通过以上代码，我们可以得到表面的粗糙度Ra值。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

粗糙集-属性约简-m a t l a b程序
Data2为条件属性，decision2为决策属性
%%%my_test函数实现
clc;
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%读取信息系统文件
file=textread('data2.txt','%s','delimiter','\n','whitespace','');%读取文件信息，每一行为一个胞元
[m,n]=size(file);%胞元的大小
fori=1:m
words=strread(file{i},'%s','delimiter','');%读取每个胞元中字符，即分解胞元为新的胞元
words=words';%转置
X{i}=words;
end
X=X'; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
[B,num,AT]=my_reduct(X);%信息系统的约简
ind_AT=ind(X);%信息系统的不可等价关系%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%显示约简信息系统
disp('约简后的条件系统为：');
[m,n]=size(B);
fori=1:m
disp(B{i});
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%读取决策系统文件
file=textread('decision2.txt','%s','delimiter','\n','whitespace','');
[m,n]=size(file);
fori=1:m
words=strread(file{i},'%s','delimiter','');
words=words';
D{i}=words;
end
D=D'; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%决策系统的正域约简
X_D=X;
[l,k]=size(X_D{1});
pos_d=pos(X_D,D);%正域
fori=1:m%%%%%%%%%%%%%%正域有问题%%%%%%%%%%%%%%%%%%%%%%%%%%%
if(~ismember(num(i),pos_d))
B{i}='';%若约简后的信息系统B{i}不在正域中则删除该行
end%因为相同的条件得到的决策不一样，
end
%将在正域规则下约简过的信息系统B连接决策系统D
[m,n]=size(B);
fori=1:m
if(~isequal(B{i},''))
B{i}{1,k+1}=D{i}{1};
end
end %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%显示约简决策系统
disp('约简后的决策系统为：');
[m,n]=size(B);
fori=1:m
disp(B{i});
end
--------------------------------------------------------------------------------
%%%%%my_reduct函数实现
function[C,num,reduct_attr]=my_reduct(X)
%%%%%y为约简后的cell数组，reduct_attr为可约去的属性
%X为行向量（元素为胞元）
clc;
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%约简
[m,n]=size(X);
[p,k]=size(X{1});
ind_AT=ind(X);%寻找不可等价关系
reduct_attr=[];%可约去的的属性
num=zeros(m,1);%约简后的信息对应的个体
fori=1:k
B=delete_AT(X,i);
if(isequal(ind_AT,ind(B)))%若IND(AT-{a}=IND(AT)
reduct_attr=union(reduct_attr,i);%则寻找到可约去的属性
X=B;
end
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%剔除重复的行
k=1;
fori=1:m
if(~isequal(ind_AT{i},[]))
C_i=ind_AT{i,1}(1);
num(k)=i;
C{k,1}=X{C_i};%返回约简后的信息系统
k=k+1;
end
end
--------------------------------------------------------------------------------
%%%%%ind函数实现
functionyy=ind(X)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%寻找不可分辨关系[m,n]=size(X);
k=1;
ind_AT=cell(m,1);
fori=1:m
forj=(i+1):m%潜在问题，如i=m是终止循环，此时若最后一行不为空的话，将漏扫
if(~isequal(X{i},''))%若X{i}不为空
ind_AT{k}=union(ind_AT{k},i);%不可等价关系赋初值
if(isequal(X{i},X{j}))
X{j}='';%若X{i}==X{j},则删除X{j}
ind_AT{k}=union(ind_AT{k},j);%寻找不可等价关系
end
end
end
k=k+1;
end
--------------------------------------------------------------------------------
%%%delete_AT函数的源代码
functiony=delete_AT(X,ATi)%删除X中第i列的属性值
[m,n]=size(X);
[l,k]=size(X{1});
fori=1:m
X{i}{ATi}='';
end
y=X;
--------------------------------------------------------------------------------
%%%%%pos函数实现
functionpos_d=pos(X,D)%求决策系统的正域函数
%X为条件属性，D为决策属性
ind_D=ind(D);%求决策属性D的不可等价关系
[m,n]=size(ind_D);
ind_X=ind(X);%求信息系统属性X的不可等价关系
low=[];%存储正域个体的编号
fori=1:m
forj=1:m
if(~isequal(ind_X{i},[])&&~isequal(ind_D{j},[]))
if(ismember(ind_X{i},ind_D{j}))
low=union(low,ind_X{i});%由性质Pos_AT(d)=low_AT(X1)Ulow_AT(X2)U...
end
end
end
end
pos_d=low;。

4粗糙集与数据约简

页数:76
粗糙集属性约简matlab程序

页数:4
粗糙集属性约简matlab程序解析

页数:8
粗糙集理论学习心得与基于ROSETTA的决策表属性约简实验--陈涛

页数:12
基于粗糙集的符号与数值属性的快速约简算法

页数:5