基于等价关系的混合多粒度粗糙集
- 格式:pdf
- 大小:668.69 KB
- 文档页数:5
基于粗糙集理论的不确定信息系统及其决策研究随着云计算、大数据等新兴信息技术的广泛应用,各领域的数据急剧增长,这其中结构化数据仍然是数据的主要表现形式之一。
在这些数据中往往含有大量冗余的与不确定性数据,从而导致模式分类的处理能力与决策的辨识能力的降低。
区间值型数据与直觉模糊型数据作为信息的不确定与不充分的表现形式是两种重要的结构化数据。
如何从这两类不确定数据中发现有价值的信息和规律为管理者提供决策参考,仍然是管理决策科学领域中的研究热点之一。
粗糙集理论作为数据挖掘领域中的重要方法之一,其最显著的优点是在于不需要提供解决问题所需要的数据以外的先验知识,只要面向数据本身提供的信息,就可以实现对数据的分类与决策规则的获取等任务。
该理论已经被成功地应用于机器学习、数据挖掘、决策分析等诸多领域。
经典的粗糙集模型是建立在等价关系基础之上的,要求相对较为严格,处理不确定性数据存在着局限性。
因此,经典粗糙集模型的各种扩充对于不确定信息系统的知识约简与决策规则的获取具有极其重要的意义。
本文以粗糙集为工具,结合国内外的研究现状,较为系统的研究了单粒度与多粒度背景下区间值信息系统与直觉模糊信息系统的属性约简及其决策规则的获取问题,同时面向交通事故因素关联分析问题构造了一种群决策属性粗糙集模型并加以应用。
本文的主要创新性工作如下:(1)分析了现有的容差关系在区间值聚类中的不足,本文构建了一种模糊等价关系,基于此关系分别从单粒度与多粒度视角建立了区间值信息系统的粗糙集模型,给出分辨矩阵、属性约简的判定定理及其属性约简的方法,基于模糊等价关系定义了区间值决策系统上的决策规则置信度因子,给出了决策规则的支持定理及其决策规则的获取方法。
(2)分别从单粒度与多粒度角度建立了直觉模糊信息系统的粗糙集模型。
定义了直觉模糊信息系统上的偏序关系及其分辨矩阵,给出了有效的属性约简方法。
基于直觉模糊决策系统的分类质量给出了相对属性约简的计算方法,研究了相对属性重要度以及序决策规则的提取方法,建立了直觉模糊信息系统的乐观多粒度与悲观多粒度两种模型,分析了相应的性质及其与单粒度模型的联系与区别,给出了基于多粒度序关系的决策规则置信度因子及其决策规则的获取方法。
基于粒度矩阵的程度多粒度粗糙集粒度约简汪小燕;申元霞【摘要】Multi-granularity is an effective data processing method in rough set theory.Granularity reduc-tion is the prerequisite for obtaining the concise rules of the information system.The granulation reduction of graded optimism (pessimism)multi-granulation rough set is researched and the lower approximation definition of graded rough set is improved.The granulation matrix of graded multi-granulation rough set is proposed. Based on the granulation matrix,the lower approximation calculation and necessity of granularity are studied in graded multi-granulation rough set.Then the core granulation definition on graded optimism multi-granulation rough set is given.The granulation reduction of graded optimism (pessimism)multi-granulation rough set is proposed based on granulation matrix.Finally,a numerical example is given to demonstrate the correctness of the proposed method for granularity reduction.%多粒度是粗糙集理论中的一种有效的数据处理方法,粒度约简是获取信息系统简洁规则的前提。
第三节粗糙集(Rough Set,RS)如果我们将研究对象看成是现象,那么我们可以将这些现象分类。
现象被分为确定现象与不确定现象。
不确定现象有分为随机现象,模糊现象和信息不全的粗糙现象。
如下所示:⎧⎪⎪⎧⎪⎪⎨⎪⎪⎨⎪⎪⎪⎪⎩⎩∈确定现象随机现象,0-1律,多种可能性满足分布规律。
现象不确定现象模糊现象,律属度Î(0,1),不是非此即彼。
粗糙现象,研究那些因为信息不充分而导致的不确定性相对于前两种现象的处理,粗糙现象是基于不完全的信息或知识去处理不分明的现象,因此需要基于观测或者测量到的部分信息对数据进行分类,这就需要与概率统计和模糊数学不同的处理手段,这就是粗糙集理论。
直观地讲,粗糙集是基于一系列既不知道多了还是少了,也不知道有用还是没用的不确定、不完整乃至于部分信息相互矛盾的1数据或者描述来对数据进行分析、推测未知信息。
下面我们对粗糙集的基本特征、以及数学符号进行简述。
1.粗糙集的特点粗糙集的特点是利用不精确、不确定、部分真实的信息来得到易于处理、鲁棒性强、成本低廉的决策方案。
因此更适合于解决某些现实系统,比如,中医诊断,统计报表的综合处理等。
粗糙集的另一个重要特点就是它只依赖于数据本身,不需要样本之外的先验知识或者附加信息,因此挑选出来的决策属性可以避免主观性,有英雄不问出身的意味。
用粗糙集来处理的数据类型包括确定性的、非确定性的、不精确的、不完整的、多变量的、数值的、非数值的。
粗糙集使用上、下近似来刻画不确定性,使得边界有了清晰的数学意义并且降低了算法设计的随意性。
3.粗糙集的基本概念粗糙集要涉及论域U(这与模糊系统相似),还要涉及属性集合R C D=(这被认为是知识,或者知识库)。
当然,也要有属性值域V,以及信息函数f:U R V⨯→的。
因此,一个信息系统S可以表示为一个四元组{}=。
在不混淆的情况下,简记为(,)S U R V f,,,=,S U R23 也称为知识库。
等价关系(通常用来代替分类)是不可或缺的概念,根据等价关系可以划论域中样本为等价类。
粗糙集理论与应用研究综述粗糙集理论是不确定性信息处理的一种数学工具,是由波兰科学家佩德罗泽文斯基于1982年提出的。
粗糙集理论通过将数据划分成不同的等价类,来描述不确定性的知识和推理过程。
在实际应用中,粗糙集理论被广泛应用于模式识别、数据挖掘、决策支持系统等领域。
粗糙集理论的核心思想是基于粗糙近似。
在数据集中,有些数据可能存在不确定性,即一个数据对象可能属于多个等价类。
为了处理这种不确定性,粗糙集理论引入了下近似集和上近似集的概念。
下近似集是所有能包含该数据对象的最小等价类的集合,上近似集是能被该数据对象覆盖的最大等价类的集合。
通过对下近似集和上近似集的分析,可以获得对不确定性的更准确的描述。
粗糙集理论的核心内容包括等价关系的建立和精化、下近似集和上近似集的计算、知识规约等。
等价关系的建立和精化主要是通过观察数据集中的属性值之间的关系,构建等价关系矩阵,并通过矩阵的交叉点进行精化。
下近似集和上近似集的计算是通过迭代和剪枝操作,依次计算各个属性的下近似集和上近似集。
知识规约是利用粗糙集理论对数据集进行简化,去除不必要的属性,提取出核心属性和决策规则。
在模式识别中,粗糙集理论可以用于特征选择和特征提取。
特征选择是指从原始数据集中选择出最具有代表性和判别能力的特征子集,以便提高分类器的性能。
特征提取是通过对原始特征进行数学变换,将其转化为新的特征空间,以便更好地区分和分类数据。
粗糙集理论可以帮助识别出具有决策不确定性的特征,并提供精确的决策规则。
在数据挖掘中,粗糙集理论可以用于发现数据之间的相互关系和规律。
通过对数据集进行粗糙集分析,可以得到不同属性之间的依赖关系,以及属性与决策之间的关系。
基于这些关系,可以发现隐藏在数据集中的模式和规律,帮助用户进行预测和决策。
在决策支持系统中,粗糙集理论可以用于辅助决策过程中的信息处理和决策分析。
通过对决策问题进行粗糙集建模,可以对决策过程中的不确定性进行量化,并提供决策规则和优化方案。
哎呀,这个话题听起来就挺高大上的,不过别担心,咱们今天就用大白话聊聊这个“基于粗糙集的多源信息融合处理技术”。
这玩意儿听起来像是科学家们在实验室里捣鼓的玩意儿,但其实它跟咱们的日常生活也息息相关呢。
先说说啥是粗糙集。
粗糙集,这玩意儿就像是你家里那个乱七八糟的杂物抽屉,里面啥都有,但找起东西来可费劲了。
粗糙集就是用来处理这种不精确、不完整信息的一种数学工具。
它能帮助我们从这些乱七八糟的信息中提取出有用的知识。
再说说多源信息融合。
这个就更简单了,就像你做菜,得把各种食材混合在一起,才能做出美味的大餐。
多源信息融合就是把来自不同地方、不同形式的信息整合到一起,让它们发挥出最大的价值。
好了,现在咱们来聊聊一个真实的例子。
比如说,你是个天气预报员,你得从卫星云图、地面观测站、海洋浮标等等一大堆地方收集数据。
这些数据就是多源信息。
但是,这些数据有时候不完整,有时候又互相矛盾,这时候粗糙集就派上用场了。
想象一下,你手里有一堆乱七八糟的数据,有的清晰,有的模糊。
粗糙集就像是一个筛子,帮你把那些模糊不清的数据筛掉,留下那些有用的信息。
然后,你把这些有用的信息融合在一起,就像是把各种食材混合在一起,最后得出一个准确的天气预报。
这个过程听起来挺复杂的,但其实就跟咱们平时处理事情一样。
比如,你决定今天晚上吃什么,你得考虑冰箱里有什么食材,还得考虑自己的口味和健康需求。
这个过程其实就是一个信息融合的过程,你得从各种信息中提取出对你有用的部分,然后做出决策。
所以说,基于粗糙集的多源信息融合处理技术,其实就是一种帮助我们从复杂信息中提取有用知识的工具。
它虽然听起来高大上,但其实就跟我们日常生活中的决策过程差不多。
通过这种技术,我们可以更好地理解和利用周围的世界,做出更明智的决策。
这就是这个技术的魅力所在,它让我们的生活变得更加智能,更加高效。
多粒度粗糙集粒度约简的高效算法胡善忠;徐怡;何明慧;王冉【期刊名称】《计算机应用》【年(卷),期】2017(037)012【摘要】Aiming at the low efficiency problem of the existing granulation reduction algorithms for multi-granulation rough set,an Effective Algorithm for Granulation Reduction of Multi-granulation Rough Set (EAGRMRS) was proposed.Firstly,the lower approximation Boolean matrix of decision classes was defined by using the decision information system as the object.The defined matrix could be used for converting redundant and repeated set operations into Boolean operations in the process of granular reduction.Based on this matrix,the algorithm for computing lower approximation of decision classes and the algorithm for computing the important measure of granularity were presented.Then,focusing on the problem of redundancy calculation when computing the important measure of granularity,a fast algorithm for computing the important measure of granularity with dynamic increasing of granularity was presented.On the basis,the EAGRMRS was proposed.The time complexity of the proposed algorithm is O(| A | ·| U| 2 +| A | 2 ·| U|),in which | A [is the size of granulation set,| U| is the number of instances in decision information system.The experimental results on UCI datasets show that,the proposed algorithm is effective and efficient,the efficiency advantage ofEAGRMRS is more obvious over Heuristic Approach to Granular Structure Selection (HAGSS) for multi-granulation rough set when the dataset increases.%针对已有多粒度粗糙集粒度约简算法效率较低的问题,提出一种多粒度粗糙集粒度约简的高效算法(EAGRM RS).首先,以决策信息系统为对象,定义决策类下近似布尔矩阵,该矩阵能够将粒度约简过程中过多且有重复的集合运算转换为布尔运算,基于该矩阵给出计算决策类下近似算法和计算粒度重要度算法.然后,针对计算粒度重要度时存在冗余计算的问题,提出粒度动态增加时快速计算粒度重要度的算法,并在此基础上,提出EAGRMRS,该算法的时间复杂度为O(| A|·| U|2+| A|2·|U|),其中|A|表示粒度集合大小,|U|表示决策信息系统中实例数.在UCI数据集上的实验结果验证了所提算法的有效性和高效性,并且随着数据集的增大,EAGRMRS相较于多粒度粗糙集粒度约简的启发式算法(HAGSS)效率优势更加明显.【总页数】6页(P3391-3396)【作者】胡善忠;徐怡;何明慧;王冉【作者单位】安徽大学计算机科学与技术学院,合肥230601;安徽大学计算机科学与技术学院,合肥230601;计算智能与信号处理教育部重点实验室(安徽大学),合肥230039;安徽大学计算机科学与技术学院,合肥230601;安徽大学计算机科学与技术学院,合肥230601【正文语种】中文【中图分类】TP18【相关文献】1.基于下近似分布粒度熵的变精度悲观多粒度粗糙集粒度约简 [J], 孟慧丽;马媛媛;徐久成2.基于粒度矩阵的程度多粒度粗糙集粒度约简 [J], 汪小燕;申元霞3.可变多粒度粗糙集粒度约简研究 [J], 汪小燕;郭云婷;申元霞4.基于压缩决策表的乐观多粒度粗糙集粒度约简算法 [J], 王必晴;梁昌勇;齐平;黄永青5.基于矩阵的多粒度粗糙集粒度约简方法 [J], 郑文彬;李进金;张燕兰;廖淑娇因版权原因,仅展示原文概要,查看原文内容请购买。