第六讲 变精度粗糙集模型
- 格式:ppt
- 大小:537.50 KB
- 文档页数:15
粗糙集理论的基本原理与模型构建粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它在信息科学、数据挖掘和人工智能等领域具有广泛的应用。
本文将介绍粗糙集理论的基本原理和模型构建方法。
一、粗糙集理论的基本原理粗糙集理论最早由波兰学者Pawlak于1982年提出,它是基于集合论和近似推理的一种数学模型。
粗糙集理论的核心思想是通过对数据集进行分析,找出数据之间的关联和规律,从而进行决策和推理。
粗糙集理论的基本原理包括下近似和上近似。
下近似是指在给定条件下,能够包含所有满足条件的对象的最小集合;上近似是指在给定条件下,能够包含所有满足条件的对象的最大集合。
通过下近似和上近似的计算,可以得到粗糙集的边界区域,进而进行数据分类、决策和模式识别等任务。
二、粗糙集模型的构建方法粗糙集模型的构建方法主要包括属性约简和决策规则提取两个步骤。
属性约简是指从原始数据集中选择出最具代表性和决策能力的属性子集。
属性约简的目标是减少属性的数量,同时保持原始数据集的决策能力。
常用的属性约简方法包括正域约简、核约简和快速约简等。
这些方法通过计算属性的重要性和相关性,从而选择出最优的属性子集。
决策规则提取是指从属性约简后的数据集中提取出具有决策能力的规则。
决策规则是一种描述数据之间关系的形式化表示,它可以用于数据分类、决策和模式识别等任务。
决策规则提取的方法包括基于规则的决策树、基于规则的神经网络和基于规则的关联规则等。
三、粗糙集理论的应用领域粗糙集理论在信息科学、数据挖掘和人工智能等领域具有广泛的应用。
它可以用于数据预处理、特征选择、数据分类和模式识别等任务。
在数据预处理方面,粗糙集理论可以帮助我们对原始数据进行清洗和转换,从而提高数据的质量和可用性。
通过对数据集进行属性约简和决策规则提取,可以减少数据集的维度和复杂度,提高数据挖掘和决策分析的效率和准确性。
在特征选择方面,粗糙集理论可以帮助我们选择出最具代表性和决策能力的属性子集。
2017,53(6)1引言粗糙集理论是波兰数学家Pawlak 于1982年提出的一种处理具有不精确性、不确定性和模糊性知识的有效工具[1],并被广泛地运用到知识发现、数据挖掘、决策分析和模式识别等领域[2-4]。
传统粗糙集的研究对象是具有离散属性值的完备信息系统,并基于不可区分关系,定义对象的下、上近似集。
然而,由于客观世界的复杂性、不确定性以及人类认知的有限性,信息系统的属性值并不是都已知的,即可能存在着部分对象的属性值未知的情况,处理此类信息系统,传统粗糙集方法显得无能为力。
为了处理此类问题,一些专家、学者主要从两个角度展开研究基于不完备信息的粗糙集方法。
第一个角度,主要针对不完备信息系统数据的不完整,采用预处理方法补全残缺的数据,而后利用传统粗糙集方法进行处理;另一个角度,是将对象间的不可分辨关系进行软化处理,建立容差关系、相似关系等。
对于第一个角度,由于预处理可能会造成更多的信息丢失,这里不做介基金项目:国家自然科学基金(No.71503103);江苏省自然科学基金(No.BK20150157);中央高校基本科研业务费专项资金资助-江苏省研究生培养创新工程(No.KYZZ_0096)。
作者简介:赵焕焕(1988—),女,博士生,研究方向:软计算;刘勇(1985—),通讯作者,男,博士,副教授,硕导,研究方向:软计算,冲突分析,E-mail :clly1985528@ 。
收稿日期:2015-08-25修回日期:2015-12-16文章编号:1002-8331(2017)06-0051-06CNKI 网络优先出版:2016-01-12,/kcms/detail/11.2127.TP.20160112.1710.020.html基于集对顺势相似关系的变精度粗糙集模型赵焕焕1,菅利荣1,刘勇2ZHAO Huanhuan 1,JIAN Lirong 1,LIU Yong 21.南京航空航天大学经济与管理学院,南京2111062.江南大学商学院,江苏无锡2141221.College of Economics and Management,Nanjing University of Aeronautics and Astronautics,Nanjing 211106,China2.School of Business,Jiangnan University,Wuxi,Jiangsu 214122,ChinaZHAO Huanhuan,JIAN Lirong,LIU Yong.Variable precision rough set model based on set pair homeopathic simi-lar puter Engineering and Applications,2017,53(6):51-56.Abstract :In order to deal with incomplete information system with noise data,ambiguity and other information,the thought and method of the set pair theory and variable precision rough set is used to construct a novel variable precision rough set model.To begin with,the advantages and limitations of these models previously established based on the set pair similarity relationship are compared,and then the set pair homeopathic similar relationship based on the threshold αconnection degree is defined,and then it is used to substitute the equivalence relationship of the variable precision rough set,so that a novel variable precision rough set model based on the set pair homeopathic similar relationship is established,and its properties are researched.Finally an example is used to verify the feasibility and effectiveness of the novel model.Key words :incomplete information system;set pair analysis;set pair homeopathic similar relationship;variable precision rough set;equivalence relationship摘要:为了能有效处理含有含噪音数据、模糊性的不完备信息系统,利用集对分析与粗糙集的思想与方法,在比较几种集对相似关系的优势与劣势的基础上,提出了一种基于阀值α联系度系数的集对顺势相似关系,并将其代替变精度粗糙集的不可区分关系,构建了一种基于集对顺势相似关系的变精度粗糙集模型,探讨其性质。
多重变精度粗糙集模型陆秋琴;和涛;黄光球【摘要】In order to solve the problem that the domain partition of Zaike variable precision rough set can not overlap, an expansion was made on the domain of Zaike variable precision rough set based on multi-set, a multiple variable precision rough set model was put forward, and its corresponding definitions, theorems and properties were fully described, which included definitions of multiple domain and multiple variable precision approximate sets, proofs of their properties, and relations between multiple Zaike variable precision rough set and multiple variable precision rough set. These definitions, theorems and properties have not only differences but also relations between multiple variable precision rough set and Zaike variable precision rough set. Multiple variable precision rough set can fully describe overlap among knowledge particles, difference of significance among objects and polymorphism of objects, and can conveniently find associated knowledge from data saved in a relation database, having one-to-many and many-to-many dependency, and thought to have no relations.%为了解决Zaike变精度粗糙集模型的论域划分不能重叠的问题,基于多重集合,对Zaike变精度粗糙集模型的论域进行了扩展,提出了基于多重集的多重变精度粗糙集模型,给出了该模型的完整定义、相关定理和重要性质,其中包括多重论域定义、多重变精度近似集的定义及其性质的证明、与Zaike变精度粗糙集的关系等.这些定义、定理和性质与Zaike变精度粗糙集既有区别又有联系.多重变精度粗糙集可充分反映知识颗粒间的重叠性,对象的重要度差另及其多态性,这样有利于用粗糙集理论从保存在关系数据库中的具有一对多、多对多依赖性的且认为不相关的数据中发现相关知识.【期刊名称】《计算机应用》【年(卷),期】2011(031)006【总页数】5页(P1634-1637,1640)【关键词】知识发现;粗糙集;多重粗糙集;变精度粗糙集;多重集【作者】陆秋琴;和涛;黄光球【作者单位】西安建筑科技大学管理学院,西安710055;西安建筑科技大学管理学院,西安710055;西安建筑科技大学管理学院,西安710055【正文语种】中文【中图分类】TP1820 引言Zaike变精度粗糙集模型[1]是Z.Pawlak 粗糙集模型[2-3]的重要扩展,其实质是允许一定的错误分类存在,这样有利于用粗糙集理论从认为不相关的数据中发现相关数据,解决属性间无函数或不确定关系的数据分类问题。