粗糙集理论介绍和研究综述
- 格式:pdf
- 大小:545.56 KB
- 文档页数:12
第2卷第6期 智 能 系 统 学 报 V ol.2 .62007年12月 CAAI T ransactions on Intelligent Systems D ec.2007粒计算研究综述王国胤1,2,张清华1,2,胡 军1,3(1.重庆邮电大学计算机科学与技术研究所,重庆400065; 2.西南交通大学信息科学与技术学院,四川成都610031;3.西安电子科技大学电子工程学院,陕西西安710071)摘 要:粒计算(gr anular computing)是当前计算智能研究领域中模拟人类思维和解决复杂问题的新方法.它覆盖了所有有关粒度的理论、方法和技术,是复杂问题求解、海量数据挖掘、模糊信息处理的有效工具.首先回顾了粒计算研究和发展状况,介绍了粒计算的基本组成和问题,综述了粒计算的基本模型和方法,并讨论了它们之间的相互关系,最后探讨了构建统一的粒计算模型、复杂问题空间的粒化、粒层之间的转换、高效的粒计算方法、新的粒计算模型、动态粒计算模型、自主粒计算模型、粒计算方法的模糊化以及粒计算模型的应用和推广等几个方面的关键问题.关键词:粒计算;数据挖掘;智能信息处理;粗糙集;模糊集;商空间中图分类号:T P18 文献标识码:A 文章编号:1673 4785(2007)06 0008 19An overview of granular computingWAN G Guo yin 1,2,ZHANG Qing hua 1,2,HU Jun 1,3(1.Institute of Comput er Science &T echno lo gy ,Cho ng qing U niversit y of Po st s and T eleco mmunications,Chong qing 400065,China;2.Scho ol of Infor matio n Science &T echnolog y,Southwest Jiao tong U niv ersit y,Chengdu 610031,China; 3.School of Electro nic Engineer ing,Xidian U niver sity,Xi an 710071,China)Abstract:In the field of com putational intelligence,granular computing (GrC)is a new w ay to simulate hu m an thinking to help solve co mplicated problems.Gr C involv es all the theories,methodo logies and tech niques o f granularity,pr oviding a pow erful to ol for the so lution of complex problems,m assiv e data min ing,and fuzzy information pr ocessing.In this paper,first the current situation and the developm ent pros pects of GrC are introduced,then the fundamental and ex isting problem s r elated to GrC ar e presented and its basic models and metho ds summ arized.Finally,som e future research topics abo ut GrC are presented,such as,uniform granular co mputing mo del,granulation of complex pro blem space,transform ation be tw een granule spaces,efficient g ranular co mputing algor ithm,nov el g ranular co mputing model,dy namic granular co mputing m odel,data driven g ranular co mputing m odel,fuzzy gr anular co mputing method,and the applications of gr anular computing models,etc.Keywords:g ranular computing;data m ining;intelligent inform ation processing;roug h sets;fuzzy sets;quotient space收稿日期:2007 04 02.基金项目:国家自然科学基金资助项目(60573068);新世纪优秀人才支持计划;重庆市教委科学技术研究资助项目(KJ060517).自Zadeh 1979年发表论文!Fuzzy sets and in form ation granularity ∀以来[1],研究人员对信息粒度化的思想产生了浓厚的兴趣.Zadeh 认为很多领域都存在信息粒的概念,只是在不同领域中的表现形式不同.自动机与系统论中的!分解与划分∀、最优控制中的!不确定性∀、区间分析里的!区间数运算∀、以及D S 证据理论中的!证据∀都与信息粒密切相关.H obss 在1985年直接用!粒度(granularity)∀作为论文题目发表论文[2],讨论了粒的分解和合并,以及如何得到不同大小的粒,并提出了产生不同大小粒的模型.Lin 在1988年提出邻域系统并研究了邻域系统与关系数据库之间的关系[3].1996年,他在U C Berkeley 大学访问时,向Zadeh 提出作!granular computing∀的研究,Zadeh称之为!g ranular mathematics∀,Lin改称为!granular co mputing∀,并缩写成Gr C.他发表了一系列关于粒计算与邻域系统的论文[4-10],主要是研究二元关系(邻域系统、Rough集和信任函数)下的粒计算模型,论述基于邻域系统的粒计算在粒结构、粒表示和粒应用等方面的问题,讨论了粒计算中的模糊集和粗糙集方法,并将粒计算方法引入数据挖掘和机器发现.依据人们在解决问题时能从不同的粒度世界去分析和观察同一问题,并且很容易地从一个粒度世界转到另一个粒度世界,张钹和张铃在1990年针对复杂问题求解,建立了一种复杂问题求解的商结构形式化体系,给出了一套解决信息融合、启发式搜索、路径规划和推理等问题的理论和算法[11-12].1997年,Zadeh进一步指出[13],世上有3个基本概念构成人类认知的基础:粒化、组织及因果关系.其中,粒化是整体分解为部分,组织是部分结合为整体,而因果关系则涉及原因与结果间的联系.物体的粒化产生一系列的粒子,每个粒子即为一簇点(物体),这些点难以区别,或相似、或接近、或以某种功能结合在一起.一般来说,粒化在本质上是分层次的,时间可粒化为年、月、日、小时、分、秒就是大家熟悉的例子.在Lin的研究基础上,Yao结合邻域系统对粒计算进行了详细的研究[14-16],发表了一系列研究成果[17-22],并将它应用于知识挖掘等领域,建立了概念之间的if then规则与粒度集合之间的包含关系,提出利用由所有划分构成的格求解一致分类问题,为数据挖掘提供了新的方法和视角.结合粗糙集理论,Yao探讨了粒计算方法在机器学习、数据分析、数据挖掘、规则提取、智能数据处理和粒逻辑等方面的应用.Yao给出了粒计算的3种观点[22]:1)从哲学角度看,粒计算是一种结构化的思想方法;2)从应用角度看,粒计算是一个通用的结构化问题求解方法;3)从计算角度看,粒计算是一个信息处理的典型方法.随着粒计算研究的发展,近年来国内外又有很多学者加入到了粒计算研究的领域.为了探讨粗糙集理论在各种环境下的应用,Skow r on[23-27]以包含度概念来研究粒近似空间上的Rough下近似和Rough上近似.刘清[28-30]在Roug h逻辑的基础上,提出了粒-逻辑的概念(G 逻辑),构造了这种逻辑的近似推理系统,并应用于医疗诊断.近几年来,在掀起粒计算研究的热潮中,商空间理论被人们广泛认识和推广,2003年张铃和张钹将模糊概念与商空间理论结合,提出模糊商空间理论,为粒计算提供了新的数学模型和工具,并成功应用于数据挖掘等领域[31-35].2002年苗夺谦等人[36]对知识的粒计算进行探讨,引入属性的重要度,并在求最小属性约简方面得到应用.王飞跃等人[37]对词计算和语言动力学进行了探讨,以词计算为基础,对问题进行动态描述、分析和综合,提出了设计、控制和评估的语言动力学系统.王国胤等人[38-44]提出了基于容差关系的粒计算模型,利用属性值上的容差关系给出了不完备信息系统的粒表示、粒运算规则和粒分解算法,同时结合粗糙集中的属性约简问题,提出了不完备信息系统在粒表示下属性必要性的判定条件,对粒计算方法在规则提取方面进行了探索.郑征等人[45-47]提出了相容粒度空间模型,并在图像纹理识别和数据挖掘中取得了成功,他们认为,人类具有根据具体的任务特性把相关数据和知识泛化或者特化成不同程度、不同大小的粒的能力,以及进一步根据这些粒和粒之间的关系进行问题求解的能力.卜东波等人[48]从信息粒度的角度剖析聚类和分类技术,试图使用信息粒度原理的框架来统一聚类和分类,指出从信息粒度的观点来看,聚类是在一个统一的粒度下进行计算,而分类却是在不同的粒度下进行计算,并根据粒度原理设计了一种新的分类算法,大规模中文文本分类的应用实践表明,这种分类算法有较强的泛化能力.Zhang等人[49-50]对粒神经网络进行了探讨,并在高效知识发现中得到很好的应用.李道国等人[51]研究了基于粒向量空间的人工神经网络模型,在一定程度上提高了人工神经网络的时效性、知识表达的可理解性.杜伟林等人[52]根据概念格[53]与粒度划分在概念聚类的过程中都是基于不同层次的概念结构来进行分类表示,而且粒度划分本身构成一个格结构的特点,研究了概念格与粒度划分格在概念描述与概念层次转换之间的联系,通过对概念的分层递阶来进行概念的泛化与例化,使概念在递阶方面忽略不必要的冗余信息.Yager[54]探讨了基于粒计算的学习方法和应用.Lin[55]在2006年粒计算国际会议上提出了新的研究思路!infrastruc tures for AI engineering∀.同时,Bargiela和Pe dry cz[56]也从各个侧面对粒计算的根源和实质进行了详细的探讨和总结.Yag er指出,发展信息粒的操作方法是当前粒计算研究的一个重要任务[57].1 粒计算的基本组成粒计算的基本组成主要包括3部分:粒子、粒层#9#第6期 王国胤,等:粒计算研究综述和粒结构.1 1 粒 子粒子是构成粒计算模型的最基本元素[58-59],是粒计算模型的原语.一个粒可以被解释为许多小颗粒构成的一个大个体,现实生活中,粒子无处不在,如在地图上观察洲、国家、海洋、大陆和山脉等是一些粗的粒子(大的粒子),观察省、市、区等是一些中等的粒子,而观察街道、饭店、机场等是一些相对较小的粒子.一个粒子可以被同时看作是由内部属性描述的个体元素的集合,以及由它的外部属性所描述的整体.一个粒子的存在仅仅在一个特定的环境中才有意义.一个粒子的元素可以是粒子,一个粒子也可以是另外一个粒子的元素.而衡量粒子!大小∀的概念是粒度,一般来讲,对粒子进行!量化∀时用粒度来反映粒化的程度[59].1 2 粒 层按照某个实际需求的粒化准则得到的所有粒子的全体构成一个粒层,是对问题空间的一种抽象化描述.根据某种关系或算子,问题空间产生相应的粒子.同一层的粒子内部往往具有相同的某种性质或功能.由于粒化的程度不同,导致同一问题空间会产生不同的粒层.粒层的内部结构是指在该粒层上的各个粒子组成的论域的结构,即粒子之间的相互关系.在问题求解中,选择最合适的粒层对于问题求解尤为关键,因为,在不同粒层求解同一问题的复杂度往往不同.在高一级粒层上的粒子能够分解成为下一级粒层上的多个粒子(增加一些属性),在低一级粒层上的多个粒子可以合并成高一级粒层上的粒子(忽略一些属性).粒计算模型的主要目标是能够在不同粒层上进行问题求解,且不同粒层上的解能够相互转化.1 3 粒结构一个粒化准则对应一个粒层,不同的粒化准则对应多个粒层,它反应了人们从不同角度、不同侧面来观察问题、理解问题、求解问题.所有粒层之间的相互联系构成一个关系结构,称为粒结构[20].粒结构给出了一个系统或者问题的结构化描述.通过从系统思维、复杂系统理论和层次结构理论(技术)中得到的启发至少需要确定一个粒结构网[20]中3个层次的结构:粒子的内部结构、粒子集结构和粒子网的层次结构.粒子集的集体结构可以看作是全部层次结构中一个层次或者一个粒度视图中的结构.它本身可以看作是粒的内部连接网络.对于同一个系统或者同一个问题,许多解释和描述可能是同时存在的.所以,粒结构需要被模型化为多种层次结构,以及在一个层次结构中的不同层次.虽然一个粒子在某个粒层上被视为一个整体,但粒子内部元素(子粒子)的结构在问题求解时也很重要,因为它能提供粒子更为详细的特性.而在同一层上的粒子之间也具有某种特殊的结构,它们可能是相互独立,或者部分包含.如果同一粒层上的粒子之间的独立性越好,可能问题求解后合并起来越方便;反之,如果粒子之间的相关性越好,则问题求解后的合并工作相对越繁杂.粒子网的层次结构是对整个问题空间的概括,它的复杂性在一定程度上决定了问题求解的复杂程度.2 粒计算的基本问题粒计算中存在2个最基本的问题,即粒化和粒的计算.问题空间的粒化是指将问题空间分解为许多子空间,或是基于有用的信息和知识将问题空间中的个体聚集成不同的类,这些类称之为粒.粒中的元素可以理解为对应概念的实例.可以把粒计算和概念生成、知识发现和数据挖掘联系起来,因为概念生成的目的之一是对具有某些概念的粒的表示、特征化、描述和解释,而知识发现和数据挖掘就是在粒之间建立关联和因果等联系.2 1 粒 化粒化是问题求解空间的一个构造性过程,它可以简单理解为在给定粒化准则下得到一个粒层的过程,是粒计算基础单元的构建,包括粒子、粒视图、粒网和层次结构.在不同的粒化准则下就得到多个粒层,进而得到粒层的网络结构.通常的粒化方法有自顶而下通过分解粗粒子得到细粒子的方法,和自底向上将细粒子通过合并得到粗粒子的方法.粒化过程是粒计算的必要过程.问题空间的粒化过程主要涉及粒化准则、粒化算法(方法)、粒子和粒结构的表示(描述)以及粒子和粒结构的定性(定量)描述等问题[59].粒化准则主要是语义方面的问题,解决为什么2个对象能放进同一个粒子内的问题.它是根据实际问题求解的具体需求和具体精度要求得到的.粒化准则的一个基本要求是忽略掉那些无关紧要的细节,从而达到降低问题求解复杂度的目的.粒化方法面对实际问题,回答如何对问题空间进行粒化,采用什么算法或工具实现粒层的构造,它属于算法方面的问题.如在粗糙集理论中,如何对对象集进行划分产生粒层,如何高效实现属性的约简等问题.粒子的结构描述主要是用粒化方法得到的粒子,如何用形式化的语言表述出来,以便后面进行计算.例如在粗糙集理论模型中,粒子的表示可能是一个子集.而#10#智 能 系 统 学 报 第2卷在概念格理论中,粒子的表述就是一个概念,它包括概念的外延(一个对象子集)和内涵(一个属性子集) 2部分.粒结构的描述往往形式多样,在商空间理论模型中,粒结构是一种分层递阶的结构,在概念格模型中,粒结构是一种H asse图.粒子和粒结构的定性、定量描述主要指粒子和粒结构的大小(主要是指粒度的结果)和复杂性度量.当前,成功的粒化方法往往都是以将解空间形成划分空间为主要的目标,这样便于将子空间上的解合成原问题空间的解,商空间理论就是这样一个成功的实例.当然,如果用某种粒化方法形成的解空间不是划分(如覆盖),这将增加合成的复杂度.2 2 粒的计算以粒子为运算对象进行问题的求解或推理,是狭义的粒计算.粒计算可以通过系统访问粒结构来解决问题,包括在层次结构中向上和向下2个方向的交互,以及在同一层次内的移动,主要分为2种[59]:同一粒层上粒子之间相互转换和推理,不同粒层上粒子之间的转换或推理.不同粒层之间的联系可以由映射来表示,在不同粒层上同一问题以不同的粒度、不同的细节表示,粒层之间的映射就建立了同一问题的不同细节描述之间的关系.商空间理论模型就是通过自然投影建立了分层递阶的商空间链式结构.粒计算的主要特点是同一问题的解可以在不同粒层之间自由转化.正是基于这一点,人们才能用粒计算方法高效地实现复杂问题的求解.模糊商空间上的分层递阶结构可以通过模糊等价关系的截关系建立相应的转化联系;粗糙集理论中的划分粒度可以通过属性的增加或删减来控制;而概念格理论模型中的概念粒子的相互转化可以通过改变概念的内涵来实现.这些转化虽然方式不同,但一个共同的特点是在转化的过程中,问题求解的重要性质必须能在不同粒层上表现出来,这也是评价粒化方法好坏的一个重要指标.如果在粒化后粒层之间的相互转化过程中,某些重要属性不能体现出来,这不但不利于问题的求解,反而会导致问题求解过程发散,从而增加问题求解的复杂度.商空间理论模型中的!保真∀和!保假∀原理使得粒化后形成的商空间具有!保序∀性,使得问题求解的搜索空间大大减少,复杂度由相乘变为相加.粒计算的2个基本问题中,粒化是关键,它直接决定粒计算的成功与否.因此,粒化方法是人们研究的热点问题.目前,粒化方法很多,如基于等价关系的划分产生粒子[17],基于模糊集产生模糊信息粒[1],基于模糊等价关系截集产生分层递阶粒空间[35],基于概念格产生概念信息粒和概念知识粒[60],基于邻域系统产生邻域粒子[3]等等.总之,粒计算是一个多准则学科,它从许多领域中获得其基本的思想、准则和方法,是基于不同层次粒度和细节的问题求解的一般性理论.在粒计算的!大伞∀下进行统一的研究,可以发现不同学科之间原理的关联,它与具体的学科研究是相互独立的[59].一旦掌握了粒计算中的结构化思维和结构化问题求解的抽象思想,就可以很容易地在任何领域中运用.3 粒计算的主要模型与理论方法3 1 词计算模型高标准的精确表达,普遍存在于数学、化学、工程学和另外一些!硬∀科学之中,而不精确表达却普遍存在于社会、心理、政治、历史、哲学、语言、人类学、文学、文艺及相关的领域中[61].针对复杂且非明晰定义的现象,无法用精确的数学方法来描述,但可以用一些程度词语,如不很可能、十分不可能、极不可能等,来对某些模糊概念进行修饰.尽管普通的精确方法(如数学)在某些科学领域应用相当广泛,也一直尝试着应用到人文学科中,但人们在长期的实践中已经清楚地认识到精确的方法应用到人文学科有很大的局限性.面对巨大而又复杂的人文学科系统,区别于传统方法的新方法∃∃∃模糊计算方法被Zadeh提出.在人类的认识中,粒的模糊性直接源于无区别、相似性、接近性以及功能性等这些概念的模糊性.人类具有在不精确性、部分知识、部分确定以及部分真实的环境下作出合理决策这一不同寻常的能力,而模糊信息粒化正是这种能力的基础.在模糊逻辑中,模糊信息粒化是语言变量、模糊!if then∀规则以及模糊图的基础.词计算(com puting w ith w o rds)是用词语代替数进行计算及推理的方法[62].如何利用语言进行推理判断,这就要进行词计算.信息粒化为词计算提供了前提条件,词计算在信息粒度、语言变量和约束概念上产生了自己的理论与方法,意在解决模糊集合论的数值化隶属度函数表示法的局限性、表达的概念缺乏前后联系、逻辑表达和算子实现的复杂性等问题,使它们能够更符合人类的思维特点.词计算有狭义和广义2个方面的概念.狭义的模糊词计算理论是指利用通常意义下的数学概念和运算(如加、减、乘、除等)构造的带有语义的模糊数值型的词计算的理论体系;广义的词计算理论统指用词进行推理、用词构建原型系统和用词编程,前者是后者的基#11#第6期 王国胤,等:粒计算研究综述础[63].模糊逻辑在词计算中起中心作用,它可以近似地被认为与词计算相同[62].在词计算中存在2个核心问题:模糊约束的表现问题和模糊约束的繁殖问题,它们是模糊信息粒化的基本准则.信息粒化(infor mation granulation)是粒化的一种形式.在众多的信息粒化中,非模糊粒化的方法很多,如将问题求解空间形成划分空间,每个粒子都是精确的.但这种粒化方法不能解决很多现实问题,如将人的头部粒化为脸、鼻子、额头、耳朵、头盖、脖子等粒子,这些粒子之间没有明确的分界线,它们都是模糊的粒子.模糊信息粒化是传统信息粒化的一种推广.模糊信息粒化理论[64-65](theor y of fuzzy information g ranulation,TFIG)建立在模糊逻辑和信息粒化方法基础之上,是从人类利用模糊信息粒化方式中获得的启发,其方法的实质是数学.Zadeh指出[64],除模糊逻辑外,没有一种方法能提供概念框架及相关技术,它能在模糊信息粒化起主导作用.继Zadeh之后,许多学者开始了有关词计算的研究工作,Wang[66]编写了词计算一书.广义词计算理论的研究工作,中国刚刚起步,李征等人[67-68]通过研究模糊控制器的结构,认为模糊控制实际上是应用了信息粒化和词计算技术,但却只是应用了该技术的初级形式,而基于信息粒化和词计算(IGCW)的模糊控制系统,将具有更强的信息处理和推理判断能力,是对人类智能更高程度的模拟.他们指出,基于信息粒化和词计算的模糊控制系统是通过信息粒化和重组、多层次的思维决策,动态地改变下层控制器的参数和推理方法或控制规则,因而使控制器具有变结构和多模态的特性.信息太多会延误推理计算的时间,给系统带来不必要的处理任务;而信息太少,则会降低推理结果的完善性.因此,提出了合理重新组织信息的研究课题.随着近年来智能信息处理的不断深入与普及,特别是处理复杂系统分析与评估时的迫切需要,人们越来越发现排除自然语言的代价太大了.首先,从应用角度来看,人类已习惯于用自然语言描述和分析事物,特别是涉及社会、政治、经济和管理中的复杂过程.人类可以方便地利用以自然语言表示的前提进行推理和计算,并得到用自然语言表达的结果;其次,从理论角度来看,不利用自然语言,现有的理论很难甚至不能够处理感性信息,而只能处理测度信息.感性信息或知识通常只能用自然语言来描述,由于人类分辨细节和存储信息的认知能力的内在限制,感性信息在本质上是不精确的[69-72].W ang利用自然语言知识和信息,建立以词计算为基础的语言动力学系统(linguistic dynamic system s,LDS),并通过融合几个不同领域的概念和方法[37],提出基于词计算的语言动力学系统的计算理论框架,根据这个计算理论框架,利用常规或传统数值动力学系统中已有的成熟概念和方法,对语言动力学系统进行动力学分析、设计、控制和性能评估.这些研究的目的是建立连接人类的语言知识表示与计算机的数字知识表示的桥梁,成为下一代智能化人机交互的理论基础之一.总之,词计算理论和方法对于复杂信息系统的模糊推理和控制非常重要,但由于自身的局限性,它必须和其他理论体系相结合,才能更有效地处理复杂信息.3 2 粗糙集模型一个对象属于某个集合的程度随着属性粒度的不同而不同,为了更好地刻画集合边界的模糊性,波兰学者Paw lak[73]在20世纪80年代提出了粗糙集理论,其本质思想是利用不可分辨关系(等价关系)来建立论域的一个划分,得到不区分的等价类(即不同属性粒度下的概念粒),从而建立一个近似空间(由不同大小的概念粒形成).在近似空间上,用2个精确的集合(上近似集和下近似集)来逼近一个边界模糊的集合.如果近似空间的粒度较粗,被近似的集合的边界域较宽,而如果近似空间的粒度较细,被近似集合的边界域较窄.给定集合X上的一个划分等价于在X上给定一个等价关系R.X/R表示U上由R导出的所有等价类,[x]R表示包含元素x的等价类,其中x%U. Paw lak称之为在论域上给定了一个知识基(X,R),然后讨论一个一般的概念X(U中的一个子集)如何用知识基中的知识来表示.对那些无法用(X,R)中的集合的并来表示的集合,借用拓扑中的内核和闭包的概念,引入下近似和上近似的概念:R-(X)= {x%U|[x]R X}和R-(X)={x%U|[x]R&X∋ }.当R-(X)∋R-(X)时,就称X为粗糙集,从而创立了!粗糙集理论∀.粗糙集理论是一种软计算方法.软计算(soft computing)概念是由模糊集创始人Zadea提出的[61-65].传统的计算方法即所谓硬计算,使用精确、固定和不变的算法来表达和解决问题;而软计算的指导原则是利用所允许的不精确、不确定性和部分真实性得到易于处理、鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调.粗糙集理论的研究,已经经历了20多年的时间,无论是在系统理论、计算模型的建立和应用系统的研制开发上,都已经取得了很多成果,也建立了一套较为完善的粗糙集理论体系[74-75].目前粗糙集理#12#智 能 系 统 学 报 第2卷。
自己为什么选择这个课题?(选题的缘由)主要有两种写法:一、是由于看到与你论文中观点一致或相反的资料、事例引发的思考。
这种要求你把事例或是资料解析一下,并着重强调自己的思考。
最后要求阐述一下你思考后的结论和你为了证明自己观点所做的研究。
二、是由于你所研究的内容具有明确的理论价值和实践意义。
要从观点的由来和研究历程着手,提出你的论文对以往研究的总结还是创新。
你的研究有利于完善或是明确这一观点,而且可以指导实践,既有理论价值又有实践意义。
最后提出自己的观点是什么。
基本上,就是一个文献综述的形式吧,但是如果你论文结构中有单独的文献综述,那么你在这一部分就不能罗列过多的研究成果。
要表明研究的价值与意义,研究的可行性与必要性等,讲清楚这个了,就是让别人理解你为什么要选这个题目。
研究这个课题的意义和目的是什么?首先纲领性把握两者区别:目的——重在阐述论文要解决的问题。
即为什么选这样一个题目进行论述,要论述出什么东西。
意义——重在表明论文选题对理论研究有哪些贡献,或对实践具有哪些帮助和指导。
在明确两部分的区别之后可以对选题的相关领域进行搜索,明确当下该选题有哪些研究成果,还有哪些部分是你的选题需要补充和完善的。
对选题的价值有一个综合性的判断。
最后进入实战部分:可以先简单叙述该课题的起源或者发展状况,然后阐明选题着重解决哪些问题(讨论范围)。
最后对你的选题进行价值性评估,说清楚这篇论文将对理论产生哪些推动作用,或者对实践有什么指导意义就可以了。
PS.目的和意义可以分开写,也可以合并写,看个人爱好以及资料的详实程度。
论文选题的立论、目的和意义:软件测试的根本目的是在花费尽可能少的人力物力的前提下,寻找并改正软件的故障及缺陷,由此提高软件的可靠性。
根据软件开发各阶段的规格说明和程序结构选取测试数据,设计得到测试用例后驱动被测程序,观察并记录程序执行结果,并与预期的结果进行比较。
根据比较结果修正程序,排除故障。
可见,测试用例的设计是软件测试的重点与关键,因为构成用例的各个测试数据即是对应于程序各个输入变量的输入数据。
收稿日期:2014-05-10基金项目:河南省基础与前沿科学技术研究基金资助项目(122300410222);河南省教育厅科学技术研究重点基金资助项目(2012B120011、2011A120007)作者简介:梁俊奇(1958-),男,河南宁陵人,商丘师范学院教授,硕士研究生导师,主要从事智能计算与不确定信息处理及其应用等方面的研究.第30卷第12期2014年12月商丘师范学院学报JOURNALOFSHANGQIUNORMALUNIVERSITYVol.30No.12Dec. 2014若干Rough函数及其性质梁俊奇1,阙凤珍2(1畅商丘师范学院数学与信息科学学院,河南商丘476000;2畅黄河交通学院基础教学部,河南焦作454950) 摘 要:简要介绍Rough函数的基本概念,给出并证明它们的性质,即定理1,2,3.关键词:粗糙集;Rough函数;性质中图分类号:TP18 文献标识码:A 文章编号:1672-3600(2014)12-0015-03SomRoughfunctionsanditspropertiesLIANGJunqi1,QUEFengzhen2(1.SchoolofmathematicsandInformationSciences,ShangqiuNormalUniversity,Shangqiu476000,China;2.BasicTeachingDepartmentoftheYellowRiverInstituteofTraffic,Jiaozuo454950,China)Abstract:ThispaperintroducesthebasicconceptsoftheRoughfunctionisgivenandprovedtheirproperties,Theorem1,2.3.Keywords:roughsets;Roughfunction;properties0 引言与预备谓词逻辑的创始人G.Frege于1904年提出了含糊边界线问题,即如何计算边界线上含糊元素数量[1-2],许多数学家和计算机科学家都为之而进行研究.L.A.Zadeh于1965年提出了Fuzzy集[3],试图通过这一理论解决G.Frege的含糊概念,但遗憾的是模糊集没有给出精确的数学公式描述这一模糊概念,故无法计算出G.Frege边界线上具体的含糊元素数目.如模糊集中的隶属函数μ和模糊逻辑中的算子λ都是如此.时隔20年后的1982年,Z.Pawlak针对G.Frege的边界线区域思想提出了Rough集[4],把那些无法确认的元素都归属于边界线区域,而这种边界线区域被定义为上近似集和下近似集之差集.由于上近似集和下近似集都可以通过等价关系给出确定的数学公式描述,所以边界线上含糊元素数目被认为可以计算出来,从而实现了G.Frege的边界线思想.Rough集理论主要兴趣在于它恰好反映了人们用Rough集方法处理不可区分问题的常规性,即以不完全信息或知识去处理一些不分明现象的能力,或依据观察、度量到的某些不精确的结果而进行分类数据的能力.Rough集理论是一种处理含糊和不精确性问题的新型数学工具.对于不可定义的不精确集,显然只能通过上、下界逼近的方式来刻画,这就是Rough集理论中的上、下近似算子.本文以近似算子为核心基础,试图从数学分析的角度,给出Rough集中的几个函数,并讨论它们的性质.1 Rough函数的概念1.1 Rough隶属函数[5]定义1[5] 设U是一非空有限集合,称为论域,R是U上的一个等价关系,称二元组(U,R)为一个Z.Pawlak近似空间.对于任意X彻U,X关于近似空间(U,R)的下近似算子R(X)与上近似算子R(X)分别定义为:R(X)={x∈U;[x]R彻X},R(X)={x∈U;[x]R∩X≠矱}其中[x]R={y∈U;(x,y)∈R}为x关于R的等价类.集合bnR(X)=R(X)-R(X)称为X的R边界域,posR(X)=R(X)称为X的R正域,negR(X)=U-R(X)称为X的R负域.定义2 设二元组(U,R)为一个Z.Pawlak近似空间,则Rough隶属函数可定义为:μRX(x)=Card(X∩[x]R)Card([x]R),其中Card(·)表示集合·的元素个数,μRX(x)表示任一x∈U属于X炒U的程度.1.2 Rough距离函数[6]定义3 设二元组(U,R)为一个Z.Pawlak近似空间,则Rough距离函数可定义为:d(R(X),R(X))=Card(R(X)∪R(X)-R(X)∩R(X))Card(R(X)∪R(X)).1.3 Rough精度函数定义4 设二元组(U,R)为一个Z.Pawlak近似空间,则Rough精度函数可定义为:αR(X)=Card(R(X))Card(R(X)).2 Rough函数的性质定理1 (1)Rough隶属函数μRX(X)是一个确切值,μRX(x)∈[0,1],而Fuzzy隶属函数则不然;(2)R(X)、R(X)与μRX(x)是等价的,即R(X)={x∈U:μRX(x)=1},R(X)={x∈U:μRX(x)>0}.证明:由μRX(x)和R(X)、R(X)的定义易证.定理2[7] Rough距离函数d(R(x),R(x))与Rough精度函数αR(X)互补,即d(R(X),R(X))=1-αR(X).证明:因为d(R(X),R(X))=Card(R(X)∪R(X)-R(X)∩R(X))Card(R(X)∪R(X))=Card(R(X)-R(X))Card(R(X))=1-Card(R(X))Card(R(X))=1-αR(X).所以,定理结论成立.定理3[8] 设μRX(X)是Rough隶属函数,则(1)μRX(x)=1当且仅当X∩[x]R=[x]R.(2)μRX(x)=0当且仅当X∩[x]R=矱.(3)0<μRX(x)<1当且仅当x∈bngR(X).(4)对任意x∈U,有μRU-X(x)=1-μRX(x).(5)对任意x∈U,μRX∪Y(x)≥max(μRX(x),μRY(x)).(6)对任意x∈U,μRX∪Y(x)≤min(μRX(x),μRY(x)).(7)如果Xi炒U,i=1,2,3,…,且Xi∩Xj=矱,i≠j,则对任意x∈U,有μ∪RiX(x)=∑iμRXi(x).证明:(1),(2),(3)显然.下面证明(4)-(7).(4)对任意x∈U,有μRU-X(x)=Card[(U-X)∩[x]R]Card([x]R)=Card[U∩[x]R-X∩X]Card([x]R)=Card([x]R)-Card(X∩[x]R)Card([x]R)=1-μRX(x).61商丘师范学院学报 2014年 (5)对任意x∈U,有μRX∪Y(x)=Card[(X∪Y)∩[x]R]Card([x]R)=Card[(X∩[x]R)∪Y∩[x]R]Card([x]R)≥Card(X∩[x]R)Card([x]R)(orCard(Y∩[x]R)Card([x]R))=max(μRX(x),μRY(x)).(6)类似于(5)的证明.(7)因为Xi∩Xj=矱,i≠j,所以对任意x∈U,有μ∪RiXi(x)=Card[(∪iXi)∩[x]R]Card([x]R)=Card[∪i(Xi∩[x]R]Card([x]R)=∑iCard(Xi∩[x]R)Card([x]R)=∑iμRXi(x).3 结 语粗集理论在解决不确定性因素影响下的决策分析等方面有其独到之处.通过研究Rough函数及其性质,可以有效地从众多相关属性中选出条件属性相关度最高、决策属性最优的属性,最终以定量的方式给出更合理的预测结果而不是简单的随机预测值.参考文献:[1]Z.Pawlak.RoughSets:PresentStateandFurtherProspects[C].TheProceedingsoftheThirdInternationalWorkshoponRoughSetsandSoftComputing(RSSC94),USA,1994(11):72-77.[2]FregeG.GrundgesetzederArihtmentik[M].GeachandBlack(Eds.),SelectionsfromthePhilosophicalWritingsofGotlobFrege,Balckweil,Oxford,1970.[3]Zadeh.FuzzySets[J].InformationandControl,1965(8):338-353.[4]Z.Pawlak.RoughSets[J].Int.J.ofInf.AndComp.Sci.,1982,11(5):341-356.[5]张文修,吴伟志,等.粗糙集理论与方法[M].北京:科学出版社,2001.[6]刘清.Rough集及Rough推理[M].北京:科学出版社,2001.[7]YaoYY.Relationalinterpretationsofneighborhoodoperatorsandroughsetapproximationoperators[J].InformationSciences,1998,111(1-4):239-259.[8]司红颖,阙凤珍,梁俊奇.变精度Rough隶属函数及其性质[J].模糊系统与数学,2014,27(4):157-159.[9]王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J].计算机学报,2009(7):1229-1246.【责任编辑:王军】71 第12期 梁俊奇,等:若干Rough函数及其性质。
数据挖掘中的软计算方法及应用综述1在过去的数十年中,随着计算机软件和硬件的发展,我们产生和收集数据的能力已经迅速提高。
许多领域的大量数据集中或分布的存储在数据库中[1][2],这些领域包括商业、金融投资业、生产制造业、医疗卫生、科学研究,以及全球信息系统的万维网。
数据存储量的增长速度是惊人的。
大量的、未加工的数据很难直接产生效益。
这些数据的真正价值在于从中找出有用的信息以供决策支持。
在许多领域,数据分析都采用传统的手工处理方法。
一些分析软件在统计技术的帮助下可将数据汇总,并生成报表。
随着数据量和多维数据的进一步增加,高达109的数据库和103的多维数据库已越来越普遍。
没有强有力的工具,理解它们已经远远超出了人的能力。
所有这些显示我们需要智能的数据分析工具,从大量的数据中发现有用的知识。
数据挖掘技术应运而生。
数据挖掘就是指从数据库中发现知识的过程。
包括存储和处理数据,选择处理大量数据集的算法、解释结果、使结果可视化。
整个过程中支持人机交互的模式[3]。
数据挖掘从许多交叉学科中得到发展,并有很好的前景。
这些学科包括数据库技术、机器学习、人工智能、模式识别、统计学、模糊推理、专家系统、数据可视化、空间数据分析和高性能计算等。
数据挖掘综合以上领域的理论、算法和方法,已成功应用在超市、金融、银行[4]、生产企业[5]和电信,并有很好的表现。
软计算是能够处理现实环境中一种或多种复杂信息的方法集合。
软计算的指导原则是开发利用那些不精确性、不确定性和部分真实数据的容忍技术,以获得易处理、鲁棒性好、低求解成本和更好地与实际融合的性能。
通常,软计算试图寻找对精确的或不精确表述问题的近似解[6]。
它是创建计算智能系统的有效工具。
软计算包括模糊集、神经网络、遗传算法和粗集理论。
2数据挖掘中的软计算方法目前,已有多种软计算方法被应用于数据挖掘系统中,来处理一些具有挑战性的问题。
软计算方法主要包括模糊逻辑、神经网络、遗传算法和粗糙集等。
(2011 届)毕业论文(设计)文献综述题目: 连续数据的离散化研究学院:数学与信息工程学院专业:信息管理与信息系统班级:学号:姓名:指导教师:教务处制一、前言部分如今,随着计算机、网络和通讯等信息技术的高速发展,当今社会已经进入了网络信息时代,计算机技术得到了迅猛的发展,特别是存储技术、数据库技术和网络技术,信息处理在整个社会规模上迅速产业化,在技术表现为整个社会对大规模数据操作的产业化。
存储设备单位价格的不断下跌而容量的急剧扩大,关系数据库、对象数据库、多媒体数据库、地理信息数据库和空间数据库的不断成熟并得到广泛的应用,数据库管理系统的口益普及,这使得人们所积累的数据越来越多,并且数据与信息系统中的不确定性更加显著。
海量的数据背后隐藏着许多重要的信息,人们希望能够对其进行深入分析,以便更好地利用这些数据所隐藏的信息。
目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势[1],缺乏挖掘数据背后隐藏知识的手段,导致了“数据爆炸但知识贫乏的现象”[2]。
例如,商业上条形码的普遍使用,使得每天很多行业都积累了数以万计的数据,各种同步卫星每小时传回地球的遥感图像数据就达50千兆字节。
要把大量的数据作为信息,信息成为知识,知识付诸于应用,已使一些传统的方法感到无能为力。
因此,如何从大量的、杂乱无章的、强干扰的数据中挖掘出潜在的、有利用价值的信息,便成为人类智能信息处理中面临的前所未有的挑战。
由此产生了人工智能研究的一个崭新领域一一数据挖掘(Data Mining,简称DM)[3]。
数据离散化技术在传统的机器学习中被当作边缘性课题而没有受到足够的重视,随着近年来数据挖掘的不断更新发展,数据离散化在数据挖掘技术中渐渐显现出其不可替代的重要性,在规则提取、特征分类等很多算法中,尤其是在应用粗集理论进行数据挖掘的研究中,连续属性数据必须进行离散化,因此越来越多的专家和学者开始关注数据离散化[4]。
第2卷第6期 智 能 系 统 学 报 V ol.2 .62007年12月 CAAI T ransactions on Intelligent Systems D ec.2007粒计算研究综述王国胤1,2,张清华1,2,胡 军1,3(1.重庆邮电大学计算机科学与技术研究所,重庆400065; 2.西南交通大学信息科学与技术学院,四川成都610031;3.西安电子科技大学电子工程学院,陕西西安710071)摘 要:粒计算(gr anular computing)是当前计算智能研究领域中模拟人类思维和解决复杂问题的新方法.它覆盖了所有有关粒度的理论、方法和技术,是复杂问题求解、海量数据挖掘、模糊信息处理的有效工具.首先回顾了粒计算研究和发展状况,介绍了粒计算的基本组成和问题,综述了粒计算的基本模型和方法,并讨论了它们之间的相互关系,最后探讨了构建统一的粒计算模型、复杂问题空间的粒化、粒层之间的转换、高效的粒计算方法、新的粒计算模型、动态粒计算模型、自主粒计算模型、粒计算方法的模糊化以及粒计算模型的应用和推广等几个方面的关键问题.关键词:粒计算;数据挖掘;智能信息处理;粗糙集;模糊集;商空间中图分类号:T P18 文献标识码:A 文章编号:1673 4785(2007)06 0008 19An overview of granular computingWAN G Guo yin 1,2,ZHANG Qing hua 1,2,HU Jun 1,3(1.Institute of Comput er Science &T echno lo gy ,Cho ng qing U niversit y of Po st s and T eleco mmunications,Chong qing 400065,China;2.Scho ol of Infor matio n Science &T echnolog y,Southwest Jiao tong U niv ersit y,Chengdu 610031,China; 3.School of Electro nic Engineer ing,Xidian U niver sity,Xi an 710071,China)Abstract:In the field of com putational intelligence,granular computing (GrC)is a new w ay to simulate hu m an thinking to help solve co mplicated problems.Gr C involv es all the theories,methodo logies and tech niques o f granularity,pr oviding a pow erful to ol for the so lution of complex problems,m assiv e data min ing,and fuzzy information pr ocessing.In this paper,first the current situation and the developm ent pros pects of GrC are introduced,then the fundamental and ex isting problem s r elated to GrC ar e presented and its basic models and metho ds summ arized.Finally,som e future research topics abo ut GrC are presented,such as,uniform granular co mputing mo del,granulation of complex pro blem space,transform ation be tw een granule spaces,efficient g ranular co mputing algor ithm,nov el g ranular co mputing model,dy namic granular co mputing m odel,data driven g ranular co mputing m odel,fuzzy gr anular co mputing method,and the applications of gr anular computing models,etc.Keywords:g ranular computing;data m ining;intelligent inform ation processing;roug h sets;fuzzy sets;quotient space收稿日期:2007 04 02.基金项目:国家自然科学基金资助项目(60573068);新世纪优秀人才支持计划;重庆市教委科学技术研究资助项目(KJ060517).自Zadeh 1979年发表论文!Fuzzy sets and in form ation granularity ∀以来[1],研究人员对信息粒度化的思想产生了浓厚的兴趣.Zadeh 认为很多领域都存在信息粒的概念,只是在不同领域中的表现形式不同.自动机与系统论中的!分解与划分∀、最优控制中的!不确定性∀、区间分析里的!区间数运算∀、以及D S 证据理论中的!证据∀都与信息粒密切相关.H obss 在1985年直接用!粒度(granularity)∀作为论文题目发表论文[2],讨论了粒的分解和合并,以及如何得到不同大小的粒,并提出了产生不同大小粒的模型.Lin 在1988年提出邻域系统并研究了邻域系统与关系数据库之间的关系[3].1996年,他在U C Berkeley 大学访问时,向Zadeh 提出作!granular computing∀的研究,Zadeh称之为!g ranular mathematics∀,Lin改称为!granular co mputing∀,并缩写成Gr C.他发表了一系列关于粒计算与邻域系统的论文[4-10],主要是研究二元关系(邻域系统、Rough集和信任函数)下的粒计算模型,论述基于邻域系统的粒计算在粒结构、粒表示和粒应用等方面的问题,讨论了粒计算中的模糊集和粗糙集方法,并将粒计算方法引入数据挖掘和机器发现.依据人们在解决问题时能从不同的粒度世界去分析和观察同一问题,并且很容易地从一个粒度世界转到另一个粒度世界,张钹和张铃在1990年针对复杂问题求解,建立了一种复杂问题求解的商结构形式化体系,给出了一套解决信息融合、启发式搜索、路径规划和推理等问题的理论和算法[11-12].1997年,Zadeh进一步指出[13],世上有3个基本概念构成人类认知的基础:粒化、组织及因果关系.其中,粒化是整体分解为部分,组织是部分结合为整体,而因果关系则涉及原因与结果间的联系.物体的粒化产生一系列的粒子,每个粒子即为一簇点(物体),这些点难以区别,或相似、或接近、或以某种功能结合在一起.一般来说,粒化在本质上是分层次的,时间可粒化为年、月、日、小时、分、秒就是大家熟悉的例子.在Lin的研究基础上,Yao结合邻域系统对粒计算进行了详细的研究[14-16],发表了一系列研究成果[17-22],并将它应用于知识挖掘等领域,建立了概念之间的if then规则与粒度集合之间的包含关系,提出利用由所有划分构成的格求解一致分类问题,为数据挖掘提供了新的方法和视角.结合粗糙集理论,Yao探讨了粒计算方法在机器学习、数据分析、数据挖掘、规则提取、智能数据处理和粒逻辑等方面的应用.Yao给出了粒计算的3种观点[22]:1)从哲学角度看,粒计算是一种结构化的思想方法;2)从应用角度看,粒计算是一个通用的结构化问题求解方法;3)从计算角度看,粒计算是一个信息处理的典型方法.随着粒计算研究的发展,近年来国内外又有很多学者加入到了粒计算研究的领域.为了探讨粗糙集理论在各种环境下的应用,Skow r on[23-27]以包含度概念来研究粒近似空间上的Rough下近似和Rough上近似.刘清[28-30]在Roug h逻辑的基础上,提出了粒-逻辑的概念(G 逻辑),构造了这种逻辑的近似推理系统,并应用于医疗诊断.近几年来,在掀起粒计算研究的热潮中,商空间理论被人们广泛认识和推广,2003年张铃和张钹将模糊概念与商空间理论结合,提出模糊商空间理论,为粒计算提供了新的数学模型和工具,并成功应用于数据挖掘等领域[31-35].2002年苗夺谦等人[36]对知识的粒计算进行探讨,引入属性的重要度,并在求最小属性约简方面得到应用.王飞跃等人[37]对词计算和语言动力学进行了探讨,以词计算为基础,对问题进行动态描述、分析和综合,提出了设计、控制和评估的语言动力学系统.王国胤等人[38-44]提出了基于容差关系的粒计算模型,利用属性值上的容差关系给出了不完备信息系统的粒表示、粒运算规则和粒分解算法,同时结合粗糙集中的属性约简问题,提出了不完备信息系统在粒表示下属性必要性的判定条件,对粒计算方法在规则提取方面进行了探索.郑征等人[45-47]提出了相容粒度空间模型,并在图像纹理识别和数据挖掘中取得了成功,他们认为,人类具有根据具体的任务特性把相关数据和知识泛化或者特化成不同程度、不同大小的粒的能力,以及进一步根据这些粒和粒之间的关系进行问题求解的能力.卜东波等人[48]从信息粒度的角度剖析聚类和分类技术,试图使用信息粒度原理的框架来统一聚类和分类,指出从信息粒度的观点来看,聚类是在一个统一的粒度下进行计算,而分类却是在不同的粒度下进行计算,并根据粒度原理设计了一种新的分类算法,大规模中文文本分类的应用实践表明,这种分类算法有较强的泛化能力.Zhang等人[49-50]对粒神经网络进行了探讨,并在高效知识发现中得到很好的应用.李道国等人[51]研究了基于粒向量空间的人工神经网络模型,在一定程度上提高了人工神经网络的时效性、知识表达的可理解性.杜伟林等人[52]根据概念格[53]与粒度划分在概念聚类的过程中都是基于不同层次的概念结构来进行分类表示,而且粒度划分本身构成一个格结构的特点,研究了概念格与粒度划分格在概念描述与概念层次转换之间的联系,通过对概念的分层递阶来进行概念的泛化与例化,使概念在递阶方面忽略不必要的冗余信息.Yager[54]探讨了基于粒计算的学习方法和应用.Lin[55]在2006年粒计算国际会议上提出了新的研究思路!infrastruc tures for AI engineering∀.同时,Bargiela和Pe dry cz[56]也从各个侧面对粒计算的根源和实质进行了详细的探讨和总结.Yag er指出,发展信息粒的操作方法是当前粒计算研究的一个重要任务[57].1 粒计算的基本组成粒计算的基本组成主要包括3部分:粒子、粒层#9#第6期 王国胤,等:粒计算研究综述和粒结构.1 1 粒 子粒子是构成粒计算模型的最基本元素[58-59],是粒计算模型的原语.一个粒可以被解释为许多小颗粒构成的一个大个体,现实生活中,粒子无处不在,如在地图上观察洲、国家、海洋、大陆和山脉等是一些粗的粒子(大的粒子),观察省、市、区等是一些中等的粒子,而观察街道、饭店、机场等是一些相对较小的粒子.一个粒子可以被同时看作是由内部属性描述的个体元素的集合,以及由它的外部属性所描述的整体.一个粒子的存在仅仅在一个特定的环境中才有意义.一个粒子的元素可以是粒子,一个粒子也可以是另外一个粒子的元素.而衡量粒子!大小∀的概念是粒度,一般来讲,对粒子进行!量化∀时用粒度来反映粒化的程度[59].1 2 粒 层按照某个实际需求的粒化准则得到的所有粒子的全体构成一个粒层,是对问题空间的一种抽象化描述.根据某种关系或算子,问题空间产生相应的粒子.同一层的粒子内部往往具有相同的某种性质或功能.由于粒化的程度不同,导致同一问题空间会产生不同的粒层.粒层的内部结构是指在该粒层上的各个粒子组成的论域的结构,即粒子之间的相互关系.在问题求解中,选择最合适的粒层对于问题求解尤为关键,因为,在不同粒层求解同一问题的复杂度往往不同.在高一级粒层上的粒子能够分解成为下一级粒层上的多个粒子(增加一些属性),在低一级粒层上的多个粒子可以合并成高一级粒层上的粒子(忽略一些属性).粒计算模型的主要目标是能够在不同粒层上进行问题求解,且不同粒层上的解能够相互转化.1 3 粒结构一个粒化准则对应一个粒层,不同的粒化准则对应多个粒层,它反应了人们从不同角度、不同侧面来观察问题、理解问题、求解问题.所有粒层之间的相互联系构成一个关系结构,称为粒结构[20].粒结构给出了一个系统或者问题的结构化描述.通过从系统思维、复杂系统理论和层次结构理论(技术)中得到的启发至少需要确定一个粒结构网[20]中3个层次的结构:粒子的内部结构、粒子集结构和粒子网的层次结构.粒子集的集体结构可以看作是全部层次结构中一个层次或者一个粒度视图中的结构.它本身可以看作是粒的内部连接网络.对于同一个系统或者同一个问题,许多解释和描述可能是同时存在的.所以,粒结构需要被模型化为多种层次结构,以及在一个层次结构中的不同层次.虽然一个粒子在某个粒层上被视为一个整体,但粒子内部元素(子粒子)的结构在问题求解时也很重要,因为它能提供粒子更为详细的特性.而在同一层上的粒子之间也具有某种特殊的结构,它们可能是相互独立,或者部分包含.如果同一粒层上的粒子之间的独立性越好,可能问题求解后合并起来越方便;反之,如果粒子之间的相关性越好,则问题求解后的合并工作相对越繁杂.粒子网的层次结构是对整个问题空间的概括,它的复杂性在一定程度上决定了问题求解的复杂程度.2 粒计算的基本问题粒计算中存在2个最基本的问题,即粒化和粒的计算.问题空间的粒化是指将问题空间分解为许多子空间,或是基于有用的信息和知识将问题空间中的个体聚集成不同的类,这些类称之为粒.粒中的元素可以理解为对应概念的实例.可以把粒计算和概念生成、知识发现和数据挖掘联系起来,因为概念生成的目的之一是对具有某些概念的粒的表示、特征化、描述和解释,而知识发现和数据挖掘就是在粒之间建立关联和因果等联系.2 1 粒 化粒化是问题求解空间的一个构造性过程,它可以简单理解为在给定粒化准则下得到一个粒层的过程,是粒计算基础单元的构建,包括粒子、粒视图、粒网和层次结构.在不同的粒化准则下就得到多个粒层,进而得到粒层的网络结构.通常的粒化方法有自顶而下通过分解粗粒子得到细粒子的方法,和自底向上将细粒子通过合并得到粗粒子的方法.粒化过程是粒计算的必要过程.问题空间的粒化过程主要涉及粒化准则、粒化算法(方法)、粒子和粒结构的表示(描述)以及粒子和粒结构的定性(定量)描述等问题[59].粒化准则主要是语义方面的问题,解决为什么2个对象能放进同一个粒子内的问题.它是根据实际问题求解的具体需求和具体精度要求得到的.粒化准则的一个基本要求是忽略掉那些无关紧要的细节,从而达到降低问题求解复杂度的目的.粒化方法面对实际问题,回答如何对问题空间进行粒化,采用什么算法或工具实现粒层的构造,它属于算法方面的问题.如在粗糙集理论中,如何对对象集进行划分产生粒层,如何高效实现属性的约简等问题.粒子的结构描述主要是用粒化方法得到的粒子,如何用形式化的语言表述出来,以便后面进行计算.例如在粗糙集理论模型中,粒子的表示可能是一个子集.而#10#智 能 系 统 学 报 第2卷在概念格理论中,粒子的表述就是一个概念,它包括概念的外延(一个对象子集)和内涵(一个属性子集) 2部分.粒结构的描述往往形式多样,在商空间理论模型中,粒结构是一种分层递阶的结构,在概念格模型中,粒结构是一种H asse图.粒子和粒结构的定性、定量描述主要指粒子和粒结构的大小(主要是指粒度的结果)和复杂性度量.当前,成功的粒化方法往往都是以将解空间形成划分空间为主要的目标,这样便于将子空间上的解合成原问题空间的解,商空间理论就是这样一个成功的实例.当然,如果用某种粒化方法形成的解空间不是划分(如覆盖),这将增加合成的复杂度.2 2 粒的计算以粒子为运算对象进行问题的求解或推理,是狭义的粒计算.粒计算可以通过系统访问粒结构来解决问题,包括在层次结构中向上和向下2个方向的交互,以及在同一层次内的移动,主要分为2种[59]:同一粒层上粒子之间相互转换和推理,不同粒层上粒子之间的转换或推理.不同粒层之间的联系可以由映射来表示,在不同粒层上同一问题以不同的粒度、不同的细节表示,粒层之间的映射就建立了同一问题的不同细节描述之间的关系.商空间理论模型就是通过自然投影建立了分层递阶的商空间链式结构.粒计算的主要特点是同一问题的解可以在不同粒层之间自由转化.正是基于这一点,人们才能用粒计算方法高效地实现复杂问题的求解.模糊商空间上的分层递阶结构可以通过模糊等价关系的截关系建立相应的转化联系;粗糙集理论中的划分粒度可以通过属性的增加或删减来控制;而概念格理论模型中的概念粒子的相互转化可以通过改变概念的内涵来实现.这些转化虽然方式不同,但一个共同的特点是在转化的过程中,问题求解的重要性质必须能在不同粒层上表现出来,这也是评价粒化方法好坏的一个重要指标.如果在粒化后粒层之间的相互转化过程中,某些重要属性不能体现出来,这不但不利于问题的求解,反而会导致问题求解过程发散,从而增加问题求解的复杂度.商空间理论模型中的!保真∀和!保假∀原理使得粒化后形成的商空间具有!保序∀性,使得问题求解的搜索空间大大减少,复杂度由相乘变为相加.粒计算的2个基本问题中,粒化是关键,它直接决定粒计算的成功与否.因此,粒化方法是人们研究的热点问题.目前,粒化方法很多,如基于等价关系的划分产生粒子[17],基于模糊集产生模糊信息粒[1],基于模糊等价关系截集产生分层递阶粒空间[35],基于概念格产生概念信息粒和概念知识粒[60],基于邻域系统产生邻域粒子[3]等等.总之,粒计算是一个多准则学科,它从许多领域中获得其基本的思想、准则和方法,是基于不同层次粒度和细节的问题求解的一般性理论.在粒计算的!大伞∀下进行统一的研究,可以发现不同学科之间原理的关联,它与具体的学科研究是相互独立的[59].一旦掌握了粒计算中的结构化思维和结构化问题求解的抽象思想,就可以很容易地在任何领域中运用.3 粒计算的主要模型与理论方法3 1 词计算模型高标准的精确表达,普遍存在于数学、化学、工程学和另外一些!硬∀科学之中,而不精确表达却普遍存在于社会、心理、政治、历史、哲学、语言、人类学、文学、文艺及相关的领域中[61].针对复杂且非明晰定义的现象,无法用精确的数学方法来描述,但可以用一些程度词语,如不很可能、十分不可能、极不可能等,来对某些模糊概念进行修饰.尽管普通的精确方法(如数学)在某些科学领域应用相当广泛,也一直尝试着应用到人文学科中,但人们在长期的实践中已经清楚地认识到精确的方法应用到人文学科有很大的局限性.面对巨大而又复杂的人文学科系统,区别于传统方法的新方法∃∃∃模糊计算方法被Zadeh提出.在人类的认识中,粒的模糊性直接源于无区别、相似性、接近性以及功能性等这些概念的模糊性.人类具有在不精确性、部分知识、部分确定以及部分真实的环境下作出合理决策这一不同寻常的能力,而模糊信息粒化正是这种能力的基础.在模糊逻辑中,模糊信息粒化是语言变量、模糊!if then∀规则以及模糊图的基础.词计算(com puting w ith w o rds)是用词语代替数进行计算及推理的方法[62].如何利用语言进行推理判断,这就要进行词计算.信息粒化为词计算提供了前提条件,词计算在信息粒度、语言变量和约束概念上产生了自己的理论与方法,意在解决模糊集合论的数值化隶属度函数表示法的局限性、表达的概念缺乏前后联系、逻辑表达和算子实现的复杂性等问题,使它们能够更符合人类的思维特点.词计算有狭义和广义2个方面的概念.狭义的模糊词计算理论是指利用通常意义下的数学概念和运算(如加、减、乘、除等)构造的带有语义的模糊数值型的词计算的理论体系;广义的词计算理论统指用词进行推理、用词构建原型系统和用词编程,前者是后者的基#11#第6期 王国胤,等:粒计算研究综述础[63].模糊逻辑在词计算中起中心作用,它可以近似地被认为与词计算相同[62].在词计算中存在2个核心问题:模糊约束的表现问题和模糊约束的繁殖问题,它们是模糊信息粒化的基本准则.信息粒化(infor mation granulation)是粒化的一种形式.在众多的信息粒化中,非模糊粒化的方法很多,如将问题求解空间形成划分空间,每个粒子都是精确的.但这种粒化方法不能解决很多现实问题,如将人的头部粒化为脸、鼻子、额头、耳朵、头盖、脖子等粒子,这些粒子之间没有明确的分界线,它们都是模糊的粒子.模糊信息粒化是传统信息粒化的一种推广.模糊信息粒化理论[64-65](theor y of fuzzy information g ranulation,TFIG)建立在模糊逻辑和信息粒化方法基础之上,是从人类利用模糊信息粒化方式中获得的启发,其方法的实质是数学.Zadeh指出[64],除模糊逻辑外,没有一种方法能提供概念框架及相关技术,它能在模糊信息粒化起主导作用.继Zadeh之后,许多学者开始了有关词计算的研究工作,Wang[66]编写了词计算一书.广义词计算理论的研究工作,中国刚刚起步,李征等人[67-68]通过研究模糊控制器的结构,认为模糊控制实际上是应用了信息粒化和词计算技术,但却只是应用了该技术的初级形式,而基于信息粒化和词计算(IGCW)的模糊控制系统,将具有更强的信息处理和推理判断能力,是对人类智能更高程度的模拟.他们指出,基于信息粒化和词计算的模糊控制系统是通过信息粒化和重组、多层次的思维决策,动态地改变下层控制器的参数和推理方法或控制规则,因而使控制器具有变结构和多模态的特性.信息太多会延误推理计算的时间,给系统带来不必要的处理任务;而信息太少,则会降低推理结果的完善性.因此,提出了合理重新组织信息的研究课题.随着近年来智能信息处理的不断深入与普及,特别是处理复杂系统分析与评估时的迫切需要,人们越来越发现排除自然语言的代价太大了.首先,从应用角度来看,人类已习惯于用自然语言描述和分析事物,特别是涉及社会、政治、经济和管理中的复杂过程.人类可以方便地利用以自然语言表示的前提进行推理和计算,并得到用自然语言表达的结果;其次,从理论角度来看,不利用自然语言,现有的理论很难甚至不能够处理感性信息,而只能处理测度信息.感性信息或知识通常只能用自然语言来描述,由于人类分辨细节和存储信息的认知能力的内在限制,感性信息在本质上是不精确的[69-72].W ang利用自然语言知识和信息,建立以词计算为基础的语言动力学系统(linguistic dynamic system s,LDS),并通过融合几个不同领域的概念和方法[37],提出基于词计算的语言动力学系统的计算理论框架,根据这个计算理论框架,利用常规或传统数值动力学系统中已有的成熟概念和方法,对语言动力学系统进行动力学分析、设计、控制和性能评估.这些研究的目的是建立连接人类的语言知识表示与计算机的数字知识表示的桥梁,成为下一代智能化人机交互的理论基础之一.总之,词计算理论和方法对于复杂信息系统的模糊推理和控制非常重要,但由于自身的局限性,它必须和其他理论体系相结合,才能更有效地处理复杂信息.3 2 粗糙集模型一个对象属于某个集合的程度随着属性粒度的不同而不同,为了更好地刻画集合边界的模糊性,波兰学者Paw lak[73]在20世纪80年代提出了粗糙集理论,其本质思想是利用不可分辨关系(等价关系)来建立论域的一个划分,得到不区分的等价类(即不同属性粒度下的概念粒),从而建立一个近似空间(由不同大小的概念粒形成).在近似空间上,用2个精确的集合(上近似集和下近似集)来逼近一个边界模糊的集合.如果近似空间的粒度较粗,被近似的集合的边界域较宽,而如果近似空间的粒度较细,被近似集合的边界域较窄.给定集合X上的一个划分等价于在X上给定一个等价关系R.X/R表示U上由R导出的所有等价类,[x]R表示包含元素x的等价类,其中x%U. Paw lak称之为在论域上给定了一个知识基(X,R),然后讨论一个一般的概念X(U中的一个子集)如何用知识基中的知识来表示.对那些无法用(X,R)中的集合的并来表示的集合,借用拓扑中的内核和闭包的概念,引入下近似和上近似的概念:R-(X)= {x%U|[x]R X}和R-(X)={x%U|[x]R&X∋ }.当R-(X)∋R-(X)时,就称X为粗糙集,从而创立了!粗糙集理论∀.粗糙集理论是一种软计算方法.软计算(soft computing)概念是由模糊集创始人Zadea提出的[61-65].传统的计算方法即所谓硬计算,使用精确、固定和不变的算法来表达和解决问题;而软计算的指导原则是利用所允许的不精确、不确定性和部分真实性得到易于处理、鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调.粗糙集理论的研究,已经经历了20多年的时间,无论是在系统理论、计算模型的建立和应用系统的研制开发上,都已经取得了很多成果,也建立了一套较为完善的粗糙集理论体系[74-75].目前粗糙集理#12#智 能 系 统 学 报 第2卷。
仅供参考[整理] 安全管理文书油气管道泄漏检测技术综述日期:__________________单位:__________________第1 页共18 页油气管道泄漏检测技术综述摘要:简单说明了油气长输管道泄漏的原因和泄漏的危害,简单回顾了国内外油气长输管道泄漏检测技术发展的历史,详细介绍了热红外线成像、探地雷达、气体成像、传感器法、探测球法、半渗透检测管检漏法、GPS时间标签法、放射性示踪剂法、体积或质量平衡法、压力波法、小波变换法、相关分析法、状态估计法、系统辨识法、神经网络法、统计检漏法和水力坡降法等20多种管道泄漏检测技术方法,同时介绍了泄漏检测方法的诊断性能指标和综合性能指标,最后指出了现在存在的问题和发展的趋势。
关键词:油气;长输管道;泄漏;原因;检测方法;性能指标;问题;发展;趋势油气长输管道发生泄漏的原因多种多样,但大致可以分为:(1)管道腐蚀:防护层老化、阴极保护失效,以及腐蚀性介质对管道外壁造成的腐蚀和传输介质的腐蚀成分对管道内壁造成的腐蚀;(2)自然破坏:由于地震、滑坡等自然灾害以及气候变化使管道发生翘曲变形导致应力破坏;(3)第三方破坏:不法分子的盗窃破坏,施工人员违章操作,野蛮施工造成的破坏;(4)管道自身缺陷:包括管道焊接质量缺陷,管道连接部位密封不良,未设计管道伸缩节,材料等原因。
油气管道泄漏不仅给生产、运营单位造成巨大的经济损失,而且会对环境造成破坏、严重影响沿线居民的身体健康和生命安全。
1检漏技术发展历史国外从上个世纪70年代就开始对管道泄漏检测技术进行了研究。
早在1976年德国学者R.Isermann和H.Siebert就提出以输入输出的流量和压力信号经过处理后进行互相关分析的泄漏检测方法;1979年第 2 页共 18 页ToslhioFukuda提出了一种基于压力梯度时间序列的管道泄漏检测方法;L.Billman和R.Isermann在1987年提出采用非线性模型的非线性状态观测器的检漏方法;A.Benkherouf在1988年提出了卡尔曼滤波器方法;1991年Kurmer等人开发了基于Sagnac光纤干涉仪原理的管道流体泄漏检测定位系统;1993年荷兰壳牌(shell)公司的x.J.Zhang提出了统计检漏法;1999年美国《管道与气体杂志》报道了一种称作“纹影”(Schlieren)的技术,即采用空气中的光学折射成象原理可用于管道检漏;2001年Witness提出了采用频域分析的频域响应法,其基本思想是将管道系统的模型转换到频域进行泄漏检测和定位分析;2003年MarcoFerrante提出了采用小波分析的方法,利用小波技术对管道的压力信号进行奇异性分析,由此来检测泄漏。
基于粗糙集的SCM方法的开题报告一、选题背景供应链管理(SCM)是近年来被广泛研究的一个热门领域,它是指将物流、采购、销售、市场、生产等所有生产、运输和销售环节中的成本、库存、质量、交期等方面进行综合优化和管理的过程。
在供应链的整个过程中,需要跨越多个组织或者企业进行协同合作,因此,开展供应链管理需要通过各个组织的协同努力,才能够实现真正的优化。
传统的供应链管理很大程度上依赖于计算机信息系统的支持,即利用计算机对供应链进行建模和优化。
而对于供应链中存在的大量不确定性和模糊性,传统的计算机建模方法难以有效处理。
因此,现在越来越多的学者开始运用粗糙集理论来处理供应链中的不确定性和模糊性,并基于粗糙集理论开展供应链管理的研究。
二、选题意义基于粗糙集的SCM方法,在处理复杂供应链问题中表现出了一定的优势,相较于传统的计算机建模方法,此方法能够更好地增强模型的稳定性和鲁棒性,并能够更好地解释和应对供应链中的不确定性和模糊性。
因此,本研究的选择具有一定的科学性和实用性,对于提高供应链管理的决策效果、优化供应链全流程管理具有重要的理论和实践意义。
三、研究的内容和目标本研究旨在通过对比传统的计算机建模方法和基于粗糙集的方法,探讨基于粗糙集的SCM方法在处理复杂供应链问题中的可行性和优越性。
具体研究内容如下:1. 对比传统的计算机建模方法和基于粗糙集的方法,评估两种方法在处理供应链问题时的优缺点。
2. 探讨基于粗糙集的SCM方法在处理供应链问题中的应用场景和优势。
3. 选取实际供应链问题进行建模,并运用基于粗糙集的方法进行求解,验证该方法的可行性和有效性。
4. 基于实际实验结果,提出改进和完善该方法的建议,以期在供应链管理决策中更好地应用该方法。
四、研究方法和步骤1. 文献综述,分析计算机建模方法和基于粗糙集的方法在处理供应链问题中的优缺点,并探讨基于粗糙集的SCM方法的应用场景和优越性。
2. 选取实际供应链问题进行建模,并选择适当的案例数据进行实验。
基于粒计算的粗糙集聚类算法
李莲;罗可;周博翔
【期刊名称】《计算机应用研究》
【年(卷),期】2013(30)10
【摘要】针对传统K-means聚类算法初始聚类中心随机选取、不能处理边界对象、效率低、聚类精度低等问题,提出了一种新的K-means聚类算法.算法引入粒计算理论,并依据密度和最大最小距离法选择初始聚类中心,避免初始聚类中心在同一个类中,结合粗糙集,通过动态调整上近似集和边界集的权重因子,以解决边界数据的聚类问题;最后采用类间距和类内距均衡化准则函数作为算法终止判断条件,来得到更好的聚类效果.实验结果表明:该算法具有较高的准确率,迭代次数较少,并降低了对噪声的敏感程度.
【总页数】4页(P2916-2919)
【作者】李莲;罗可;周博翔
【作者单位】长沙理工大学计算机与通信工程学院,长沙410114;长沙理工大学计算机与通信工程学院,长沙410114;长沙理工大学计算机与通信工程学院,长沙410114
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.基于粗糙集的粒计算理论的研究综述 [J], 曾安平;黄永平;李广军;阳万安
2.基于粒计算与粗糙集的人工鱼群聚类算法 [J], 陈济舟;罗可
3.基于粒计算的粗糙集知识发现算法 [J], 郑晓辉
4.基于三支决策的形式概念分析、粗糙集与粒计算 [J], 姚一豫;祁建军;魏玲
5.三支决策-基于粗糙集与粒计算研究视角 [J], 刘盾; 李天瑞; 杨新; 梁德翠
因版权原因,仅展示原文概要,查看原文内容请购买。
粗糙集理论在机械故障诊断中的应用摘要:作为处理模糊和不确定知识的工具,粗糙集理论能够有效地确定知识系统中有用知识和冗余知识,从而对知识系统进行浓缩,有效地减少训练集,它很好地弥补了人工智能的不足之处。
因此,传统的机械故障诊断技术已从人工智能领域转向以粗糙集理论为代表的计算智能领域。
本文以某型机械故障诊断为例,运用粗糙集理论对故障数据加以分析处理,得到了简明的故障诊断规则,取得了良好的诊断效果。
关键词:粗糙集;属性约简;故障诊断中图分类号:tp751目前,机械设备发展迅速,特别是人工智能技术的应用使机械设备的工作效率大大提高。
但是,机械设备的实时监控却相对滞后,这也大大地制约了农业现代化的发展。
一个小的故障若不及时处理,可能引起放大效应,从而导致更大的财产损失。
因此,如何在机械故障发生后第一时间及时进行诊断进而保证机械设备持续高效运转已成为提高生产效率的关键。
粗糙集理论是波兰数学家z.pawlak于1982年提出的一种能够定量分析处理不精确、不一致、不完整信息与知识的数学工具[1]。
该理论最大的优势是无需提供除问题所需处理的数据集以外的任何先验信息。
此外,该理论还能够有效地去除冗余,对所给信息系统进行分析处理,找出其中的隐含知识,揭示潜在的规律[2]。
本文对粗糙集理论在机械故障诊断中的应用进行研究,以丰富故障诊断知识。
1粗糙集理论的基本概念定义1:设是我们感兴趣的对象组成的有限集合,称为论域[3–4]。
称为中的一个概念或范畴。
中任何概念族称为关于的抽象知识,简称知识。
为规范起见,我们认为空集也是一个概念。
上的一个划分可定义为:;其中,,且,对于;。
定义2:设为上的一个等价关系,表示的所有等价类(或者上的分类)构成的集合,表示包含元素的等价类。
定义3:设是上的一族等价关系,若,且,则中所有等价关系的交集称为上的不可区分关系,记为,且有定义4:信息系统被定义为如下的四元组:。
其中:知识表达系统;:对象的非空有限集合,也称论域;,是属性的值域;为一信息函数,它为每个对象的每个属性赋予一个信息值,即,。
国外DRG相关研究总结随着科学技术的开展、国医疗环境的快速变化,医院面临着竞争剧烈的经营环境,医院管理也面临着越来越大的挑战。
我国当前实行按医疗效劳工程付费的支付方式,这种支付方式使得医疗效劳收费极具扩性。
同时,由于医院管理者缺乏控制本钱的动机和压力,医院经营情况不乐观,在提供医疗效劳的过程中,经常出现医院设施利用率低、医护人员配置不合理等浪费现象。
1、DRG的提出为了控制过度医疗而导致的医疗费用过快增长,目前国际上采用诊断相关组〔Diagnosis Related Group,DRG〕付费的方式,最早由美国耶鲁大学的学者们在20世纪60年代后期开场研究。
DRG支付制度将按效劳工程付费改为按病种付费,根据国际疾病分类法将住院病人按病人年龄、主次要诊断、手术、并发症或伴随病等分为假设干组并制定相应的支付标准。
当医院面对固定的DRG价格时,如果实际效劳本钱超过了该病人的DRG价格,医院那么承当相应的经济损失;如果实际效劳本钱低于DRG价格,两者之间的差额即成为可供医院自由支配的“利润〞。
对医院来讲,DRG建立了一种动态的价风格整机制和效劳监视机制,客观上要求医院增强本钱意识,加强对医疗效劳本钱的预测、方案、计算、控制、分析和考核,努力降低本钱,从医疗效劳的设计、提供等各环节,寻求最合理的流程,高效使用医疗资源,减少人员、设备、技术的无效投入。
自2000年开场,我国越来越多的医院开场实施病种付费制度。
这一新型付费制度能通过规化的临床路径很好地控制医疗费用增长,但也使医院面临着更多的收益风险问题。
因此,如何有效地管理和控制面向DRG的医疗效劳本钱,是当前医院所面临的重要课题。
2、国外研究应用现状由于实施DRG确实能起到缩短平均住院日、控制住院费用的效果,因此许多国家纷纷效仿。
如英国开发了安康资源分组(Health Resource Groups,HRG);加拿大和法国在美国HCFA-DRGs7.0版的根底上开发了加拿大版本和法国版本(GHM)。
基于粗糙集和灰色理论的决策树算法研究的开题报告一、选题背景近年来,信息时代随着互联网的高速发展,数据量呈爆炸式增长,数据挖掘技术成为了热点话题之一。
数据挖掘技术是从大量数据中自动发现非显而易见的模式、知识和信息的一种方法,它主要包括聚类、分类和预测等功能。
其中,分类算法是数据挖掘中最为重要的一种技术,其核心算法之一就是决策树。
决策树算法是一种有效的分类算法,其基本思想是通过选择最优的属性对数据进行划分,从而构建一个树形结构的决策模型。
目前,关于决策树的研究主要包括三个方面:一是改进算法本身,如采用剪枝技术、改进属性选择度量方法等;二是融入其他算法来改进决策树,在常用的决策树算法的基础上,融入数据挖掘领域其他算法,如粗糙集、灰色理论等;三是将决策树应用于实际问题,如医学、金融、环保等领域,从而实现对这些领域的深度挖掘。
二、选题意义当前,随着数据量的不断增长和应用领域的不断拓展,决策树算法在数据挖掘、机器学习等领域的应用越来越广泛。
在实际应用中,决策树算法具有解决复杂分类问题、推理能力强、易于理解和解释等优点。
同时,粗糙集和灰色理论也是目前数据挖掘领域中常用的方法,其与决策树的结合可以更好地发挥数据挖掘的优势,提高决策树算法的效率和精度。
通过研究基于粗糙集和灰色理论的决策树算法,可以更深入地探究决策树算法的内在规律和实现机制,从而在实际应用中更有效地运用决策树算法解决各种分类问题。
三、研究内容本文将基于粗糙集和灰色理论的决策树算法作为研究对象,重点研究以下内容:1. 粗糙集理论和灰色理论的原理及应用;2. 常见决策树算法的原理、优缺点及改进;3. 基于粗糙集和灰色理论的决策树算法的设计和实现;4. 算法性能的实验验证及分析。
四、研究方法本文将主要采用以下研究方法:1. 文献综述法:对现有的相关文献和研究成果进行系统的搜集和综述,了解决策树算法和粗糙集/灰色理论的相关背景知识和最新研究进展;2. 算法设计法:在对现有算法进行了解和分析的基础上,对基于粗糙集和灰色理论的决策树算法进行设计和完善,包括算法的整体结构设计、关键步骤的实现、参数选取等;3. 实验验证法:进行算法性能分析和实验验证,通过对数据集的分析和比较来验证算法的可行性和优越性。