基于聚类和遗传算法的解释性模糊模型设计
- 格式:pdf
- 大小:179.22 KB
- 文档页数:3
收稿日期:2004205230.作者简介:许松荣(19792),男,硕士研究生;厦门,厦门大学计算机与信息工程学院(361005).E 2mail:xsr abc@基于遗传算法的模糊聚类方法许松荣(厦门大学计算机与信息工程学院,福建厦门361005)摘要:针对模糊c 2均值算法容易收敛于局部极小点的缺陷,将遗传算法应用于模糊c 2均值算法的优化计算中.算法采用实数编码,提高了试验精度.实验证明基于遗传算法的模糊聚类方法能够在一定程度上克服初值的影响,跳出局部极小点,在大样本的聚类方面有较大的优势.关 键 词:聚类;模糊c 2均值算法;遗传算法中图分类号:TP391 文献标识码:A 文章编号:167124512(2004)S120217203The fuzzy clustering method based on genetic arithmeticXu SongrongAbstr act:This paper applies genetic arithmetic to optimization of the fuzzy c 2mean arithmetic since the fuzzy c 2mean arithmetic has the limitation of converging to the local infinitesimal point.The arithmetic adopts the real code and thus increases the precision of the experiments.The experiments prove that the fuzzy c 2means arithmetic based on genetic arithmetic can overcome the influence of initial values and possess the predominance in the clustering of huge samples.Key words:clustering;fuzzy c 2mean arithmetic;genetic arithmeticXu Songr ong Postgraduate;Computer &Information Engineering College,Xiamen U niversity.Fujian,Xiamen 361005,China. 聚类[1]是根据数据的不同特征,将其划分为不同的数据类.聚类的目的是使得属于同一类别的个体之间的距离尽可能地小,而不同类别上的个体间的距离尽可能地大.聚类方法包括统计方法、机器学习方法、神经网络方法等.模糊聚类方法具有简便易行,聚类效果较好的优点,在实际应用中获得广泛的运用.但是普通的模糊聚类易于陷入局部极小点而不能搜索到全局的聚类中心.而遗传算法作为一种新型的进化优化算法,可以概率地在状态空间搜索最佳点,特别适合于非线性多峰值的函数优化问题.1 普通的模糊聚类方法模糊聚类是将样本空间X ={x 1,x 2,,,x n }的样本点分成c 类,任意一个样本点x i I X 几乎不可能被严格地划分给某一类,定义样本点x i 属于第j (1[j [c)类的程度w ij (0[w i j [1).样本空间X 的模糊聚类用模糊矩阵W =(w ij )描述,元素w ij 是矩阵W 的第i 行第j 列元素,代表第i 个样本点隶属于第j 类的隶属度.W 具有以下性质:w ij I [0,1];(1)E c j=1w ij =1;(2)0<E n i =1w ij <n.(3)为了计算各个样本点相对于聚类中心的隶属度,一般采用FCM 算法.定义目标函数:J m (W ,Z )=E ni =1E cj =1w ij d 2ij (x i ,z j ),Z =(z 1,z 2,,,z c ),其中z j 表示第j 类的聚类中心,d 2ij (x i ,z j )=+x i -z j +是样本点x i 到聚类中心z j 的欧氏距离.聚类即是求目标函数在式(1)~(3)约束下的第32卷增刊 华 中 科 技 大 学 学 报(自然科学版) Vol.32 Sup.2004年 10月J.Huazhong Univ.of Sci.&Tech.(Nature Science Edition)Oct.2004最小值.FCM 算法通过对目标函数的迭代优化来取得对样本集的模糊分类.具体算法参见文献[2].该算法对初值敏感,很大程度上依赖初始聚类中心的选择,当初始聚类中心严重偏离全局最优聚类中心时,用FCM 很可能陷入局部极小值.当聚类数目较大时,该缺点更为明显.2 基于遗传算法的模糊聚类方法遗传算法[3]是基于/优胜劣汰、适者生存0的一种高度并行、随机和自适应的全局优化算法.它从某一随机种群出发,按照一定的操作规则,根据每一个个体的适应度,存优去劣,引导搜索过程向最优解逼近.遗传算法不要求连续、可微等条件,具有较强的鲁棒性.对于所定义的目标函数,聚类问题即是求满足式(1)~(3)的W 和Z ,使得目标函数值最小,这实际上是一个优化的问题.用遗传算法求解,主要考虑以下因素[4]:染色体编码、个体适应度评价、遗传算子(选择算子、交叉算子、变异算子)以及遗传参数设置等.2.1 染色体编码方法设n 个样本被分成c 类:Z 1,Z 2,,,Z c ,模糊分类矩阵W =(w ij )共有n @c 个元素.这里采用实数编码方案[5,6].一个染色体可以被编码成为:[z 1z 2,z c w 11w 12,w 1c w 21w 22,w 2c ,w n 1w n 2,w nc ].2.2 始化群体的生成当聚类个数c 给定时,随机选取聚类中心并随机生成w ij 组成模糊矩阵W .2.3 适应度函数用适应度函数模拟自然选择,评价染色体的相对优劣程度,由此决定各种遗传操作.个体以J m (W ,Z )为目标函数值,J m (W ,Z )越小,个体的适应度就越高.取f i =1/J m (W ,Z )作为第i个个体的适应度,总的适应度为F =E cj =1f i ,平均适应度为 f =f i /F.2.4 选择选择操作建立在对个体的适应度评价的基础上,用来将父代中的优秀个体保存到下一代.常用的选择操作有轮赌盘选择、余数选择法、保留最佳个体等.这里采用期望值选择法.a .计算群体中每个个体在下一代生存的期望数目N i =f i / f .b .若某个个体被选中并要参与配对和交叉,则它在下一代的期望数目减去0.5;若不参与配对和交叉,则该个体的生存期望数目减去1.c .在上面两种情况中,若一个个体的期望值小于0,则该个体不参与选择.2.5 交叉交叉用于组合新个体,使子代继承父代优秀基因.a .对每个个体产生[0,1]的随机数r ,若r <p c ,则该个体参加交叉操作,选出交叉操作的一组染色体后进行随机配对.b .对每一对染色体X 、Y,产生(0,1)之间的随机数e.c .做如下交叉运算:X z e X +(1-e )Y,Y z e Y +(1-e)X.2.6 变异变异用来保持种群的多样性.这里变异操作分为两个部分.首先对染色体的前c 位基因进行变异操作.a .产生随机数r ,若p m <r ,则进行变异操作.b .产生随机正整数h (1[h [c/2).c .产生h 个随机正整数t 1,t 2,,,t h ,对第t i 位基因产生随机数,代替原来的基因.d .若前c 位发生重复,则对重复的基因再进行变异.然后对染色体第c 位后的基因(记做Z )进行变异操作.a .产生(0,1)之间的随机数A .b .产生nc 维随机向量V =[v 1v 2,v nc ],v i I [0,1].c .做变异Z z Z +A V.2.7 合法性检查遗传操作可能产生非法的个体,要对产生的非法个体进行修正.修正的规则如下:a .如果w ij >1或w ij <0,则w ij =0.5.b .如果E cj =1w ij >1,且所有w ij 都相同,则令w ij =1/c,j =1,2,,,c;否则,令w ik =max (w i 1,w i 2,,,w i c ),于是w ik =1-E c j =1,j X kw ij ,j =1,2,,,c.c .如果E cj =1w ij <1,且所有w ij 都相同,则令w ij =1/c,j =1,2,,,c;否则,令w ik =min (w i 1,w i 2,,,w ic ,于是w ik =1-E cj =1,j X kw ij ,218 华 中 科 技 大 学 学 报(自然科学版) 第32卷j =1,2,,,c.d .如果E ni =1w ij \n,则w ij z 0.5,i =1,2,,,n.3 实例应用基于遗传算法的模糊c 2均值算法对二维数据集进行聚类.图1(a)为聚类样本.初始种图1 聚类样本和聚类结果群300,最大进化世代数500,p c =0.2,p m =0.05.运算结果为J =2.619.聚类中心为(0.749,0.218)和(0.234,0.238).图1(b)为聚类结果.参考文献[1]张红云,刘向东,段晓东等.数据挖掘中聚类算法比较研究.计算机应用与软件,2003(2):5~6[2]李洪兴,汪培庄.模糊数学.北京:国防工业出版社,1994.[3]褚蕾蕾,陈绥阳,周 梦.计算智能的数学基础.北京:科学出版社,2002.[4]史忠植.知识发现.北京.清华大学出版社,2002.[5]张 维,潘福铮.一种基于遗传算法的模糊聚类.湖北大学学报,2002(2):101~104[6]王 敞,陈增强,袁著祉.基于遗传算法的K 均值分析.计算机科学,2003(2):162~164219增刊 许松荣:基于遗传算法的模糊聚类方法。
基于遗传算法的模糊树建模方法的报告,800字遗传算法(GA)作为模糊树建模方法一种近期被广泛使用的技术,其在运用到实际工作中取得了不错的应用效果。
本文旨在通过介绍遗传算法的概念、原理以及模糊树建模方法的应用实例,研究GA在模糊树建模方法中的作用。
首先,要给出遗传算法的定义,遗传算法是一种模拟生物进化与遗传机制的计算机算法,它可以逐步淘汰不优秀的个体,从而达到改进和优化目标函数过程的效果。
遗传算法包括三大步骤,即初始化、选择和交叉等。
在模糊树建模方法中,初始化可以通过随机生成模糊树结构,将其转换为个体组合进行初始化;选择中,可以依据适应度函数对模糊树结构的个体进行去重处理和选择,提高个体的适应度;交叉则是在优良的个体之间进行基因交叉,达到结构改变、参数变化的效果。
其次,我们以湿式轧机旋转系统的建模为例,研究如何应用GA在模糊树建模中发挥作用。
首先,根据实际工作情况,设计建模目标函数,将其作为GA的最优解追求;然后可通过容量反演依据轧机感应信号通过GA优化结构,构建一个基于模糊树的模型;最后,可以使用测试数据对模型进行验证,确保模型结构和参数都能够满足目标函数要求。
本文采用GA作为模糊树建模的方法,证明了其在实际应用中是一种有效的技术手段,在模糊树建模方面能够较好地发挥作用。
建议在实际工作中大胆引入GA,结合实际环境设计合适的最优解追求条件,用不同的GA参数来提高遗传算法的效率,并及时更新模糊树结构以及参数,最终实现高效的模糊树建模。
总之,遗传算法在模糊树建模方法中是一种表现出色的方法,其可以有效地解决多变量复杂问题。
应用GA前要结合实际环境设计适当的最优解追求条件,考虑不同的GA参数,及时更新模糊树结构以及参数,以便更好地应用GA在模糊树建模方法中。
发表:一类基于分级聚类的可解释性模糊建模方法的研究(一)摘要提出了一种基于两级聚类算法的可解释性模糊建模方法.首先指出模糊模型可解释性的重要地位,分析影响可解释性的主要因素;然后利用减法聚类和加权模糊C均值聚类算法辨识初始模糊模型,紧密/分离性函数确定最优划分和模糊集合的相似性融合约简初始模糊模型,从而提高其可解释性;最后采用约束优化算法整体优化模型,提高其精度。
通过对Box—Jenkins火炉数据的模糊建模,验证了该方法的有效性。
XX关键词模糊建模,可解释性,减法聚类,加权模糊C均值聚类Key wordsfuzzy deling,interpretability,subtraction clustering, weighted fuzzy c-means algorithm XX引言XX近些年来,基于规则的模糊建模以其众多优点成为一个活跃研究的领域,并在仿真、分类、数据挖掘、模式识别、预测及控制等方面得到应用。
与神经网络等模型不同,模糊模型的知识表达形式和推理机制符合人的思维习惯,可为人们所理解,成为模糊模型最显著的特征。
XX在模糊建模中,一般要求所建立的模型既要有较好的拟合精度,又要有较简单的模糊结构。
目前,众多聚类算法在模糊逻辑系统的结构辨识中得到了应用,据此而得到的模糊结构往往以拟合精度作为指标,从而得到的模糊模型含有大量的冗余信息,泛化能力差,不具备可解释性.XX为了提高模糊模型的可解释性,诸多学者进行了相关研究.文献给出了模糊模型可解释性的一些必要条件。
文献给出了提高模糊模型可解释性的一些具体方法,包括模糊集合的相似性度量、正交变换和遗传算法的规则约简,全局与局部学习算法等.文献利用模糊聚类辨识含有冗余的模型,然后利用模糊集合相似性度量和相似性奖励遗传算法对模型进行迭代简化,最后利用相似性遗传算法整体优化模型。
文献提出了一种新分级聚类算法,利用最近领域聚类算法和加权模糊C均值聚类算法辨识出较少的模糊规则,但没有考虑模糊集合的相似性融合,同时最近领域聚类算法对于高维系统易产生维数灾难。
《基于遗传算法和模糊聚类的目标识别技术研究》一、引言随着计算机视觉技术的飞速发展,目标识别技术在众多领域中得到了广泛应用。
遗传算法和模糊聚类作为两种重要的优化和聚类技术,其与目标识别技术的结合,能够显著提高识别的准确性和效率。
本文将重点探讨基于遗传算法和模糊聚类的目标识别技术研究,通过分析和研究两种算法的特点及其在目标识别中的应用,以期为相关领域的研究和应用提供理论和技术支持。
二、遗传算法及其在目标识别中的应用遗传算法是一种基于生物进化原理的优化算法,其通过模拟自然选择和遗传机制,实现对问题的全局优化。
在目标识别中,遗传算法主要用于优化分类器的参数和特征选择。
通过设置适当的适应度函数,遗传算法可以在大量可能的参数和特征组合中寻找到最优的组合,从而提高目标识别的准确性和鲁棒性。
具体而言,遗传算法通过种群初始化、选择、交叉和变异等操作,不断产生新的个体,并通过适应度函数对个体进行评价和选择。
在目标识别中,可以将分类器的参数或特征组合看作个体,通过遗传算法的优化过程,找到最适合目标识别的参数和特征组合。
三、模糊聚类及其在目标识别中的应用模糊聚类是一种基于模糊数学理论的聚类方法,其通过引入模糊性概念,实现对数据的软划分。
在目标识别中,模糊聚类主要用于对图像或特征进行聚类分析,从而实现对目标的识别和分类。
模糊聚类通过计算数据之间的相似性或距离,将数据划分为不同的聚类,每个聚类代表一个潜在的目标。
在目标识别中,可以利用模糊聚类分析图像或特征的空间分布、颜色、纹理等特性,从而实现对目标的准确识别和分类。
四、基于遗传算法和模糊聚类的目标识别技术将遗传算法和模糊聚类相结合,可以实现对目标识别的进一步优化。
具体而言,可以利用遗传算法优化模糊聚类的参数和规则,从而提高聚类的准确性和效率;同时,可以利用模糊聚类对图像或特征进行预处理和分析,为遗传算法提供更准确的适应度评价依据。
在实际应用中,可以将这两种算法进行融合和优化,形成一种基于遗传算法和模糊聚类的目标识别系统。
基于遗传算法的模糊聚类研究及其应用的开题报告开题报告:一、选题背景随着信息技术和计算机科学的发展,数据处理和分析已成为现代社会中极其重要的一个领域。
在信息时代,数据的规模和复杂性越来越大,传统的数据挖掘和聚类算法难以胜任这个任务,因此需寻找新的方法解决这个问题。
模糊聚类算法是一种基于模糊思想的聚类方法,它在处理模糊信息方面表现出很好的效果。
而遗传算法则是模拟自然界进化而来的一种算法,能够在大规模的搜索问题中快速寻找最优解。
两者结合可以有效地解决大规模模糊聚类问题。
二、研究目的本研究旨在探索基于遗传算法的模糊聚类算法,研究其原理、特点、优化方法及其应用,进一步提高模糊聚类算法的效率和准确性,为实际应用提供支持。
具体目的如下:1.深入了解遗传算法的基本原理和聚类算法的基本原理;2.掌握遗传算法在模糊聚类中的应用方法;3.研究基于遗传算法的模糊聚类算法的特点和优势;4.分析遗传算法的优化技术在基于模糊聚类算法中的应用;5.通过实验验证基于遗传算法的模糊聚类算法的性能。
三、研究内容1. 模糊聚类算法的基本原理及其常见方法;2. 遗传算法的基本原理及其应用方法;3. 基于遗传算法的模糊聚类算法的设计与实现;4. 基于真实数据的实验验证及分析;5. 对研究结果进行总结和评估。
四、预期成果1. 实现基于遗传算法的模糊聚类算法,并比较不同算法在效率和准确性上的差异;2. 对算法性能进行实验分析和评估,验证算法有效性;3. 发表学术论文1-2篇。
五、研究方法及技术路线本研究采用实验研究方法,通过对不同聚类算法的比较和分析,选定适合基于遗传算法的模糊聚类算法,并在真实数据上进行试验验证其性能。
研究的技术路线如下:1. 研究模糊聚类算法的基本原理,比较传统聚类算法的优缺点;2. 研究遗传算法的原理和应用方法,分析其在模糊聚类中的作用;3. 对基于遗传算法的模糊聚类算法进行研究和设计,构建算法模型;4. 使用真实数据进行实验,比较不同算法的性能,评估其优缺点;5. 进行研究总结,并撰写相关学术论文。
附录1基于神经网络和遗传算法的模糊系统的自动设计摘要本文介绍了基于神经网络和遗传算法的模糊系统的设计,其目的在于缩短开发时间并提高该系统的性能。
介绍一种利用神经网络来描绘的多维非线性隶属函数和调整隶属函数参数的方法。
还提及了基于遗传算法的集成并自动化三个模糊系统的设计平台。
1 前言模糊系统往往是人工手动设计。
这引起了两个问题:一是由于人工手动设计是费时间的,所以开发费用很高;二是无法保证获得最佳的解决方案。
为了缩短开发时间并提高模糊系统的性能,有两种独立的途径:开发支持工具和自动设计方法。
前者包括辅助模糊系统设计的开发环境。
许多环境已具有商业用途。
后者介绍了自动设计的技术。
尽管自动设计不能保证获得最优解,他们仍是可取的手工技巧,因为设计是引导走向和依某些标准的最优解。
有三种主要的设计决策模糊控制系统设计:(1)确定模糊规则数,(2)确定隶属度函数的形式。
(3)确定变化参数再者,必须作出另外两个决定:(4)确定输入变量的数量(5)确定论证方法(1)和(2)相互协调确定如何覆盖输入空间。
他们之间有高度的相互依赖性。
(3)用以确定TSK(Takagi-Sugeno-Kang)模式【1】中的线性方程式的系数,或确定隶属度函数以及部分的Mamdani模型【2】。
(4)符合决定最低套相关的输入变量,计算所需的目标决策或控制的价值观。
像逆向消除(4)和信息标准的技术在此设计中经常被利用。
(5)相当于决定使用哪一个模糊算子和解模糊化的方法。
虽然由数种算法和模糊推理的方法已被提出,仍没有选择他们标准。
[5]表明动态变化的推理方法,他依据这个推理环境的结果在性能和容错性高于任何固定的推理的方法。
神经网络模型(以更普遍的梯度)和基于遗传算法的神经网络(最常见的梯度的基础)和遗传算法被用于模糊系统的自动设计。
基于神经网络的方法主要是用来设计模糊隶属度函数。
这有两种主要的方法;(一)直接的多维的模糊隶属度函数的设计:该方法首先通过数据库确定规则的数目。