基于聚类分析的综合神经网络集成算法

格式：pdf
大小：264.63 KB
文档页数：5

下载文档原格式

/ 5

基于人工神经网络的聚类算法优化研究

基于人工神经网络的聚类算法优化研究随着科技的不断发展，人工智能成为了当今社会一个备受关注的热点话题。

其中，人工神经网络作为一种重要的技术，受到了越来越多的关注和研究。

而在人工神经网络应用领域中，聚类算法优化也成为了一个重要的研究课题。

那么，本文便将基于人工神经网络的聚类算法优化进行深入探讨。

一、人工神经网络基础人工神经网络是一种由多个神经元相互连接组成的网络，其结构与生物神经系统相似。

通过学习与训练，人工神经网络可以模拟人类的智能行为，并对大量数据进行分类、预测、识别等操作。

而人工神经网络训练过程中使用的算法和方法，则对于聚类算法优化而言尤为重要。

二、聚类算法优化研究聚类算法是机器学习中的一个重要领域，它主要通过对样本进行分组或分簇，对数据进行分类和分析。

聚类算法优化则是针对现有聚类算法进行改进和优化，提升其运行效率和准确性。

传统的聚类算法中，K-means算法是一种著名的聚类算法。

它通过计算样本之间的欧几里得距离，将样本依据距离远近分组。

但是，K-means算法具有计算量大，对初始值敏感以及易陷入局部最小值等问题。

为此，研究人员提出了一系列基于人工神经网络的聚类算法。

例如，自组织特征映射(SOM)算法、基于ART神经网络的聚类算法等。

这些算法的出现，旨在优化传统聚类算法的问题，并提高聚类效果和精度。

具体来说，这些新算法能够通过不同的神经元之间的相互作用，学习样本的非线性特征，并能够自适应地调整分组结果。

三、优化研究案例为了更好的说明基于人工神经网络的聚类算法优化的具体应用，我们举一个实际的例子。

研究人员曾对美国著名的湾流飞机的大量数据进行聚类分析，探讨其工作状态下性能和健康状况的影响因子。

在传统聚类算法下，所得到的聚类结果效果不佳。

于是，研究人员采用基于单层神经网络和基于ART神经网络的聚类算法，并将两种算法结果进行比较。

实验结果表明，采用基于ART神经网络的方法所得到的分组结果比传统K-means算法更优，能够更好地揭示湾流飞机性能和健康状况的关联因素。

如何使用神经网络进行聚类分析

如何使用神经网络进行聚类分析神经网络在机器学习领域中扮演着重要的角色，可以用于各种任务，包括聚类分析。

聚类分析是一种将数据集中的对象划分为相似组的方法。

在本文中，我们将探讨如何使用神经网络进行聚类分析，并介绍一些常用的神经网络模型。

首先，让我们了解一下什么是神经网络。

神经网络是一种模仿人类神经系统的计算模型，由多个神经元（节点）组成的层级结构。

每个神经元都与其他神经元相连，并通过权重来传递信息。

神经网络通过学习权重和偏差的调整，从而能够对输入数据进行分类、回归或聚类等任务。

在聚类分析中，我们希望将数据集中的对象划分为不同的组，使得每个组内的对象相似，而不同组之间的对象差异较大。

神经网络可以通过学习数据集的特征和模式，自动将对象划分为不同的聚类。

下面介绍几种常用的神经网络模型用于聚类分析。

一种常用的神经网络模型是自组织映射（Self-Organizing Map，SOM）。

SOM 是一种无监督学习算法，可以将高维数据映射到一个低维的拓扑结构中。

SOM模型由输入层和竞争层组成，竞争层中的神经元代表聚类中心。

通过调整神经元之间的权重，SOM模型可以将输入数据映射到最相似的聚类中心。

另一种常用的神经网络模型是深度自编码器（Deep Autoencoder）。

深度自编码器是一种多层神经网络，由编码器和解码器组成。

编码器将输入数据压缩为低维表示，而解码器则将低维表示重构为原始数据。

通过训练深度自编码器，可以学习到数据的潜在特征，并用于聚类分析。

除了上述两种模型，还有许多其他的神经网络模型可用于聚类分析，如卷积神经网络（Convolutional Neural Network，CNN）和循环神经网络（Recurrent Neural Network，RNN）。

这些模型在不同的数据集和任务中表现出色，可以根据具体需求选择合适的模型。

在使用神经网络进行聚类分析时，还需要注意一些问题。

首先，数据的预处理非常重要。

神经网络对数据的分布和尺度敏感，因此需要对数据进行标准化或归一化处理。

基于聚类的神经网络规则抽取算法

关键词：规则抽取；神经网络；聚类
中图分类号：Ｐ８Ｔ１３文献标识码：Ａ
ＲｕｅｔａｔｎｆｏＡｒｉｃａｕａｔｒｓｄｏｕｔｒｎｌｓＥｘｒｃｉｒｍｔｉｌＮｅｒｌＮｅｗｏｋＢａｅｎＣｌｓｅｉｇｏｉｆ
ｔａｎｄａｒｎｄｓｃｓｆｌｒｉｅｎｄｐｕｅｕｃｅｓｕｌｈｃｉａｉｎｖｌｓａｈｄｅｉａｅｃｕｔｒｄｉｔｉｃｅｅｖｌｅ．Ｉｈｙ，ｔｅａｔｖｔｏａｕｅｔｔｅｈｉｄｎｕｎｔｒｌｓｅｅｎｏｄｓｒｔａｕｓｎｔｅ
ｃｕｔｈｓ，ｈｌｓｒｕｅｆｅｈｓａｅａｊｓｄｄｎｍｉｌｃｏｄｎｃｖｔｎｖｌｅｆｈｉｌｓｒａｅｔｅｃｕｔｍｂｒｉｔｃｎｂｄｕｔｙａｃｌａｃｒｉｔａｔａｏａｓｏｅｒｅｐｅｎｏｗｇｅａｙｇｏｉｉｕｔ
ＡｂｔａｔＷｅｐｏｏｅａｎｖｌａｇｒｔｍｏｘｒｃｉｇｒｌｓｆｏａｔｃａｕａｅｗｏｋ．Ａｆｅｈｅｎｔｒｓｓｒｃ：ｒｐｓｏｅｌｏｉｈｆｒｅｔａｔｕｅｒｍｒｉｉｌｎｅｒｌｎｔｒｎｉｆｔｒｔｅｗｏｋｉ
第２８卷第５期２１９月００年
吉林大学学报（息科学版）信ＪｕｎｌｆｉｎＵｉｒｔＩｏｍｔｎＳｉｃｄｉ）ｏｒａｏｌｎｖｓｙ（ｎｒａｉｃｅｅｉｏＪｉｅｉｆｏｎＥｔｎ

聚类算法和分类算法总结

聚类算法和分类算法总结聚类算法总结原⽂:聚类算法的种类：基于划分聚类算法（partition clustering)k-means：是⼀种典型的划分聚类算法，它⽤⼀个聚类的中⼼来代表⼀个簇，即在迭代过程中选择的聚点不⼀定是聚类中的⼀个点，该算法只能处理数值型数据k-modes：K-Means算法的扩展，采⽤简单匹配⽅法来度量分类型数据的相似度k-prototypes：结合了K-Means和K-Modes两种算法，能够处理混合型数据k-medoids：在迭代过程中选择簇中的某点作为聚点，PAM是典型的k-medoids算法CLARA：CLARA算法在PAM的基础上采⽤了抽样技术，能够处理⼤规模数据CLARANS：CLARANS算法融合了PAM和CLARA两者的优点，是第⼀个⽤于空间数据库的聚类算法FocusedCLARAN：采⽤了空间索引技术提⾼了CLARANS算法的效率PCM：模糊集合理论引⼊聚类分析中并提出了PCM模糊聚类算法基于层次聚类算法：CURE：采⽤抽样技术先对数据集D随机抽取样本，再采⽤分区技术对样本进⾏分区，然后对每个分区局部聚类，最后对局部聚类进⾏全局聚类ROCK：也采⽤了随机抽样技术，该算法在计算两个对象的相似度时，同时考虑了周围对象的影响CHEMALOEN（变⾊龙算法）：⾸先由数据集构造成⼀个K-最近邻图Gk ,再通过⼀个图的划分算法将图Gk 划分成⼤量的⼦图,每个⼦图代表⼀个初始⼦簇,最后⽤⼀个凝聚的层次聚类算法反复合并⼦簇，找到真正的结果簇SBAC：SBAC算法则在计算对象间相似度时，考虑了属性特征对于体现对象本质的重要程度，对于更能体现对象本质的属性赋予较⾼的权值BIRCH：BIRCH算法利⽤树结构对数据集进⾏处理，叶结点存储⼀个聚类，⽤中⼼和半径表⽰，顺序处理每⼀个对象，并把它划分到距离最近的结点，该算法也可以作为其他聚类算法的预处理过程BUBBLE：BUBBLE算法则把BIRCH算法的中⼼和半径概念推⼴到普通的距离空间BUBBLE-FM：BUBBLE-FM算法通过减少距离的计算次数，提⾼了BUBBLE算法的效率基于密度聚类算法：DBSCAN：DBSCAN算法是⼀种典型的基于密度的聚类算法，该算法采⽤空间索引技术来搜索对象的邻域，引⼊了“核⼼对象”和“密度可达”等概念，从核⼼对象出发，把所有密度可达的对象组成⼀个簇GDBSCAN：算法通过泛化DBSCAN算法中邻域的概念，以适应空间对象的特点DBLASD：OPTICS：OPTICS算法结合了聚类的⾃动性和交互性，先⽣成聚类的次序，可以对不同的聚类设置不同的参数，来得到⽤户满意的结果FDC：FDC算法通过构造k-d tree把整个数据空间划分成若⼲个矩形空间，当空间维数较少时可以⼤⼤提⾼DBSCAN的效率基于⽹格的聚类算法：STING：利⽤⽹格单元保存数据统计信息，从⽽实现多分辨率的聚类WaveCluster：在聚类分析中引⼊了⼩波变换的原理，主要应⽤于信号处理领域。

基于深度学习算法的聚类分析应用研究

基于深度学习算法的聚类分析应用研究随着互联网技术的日新月异，数据量的快速增长已经成为了当今社会的一个普遍现象。

为了更好地了解这些庞大的数据，我们可以通过数据分析的方式来寻找其中潜在的联系和规律。

其中的一个方法就是聚类分析。

聚类分析是一种数据分析方法，通过将数据划分成不同的群组，来挖掘出数据之间的内在联系。

这一方法也被广泛应用于人工智能领域之中。

基于深度学习算法的聚类分析，正是人工智能领域的一大创新。

一、深度学习算法的基本原理深度学习算法，是一种基于神经网络理论的学习方法。

其核心思想是借鉴生物神经系统中神经元之间信息传递的方式，构建出一个网络结构，利用输入数据与输出数据之间的关系，逐渐地训练出这个网络的参数，从而实现对于未知数据的预测。

在深度学习算法中，最为重要的是神经网络结构。

其中的主要构件是“神经元”，通过一定的权重间联系，形成了一个大规模的计算模型。

每一层的神经元都可以接受上一层的输入，并根据各自的函数进行计算，然后作为下一层神经元的输入进行传递。

而最后一层神经元的输出，则被认为是整个神经网络的预测结果。

二、深度学习算法在聚类分析中的应用深度学习算法因其优异的表现，被广泛应用于各种数据挖掘的应用场景之中。

其中包括了数据分类、目标检测、图像处理等领域。

而在聚类分析领域中，深度学习算法同样具有很大的优势。

基于深度学习算法的聚类分析，主要考虑到了数据内在的高阶规律性。

在网络训练的过程中，神经网络通过自适应策略来进行参数的调整，从而自动地发现数据内在的潜在联系。

相比于传统的聚类分析方法，这一方法所挖掘出的数据特征，更加准确、全面、以及具有实时性。

三、深度学习算法在聚类分析中的实例除了理论方面的研究外，深度学习算法在聚类分析领域中，也有着广泛的应用案例。

例如，在语音验证这一领域中，深度学习算法可以将许多声音特征归为一个群组。

这种方法可以帮助计算机提高对于语音信号的处理能力。

另一个实例，则是在图像处理方面的应用。

基于聚类算法的RBF神经网络设计综述

基于聚类算法的RBF神经网络设计综述张彬【期刊名称】《微型机与应用》【年(卷),期】2012(31)12【摘要】简要分析了径向基函数（RBF）神经网络。

在此基础上，介绍了K-均值聚类算法的神经网络、C-均值聚类算法的神经网络和PAM聚类算法的神经网络三种聚类算法的RBF神经网络。

展望了基于聚类的RBF神经网络设计的发展趋势。

%This paper briefly analyzed the mathematical model of RBF neural network. On this basis,three kinds of RBF net- work based on fuzzy clustering were introduced ：K-means clustering algorithm, C-means clustering algorithm and PAM clustering algorithm. Finally, it was expected about the future trend of design of RBF Network based on fuzzy clustering.【总页数】4页(P1-3,7)【作者】张彬【作者单位】长沙理工大学电气与信息工程学院,湖南长沙410004【正文语种】中文【中图分类】TP18【相关文献】1.基于K-均值聚类算法RBF神经网络交通流预测 [J], 管硕;高军伟;张彬;刘新;冷子文2.基于蚁群聚类算法的RBF神经网络在压力传感器中的应用 [J], 孙艳梅;都文和;冯昌浩;刘道森;卢俊国;崔全领;苗凤娟;宋志章3.基于改进自适应聚类算法的RBF神经网络分类器设计与实现 [J], 郝晓丽;张靖4.基于K均值聚类算法与RBF神经网络的交通流预测方法 [J], 张天逸;孙毅然;刘凡琪;梁悦祺;林永杰;马明辉5.基于K均值聚类算法与RBF神经网络的交通流预测方法 [J], 张天逸;孙毅然;刘凡琪;梁悦祺;林永杰;马明辉因版权原因，仅展示原文概要，查看原文内容请购买。

基于聚类与梯度混合学习算法RBF神经网络的电液伺服系统建模及仿真

Ａｂｔａｃ：ｔＳｈｒｏｇｔｔｅｅａｔｍｏｌｏｈｌｃｒｈｙｒｕｌｃｓｒｏｓｓｅｕｓｎｉｓ— ｉｃｐｌｅｈｄｄｅｔｈｅｎｎｉａｕａｉｎｓｒｔＡｓｉ’ ａｄｔｅｈｘｃｄｅｆｔｅｅｅｔｏｄａｉｅｖｙｔｍｉｇｆｔｐｒｎｉｅｍｔｏｕｏｔｏｌｎｅｒｃａｓｔｏｓｒｓｃｓｔｅｉｈｒｎｕｘ— ｐｅｓｅｒｌｔｏｕｈａｈｎｅｅｔｆｌｒｓｕｒｅａｉｎＩＲＢＦｎｕａｅｗｏｋｗａｅｏｈｏｌｎｉｌｔｏｆｔｅｌｃｒｈｄａｌｃｅｒｌｎｔｒｓｕｓｄｆｒｔｅｍｄｅｉａｄｓｍｕａｉｎｏｈｅｅｔｏｙｒｕｉｎｇｓＩｙｔｍｆａｍｉｅｓｅｉｇｐｌｕｈｉａｎｓｓｅ．Ｓｉｅｔｕｒｌｎｔｒａｌｗｒｉｎｇｓｅｎｄｐｏｒｃｎｅｇｎｃ，ｅ￣Ｏｓｓｅｏｎｗｅｐｎｏｇｎａｗｅｐｏｙｔｍｎｃｈｅｎｅａｅｗｏｋｈｄｓｏｔａｎｉｐｅｄａｏｏｖｒｅｅ
，
ＷｕｘｉｏｉｏＣｈｎＪｉＷａｇＬａｘａｅｉｎｌｎｉ
（ｃｏｌｆＭｅａｉｌｎｉｅｒｇ，ＳｈｏｏｃｎａｇｎｅｎｈｃＥｉ
ｎｇ
ｉｃｎｅａｄＴｃｎｌｙＮｎｎｉｎｓ１０４ｈｎ）ｔｏｉｃｎｅｏｇ，ａｊｇＪｇｕ２０９，ＣｉａｙｆＳｅｈｏｉａ
豢遣鞋

基于神经网络的聚类算法研究

基于神经网络的聚类算法研究近年来，随着人工智能技术的不断发展，基于神经网络的聚类算法也越来越受到研究者的关注。

此类算法能够根据数据的特征，将数据划分成不同的簇，从而方便后续的数据分析。

本文将探讨基于神经网络的聚类算法的研究现状、应用前景以及存在的问题。

一、研究现状随着数据量的不断增加，传统的聚类算法（例如k-means）已经不能满足现代数据的需求。

因此，基于神经网络的聚类算法应运而生。

这类算法结合了神经网络的非线性映射能力和聚类算法的分类能力，不仅能够处理大规模和高维的数据，还具有异构聚类的能力。

目前，基于神经网络的聚类算法主要可以分为两类：有监督学习和无监督学习。

有监督学习的算法需要先对数据标注，然后通过神经网络进行分类，这类算法的优点在于能够得到更准确的聚类结果。

无监督学习的算法则不需要数据标注，通常采用自组织映射网络（SOM）或高斯混合模型（GMM）进行计算，这类算法的优点在于不需要额外的标注信息。

二、应用前景基于神经网络的聚类算法在很多领域都有着广泛的应用前景。

其中，最为常见的应用领域就是图像分割和模式识别。

在图像分割领域，这类算法可以将一张图像分成若干个部分，每个部分代表一种物体或者纹理。

在模式识别领域，这类算法可以帮助我们检测文本和语言中的规律模式，从而方便我们进行分类和标注。

另外，基于神经网络的聚类算法还可以应用于网络安全领域。

例如，我们可以将用户的网络行为数据进行聚类，从而发现异常的网络行为，提供更加有效的安全防护。

三、存在的问题尽管基于神经网络的聚类算法具有许多优点，但也存在着一些问题和挑战。

首先，这类算法需要大量的计算资源才能进行有效的计算。

其次，由于神经网络模型的复杂性，这类算法可能存在过拟合的问题。

此外，由于神经网络的黑箱结构，这类算法可能难以解释计算的结果。

针对上述问题，目前研究者正在尝试寻找有效的解决方案。

例如，一些研究者提出了基于GPU加速的算法，可以显著减少计算时间。

基于聚类的RBF-LBF串联神经网络学习算法

ｈｓｈｉｈｒｇｎｒｌｚｔｏｂｌｔｎｄｎｅｈｏｔｒｔａｎｉｇｔａｇｅｅｅａｉａｉｎａｉｉａｅｄｓｓｒｅｒｉｎｉｙｍｅ．
ＫｙｗｒｓｅｅａｚｔｎａｉｔｅｒｅｏｓａｉａｉＦｎｔｎ（Ｂ）ａｅｎｃｓｒｇｅｏｄ：ｇｎｒｉｉｌｙｌａｏｂｉ；ｎｕａｎｔｒ；ＲｄａＢｓｕｃｉＲＦ；ｐｔｒｕｔｎｌｗｋｌｓｏｔｌｅｉ
摘
要：为提高网络的泛化能力，究了单层ＲＦ神经网络和ＬＦ网络组成的ＲＦＬＦ串联神研ＢＢＢ —Ｂ
经网络，并提出了一种基于模式聚类的ＲＦＬＦ串联神经网络的学习算法。该算法分别对单层ＲＦＢ —ＢＢ
网络和ＬＦ网络的输入进行模式聚类，Ｂ以确定网络的初始结构，然后通过调整错分样本的类别，使之
ａｊｓｄｉｗｏｇｃｓｔｏｅａｒｒｅｋｒｅｆｎｆｎｘｅｉｅｔｆｗｐａｒｌｍｐｖｓｔａｔｇｒｈｄｕｔｒｎｌｓｏｖｒｐｏｇｔｅｎｌｕｃｏ．Ｅｐｒｎｏｏｓｉｓｐｏｅｒｅｈｔｈａｏｔｍｅｎａｌｍｅｅｈｍｔｒｌｂｏｅｌｉ
ｓｇ — ｇｒａｉａｉＦｎｔｎ（Ｂ）ａｄＬｎａＢｉＦｎｔｎ（Ｂ）ｎｔｏｋａｒｐｓｄｎａｅｎｂｓｄｉｌｌｅｄａＢｓｕｃｏａＥｎｉｅｒａｓｕｃｉＬＦｅｒｓｗｐｏｏｅ，ａｄａｐｔｒ—ａｅｎｅａＲｌｓｉｓｏｗｓｔ

基于神经网络模型的聚类分析技术研究

维普资讯
第２期
李大辉等：基于神经网络模型的聚类分析技术研究
２１竞争学习神经网络方法（ｏｅｉｅＬａｎｎＮ）．ＣｍｐｔｉｅｒｉＮｔｖｇ
竞争学习方法包含一个由若干单元组成的层次结构… ，层与层之间的连接是有刺激的，即一个给定层上的单元接受来自低一层所有单元的输入，一个层上激活单元配置就构成了对高一层的输入模式．在一个给定层上的聚类中单元相互竞争，以响应来自低一层输出的模式．层内的连接是抑制的，以使得一个特定聚类只有一个单元可被激活．获胜的单元调整与同一聚类中其它单元的连接，以使得之后可以对类似对象
反应更强烈．如果将一个权值定义为一个例证，那么新对象就赋给最近的例证．输入参数为聚类个数和每个聚类的单元个数．在聚类过程结束时，每个簇被认为是一个新的 “ 特征” 它检测对象的某些规律．如此，
产生的结果簇可以看作一个低层特性向高层特性的映射．
２２自组织特征图ＳＭ神经网络方法（ｅｆＯｒａｉｎｅｔｒｐＮ）．ＯＦＳｌｇｎｚｇＦａｕｅＭａｓＮ — ｉ
80年代初mchalski提出了概念聚类技术其要点是在划分对象时不仅考虑对象之间的距离还要求划分出的类具有某种内涵描述从而避免了传统技术的某些片面性聚类分析就是使用聚类算法来发现有意义的聚类它的主要依据是把相似的样本归为一类而把差异大的样本区分开来这样所生成的簇是一组数据对象的集合
维普资讯
在空间呈现这种结构，单元的组织形成一个特性映射，ＳＦ被认为类似于大脑的处理过程，对在二维或ＯＭ三维空间中可视化高维数据是很有用的．ＳＦＯＭ神经网络结构是由输入层和竞争层组成，输入层由个输入神经元组成，竞争层由：ＸＮ个输出神经元组成，且形成一个二维平面阵列．输入层各神经元与竞争层各神经元之间实现全互连接．该网络根据其学习规则，通过对输入模式的反复学习，捕捉住各个输人模式中所含的模式特征，并对其进行自组织，在竞争层将聚类结果表现出来，进行自动聚类．竞争层的任何一个神经元都可以代表聚类结果．２引入可变学习速度的ＳＭ神经网络训练算法．３０Ｆ设网络的输入模式为Ｘ，，ｋ …，）ｋ＝ｌ，３＝，，，２，… ，Ｐ；竞争层神经元向量为

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第 27卷第 1期文章编号 : 1006 - 9348 ( 2010) 01 - 0166 - 04
计算机仿真
2010年 1月
基于聚类分析的综合神经网络集成算法
齐新战 1 ,刘丙杰 2 ,冀海燕 2
(1. 海军潜艇学院作战指挥系 ,山东青岛 266071; 2. 海军潜艇学院导弹兵器系 ,山东青岛 266071)
一 [10 ] 。但是 FCM 算法也有其自身的缺点 ,文献 [ 10 ]深入研
究了 FCM 算法的缺陷 ,主要是对噪声数据敏感 ,其主要原因
是聚类中心计算采用了最简单的均值计算 :
N
∑ x
=
1 N
xi
i =1
(1)
当有噪声或游离值时 , 聚类中心会发生改变。由于中位
数对噪声和游离值的干扰不敏感 ,本文采用样本的中位数表
示聚类中心。聚类算法采用 FCM 算法。
假设待分类的样本集合为 X = { ( x1 , d1 ) , ( x2 , d2 ) , …, ( xn , dn ) } ,其中 xi表示输入 , di表示输出 , n为样本数量。因为神经网络处理的是输入数据 , 所以仅仅对样本的输入聚类。
输入样本的每个元素由一组特征表示 xk = { xk1 , xk2 , …, xkm } , m 为特征数量 , 通常情况下 , m 和神经网络的输入层神经元个数相同。FCM 算法具体步骤如下 :
1) 数据的标准化。有标准差标准化和极差标准化两种方
法 [11 ] ,本文采用极差标准化 :
xij
= xij - xj Rj
(2)
Xj (n
+ 1) , 2
n
is
odd
xj =
(3)
xj
= Xj (
n ), n 2
is even
Rj
=
m ax
0 < i≤n
(
xij
)
-
m in
0 < i≤n
(
xij
k
∑ d iff ( d, cj ) =
| di - cji | , 0 < j < m
(7)
i =1
集成权值为 :
Wj =
d iff ( d, cj )
m
,0 < j <m
(8)
∑d iff ( d, cj )
j=1
m
∑ 满足 : w i > 0, w j = 1。 j=1
假设网络 j的输出为 V j,则集成结果为 :
收稿日期 : 2008 - 10 - 01 修回日期 : 2008 - 10 - 30
— 166 —
经网络的方法进行改进。李凯等 [2 ]以及李国正等 [3 ]提出基于聚类技术的选择性 NNE算法 ,该算法通过计算个体神经网络之间的差异度对神经网络进行聚类 ,剔除相关神经网络 ,减小 NNE规模 ,实验表明这种算法是可行的。M d. 等 [4 ] 提出一种新的集成算法 CNNE,该算法首先建立一个较小的 NN E,然后通过增加个体神经网络隐含层神经元及增加个体神经网络来创建最优的网络结构。W ang[5 ]通过增加一个偏差对 Zhou[1 ]的算法进行了改进 ,在一定程度上提高了 NNE 的精度。 Pitoyo[6 ]提出了一种从不完全样本中学习的自适应 NNE算法 ,该算法通过消除不正确样本达到提高神经网络精度的目的。 Yao[7 ]提出一种用进化计算方法调整权值的 NNE 算法。
本文设计了一个综合神经网络集成算法 InNNE。该算法首先利用聚类分析技术将样本分类 ,对不同类别的样本采用不同的个体神经网络训练 ,个体神经网络的数目等于样本类别数目。这样可以达到不同的神经网络学习不同类的样本 ,可以提高神经网络个体之间的差异性 [8 ] ,从而提高 NNE 的泛化能力。NNE中的个体神经网络学习的样本不一样 ,对一个问题的不同侧面的认识能力也不一样 ,所以对于不同的输入数据 ,个体神经网络的处理能力是不同的。固定的 NNE 权值可能会降低某些神经网络个体的性能 ,从而导致整体 NNE性能下降。 InNNE根据输入数据与样本类别之间的相关程度自适应调整集成权值 ,这样可以提高 NNE 的精度。文献 [ 2, 3 ]中也将聚类分析技术应用于 NNE,所不同的是 , 文献 [ 2, 3 ]用聚类技术对个体神经网络进行聚类 ,选择差异度较大的神经网络作为集成网络的个体 ,网络集成权值还是固定的 ,而且没有研究神经网络生成算法。
An In tegra ted Neura l Net work En sem ble A lgor ithm Ba sed on C luster ing Technology
Q I X in - zhan1 , L IU B ing - jie2 , J I Hai - yan2
(1. Commd. Dep t. Navy Submarine Academy, Q ingdao Shandong 266071, China; 2. M issile Dep t. Navy Submarine Academy, Q ingdao Shandong 266071, China )
2 样本聚类
所谓聚类就是将物理或抽象的集合分组成相似对象组
成的多个类的过程 ,使得同一类中对象间的相似度最大化 , 不同类中的对象间的相似度最小化 [9 ] 。本文将利用模糊聚
类分析对样本分类 , FCM ( Fuzzy C - means) 算法是模糊聚类
分析中最主要的一个 ,其以被证明的最有效的聚类方法之
1 引言
由于神经网络集成 (Neural Network Ensemble, NNE) 在泛化能力上的优良性能以及精度的大幅提高 , NNE 自从 1990年被提出以来 ,得到了众多学者的广泛研究。NNE研究主要集中在三个方面 :如何生成个体神经网络 ,如何集成个体神经网络以及如何确定 NNE的结构。 Zhou[1 ]提出了一种基于遗传算法的选择性 NNE, GASEN , GASEN 利用遗传算法选择差异度大的神经网络 ,而不是将所有的个体神经网络都集成。实验表明这种算法泛化能力和精度都高于普通算法如 Boosting和 Bagging。但是该算法并没有对产生个体神
假设样本被分为 m 类 , 分别为 X1 , X2 , …, Xm , 其中心为 c1 , c2 , …cm ,每一个中心的特征为 ci1 , ci2 , …cik , 注意 , 这里使用的中心特征值是同一类中对象各个特征的中位数 , 而不是经过标准化以后的数据 ,这样可以减少游离数据对特征中心的影响。输入数据为 d = { d1 , d2 , …, dk } , d与各个每一类的距离为 :
摘要 :研究神经网络集成是一种有效实用的分类方法 ,权值是影响神经网络集成性能的重要因素。为了克服神经网络集成固定权值的缺陷 ,提出一种基于聚类分析的综合神经网络集成算法。算法首先将样本分类 ,每类样本中加入其他样本类一定数量的中心样本 ,不同的神经网络学习不同类的样本。根据输入数据与样本类别之间的相关程度自适应调整集成权值。算法不仅用于自适应调整集成权值 ,而且是一种产生个体神经网络的训练方法。四个数据集上的仿真试验证实了算法的有效性。关键词 :神经网络集成 ;聚类分析 ;泛化性能中图分类号 : TP181 文献标识码 : A
)
(4)
2) 求样本之间的模糊相似矩阵 ,有相关系数法和距离表
示法等 ,本文采用后者产生相似矩阵 :
1 d12 … d1 n1… NhomakorabeaD=
(5)
1 dn - 1, 1
1
m
∑ dij =
～
～
| x ik - x jk |
(6)
k =1
D 为对称矩阵 ,其中 dij = dji , dii = 1。
3) 模糊相似矩阵 D ’的形成。由于 D 仅仅满足自反性和
m
∑ V =
w jV i
(9)
j=1
算法的具体步骤如下 :
ABSTRACT:D ifferent component neural networks (NN s) in an ensemble in which different training sets have differ2 ent performance for the same input data. The weights of an ensemble impact greatly on the performance of ensemble. The fixed weights may weaken the performance of some component NN s which can have better performance and lower weights, An Integrated neural network ensemble ( InNNE) is p roposed in the paper, which is an integrated ensemble algorithm not only for dynam ically adjusting weights of an ensemble, but also for generating component NN s based on clustering technology. InNNE classifies the training set into different training subsets w ith clustering technology, which are used to train different component NN s. The weights of an ensemble are adjusted by the correlation of input data and the center of different training subsets. InNNE can increase the diversity of component NN s and decrease generalization error of ensemble. The paper p rovides both the analytical and experimental evidence to support the no2 vel algorithm. KEYW O RD S:Neural network ensemble; Clustering analysis; Generalization performance