K-中心点聚类算法优化模型的仿真研究

格式：pdf
大小：293.91 KB
文档页数：4

下载文档原格式

一种改进的K-均值聚类算法的研究

传统的Ｋ均值聚类算法＿采用的相似性度量通常是欧几里德距离的倒数（氏距离）ｌ欧，也就是说两
者的距离越小表示两者的相似性越大，反之则相似性越小。这种传统的Ｋ均值聚类算法基于样本间的一距离，具有简单、快速并且能够有效地处理大数据库的优点。但是，这种算法存在一个明显的缺点，即采用均值作为一类的代表点，一个点往往不能充分反映该类的模式分布结构，从而损失了很多有用的信
一
种改进的Ｋ一值聚类算法的研究均
王圆妹（长江大学电子信息学院，湖北荆州４４３３０）２
［要］聚类分祈在科研和商业应用中都有着非常重要的怍用。Ｋ均值聚类算法是一种基于样本间相似性摘一
１核函数距离
为了能将模式集划分为不同的类别，必须定义一种相似性的度量，即同一类样本间的类似性和不属：一样本间的差异性。在聚类分析中，常采用的距离有绝对值距离、切比雪夫距离、欧几里德距离、Ｆ一明考夫斯基距离和马哈拉诺比斯距离等等一。但在运用过程中有如下个问题：① 模式各特征分量的量
维普资讯
长江大学学报（自科版）２０年１０６２月第３第４理工卷卷期Ｊｕｎｌｆａｇｚｎｖｒｉ（ａｃＥｉｏｒａｏｎｔｅＵｉｅｔＮｔｉｄｔＹｓｙＳ）Ｄｃ２０．Ｖ１ｏ４ＳｉＥｇｅ．０６ｏ．Ｎ．ｃ＆ｎ３Ｖ

K均值优化算法综述

K均值优化算法综述K均值算法是一种经典的聚类算法，它是一种基于距离的聚类算法，利用数据点之间的距离来进行聚类分析。

K均值算法一般用于将数据点分成K个簇，其中K是一个预先指定的参数。

K均值算法在数据挖掘、模式识别、图像处理等领域都有着广泛的应用。

本文将对K均值算法进行综述，重点介绍K均值算法的优化方法及其应用。

一、K均值算法原理K均值算法的原理比较简单，主要包括初始化、簇分配、更新簇中心三个步骤。

1. 初始化：首先需要确定簇的个数K，然后随机选择K个样本点作为初始的簇中心。

2. 簇分配：将每个数据点分配到距离其最近的簇中心所在的簇。

3. 更新簇中心：计算每个簇中所有数据点的均值，将均值作为新的簇中心。

重复进行簇分配和更新簇中心的步骤，直到簇中心的位置不再发生变化，算法收敛。

二、K均值算法优化方法虽然K均值算法具有简单、易实现等优点，但也存在一些缺点，比如初始簇中心的选择会对聚类结果产生影响；算法对噪声和异常值较为敏感；收敛到局部最优解等问题。

为了提高K均值算法的聚类效果，研究者们提出了许多的算法优化方法。

1. 优化初始簇中心的选择初始簇中心的选择对K均值算法的聚类效果有很大的影响，一种常用的方法是在样本中随机选择K个点作为初始的簇中心。

还有一些更加有效的初始簇中心选择方法，比如K 均值++算法、K均值||算法等。

2. 对异常值和噪声的处理K均值算法对噪声和异常值较为敏感，这些异常值会对最终的聚类结果产生较大的影响。

为了提高算法的鲁棒性，可以采用一些方法来处理异常值，比如在进行簇分配时，距离大于某个阈值的点可以认为是异常值，可以将这些点剔除再进行聚类。

3. 收敛到全局最优解K均值算法由于初始点的选取不同，可能会收敛到不同的局部最优解，而不是全局最优解。

研究者们提出了一些启发式的方法来解决这个问题，比如多次运行K均值算法，选择最优的聚类结果；或者使用一些局部搜索策略，如模拟退火算法、遗传算法等方法。

1. 数据挖掘在数据挖掘领域，K均值算法常用于对大量的数据进行分类和分析。

【计算机应用研究】_k-means聚类算法_期刊发文热词逐年推荐_20140725

科研热词聚类遗传算法资源查找节点关联度网格维数约简神经网络社团结构样本生成数据挖掘恢复机制对等系统复杂网络协同过滤动态模型分类主成分分析不均衡数据集 k-means聚类算法 k-means聚类 k-means算法
推荐指数 4 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2012年序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77
2011年科研热词推荐指数基于密度 3 聚类 2 类间距离 2 类内距离 2 k-均值聚类 2 k-均值算法 2 k-means算法 2 k-means 2 高斯性测度 1 长码直扩信号 1 迭代收敛 1 软件可靠性模型:k-means聚类 1 跳频 1 超球 1 视频检索 1 视觉词袋 1 规则化距离 1 蚁群聚类 1 自适应 1 能量均衡 1 群体智能 1 置信半径 1 粗糙集 1 粒平群优化 1 粒子群 1 粒子对 1 盲恢复 1 特征融合 1 特征基因 1 物体识别 1 点对点技术 1 游程检验 1 混合聚类 1 混合算法 1 流形学习 1 模型选择 1 极值优化算法 1 有监督的k-均值聚类算法 1 有界坐标系统 1 最大距离积 1 最大最小距离 1 显著区域 1 无线传感器网络 1 文本 1 整体相似度 1 数据挖掘 1 支撑向量机 1 支持向量机 1 形态学处理 1 属性依赖度 1 局部密度 1 局部切空间排列法 1

基于模拟退火算法对K-means聚类算法的优化

通常ｋ “ ｎ且ｔ “ ｎ。
在聚类时该算法的不足也表现明显，聚类结果通常对应于目标函数的极值点，由于目标函数可能存在很多的局部极
计算目标函数差一判断是否接受一接受或舍 ’ 的迭代，并逐步衰减ｔ值，算法终止时的当前解即为所得近似最优解［２－３】。
一
小值点，这就会导致算法在局部极小值点收敛。而且该算法
对‘ 噪声 ’ 和孤立点敏感，极个别的孤立点往往对聚类结果产生很大影响。最终的聚类结果依赖于最初的划分，而且需要
事先指定聚类的数。
本文介绍了Ｋ．ｍｅａｎｓ聚类算法的目标函数、算法思想、
关键词：数据挖掘；聚类算法；Ｋ．ｍｅａｎｓ聚类算法；模拟退火算法
ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１６７１ — ６３９６．２０１３．０６．０１２
１引言
Ｋ．ｍｅａｎｓ聚类算法是由Ｌｌｏｙｄ１９５７年、Ｂａｌｌ＆Ｈａｌｌ１９６５年、Ｓｔｅｉｎｈａｕｓ１９５５年、ＭｃＱｕｅｅｎ１９６７年分别在各自不同的
２．２Ｋ－ｍｅａｎｓ聚类算法流程
（１）随机选定ｋ个对象作为初始的聚类中心。（２）通过计算每个数据点到各个聚类中心的欧式距离Ｄ（Ｓ），将每个对象赋给最近的类。（３）更新聚类中心，重新计算每个类中数据点的平均值作为新的聚类中心，计算所有数据点到其所在类别中心的距

基于模拟退火算法对K-means聚类算法的优化

基于模拟退火算法对K-means聚类算法的优化
刘寒梅;张鹏
【期刊名称】《中国西部科技》
【年(卷),期】2013(000)006
【摘要】K-means 聚类算法是近年来数据挖掘学科的一个研究热点和重点，该算法是基于划分的聚类分析算法。

目前这种算法在聚类分析中得到了广泛应用。

本文将介绍K-means聚类算法的主要思想，及其优缺点。

针对该算法经常陷入局部最优，以及对孤立点敏感等缺点，提出了一种基于模拟退火算法的方法对其进行优化，可以有效地防止该算法陷入局部最优的情况。

【总页数】3页(P23-24,71)
【作者】刘寒梅;张鹏
【作者单位】长春工业大学计算机科学与信息工程学院，吉林长春 130012;长春
工业大学计算机科学与信息工程学院，吉林长春 130012
【正文语种】中文
【相关文献】
1.基于K-means聚类算法优化方法的研究 [J], 刘叶;吴晟;周海河;吴兴蛟;韩林峄
2.基于CUDA并行化的K-Means聚类算法优化 [J], 丁芙蓉;张功萱
3.基于混沌理论与蝗虫优化K-means聚类算法的电抗器铁芯和绕组松动状态监测[J], 侯鹏飞;马宏忠;吴金利;张俊杰
4.基于灰狼优化K-means聚类算法的公交地铁换乘效率评价方法 [J], 韩丽东
5.基于优化初始聚类中心的K-means聚类算法 [J], 郭文娟
因版权原因，仅展示原文概要，查看原文内容请购买。

K均值优化算法综述

K均值优化算法综述K均值优化算法是一种常用的聚类算法，通过不断迭代优化来确定数据集内的聚类。

本文将对K均值优化算法进行综述，介绍其原理、优缺点以及应用领域，旨在帮助读者更全面地了解和理解这一算法。

一、K均值优化算法原理K均值优化算法是一种迭代优化聚类的方法，其目的是将数据集划分为K个不同的簇。

其主要步骤如下：1. 初始化：随机选择K个数据点作为初始的簇中心。

2. 分配：将每个数据点分配到距离最近的簇中心所在的簇。

3. 更新：计算每个簇的新中心，即将该簇内所有数据点的均值作为新的簇中心。

4. 重复：重复执行步骤2和步骤3，直到簇中心不再发生变化，或者达到预设的迭代次数。

通过反复迭代更新簇中心的位置，K均值优化算法能够不断优化每个簇的形状和大小，使得簇内的数据点之间的差异最小化，从而实现对数据集的聚类。

二、K均值优化算法优缺点1. 优点：（1）简单易实现：K均值优化算法的思想相对简单，易于理解和实现。

（2）计算速度快：算法复杂度较低，适用于大规模数据集的聚类。

（3）能够处理各种形状的簇：K均值优化算法对于不规则形状的簇也能够较好地进行聚类。

2. 缺点：（1）需要预先确定簇的个数K：K均值优化算法在执行前需要确定簇的个数K，而现实中很多情况下并不清楚应该选择多少个簇。

（2）对初始值敏感：簇中心的初始值对于聚类结果有较大影响，选择不当可能导致得到不理想的聚类结果。

（3）对噪声敏感：K均值优化算法对噪声数据比较敏感，可能会影响最终的聚类结果。

三、K均值优化算法应用领域K均值优化算法在实际应用中有着广泛的领域，尤其适用于如下场景：1. 无监督学习：K均值优化算法是一种无监督学习方法，不需要事先标注的数据即可进行聚类分析。

2. 数据挖掘：K均值优化算法可应用于数据挖掘领域，结合其他算法可发现数据集内隐藏的模式和规律。

3. 图像分割：K均值优化算法可用于图像分割，将图像中相似的像素点聚类在一起以便于后续处理。

基于密度标准差优化初始聚类中心的k_means改进算法

基于密度标准差优化初始聚类中心的k_means改进算法作者：黄灵王云锋陈光武来源：《电脑知识与技术》2019年第06期摘要：传统k_means算法采用随机法选择初始聚类中心，易造成聚类结果陷入局部最优解和聚类精度低的问题，而且易受孤立点的影响。

为了解决这一问题，提出了一种基于密度标准差优化初始聚类中心的改进算法。

该算法先计算数据集样本的平均值和标准差，接着计算每个数据点的密度分布函数值，然后计算样本的平均密度和密度标准差，若小于密度标准差，则划分为孤立点；搜索密度分布函数值数组中的最大值，那么最大值对应的样本点即为初始聚类中心，并将以初始聚类中心为原点，以样本平均值为半径的圆内各点的密度函数值赋值为0，如此重复，直到找到k个初始聚类中心。

该算法基于Python语言在PyCharm软件平台实现。

实验结果表明，这种基于密度标准差优化初始聚类中心的算法消除了孤立点的影响，具有更高的准确率和更好的聚类结果。

关键词： k_means算法；密度标准差；初始聚类中心；Python中图分类号：TP301 文献标识码：A 文章编号：1009-3044（2019）06-0147-051 引言数据挖掘，又称为数据库知识发现，是从海量的、无规律的、有噪声的数据中，提取出潜在的、对人们有利用价值的信息和知识的过程[1]。

数据挖掘是一门多学科交叉的学问，包括：机器学习、统计、数据库、人工智能、信息检索和可视化[2]。

数据挖掘分析方法包括：分类，估计，预测，相关性分组或关联规则，聚類，复杂数据类型挖掘（Text，Web，图形图像，视频，音频等）。

聚类分析作为数据挖掘领域中常用的数据分析方法，它是数据之间的相似度作为评判事物类别的依据，将具有足够相似度的数据聚为一类，使得同一类簇内数据的相似度尽量大，不同类簇间的数据相似度尽量小[3]。

通过聚类分析，可以发现全部数据对象属性的分布规律，明确数据的整体发展态势。

聚类算法[3-4]可以分为：基于划分的方法，基于层次的方法，基于密度的方法，基于网格的方法，基于模型的方法。

k-中心聚类算法公式

k-中心聚类算法公式K-中心聚类算法是一种迭代求解的聚类分析算法，其方法是随机选取K个对象（点）作为初始的聚类中心，然后计算其他对象（点）与各个聚类中心之间的距离，把每个对象（点）分配给距离它最近的聚类中心。

聚类中心以及分配给它们的对象（点）就代表一个聚类。

各个聚类被分配完后，各个聚类的聚类中心会根据聚类中现有的对象（点）被重新计算。

这个过程将不断重复直到满足某个终止条件。

K-中心聚类算法的公式包括以下步骤：1. 初始化：从数据集中随机选择K个对象作为初始的聚类中心。

2. 分配对象：对于数据集中的每个对象，计算它与各个聚类中心的距离，并将其分配到距离最近的聚类中心。

3. 重新计算聚类中心：根据每个聚类的现有对象，重新计算该聚类的中心点。

这个中心点可以是该聚类中所有对象的平均值或者其他代表性的点。

4. 迭代：重复步骤2和3，直到聚类的中心点不再发生改变或者达到最大的迭代次数。

在计算距离时，通常使用欧几里得距离或者曼哈顿距离等度量方式。

在重新计算聚类中心时，常用的方法包括最小方差法、质心法和簇均值法等。

K-中心聚类算法的主要优点是能够发现任意形状的聚类，并且可以处理噪声和异常值。

但是，它需要预先设定聚类的数量K，并且对初始的聚类中心敏感，容易陷入局部最优解。

此外，当数据集较大或者存在复杂的结构时，K-中心聚类算法可能需要较长的运行时间和较大的空间复杂度。

在实际应用中，K-中心聚类算法可以用于许多领域，如模式识别、图像处理、文本挖掘、社交网络分析等。

它可以单独使用，也可以与其他算法结合使用，例如与层次聚类算法、DBSCAN算法等结合使用可以获得更好的聚类效果。

此外，还有一些改进版本的K-中心聚类算法，如基于密度的K-中心聚类算法、模糊K-中心聚类算法等。

这些算法在处理噪声和异常值、发现任意形状的聚类、避免局部最优解等方面进行了改进，提高了聚类的准确性和稳定性。

总之，K-中心聚类算法是一种常用的聚类分析算法，具有广泛的应用场景和改进空间。

基于K-means聚类算法的青岛房屋分布及价格分析

2021年2月基于聚类算法的青岛房屋分布及价格分析吴正哲（山东科技大学计算机科学与工程学院，山东青岛266590）【摘要】随着大数据时代的到来,互联网已经深深地改变了我们的生活模式。

本文使用Python爬虫技术从青岛链家网二手房网站中抓取招聘信息并清洗;然后利用Python中的matplotlib库,对清洗后的数据进行可视化分析,分析不同类型房屋情况的分布;最后,通过K-means算法和线性回归算法分析青岛房屋的分布与价格,准确得出多个方面的分析数据,起到购房决策辅助作用。

【关键词】K-means;线性回归;数据可视化;机器学习;Python语言;Beautiful Soup技术【中图分类号】G350【文献标识码】A【文章编号】1006-4222（2021）02-0297-020引言“互联网+”时代的到来，增强了房地产经纪业务适应线上、线下场景的产品和服务能力，目前我国房地产经纪业务已经形成O2O的发展格局，未来线上线下渠道将继续加速融合发展。

因此，无论是从带动国民经济发展的角度，还是从满足人民群众基本需求以及开发商投资决策的角度，掌握了解商品住宅价格的变动发展趋势都显得尤为重要。

1相关工作Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库，简单来说，它能将HTML的标签文件解析成树形结构，然后方便地获取到指定标签的对应属性。

爬取网页的内容其实就是先把页面的信息先通过Urllib库抓取到本地，然后再通过Beautiful Soup库精细划分抓取得到的页面内容数据。

K表示聚类个数，读取全部数据之后，随机选取K个数据作为初始聚类中心，然后将剩余数据计算到聚类中心距离并分配到最近的中心簇，并且相应的删除每个聚类中的个数，更新聚类中心。

Means也就是均值，就是每次“选举大会”每个组内由X和Y的平均值组成新的老大，往往是虚拟的。

形成的新簇并不一定是最好的划分，因此生成的新簇中，重新计算每个簇的中心点，然后在重新进行划分，直到每次划分的结果保持不变。

基于蚁群优化K-medoids的变电站特性聚类研究

ｇｌｂｌｅｒｈａａｉｉｙ，ｏｖｒｏｎｇｈｅｏａｓａｃｃｐｂｌｔｅｃｍｉｔＫ— ｄｄｓｌｏｉｍｅｓｌｒｐｐｄｎｏｏａｏｔｍａｍｅｏｉａｇｒｔｈａｉｙｔａｅｉｔｌｃｌｐｉｌｓｏｔｏｉｇｓｉｒｖｄｌｔｒｎａｃｒｃｈｒｃｍｎ，ｍｐｏｅｃｕｓｅｉｇｃｕａｙ．Ｆｉａｌｉａａｙｚｓｔａｓｒｌｒｕｔｔｏｔｅｎｌｙ，ｔｎｌｅｒｎｆｌｅｓｂｓａｉｎｈｏＴｃｒｃｅｉｔｃｌｔｒｎｘｍｐｌｓａｄｒｓｌｓｖｒｆｈｅｓｂｌｔｎｆｅｔｖｎｓｆｔｒｐｅｈａａｔｒｓｉｓｃｕｓｅｉｇｅａｅｎｅｕｔｅｉｙｔｅｆａｉｉｉｙａｄｅｆｃｉｅｅｓｏｐｏｏｓｄｈｅ
研究与开发
基于蚁群优化ｍｅｏｄＫ．ｄｉｓ的变电站特性类研究聚
刘建华孟颖２谭智
４０１；１１４（．沙理工大学电气与信息工程学院，长沙１长
２长沙理工大学计算机与通信工程学院，长沙．
４０１１１４）
摘要为建立合适的变电站负荷模型，将聚类方法引入到变电站负荷特性分析，提出了一种基于蚁群优化Ｋｍｄｉｓ－ｅｏｄ的综合聚类算法。该综合算法是Ｋｍｄｉｓ —ｅｏｄ算法对蚁群的历史最优位置进行聚类分析，蚁群算法全局搜索能力强，克服了Ｋｍｄｉｓ－ｅｏｄ算法易陷入局部最优的缺点，提高了聚类的准确率。最后通过变电站特性聚类实例，验证了综合算法在变电站特性聚类的可行性和有效性。关键词：蚁群优化Ｋｍｄｉｓ－ｅｏｄ；蚁群算法；Ｋｍｄｉｓ算法；负荷特性；聚类分析－ｅｏｄ

对K-means算法初始聚类中心选取的优化

心的选择应该满足两个条件： ①类中心所处位置样本点密度
较高；
① 任意的选取ｋ个样本数据作为
其中应用最多且算法逻辑思维比较初始聚类中心。简单的就是基于Ｋｍａｓ — ｅｎ算法。 ② 把全部混合样本直观地分成ｋ
② 类中心之间的距离应尽可能
簇中对象的平均值（看作簇的重问题的代表点。被
心）来进行。Ｋｍａｓ－ｅｎ算法的处理流
能够找到这些样本并作为初始类中
⑥ 采用遗传算法或者免疫规划心，就能避免ｋｍａｓ — ｅｎ算法因为初始化不合理而出现的种种问题。
知的。那么我们就需要聚类分析中上进行迭代。
分布密度较大。同时，在样本点密
的基于多种不同思想的聚类算法，
２１－ｅｎ算法初值选取的现度连续的范围内，应该只具有一个．ｋｍａｓ聚类中心，否则就会出现两个类交
一
复，直到准则函数收敛。
条线段，这种选取方法可以避免则该样本点对于分类的影响就越
／１．／屯子世界２２３００一１ — １
Ｉ》．探
察………………………．
＝
大。因此，每个样本点都存在一个分布密度，对于每个样本点Ｘ，其
地大。
１６年，ＪＢＭｃｕｅ提出了９７．．ａＱｅｎ类，计算各类均值作为初始聚类中心。
Ｋｍａｓ－ｅｎ算法，是一种基于质心的经

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Ｋ—ｃｎｅｌｏｉｈ，ｉｓｍａｎｄｒｗａｋｓｔａｔｏｅｅｓｔａｅｎｌｃｌｏｉｍｎｈｅｃｍｐｔｎｏｔｉｏｅｔｒａｇｒｔｍｔｉａｂｃｉｈｔｉｆｎｇｔｒｐｐｄｉｏａｐｔｍｕａｄｔｏｕｉｇｃｓｓｔｏｔ
ＢＩｕ．Ｉｈ—ｕＡＪＮＺｉｊｎＸ
（．ＣｌｇｆｈｓｓＳｉｃｎｎｒａｉｎｉｅｉｇＨｂｉｏｍｌｎｖｒｉ，１ｏｅｅｏｙｉｃｎｅａｄＩｆｍｔｎＥｇｅｒ，ｅｅＮｒａＵｉｓｙｌＰｃｅｏｏｎｎｅｔ
ｔｅｈｍｐｏｅｌｏｔｍｓｕｅｉｉｅｔｅｄｔｎｏｄｒｔｎｈｌｓｅｎｅｔｒｎｔｅｅｄｏｉａｅ，ｈｎｔｅｉｒｖｄａｇｒｈｉｓｄｔｄｖｄａａｉｒｅｆｄｔｅｃｕｔｒｇｃｎｅ．Ｉｈｎｆｔｓｐｐｒｉｏｈｏｉｉｈ
ｔａｄｅｓｌｄｔｅｓ，ｉｎｆｔｅｍｏｔｉｏａｔｍｅｈｄ．Ｂｅａｓｔｎｔａａａｃｎｅｓｃｏｅａｏｙｉｏｈｎｌｍａｌａａｓｔｓｏｅｏｈｓｍｐｒｎｔｏｔｃｕｅｉｓｉｉｉｌｄｔｅｔｒｉｈｓｄｒｎｄｍｌｎ
第２卷第１８期
文章编号：０６９４（０１Ｏ — ２８０１０ — ３８２１）１０１ — ４
计
算
机
仿
真 பைடு நூலகம்
２１年１０１月
Ｋ一心点类算法优化模型的仿真研究中聚
白旭，志军靳
（．河北师范大学物理科学与信息工程学院，北石家庄００１２１河５０６；．河北省新型薄膜材料实验室，北石家庄００１河５０６；
速度，省约聚类时间。节
关键词：据挖掘；数聚类；常检测；测率；警率异检误
中图分类号：Ｐ９Ｔ３３
文献标识码：Ａ
ＲｅｅｒｈｏｓａｃｎＯｐｔａｏｅｆＫ — ｅｎｕｔｒｎｇｒｔｍｉｌＭｄｌｏ — ａｓＣｌｓｅｉｇＡｌｏｉｈｍＭ
３．河北省图书馆，北石家庄００１）河５０１
摘要：类分析是数据挖掘的一项关键技术，于大数据集，定聚类中心点集所需的计算时间相当的长，对Ｋ一心算法聚对确针中是一种经典的聚类算法，一心在处理小数据集聚类的的问题时，有良好准确性和伸缩性。但由于Ｋ一心初始中心点Ｋ中具中是随机选取，类过程缓慢，陷入局部极值，类的准确性大大降低。为了提高聚类速度和准确性，出一种改进的快速聚易聚提Ｋ一中心聚类算法。方法首先将训练数据集转换为标准的单位特征度量空间，后将数据先粗划分为ｉ组，对ｉ的ｋ个然ｎ再ｎ组
中心进行聚类找到最优聚类中心，到聚类中心进行聚类并得到最终聚类结果。以网络入侵数据为例对算法进行了验证性找分析，验结果表明，对于基本Ｋ中心聚类算法，实相一在保持相同聚类效果的情况下，速Ｋ中心聚类新算法能够加快聚类快一
３ｅｅＰｏｉｃｉｒｒ，ｈｉｈａｇＨｂｉ５０６Ｃｉ）．ＨｂｉｒｖｅＬｂａＳｉａｕｎｅｅ００１，ｈｎｎｙｊｚａ
ＡＢＴＲＡＣＴ：ｌｓｒｎｎｉｏｔｎｅｅｒｈｄｒｃｉｎａｄｔｅＫ－ｅｔｒａｇｒｈｗｈｃｓｅｆｉｎｎｅｉｌＳＣｕｔｉｇｉａｍｐｒａｔｓａｃｉｔｎｈｃｎｅｌｏｔｍｉｈｉｆｃｅｔｄｆｘｂｅｅｓｒｅｏｉｉａｌ
ｒｔｍｓｐｏｏｅｎｔｓｐｅ．Ｆｉｓｌｉｈｉｒｐｓｄｉｈｉａｐｒｒｔｙ，ｔｅｔａｎｎｇｄｔｅｓｃｎｅｄｔｈｅｓａａｄｕｔｆａｕｅｅｒｃｓｃｈｒｉｉａａｓｔｉｏｖｎｅｏｔｔｎｄｒｎｉｅｔｒｓｍｔｐａｅ，ｉ
ｈｇｒａｅｄｔｓｔｎｏｄｒｏｉｐｏｅｔｅｑａｔｏｉｒｓｎｄｔｃｏ，ｎｉｐｏｅｎｍｌｄｔｔｎａｏｉｈｆｒａａｅ．Ｉｒｅｍｒｖｕｌｙｆｎｕｉｅｔｎａｒｖｄａｏａｙｅｅｉｌ — ｏｌｇｓｔｈｉｔｏｅｉｍｃｏｇ
ＳｉａｈａｇＨｂｉ５０，ｈｎ；ｈｊｚｕｎｅｅ００１Ｃｉｉ６ａ２ｅｅＡｖｎｅｈｉｓＬｂｒｏ，ｈｉｈａｇＨｂｉ５０６Ｃｉ；．ＨｂｉｄａｃｄＴｉＦｌａｏａｒＳｉａｕｎｅｅ００１，ｈｎｎｍｔｙｊｚａ

K-中心点聚类算法优化模型的仿真研究

合集下载

一种改进的K-均值聚类算法的研究

K均值优化算法综述

【计算机应用研究】_k-means聚类算法_期刊发文热词逐年推荐_20140725

基于模拟退火算法对K-means聚类算法的优化

基于模拟退火算法对K-means聚类算法的优化

K均值优化算法综述

基于密度标准差优化初始聚类中心的k_means改进算法

k-中心聚类算法公式

基于K-means聚类算法的青岛房屋分布及价格分析

基于蚁群优化K-medoids的变电站特性聚类研究

对K-means算法初始聚类中心选取的优化

文档推荐

最新文档