改进的大数据分层建树KNN聚类算法

格式：pdf
大小：211.79 KB
文档页数：3

下载文档原格式

大数据十大经典算法kNN讲解

可解释性差
KNN算法的分类结果只依赖于最近邻的样本，缺乏可解释性。
无法处理高维数据
随着维度的增加，数据点之间的距离计算变得复杂，KNN算法在高维空间中的性能会受到影响。
对参数选择敏感
KNN算法中需要选择合适的K值，不同的K值可能会影响分类结果。
04
KNN算法的改进与优化
基于距离度量的优化
与神经网络算法的比较
神经网络算法
神经网络算法是一种监督学习算法，通过训练神经元之间的权重来学习数据的内在规律。神经网络算法在处理大数据集时需要大量的计算资源和时间，因为它的训练过程涉及到复杂的迭代和优化。
KNN算法
KNN算法的训练过程相对简单，不需要进行复杂的迭代和优化。此外，KNN算法对于数据的分布和规模不敏感，因此在处理不同规模和分布的数据集时具有较好的鲁棒性。
对数据分布不敏感
KNN算法对数据的分布不敏感，因此对于非线性问题也有较好的分类效果。
简单直观
KNN算法原理简单，实现直观，易于理解。
分类准确度高
基于实例的学习通常比基于规则或判别式的学习更为准确。
对异常值不敏感
由于KNN基于实例的学习方式，异常值对分类结果影响较小。
缺点
计算量大
KNN算法需要计算样本与所有数据点之间的距离，因此在大规模数据集上计算量较大。
欧氏距离
适用于数据特征呈正态分布的情况，但在非线性可分数据上表现不佳。
余弦相似度
适用于高维稀疏数据，能够处理非线性可分问题。
曼哈顿距离
适用于网格结构的数据，但在高维数据上计算量大。
皮尔逊相关系数
适用于衡量两组数据之间的线性关系。
K值选择策略的优化

改进的层次k均值聚类算法

改进的层次k均值聚类算法K-means聚类算法是一种基于距离的无监督学习算法，它在数据挖掘和机器学习中广泛应用。

然而，传统的K-means算法存在着一些问题，特别是在处理大规模数据、噪声数据和高维数据方面表现欠佳。

为了解决这些问题，研究人员提出了许多改进的K-means聚类算法。

改进的层次K-means聚类算法是一种比传统K-means更有效的聚类算法之一。

它通过增加层次结构的方式在多个层次进行聚类，能够对复杂数据结构和噪声数据进行更好的处理。

以下是改进的层次K-means聚类算法的特点及其优点：1. 增加层次结构改进的K-means聚类算法通过增加层次结构，在不同层次上进行聚类，能够更好地处理具有复杂结构的数据。

在每个层次中，数据被分为更小的聚类中心，每个聚类中心代表一个数据点的集合。

然后，将这些聚类中心看作新的数据点，再在下一个层次中重复这个过程。

通过这种方式，能够生成具有不同层次的聚类结果。

2. 非独立性噪声数据处理传统的K-means算法无法有效地处理非独立性噪声数据，这种数据可能会对聚类结果造成影响。

改进的层次K-means聚类算法通过使用权重和距离函数处理非独立性噪声数据。

具体来说，对于每个数据点，根据其与其他数据点的距离和它的权重计算它的新的聚类中心。

这种方式能够使非独立性噪声数据对聚类结果的影响降到最低，提高聚类准确率。

3. 处理大规模数据传统的K-means算法在处理大规模数据时效率低下，需要大量时间和计算资源。

改进的层次K-means聚类算法通过数据分区和并行处理技术能够更好地处理大规模数据。

具体来说，将数据分为小的块，在不同的处理器上并行处理。

这种方式能够减少计算时间，提高效率。

4. 多样性聚类结果改进的层次K-means聚类算法能够生成多样性的聚类结果，这种结果能够更好地反映数据的不同特征和结构。

在不同的层次上进行聚类，能够得到不同的聚类结果，这些结果代表了数据的不同方面。

常见的聚类方法及应用

常见的聚类方法及应用常见的聚类方法有层次聚类、K-means聚类、DBSCAN聚类和密度聚类。

层次聚类（Hierarchical clustering）是一种自下而上或自上而下的聚类方法。

这种方法通过划分数据集来构建聚类树，然后根据树的分支情况划分簇。

层次聚类方法有两种：凝聚性（Agglomerative）和分裂性（Divisive）。

凝聚性层次聚类是自下而上的方法，首先将每个样本看作一个簇，然后逐步合并相似的簇，直到形成一个大簇。

而分裂性层次聚类则是自上而下的方法，首先将所有样本看作一个大簇，然后逐步将大簇分割成更小的簇，直到每个样本都成为一个簇。

层次聚类方法的应用包括文本聚类、图像聚类和生物学数据分析等方面。

K-means聚类是一种基于划分的聚类方法。

这种方法将数据集划分为K个簇，每个簇包含与之最相似的数据点。

K-means聚类的过程分为两个步骤：选择初始质心和迭代优化。

选择初始质心可以用多种方法，比如随机选择或根据数据分布选择。

迭代优化通过计算数据点到簇质心的距离，并将每个点分配到最接近的质心，然后更新质心的位置，直到质心位置不再变化或达到预设迭代次数。

K-means聚类的应用包括图像分割、推荐系统和市场分析等方面。

DBSCAN聚类（Density-Based Spatial Clustering of Applications with Noise）是一种基于密度的聚类方法。

这种方法将数据点分为核心点、边界点和噪声点。

核心点是一个密度可达的点，即在以该点为圆心，以一定半径内至少包含最小样本数的区域内有足够的样本点。

边界点是在以核心点为圆心，以一定半径内包含小于最小样本数的样本点。

噪声点是既不是核心点也不是边界点的点。

DBSCAN聚类的过程是通过寻找核心点的相邻点和扩展密度直达的样本点，从而形成一个簇。

DBSCAN聚类的应用包括异常检测、土壤学分析和客户细分等方面。

密度聚类（Density-based clustering）是一种基于样本密度的聚类方法。

改进的KNN算法及其在医学图像处理中的应用

ｏｔｎｄｂ —ｍａｓｌｓｒｇａｏｔｍ，ａｇｒｅ８ｔｉｉｇｓｐｅ．ＩａｄｔｎｅｒＫＮｍｔｏｓａｐｉ，ｂａｅｙｋｅｕｔｎｇｒｉｎｃｅｉｌｉｈｒｒａｄｄ８ａｎａｌｅｅｒｎｍｓｎｄｉｏ，ｂｆｅＮｅｈｄｉｐｌｄｉｏｅ
维普资讯
泰
பைடு நூலகம்
山
医学
院
学
报
ＪＯＵＲＮＡＬＳＯＦＴＡＩＨＡＮＭＥＣＡＬＣＯＬＥＧＥＶｏ．７Ｎｏ６２０ＤＩＬ１２．０６
改进的ＫＮ算法及其在医学图像处理中的应用Ｎ
王清，马华，孙静，韩忠东
（ｃｏｌｆｎｏｔｎＥｇｅｒｇＴｉａｄｃｌｏｅｅＴｉｎ２１１Ｓｈｏｆｒｉｎｉｅｎ，ａｈｎＭｅｉｌｇ，ａａ７０６）ｏＩｍａｏｎｉｓａＣｌ
ＡｓａｔＯｃｖ：ｅｇｅｃｒｓｎｎｅ（ｂｔｃ：￣ｅｆｅｗｈｎｍａｎｔｅｏａｃＭＲ）ｉｇｓａｅｍｎｅｙｋ—ｎａｓｎｉｂｒ（Ｎｌｇ— ｒｉｉｍａｅｒｓｇｅｔｂｅｄｅｒｔｅｈｏＫＮ）ａｏｅｉｇ
Ｍｏｉｅ —ＮＮｌｏｉｍｎｔｐｉａｉｎｔｅｉａｍａｅＰｏｅｓｎｄｆｄＫ－ｉａｇｒｔｈａｄＩｓＡｐｌｔｏＭｄｃｌＩｇｒｃｓｉｇｃｏ
ＷＮ垤，ＡＨａＳＮｉ，／ＮＺｏｇ一ｇＡＧＱＭｕ，ＵＪｎ／ｈｎ幽凡ｇＡ

基于DBSCAN聚类的改进KNN文本分类算法

在类的类别权重，把归人到相似度最大的类别中。ＫＮＮ算法的具体步骤如下：（１）根据训练文本最终特征集合，将训练文本
表示为向量空间中的特征向量；
科
学
技
术
与
工
程
１３卷
（２）将待分类文本表示为和训练文本一致的
特征向量ｄ；
中图法分类号
ＴＰ３９１．１１；
文献标志码
Ａ
文本自动分类技术是实现文本数据组织与检索的有效手段，在提高文本数据利用的有效性和准确性方面具有重要的现实意义和广泛的应用前景，
Ｉ＞Ｍｉｎｐｔｓ，则称为核心对象。只包含核心对象
的集合称为核心样本集，记作ｋｅｒ（Ｄ）。
定义３直接密度可达。给定邻域半径和最少样本数Ｍｉｎｐｔｓ（Ｍｉｎｐｔｓ＞０），当：
选择对聚类结果有较大的影响，它对于噪声数据比
较敏感，少量的该类数据将会对平均值产生比较大的影响。本文主要是针对利用ｋ－ｍｅａｎｓ聚类算法实现样本裁剪的不足，提出了一种基于ＤＢＳＣＡＮ算法
的ＫＮＮ文本分文本分类方法主要包括决策树、Ｋ最近邻（ＫＮＮ）、关联规则、支持向量机（ＳＶＭ）、贝叶斯算法（Ｂａｙｅｓ）、神经网络、粗糙集等。其中基于向量空间

大数据十大经典算法kNN讲解PPT

KNN算法的缺陷
观察下面的例子，我们看到，对于位置样本X，通过KNN算法，我们显然可以得到X应属于红点，但对于位置样本Y，通过KNN算法我们似乎得到了Y应属于蓝点的结论，而这个结论直观来看并没有说服力。
KNN算法的具体实现
由上面的例子可见：该算法在分类时有个重要的不足是，当样本不平衡时，即：一个类的样本容量很大，而其他类样本数量很小时，很有可能导致当输入一个未知样本时，该样本的K个邻居中大数量类的样本占多数。但是这类样本并不接近目标样本，而数量小的这类样本很靠近目标样本。这个时候，我们有理由认为该位置样本属于数量小的样本所属的一类，但是，KNN却不关心这个问题，它只关心哪类样本的数量最多，而不去把距离远近考虑在内，因此，我们可以采用权值的方法来改进。和该样本距离小的邻居权值大，和该样本距离大的邻居权值则相对较小，由此，将距离远近的因素也考虑在内，避免因一个样本过大导致误判的情况。
KNN算法的缺陷
从算法实现的过程大家可以发现，该算法存两个严重的问题，第一个是需要存储全部的训练样本，第二个是需要进行繁重的距离计算量。对此，提出以下应对策略。
KNN算法的改进：分组快速搜索近邻法
其基本思想是：将样本集按近邻关系分解成组，给出每组质心的位置，以质心作为代表点，和未知样本计算距离，选出距离最近的一个或若干个组，再在组的范围内应用一般的knn算法。由于并不是将未知样本与所有样本计算距离，故该改进算法可以减少计算量，但并不能减少存储量。
问题：有一个未知形状X(图中绿色的圆点)，如何判断X是什么形状?
K-最近邻算法
显然，通过上面的例子我们可以明显发现最近邻算法的缺陷——对噪声数据过于敏感，为了解决这个问题，我们可以可以把位置样本周边的多个最近样本计算在内，扩大参与决策的样本量，以避免个别数据直接决定决策结果。由此，我们引进K-最近邻算法。

基于冗余度的KNN训练样本裁剪新算法

基于冗余度的KNN训练样本裁剪新算法王子旗; 何锦雯; 蒋良孝【期刊名称】《《计算机工程与应用》》【年(卷),期】2019(055)022【总页数】6页(P40-45)【关键词】KNN分类器; 样本裁剪; 快速分类; 类不平衡【作者】王子旗; 何锦雯; 蒋良孝【作者单位】中国地质大学(武汉)计算机学院武汉 430074【正文语种】中文【中图分类】TP3911 引言随着信息时代的迅猛发展，海量数据生成、积累，对数据进行快速分类、处理显得尤为关键。

数据挖掘技术在大数据的背景下应运而生。

在现有的数据挖掘技术中，常见的分类方法包括支持向量机[1]、决策树[2]、贝叶斯网络[3]、人工神经网络[4]、K-近邻算法（K-Nearest-Neighbor，KNN）[5]等。

其中，KNN 作为一种非参数、无需训练时间、简单高效的算法，最初被用于解决文本分类问题，后来被广泛应用于模式识别的各个领域，并且取得了很好的效果。

KNN分类器的基本思想是寻找在特征空间中与待测样本特征距离最小的k 个训练样本，并将待测样本最终分类到k 个训练样本中具有优势数量的类中。

然而，作为一种基于实例的懒惰学习方法，KNN 分类器需要存储全部训练样本，并且在分类时需要计算待测样本与全部训练样本之间的特征距离并按距离进行排序，这意味着KNN分类器的分类时间复杂度将随着训练样本数或特征维度的增加而急剧上升。

另外，因训练样本的类分布不均匀而导致的类不平衡问题也会影响分类性能。

目前，针对KNN 分类效率的改进方法大致可以分为两类：第一类是采用快速搜索方法，通过提高搜索速度直接提高KNN分类效率[6-7]，如Zhong的G-Tree算法[8-9]、Deng的基于聚类加速的KNN改进算法[10]和Xie的Simba（SpatialIn-Memory Big Data Analysis）算法[11]。

另一类是精简训练样本数量或特征维度。

精简特征维度主要采用特征选择或特征抽取的方式。

knn算法的用法

knn算法的用法一、引言K近邻算法（K-NearestNeighbors，简称KNN）是一种基于实例的学习算法，它广泛用于分类和回归问题。

KNN算法以其简单、直观且易于理解的特点，在许多领域得到了广泛应用。

本文将详细介绍KNN算法的原理、应用场景、参数设置以及优缺点，帮助读者更好地理解和应用该算法。

二、KNN算法原理KNN算法的基本思想是通过比较待分类项与已知样本集中的每个样本的距离，找出与待分类项距离最近的K个样本。

根据这K个样本的类别，对待分类项进行预测。

最终，待分类项的类别是由这K个样本中最常见的类别决定。

三、KNN算法的应用场景KNN算法适用于以下场景：1.分类问题：KNN算法可以应用于各种分类问题，如文本分类、图像分类、生物信息学中的基因分类等。

2.回归问题：KNN算法也可以应用于回归问题，如房价预测、股票价格预测等。

3.异常检测：通过比较待分类项与已知样本集的距离，KNN算法可以用于异常检测，识别出与正常样本显著不同的数据点。

四、KNN算法参数设置KNN算法的参数包括：1.K值：确定近邻数，影响算法的准确度和计算复杂度。

过小的K 值可能会导致漏检，而过大的K值可能会导致误检。

需要根据实际问题进行尝试和调整。

2.距离度量方法：KNN算法支持多种距离度量方法，如欧氏距离、曼哈顿距离等。

选择合适的距离度量方法对于算法的性能至关重要。

3.权重策略：在计算待分类项的近邻时，不同的样本可能具有不同的权重。

常见的权重策略包括按照样本出现次数加权、按照距离加权等。

合适的权重策略可以提高算法的准确度和鲁棒性。

五、KNN算法优缺点优点：1.简单易实现：KNN算法实现简单，易于理解和应用。

2.对异常值和噪声具有鲁棒性：KNN算法对异常值和噪声具有较强的鲁棒性，可以有效地处理这些问题。

3.无需大量的参数调优：与其他机器学习算法相比，KNN算法的参数较少，无需进行复杂的参数调优。

缺点：1.对大数据处理能力有限：KNN算法的计算复杂度较高，尤其是在大规模数据集上，处理速度较慢。

knn算法介绍与参数调优

KNN算法介绍与参数调优K近邻法(k-nearest neighbors,KNN)是一种很基本的机器学习方法了，在我们平常的生活中也会不自主的应用。

比如，我们判断一个人的人品，只需要观察他来往最密切的几个人的人品好坏就可以得出了。

这里就运用了KNN的思想。

KNN方法既可以做分类，也可以做回归，这点和决策树算法相同。

KNN做回归和分类的主要区别在于最后做预测时候的决策方式不同。

KNN做分类预测时，一般是选择多数表决法，即训练集里和预测的样本特征最近的K个样本，预测为里面有最多类别数的类别。

而KNN 做回归时，一般是选择平均法，即最近的K个样本的样本输出的平均值作为回归预测值。

由于两者区别不大，虽然本文主要是讲解KNN的分类方法，但思想对KNN的回归方法也适用。

由于scikit-learn里只使用了蛮力实现(brute-force)，KD树实现(KDTree)和球树(BallTree)实现，本文只讨论这几种算法的实现原理。

1. KNN算法三要素KNN算法我们主要要考虑三个重要的要素，对于固定的训练集，只要这三点确定了，算法的预测方式也就决定了。

这三个最终的要素是k值的选取，距离度量的方式和分类决策规则。

对于分类决策规则，一般都是使用前面提到的多数表决法。

所以我们重点是关注与k值的选择和距离的度量方式。

对于k值的选择，没有一个固定的经验，一般根据样本的分布，选择一个较小的值，可以通过交叉验证选择一个合适的k值。

选择较小的k值，就相当于用较小的领域中的训练实例进行预测，训练误差会减小，只有与输入实例较近或相似的训练实例才会对预测结果起作用，与此同时带来的问题是泛化误差会增大，换句话说，K值的减小就意味着整体模型变得复杂，容易发生过拟合；选择较大的k值，就相当于用较大领域中的训练实例进行预测，其优点是可以减少泛化误差，但缺点是训练误差会增大。

这时候，与输入实例较远（不相似的）训练实例也会对预测器作用，使预测发生错误，且K值的增大就意味着整体的模型变得简单。

基于FLANN改进的KNN医疗分类算法

基于FLANN改进的KNN医疗分类算法
郭凯;艾菊梅
【期刊名称】《计算机与现代化》
【年(卷),期】2022()8
【摘要】本文通过研究KNN(K-最近邻)算法在疾病预测领域的使用与分析,总结出KNN的2点不足,针对不足进行相应改进并提出F_KNN(循环最近邻搜索)算法:1)
针对KNN计算量大、效率低下的缺点,本文采用FLANN(快速最近邻搜索)循环搜
索与待测样本距离最近的点,记录若干个最近邻点作为最近邻点子集,利用此子集取
代全集对待测样本进行计算,可以降低计算量,极大地提高了KNN算法效率;2)针对KNN难以对高维数据集分类的缺点,本文采用AHP(层次分析法)对样本的特征属性进行相关性研究,使用合适的参数分配权重,提高了KNN算法准确率。

本文采用一
组脑中风数据集对优化后的算法进行实验,实验结果表明,F_KNN准确率达96.2%。

与传统KNN相比,F_KNN提高了分类性能且极大地提高了算法效率。

在处理高维
且较大的数据集时,F_KNN算法优势明显,具有较好的应用前景。

【总页数】6页(P25-29)
【作者】郭凯;艾菊梅
【作者单位】东华理工大学信息工程学院
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于健康医疗大数据的KNN分类算法研究
2.基于类别特征改进的KNN短文本分类算法
3.基于聚类改进的Fisher与KNN判别分类算法对比研究
4.基于改进K-modes聚类的KNN分类算法
5.基于高斯函数的改进KNN分类算法研究
因版权原因，仅展示原文概要，查看原文内容请购买。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

ｃａｌｃｌｕｓｔｅｒｃｏｒｅｖｅｃｔｏｒｍａｃｈｉｎｅｂａｓｅｄｄａｔａ．Ｕｓｉｎｇｆｏｕｒｂｉｎａｒｙｔｒｅｅａｌｇｏｉｔｒｈｍｏｆｄａｔａｐｒｅｔｒｅａｔｍｅｎｔｏｎｍｕｌｔｉｄｉｍｅｎｓｉｏｎａｌｄａｔａ，ｔｈｅｃｌｕｓｔｅｉｒｎｇｃｅｎｔｅｒｏｆｔｈｅｃｅｎｔｒｌａｒｅｇｉｏｎｏｆｔｈｅＫＮＮｅｘｔｅｎｓｉｏｎｐｒｏｃｅｓｓｉｎｇ，ａｃｃｏｒｄｉｎｇｔｏｔｈｅｋｉｎｄｏｆｃｒｏｓｓｄｏｍａｉｎｏｆｂｉｇｄａ — ｔａｆｏｒａｃｏｒｅｖｅｃｔｏｒｍａｃｈｉｎｅｄｉｆｆｅｒｅｎｔｉａｌｃｏｍｐａｒｉｓｏｎ，ｇｅｔｔｈｅＫＮＮｆｕｚｚｙｐａｔｉｒｔｉｏｎｍａｔｒｉｘ，ａｃｃｏｒｄｉｎｇｔｏｔｈｅｃａｔｅｇｏｒｙｆｏｔｈｅ
关键词：大数据；分层建树；聚类算法
中图分类号：ＴＰ３９１文献标识码：Ａ文章编号：１００ｌ一７１１９（２０１５）０８ — ０１２９ — ０３
ＩｍｐｒｏｖｅｄＬａｒｇｅＤａｔａＳｔｒａｔｉｉｃｆａｔｉｏｎＣｏｎｔｒｉｂｕｔｉｏｎＫＮＮＣｌｕｓｔｅｒｉｎｇＡｌｇｏｒｉｔｈｍ
第３１卷第８期
２０１５年８月
科技通报
ＢＵＬＬＥＴＩＮＯＦＳＣ１ＥＮＣＥＡＮＤＴＥＣＨＮＯＬＯＧＹ
Ｖｏ１．３１Ｎｏ．８
Ａｕｇ．２０１５
改进的大数据分层建树ＫＮＮ聚类算法
牛耕
（陕西警官职业学院警察技术系，西安７１００４３）
Ｎ／ｕＧｅ
（ＴｈｅＰｏｌｉｃｅＴｅｃｈｎｏｌｏｇｙＤｅｐａｒｔｍｅｎｔ，ＳｈａａｎｘｉＰｏｌｉｃｅＡｃａｄｅｍｙ，Ｘｉａｎ７１００４３，Ｃｈｉｎａ）
摘
要：对大数据的分层建树聚类，提高对大数据的检测和大数据应用系统的故障分析能力。传统方
法中对大数据的分层聚类采用Ｋ — Ｍｅａｎｓ聚类算法，容易陷入局部收敛，聚类效果不好。提出一种基于核向量机的数据的分层建树聚类。采用四叉树算法对多维数据进行数据预处理，进行ＫＮＮ中心区域的聚类中心扩展处理，针对大数据的类域交叉性进行了一次核向量机差分比较，得到ＫＮＮ模糊划分矩
ａｎｄｄａｔａａｐｐｌｉｃａｔｉｏｎｓｙｓｔｅｍ．Ｋ— Ｍｅａｎｓｃｌｕｓｔｅｉｎｒｇａｌｇｏｉｒｔｈｍａｎｄｈｉｅｒａｒｃｈｉｃｌａｃｌｕｓｔｅｒｉｎｇｆｏｒｌａｒｇｅｄａｔａｂｙｕｓｉｎｇｔｈｅｔｒａｄｉｔｉｏｎ —
Ａｂｓｔｒａｃｔ：ｏｎｔｈｅｓｔｒａｔｉｉｆｅｄｄａｔａｃｌｕｓｔｅｒｉｎｇａｎａｌｙｓｉｓｏｆａｃｈｉｅｖｅｍｅｎｔｓ，ｉｍｐｒｏｖｅｔｈｅｃａｐａｂｉｌｉｔｙｏｆｆａｕｌｔｄｅｔｅｃｔｉｏｎｆｏｒｌａｒｇｅｄａｔａ
阵，根据所属类别的不同对已知样本进行分层，得到一维差分分层建树模型和二维差分分层建树似度特征，实现矩阵的数据点数模糊集合贴近度填充，实现聚类算法改进。仿真结果表明，该算法具有优越的大数据聚类性能，收敛性好，应用到网络在线故障诊断中，实现对故障信号的和恢复跟踪，提高了故障诊断效益，展示了较好的应用价值。
ｌａｍｅｔｈｏｄ，ｉｓｅａｓｙｔｏｆａｌｌｉｎｔｏｌｏｃａｌｃｏｎｖｅｒｇｅｎｃｅ，ｃｌｕｓｔｅｒｉｎｇｅｆｆｅｃｔｉｓｎｏｔｇｏｏｄ．Ｐｕｔｆｏｒｗａｒｄａｋｉｎｄｏｆｃｏｎｔｉｒｂｕｔｉｏｎｏｆｈｉｅｒａｒｃｈｉ —