子空间聚类Sparse Subspace Clustering SSC
- 格式:doc
- 大小:49.00 KB
- 文档页数:2
基于多级结构的深度子空间聚类方法作者:***来源:《现代信息科技》2022年第06期摘要:提出了一种新的深度子空间聚类方法,使用了卷积自编码器将输入图像转换为位于线性子空间上的表示。
通过结合自编码器提取的低阶和高阶信息来促进特征学习过程,在编码器的不同层级生成多组自我表示和信息表示。
将得到的多级信息融合得到统一的系数矩阵并用于后续的聚类。
通过多组实验验证了上述创新的有效性,在三个经典数据集:Coil20,ORL 和Extended Yale B上,聚类精度分别达到95.38%、87.25%以及97.58%。
相较于其他主流方法,能有效提高聚类准确性,并具有较强的鲁棒性。
关键词:子空间聚类;多级结构;自编码器中图分类号:TP181 文献标识码:A文章编号:2096-4706(2022)06-0100-04Deep Subspace Clustering Method Based on the Multi-level StructureYU Wanrong(School of Artificial Intelligence and Computer Science, Jiangnan University, Wuxi 214122, China)Abstract: A new deep subspace clustering method that uses a convolutional autoencoder to transform an input image into a representation that lies on a linear subspace is proposed. The feature learning process is facilitated by combining low-order and high-order information extracted by the autoencoders, and multiple sets of self-representations and information representations are generated at different levels of the encoder. The obtained multi-level information is fused to obtain a unified coefficient matrix and use it for subsequent clustering. The effectiveness of the above innovations is verified through multiple experiments on three classic datasets, including Coil20, ORL and Extended Yale B. And the clustering accuracies reach 95.38%, 87.25% and 97.58% respectively.Compared with other mainstream methods, this method can effectively improve the clustering accuracy and it has strong robustness.Keywords: subspace clustering; multi-level structure; autoencoder0 引言高維数据处理已成为机器学习和模式识别领域具有代表性的任务之一。
空间序列低秩稀疏子空间聚类算法作者:由从哲舒振球范洪辉来源:《江苏理工学院学报》2020年第04期摘要:研究序列数据的子空间聚类问题,具体来说,给定从一组序列子空间中提取的数据,任务是将这些数据划分为不同的不相交组。
基于表示的子空间聚类算法,如SSC和LRR 算法,很好地解决了高维数据的聚类问题,但是,这类算法是针对一般数据集进行开发的,并没有考虑序列数据的特性,即相邻帧序列的样本具有一定的相似性。
针对这一问题,提出了一种新的低秩稀疏空间子空间聚类方法(Low Rank and Sparse Spatial Subspace Clustering for Sequential Data,LRS3C)。
该算法寻找序列数据矩阵的稀疏低秩表示,并根据序列数据的特性,在目标函数中引入一个惩罚项来加强近邻数据样本的相似性。
提出的LRS3C算法充分利用空间序列数据的时空信息,提高了聚类的准确率。
在人工数据集、视频序列数据集和人脸图像数据集上的实验表明:提出的方法LRS3C与传统子空间聚类算法相比具有较好的性能。
关键词:低秩表示;稀疏表示;子空间聚类;序列数据中图分类号:TP391.4 文献标识码:A 文献标识码:2095-7394(2020)04-0078-08序列数据特别是视频数据往往具有高维属性,利用传统聚类算法进行分析处理时,往往会遇到“维数灾难”的问题,于是研究人员提出了一系列基于表示的子空间聚类算法,如稀疏表示子空间聚类算法(SSC)和低秩表示算法(LRR),较好地解决了高维数据聚类的问题,从而得到了广泛的关注,并在众多领域得到成功的应用。
但是,这类算法是针对一般数据集设计开发的,在许多实际场景中,数据通常具有顺序或有序的属性,例如视频、动画或其他类型的时间序列数据。
然而,传统的方法假设数据点独立于多个子空间,而忽略了时间序列数据中的连续关系。
如何充分利用空间序列数据这一特性提高聚类性能,是计算机视觉领域中一个重要但又具有挑战性的问题。
子空间聚类概述
子空间聚类是一种在高维数据中发现隐含的低维子空间结构的聚类方法。
与传统的聚类算法不同,子空间聚类考虑到了数据在不同的属性子空间中可能具有不同的聚类结构。
它将数据投影到不同的子空间中进行聚类分析,以发现数据在各个子空间中的聚类特征。
子空间聚类算法通常具有以下步骤:
1. 子空间选择:选择要进行聚类的属性子空间。
可以通过特征选择、主成分分析等方法来选择合适的子空间。
2. 子空间投影:将数据投影到选择的子空间中,得到在每个子空间中的投影结果。
3. 聚类分析:在每个子空间中使用传统的聚类算法(如
k-means、DBSCAN等)进行聚类分析,得到每个子空间中的聚类结果。
4. 融合聚类结果:将各个子空间中的聚类结果进行融合,得到最终的聚类结果。
子空间聚类的优势在于可以处理高维数据中存在的低维子空间结构,能够更好地挖掘数据的潜在模式和关联信息。
它适用于许多领域,如图像处理、文本挖掘、生物信息学等。
然而,子空间聚类也面临着一些挑战,如选择合适的子空间、处理噪音和异常值等问题,需要根据具体应用场景进行算法选择和参数调优。