通过特征提取和聚类实现对信号分类的研究
- 格式:doc
- 大小:16.00 KB
- 文档页数:3
雷达信号特征提取及分类算法研究随着科技的不断发展,雷达信号在军事、民用等领域得到了广泛应用。
雷达信号具有广阔的应用前景,但是由于其具有一定的复杂性,因此对雷达信号的特征提取及分类算法的研究备受重视。
本文将从以下几个方面对雷达信号的特征提取及分类算法进行探讨。
一、雷达信号特征提取雷达信号的特征提取是雷达信号处理中的重要步骤,通过对雷达信号进行特征提取可以实现雷达信号的识别、定位等目的。
目前,可供选择的雷达信号特征有很多种,常用的有功率谱密度、离散傅里叶变换等。
功率谱密度是一种常用的雷达信号特征,其计算方法简单,能够反映出信号的频率和能量分布。
利用功率谱密度特征可以区分不同类型的雷达目标,例如舰船、机动车等等。
离散傅里叶变换(DFT)是一种利用频谱分析方法对雷达信号进行特征提取的方法。
它可以将时间域信号转换为频域信号,从而得到显著的频谱特征。
DFT能够反映出雷达信号的频率分布情况和脉冲宽度等特征,因此在雷达信号分类中也具有广泛的应用。
除此之外,目前还有一些新型的特征提取方法出现,例如小波变换、矩法等,这些方法正在不断地发展和完善。
二、雷达信号分类算法在对雷达信号进行特征提取之后,如何对雷达信号进行分类也是一个重要的问题。
当前常见的雷达信号分类算法主要分为以下几种:支持向量机(SVM)算法是近年来广泛应用的一种分类算法,该算法具有较高的分类准确率和较小的计算量。
通过训练样本向量和目标向量的构造,模拟出不同的分类面,从而实现分类的目的。
模糊C均值聚类算法(FCM)算法是一种基于聚类的分类方法。
该算法通过计算隶属度矩阵来实现分类,具有较小的计算量和较好的聚类效果。
朴素贝叶斯分类算法(NBC)是一种基于贝叶斯规则的概率分类方法。
该算法假设各个特征之间不存在关联性,计算样本在各个类别下的概率,从而对样本进行分类。
这些算法各有特点,可以根据具体的应用场景和分类需求来选择合适的算法。
三、雷达信号分类应用作为一种高精度、高可靠的探测手段,雷达信号广泛应用于军事、民用等领域。
无监督学习方法在像识别中的特征提取与分类研究无监督学习方法在图像识别中的特征提取与分类研究无监督学习方法在图像识别领域发挥着重要的作用,特别是在特征提取和分类任务上。
本文将对无监督学习方法在图像识别中的特征提取和分类研究进行探讨。
一、引言随着现代科技的发展,图像数据的规模和复杂性不断增加。
传统的监督学习方法依赖于标注好的训练数据,但这在大规模图像数据上往往不切实际。
而无监督学习方法可以从未标注的数据中自动学习有用的特征和结构,因此在图像识别中具有广泛的应用前景。
二、无监督学习方法的特征提取无监督特征学习是指通过学习数据的内在结构和分布来自动发现有用的特征。
在图像识别中,常见的无监督学习方法包括自编码器、生成对抗网络和聚类算法等。
1. 自编码器自编码器是一种无监督学习的神经网络模型,通过将输入数据进行编码和解码,可以学习到数据的低维表示。
在图像识别中,自编码器可以用于从图像中提取有用的特征。
通过训练自编码器,可以得到图像的稀疏表示,这些稀疏表示可以用于后续的分类任务。
2. 生成对抗网络生成对抗网络(GAN)是一种由生成器和判别器组成的对抗性框架。
生成器负责生成伪造的图像,而判别器负责判断生成的图像是否真实。
通过不断迭代,生成器和判别器可以相互博弈,最终生成逼真的图像。
在实际应用中,生成对抗网络可以用于学习图像的潜在空间,进而提取有用的特征。
3. 聚类算法聚类算法是将数据集划分成若干个互不重叠的子集,使得同一子集中的数据更加相似。
在图像识别中,聚类算法可以用于将图像分组,从而找到图像的共同特征。
常见的聚类算法包括K均值算法、谱聚类算法等。
三、无监督学习方法的分类研究除了特征提取,无监督学习方法在图像识别中的分类任务上也有广泛的应用。
无监督学习方法可以通过学习数据的潜在分布和结构,对图像进行分类。
1. 概率图模型概率图模型是一种用于描述变量之间概率关系的有向或无向图。
在图像识别中,概率图模型可以用于图像分类。
人体肌电信号的特征提取与分类算法研究近年来,人体肌电信号在生物医学领域中的应用越来越广泛。
肌电信号本身是人体肌肉无意识的微弱电信号,可以通过电极采集到,然后通过对其特征的提取和分析,可以对肌肉的运动状态、疾病诊断、运动员的体能评估等方面进行研究。
本文将对人体肌电信号的特征提取与分类算法进行探讨。
一、人体肌电信号的特征提取1.1 时域特征肌电信号的时域特征指的是肌电信号在时间维度上的特性,反映了肌肉电活动的总体变化情况。
主要包括肌电信号的均方根(RMS)、方差、标准差和平均值等指标。
其中,RMS是最常用的特征之一,能够反映信号的总体强度。
对于某些疾病的诊断以及运动员的体能评估,RMS是一项非常有价值的特征。
1.2 频域特征肌电信号的频域特征可以通过傅里叶变换获得。
它们反映了肌肉电活动的频率分布情况,包括功率谱、能量谱密度、频率分布等指标。
频域特征的应用范围较广,运动员表现、肌肉疲劳等方面的研究都有应用。
1.3 时频域特征时频域特征是时域和频域特征的结合体,可以反映信号在时间和频率上的变化情况。
常用的时频域特征包括小波能量、瞬时频率、拍数等指标。
时频域特征是一种比较新的肌电信号特征提取方法,具有较好的应用前景。
二、人体肌电信号的分类算法2.1 支持向量机(SVM)SVM是一种常用的分类算法,它能够有效地处理高维数据,并在分类问题中表现出良好的效果。
在肌电信号分类中,SVM算法常常被用来区分运动与静息状态,或者区分不同动作之间的肌肉电活动模式。
2.2 随机森林(RF)随机森林是一种基于决策树的分类算法。
随机森林不需要数据预处理,而且可以处理大量、高维度数据。
在肌电信号分类中,随机森林可以用于区分不同动作类型或不同运动阶段的肌肉电活动模式。
2.3 人工神经网络(ANN)人工神经网络是一种模拟人脑神经网络结构的模型。
它具有很强的非线性处理能力,可以自适应地学习和处理复杂的信息。
在肌电信号分类中,ANN可以用于肌肉疲劳的监测、动作类型的识别等方面。
多模态信号特征提取和识别算法研究随着信息技术和人工智能的快速发展,多模态信号的处理和分析已经成为了一个热门的研究方向。
多模态信号通常指来自不同传感器或传感器数组的信号,比如图像、语音、视频、生物电等等。
多模态信号通常包含大量的信息,需要经过专门的特征提取和识别算法才能被有效的利用。
本文主要就多模态信号特征提取和识别算法的研究进行探讨。
一、多模态信号特征提取算法多模态信号特征提取是多模态识别的关键环节,它旨在将原始信号处理成有意义的特征向量,以便于后续的分类和识别。
通常,特征提取方法可以分为时间域、频域、时频域和小波变换等几个方面进行。
1、时间域特征提取时间域特征提取方法将信号转换到时域,通过时间轴或波形提取信号特征。
比如:均值、方差、标准差、平均功率和自相关函数等。
时间域特征提取算法简单,易于使用,但存在信噪比低和无法分辨信号细节等问题。
2、频域特征提取频域特征提取方法将信号转换到频域,通过频域分析提取信号特征。
比如:傅里叶变换、短时傅里叶变换和快速傅里叶变换等。
频域分析可以分析信号的频率和相位信息,但过多的频域维数负面影响分类性能和计算效率。
3、时频域特征提取时频域特征提取方法将信号转换到时频域,通过时频分析提取信号特征。
比如:连续小波变换和离散小波变换等。
时频分析能同时提取信号的时间和频率信息,能有效防止时域和频域方法的局限性,但计算量较大。
4、小波变换特征提取小波变换特征提取方法将信号通过小波基函数分解为多个分量的线性组合,提取每个分量的特征向量。
小波变换是一种非局部、信号分辨率分层和多分辨率分析的信号处理方法,能提取信号的时-频特征,在处理信号时可有效的抑制噪声干扰。
二、多模态信号识别算法多模态信号识别算法是通过对多模态信号特征进行聚类、分类等方法进行识别。
识别算法有许多,例如支持向量机(SVM)、人工神经网络(ANN)、朴素贝叶斯分类(Naive Bayes)、隐马尔可夫模型(HMM)和决策树分类等。
机械系统的振动信号识别与分类机械系统的振动信号是一种重要的检测和分析手段,广泛应用于工业生产、设备维修、结构安全评估等领域。
振动信号可以包含丰富的信息,通过对其进行识别和分类,可以帮助人们了解机械系统的运行状态、健康状况以及可能存在的故障和隐患。
本文将探讨机械系统振动信号的识别与分类方法,并介绍其在实际应用中的意义和挑战。
一、振动信号的特征提取机械系统的振动信号包含了丰富的信息,如频率、振幅、相位等。
为了对振动信号进行识别和分类,首先需要提取振动信号的特征。
常用的特征提取方法包括时域分析、频域分析和时频域分析。
时域分析主要通过计算信号的均值、方差、峰值等统计量,得到信号的时域特征。
频域分析则是将信号转换到频域,计算信号的频谱特征,如功率谱密度、频率分量等。
时频域分析则结合了时域和频域的特征,可以得到信号在时间和频率上的变化情况。
二、振动信号分类方法振动信号的分类是指将不同特征的振动信号归类到不同组别或状态中。
常见的分类方法包括有监督学习和无监督学习。
有监督学习是指依据已知类别的样本数据,通过建立分类模型对新样本进行分类。
常用的有监督学习算法包括支持向量机、决策树、神经网络等。
无监督学习则是对振动信号进行聚类分析,将具有相似特征的信号分为一类。
常用的无监督学习算法包括K-means聚类、层次聚类等。
三、振动信号识别与故障诊断振动信号的识别与故障诊断是指通过分析振动信号的特征,判断机械系统是否存在故障或隐患,并确定故障类型和位置。
振动信号的识别与故障诊断可以帮助人们及时采取维修措施,减少生产事故和停机损失。
例如,对于旋转机械来说,不同的故障类型会产生不同的振动频率特征,通过分析频谱特征可以判断故障的类型,如轴承故障、不平衡、失衡等。
同时,故障诊断还可以根据振动信号的幅值变化和相位变化,确定故障位置,指导具体的维修措施。
四、振动信号识别与分类的应用机械系统的振动信号识别与分类在工业生产中有着广泛的应用。
多媒体信息处理与分析技术研究随着信息技术的飞速发展和多媒体数据的大量产生,对多媒体信息处理与分析技术的研究日益重要。
多媒体信息处理与分析技术是指通过对多媒体数据进行特征提取、数据挖掘、模式识别等技术手段的研究和应用,以实现对多媒体信息的理解、检索、分类、分析等目的。
本文将介绍多媒体信息处理与分析技术的研究现状和应用领域,并探讨未来的发展趋势。
一、多媒体信息处理的研究现状1.特征提取技术多媒体信息处理的第一步是对多媒体数据进行特征提取。
常见的多媒体特征包括颜色、纹理、形状、运动等。
目前,研究人员提出了许多基于统计学、机器学习等方法的特征提取算法,如主成分分析(PCA)、局部二值模式(LBP)、深度卷积神经网络(CNN)等。
这些算法可以从多个角度对多媒体数据进行全面的特征提取,为后续的处理和分析打下基础。
2.数据挖掘与知识发现多媒体信息处理与分析的关键在于如何从海量的数据中提取有价值的信息。
数据挖掘技术通过自动发现数据中的模式、规律和关联,可实现对多媒体数据的知识发现。
常用的数据挖掘方法包括关联规则挖掘、聚类分析、分类算法等。
通过数据挖掘技术,可以发现多媒体数据中隐藏的关系和规律,为进一步的分析和应用提供依据。
3.模式识别与分类技术多媒体信息处理与分析的重要任务之一是对多媒体数据进行分类和识别。
模式识别技术通过建立数学或统计模型,实现对多媒体数据的自动分类和识别。
常见的模式识别方法包括支持向量机(SVM)、朴素贝叶斯分类器、人工神经网络等。
这些算法可以从特征向量中学习出分类模型,并对未知样本进行自动分类,实现对多媒体数据的智能化处理。
二、多媒体信息处理与分析的应用领域1.多媒体检索与推荐多媒体信息处理与分析技术在多媒体检索和推荐系统中发挥着重要作用。
通过对多媒体数据进行特征提取和相似度计算,可以实现对多媒体数据的高效检索。
同时,利用用户行为和兴趣模型,还可以实现个性化的多媒体推荐。
多媒体检索和推荐系统广泛应用于图像检索、音乐推荐、视频搜索等领域。
基于聚类算法的文本分类研究文本分类是自然语言处理领域的重要研究方向之一。
它的基本任务是将给定的文本分成不同的类别,这对信息检索、舆情分析、垃圾邮件过滤等应用具有重要意义。
随着社交媒体和互联网技术的不断发展,海量文本数据也不断涌现,如何高效、准确地对这些文本进行分类成为了研究的热点之一。
本文主要探讨基于聚类算法的文本分类研究。
聚类算法是一种常见的无监督学习算法,在数据挖掘、模式识别等领域得到广泛应用。
在文本分类中,聚类算法可以通过自动对数据集进行分组,找到数据点间的相似性,从而实现文本的自动分类。
一、文本分类的基本方法文本分类的基本方法通常分为两种:有监督学习和无监督学习。
有监督学习指的是,需要预先定义好分类的标签和特征,在已知数据集的情况下,通过机器学习算法让机器学习分类的规则,从而对未知数据进行预测。
常见的有监督学习算法有朴素贝叶斯、支持向量机、决策树等。
无监督学习则不需要预先定义标签和特征,它可以自动从未分类的数据中发现类别以及类间关系。
常见的无监督学习算法包括聚类、主题模型、关联规则挖掘等。
在文本分类中,有监督学习需要人工定义分类标签和特征,需要大量的标注数据和专业知识,难度较大。
而无监督学习可以自动、高效地对文本进行分类,不需要先验标签,更加适合大规模、多样化的文本分类任务。
因此,聚类算法也成为了文本分类中常用的无监督算法之一。
二、聚类算法的基本原理聚类算法是一种经典的无监督学习算法,它的基本思想是将数据分成有意义的组或簇。
在文本分类中,聚类算法可以自动发现文本数据集中的不同主题或类别,从而实现文本的自动分类。
聚类算法包括层次聚类和划分聚类两种类型。
层次聚类是一种自底向上的聚合方法,常见的算法有凝聚层次聚类(AGNES)和分裂层次聚类(DIANA)等。
划分聚类是一种自顶向下的划分方法,常见的算法有K-Means、DBSCAN、谱聚类等。
在聚类算法中,距离度量是关键的因素之一。
距离度量常用的有欧式距离、余弦相似度、曼哈顿距离等。
高光谱遥感图像的特征提取和分类算法探究遥感技术已经成为了现代地球科学中不可或缺的一部分,这种技术通过对地球表面的各种信息进行多波段、多角度、多时相的采集和处理,可以形成一系列高分辨率遥感图像。
其中,高光谱遥感图像是一种获取地表物质高光谱信息的遥感技术,这种技术可以获取大量的物质光谱信息,为我们研究地球科学和环境变化提供了重要的数据来源。
在高光谱遥感图像中,物质对不同波长的电磁辐射的反射和吸收的不同程度是其与众不同的特性。
由于不同的物质对不同波段的辐射产生的反应不同,固有光谱和在远距离上的高光谱遥感图像可以很好地区分不同物质。
在高光谱遥感图像研究中,特征提取和分类算法是研究的两个重要方面。
因此,本篇文章将探讨高光谱遥感图像的特征提取和分类算法的研究进展和应用现状。
一、特征提取在高光谱遥感图像中,特征提取是一项至关重要的技术。
特征提取的主要任务是将高光谱遥感图像中每个像元的光谱信息转化成低维空间的特征,以减少信息冗余和处理量,同时保留物体空间分布和分类信息。
常用的特征提取方法包括如下几种。
1. 主成分分析(PCA)PCA是一种线性变换的方法,可以将高维空间中的数据降维到低维度的特征空间。
在高光谱遥感图像中,PCA方法可以对数据矩阵进行特征值分解,得到协方差矩阵的主特征向量。
这些主成分可以描述遥感图像的大部分空间信息,对于多波段数据的降维处理非常有效。
2. 独立成分分析(ICA)ICA是一种非线性变换的方法,可以将遥感图像中的光谱信息进行分离和隔离,从而得到更加明确的光谱信息。
在高光谱遥感图像中,ICA可以对数据矩阵进行特征值分解,找到可以独立分离的成分。
这些成分可以帮助我们更好地理解高光谱遥感图像中的光谱结构,并提高物体检测和分类的准确率。
3. 小波变换(WT)WT是一种非平稳信号的频域分析方法,可以用于多尺度分析和特征提取。
在高光谱遥感图像中,WT可以将数据矩阵分解为一组小波系数,这些系数可以反映不同尺度下的物体信息。
模式识别技术在信号处理中的应用信号处理是将原始信号转换为更加可读和易于分析的形式的一种技术。
而在信号处理中,模式识别技术作为一种重要的手段,可以用于寻找和识别信号中的某些特征,进而实现对信号的有效处理。
一、模式识别技术概述模式识别技术是指通过对已知模式进行学习和分析,从而能够对新模式进行认知和识别的过程。
在现代信息处理中,模式识别技术已经广泛应用于图像处理、声音识别、生物信息学、机器学习等多个领域。
而在信号处理中,模式识别技术能够有效实现对信号的分类、聚类和特征提取,从而提高了信号的分析效率和判断准确率。
二、模式识别技术在信号分类中的应用信号分类是指将原始信号根据某些特定的属性或标准进行划分和分类的过程。
而在信号分类中,模式识别技术可以通过对信号的特征进行提取和分析,实现对信号进行分类和识别的目的。
例如,在语音处理中,人们可以通过采集和录音,获取到语言信号,并通过模式识别技术实现对信号的分类。
其中,可以通过获取语言信号的高频和低频分量,来区分不同的语音信号;也可以通过特征提取,将信号的频域、时域和能量等特征参数提取出来,并通过分类算法实现对不同语音信号的识别和分类。
三、模式识别技术在信号聚类中的应用信号聚类是指将信号数据根据一些特定的相似度或聚类算法进行分组和聚类的过程。
而在信号聚类中,模式识别技术可以通过对信号的特征向量进行构造和计算,从而实现信号聚类和分类的目的。
例如,在人脸识别中,可以采用PCA(Principal Component Analysis)方法对人脸图像进行特征提取,然后通过K-means算法实现对人脸图像的聚类。
而在这个过程中,模式识别技术可以自动地学习和分析人脸图像的特征向量,并通过聚类算法实现一组相似人脸图像的分类和聚合。
四、模式识别技术在信号特征提取中的应用信号特征提取是指从信号数据中提取出具有特殊意义和代表性的数据特征,从而实现对信号的处理和分析的过程。
而在信号特征提取中,模式识别技术可以通过自动化的方法,将信号的各种数学特征和物理特性进行提取和分析,从而实现对信号的特征表述和分析。
恶意代码中的特征提取技术及分类算法研究随着互联网的快速发展,计算机病毒、木马病毒、蠕虫病毒等恶意代码也越来越复杂,危害也越来越大。
这些病毒不仅能窃取用户隐私,窃取账号密码,还能破坏用户的计算机系统,甚至造成不可挽回的损失。
这些恶意代码的特征提取和分类算法研究是计算机安全领域的重要研究方向。
一、恶意代码中的特征提取技术在计算机病毒的检测与防御中,特征提取就显得格外重要。
特征提取是将样本数据转化为计算机能够处理的数值型数据的过程,能够为分类器提供较为稳定的输入数据,从而提升检测和分类的准确率。
1. 静态特征提取:静态特征提取是在程序或文件未被执行的情况下,通过对样本文件的分析,提取其特征并进行分类。
其主要针对的是病毒文件的结构特征,例如文件头、代码段、数据段、注释等。
但是随着恶意代码技术的发展,通过对代码的混淆、加密等技术,使得静态特征提取变得越来越困难。
2. 动态特征提取:动态特征提取是在程序或文件被执行时,通过检测程序的行为特征,提取样本文件的特征并进行分类。
其主要针对的是病毒文件的行为特征,例如病毒启动、文件创建、网络连接等。
相较于静态特征提取,动态特征提取的准确率更高。
3. 混合特征提取:为了提高特征提取的准确率,许多学者将静态特征提取和动态特征提取相结合,即混合特征提取。
混合特征提取综合了两种技术的优点,能够有效地提高特征提取的准确率。
二、恶意代码的分类算法恶意代码分类算法是将恶意代码样本数据划分到对应的恶意类型中,可分为监督学习算法和非监督学习算法。
1. 监督学习算法:监督学习算法是通过数据集训练得到一个分类模型,根据该模型对新的样本进行分类。
根据训练集和测试集的区分,监督学习算法可分为分类算法和回归算法。
常见的监督学习算法有:决策树、贝叶斯分类器、支持向量机和神经网络等。
2. 非监督学习算法:非监督学习算法是不依赖于已有标签数据进行分类,而是通过对数据集进行聚类,得到分类结构。
常见的非监督学习算法有:K-Means聚类、DBSCAN聚类和谱聚类等。
通过特征提取和聚类实现对信号分类的研究作者:姜世文韩智旭林笑
来源:《中国科技博览》2018年第14期
[摘要]信息化战争背景下,如何在复杂的电磁空间中识别有效信号,以展开信息侦察行动是掌握战场主动权的关键。
信号识别就是对通信辐射源辐射的有效信号进行研究、分析、处理和分类。
本文通过对采集到的电磁信号进行时域和频域的分析研究,提取变换域下的信号特征参数,运用k-means聚类算法完成对信号的分类。
[关键词]k-means聚类傅里叶变换辐射源特征参数提取
中图分类号:S201 文献标识码:A 文章编号:1009-914X(2018)14-0271-02
1 引言
在日趋复杂的电磁环境下识别有效信号,通过对采集到的通信辐射源信号离散数据进行作图和分析,从中提取特征值,利用k-means聚类算法,实现一般通信信号的分类。
这对从海量信号中提取有用信息,提高信息作战侦察和通信对抗能力,保证在未来战争中情报信息的获取与利用,掌握战争的主动权具有重要价值和意义。
通信信号属于模拟信号,一般分析方法主要是基于不同变换域的波形进行分析,主要是时域分析法和频域分析法,现有的模拟信号分类方法主要是根据其时域和频域的波形图,进行对比、分析和判断,将其分为调幅(AM)信号、双边带(DSB)信号、单边带(SSB)信号和调频(FM)信号。
本文研究的方法是在时域波形图和频域波形图的基础上,提取信号的特征参数,通过应用k-means算法建立模型,对分析得到的特征值进行聚类,从而实现通信信号的分类。
2 信号特征的提取
通信信号的分析方法主要有时域分析法和频域分析法,我们可以基于信号的时域波形图,通过傅里叶变换,得到其频谱图。
对信号的时域波形图和频谱图进行分析,是通信辐射源信号分类和识别的最重要依据。
下图是利用Matlab作出的某个辐射源信号在时域和频域的展示图:
在进行时域分析时,分类的依据是时域波形图的基本特征,也就是峰-峰值(最大值与最小值的差)、标准差、极大值、极小值等时域波形特征,提取其特征参数;同样,在进行频域分析时,首先对信号样本进行傅里叶变换得到频谱图,再分析并提取其载波频率、能量谱密
度、峰尖等基本频域特征参数;除此之外,还可以通过对信号进行相关变换和特征降维来得到信号的细微特征,这对于相似信号更精细的区分是很有必要的。
3 基于k-means算法的聚类模型
要实现对信号的分类,我们对分层集群、k-means聚类、光谱集群、光谱嵌入集群、支持向量聚类、最大边缘聚类初始化独立集群等聚类算法进行研究和分析,认为对信号特征值聚类最有效、准确、快速的方法是k-means聚类算法。
k-means聚类算法是一种典型的硬聚类算法,同时也是一种最为典型的基于所建的目标函数聚类方法,它是数据点到所选的聚类中心之间的距离这个因素作为优化的目标函数,利用函数求极值的这个方法,然后通过迭代运算的这种方式来调整最后运算的结果。
k-means算法是一种典型的基于两点之间距离的聚类算法,其相似性的评价指标是通过距离的大小来进行判定的,即认为如果两个对象之间的距离越近,其相似度就越大,反之其次。
该算法认为距离靠近的对象组成特定的簇,因而把最后得到的紧凑且独立的簇作为最终要获得的目标。
k-means算法以数据集中两个元素之间的欧式距离作为相似度,它是求对应某一初始聚类中心做最优良的分类,使得聚类效果最好,准确度最高。
其处理流程如下:
1)从含有n个数据对象的数据库中任意选择K个对象作为初始聚类的中心;
2)根据每个需要聚类的对象位置,计算这些对象到这些中心对象之间的距离;并根据得到的最小距离来重新对相应对象进行归类和划分;
3)重新计算每个有变化的对象到其他中心之间的距离;
4)循环2)和3)两个过程直到每个聚类对象都不再发生变化为止。
k-means算法接受输入的中心数量K;然后将具有n个数据对象的数据库划分为k个聚类以便获得所需要的聚类结果。
根据k-means算法的原理,我们建立如下的模型:
min V=
式中,V代表着一个簇的距离之和,si为i类样本总数,xj是其中一个数据,ui为i类的中心。
根据k-means算法得到k个聚类的运算过程如图2:
基于k-means算法的原理,建立聚类模型,以信号特征值为基本元素,通过对特征值聚类、整理和归纳,从而实现信号的分类。
4 算例
我们采集了5种通信辐射源的侦测接收信号r_n(采样频率均为f_s=1.01MHz)的500个信号样本,下面利用本文提出的方法进行信号分类研究。
1)样本信号的特征参数提取
通过对500种信号进行时域和频率的分析,结合有关通信和信号专业知识,我们选取了5种对波形影响较大的典型特征,分别是时域的峰-峰值、标准差,以及频域的载波频率、能量谱密度、峰尖等五项指标作为将要提取的特征参数。
针对这500样本信号,我们提取的特征值如表1。
2)信号的分类
特征值提取完成后,对其进行聚类分析。
我们根据提出的聚类模型的建立方法,对提取到的特征值进行k-means算法聚类,对这500个信号样本进行的k-means算法聚类的成效图如图3:
通过运算,将500个样本信号分成了5种信号,聚类的结果如表2:
由聚类结果看,五类信号各不相同,每种信号都各有特点且特征明显,分为同一种样本信号的波形图的相似程度高,特征值也大致相近。
每类信号的时域和频域例图如图4:
由上图可以更直观地看出五类信号源在峰-峰值、载频、能量等方面的区别,每一类信号的特征值都有其大致地取值范围,说明此聚类算法可以很好地实现信号的分类。
5 结束语
通过本文的方法,对信号源辐射的信号进行分类,在民用和军事领域有很高的研究价值与意义。
尤其在信息化作战中,通过对敌信号源辐射的信号进行分类,进而有针对性地对敌重要通信源进行监视、识别、干扰或打击,将对敌方通信网、指挥信息系统和指挥部造成极大地威胁,为夺取制信息权、打赢现代化信息化战争提供重要技术和理论支持。
参考文献
[1] 张宪超.《数据聚类》M.科学出版社,2017.6.。