基于核函数的学习算法

格式：ppt
大小：872.50 KB
文档页数：39

下载文档原格式

基于各向异性核函数的均值漂移跟踪算法

ｎｉｈｏｈｏ，ａｅｎａｐｉｏｏｃｔａｋｎ．ｗｖｒｗｉｈｈｎｉｇｓｒｃｕｅｏｂｅｔｉｉｅｅｂｒｏｄｈｓｂｅｐｌｄｔｎｅｔｒｉｇＨｏｅｅ，ｔｔｅｃａｇｎｔｕｔｒｆｏｊｃｎｖｄｏｇｅｃｈｓｑｅｃｓｒｄｔｎｌｍｅｎｓｉｒｋｒｂｓｔｏｉｋｒｅｏｔｎｌｓｓｔｅｏｊｃ，ｅｐｃａｌｅｂｅｔｅｕｎｅ，ｔａｉｏａｉａｈｆｔａｅｙｉｒｐｃｅｎｌｆｏｅｈｂｅｔｓｅｉｙｗｈｎｏｊｃｔｃｏｅｌｓｒｃｕｅｖｒｓａｔＴｈｓａｅｌｎｓｂｅｔｒｋｎｔｎｓｔｏｉｋｒｅｍｅｎｓｉｉｅｈｐ，ｔｕｔｒａｉ．ｉｐｐｒｍｐｅｅｆｓｉｍｅｔｊｃａｉｇｗｉａｉｒｐｃｅｎｌａｆｉｗｈｃｔａｅｏｔｃｈｏｈｔｎｈｈｓｓａｅａｄｏｉｎａｉｎｏｅｅｎｌａａｔｏｔｅｈｎｉｇｏｊｃｒｃｕｅＴｈｇｒｈｅｓｒｓｒｋｎｂｓｃｌ，ｒｔｔｆｈｒｅｐａｇｎｂｅｔｔｕｔｒ．ｅｏｉｍｕｅａｉｇｒｕｔｎｅｏｔｋｓｄｔｈｃｓｌａｔｎｔｃｏ
２基于各向同性核函数的均值漂移跟踪算法及其
性和鲁棒性。实验结果证明该算法是有效的。关键词：目标跟踪；均值漂移；各向异性核函数；模板匹配
中图分类号：ＴＮ９９８１．
文献标识码：Ａ
文献标识码：１０．８６２０）３０８．４０９５９（０７０ —６６０

核聚类算法

核聚类算法核聚类算法是一种基于核函数的聚类方法。

与传统聚类方法不同的是，核聚类算法不需要预先确定聚类的数目，而是通过核函数将数据映射到高维空间中，再在高维空间中进行聚类。

核聚类算法可以解决传统聚类算法中的一些问题。

传统聚类算法需要预先确定聚类的数目，但在实际情况下，聚类的数目往往是不确定的。

此外，传统聚类算法对数据的分布形状有一定的要求，如果数据的分布形状不符合聚类算法的要求，将会导致聚类结果不准确。

而核聚类算法通过将数据映射到高维空间中，可以使得数据在高维空间中呈现出线性可分的特征，从而解决了传统聚类算法中的一些问题。

核聚类算法的核心是核函数。

核函数是一种能够将数据映射到高维空间中的函数。

常用的核函数有线性核函数、多项式核函数、高斯核函数等。

其中，高斯核函数是最常用的核函数之一。

高斯核函数可以将数据映射到无限维的高维空间中，从而使得数据在高维空间中呈现出非线性可分的特征。

核聚类算法的步骤如下：1.选择核函数。

常用的核函数有线性核函数、多项式核函数、高斯核函数等。

2.计算核矩阵。

将数据映射到高维空间中后，可以得到一个新的数据集。

将新的数据集计算出来的两两之间的核函数值组成一个核矩阵。

3.进行聚类。

对核矩阵进行聚类，可以得到聚类结果。

其中，常用的聚类方法有谱聚类、基于密度的聚类等。

核聚类算法具有一定的优点和缺点。

其优点是能够处理高维数据和非线性数据，并且不需要预先确定聚类的数目。

其缺点是计算复杂度高，需要大量的计算资源。

在实际应用中，核聚类算法被广泛应用于图像分析、文本分析、生物信息学等领域。

在图像分析中，核聚类算法可以用于图像分割和图像分类。

在文本分析中，核聚类算法可以用于文本聚类和文本分类。

在生物信息学中，核聚类算法可以用于基因表达数据的聚类和分类。

核聚类算法是一种基于核函数的聚类方法，能够处理高维数据和非线性数据，不需要预先确定聚类的数目，被广泛应用于图像分析、文本分析、生物信息学等领域。

基于核函数的支持向量机样本选取算法

（．Ｓｈｏｆｏｕｅｃｅｃ，ＳｕｈＣｈｎｒｌｉｅｓｙ１ｃｏｌｍｐｔｒｉｎｅｏｔｉａｏＣＳＮｏｍａＵｎｖｒｉ，Ｇｕｎｚｏ６ｔａｇｈｕ５３，Ｃｈｎ；１１０ｉａ２ｎｏａｉｎＴｃｎｌｇｅｅｒｈＩｓｉｔ，ＪｎｎＵｎｖｒｉ，Ｇｕｎｚｏ１０５ｈｎ）．ＩｆｒｔｅｈｏｏｙＲｓａｃｔｕｅｉａｉｅｓｙｍｏｎｔｔａｇｈｕ５０７，Ｃｉａ
样本时所需空间及时间开销，高支持向量机分类效率与质量，提出了一种基于核函数的样本选取算法。该算法通过选取提
最大可能成为支持向量的样本，以达到减少训练时存储Ｈｅｓｎ矩阵所需空间及时间开销的目的。实验结果表明，ｓａｉ该算法所
摘要：用支持向量机求解大规模数据分类需要较大内存来存储Ｈｅｓｎ矩阵，矩阵的大小则依赖于样本数，因此在一使ｓｉａ而，
定程度上导致支持向量机分类效率及质量难以提高考虑到只有成为支持向量的样本才对决策函数起作用，了减少训练为
ＡｂｔａｔＵｓｇｓｐｏｔｅｔｒｃｉｅｏｖｒｅｓａｅｄｔｌｓｉｃｔｎｎｅｓａｈｒｒｍｏｙｔｔｒｓｉｎｍａｒｏｅｓｒｃ：ｉｐｒｖｃｏｎｕｍａｈｎｓｏｓｌｅａｇ — ｃｌａａａｓｆａｉｅｄｔｅｔｌｃｉｏｒｍｏｅｍｅｒｓｅｏｏＨｅｓｔｉｗｈｓａｘ

数据分析知识：数据挖掘中的监督学习和无监督学习

数据分析知识：数据挖掘中的监督学习和无监督学习在数据分析领域，数据挖掘技术被广泛运用于从数据中挖掘出有意义的信息和规律，以帮助企业和个人做出更明智的决策。

而数据挖掘主要分为监督学习和无监督学习两种方式。

本文将详细介绍这两种学习方式的概念、算法、应用场景和优缺点。

一、监督学习监督学习是指基于已知结果的数据样本，通过建立一个映射函数，将输入数据映射到输出结果，从而实现对未知数据进行预测或分类的过程。

在监督学习中，我们通常将输入数据称为自变量，输出结果称为因变量。

监督学习的核心是建立一个有效的模型，这个模型需要能够对未知数据进行良好的预测或分类。

目前常用的监督学习算法包括决策树、神经网络、支持向量机、朴素贝叶斯分类和随机森林等。

1.决策树算法决策树算法是一种基于树型结构的分类算法，它通过对数据样本的分类特征进行判断和划分，最终生成一棵树形结构，用于对未知数据进行分类或预测。

决策树算法具有易于理解、易于实现和可解释性强等优点，适合于处理中小规模的数据集。

2.神经网络算法神经网络算法是一种基于人工神经网络的分类算法，它通过多层神经元之间的相互连接和权重调整，学习输入数据和输出结果之间的复杂非线性关系，从而实现对未知数据的分类或预测。

神经网络算法具有适应性强、泛化能力好等优点，但也存在学习速度慢、容易陷入局部最优等缺点。

3.支持向量机算法支持向量机算法是一种基于核函数的分类算法，它通过定义一个最优超平面，将不同类别的数据样本分隔开来，从而实现对未知数据的分类或预测。

支持向量机算法具有泛化性能强、对于样本噪声和非线性问题具有较好的处理能力等优点，但也存在计算量大、核函数选择过程较为困难等缺点。

4.朴素贝叶斯分类算法朴素贝叶斯分类算法是一种基于概率统计的分类算法，它通过统计样本数据中各个特征值出现的概率，并根据贝叶斯公式计算出对于给定数据属于每个类别的概率，从而实现对未知数据的分类或预测。

朴素贝叶斯分类算法具有计算速度快、对于高维数据具有处理优势等优点，但也存在对于样本分布不平衡和假设独立性等问题的限制。

增量学习算法的研究及其在数据挖掘中的应用

增量学习算法的研究及其在数据挖掘中的应用随着大数据技术的快速发展，数据挖掘在各个领域中得到了广泛的应用。

而在数据挖掘的过程中，保持模型的鲁棒性和稳定性是至关重要的。

为了实现这一目标，人工智能领域推出了增量学习算法。

一、增量学习算法的定义增量学习算法是指利用一些统计学方法和机器学习的基本概念，对已有模型进行增量式的调整和更新，以适应新的数据集，提高学习算法的性能。

与传统的批量学习算法不同，增量学习算法经常在连续的流数据中运行，可以持续地更新模型，从而更好地适应变化的数据集。

因此，增量学习算法对于大数据的应用有着非常重要的意义。

二、增量学习算法的种类在实际应用中，增量学习算法有多种不同的形式。

以下是常见的增量学习算法类型：1.递归式增量学习算法递归式增量学习算法是指基于递归式神经网络进行嵌套，对于新的数据不断进行学习调整，以适应变化的数据集。

递归式神经网络是一种具有循环结构的神经网络，因此可以很好地处理带有序列化结构的数据。

2.基于核函数的增量学习算法基于核函数的增量学习算法是指在传统的支持向量机算法的基础上增加了时间序列分类功能，以适应时间序列数据的增加和调整。

利用核函数的特性，可以高效地学习并更新模型，从而实现更好的性能。

3.贝叶斯学习方法贝叶斯学习方法是基于贝叶斯定理的一种学习算法。

在增量学习的场景中，可以利用贝叶斯学习方法对数据进行学习，并实现连续更新模型，从而实现更好的性能。

三、增量学习算法在数据挖掘中的应用增量学习算法在数据挖掘中有着广泛的应用。

以下是一些常见的应用情景：1.推荐系统在推荐系统中，增量学习算法可以对新的用户行为进行学习，不断优化推荐策略和推荐结果。

在用户数据关联性高、变化快的场景中，增量学习算法具有重要的应用价值。

2.异常检测在异常检测中，增量学习算法可以实时监测数据变化，对异常数据进行识别和排除，提高异常检测系统的鲁棒性和稳定性。

3.决策树在决策树中，增量学习算法可以对新的数据进行实时学习，并根据新的数据不断更新决策树模型。

基于核函数的学习算法

基于核函数的学习算法基于核函数的学习算法是一种机器学习算法，用于解决非线性分类和回归问题。

在传统的机器学习算法中，我们通常假设样本数据是线性可分或线性可回归的，但是在现实世界中，许多问题是非线性的。

为了解决这些非线性问题，我们可以使用核函数来将原始数据映射到高维特征空间中，然后在该特征空间中进行线性分类或回归。

核函数是一个用于计算两个向量之间相似度的函数。

它可以通过计算两个向量在特征空间中的内积来度量它们的相似程度。

常用的核函数包括线性核函数、多项式核函数、高斯核函数等。

支持向量机是一种非常有力的分类算法。

它利用核技巧将输入数据映射到高维特征空间中，然后在该特征空间中找到一个最优分割超平面，使得样本点离超平面的距离最大化。

通过最大化间隔，支持向量机能够更好地处理非线性分类问题，并具有较好的泛化性能。

支持向量机的核函数可以将样本数据映射到高维特征空间中，以便在非线性问题上进行线性分类。

常用的核函数包括线性核函数、多项式核函数和高斯核函数等。

线性核函数可以实现与传统线性分类算法相同的效果。

多项式核函数可以将数据映射到多项式特征空间中，通过多项式特征的组合实现非线性分类。

高斯核函数可以将数据映射到无穷维的特征空间中，通过高斯核函数的相似度计算实现非线性分类。

核岭回归是一种非线性回归算法。

类似于支持向量机，核岭回归也利用核函数将输入数据映射到高维特征空间中，然后在该特征空间中进行线性回归。

通过最小二乘法求解岭回归问题，核岭回归能够更好地处理非线性回归问题。

1.能够处理非线性问题：核函数能够将数据映射到高维特征空间中，从而实现对非线性问题的线性分类或回归。

2.较好的泛化性能：支持向量机等基于核函数的学习算法通过最大化间隔来进行分类，可以有较好的泛化性能，减少模型的过拟合风险。

3.算法简洁高效：基于核函数的学习算法通常具有简单的模型结构和高效的求解方法，能够处理大规模数据集。

4.不依赖数据分布：基于核函数的学习算法不依赖于数据的分布情况，适用于各种类型的数据。

高斯核函数计算

高斯核函数：深度学习中的经典工具
在深度学习领域中，高斯核函数一直是一个备受关注的经典工具。

它不仅可以有效地解决回归和分类等任务，还可以应用于图像和语音
识别等领域。

那么，高斯核函数是如何计算的呢？本文将介绍高斯核
函数的计算方法及其应用。

首先，高斯核函数是一种基于距离的相似度度量方式。

它可以将
样本空间中的点映射到高维空间中，使得原本线性不可分的数据变成
线性可分的数据。

具体而言，我们可以用以下公式来表示高斯核函数：K(x_i, x_j) = exp(-|| x_i - x_j ||^2 / (2 * sigma^2))
其中，x_i和x_j分别表示样本空间中的两个点，sigma为高斯核
函数的参数，|| x_i - x_j ||^2为欧氏距离的平方。

在实际计算过程中，高斯核函数通常与支持向量机（SVM）算法结
合使用，来进行分类和回归等任务。

在SVM算法中，高斯核函数可以
将原始数据映射到一个高维空间中，并计算多维空间中数据的内积，
从而得出分类结果。

具体而言，高斯核函数可以通过SVM的拉格朗日
乘子来计算。

除此之外，高斯核函数还可以应用于图像和语音识别等领域。

例如，在图像识别中，可以通过高斯核函数来进行图像特征提取，从而
实现图像分类和识别。

在语音识别中，可以通过高斯核函数来进行声
学模型训练，从而实现语音识别的精准度提升。

综上所述，高斯核函数作为深度学习中的经典工具，不仅能够有效地解决回归和分类等问题，还可以应用于图像和语音识别等领域。

因此，如果你想要开展深度学习相关的研究，那么请不要错过这个重要的工具！。

基于混合核函数的SVM及其应用(精)

基于混合核函数的SVM及其应用
支持向量机的许多特性是由所选择的核函数来决定的,为了得到性能更为优良的支持向量机,一种改进的方法是把多个核函数组合起来,形成一种混合核函数。应用: 将混合核函数的SVM算法用于血浆脂蛋白样本与其血浆胆固醇的含量的测定中,并将结果与由其它核函数构造的支持向量机方法进行比较,意在提出一个更合适的核函数来解决函数拟合问题。
总结
简要介绍了由混合核函数构造的支持向量机,并将其运用于函数拟合中。通过对3 种不同类别血浆脂蛋白样本与其血浆胆固醇的含量的测定,验证了选择这种混合核函数的实验具有很好的效果,实验中 VLDL 的精确度有明显提高,而且本实验中训练时间只有2. 5 秒左右,很好地解决了训练速度慢的问题。
核函数
所谓核函数就是存在一非线性变换 ,使 K( xi ,xj) = 成立的一类函数。正是核函数的引入使SVM 得以实用化,因为它避免了显示高维空间中向量内积而造成的大量运算。目前研究最多的核函数主要有3类: 1) 多项式核函数:
2) 径向基核函数(RBF) :
3) Sigmoid 函数: 式(6 ～ 8) 中q ,σ, c 等参数都是实常数。在实际运用中,通常要根据问题的具体情况选择合适的核函数以及相应的参数。
从表1 中可以看出采用混合核函数进行函数拟合的效果更好,尤其是VLDL 的精确度得到了大幅度的提高。
表2 是混合核函数在λ = 0. 98 , q = 1 ,σ取不同值时进行拟合的结果,由表2 可以看出σ在 0. 01 ～ 0. 5 之间时效果较好.
不仅如此, 还发现, C 值的选取影响训练时间的长短, C值越小平均训练时间越短,但当 C值过小( C ≤102) 时,实验结果的精度会下降。表3 是C 取不同值时平均训练时间的值,因此实验中采用C = 1000 是较合理的,并且有效提高了SVM方法的训练速度。

kkrt算法原理

kkrt算法原理
KKRT（Kernelized K-means with Reduced Space Technique）算法是一种基于核函数的聚类算法，它结合了K-means算法和谱方法的优点，并通过降维的方式提高了算法的效率。

算法的核心思想是将原始数据映射到一个高维的特征空间，并在特征空间中进行聚类。

通过使用核函数，可以在不直接计算高维特征空间的内积的情况下，计算实例之间的相似度，从而更高效地进行聚类。

KKRT算法的具体步骤如下：
1. 使用核函数将原始数据映射到一个高维的特征空间。

2. 随机选择K个数据点作为初始的聚类中心。

3. 对每个数据点，计算其与聚类中心的距离，距离计算使用在特征空间中定义的距离函数。

4. 将每个数据点分配到与其最近的聚类中心所对应的簇中。

5. 更新聚类中心，将每个簇中的数据点的特征向量的平均值作为新的聚类中心。

6. 重复步骤3到5，直到聚类中心不再变化或达到预定的迭代次数。

7. 对聚类结果进行评估，可以使用各种聚类评估指标，如轮廓系数、Calinski-Harabasz指数等。

需要注意的是，KKRT算法通过降维的方式提高了算法的效率，可以减小计算开销。

在降维过程中，可以使用各种降维方法，如主成分分析（PCA）、线性判别分析（LDA）等。

总结起来，KKRT算法是一种基于核函数的聚类算法，它通过将数据映射到高维特征空间并利用核函数计算相似度，以提高聚类效果。

同时，通过降维的方式，可以减小计算开销，提高算法的效率。

基于核函数的Adaboost分类算法研究

ｃａｓｆｅｏｒＡｄＢｏｏｔＴｈｅｔａｌｅＯｔｏｌｉｓａｕｔｃｎｃｒｄｔｅｘｒｍｅａｒｆｃｔｏｎｏｃｅｒｆｎｃｏｎａａｌｓｉｒｆａｉｓ．ｎｉｐｐｉｄｔｗｏｃｎｃｕｓｏｎｂｏａｅａａｓｔｂｙｅｐｅｉｎｔｌｖｅｉａｉｉｆａｎｕｌａｕｔｓａｗｅｋｉｃａｓｆｅｎｔｇａｅｈｅｇｏｄｐｅｆｒａｃｆＡｄＢｏｏｔｃａｓｆｅ．ｌｓｉｒｉｅｒｔｓｔｏｒｏｍｎｅｏａｉｓｌｓｉｒｉｓＫｅｙｗｏｒ：ｂｓｉｇａｇｉｔ；ｅｅｂｅｌａｎｉｇ；ｋｒｅｕｔｏｎ；ｅｋｃａｓｆｅｄｓｏｏｔｎｌｏｒｈｍｎｓｍｌｅｒｎｅｌｆｎｃｉｎｗａｌｓｉｒｉ
ｈｔ：ｗｗｄｚ．ｅ．ｎｔ／ｗ．ｎｓｎｔｐ／ｃ
Ｔｌ８ — ５ — ６０６５９９４ｅ：６５１５９９３＋６０６
基于
李．涛想李
薮的Ａｄｂｏｔａｏｓ分类算法研究
（州交通大学自动化与电气工程学院，肃兰州７０７）兰甘３００
ｈａｒａｐｌｃｔｏｎＯ１ｔａｔｒｌｓｉｃｔｏｎｆｅｄ．Ｔｈｅｔｏｓａｇｅｔａｐｉａｉ＂ｈｅｐｔｅｃａｓｆａｉｌ１ｎｉｉｈｅｒｏｆＢｏｏｔｎｎｄｔｅｃａｓｃｇｒｔｍｆＡｄＢｏｏｔａｅｓｕｄｅａｒｔｙｓｇａｈｌｓｉａａｏｉｈｏａｉｌｌｓｒｔｉｄｔｆｓ，ｉ

基于核的最小均方误差改进算法及其应用

基于核的最小均方误差改进算法及其应用基于核的最小均方误差改进算法（KMSE）是核学习方法中的一种有效算法，有助于优化复杂和非凸问题。

近年来，KMSE算法已被用于许多领域，包括机器学习，模式识别，计算机视觉，信号处理和信息检索。

本文的目的是介绍KMSE算法的基本原理和其应用。

首先，我们讨论了KMSE算法在数学上表示的形式，并讨论了理论上的最优化步骤。

其次，文章探讨了KMSE算法在实际应用中的优势，例如抗噪性和收敛性。

最后，本文介绍了KMSE算法在几个重要领域的应用，这些领域包括机器学习，模式识别，计算机视觉，信号处理和信息检索。

第二部分：简介基于核的最小均方误差改进算法（KMSE）是一种有效的优化算法，用于求解复杂和非凸的优化问题。

它采用有效的平衡率来改善最小均方误差（MSE）算法。

该算法采用半正则化和全正则化方法来优化模型。

KMSE算法在实际应用中具有许多优势，这些优势包括抗噪性，收敛性，快速计算和自适应性。

第三部分：KMSE算法的基本原理KMSE算法是基于核函数的优化算法，它可以将非凸的优化问题转换为凸的优化问题。

它的基本原理是通过计算非线性核函数来实现。

KMSE算法的主要步骤是：（1）构造非线性核函数；（2）计算改进的最小均方误差；（3）设定正则化和反正则化系数；（4）选择最佳参数；（5）更新模型；（6）重复以上步骤，直到收敛为止。

第四部分：KMSE算法的实际应用KMSE算法在机器学习，模式识别，计算机视觉，信号处理和信息检索等领域都得到了广泛的应用。

例如，KMSE算法用于进行人脸识别，语音识别等任务。

另一方面，KMSE算法也可以用于信号处理，图像处理和机器学习等领域。

在信号处理领域，KMSE算法可以帮助优化信号参数，从而提高信号处理的性能。

此外，KMSE算法也可用于信息检索，以实现更快更准确的搜索速度。

第五部分：结论KMSE算法是一种高性能的优化算法，它可以解决复杂和非凸的优化问题，并且比传统的MSE算法更有效地为给定问题求解最优解。

基于核方法与流形学习的运动想象脑电信号特征提取算法

第３５卷第４期２０２２年４月传感技术学报ＣＨＩＮＥＳＥＪＯＵＲＮＡＬＯＦＳＥＮＳＯＲＳＡＮＤＡＣＴＵＡＴＯＲＳＶｏｌ３５㊀Ｎｏ４Ａｐｒ.２０２２项目来源:浙江省重点研发计划(２０２０Ｃ０４００９)ꎻＮＳＦＣ－浙江两化融合联合基金(Ｕ１６０９２１８)收稿日期:２０２１－０８－１６㊀㊀修改日期:２０２１－１１－２３ＦｅａｔｕｒｅＥｘｔｒａｃｔｉｏｎＡｌｇｏｒｉｔｈｍｏｆＭｏｔｏｒＩｍａｇｅｒｙＥＥＧＳｉｇｎａｌｓｂａｓｅｄｏｎＫｅｒｎｅｌＭｅｔｈｏｄａｎｄＭａｎｉｆｏｌｄＬｅａｒｎｉｎｇ∗ＺＨＵＬｅｉ１ꎬＺＨＵＪｉｅｐｉｎｇ１ꎬＤＩＮＧＷａｎｇｐａｎ１ꎬＹＡＮＧＪｕｎｔｉｎｇ１ꎬＨＵＱｉｆｅｎｇ１ꎬＹＩＮＧＮａｎｊｉａｏ１ꎬＸＵｐｉｎｇ１ꎬＺＨＡＮＧＪｉａｎｈａｉ２ꎬ３∗(１.ＳｃｈｏｏｌｏｆＡｕｔｏｍａｔｉｏｎꎬＨａｎｇｚｈｏｕＤｉａｎｚｉＵｎｉｖｅｒｓｉｔｙꎬＨａｎｇｚｈｏｕＺｈｅｊｉａｎｇ３１００１８ꎬＣｈｉｎａꎻ２.ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙꎬＨａｎｇｚｈｏｕＤｉａｎｚｉＵｎｉｖｅｒｓｉｔｙꎬＨａｎｇｚｈｏｕＺｈｅｊｉａｎｇ３１００１８ꎬＣｈｉｎａꎻ３.ＫｅｙＬａｂｏｒａｔｏｒｙｏｆＢｒａｉｎＭａｃｈｉｎｅＣｏｌｌａｂｏｒａｔｉｖｅＩｎｔｅｌｌｉｇｅｎｃｅｏｆＺｈｅｊｉａｎｇＰｒｏｖｉｎｃｅꎬＨａｎｇｚｈｏｕＺｈｅｊｉａｎｇ３１００１８ꎬＣｈｉｎａ)Ａｂｓｔｒａｃｔ:ＩｎｖｉｅｗｏｆｔｈｅｎｏｎｌｉｎｅａｒｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆＥＥＧｓｉｇｎａｌｓａｎｄｔｈｅｐｒｏｂｌｅｍｔｈａｔｔｒａｄｉｔｉｏｎａｌｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎｍｅｔｈｏｄｓｉｇｎｏｒｅｔｈｅｓｐａｔｉａｌａｎｄｎｅｉｇｈｂｏｒｈｏｏｄｓｔｒｕｃｔｕｒｅｉｎｆｏｒｍａｔｉｏｎｏｆｆｅａｔｕｒｅｓｉｇｎａｌｓꎬａＫｅｒｎｅｌＢｉｌｉｎｅａｒＴｗｏ￣ｄｉｍｅｎ￣ｓｉｏｎａｌＤｉｓｃｒｉｍｉｎａｎｔＬｏｃａｌｉｔｙＰｒｅｓｅｒｖｉｎｇＰｒｏｊｅｃｔｉｏｎ(Ｋｅｒｎｅｌ￣Ｂ２ＤＤＬＰＰ)ａｌｇｏｒｉｔｈｍｉｓｐｒｏｐｏｓｅｄ.Ｔｈｅｆｒｅｑｕｅｎｃｙ￣ｓｐａｃｅｆｅａｔｕｒｅｓｅｔｉｓｏｂｔａｉｎｅｄｔｈｒｏｕｇｈｔｈｅＦｉｌｔｅｒＢａｎｋＣｏｍｍｏｎＳｐａｔｉａｌＰａｔｔｅｒｎ(ＦＢＣＳＰ)ａｌｇｏｒｉｔｈｍ.Ｔｈｅｎｔｈｅｆｅａｔｕｒｅｉｓｅｘ￣ｔｒａｃｔｅｄｂｙｕｓｉｎｇｔｈｅＫｅｒｎｅｌ￣Ｂ２ＤＤＬＰＰａｌｇｏｒｉｔｈｍ.ＦｉｎａｌｌｙꎬＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ(ＳＶＭ)ｉｓｕｓｅｄｆｏｒｃｌａｓｓｉｆｉｃａｔｉｏｎ.Ｔｈｅｅｘｐｅｒｉｍｅｎｔｅｖａｌｕａｔｅｓｔｈｅｐｅｒｆｏｒｍａｎｃｅｏｆｔｈｅａｌｇｏｒｉｔｈｍｔｈｒｏｕｇｈｋ￣ｆｏｌｄｃｒｏｓｓ￣ｖａｌｉｄａｔｉｏｎ.Ｔｈｅａｖｅｒａｇｅａｃｃｕｒａｃｙｏｆ７６.１１％ａｎｄ７４.５４％ａｎｄｔｈｅｈｉｇｈｅｓｔａｃｃｕｒａｃｙｏｆ８８.３３％ａｎｄ８７.１４％ａｒｅｏｂｔａｉｎｅｄｏｎｔｗｏｆｏｕｒｃｌａｓｓｍｏｔｏｒｉｍａｇｅｒｙｃｏｍｐｅｔｉｔｉｏｎｄａｔａｓｅｔｓ.Ｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｅｌｉｍｉｔａｔｉｏｎｓｏｆｌｉｎｅａｒｍｅｔｈｏｄｓａｒｅｂｒｏｋｅｎꎬｔｈｅｉｎｓｕｆｆｉｃｉｅｎｔｄｅｓｃｒｉｐｔｉｏｎｏｆｓｐａｔｉａｌｉｎｆｏｒｍａｔｉｏｎｉｎｔｒａｄｉｔｉｏｎａｌｅｘｔｒａｃｔｉｏｎｍｅｔｈｏｄｓｉｓｅｆｆｅｃｔｉｖｅｌｙｏｖｅｒｃｏｍｅꎬｔｈｅｓｕｐｐｌｅ￣ｍｅｎｔａｒｙｉｎｆｏｒｍａｔｉｏｎｏｆｎｏｎｌｉｎｅａｒｆｅａｔｕｒｅｓｐａｃｅｉｓｂｅｔｔｅｒｏｂｔａｉｎｅｄꎬａｎｄｈｉｇｈｅｒｐｒｅｃｉｓｉｏｎｓａｍｐｌｅａｐｐｒｏｘｉｍａｔｅｆｅａｔｕｒｅｓａｒｅｐｒｏｖｉｄｅｄｔｈｒｏｕｇｈｔｈｅａｄｏｐｔｉｏｎｏｆｔｈｅｐｒｏｐｏｓｅｄｍｅｔｈｏｄ.Ｋｅｙｗｏｒｄｓ:ｍｏｔｏｒｉｍａｇｅｒｙꎻｋｅｒｎｅｌｍｅｔｈｏｄｓꎻｍａｎｉｆｏｌｄｌｅａｒｎｉｎｇꎻｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎＥＥＡＣＣ:７２３０㊀㊀㊀㊀ｄｏｉ:１０.３９６９/ｊ.ｉｓｓｎ.１００４－１６９９.２０２２.０４.０１２基于核方法与流形学习的运动想象脑电信号特征提取算法∗祝㊀磊１ꎬ朱洁萍１ꎬ丁旺盼１ꎬ杨君婷１ꎬ胡奇峰１ꎬ应南娇１ꎬ徐㊀平１ꎬ张建海２ꎬ３∗(１.杭州电子科技大学自动化学院ꎬ浙江杭州３１００１８ꎻ２.杭州电子科技大学计算机学院ꎬ浙江杭州３１００１８ꎻ３.浙江省脑机协同智能重点实验室ꎬ浙江杭州３１００１８)摘㊀要:针对脑电信号的非线性特点及传统的特征提取方法存在忽略特征信号空间和邻域结构信息的问题ꎬ提出一种核－双向二维判别局部保留投影特征提取算法ꎮ首先采用滤波器组共空间模式算法获得频－空特征集ꎬ再使用核－双向二维判别局部保留投影算法进行特征提取ꎬ最后使用支持向量机进行分类ꎮ实验通过ｋ折交叉验证评估算法的性能ꎮ在两个四分类运动想象竞赛数据集上分别获得了平均７６.１１％㊁７４.５４％和最高８８.３３％㊁８７.１４％的准确率ꎮ实验结果表明该方法打破了线性方法的局限性ꎬ有效地克服了传统提取方法空间信息描述不足的问题ꎬ更好地获取了非线性特征空间的补充信息ꎬ提供了更高精度的样本近似特征ꎮ关键词:脑机接口ꎻ运动想象ꎻ核方法ꎻ流形学习ꎻ特征提取中图分类号:ＴＰ３９１㊀㊀㊀㊀文献标识码:Ａ㊀㊀㊀㊀文章编号:１００４－１６９９(２０２２)０４－０５０４－０７㊀㊀脑机接口(Ｂｒａｉｎ￣ｃｏｍｐｕｔｅｒＩｎｔｅｒｆａｃｅꎬＢＣＩ)是将大脑活动通过信号采集系统进行记录并分析从而实现计算机与大脑连接[１]的技术ꎮ近年来ꎬＢＣＩ技术在临床领域应用广泛[２]ꎬ用于病患的身体康复[３]以及行为活动的辅助[４]ꎮＢＣＩ技术应用的关键在于脑电信号的特征提取以及分类模型的构建[５]ꎮ并非所有从ＥＥＧ信号中提取的特征都与分类相关ꎮ过多的特征不仅会增加特征矩阵的维数ꎬ还会导致分第４期祝㊀磊ꎬ朱洁萍等:基于核方法与流形学习的运动想象脑电信号特征提取算法㊀㊀类成功率低[６]ꎮ因而解决高维数据造成的计算复杂度高和分类精度低的问题[７]至关重要ꎮ包括独立成分分析[８](ＩｎｄｅｐｅｎｄｅｎｔＣｏｍｐｏｎｅｎｔＡｎａｌｙｓｉｓꎬＩＣＡ)㊁主成分分析[９](ＰｒｉｎｃｉｐａｌＣｏｍｐｏｎｅｎｔＡｎａｌｙｓｉｓꎬＰＣＡ)和线性判别分析[１０](ＬｉｎｅａｒＤｉｓｃｒｉｍｉｎａｎｔＡｎａｌｙｓｉｓꎬＬＤＡ)等在内的降维算法在传统ＢＣＩ中得到广泛应用ꎬ但大都忽略了脑电信号中重要的结构信息ꎮ共空间模式(ＣｏｍｍｏｎＳｐａｔｉａｌＰａｔ￣ｔｅｒｎꎬＣＳＰ)算法从多通道的数据中提取出每一类的空间分布成分ꎬ能很好地利用脑电信号的空间相关性ꎬ并且对于信号的噪声也有着很好的消除效果ꎬ表现出较好的分类性能[１１－１２]ꎬ被认为是最流行的运动想象应用技术[１３]ꎬ但是却强烈依赖于频带的选择[１４]ꎮ此外ꎬ流形学习也被用于运动想象脑电的研究中ꎬ如Ｌｉ等[１５]使用了局部线性嵌入(ＬｏｃａｌｌｙＬｉｎｅａｒＥｍｂｅｄｄｉｎｇꎬＬＬＥ)算法提取运动想象脑电中的非线性特征ꎬ并获得了较高的分类精度ꎮ但考虑到脑电信号并不是单纯向量化的数据ꎬ单纯使用基于向量的特征提取方法会造成空间信息的丢失ꎮＨｕ等[１６]提出了一种基于矩阵变量高斯模型的双线性二维判别局部保持投影(Ｂ２ＤＤＬＰＰ)算法ꎬ在二维判别局部保持投影(２ＤＤＬＰＰ)算法[１７]中引入双线性结构和矩阵变量高斯模型ꎬ来充分提取ＥＥＧ信号通道之间的特征信息ꎬ获得了较好的判别性能ꎮ针对脑电信号中的非线性特点ꎬ本文引入核函数的方法以加强对数据特征的获取ꎬ并结合双向二维判别局部保留投影算法ꎬ提出一种核－双向二维判别局部保留投影(ＫｅｒｎｅｌＢｉｌｉｎｅａｒＴｗｏ￣ｄｉｍｅｎｓｉｏｎａｌＤｉｓｃｒｉｍｉｎａｎｔＬｏｃａｌｉｔｙＰｒｅｓｅｒｖｉｎｇＰｒｏｊｅｃｔｉｏｎꎬＫｅｒｎｅｌ￣Ｂ２ＤＤＬＰＰ)算法来进行特征提取ꎮ通过将数据映射到合适的高维空间ꎬ使得线性不可分的脑电数据在高维空间中的特征更加具有区分性ꎮ并在预处理阶段参考滤波器组共空间模式(ＦＢＣＳＰ)算法[１８]ꎬ将ＥＥＧ信号过滤成多个频带ꎬ从每一个频带的数据中提取出ＣＳＰ特征ꎬ整合生成频－空矩阵集作为特征提取步骤的输入ꎮ最后使用了支持向量机(ＳＶＭ)[１９]对提取的特征值进行分类ꎮ实验结果表明ꎬ该方法有效地保留了更高精度的数据特征ꎬ具有较好的分类稳定性ꎬ提高了分类正确率ꎮ１㊀特征提取方法１.１㊀流形学习方法二维判别局部保留投影(２ＤＤＬＰＰ)算法是ＤＬＰＰ算法的２Ｄ拓展ꎬ可以将样本中的空间结构信息考虑在内ꎬ提供更高精度的样本近似ꎮＢ２ＤＤＬＰＰ算法基于矩阵变量高斯模型ꎬ对２ＤＤＬＰＰ算法进行了改进ꎮ假设每一个样本的特征矩阵Ｘ的大小为ＮｆˑＮｇꎬ总样本数为Ｎꎬ每一个类别中的样本数ｎｓꎬ类别ｓ＝１ꎬ２ꎬ Ｚꎬ类别对应的矩阵集Ｘｓ＝{Ｘｓ１ꎬＸｓ２ꎬ ꎬＸｓｎｓ}ꎬｎｓ为第ｓ个类别中的样本个数ꎮ原始空间ＲＤ中的样本Ｘ＝(ｘ１ꎬｘ２ꎬ ꎬｘＮ)ꎬ要找到一个投影矩阵ꎬ将样本集投影到一个低维的空间Ｒｄꎬ并保留原始空间中的邻域关系ꎬ投影后的样本集记为Ｙ＝(ｙ１ꎬｙ２ꎬ ꎬｙＮ)ꎮＢ２ＤＤＬＰＰ的目标函数为:Ｊ(Ｇ)＝ＧＴＳＢＧＧＴＳＷＧ(１)式中:Ｇ为目标投影方向ꎬＳＢ是类间散布矩阵ꎬＳＷ是类内散布矩阵ꎮ通过最大化目标函数获得投影方向ꎬ并对相应的协方差矩阵进行近似:ψ＝１２∗ＮｆðＺｓ＝１ðｎｓｉꎬｊ＝１(Ｘｓｉ－Ｘｓｊ)Ｔ(Ｘｓｉ－Ｘｓｊ)Ｗｓｉｊ(２)ϕ＝１２∗ＮｇðＺｓ＝１ðｎｓｉꎬｊ＝１(Ｘｓｉ－Ｘｓｊ)(Ｘｓｉ－Ｘｓｊ)Ｗｓｉｊ(３)式中:ψ㊁ϕ分别表示空间协方差矩阵和频率协方差矩阵ꎮＷｓ是同类别中任意两个样本之间的权值ꎬ定义为Ｗｓｉｊ＝ｅｘｐ(－Ｘｓｉ－Ｘｓｊ２/ｔ)ꎮＢ２ＤＤＬＰＰ算法定义向量化后的类间散布矩阵是一个可分离结构ꎬＳＢ＝ＳＢＲ⊗ＳＢＬꎬ表达式分别为:ＳＢ＝１２ðＺａꎬｂ＝１(ｕａ－ｕｂ)(ｕａ－ｕｂ)ＴＢａｂ(４)ＳＢＬ＝１２ðＺａꎬｂ＝１(Ｆａ－Ｆｂ)(Ｆａ－Ｆｂ)ＴＢａｂ(５)ＳＢＲ＝ｔｒ－１(ＳＢＬ)１２ðＺａꎬｂ＝１(Ｆａ－Ｆｂ)Ｔ(Ｆａ－Ｆｂ)Ｂａｂ(６)式中:ｕ为Ｆ的向量化ꎬｕ＝ｖｅｃ(Ｆ)ꎬＦｓ为ｓ类别的样本均值矩阵ꎮＢａｂ是任意两个类别样本均值之间的权值矩阵ꎬ定义为Ｂａｂ＝ｅｘｐ(－Ｆａ－Ｆｂ２ｔ)ꎮ可以得到ϕ－１ＳＢＬ的特征值和特征向量ꎬ分别记为λｌ和ｕｌꎮ类似的ꎬ可以得到ψ－１ＳＢＲ的特征值和特征向量ꎬ记为γｊ和ｖｊꎮ接着将特征值λｌ和γｊ分别进行降序排列ꎬ对应的特征向量进行重构ꎬ得到投影矩阵Ｕ㊁Ｖꎮ特征矩阵Ｙ可以通过Ｙ＝ＵＴＸＶ得到ꎮ１.２㊀核方法一个非线性函数进行显式的映射会带来非常大的计算量ꎬ并引起维数灾难ꎮ通过核函数计算高维空间中向量的内积ꎬ使‹ϕ(ｘ)ꎬϕ(ｙ)›＝Ｋ(ｘꎬｙ)ꎬ即可解决上述问题ꎮ将原始空间内的样本按列进行分块ꎬ可得Ｘｉ＝５０５传㊀感㊀技㊀术㊀学㊀报ｃｈｉｎａｔｒａｎｓｄｕｃｅｒｓ.ｓｅｕ.ｅｄｕ.ｃｎ第３５卷[α１ꎬα２ꎬ ꎬαｎ]ꎮ根据核方法的理论ꎬ存在一个非线性映射ϕꎬ将原始空间里的脑电样本映射到核空间中Ｘңϕ(Ｘ)ꎮ可得核矩阵Ｋ具体形式如下:Ｋ＝[ϕ(Ｘ１)Ｔϕ(Ｘ１)] [ϕ(Ｘ１)Ｔϕ(ＸＮ)]⋮⋮[ϕ(ＸＮ)Ｔϕ(Ｘ１)] [ϕ(ＸＮ)Ｔϕ(ＸＮ)]éëêêêêùûúúúú(７)１.３㊀核－双向二维判别局部保留投影算法本文在Ｂ２ＤＤＬＰＰ[１６]基础上引入了核方法的思想ꎬ将权值矩阵和样本进行了非线性拓展ꎬ提出一种核－双向二维判别局部保留投影算法(Ｋｅｒｎｅｌ￣Ｂ２ＤＤＬＰＰ)ꎬ以得到更具有判别力的特征ꎮ根据Ｂ２ＤＤＬＰＰ中的理论ꎬ类内散布矩阵ＳＷ和类间散布矩阵ＳＢ都可进行拆分两部分ꎬＳＷ拆分成ＳＷＬ和ＳＷＲ如下:ＳＷＬ＝１２ｎðＺｓ＝１ðｎｓｉꎬｊ＝１(Ｘｓｉ－Ｘｓｊ)(Ｘｓｉ－Ｘｓｊ)ＴＷｓｉｊ(８)ＳＷＲ＝１２ｍðＺｓ＝１ðｎｓｉꎬｊ＝１(Ｘｓｉ－Ｘｓｊ)Ｔ(Ｘｓｉ－Ｘｓｊ)Ｗｓｉｊ(９)ＳＢ拆分成ＳＢＬ和ＳＢＲꎬ如下:ＳＢＬ＝１２ðＺａꎬｂ＝１(Ｆａ－Ｆｂ)(Ｆａ－Ｆｂ)ＴＢａｂ(１０)㊀ＳＢＲ＝１２ｔｒ－１(ＳＢＬ)ðＺａꎬｂ＝１(Ｆａ－Ｆｂ)Ｔ(Ｆａ－Ｆｂ)Ｂａｂ(１１)以ＳＷＬ和ＳＢＬ部分为例ꎬ通过非线性映射后ꎬ对应在核空间的类内散布矩阵和类间散布矩阵转换成:ＳϕＷＬ＝１２ｎðＺｓ＝１ðｎｓｉꎬｊ＝１[ϕ(Ｘｓｉ)－ϕ(Ｘｓｊ)]ˑ[ϕ(Ｘｓｉ)－ϕ(Ｘｓｊ)]ＴＷϕｉｊ(１２)ＳϕＢＬ＝１２ðＺａꎬｂ＝１[ϕ(Ｆａ)－ϕ(Ｆｂ)]ˑ[ϕ(Ｆａ)－ϕ(Ｆｂ)]ＴＢϕａｂ(１３)目标函数为:ａｒｇｍａｘＷＴＳϕＢＬＷＷＴＳϕＷＬＷ(１４)根据再生核理论ꎬ可以令Ｗ＝ϕ(Ｘ)Γꎬ将目标函数进行转换ꎮ分子部分转换成:ＷＴＳϕＢＬＷ＝ΓＴ１２ðＺａꎬｂ＝１( Ｘｋａ－Ｘｋｂ)( Ｘｋａ－Ｘｋｂ)ＴＢϕａｂΓ(１５)式中: Ｘｋａ＝ϕ(Ｘ)Ｔϕ(Ｆａ)为内积后的表达式ꎬ具体形式为Ｘｋｉ＝１ｎａðＸｋｉɪａＸｋｉꎮ分母部分转换成:ＷＴＳϕＷＬＷ＝ΓＴ１２ｎðＺｓ＝１ðｉꎬｊɪＺｓ[Ｘｋｉ－Ｘｋｊ][Ｘｋｉ－Ｘｋｊ]ＴＷϕｉｊΓ(１６)Ｂϕａｂ和Ｗϕｉｊ需要转换成核空间内的权值矩阵ꎬ由于在核空间内的样本形式未知ꎬ因此本文也利用了核函数的方法ꎬ运算中的内积用核函数来进行替代ꎬ进行求解ꎮ以类内散布矩阵中两个样本矩阵ϕ(Ｘｉ)和ϕ(Ｘｊ)之间的权重为例:ｅｘｐ－ ϕ(Ｘｉ)－ϕ(Ｘｊ) ２ｔéëêêùûúú＝ｅｘｐ２ｔｒａｃｅ[ｋ(ＸｉꎬＸｊ)]ｔ{}(１７)相当于以Ｘｋｉ作为新的样本ꎬｉ＝１ꎬ２ꎬ ꎬＮꎮ随后求解出列的投影矩阵Ｖꎮ以类似步骤ꎬ进行ＳＷＲ和ＳＢＲ部分的计算ꎮ与上部分不同的是ꎬ输入的Ｘ按行进行分块ꎬ核矩阵Ｋ大小相应地变成ｍＮˑｍＮꎬＸｋｉ为一个ｍＮˑｍ的矩阵ꎬｉ＝１ꎬ２ꎬ Ｎꎮ最终可以计算出该部分按行的投影矩阵Ｕꎮ计算新的样本以及权值矩阵得到一个方向的投影矩阵ꎬ应用于原始样本Ｘꎮ结合Ｂ２ＤＤＬＰＰ的特征选择的思想ꎬ从特征矩阵Ｙ＝ＵＴＸＶ中挑选出前ｄ个最大的λｌγｊ值所对应的ｙｉｊ元素ꎬ作为降维后的ｄ维特征ꎮ图２㊀竞赛数据集Ｄａｔａｓｅｔ３ａ的实验范式图２㊀实验数据实验使用两个公开数据集进行对比试验ꎬ均为四分类运动想象ＢＣＩ竞赛公开数据集ꎬ分别是ＢＣＩＣｏｍｐｅｔｉｔｉｏｎ４的Ｄａｔａｓｅｔ２ａ[２０]以及ＢＣＩＣｏｍｐｅｔｉｔｉｏｎ３的Ｄａｔａｓｅｔ３ａ[２１]ꎮ两个公开数据集均为左右手㊁脚和舌头的四分类运动想象数据ꎮ其中Ｄａｔａｓｅｔ２ａ数据集的信号通过布满头皮的２２个电极进行采集ꎬ每个电极以２５０Ｈｚ的采样频率收集信号ꎬ并在０.５Ｈｚ~１００Ｈｚ直接进行带通滤波ꎮ该数据集总共包含９名受试者ꎬＤａｔａｓｅｔ３ａ数据集包括３名受试者ꎬ通过６０个通道的电极以２５０Ｈｚ的采样频率进行采样ꎬ并且通过陷波滤波器进行１Ｈｚ~５０Ｈｚ滤波ꎮ二者的实验范式分别如图１和图２所示ꎮ图１㊀竞赛数据集Ｄａｔａｓｅｔ２ａ的实验范式图６０５第４期祝㊀磊ꎬ朱洁萍等:基于核方法与流形学习的运动想象脑电信号特征提取算法㊀㊀为了更好地保留空间结构信息ꎬ本文实验使用了数据集的所有电极通道的数据ꎮ３㊀实验结果与分析３.１㊀预处理考虑到ＣＳＰ算法的表现十分依赖于脑电信号中的最优频带ꎬ且运动想象信息主要包含在μ频段(８Ｈｚ~１３Ｈｚ)和β频段(１４Ｈｚ~０Ｈｚ)中ꎬ而眼电噪声频率范围主要存在较低频中ꎬ因此预处理部分参考滤波器组共空间模式(ＦＢＣＳＰ)采用了一个覆盖４Ｈｚ~４０Ｈｚ的切比雪夫Ⅱ型滤波器组将所有脑电信号划分为多个子频段ꎬ每４Ｈｚ频段进行一个分割ꎬ共划分为９个子频段ꎬ各子频带的频率范围在表１中列出ꎮ表１㊀滤波器组划分脑电信号对应各频段频率范围子频带范围/Ｈｚ子频带范围/Ｈｚ子频带范围/Ｈｚｆｂ１[４ꎬ８]ｆｂ４[１６ꎬ２０]ｆｂ７[２８ꎬ３２]ｆｂ２[８ꎬ１２]ｆｂ５[２０ꎬ２４]ｆｂ８[３２ꎬ３６]ｆｂ３[１２ꎬ１６]ｆｂ６[２４ꎬ２８]ｆｂ９[３６ꎬ４０]３.２㊀特征提取分类首先将经预处理后得到的九个频段数据采用一对多共空间模式算法(ｏｎｅｖｅｒｓｕｓｔｈｅｒｅｓｔｃｏｍｍｏｎｓｐａｔｉａｌｐａｔｔｅｒｎｓꎬＯＶＲ￣ＣＳＰ)进行第一阶段的特征提取ꎬ得到一组频－空特征数据集ꎮ对于四分类数据ꎬ总共可以得到四组特征ꎮ将得到的Ｚ组特征组合起来ꎬＺ为总类数ꎬ最后得到一个大小为ＮｆˑＮｇ的特征矩阵ꎬ其中Ｎｆ为划分的频带数ꎬＮｇ＝２ｐＺꎬｐ为ＣＳＰ算法中计算投影矩阵时的特征向量选取数目参数ꎮ再将特征集ＸＮｆˑＮｇ通过核－双向二维判别局部保留投影算法进行第二阶段特征提取ꎬ构造投影矩阵ＵꎬＶꎬ计算特征矩阵Ｙꎬ从Ｙ中挑选出前ｄ个最大的λｌγｊ值所对应的ｙｌｊ元素作为降维后的特征维数ꎮ最后将降维后的特征集使用ＳＶＭ分类器进行分类ꎬ根据分类结果分析性能ꎮ算法的性能取决于分类器输入的特征空间的维数ꎬ用ｄ表示ꎬ而ｄ的取值范围受第一阶段特征提取部分参数ｐ的影响ꎮ考虑到脑电数据在不同数据集中㊁不同受试上的各异性ꎬ且计算量将随ｐ值的增加而增大ꎬ本文将实验中参数ｐ的取值范围选定为[１ꎬ４]ꎮ对于每一种特征提取的方法ꎬ根据每个受试者５折交叉验证的平均结果来确定最优维数ｄｏｐꎮ测试集数据用训练得到的最优维数进行降维ꎮ实验的总体流程图如图３所示ꎮ图３㊀本文实验总体流程图３.３㊀结果与讨论实验将本文算法与五种算法进行分类结果对比ꎮ其中ꎬ对比ＣＳＰ算法是为了验证流形学习方法的加入对特征空间描述信息补足的积极作用ꎬ对比ＣＳＰ＋Ｂ２ＤＤＬＰＰ算法用于验证核方法对非线性特性处理脑电信号数据的有效性ꎮＫＰＣＡ[２２]㊁ＫＬＤＡ[２３]㊁ＫＬＰＰ[２４]作为常用的核降维算法也与本文算法进行了对比ꎮ需要说明的是ꎬ初步实验中ꎬ算法使用的核函数均为高斯核函数(ＲＢＦ)ꎬ函数中的参数σ２设置为１ꎬＢ２ＤＤＬＰＰ算法以及本文算法中进行权重矩阵计算时的参数ｔ设置为１ꎮＤａｔａｓｅｔ２ａ数据集与Ｄａｔａｓｅｔ３ａ数据集的具体验证结果分别由表２和表３所示ꎮ７０５传㊀感㊀技㊀术㊀学㊀报ｃｈｉｎａｔｒａｎｓｄｕｃｅｒｓ.ｓｅｕ.ｅｄｕ.ｃｎ第３５卷表２㊀Ｄａｔａｓｅｔ３ａ数据集中不同特征提取算法的最佳交叉验证结果特征提取算法分类正确率/％ꎬ(ｐꎬｄｏｐ)Ｋ３ｂＫ６ｂＬ１ｂ平均值ＣＳＰ８１.９５ｐ＝３６６.６４ｐ＝１６５.６１ｐ＝１７１.４０ＣＳＰ＋Ｂ２ＤＤＬＰＰ８３.３３ｐ＝２ꎬｄｏｐ＝５３６５.００ｐ＝３ꎬｄｏｐ＝６５６６.６７ｐ＝２ꎬｄｏｐ＝１０８７１.６７ＣＳＰ＋ＫＰＣＡ８６.１１ｐ＝２ꎬｄｏｐ＝５２６５.８３ｐ＝４ꎬｄｏｐ＝２１３５５.８３ｐ＝３ꎬｄｏｐ＝３６６９.２６ＣＳＰ＋ＫＬＰＰ６５.００ｐ＝１ꎬｄｏｐ＝７２６５.００ｐ＝１ꎬｄｏｐ＝２３６３.３３ｐ＝１ꎬｄｏｐ＝１１６４.４４ＣＳＰ＋ＫＬＤＡ６９.４４ｐ＝１ꎬｄｏｐ＝５２６５.８３ｐ＝１ꎬｄｏｐ＝２９６５.８３ｐ＝１ꎬｄｏｐ＝２１６７.０３ＣＳＰ＋本文算法８８.３３ｐ＝１ꎬｄｏｐ＝４０７１..６７ｐ＝３ꎬｄｏｐ＝２０４６８.３３ｐ＝２ꎬｄｏｐ＝１０５７６.１１表３㊀Ｄａｔａｓｅｔ２ａ数据集中不同特征提取算法的最佳交叉验证结果特征提取算法分类正确率/％ꎬ(ｐꎬｄｏｐ)２Ａ０１２Ａ０２２Ａ０３２Ａ０４２Ａ０５２Ａ０６２Ａ０７２Ａ０８２Ａ０９平均值ＣＳＰ７６.３９ｐ＝２８０.５６ｐ＝１５４.８３ｐ＝１５１.６７ｐ＝１５９.７２ｐ＝４７７.７８ｐ＝１５６.９３ｐ＝３６７.７３ｐ＝１４７.２２ｐ＝２６３.６５ＣＳＰ＋Ｂ２ＤＤＬＰＰ８２.４６ｐ＝１ｄｏｐ＝５２６４.２６ｐ＝２ｄｏｐ＝９８８２.９９ｐ＝１ｄｏｐ＝９６３.５０ｐ＝２ｄｏｐ＝５２６９.７８ｐ＝１ｄｏｐ＝６９５０.７３ｐ＝１ｄｏｐ＝８８７.８６ｐ＝１ｄｏｐ＝４１８１.９３ｐ＝３ｄｏｐ＝５６６８.４３ｐ＝１ｄｏｐ＝５３７２.４４ＣＳＰ＋ＫＰＣＡ７６.４１ｐ＝２ｄｏｐ＝２５６０.０８ｐ＝２ｄｏｐ＝５７５.００ｐ＝１ｄｏｐ＝７８６０.８３ｐ＝３ｄｏｐ＝１０７６６.６８ｐ＝１ｄｏｐ＝４５４９.６４ｐ＝４ｄｏｐ＝８２８７.５２ｐ＝１ｄｏｐ＝８８０.９１ｐ＝４ｄｏｐ＝６３６７.０１ｐ＝２ｄｏｐ＝１２７６９.３４ＣＳＰ＋ＫＬＰＰ７２.５７ｐ＝１ｄｏｐ＝７２５５.８７ｐ＝１ｄｏｐ＝６３７４.９８ｐ＝１ｄｏｐ＝５６５４.１５ｐ＝１ｄｏｐ＝１４５７.３０ｐ＝１ｄｏｐ＝６６４３.４１ｐ＝１ｄｏｐ＝５５７８.７８ｐ＝１ｄｏｐ＝６４７０.５０ｐ＝１ｄｏｐ＝４６６３.１８ｐ＝１ｄｏｐ＝１６３.４２ＣＳＰ＋ＫＬＤＡ７３.９３ｐ＝１ｄｏｐ＝１４５５.２３ｐ＝１ｄｏｐ＝２０７８.１５ｐ＝１ｄｏｐ＝３８５７.６５ｐ＝１ｄｏｐ＝５５５２.７８ｐ＝１ｄｏｐ＝５１４３.０４ｐ＝１ｄｏｐ＝２１７８.７８ｐ＝１ｄｏｐ＝１７６７.７６ｐ＝１ｄｏｐ＝５１６３.５６ｐ＝１ｄｏｐ＝２３６３.４３ＣＳＰ＋本文算法８３.３２ｐ＝３ｄｏｐ＝１５０６３.９１ｐ＝３ｄｏｐ＝１０４８６.１３ｐ＝１ｄｏｐ＝５３６０.７８ｐ＝３ｄｏｐ＝１８４６９.０９ｐ＝２ｄｏｐ＝１１０６７.００ｐ＝１ｄｏｐ＝７０８７.１４ｐ＝２ｄｏｐ＝１１３８１.６０ｐ＝２ｄｏｐ＝７３７１.８６ｐ＝２ｄｏｐ＝６４７４.５４㊀㊀可以看出ꎬ在两个不同数据集中ꎬ整体上本文改进后算法的分类结果都优于其余五种算法ꎬ相比加入Ｂ２ＤＤＬＰＰ算法有小幅度提升ꎬ而对比于其余四种算法ꎬ本文算法均表现出明显的优越性ꎮ如表３和表４所示ꎬ在数据集Ｄａｔａｓｅｔ３ａ上ꎬ其平均分类精确度相较于ＣＳＰ㊁ＣＳＰ＋Ｂ２ＤＤＬＰＰ㊁ＣＳＰ＋ＫＰＣＡ㊁ＣＳＰ＋ＫＬＰＰ以及ＣＳＰ＋ＫＬＤＡ五种算法分别提升了４.７１％㊁４.４４％㊁６.８５％㊁１１.６７％及９.０８％ꎻ在数据集Ｄａｔａｓｅｔ２ａ上ꎬ也分别提升了１０.８９％㊁２.１％㊁５.２％㊁１１.１２％及１１.１１％ꎮ从单个受试者的分类结果来看ꎬ本文算法对分类性能的提升在数据集Ｄａｔａｓｅｔ３ａ上表现得更为明显ꎬ且相比其他算法均有很大提升ꎮ与应用Ｂ２ＤＤＬＰＰ算法相比ꎬ除２Ａ０６受试者的分类精度增加了１６.２７％之外ꎬ２Ａ０２㊁２Ａ０４受试者的分类精确度有少许降低ꎬ但差距很小ꎬ大部分受试者的分类精度均有小幅度提升ꎮ这足以证明处理脑电信号时考虑数据中存在的非线性关系意义重大ꎮ相比于其他五种算法ꎬ仅使用ＣＳＰ算法的分类结果波动较大ꎬ在受试者２Ａ０２和２Ａ０６上表现出较高的分类性能ꎬ而在其余受试者的数据上表现不佳ꎮ这可能是由于本文实验为了确保通道结构的完整性ꎬ使用了所有采集通道的数据ꎬ这带来了冗余的数据和噪声ꎬ而ＣＳＰ算法对数据预处理的要求很高ꎬ对于噪声的鲁棒性较差ꎮ相比于Ｂ２ＤＤＬＰＰ方法ꎬ本文算法通过引入核函数加强了对数据非线性特征的提取能力ꎬ在处理脑电数据上的表现有了一定程度的提升ꎮＫＰＣＡ㊁ＫＬＰＰ以及ＫＬＤＡ算法虽然为非线性特征提取方法ꎬ但在实验中的分类性能表现均不理想ꎬ这是由于这类向量化特征提取方法会在一定程度上造成空间信息的丢失ꎬ破坏了数据的结构特征ꎬ使得提取后的特征区分度降低ꎬ从而导致最终的分类准确率不佳ꎮ图４㊁图５及图６分别为样本原始特征㊁样本特征经ＦＢＣＳＰ预处理后以及样本特征由本文算法提８０５第４期祝㊀磊ꎬ朱洁萍等:基于核方法与流形学习的运动想象脑电信号特征提取算法㊀㊀取后的特征值分布ꎮ可以直观地看出ꎬ经ＦＢＣＳＰ处理后特征有一定区分度但仍有较多重叠ꎬ而经过本文方法进行特征提取后ꎬ左手㊁右手及舌头样本特征几乎可以完全区分ꎬ足部特征的区分度也有了较大提升ꎮ图４㊀原始样本特征分布图５㊀ＦＢＣＳＰ预处理后样本特征分布图６㊀本文算法特征提取后样本特征分布值得注意的是ꎬ分类精度在一定程度上受输入分类器的特征数据维度的影响ꎮ由图７与图８可见ꎬ随着维数ｄ的增加ꎬ分类精度也缓慢增加ꎬ最终趋于平缓ꎮ且由图７可以看出ꎬ相比其他对比算法ꎬ本文算法在各维数上的分类精度总体来说最佳ꎬ在低维数的情况下也能实现较高的准确率ꎮ上述这些结果表明ꎬ矩阵结构的数据中存在着图７㊀在Ｄａｔａｓｅｔ３ａ数据集上应用本文算法且ｐ＝２时不同维度对分类精度的影响对比图８㊀在受试Ｋ３ｂ上应用不同算法且ｐ＝２时不同维度对分类精度的影响对比重要的空间联系ꎬ不同特征提取方法对于空间信息和结构信息具有不同的提取能力ꎬ并且这种提取的效果决定了最终的准确率ꎮ本文算法将协方差矩阵分成行和列两部分ꎬ能够对脑电数据中的空间和频率信息有更好的捕获能力ꎬ从而提取出更加具有判别力的特征ꎮ利用核方法计算高维空间中的核矩阵以及类内和类间权值矩阵ꎬ并将低维脑电数据进行转换ꎬ获得新的投影矩阵进行特征的提取ꎬ相比于传统的流形学习特征提取方法增加了对非线性特征的提取能力ꎬ同时保留了对空间和频率信息的利用ꎬ在处理脑电数据上的表现有了一定程度的提升ꎮ４㊀结论本文提出了核－双向二维判别局部保留投影算法ꎬ将原始样本投影到了高维的核空间当中ꎬ使得线性不可分的脑电数据在高维空间中的特征更加具有区分性ꎮ改进后的算法利用核方法计算高维空间中的核矩阵以及类内和类间权值矩阵ꎬ并将低维脑电数据进行转换ꎬ获得新的投影矩阵以进行特征的提取ꎮ实验结果表明ꎬ核方法可以有效地在高维特征空间提高算法性能ꎬ相比于传统流形学习算法增加了对非线性特征的提取能力ꎬ同时保留了对空间和频率信息的利用ꎬ在处理脑电数据上的表现有了一定程度的提升ꎮ本文算法在判别特征的提取上有了较好的优化和改进ꎮ９０５传㊀感㊀技㊀术㊀学㊀报ｃｈｉｎａｔｒａｎｓｄｕｃｅｒｓ.ｓｅｕ.ｅｄｕ.ｃｎ第３５卷参考文献:[１]㊀ＳｃｈａｌｋＧꎬＭｃｆａｒｌａｎｄＤＪꎬＨｉｎｔｅｒｂｅｒｇｅｒＴꎬｅｔａｌ.ＢＣＩ２０００:ＡＧｅｎｅｒａｌ￣ｐｕｒｐｏｓｅＢｒａｉｎ￣ＣｏｍｐｕｔｅｒＩｎｔｅｒｆａｃｅ(ＢＣＩ)Ｓｙｓｔｅｍ[Ｊ].ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＢｉｏｍｅｄｉｃａｌＥｎｇｉｎｅｅｒｉｎｇꎬ２００４ꎬ５１(６):１０３４－１０４３.㊀[２]高上凯ꎬ张志广ꎬ高小榕ꎬ等.基于脑－机接口技术的新型医疗器械[Ｊ].中国医疗器械杂志ꎬ２００６ꎬ３０(２):７９－８２. [３]程明ꎬ任宇鹏ꎬ高小榕ꎬ等.脑电信号控制康复机器人的关键技术[Ｊ].机器人技术与应用ꎬ２００３(４):４５－４８.[４]ＣｈａｔｔｅｒｊｅｅＲꎬＭｏｉｔｒａＴꎬＩｓｌａｍＳＨꎬｅｔａｌ.ＡＮｏｖｅｌＭａｃｈｉｎｅＬｅａｒｎｉｎｇＢａｓｅｄＦｅａｔｕｒｅＳｅｌｅｃｔｉｏｎｆｏｒＭｏｔｏｒＩｍａｇｅｒｙＥＥＧＳｉｇｎａｌＣｌａｓｓｉｆｉｃａｔｉｏｎｉｎＩｎｔｅｒｎｅｔｏｆＭｅｄｉｃａｌＴｈｉｎｇｓＥｎｖｉｒｏｎｍｅｎｔ[Ｊ].ＦｕｔｕｒｅＧｅｎｅｒａｔｉｏｎＣｏｍｐｕｔｅｒＳｙｓｔｅｍｓꎬ２０１９ꎬ９８(３):４１９－４３４.[５]ＡｍｉｎＨＵꎬＭａｌｉｋＡＳꎬＡｈｍａｄＲＦꎬｅｔａｌ.ＦｅａｔｕｒｅＥｘｔｒａｃｔｉｏｎａｎｄＣｌａｓｓｉｆｉｃａｔｉｏｎｆｏｒＥＥＧＳｉｇｎａｌｓＵｓｉｎｇＷａｖｅｌｅｔＴｒａｎｓｆｏｒｍａｎｄＭａ￣ｃｈｉｎｅＬｅａｒｎｉｎｇＴｅｃｈｎｉｑｕｅｓ[Ｊ].ＡｕｓｔｒａｌａｓｉａｎＰｈｙｓｉｃａｌ＆ＥｎｇｉｎｅｅｒｉｎｇＳｃｉｅｎｃｅｓｉｎＭｅｄｉｃｉｎｅꎬ２０１５ꎬ３８(１):１３９－１４９. [６]ＳｕｂａｓｉＡꎬＧｕｒｓｏｙＭＩ.ＥＥＧＳｉｇｎａｌＣｌａｓｓｉｆｉｃａｔｉｏｎＵｓｉｎｇＰＣＡꎬＩＣＡꎬＬＤＡａｎｄＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅｓ[Ｊ].ＥｘｐｅｒｔＳｙｓｔｅｍｓＷｉｔｈＡｐ￣ｐｌｉｃａｔｉｏｎｓꎬ２０１０ꎬ３７(１２):８６５９－８６６６.[７]ＭｏｕｌｅｅｓｈｕｗａｒａｐｐｒａｂｕＲꎬＫａｓｔｈｕｒｉＮ.ＮｏｎｌｉｎｅａｒＶｅｃｔｏｒＤｅｃｏｍｐｏｓｅｄＮｅｕｒａｌＮｅｔｗｏｒｋＢａｓｅｄＥＥＧｓｉｇｎａｌＦｅａｔｕｒｅＥｘｔｒａｃｔｉｏｎａｎｄＤｅｔｅｃｔｉｏｎｏｆＳｅｉｚｕｒｅ[Ｊ].ＭｉｃｒｏｐｒｏｃｅｓｓｏｒｓａｎｄＭｉｃｒｏｓｙｓｔｅｍｓꎬ２０２０ꎬ７６(４):１－１１. [８]李章勇ꎬ万小勤ꎬ左晶ꎬ等.基于独立成分分析的癫痫脑电分析算法[Ｊ].电子世界ꎬ２０１７(５):８－９.[９]ＲａｈｍａｎＭＡꎬＨｏｓｓａｉｎＭＦꎬＨｏｓｓａｉｎＭꎬｅｔａｌ.ＥｍｐｌｏｙｉｎｇＰＣＡａｎｄｔ￣ＳｔａｔｉｓｔｉｃａｌＡｐｐｒｏａｃｈｆｏｒＦｅａｔｕｒｅＥｘｔｒａｃｔｉｏｎａｎｄＣｌａｓｓｉｆｉｃａｔｉｏｎｏｆＥｍｏｔｉｏｎｆｒｏｍＭｕｌｔｉｃｈａｎｎｅｌＥＥＧＳｉｇｎａｌ[Ｊ].ＥｇｙｐｔｉａｎＩｎｆｏｒｍａｔｉｃｓＪｏｕｒｎａｌꎬ２０２０ꎬ２１(１):２３－３５.[１０]ＤｏｄｉａＳꎬＥｄｌａＤＲꎬＢａｂｌａｎｉＡꎬｅｔａｌ.ＡｎＥｆｆｉｃｉｅｎｔＥＥＧＢａｓｅｄＤｅｃｅｉｔＩｄｅｎｔｉｆｉｃａｔｉｏｎＴｅｓｔＵｓｉｎｇＷａｖｅｌｅｔＰａｃｋｅｔＴｒａｎｓｆｏｒｍａｎｄＬｉｎｅａｒＤｉｓｃｒｉｍｉｎａｎｔＡｎａｌｙｓｉｓ[Ｊ].ＪｏｕｒｎａｌｏｆＮｅｕｒｏｓｃｉｅｎｃｅＭｅｔｈｏｄｓꎬ２０１９ꎬ３１４(１５):３１－４０.[１１]刘冲ꎬ赵海滨ꎬ李春胜ꎬ等.基于ＣＳＰ与ＳＶＭ算法的运动想象脑电信号分类[Ｊ].东北大学学报(自然科学版)ꎬ２０１０ꎬ３１(８):１０９８－１１０１.[１２]ＧｕｇｅｒＣꎬＲａｍｏｓｅｒＨꎬＰｆｕｒｔｓｃｈｅｌｌｅｒＧ.Ｒｅａｌ￣ＴｉｍｅＥＥＧＡｎａｌｙｓｉｓＷｉｔｈＳｕｂｊｅｃｔ￣ＳｐｅｃｉｆｉｃＳｐａｔｉａｌＰａｔｔｅｒｎｓｆｏｒａＢｒａｉｎ￣ＣｏｍｐｕｔｅｒＩｎｔｅｒ￣ｆａｃｅ(ＢＣＩ)[Ｊ].ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＲｅｈａｂｉｌｉｔａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇꎬ２０００ꎬ８(４):４４７－４５６.[１３]ＧｕｂｅｒｔＰＨꎬＣｏｓｔａＭＨꎬＳｉｌｖａＣＤꎬｅｔａｌ.ＴｈｅＰｅｒｆｏｒｍａｎｃｅＩｍｐａｃｔｏｆＤａｔａＡｕｇｍｅｎｔａｔｉｏｎｉｎＣＳＰ￣ＢａｓｅｄＭｏｔｏｒ￣ＩｍａｇｅｒｙＳｙｓｔｅｍｓｆｏｒＢＣＩＡｐｐｌｉｃａｔｉｏｎｓ[Ｊ].ＢｉｏｍｅｄｉｃａｌＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇａｎｄＣｏｎｔｒｏｌꎬ２０２０ꎬ６２(１):１－１２.[１４]ＭｉａｏＹＹꎬＪｉｎＪꎬＤａｌｙＩꎬｅｔａｌ.ＬｅａｒｎｉｎｇＣｏｍｍｏｎＴｉｍｅ￣Ｆｒｅｑｕｅｎｃｙ￣ＳｐａｔｉａｌＰａｔｔｅｒｎｓｆｏｒＭｏｔｏｒＩｍａｇｅｒｙＣｌａｓｓｉｆｉｃａｔｉｏｎ[Ｊ].ＩＥＥＥＴｒａｎｓ￣ａｃｔｉｏｎｓｏｎＮｅｕｒａｌＳｙｓｔｅｍｓａｎｄＲｅｈａｂｉｌｉｔａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇꎬ２０２１ꎬ２９(１):６９９－７０７.[１５]ＬｉＭꎬＬｕｏＸꎬＹａｎｇＪꎬｅｔａｌ.ＡｐｐｌｙｉｎｇａＬｏｃａｌｌｙＬｉｎｅａｒＥｍｂｅｄｄｉｎｇＡｌｇｏｒｉｔｈｍｆｏｒＦｅａｔｕｒｅＥｘｔｒａｃｔｉｏｎａｎｄＶｉｓｕａｌｉｚａｔｉｏｎｏｆＭＩ￣ＥＥＧ[Ｊ].ＪｏｕｒｎａｌｏｆＳｅｎｓｏｒｓꎬ２０１６ꎬ２０１６:７４８１９４６.[１６]ＺｈｕＬꎬＨｕＱꎬＹａｎｇＪꎬｅｔａｌ.ＥＥＧＳｉｇｎａｌＣｌａｓｓｉｆｉｃａｔｉｏｎＵｓｉｎｇＭａｎｉｆｏｌｄＬｅａｒｎｉｎｇａｎｄＭａｔｒｉｘ￣ＶａｒｉａｔｅＧａｕｓｓｉａｎＭｏｄｅｌ[Ｊ].Ｃｏｍｐｕ￣ｔａｔｉｏｎａｌＩｎｔｅｌｌｉｇｅｎｃｅａｎｄＮｅｕｒｏｓｃｉｅｎｃｅꎬ２０２１ꎬ２０２１ꎬ６６６８８５９. [１７]ＺｈｉＲꎬＲｕａｎＱ.ＦａｃｉａｌＥｘｐｒｅｓｓｉｏｎＲｅｃｏｇｎｉｔｉｏｎＢａｓｅｄｏｎＴｗｏ￣Ｄｉ￣ｍｅｎｓｉｏｎａｌＤｉｓｃｒｉｍｉｎａｎｔＬｏｃａｌｉｔｙＰｒｅｓｅｒｖｉｎｇＰｒｏｊｅｃｔｉｏｎｓ[Ｊ].Ｎｅｕｒｏ￣ｃｏｍｐｕｔｉｎｇꎬ２００８ꎬ７１(７):１７３０－１７３４.[１８]ＡｎｇＫＫꎬＣｈｉｎＺＹꎬＺｈａｎｇＨＨꎬｅｔａｌ.ＦｉｌｔｅｒＢａｎｋＣｏｍｍｏｎＳｐａｔｉａｌＰａｔｔｅｒｎ(ＦＢＣＳＰ)ｉｎＢｒａｉｎ￣ＣｏｍｐｕｔｅｒＩｎｔｅｒｆａｃｅ[Ｃ]//ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｉｎｔＣｏｎｆｅｒｅｎｃｅｏｎＮｅｕｒａｌＮｅｔｗｏｒｋｓ(ＩＪＣＮＮ)ꎬＨｏｎｇｋｏｎｇꎬＣｈｉｎａ:ＩＥＥＥꎬ２００８:２３９０－２３９７.[１９]ＳａｕｎｄｅｒｓＣꎬＳｔｉｔｓｏｎＭＯꎬＷｅｓｔｏｎＪꎬｅｔａｌ.ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ[Ｊ].ＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅꎬ２００２ꎬ１(４):１－２８.[２０]ＴａｎｇｅｒｍａｎｎＭꎬＭüｌｌｅｒＫＲꎬＡｅｒｔｓｅｎＡꎬｅｔａｌ.ＲｅｖｉｅｗｏｆｔｈｅＢＣＩＣｏｍｐｅｔｉｔｉｏｎＩＶ[Ｊ].ＦｒｏｎｔＮｅｕｒｏｓｃｉꎬ２０１２ꎬ５５(６):１－６. [２１]ＳｃｈｌöｇｌＡꎬＬｅｅＦꎬＢｉｓｃｈｏｆＨꎬｅｔａｌ.ＣｈａｒａｃｔｅｒｉｚａｔｉｏｎｏｆＦｏｕｒ￣ＣｌａｓｓＭｏｔｏｒＩｍａｇｅｒｙＥＥＧＤａｔａｆｏｒｔｈｅＢＣＩ￣Ｃｏｍｐｅｔｉｔｉｏｎ２００５[Ｊ].ＪｏｕｒｎａｌｏｆＮｅｕｒａｌＥｎｇｉｎｅｅｒｉｎｇꎬ２００５ꎬ２(４):１４－２２.[２２]ＳｃｈｏｌｋｏｐｆＢꎬＳｍｏｌａＡꎬＭｕｌｌｅｒＫ.ＮｏｎｌｉｎｅａｒｃｏｍｐｏｎｅｎｔＡｎａｌｙｓｉｓａｓａＫｅｒｎｅｌＥｉｇｅｎｖａｌｕｅＰｒｏｂｌｅｍ[Ｊ].ＮｅｕｒａｌＣｏｍｐｕｔａｔｉｏｎꎬ１９９８ꎬ１０(５):１２９９－１３１９.[２３]ＭｉｋａＳꎬＲａｔｓｃｈＧꎬＷｅｓｔｏｎＪꎬｅｔａｌ.ＦｉｓｈｅｒＤｉｓｃｒｉｍｉｎａｎｔＡｎａｌｙｓｉｓｗｉｔｈＫｅｒｎｅｌｓ[Ｃ]//ＮｅｕｒａｌＮｅｔｗｏｒｋｓｆｏｒＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＩＸ:Ｐｒｏ￣ｃｅｅｄｉｎｇｓｏｆｔｈｅ１９９９ＩＥＥＥＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＳｏｃｉｅｔｙＷｏｒｋｓｈｏｐꎬＢｅｒｌｉｎꎬＧｅｒｍａｎｙ:ＩＥＥＥꎬ１９９９:４１－４８.[２４]ＣｈｅｎｇＪꎬＬｉｕＱꎬＬｕＨꎬｅｔａｌ.ＳｕｐｅｒｖｉｓｅｄＫｅｒｎｅｌＬｏｃａｌｉｔｙＰｒｅｓｅｒｖｉｎｇＰｒｏｊｅｃｔｉｏｎｓｆｏｒＦａｃｅＲｅｃｏｇｎｉｔｉｏｎ[Ｊ].Ｎｅｕｒｏｃｏｍｐｕｔｉｎｇꎬ２００５ꎬ６７(１):４４３－４４９.祝㊀磊(１９７９ )ꎬ男ꎬ江苏无锡人ꎬ博士ꎬ杭州电子科技大学自动化学院(人工智能学院)ꎬ副教授ꎬ硕士生导师ꎬ主要研究方向为脑机接口技术㊁生物信号处理㊁模式识别与智能系统等ꎬｚｈｕｌｅｉ＠ｈｄｕ.ｅｄｕ.ｃｎꎻ朱洁萍(１９９８ )ꎬ女ꎬ湖南常德人ꎬ硕士研究生ꎬ研究方向为脑机接口技术㊁生物信号处理等ꎬｐａｔｒｉｃｉａ０７１１＠１６３.ｃｏｍꎻ张建海(１９７８ )ꎬ男ꎬ山东潍坊人ꎬ博士ꎬ杭州电子科技大学计算机学院ꎬ教授ꎬ硕士生导师ꎬ主要研究方向为脑机交互㊁生物信号处理㊁人工智能等ꎬｊｈｚｈａｎｇ＠ｈｄｕ.ｅｄｕ.ｃｎꎮ０１５。

2024年《走进人工智能》知识考试题及答案

2024年《走进人工智能》知识考试题及答案一、单选题1.在一个神经网络中，下面（）方法可以用来处理过拟合。

A、DropoutB、分批归一化（BatchNormalization）C、正则化（Regularization）D、都可以参考答案：D2.以下几种模型方法属于判别式模型的有（）。

1)混合高斯模型2)条件随机场模型3)区分度训练4)隐马尔科夫模型A、2,3B、3,4C、1,4D、1,2参考答案：A3.神经网络模型因受人类大脑的启发而得名。

神经网络由许多神经元组成，每个神经元接受一个输入，对输入进行处理后给出一个输出。

请问下列关于神经元的描述中，哪一项是正确的？A、每个神经元只有一个输入和一个输出B、每个神经元有多个输入和一个输出C、每个神经元有一个输入和多个输出D、每个神经元有多个输入和多个输出E、上述都正确参考答案：E4.生成对抗网络像是一个博弈系统，生成器生成伪造的样本，判别器判断是真是假，我们理想的结果是（）。

A、生成器产生的样本大致相同B、判别器高效的分辨生成器产生样本的真假C、判别器无法分辨生成器产生样本的真假D、生成器产生的样本不尽相同参考答案：C5.已知：1)大脑是有很多个叫做神经元的东西构成，神经网络是对大脑的简单的数学表达。

2)每一个神经元都有输入、处理函数和输出。

3)神经元组合起来形成了网络，可以拟合任何函数。

4)为了得到最佳的神经网络，我们用梯度下降方法不断更新模型。

给定上述关于神经网络的描述，（）什么情况下神经网络模型被称为深度学习模型？A、加入更多层，使神经网络的深度增加B、有维度更高的数据C、当这是一个图形识别的问题时D、以上都不正确参考答案：A6.梯度下降算法的正确步骤是什么？1)计算预测值和真实值之间的误差2)重复迭代，直至得到网络权重的最佳值3)把输入传入网络，得到输出值4)用随机值初始化权重和偏差5)对每一个产生误差的神经元，调整相应的（权重）值以减小误差A、1,2,3,4,5B、5,4,3,2,1C、3,2,1,5,4D、4,3,1,5,2参考答案：D7.如果一个模型在测试集上偏差很大，方差很小，则说明该模型（）。

KNN算法的改进方法

KNN算法的改进方法K近邻算法是机器学习中常用的一种分类算法。

KNN算法具有简单易懂、易于实现、无需训练等优点，但在处理大量数据时，算法的计算量会变得非常大，同时又会存在维度灾难和样本不平衡等问题。

为了解决这些问题，研究人员提出了许多改进的KNN 算法。

改进方法一：KD-Tree算法K近邻算法基于距离度量来进行分类，传统的KNN算法需要计算每个测试样本与所有已知样本之间的距离，随着样本数量的增加，计算的时间复杂度会呈指数级增长，这样就会导致算法无法简单高效地应用于大规模数据的处理中。

针对这种问题，研究人员提出了KD-Tree算法。

KD-Tree是一种树形数据结构，可以有效地减少样本到测试样本的距离计算量，从而提升算法的分类效率。

具体来说，KD-Tree 算法通过递归的方式将已知样本空间划分成多个区域，每个区域的划分方式采用平行于坐标轴的超平面。

当一个测试样本要被分类时，算法首先确定它在KD-Tree上所处的叶子节点，然后只需要计算测试样本与该叶子节点内的已知样本之间的距离，从而大大减少了计算量。

改进方法二：基于核函数的KNN算法传统的KNN算法只考虑了样本之间的欧几里得距离或曼哈顿距离等常见距离度量，忽略了样本之间的非线性关系。

因此，该算法在处理非线性分类问题时可能会出现一定的局限性。

针对这一问题，研究人员提出了基于核函数的KNN算法。

核函数是一种数学技巧，用于将非线性映射变成线性映射。

基于核函数的KNN算法通过对样本进行非线性映射，将样本从低维空间映射到高维空间，从而使得在高维空间中欧式距离近的样本在低维空间中也保持足够的相似性。

同时，算法还采用加权投票的方式以获得更好的分类结果。

改进方法三：SMOTE算法传统的KNN算法针对样本不平衡问题，在数据预处理阶段通常会采用欠采样或过采样等方法来平衡样本。

欠采样方法常常会丢失重要的信息，而过采样方法则可能会引入噪声或重复样本数据。

为了解决这一问题，研究人员提出了SMOTE算法。

凸二次规划基于新的核函数的大步校正原始-对偶内点算法

ｐｒｏｖｅｔｈｅｐｏｌｙｎｏｍｉａｌｃｏｍｐｌｅｘｉｔｙｂｏｕｎｄｏｆａｌａｒｇｅ — ｕｐｄａｔｅｐｒｉｍａｌ — ｄｕａｌｉｎｔｅｒｉｏｒ — ｐｏｉｎｔｍｅｔｈｏｄｆｏｒ（ＣＱＰ）ｔｏ０（ √ ｎ
第３５卷第２期２０１３年４月
三峡大学学报（自然科学版）
ＪｏｆＣｈｉｎａＴｈｒｅｅＧｏｒｇｅｓＵｎｉｖ．（ＮａｔｕｒａｌＳｃｉｅｎｃｅｓ）３
凸二次规划基于新的核函数的大步校正原始一对偶内点算法
汪燕张明望
（三峡大学理学院，湖北宜昌４４３００２）
摘要：本文对凸二次规划提出了一种基于新的核函数的大步校正原始一对偶内点算法．这种核函数构造新的障碍函数不仅可以定义新的搜索方向，而且可以控制内迭代的过程，使得对凸二次规划提出的大步校正原始一对偶内点算法的多项式复杂性阶改善到０（ √ （１ｏｇｎ）ｌｏｇ（ｎ／ｅ）），优于基于经典对数障碍函数的相应算法的复杂性阶．关键词：凸二次规划；原始一对偶内点算法；核函数；大步校正方法；多项式复杂性中图分类号：０２２１文献标识码：Ａ文章编号：１６７２ — ９４８Ｘ（２０１３）０２ — ０１００ — ０４

核函数的实现和应用

核函数的实现和应用核函数是一种优秀的机器学习算法，它可以将高维度数据通过非线性变换映射到低维度的子空间中，用来进行分类或回归。

简单来说，核函数就是一种基于向量内积的函数，可以应用于支持向量机（SVM）等机器学习算法中，使得分类器的性能更加优秀。

一、核函数的实现核函数的实现通常有两种方法：一种是通过数值计算来实现，这种方法适用于简单的核函数，例如径向基函数（RBF）核函数；另一种是通过显式地定义核函数来实现，这种方法适用于复杂的核函数，例如多项式核函数。

1. 数值计算法对于径向基函数核函数，其公式如下：K(x_i, x_j) = exp(-||x_i-x_j||^2/2sigma^2 )其中，x_i和x_j分别表示训练集中的两个样本，sigma为高斯核的带宽参数。

该公式可以通过数值计算来实现，具体步骤如下：（1）计算训练集样本之间的欧几里得距离。

（2）将欧几里得距离除以2sigma^2 。

（3）将结果取负值并进行指数运算。

（4）最终得到核函数的值。

2. 定义核函数法对于复杂的核函数，可以显式地将核函数定义出来，并直接应用到机器学习算法中。

例如，多项式核函数的定义如下：K(x_i, x_j) = (x_i^Tx_j + c)^d其中，c和d分别为常数，x_i和x_j分别表示训练集中的两个样本。

这种方法的优点是可以更容易地定义出多种复杂的核函数，缺点是实现时需要考虑到纬度的规模。

二、核函数的应用核函数在机器学习中有着广泛的应用，下面将具体介绍一些核函数在SVM等机器学习算法中的应用。

1. 线性核函数线性核函数是SVM最简单的核函数之一，其公式如下：K(x_i, x_j) = x_i^Tx_j这种核函数的主要优点是计算速度快、参数较少，且在数据集线性可分的情况下具有好的分类性能。

2. 多项式核函数K(x_i, x_j) = (x_i^Tx_j + c)^d其中，c和d分别为常数。

该核函数的优点在于其能够表达出非线性的分类决策边界，但是需要注意的是，该核函数容易产生过拟合现象。

核函数公式

核函数公式
核函数是机器学习中常用的一种工具，用于将低维数据映射到高维特征空间中，以便更好地进行分类或回归等任务。

核函数的本质是一种相似度度量，它通过计算两个样本在特征空间中的距离来确定它们的相似程度。

本文将介绍常见的几种核函数及其特点。

1. 线性核函数
线性核函数是最简单的核函数之一，它的公式为K(x,y)=x*y。

它的特点是将数据映射到同一维度的特征空间中，效果较差，适用于数据本身线性可分的情况。

2. 多项式核函数
多项式核函数是将数据映射到高维特征空间的一种方式，它的公式为K(x,y)=(x*y+1)^d，其中d为多项式的次数。

它的特点是可以处理一些非线性可分的情况，但需要选择合适的多项式次数，否则会出现过拟合或欠拟合的问题。

3. 径向基核函数
径向基核函数是常用的一种核函数，它的公式为K(x,y)=exp(-||x-y||^2/2σ^2)，其中σ为控制函数衰减速度的参数。

它的特点是可以将数据映射到无穷维的特征空间中，适用于处理复杂的非线性可分问题。

但需要注意的是，径向基核函数对参数的选择比较敏感，不当的参数选择可能会导致分类效果不佳。

4. Sigmoid核函数
Sigmoid核函数是一种常用的核函数，它的公式为K(x,y)=tanh(αx*y+β)，其中α和β为参数。

它的特点是可以处理一些非线性可分的问题，但需要选择合适的参数，否则会出现过拟合或欠拟合的问题。

此外，Sigmoid核函数在实践中并不常用。

以上是常见的几种核函数，它们各自有不同的特点和适用范围。

在使用核函数时，需要根据具体问题选择合适的核函数及其参数，以获得最佳的分类或回归效果。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

7
.
VC维
8
Vanik和Chervonenkis(1968)提出了VC维的概念。 VC维：对于一个指示函数（即只有0和1两种取值的函
数）集，如果存在h个样本能够被函数集里的函数按照所有可能的2h种形式分开，则称函数集能够把h个样本打散，函数集的VC维就是能够打散的最大样本数目。 VC维是描述函数集或学习机器的复杂性或者说是学习能力的一个重要指标,在此概念基础上发展出了一系列关于统计学习的一致性、收敛速度、泛化性能等的重要结论。
.
13
.
14
核方法分为核函数设计和算法设计两个部分,具体情况如图1 所示。核方法的实施步骤,具体描述为: ①收集和整理样本, 并进行标准化; ②选择或构造核函数; ③ 用核函数将样本变换成为核矩阵; ④在特征空间对核矩阵实施各种线性算法;⑤ 得到输入空间中的非线性模型。
.
核函数
主要的核函数有三类：多项式核函数
其中，xi 是训练元组，xi∈Rm，yi是类标号， yi∈{1,-1}。
若存在超平面( hyperplane):
ω·x + b = 0
(1)
.
19
其中·表示向量的点积，如图1 所示，超平面能将这n 个
样本分为两类,那么存在最优超平面不仅能将两类样本准
确分开，而且能使两类样本到超平面的距离最大。式(1)
统计学习理论为研究有限样本情况下的模式识别、函数拟合和概率密度估计等三种类型的机器学习问题提供了理论框架，同时也为模式识别发展了一种新的分类方法——支持向量机。
.
6 机器学习
机器学习是现代智能技术中重要的一个方面，研究从观测样本出发去分析对象，去预测未来。
机器学习的基本模型：
输出y与x之间存在一种固定的、但形式未知的联合概率分布函数 F(y,x)。
在样本数目有限时是不合理的,因此，需要同时最小化经验风险和置信范围。统计学习理论提出了一种新的策略,即把函数集构造为一个函数子集序列,使各个子集按照VC维的大小排列;在每个子集中寻找最小经验风险,在子集间折衷考虑经验风险和置信范围,取得实际风险的最小。这种思想称作结构风险最小化准则(Structural Risk Minimization Principle)。
Kernel-Based Learning Algorithms
1
.
2
引言
近几年，出现了一些基于核函数的机器学习方法，例如：SVM（可支持向量机）、KFD （基于核的Fisher判别分析）、KPCA（核主成分分析）等。这些方法在分类问题、回归问题以及无监督学习上都具有现实意义。这些核函数方法已经成功应用到模式识别的各个领域，比如目标识别、文本分类、时间序列预测等等
径向基函数
S形函数
15
.
16
有监督学习
(supervised learning)
监督学习，就是人们常说的分类，通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就具有了对未知数据进行分类的能力。
.
12
核函数
在处理线性分类问题时，数据以点积的形式( xi ·xj ) 出现。而在处理非线性分类问题时，需要采用非线性映射把输入空间映射到高维特征空间，记为：当在特征空间H 中构造最优超平面时，训练算法仅使用空间中的点积，即
存在一种核函数K,使得:
核函数将m维高维空间的内积运算转化为n维低维输入空间的核函数计算，从而巧妙地解决了在高维特征空间中计算的“维数灾难”等问题。
中的ω和b 乘以系数后仍能满足方程，进行归一化处理之
后，对于所有样本xi ，式| ω·xi + b| 的最小值为1 , 则样本与此最优超平面的最小距离为|ω·xi + b |/‖ω‖= 1/‖ω‖,那么最优超平面应满足条件:
.
9
该线性分类函数的VC维即为3
.
10
一般而言,VC维越大, 学习能力就越强,但学习机器也越复杂。
目前还没有通用的关于计算任意函数集的VC 维的理论,只有对一些特殊函数集的VC维可以准确知道。
.
11 结构风险最小化准则
Vapnik和Chervonenkis(1974)提出了SRM。传统机器学习方法中普遍采用的经验风险最小化原则
典型的例子就是SVM（可支持向量机）、KFD （基于核的Fisher判别分析）。
.
17 SVM（Support vector machines)
SVM是基于SLT的一种机器学习方法。简单的说，就是将数据单元表示在多维空间中，然后对这个空间做划分的算法。
SVM是建立在统计学习理论的VC维理论和结构风险最小原理基础上的，根据有限的样本信息在模型的复杂性之间寻求最佳折衷，以期获得最好的推广（泛化）能力。
.
3
理论基础监督学习:SVM、KFD 无监督学习：KPCA 模型选择
.
4 理ห้องสมุดไป่ตู้基础
机器学习 VC维结构风险最小化原则
.
5 SLT(Statistical Learning Theory)
上世纪90年代中才成熟的统计学习理论，是在基于经验风险的有关研究基础上发展起来的，专门针对小样本的统计理论。
学习机中有函数集{f(x,w)}，可估计输入与输出之间依赖关系，其中w为广义参数。
.
风险最小化－机器学习问题表示
已知变量y与输入x之间存在一定的未知依赖关系，即联合概率分布F(x,y) 机器学习就是根据独立同分布的n个观测样本： (x1, y1), (x2, y2), ···, (xn, yn)
在一组函数{f(x,w)}中求一个最优函数f(x,w0)，使预测的期望风险R(w)最小化。
R(w) L( y, f (x, w))dF(x, y)
L(y, {f(x,w)})为损失函数，由于对y进行预测而造成的损失；w为函数的广义参数，故{f(x,w)}可表示任何函数集；F(x,y) 为联合分布函数。
.
18
支持向量机方法建立在统计学习理论基础之上，专门针对小样本情况下的机器学习问题。对于分类问题，支持向量机方法根据区域中的样本计算该区域的分类曲面，由该曲面决定该区域中的样本类别。
已知样本x 为m 维向量, 在某个区域内存在n个样本:
(x1,y1)，(x2,y2)，…，(xn,yn)

基于核函数的学习算法

合集下载

基于各向异性核函数的均值漂移跟踪算法

核聚类算法

基于核函数的支持向量机样本选取算法

数据分析知识：数据挖掘中的监督学习和无监督学习

增量学习算法的研究及其在数据挖掘中的应用

基于核函数的学习算法

高斯核函数计算

基于混合核函数的SVM及其应用(精)

kkrt算法原理

基于核函数的Adaboost分类算法研究

基于核的最小均方误差改进算法及其应用

基于核方法与流形学习的运动想象脑电信号特征提取算法

2024年《走进人工智能》知识考试题及答案

KNN算法的改进方法

凸二次规划基于新的核函数的大步校正原始-对偶内点算法

核函数的实现和应用

核函数公式

文档推荐

最新文档