基于特征模式提取的时间序列分类系统方案
- 格式:ppt
- 大小:1.25 MB
- 文档页数:25
人工智能技术中的特征提取与选择方法随着人工智能技术的发展,特征提取与选择方法成为了人工智能领域中的重要研究内容。
特征提取与选择方法是指从原始数据中提取出有用的特征,并选择出对问题最有意义的特征。
本文将探讨人工智能技术中的特征提取与选择方法,以及其在不同领域的应用。
特征提取是将原始数据转化为有意义的特征的过程。
在人工智能领域中,特征提取是解决问题的关键步骤之一。
特征提取的目标是找到能够最好地表示数据的特征。
常用的特征提取方法包括统计特征提取、频域特征提取和时域特征提取等。
统计特征提取是一种常用的特征提取方法。
它通过对数据进行统计分析,提取出数据的均值、方差、最大值、最小值等统计特征。
统计特征提取方法简单直观,适用于各种类型的数据。
例如,在图像识别中,可以提取图像的亮度、颜色分布等统计特征,用于图像分类和识别。
频域特征提取是通过对数据进行傅里叶变换或小波变换,将数据转化到频域进行分析。
频域特征提取方法可以捕捉到数据的频率信息,适用于信号处理和音频处理等领域。
例如,在语音识别中,可以提取语音信号的频谱特征,用于语音识别和语音合成。
时域特征提取是直接对原始数据进行分析,提取出数据的时序特征。
时域特征提取方法适用于时间序列数据和运动轨迹数据等。
例如,在行为识别中,可以提取运动轨迹的速度、加速度等时域特征,用于行为分析和动作识别。
特征选择是从提取出的特征中选择出对问题最有意义的特征的过程。
特征选择的目标是降低特征维度,提高模型的泛化能力。
常用的特征选择方法包括过滤式特征选择、包裹式特征选择和嵌入式特征选择等。
过滤式特征选择是通过对特征进行评估和排序,选择出与目标变量相关性最高的特征。
过滤式特征选择方法独立于具体的学习算法,适用于各种类型的数据。
例如,在文本分类中,可以通过计算词频-逆文档频率(TF-IDF)来评估单词对文本分类的重要性,从而选择出最有意义的特征。
包裹式特征选择是将特征选择看作是一个搜索问题,通过尝试不同的特征子集来找到最佳的特征组合。
时间序列早期分类综述马超红;翁小清【摘要】在总结了近年来关于时间序列早期分类相关文献和相关研究进展的基础上,对参考文献中的学术观点、分类方法进行了比较归类,内容涵盖了时间序列原始数据的早期分类,时间序列早期分类的特征提取与选择、评估方法,早期分类构造模型等方面,为研究者了解最新的时间序列早期分类研究动态、新技术、发展趋势提供了参考.【期刊名称】《微型机与应用》【年(卷),期】2016(035)016【总页数】4页(P13-15,19)【关键词】时间序列;早期分类;特征提取与选择【作者】马超红;翁小清【作者单位】河北经贸大学信息技术学院,河北石家庄050061;河北经贸大学信息技术学院,河北石家庄050061【正文语种】中文【中图分类】TP391.4引用格式:马超红,翁小清. 时间序列早期分类[J].微型机与应用,2016,35(16):13-15,19.时间序列在狭义上是指按时间顺序有次序的一组数据,而广义上任何实值型的有次序的序列都可以当作时间序列来处理。
时间序列分类被广泛应用在医学诊断、灾害预测、入侵检测、过程控制、道路交通等生活中的方方面面。
而在很多领域中越早做出分类对于指导决策越有利,时间序列的早期分类应运而生,并在一些时间敏感的应用领域至关重要,例如健康信息学、灾害预测、入侵检测、股市行情预测等领域。
时间序列早期分类即针对时间序列数据尽早地做出预测,并满足预期的预测质量(准确率)。
换句话说,在满足一个给定的最小的准确率情况下,早期分类尝试着优化分类的早期性,而不是像其他一般分类方法那样只追求最大化准确率[1]。
时间序列的早期分类方法大致分为三类:基于原始数据、基于特征和基于模型的分类方法。
时间序列的早期分类是近几年逐渐开始研究的,Xing Zhengzheng等人[2]在2008年对序列数据的早期预测进行了研究,提出了SCR(Sequential Classification Rule)方法和GSDT(Generalized Sequential Decision Tree)方法。
《时间序列数据异常检测方法研究与应用》一、引言时间序列数据是按时间顺序排列的数据集,常用于各种领域如金融、医疗、工业等。
异常检测则是从这些数据中识别出与常规模式不符的异常点或异常事件的过程。
本文将深入探讨时间序列数据异常检测的方法,并分析其在实际应用中的效果。
二、时间序列数据异常检测的重要性时间序列数据异常检测在许多领域都具有重要的应用价值。
在金融领域,可以用于检测股价异常波动、交易欺诈等行为;在医疗领域,可以用于监测患者生理指标的异常变化,以实现早期预警和干预;在工业领域,可以用于监测设备运行状态,及时发现故障并进行维护。
因此,研究时间序列数据异常检测方法具有重要的现实意义。
三、时间序列数据异常检测方法1. 基于统计的方法基于统计的异常检测方法是通过计算数据的统计特征,如均值、方差、标准差等,来识别异常值。
这种方法简单易行,但需要预先设定阈值,且对于复杂的时间序列数据可能效果不佳。
2. 基于机器学习的方法(1)自回归模型:自回归模型通过分析时间序列的历史数据来预测未来的值,然后根据实际值与预测值的差异来判断是否为异常。
(2)循环神经网络(RNN):RNN能够处理具有时间依赖性的数据,通过学习历史数据来预测未来的趋势和异常。
(3)无监督学习方法:如聚类算法和降维算法等,通过将时间序列数据映射到低维空间或不同的聚类中,来识别与常规模式不符的异常点。
3. 基于深度学习的方法(1)长短期记忆网络(LSTM):LSTM是一种特殊的循环神经网络,能够有效地处理长时间依赖问题,适用于时间序列数据的异常检测。
(2)变分自编码器(VAE):VAE通过学习正常数据的生成模型来识别与正常模式不符的异常点。
四、时间序列数据异常检测方法的应用以金融领域为例,基于机器学习的异常检测方法可以用于检测股价异常波动和交易欺诈行为。
首先,通过收集历史股价数据和交易数据,构建时间序列数据集。
然后,采用机器学习算法(如自回归模型、RNN等)对数据进行训练和预测。
多模态数据融合中的特征提取与表示方法多模态数据融合是指将来自不同传感器或不同表征方式的数据进行整合和融合,以获得更全面、准确和综合的信息。
在多模态数据融合中,特征提取和表示方法起着至关重要的作用。
本文将介绍几种常用的特征提取和表示方法,并探讨它们在多模态数据融合中的应用。
1. 形状特征提取与表示形状特征主要用于描述物体的轮廓和边缘,对于图像和视频等视觉数据的处理尤为重要。
常见的形状特征提取和表示方法包括边缘检测、形状描述子和轮廓匹配等。
边缘检测算法可以提取图像中的边缘信息,例如Canny算子和Sobel算子等。
形状描述子能够将轮廓分解为一组有意义的特征,常用的形状描述子有傅里叶描述子、Zernike描述子和极坐标描述子等。
轮廓匹配算法可以通过计算不同轮廓之间的相似度,找到相对应的物体。
2. 频域特征提取与表示频域特征主要用于处理时域信号的数据,例如语音信号和心电图等。
常见的频域特征提取和表示方法包括傅里叶变换、小波变换和功率谱密度等。
傅里叶变换能够将时域信号转换为频域信号,通过提取频域特征来描述信号的频率成分。
小波变换不仅可以提取频域信息,还具有时域分辨率。
功率谱密度可以用于分析信号的能量分布和频谱特征。
3. 时间序列特征提取与表示时间序列特征主要用于分析一系列时间上连续发生的事件。
常见的时间序列特征提取和表示方法有自回归模型、移动平均模型和傅里叶分析等。
自回归模型可以建立时间序列之间的依赖关系,通过预测当前时间点的值。
移动平均模型可以平滑时间序列,减少噪声的干扰。
傅里叶分析可以将时间序列信号转换为频率成分,通过提取频域特征来描述时间序列。
4. 文本特征提取与表示文本特征主要用于处理自然语言文本数据,例如文档、评论和推文等。
常见的文本特征提取和表示方法有词袋模型、TF-IDF模型和词向量模型等。
词袋模型将文本表示为词汇的集合,通过统计词频来提取特征。
TF-IDF模型不仅考虑词频,还考虑词在整个语料库中的重要性。
基于Tsfresh-RF 特征提取的人体步态识别算法①张晓东1,2, 陈 炜1,2, 孙玉超3, 魏丽璞41(天津理工大学 机械工程学院 天津市先进机电一体化系统设计与智能控制重点实验室, 天津 300384)2(天津理工大学 机械工程学院 机电工程国家级实验教学示范中心, 天津 300384)3(天津理工大学中环信息学院, 天津 300350)4(军事科学院系统工程研究院 卫勤保障技术研究所, 天津 300161)通讯作者: 陈 炜摘 要: 惯性传感器(IMU)由于尺寸小、价格低、精度高以及信息实时性强等优点, 在人体运动信息的获取与控制等方面得到广泛应用, 但在步态识别的时间序列特征提取和步态环境数据等方面还存在着明显的局限. 本文针对人体下肢步态识别特征提取的复杂性及适用性差等问题, 提出基于Tsfresh-RF 特征提取的人体步态识别新方法. 首先, 利用IMU 获取的人体步态数据集, 构建基于Tsfresh 时间序列特征提取和随机森林(RF)的人体步态识别算法模型. 其次, 采用该算法对人体不同传感器位置进行实验, 完成爬梯、行走、转弯等9种人体运动步态的识别. 最后, 实验结果表明所提方法平均分类准确率达到91.0%, 显著高于传统的支持向量机(SVM)与朴素贝叶斯(NB)等方法的识别结果. 此外, 本文所提基于Tsfresh-RF 特征提取的人体步态识别算法具有很好的鲁棒性, 将为后续下肢外骨骼机器人的控制提供有利依据.关键词: 惯性传感器; 特征提取; 步态识别; 随机森林引用格式: 张晓东,陈炜,孙玉超,魏丽璞.基于Tsfresh-RF 特征提取的人体步态识别算法.计算机系统应用,2021,30(6):168–175. /1003-3254/7930.htmlHuman Gait Recognition Algorithm Based on Tsfresh-RF Feature ExtractionZHANG Xiao-Dong 1,2, CHEN Wei 1,2, SUN Yu-Chao 3, WEI Li-Pu 41(Tianjin Key Laboratory for Advanced Mechatronic System Design and Intelligent Control, School of Mechanical Engineering,Tianjin University of Technology, Tianjin 300384, China)2(National Demonstration Center for Experimental Mechanical and Electrical Engineering Education, School of Mechanical Engineering, Tianjin University of Technology, Tianjin 300384, China)3(Zhonghuan Information College Tianjin University of Technology, Tianjin 300380, China)4(Institute of Medical Support Technology, Academy of System Engineering of Academy of Chinese PLA Military Science, Tianjin 300161, China)Abstract : Inertial Measurement Unit (IMU) is widely used in the acquisition and control of human motion information due to its small size, low costs, high accuracy, and strong timeliness. However, it still has obvious limitations in the time-series feature extraction and the data about gait environment during gait recognition. Aiming at the complexity and poor applicability of lower-limb gait recognition based on feature extraction, this study proposes a new method of human gait recognition based on Tsfresh-RF feature extraction. Firstly, an algorithm of human gait recognition based on Tsfresh time-series feature extraction and Random Forest (RF) is constructed by a human gait data set acquired by IMU. Secondly,experiments including nine gaits are carried out by this algorithm on different sensor positions, such as climbing, walking,and turning. Finally, the average classification accuracy of the proposed method reaches 91.0%, which is significantly计算机系统应用 ISSN 1003-3254, CODEN CSAOBNE-mail: Computer Systems & Applications,2021,30(6):168−175 [doi: 10.15888/ki.csa.007930] ©中国科学院软件研究所版权所有.Tel: +86-10-62661041① 基金项目: 天津市自然科学基金重点项目(19YFZCSF01150); 创新培育课题(1916312ZT00600706)Foundation item: Key Program of Natural Science Foundation of Tianjin Municipality (19YFZCSF01150); Project for Innovation and Cultivation (1916312ZT00600706)收稿时间: 2020-10-10; 修改时间: 2020-11-02; 采用时间: 2020-11-04; csa 在线出版时间: 2021-06-01168higher than that of traditional Support Vector Machine (SVM) and Naive Bayes (NB) methods. In addition, the proposed algorithm is robust, which will provide a favorable basis for subsequent control of lower-limb exoskeleton robots.Key words: Inertial Measurement Unit (IMU); feature extraction; gait recognition; Random Forest (RF)近年来, 越来越多的下肢外骨骼机器人被应用在医疗、军事、工业等领域[1]. 在这些设备的控制中, 准确的步态数据检测和识别显得尤为重要. 通过深入研究, 下肢外骨骼已朝着更智能的人机协作方向发展, 许多研究者通过检测穿戴者的运动意图来提高步态识别能力, 从而增强人机协调能力[2,3].以往对不同步态数据检测的研究主要通过肌电(EMG)传感器[4]、惯性(IMU)传感器[5]、足压传感器[6]和电容传感器[7]等实现. 例如Kuang等[8]利用胶水将足底压力传感器粘贴在鞋垫上, 将肌电传感器直接粘贴在受试者的小腿皮肤上来采集人体步态数据. 但由于粘贴不牢靠和肌肉的特殊性, 这些信号是不稳定的,对受试者产生了很大不便. 惯性传感器和电容传感器都需要绑带绑在人体身上采集数据, 不同的是电容传感器受到了皮肤状况和汗液的影响[9,10]. 采集到的数据需要特征提取和分类器识别. Li等[11]使用绝对值和方差积分特征提取, 支持向量机作为分类器来识别五种步态, 最终证明个体差异和样本大小都会影响步态分类的准确性. Wu等[12]提出了一种基于简化支持向量机的下肢运动识别多分类算法, 成功识别站立、行走和上下楼梯的运动. Antwi-Afari等[13]研究建筑工人失衡步态检测的最佳分类方法, 发现随机森林、K近邻、支持向量机比其他分类器表现更好.上述工作主要通过不同传感器采集人体数据、提取特征和选择分类器来提高步态识别准确率. 尽管这些方法在一定程度可以有效提高步态识别准确率, 但这一领域的研究范围和深度仍不够. Lee等[14]证明,由于可变环境因素的影响, 无法保证步态识别的性能,最常见的可变因素有人体负重、行走速度、传感器的选择等; 此外, 不同传感器位置和动作幅度也是两个不容忽视的因素. 有学者基于肌电图研究了不同传感器位置步态识别的影响. 例如Huang等[15]研究表面肌电在左右大腿、左右小腿对8种步态识别的影响,结果平均准确率达到92.23%. 尽管有这些出色的结果,但这并不意味着基于IMU的步态识别在不同传感器位置肯定存在同样的结论, 基于IMU的不同转弯角度对步态识别的影响鲜有报道. 此外针对时间序列特征提取是一个非常耗时的过程, 因为科学家和工程师必须考虑各种信号处理和时间序列分析的算法, 来识别和提取有意义的时间特征序列. Chinimilli等[16]提出包括加速度、角速度在内的平均值、标准差、平均绝对差、平均合成加速度、峰值之间的时间等86个特征提取算法, 但特征提取的过程较为复杂, 应用范围局限.为了提升人体步态识别准确率和实用性, 我们采用一种基于Tsfresh工具和监督机器学习随机森林算法(RF)来完成步态模式获取. Tsfresh工具用于自动提取过滤步态时间序列特征, 监督机器学习随机森林算法(RF)用于判定步态模式. 实验环节我们招募4名健康的志愿者进行实验, 两个IMU传感器分别绑定在受试者的左大腿前面和右小腿后面, 让受试者模拟九种步态事件(如站立、坐立、平地行走、上楼梯、下楼梯、转弯30度、转弯60度、转弯90度和转弯180度)来收集加速度、角速度、角度等数据. 然后将采集的步态数据通过无线蓝牙5.0传到计算机. 结果表明: 在人体不同传感器位置和不同转弯角度步态下, 基于Tsfresh-RF的算法模型鲁棒性较好, 是一种有效的、准确的步态识别方法.本文的其余部分组织如下. 第1节描述了识别算法包括特征提取和分类算法. 第2节详细介绍了实验的过程和方法. 第3节是实验结果与分析数据, 包括不同传感器位置对步态识别影响、3种算法的比较结果以及转弯角度的变化对算法识别准确率的影响. 第4节得出结论.1 Tsfresh-RF算法本文提出一种基于Tsfresh时间序列特征提取和RF的人体步态识别算法模型. 步态数据获取采用一种无线多通道传感器装置, 通过蓝牙5.0与计算机连接.具体步态识别流程如图1所示.1.1 Tsfresh特征提取采集人体下肢步态信息时, 两个传感器采集到的数据通过蓝牙同时上传到计算机, 所以首先需要分割2021 年 第 30 卷 第 6 期计算机系统应用169IMU1和IMU2的数据, 其次需要特征提取, 特征提取的主要目的是对原始加速度、角速度、角度等信号进行降维, 降低模式识别和分类的复杂性, 进而提高步态识别和分类的效率[17]. 因此, 提取范围广、复杂度低、效率高的特征至关重要[18]. 本文提取的原始数据为时间序列, 时间序列是在时间上连续进行的观测序列[19].本文采用一种Python包Tsfresh工具来提取特征, 与传统特征提取方法相比, 该算法效率高和范围广, 且能自动地计算出大量的时间序列特征[20]. 时间序列通常包含噪声、冗余或无关信息. 为了避免提取不相关的特性, Tsfresh有一个内置的过滤过程. 具体流程如图2所示.图1 基于Tsfresh-RF算法的步态识别流程图2 Tsfresh特征提取基本流程本文初步提取13 734个特征, 然后将空值和无效值去掉, 最后利用Tsfresh的特征选择功能进一步过滤掉对识别结果影响不明显的特征, 得到6993个特征数量.1.2 RF分类算法随机森林分类器是一种用于分类的集成学习技术,由多个决策树组成. 该方法有助于减少模型方差和最小化训练数据集的过拟合[21]. 由于RF分类器中的每个节点被分割成有限数量的随机预测变量, 因此相对于SVM和人工神经网络(ANN)等其他分类器, 它被认为是更强大的分类器[22]. 其算法如算法1.算法1. RF分类器T={(x i,y i)x i∈R d,yi∈Y}1≤i≤n输入: 训练集, R d ; 随机森林的规模l, 随机抽取的属性子集的大小m, 测试样例x;y∈Y输出: 测试样例x的类别标签;i=1i≤l i++1. for(; ; )T i2. 从训练集T中按一定比例有放回地随机抽取一个子集;3. end fori=1i≤l i++4. for(; ; )5. 从d个属性中, 随机地抽取m个属性;T i DT i6. 用决策树树算法在包含m个列的样例集上构建决策树;7. end forRF={DT1,DT2,···,DT l}8. 采用投票机制, 用决策森林对测试用样例x进行分类;9. 输出x的类别y.为了识别不同类型的步态, 机器学习分类器需要从IMU提取的数据特征学习独特的信号模式. Antwi-Afari等[13]研究了基于足底压力的建筑工人失衡步态检测的最佳分类方法, 发现随机森林、K近邻、支持向量机比其他分类器表现更好. 然而, 由于分类器的性能取决于数据类型和特征类型, 大多数研究表明, 不存在单一的最佳分类器[23]. 因此有必要测试不同的分类器. 本研究还将支持向量机和朴素贝叶斯分类器作为对比.支持向量机(SVM)是一种基于统计学的机器学习方法. 支持向量机通常在许多二分类问题或多分类问题中表现出出色性能. 它是在各类之间寻找最优的分离决策超平面, 并使每个类的模式[24]之间的距离最大. 通过使用核函数将数据集映射到内积空间, 从而创建一个非线性结构, 它可以受益于转换特征空间中的最大边缘超平面[25].朴素贝叶斯, 它是一种简单但极为强大的预测建模算法. 它的基本思想是根据给定的待分类数据,分别求解在该数据属于各个目标类别的概率, 概率最大的类别即为最终的类别, 如式(1)所示.计算机系统应用2021 年 第 30 卷 第 6 期170y x 其中, 是类别, 是待分类项.p (y i |x )在朴素贝叶斯中,特征属性之间相互独立的, 因此可以通过式(2)进行求解.αx其中, 是的各项特征属性.1.3 算法评估为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理, 将数据按照比例进行缩放, 使之落入一个特定的区域, 便于进行综合分析. 我们采用零-均值规范化即标准差标准化, 经过处理的数据的均值为0, 标准差为1. 公式为:x σ其中, 为原始数据的均值, 为原始数据的标准差.同时为了得到可靠稳定的分类模型, 我们利用五折交叉验证法评估识别准确率. 将所选数据随机分成5份, 每一次将其中1份作为测试数据, 其余4份作为训练数据, 这个过程共进行5次.整体识别准确率(RA )的计算方法为:N corr N total 其中, 为正确识别测试数据的个数, 为测试数据的总数.由于某些步态更容易被错误地识别为其他步态,因此建立混淆矩阵C 来量化误差, 公式如下:每个元素计算如下:n i j n i c i j i j 其中, 表示为第i 种模式下的测试数据量被识别为第j 种模式, 为模式i 中测试的总量. 当()值较大时, 表示模态i 很容易被误归为模态j .2 实验2.1 数据采集本系统选用了基于ICM42605的九轴姿态传感器来实现对人体运动状态的测量与跟踪. WT52HB 是一种USB 适配器模块, 内置nRf52832 蓝牙芯片. 该蓝牙适配器传输稳定, 最远距离可达50米. 在识别系统开始时, 同步采集两个IMU 传感器数据信号. 每个IMU生成9个通道数据, 包括角度3个通道(偏转、横摇、俯仰), 加速度3个通道(AccX 、AccY 、AccZ), 角速度3个通道(GryoX 、GryoY 、GryoZ). 考虑到传输效率和信息质量, 我们将采样频率设为50 Hz, 与其他研究者[26]相同. 传感器采集到的信号通过蓝牙模块传输到电脑端进行滤波、分割、特征提取和归一化等数据处理. 然后将处理好的数据输送给3个分类器训练分类器模型. 最后, 从分类器的输出结果评价不同传感器位置和不同步态对识别结果的影响.在研究中, 我们招募了4名身体健全的男性志愿者. 年龄范围: 25–26岁; 身高范围: 163.0–177.0 cm; 体重范围: 57–71 kg. 实验在温度、湿度和通风条件适宜的环境下进行. 这项实验是根据《赫尔辛基宣言》的原则进行的.为最大限度获得有效人体运动信息, 传感器节点的位置应慎重选择. 根据人体下肢运动生物力学[27], 我们选择人体下肢左大腿和右脚踝靠上部位放置姿态传感器. 如图3所示.IMU1 蓝牙适配器传感器绑带PCIMU2图3 IMU1模块在左大腿(左); IMU2模块在右脚踝靠上部位(右上); 蓝牙模块和传感器绑带(右下)2.2 具体步骤实验前, 被试者需满足以下要求: 首先, 熟悉相关实验设备, 如IMU 、PC 、秒表、绑带等; 其次, 不允许进行体育锻炼, 以避免疲劳所引起的并发症; 最后, 穿轻薄长裤, 以有效固定姿态传感器, 从而更有效的采集步态数据.实验研究了站立(ST)、坐立(SI)、上楼梯 (SA)、下楼梯 (SD)、平地正常行走(NW)、转弯30度(T30)、转弯60度(T60)、转弯90度(T90)、转弯180度2021 年 第 30 卷 第 6 期计算机系统应用171(T180) 9种运动模式. 每种步态测试8次.在每次试验中, 当受试者准备好, 他们会向工作人员发送指令来收集信号. 实验开始时, 受试者要求先直立站5 s使传感器数据平稳.在站立实验中受试者被要求在每次试验中保持静止5 s; 在坐立实验中, 受试者被安排坐在42 cm高的椅子上坐立5 s. 在一个宽75 cm,深30 cm, 高15.6 cm的台阶上进行上下楼梯实验, 每次实验为3个步态周期即8步. 平地正常行走要求受试者按照自己习惯速度在平地向前行走18步. 在转弯步态研究中, 我们提前设计好30度、60度、90度、180度的左转弯测试角, 受试者从转弯开始到结束约3个步态周期即9步.每次实验结束后, 要求受试者休息5分钟, 以消除因运动引起的疲劳, 避免对下次实验产生负面影响.3 结果与讨论3.1 传感器位置对识别算法影响从表1可以看出, 9种(ST、SI、NW、SA、SD、T30、T60、T90、T180)步态的测试平均识别准确率差异显著, 最高为0.91, 最低为0.65. ST、SD的步态子阶段识别表现最好, 在所有子阶段都取得了相对较高的准确率. T180表现最差, 步态识别准确率都在0.74以下. 步态T30出现了0.30、0.25的特殊情况, 这可能和识别分类器有关.表1 9种步态识别准确率传感器位置IMU 1IMU 2IMU 1 2分类器RF SVM NB RF SVM NB RF SVM NBST 1.00 1.000.95 1.00 1.000.90 1.00 1.000.95SI0.80 1.000.750.800.950.800.85 1.000.80NW0.750.700.750.750.750.700.750.750.75SA 1.000.900.75 1.000.950.60 1.000.900.50SD 1.00 1.000.90 1.00 1.000.68 1.00 1.000.84T300.950.300.500.800.900.400.900.950.25T600.900.650.450.950.950.700.950.950.60T900.850.750.45 1.000.900.70 1.000.850.65T1800.740.740.370.740.630.630.740.740.63平均0.890.780.650.890.890.680.910.900.66为了验证Tsfresh-RF算法模型识别性能, 我们分别使用SVM和NB算法来对比分析. 结果如图4所示, RF算法性能明显高于其它两个算法, 不仅准确率相对较高, 而且步态识别稳定性较强. 另外两个IMU同时识别能够有效提高识别准确率. IMU1和IMU2相比较IMU2对识别结果影响显著. 由此说明传感器位置的放置对步态识别有重要影响. 当步态训练数据来自更多位置传感器时, 步态识别更加准确.IMU 1IMU 2IMU 1 2RF SVM NB图4 不同传感器位置平均识别率图5进一步说明了随机森林算法在每种步态识别中的优越性. 其中针对SI、T30两种步态支持向量机也表现出一定的分类能力. 朴素贝叶斯分类器表现相对较差, 只有在SA步态识别时3个分类器识别率相同.ST SI SA SD NW T30T60T90T180RF SVM NB图5 不同分类器在每种步态下识别率3.2 转弯角度对识别算法影响此外, 为了进一步研究转弯角度对步态识别的影响, 实验分别测试了志愿者在转弯30度、60度、90度和180度情况下的步态. 如图6显示了不同转弯角度的识别率. 发现RF表现出较高的准确率, T60、T90两种步态普遍比T30、T180两种步态识别率高. 从转弯幅度分析4种步态准确率从小到大分别是T180、T30、T60、T90. 即在一定范围内, 步态转弯幅度越大步态识别率越高.3.3 混淆矩阵9种步态被3种分类器训练和测试, 总体结果如计算机系统应用2021 年 第 30 卷 第 6 期172图7所示. 在矩阵中, 横坐标表示真实值、纵坐标表示预测值. 蓝色越深意味着越高的步态识别精度. 主对角线显示的数据是真实值和预测值相同的数据. 非主对角线的数据显示的是真实值和预测值不一样的数据.从每个分类器的混淆矩阵中可以看出, 不同分类器对步态识别结果有很大影响且RF准确性更高一些. 用于训练和预测的数据来自不同步态的情况下, 结果差异明显. 这说明不同步态识别对结果具有很大影响. 例如NB用T30训练和用T30、T60、T90、T180预测的结果(分别为0.25、0.35、0.10、0.30). 在其他分类器SVM和RF中也发现了类似的结果. 在SVM中用步态SA的数据进行训练, 用SI数据进行预测(SA-SI: 0.25)表现最差. RF最差结果来自SA-SI(0.25). 在NB 中, SD-SA和T30-T60表现最差, 分别为0.40和0.35.RFSVMNBT30T60T90T180图6 不同转弯角度识别准确率4 结论与展望本文采用一种蓝牙无线多通道信号采集装置来采集人体下肢的加速度、角速度、角度等信号. 传感器分别固定在下肢不同位置, 4名健康的志愿者进行实验, 模拟九种步态事件. 提出了一种基于Tsfresh-RF特征提取的人体步态识别算法模型. 同时采用支持向量机和朴素贝叶斯进行比较. 结果表明: (1)在两个传感器同时识别下, Tsfresh-RF获得了最佳分类效果, 9种步态平均准确率达到91.0%; (2)传感器布置位置对步态识别的准确性有显著影响, 其中小腿的影响大于大腿且在一定范围内传感器布置越多准确率越高; (3)转弯步态识别率T180<T30<T60<T90, 且RF表现出较好识别率.可以得出结论: 在人体不同传感器位置和不同转弯角度步态下, 基于Tsfresh-RF的步态识别算法模型鲁棒性更好, 可以实现更精确的人体步态识别. 此外步态识别系统训练在单一位置传感采集是不够的且动作幅度大小会影响识别准确率. 在未来的研究中, 应考虑步态识别系统与外骨骼系统的结合. 此外, 还需要研究实时步态的识别方法.STSTSISISASASDSDNWNWT30T3T60T6T90T9T180T18(a) SVM(b) RF(c) NBSTSISASDNWT3T6T9T181.00.80.60.40.21.00.80.60.40.2STSISASDNWT30T60T90T180STSISASDNWT30T60T90T180STSISASDNWT3T6T9T181.00.80.60.40.2Predicted labelPredicted labelPredicted label图7 3种分类器下步态识别准确率矩阵2021 年 第 30 卷 第 6 期计算机系统应用173参考文献Gardner AD, Potgieter J, Noble FK. A review of commercially available exoskeletons’ capabilities. Proceedings of the 24th International Conference on Mechatronics and Machine Vision in Practice. Auckland, New Zealand. 2017. 21–23.1Lim DH, Kim WS, Kim HJ, et al . Development of real-timegait phase detection system for a lower extremity exoskeleton robot. International Journal of Precision Engineering and Manufacturing, 2017, 18(5): 681–687. [doi: 10.1007/s12541-017-0081-9]2Bortole M, Venkatakrishnan A, Zhu FS, et al . The H2robotic exoskeleton for gait rehabilitation after stroke: Early findings from a clinical study. Journal of NeuroEngineering and Rehabilitation, 2015, 12: 54. [doi: 10.1186/s12984-015-0048-y ]3Meng W, Liu Q, Zhou ZD, et al . Active interaction controlapplied to a lower limb rehabilitation robot by using EMG recognition and impedance model. Industrial Robot: An International Journal, 2014, 41(5): 465–479. [doi: 10.1108/IR-04-2014-0327]4Khandelwal S, Wickström N. Evaluation of the performanceof accelerometer-based gait event detection algorithms in different real-world scenarios using the MAREA gait database. Gait & Posture, 2017, 51: 84–90.5Wang XG, Wang QN, Zheng EH, et al . A wearable plantarpressure measurement system: Design specifications and first experiments with an amputee. In: Lee S, Cho H, Yoon KJ, et al. eds. Intelligent Autonomous Systems 12. Berlin,Heidelberg: Springer, 2013. 273–281.6Chen BJ, Zheng EH, Fan XD, et al . Locomotion modeclassification using a wearable capacitive sensing system.IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2013, 21(5): 744–755. [doi: 10.1109/TNSRE.2013.2262952]7Kuang YX, Wu Q, Shao JK, et al . Extreme learning machineclassification method for lower limb movement recognition.Cluster Computing, 2017, 20(4): 3051–3059. [doi: 10.1007/s10586-017-0985-2]8Chamroukhi F, Mohammed S, Trabelsi D, et al . Jointsegmentation of multivariate time series with hidden process regression for human activity recognition. Neurocomputing,2013, 120: 633–644. [doi: 10.1016/j.neucom.2013.04.003]9Zheng EH, Chen BJ, Wei KL, et al . Lower limb wearablecapacitive sensing and its applications to recognizing human gaits. Sensors, 2013, 13(10): 13334–13355. [doi: 10.3390/s131013334]10Li Y, Gao FR, Chen HH, et al . Gait recognition based onEMG with different individuals and sample sizes.Proceedings of the 35th Chinese Control Conference (CCC).Chengdu, China. 2016. 4068–4072.11Wu JF, Wu Q, Sun SQ. Research on classification algorithmof reduced support vector machine for low limb movement recognition. China Mechanical Engineering, 2011, 22(4):433–438.12Antwi-Afari MF, Li H, Seo JO, et al . Automated detectionand classification of construction workers ’ loss of balance events using wearable insole pressure sensors. Automation in Construction, 2018, 96: 189–199. [doi: 10.1016/j.autcon.2018.09.010]13Lee SW, Yi T, Han JS, et al . Walking phase recognition forpeople with lower limb disability. Proceedings of the 10th International Conference on Rehabilitation Robotics.Noordwijk, the Netherlands. 2007. 13–15.14Huang H, Kuiken TA, Lipschutz RD. A strategy foridentifying locomotion modes using surfaceelectromyography. IEEE Transactions on Biomedical Engineering, 2009, 56(1): 65–73. [doi: 10.1109/TBME.2008.2003293]15Chinimilli PT, Redkar S, Zhang WL. Human activityrecognition using inertial measurement units and smart shoes. Proceedings of 2017 American Control Conference.Seattle, WA, USA. 2017. 1462–1467.16Zhang XF, Sun SQ, Li C, et al . Impact of load variation onthe accuracy of gait recognition from surface EMG signals.Applied Sciences, 2018, 8(9): 1462. [doi: 10.3390/app8091462]17Hudgins B, Parker P, Scott RN. A new strategy formultifunction myoelectric control. IEEE Transactions on Biomedical Engineering, 1993, 40(1): 82–94. [doi: 10.1109/10.204774]18Box GEP, Jenkins GM, Reinsel GC, et al . Time SeriesAnalysis: Forecasting and Control, 5th Edition. Wiley, 2015.19Christ M, Braun N, Neuffer J, et al . Time Series FeatuReExtraction on basis of Scalable Hypothesis tests (tsfresh – A Python package). Neurocomputing, 2018, 307: 72–77. [doi:10.1016/j.neucom.2018.03.067]20Xia XJ, Togneri R, Sohel F, et al . Random forestclassification based acoustic event detection utilizing contextual-information and bottleneck features. Pattern Recognition, 2018, 81: 1–13. [doi: 10.1016/j.patcog.2018.03.025]21Wang ZH, Yang ZC, Dong T. A review of wearable22计算机系统应用2021 年 第 30 卷 第 6 期174technologies for elderly care that can accurately track indoor position, recognize physical activities and monitor vital signs in real time. Sensors, 2017, 17(2): 341. [doi: 10.3390/s170 20341]Liang SY, Ning YK, Li HQ, et al. Feature selection and predictors of falls with foot force sensors using KNN-based algorithms. Sensors, 2015, 15(11): 29393–29407. [doi: 10.3390/ s151129393]23Preece SJ, Goulermas JY, Kenney LPJ, et al. Activity identification using body-mounted sensors—A review of classification techniques. Physiological Measurement, 2009, 30(4): R1–R33. [doi: 10.1088/0967-3334/30/4/R01]24Pradhan C, Wuehr M, Akrami F, et al. Automated 25classification of neurological disorders of gait using spatio-temporal gait parameters. Journal of Electromyography and Kinesiology, 2015, 25(2): 413–422. [doi: 10.1016/j.jelekin.2015.01.004]Duan P, Li SL, Duan ZP, et al. Bio-inspired real-time prediction of human locomotion for exoskeletal robot control. Applied Sciences, 2017, 7(11): 1130. [doi: 10.3390/ app7111130]26Kyeong S, Shin W, Yang MJ, et al. Recognition of walking environments and gait period by surface electromyography.Frontiers of Information Technology & Electronic Engineering, 2019, 20(3): 342–352.272021 年 第 30 卷 第 6 期计算机系统应用175。
2023美赛d题参考文献参考文献:1. Liu, Y., Wang, H., & Xia, F. (2019). Time Series Clustering and Classification Based on Shapelet Transformation and Deep Learning. IEEE Transactions on Knowledge and Data Engineering, 32(12), 2260–2273.2. Zhang, X., Xing, X., Liu, S., & Han, J. (2018). Time Series Classification Using Multi-Channels Deep Convolutional Neural Networks. Proceedings of the ACM on Conference on Information and Knowledge Management, 2(2), 1–10.3. Barua, S., Islam, R., Yao, X., Murase, K., & Chiong, R. (2020). Time Series Forecasting Using a Novel Residual Generative Adversarial Network. Soft Computing, 24(12), 9441–9458.4. Wang, Y., Yan, Y., & Oates, T. (2019). Time Series Classification from Scratch with Deep Neural Networks: A Strong Baseline. Data Mining and Knowledge Discovery, 33(6), 1–45.5. Wei, J., Wang, G., & Ye, X. (2017). Supervised Time Series Feature Extraction for Classification. IEEE Transactions on Systems, Man, and Cybernetics: Systems,47(10), 2720–2732.6. Bagnall, A., Lines, J., Hills, J., & Bostrom, A. (2017). Time Series Classification with HIVE-COTE: The Hierarchical Vote Collective of Transformation-Based Ensembles. ACM Transactions on Intelligent Systems and Technology, 8(5), 1–41.7. Lin, Y., Sun, S., Zheng, J., & Lu, J. (2019). Large-Scale Time Series Classification Using Randomized Matrix Kernels and Deep Neural Network. IEEE Transactions on Big Data, 5(3), 355–369.8. Salama, M., El-Khozondar, H., & Karray, F. (2021). Deep Long Short-Term Memory Network for Time Series Classification. Pattern Analysis and Applications,24(3), 1577–1593.9. Wang, Z., Yan, Y., & Oates, T. (2017). Time Series Classification From Scratch with Deep Neural Networks: A Strong Baseline. arXiv Preprint arXiv:1611.06455.10. Zha, S., Xing, X., & Pan, S. (2020). Time Series Classification with Data Augmentation from Deep Synthetic Data. Proceedings of the ACM on Symposium on Applied Computing, 2(2), 1–15.2023美赛D题参考文献随着信息技术的快速发展和数据的爆发式增长,对时间序列数据进行分类的需求日益增加。
用于运动识别的聚类特征融合方法和装置提供了一种用于运动识别的聚类特征融合方法和装置,所述方法包括:将从被采集者的加速度信号中提取的时频域特征集的子集内的时频域特征表示成以聚类中心为基向量的线性方程组;通过求解线性方程组来确定每组聚类中心基向量的系数;使用聚类中心基向量的系数计算聚类中心基向量对子集的方差贡献率;基于方差贡献率计算子集的聚类中心的融合权重;以及基于融合权重来获得融合后的时频域特征集加速度信号时频域特征以聚类中心为基向量的线性方程组基向量的系数方差贡献率」融合权重基于特征组合的步态行为识别方法本发明公开了一种基于特征组合的步态行为识别方法,包括以下步骤:通过加速度传感器获取用户在行为状态下身体的运动加速度信息;从上述运动加速度信息中计算各轴的峰值、频率、步态周期和四分位差及不同轴之间的互相关系数;采用聚合法选取参数组成特征向量;以样本集和步态加速度信号的特征向量作为训练集,对分类器进行训练,使的分类器具有分类步态行为的能力;将待识别的步态加速度信号的所有特征向量输入到训练后的分类器中,并分别赋予所属类别,统计所有特征向量的所属类别,并将岀现次数最多的类另脈予待识别的步态加速度信号。
实现简化计算过程,降低特征向量的维数并具有良好的有效性的目的。
传感器—>加速度信息m峰值、频率、步态周期、四分位、相关系数-聚合法特征向量-样本及和步态加速度信号的特征向量作为训练集分类器具有分类步态行为的能力基于贝叶斯网络的核心网故障诊断方法及系统本发明公开了一种基于贝叶斯网络的核心网故障诊断方法及系统,该方法从核心网的故障受理中心采集包含有告警信息和故障类型的原始数据并生成样本数据,之后存储到后备训练数据集中进行积累,达到设定的阈值后放入训练数据集中;运用贝叶斯网络算法对训练数据集中的样本数据进行计算,构造贝叶斯网络分类器;从核心网的网络管理系统采集含有告警信息的原始数据,经贝叶斯网络分类器计算获得告警信息对应的故障类型。
收稿日期:2020⁃02⁃26;修回日期:2020⁃04⁃19㊀㊀基金项目:国家自然科学基金资助项目(61966023)作者简介:柯铭(1978⁃),女,河南洛阳人,副教授,硕导,博士,主要研究方向为复杂网络理论㊁大脑功能和结构研究(kemingkitty@163.com);尹倡隆(1990⁃),男,甘肃平凉人,硕士研究生,主要研究方向为生物信息处理;刘光耀(1988⁃),男,甘肃兰州人,博士研究生,主要研究方向为功能磁共振图像处理;张祺瑞(1994⁃),男,河南许昌人,硕士研究生,主要研究方向为交通信息智能化分析处理.基于1DCNN⁃XGBoost混合模型的癫痫脑电分类∗柯㊀铭1,尹倡隆1,刘光耀2,张祺瑞1(1.兰州理工大学计算机与通信学院,兰州730050;2.兰州大学第二医院核磁共振科,兰州730050)摘㊀要:在癫痫脑电自动分类研究中,针对传统方法需手动提取特征㊁特征提取不充分㊁适应性不强等问题,提出一种一维卷积神经网络结合XGBoost算法的单通道癫痫脑电分类模型1DCNN⁃XGBoost㊂该模型首先在原始脑电信号上训练一维卷积模型,利用训练好的一维卷积模型实现特征的自动提取,最后运用XGBoost算法进行训练和分类㊂通过对波恩大学癫痫脑电数据集进行分类实验,结果得到了98.83%的分类准确率,说明提出的模型能有效提取癫痫脑电信号的特征信息,并能进行准确的分类,分类精度和稳定性都有所提高㊂关键词:特征提取;一维卷积神经网络;XGBoost;脑电分类0㊀引言癫痫是一种发病率很高的中枢神经系统功能障碍慢性疾病,发作时临床表现为运动㊁感觉㊁自主神经㊁意识的异常及精神障碍等,严重影响患者的生活质量㊂临床医学发现,在癫痫样发作时,患者脑电与正常人脑电存在很大差异,故在癫痫的诊疗领域,脑电图(EEG)是最重要的检查项目之一㊂因此,如何有效地对癫痫脑电信号进行快速分析处理,提高计算机化癫痫检测的准确性和检测效率是近年来的研究热点,对于临床上癫痫的诊断也具有重要意义㊂癫痫脑电信号分类研究主要包括特征提取和分类两个部分㊂特征提取研究中,主要有时域分析㊁频域分析㊁时频分析㊁混沌理论以及非线性动力学方法等[1]㊂AR模型[2]㊁独立分量分析[3]㊁固有模态分解[4]㊁公共空间模式[5]㊁小波和小波包变换[6 8]等是常用的脑电信号特征提取算法;此外,脑电信号具有明显的非线性特性,因此,非线性动力学和混沌的方法也为脑电信号研究开辟了新途径,关联维数[9]㊁Lyapunov指数㊁近似熵㊁样本熵[7,10]㊁Hurst指数[11]和混沌理论等指标都常应用在EEG信号分析中㊂然而局限于任何一种单一的方法,会使得特征提取不充分,泛化能力不强㊂与传统方法比,基于神经网络的深度学习方法不需要手动提取特征,能直接训练原始脑电信号,对不同的信号特征进行自适应学习,从而能对脑电信号进行深度挖掘,得到更具有代表性的特征㊂另一方面,好的分类算法在训练和识别速度㊁分类准确性和稳定性方面有很重要的作用,常用方法有SVM[4,6,12]㊁隐马尔可夫模型㊁极限学习机等[13,14]㊂对于单一的分类算法,当分类数据较大㊁特征较多时,分类结果不稳定;集成学习通过将多个弱学习器进行结合,可以获得比单一算法显著优越的泛化性能,是改善脑电信号分类的有效途径㊂综合以上分析,本文提出了一种基于一维卷积神经网络(one⁃dimensionalconvolutionalneuralnetwork,1DCNN)结合XGBoost集成算法的癫痫EEG混合分类模型1DCNN⁃XGBoost,以期实现癫痫EEG信号的自动特征提取,缩短可分类预测的脑电时长,得到具有较高分类准确率和良好泛化性能的分类系统㊂1㊀实验数据实验数据来自德国波恩大学癫痫脑电数据集[15],该数据集在癫痫的诊断和分析研究中应用广泛,数据集分为setA setE五个子集,每个子集包含100个同类型样本,每个样本包含4097个脑电时间序列㊂数据采样频率为173.61Hz,持续时长23.6s,已经过0.53 40Hz人工滤波除伪迹㊂其中,setA㊁setB子集分别为5名健康受试者在睁眼和闭眼状态下采集的脑电信号;SetC子集为5名癫痫患者在发作间期病灶对侧区域采集的脑电信号;setD㊁setE子集为发作间期和发作期病灶区采集的脑电信号㊂五类脑电信号示例如图1所示,可以看出五类脑电信号波形具有显著差异,癫痫发作期的幅值明显较大㊂2㊀方法本文提出的1DCNN⁃XGBoost混合分类模型框架如图2所示㊂该方法主要包括以下几个步骤:首先,以原始脑电数据训练1DCNN模型;以训练好的1DCNN模型作为特征提取器提取特征;将特征输入XGBoost模型进行训练,同时结合贝叶斯优化算法优化超参数;最后计算评估指标,对模型进行评估㊂具体流程将在后续章节作详细介绍㊂图1㊀五类EEG信号示例图2㊀癫痫脑电分类系统流程2 1㊀1DCNN模型卷积神经网络[16]已被广泛应用于许多领域,具有强大的特征学习与分类能力,相比于二维卷积,1DCNN具有相似的特点和处理方法,关键区别在于输入数据㊁卷积核的维数及卷积核在数据之间的滑动㊂1DCNN的输入是一维向量,卷积核和特征图也是一维的,其基本结构如图3所示㊂图3㊀一维卷积神经网络基本结构1DCNN模型采用卷积㊁激活㊁池化交替提取特征,卷积运算公式:yl(i,j)=kli∗xl(rj)=ðW-1jᶄ=0kl(jᶄ)ixl(j+jᶄ)(1)其中:kl(jᶄ)i为第l层的第i个卷积核的第jᶄ个权值;xl(rj)为第l层中第j个被卷积的局部区域;W为卷积核宽度㊂卷积层激活函数为ReLU函数,并采用最大池化㊂使用全连接层将提取的特征进行融合,最后实现二分类输出㊂神经网络参数设置没有统一的依据,本研究以实践结合经验的方法来设定模型参数㊂卷积层卷积核大小均为1ˑ4,卷积核个数分别为50㊁60和50,每个卷积层激活函数均为ReLU函数;池化层池化窗口大小为1ˑ4;加入两个dropout层(参数均为0.2)防止㊃09㊃计算机应用研究2020年㊀过拟合;最后全连接层神经元个数为2,并用sigmoid激活函数实现二分类㊂学习率设为0.001,迭代次数为80,batch_size设置为200㊂采用MAE(meanabsoluteerror)损失函数和RMSprop优化算法㊂2 2㊀XGBoost分类模型XGBoost[17]算法是一种boosting类型的集成方法,由一系列CART作为基分类器构成,相比传统的GBDT算法,XGBoost对代价函数进行了二阶泰勒展开,并加入了正则项㊁支持列抽样和缺失值处理,支持利用多线程并行计算,极大地提升了训练速度和预测精度㊂XGBoost算法预测模型为^yi=ðKk=1fk(xi)(2)其中:K为树的个数;fk(xi)表示第k棵树;^yi表示样本xi的预测结果㊂模型的目标函数由损失函数和正则项两部分组成:Obj(θ)=ðni=1l(yi,^y(t)i)+ðti=1Ω(fi)(3)XGBoost模型的训练过程不是直接优化整个目标函数,而是采用加法分步的策略,首先优化第一棵树,完了之后再优化第二棵树,每加入一棵树,其损失函数不断降低,直至优化完K棵树㊂另一方面,超参数的取值对分类模型性能有较大的影响,为了得到较好的分类结果,本文结合贝叶斯算法[18]进行超参数调优㊂贝叶斯优化通过基于目标函数的过去评估结果建立概率模型,在尝试下一组超参数时,会参考上一次的评估结果,找到优化目标函数的值,从而更好地调整当前的参数㊂3㊀实验与分析为充分体现本文方法的应用效果,在实验中分别建立了1DCNN㊁XGBoost和1DCNN⁃XGBoost模型相互进行比较,采用准确率(accuracy)㊁召回率(recall)和F1值(F1⁃score)作为模型的评估指标,检验分类模型的分类效果㊂accuracy=TPTP+FP(4)recall=TPTP+FN(5)F1=2ˑrecallˑaccuracyrecall+accuracy(6)其中:TP表示实际为发作期脑电,并且被正确分类为发作期脑电;FP表示实际为正常脑电,被预测为发作期脑电;FN表示实际为发作期脑电,被预测为正常脑电㊂实验中首先将每个癫痫脑电信号样本均分为16份,获得较为充足的样本数量,每个样本持续时长为1.475s,并对每个样本进行标准化处理,然后进行后续实验,标准化公式为yi=xi- xs(7)其中: x为原始数据的均值;s为标准差㊂3 1㊀1DCNN模型1DCNN模型具体结构如表1所示㊂模型损失函数曲线和准确率曲线如图4和5所示,可以看出模型损失函数和准确率曲线波动较小,测试集准确率略低于训练集,损失函数略高于训练集,模型未发生过拟合㊂表1㊀1DCNN模型结构网络层对应层输出对应层参数网络层对应层输出对应层参数输入层(none,256,1)0池化层(none,15,60)0卷积层(none,253,50)250dropout(none,15,60)0池化层(none,63,50)0卷积层(none,12,50)12050dropout(none,63,50)0全局池化层(none,50)0卷积层(none,60,60)12060全连接(none,1)51图4㊀1DCNN模型准确率曲线㊀㊀㊀图5㊀1DCNN模型损失函数曲线3 2㊀XGBoost模型建立XGBoost模型作为对比,实验以贝叶斯优化算法结合5折交叉验证对主要参数进行优化,得到决策树深度为6,决策树个数为240,叶节点的最小权重为0.5076,学习率为0.0442,最小损失分裂值为0.1018,l1正则化系数为1,l2正则化系数为0.4498,其余采用默认值㊂然后以最优参数建立分类模型㊂模型损失函数曲线和准确率曲线如图6和7所示㊂由图可知训练集和测试集性能指标相差较大,表明了XGBoost算法在不进行特征提取时无法自动提取特征,分类效果较差㊂图6㊀XGBoost模型准确率曲线㊀㊀图7㊀XGBoost模型损失函数曲线3 3㊀1DCNN⁃XGBoost模型1DCNN⁃XGBoost模型以1DCNN模型为基础,首先进行1DCNN模型训练,保存训练好的模型,然后以训练好的模型作为特征提取器提取特征,作为XGBoost输入㊂同样对于XGBoost算法进行参数调优,得到决策树深度为6,决策树个数为300,叶节点的最小权重为0.4738,学习率为0.0245,最小损失分裂值为0.9227,l1正则化系数为0.4324,l2正则化系数为0.2112,其余采用默认值㊂然后使用最优参数建立1DCNN⁃XGBoost分类模型㊂模型损失函数曲线和准确率曲线如图8和9所示,对比前两种模型性能曲线,显然两者结合的算法拟合性能更好,模型更稳定㊂图8㊀1DCNN⁃XGBoost模型准确率曲线图9㊀1DCNN⁃XGBoost模型损失函数曲线3 4㊀实验结果分析为了讨论1DCNN⁃XGBoost混合模型的分类效果,以75%样本或特征作为训练集,25%为测试集分别建立1DCNN㊁XGBoost和1DCNN⁃XGBoost模型,重复进行10次实验,取其均值,具体结果如表2所示㊂可以看出,本文模型相较于单纯的1DCNN和XGBoost模型,各项指标均有明显提升,准确率分别提高了1.08%和4 14%,召回率分别提高了1.5%和4.76%,F1值分别提高了1 09%和4.1%,相比于较高的分类准确率而言,其性能有了很大提升㊂实验结果不仅充分说明了1DCNN算法在癫痫脑电信号的特征提取和分类研究中具很高的潜在应用价值,更证明了1DCNN⁃XGBoost混合模型能充分发挥1DCNN和XGBoost算法各自的性能,其效果优于单个的1DCNN和XGBoost模型,能自动提取特征,并且具有更好的准确率和稳定性㊂表2㊀分类结果对比/%模型accuracyrecallF1⁃score1DCNN97.7597.0797.75XGBoost94.6993.8194.741DCNN⁃XGBoost98.8398.5798.84㊀㊀另一方面,本文方法使用原始样本进行简单的标准化处理后直接提取特征,且每个样本持续时长为1.475s,持续时间短,使癫痫脑电信号分类系统不仅具有泛化能力,而且更具有临床意义㊂4㊀结束语癫痫脑电分类研究中,快速准确的分析至关重要,本研究针对单通道癫痫脑电分类问题,提出一种1DCNN结合XGBoost算法的分类模型,来提高癫痫脑电自动分类的准确率和稳定性㊂首先,将原始脑电信号进行标准化处理后训练1DCNN模型,保存训练好的模型;然后,以训练好的1DCNN模型提取特征;最后,结合XGBoost算法进行分类,并结合贝叶斯优化算法进行超参数寻优㊂实验结果表明,采用1DCNN可以很好地挖掘脑电数据信息,并在网络内部对特征进行提取和优化,自适应提取特征,更具有普适性和泛化性能;1DCNN⁃XGBoost模型相比于1DCNN和XGBoost模型各项性能均有明显提高,说明混合模型具有很好的分类性能,为癫痫脑电信号自动分类研究提供了新的思路,对癫痫疾病的(下转第94页)㊃19㊃㊀第37卷增刊柯㊀铭,等:基于1DCNN⁃XGBoost混合模型的癫痫脑电分类㊀㊀㊀4 结束语本文详细分析了多源地震灾情信息的特点,在此基础上建立了基于区间证据理论的地震多源灾情信息融合及烈度判定模型,并以芦山地震为例,利用基于证据相似性的区间证据融合理论,实现了基于地震灾情快速上报接收处理系统接收的多源灾情信息融合及地震烈度判定㊂实验结果与中国地震局公布的烈度圈分布具有一致性㊂说明了利用区间证据理论模型处理多源地震灾情信息方法的有效性㊂同时实验结果表明,判定结果仍然存在一定误差,其主要原因可能是灾情上报人员上报的地震灾情信息具有快速㊁及时的特点,但仍存在一定的主观性,可能导致局部整体偏高或整体偏低㊂未来可以结合遥感影像解译的灾情信息,进一步综合评定地震烈度㊂参考文献:[1]聂高众,安基文,邓砚.地震应急灾情服务进展[J].地震地质,2012,34(4):782⁃791.[2]胡素平,帅向华.网络地震灾情信息智能处理模型与地震烈度判定方法研究[J].震灾防御技术,2012,7(4):420⁃430.[3]王德才,倪四道,李俊.地震烈度快速评估研究现状与分析[J].地球物理学进展,2013,28(4):1772⁃1784.[4]林淋,孙景江,廖洁,等.地震动参数与地震烈度的多元回归研究[J].地震工程与工程振动,2011,31(3):33⁃38.[5]陈达生,刘汉兴.地震烈度椭圆衰减关系[J].华北地震科学,1989(3):31⁃42.[6]汪素云,俞言祥,高阿甲,等.中国分区地震动衰减关系的确定[J].中国地震,2000(2):5⁃12.[7]薄涛,李小军,陈苏,等.基于社交媒体数据的地震烈度快速评估方法[J].地震工程与工程振动,2018,38(5):206⁃215.[8]卢永坤,张建国,宋立军,等.2014年云南鲁甸6.5级地震烈度分布与房屋震害特征[J].地震研究,2014,37(4):549⁃557,669.[9]王红蕾,WalterDMooney.芦山Mw6.6级地震烈度调查及北美震例对比分析[J].地震工程与工程振动,2014,34(S1):108⁃117.[10]常想徳,陈建波,阿里木江㊃亚力昆,等.2016年新疆阿克陶M_S6.7地震烈度及探讨[J].内陆地震,2017,31(2):167⁃77.[11]罗炬,陈建波,常想德,等.2016年12月8日新疆呼图壁M_S6.2地震烈度分布初探[J].震灾防御技术,2017,12(1):24⁃30.[12]陈维锋,郭红梅,张翼,等.四川省地震灾情快速上报接收处理系统[J].灾害学,2014,29(2):116⁃22.[13]刘军,宋立军,兰陵,等.基于Android平台的灾情速报系统在于田7.3级地震中的应用[J].震灾防御技术,2014,9(4):915⁃920.[14]明小娜,周洋,卢永坤.云南地震灾情速报系统设计探讨[J].华北地震科学,2015,33(4):62⁃65.[15]曹彦波,吴艳梅,许瑞杰,等.基于微博舆情数据的震后有感范围提取研究[J].地震研究,2017,40(2):303⁃310.[16]王琛,章熙海,肖飞,等.基于12322平台的江苏省地震应急灾情速报系统的设计与应用[J].震灾防御技术,2018,13(2):471⁃479.[17]WaldDJ,QuitorianoV,HeatonTH,etal.TriNet ShakeMaps :rapidgenerationofpeakgroundmotionandintensitymapsforearthquakesinSouthernCalifornia[J].EarthquakeSpectra,1999,15(3):537⁃555.[18]王晓青,王龙,王岩,等.汶川8.0级大地震应急遥感震害评估研究[J].震灾防御技术,2008(3):251⁃258.[19]王晓青,魏成阶,苗崇刚,等.震害遥感快速提取研究 以2003年2月24日巴楚 伽师6.8级地震为例[J].地学前缘,2003(S1):285⁃291.[20]王晓青,窦爱霞,孙国清,等.基于综合震害指数的玉树地震烈度遥感评估研究[J].地震,2013,33(2):1⁃10.[21]窦爱霞,王晓青,丁香,等.遥感震害快速定量评估方法及其在玉树地震中的应用[J].灾害学,2012,27(3):75⁃80.[22]王晓青,窦爱霞,王龙,等.2013年四川芦山7.0级地震烈度遥感评估[J].地球物理学报,2015,58(1):163⁃71.[23]王晓青,窦爱霞,丁香,等.地震烈度应急遥感评估研究与应用进展[J].地球信息科学学报,2015,17(12):1536⁃1544.[24]关欣,孙贵东,郭强,等.基于区间数和证据理论的雷达辐射源参数识别[J].系统工程与电子技术,2014,36(7):1269⁃1274.[25]周剑,马晨昊,刘林峰,等.基于区间证据理论的多传感器数据融合水质判断方法[J].通信学报,2016,37(9):20⁃29.[26]方新,靳留乾,蹇明.基于区间D⁃S证据理论的物流中心选址模型[J].计算机应用研究,2015,32(12):3600⁃3604.[27]付艳华.基于证据推理的不确定多属性决策方法研究[D].沈阳:东北大学,2010.[28]中国地震烈度表(GB/T17742 2008)[S].北京:地震出版社,2008.[29]DenoeuxT.Reasoningwithimprecisebeliefstructures[J].Interna⁃tionalJournalofApproximateReasoning,1999,20(1):79⁃111.[30]DenT,OeligUX.Modelingvaguebeliefsusingfuzzy⁃valuedbeliefstructures[J].FuzzySetsandSystems,2000,116(2):167⁃199.[31]WangYingming,YangJianbo,XuDongling,etal.Onthecombinationandnormalizationofinterval⁃valuedbeliefstructures[J].InformationSciencesAnInternationalJournal,2007,177(5):1230⁃1247.[32]ZadehL.Reviewofmathematicaltheoryofevidence,byGlennShafer[J].AIMagazine,1984,5(3):81⁃83.[33]冯海山,徐晓滨,文成林.基于证据相似性度量的冲突性区间证据融合方法[J].电子与信息学报,2012,34(4):851⁃857.[34]李娅,邓鑫洋,邓勇.一种新的区间直觉模糊集决策方法:区间证据组合的角度[J].控制与决策,2014,29(6):1143⁃1147.(上接第91页)诊疗具有较强的指导意义㊂参考文献:[1]王海玉,胡剑锋,王映龙.脑电信号处理方法的研究综述[J].计算机时代,2018(1):13⁃15.[2]ZhangTao,ChenWanzhong,LiMingyang.ARbasedquadraticfeatureextractionintheVMDdomainfortheautomatedseizuredetectionofEEGusingrandomforestclassifier[J].BiomedicalSignalProces⁃singandControl,2017,31:550⁃559.[3]MatinA,BhuiyanRA,ShafiSR,etal.AhybridschemeusingPCAandICAbasedstatisticalfeatureforepilepticseizurerecognitionfromEEGsignal[C]//Procofthe8thJointInternationalConferenceonIn⁃formatics,Electronics&Visionandthe3rdInternationalConferenceonImaging,Vision&PatternRecognition.2019:301⁃306.[4]LiShufang,ZhouWeidong,YuanQi,etal.Featureextractionandre⁃cognitionofictalEEGusingEMDandSVM[J].ComputersinBiolo⁃gyandMedicine,2013,43(7):807⁃816.[5]孔祥浩,马琳,薄洪健,等.CNN与CSP相结合的脑电特征提取与识别方法研究[J].信号处理,2018,34(2):164⁃173.[6]WangYong.Classificationofepilepticelectroencephalogramssignalsusingcombiningwaveletanalysisandsupportvectormachine[J].JournalofMedicalImaging&HealthInformatics,2018,8(1):62⁃65.[7]张健钊,姜威,贲晛烨.基于样本熵与小波包能量特征提取和RealAdaBoost算法的正常期㊁癫痫间歇与发作期的脑电自动检测[J].生物医学工程学杂志,2016,33(6):1031⁃1038.[8]AlickovicE,KevricJ,SubasiA.Performanceevaluationofempiricalmodedecomposition,discretewavelettransform,andwaveletpackeddecompositionforautomatedepilepticseizuredetectionandprediction[J].BiomedicalSignalProcessing&Control,2018,39(1):94⁃102.[9]林栋,黄晓真,庄婉玉,等.基于近似熵及关联维度对浅针疗法干预失眠患者脑电数据的提取及分析[J].针刺研究,2018,43(3):180⁃184.[10]赵利民,朱晓军.基于局部均值分解与样本熵的脑电信号特征提取与分类[J].计算机工程,2017,43(2):299⁃303.[11]YuanQi,ZhouWeidong,LiShufang,etal.EpilepticEEGclassifica⁃tionbasedonextremelearningmachineandnonlinearfeatures[J].EpilepsyResearch,2011,96(1⁃2):29⁃38.[12]SriraamN,RaghuS.Classificationoffocalandnonfocalepilepticsei⁃zuresusingmulti⁃featuresandSVMclassifier[J].JournalofMedicalSystems,2017,41(10):160.[13]MurugavelASM,RamakrishnanS.Hierarchicalmulti⁃classSVMwithELMkernelforepilepticEEGsignalclassification[J].Medical&BiologicalEngineering&Computing,2016,54(1):149⁃161.[14]宋玉龙,赵冕,郑威.基于经验模态分解和极限学习机的癫痫脑电提取分类研究[J].生物医学工程研究,2019,38(3):263⁃268.[15]AndrzejakRG,LehnertzK,MormannF,etal.Indicationsofnonlineardeterministicandfinite⁃dimensionalstructuresintimeseriesofbrainelectricalactivity:dependenceonrecordingregionandbrainstate[J].PhysicalReviewE,2001,64(6):061907.[16]周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229⁃1251.[17]ChenTianqi,GuestrinC.XGBoost:ascalabletreeboostingsystem[C]//Procofthe22ndACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining.NewYork:ACMPress,2016:785⁃794.[18]ShahriariB,SwerskyK,WangZiyu,etal.Takingthehumanoutoftheloop:areviewofBayesianoptimization[J].ProceedingsoftheIEEE,2016,104(1):148⁃175.㊃49㊃计算机应用研究2020年㊀。
step特征提取-概述说明以及解释1.引言1.1 概述概述部分是对整篇文章的一个简要介绍,旨在引导读者了解文章的主要内容和目的。
对于这篇文章,我们可以这样编写概述部分的内容:概述Step特征提取是一种在数据处理和机器学习领域中广泛应用的技术,它能够从数据中提取出具有代表性和重要性的特征。
本文将深入探讨Step 特征提取的定义、背景、方法和技术,并探讨其在数据分析和决策制定中的重要性和优势。
通过研究Step特征提取的发展趋势和未来的发展方向,我们可以更好地理解和应用这一技术,以实现更准确、高效的数据分析和决策支持。
让我们一起来探索Step特征提取的世界吧!1.2 文章结构文章结构部分的内容可以包括以下内容:文章结构部分的主要目的是介绍整篇文章的框架和内容安排。
通过清晰地呈现文章的结构,读者可以更好地理解文章的逻辑和思路,有助于读者快速定位到自己感兴趣的内容。
本篇文章的结构主要包括引言、正文和结论三个部分。
引言部分主要介绍了本文的概述、文章的结构和目的。
在概述中可以简要说明Step特征提取的背景和重要性,引起读者对该主题的兴趣。
在文章结构部分,则详细介绍了各个章节的内容与目的。
正文部分是本篇文章的重点部分,主要包括Step特征提取的定义和背景以及方法和技术。
在定义和背景部分,可以详细解释Step特征提取的概念、作用和应用领域,引用相关的研究成果和理论基础,展示该方法的重要性和研究价值。
在方法和技术部分,则可以介绍Step特征提取的具体方法和技术,包括各种算法、模型和工具的使用和优缺点,并且结合实例或案例进行说明。
结论部分是对整篇文章进行总结和展望的部分。
首先,总结Step特征提取的重要性和优势,回顾与刚开始阐述的目的和论述的内容是否相符。
然后,展望未来Step特征提取的发展方向,提出可能的研究方向和改进方法,为读者提供思考和讨论的空间。
通过以上的文章结构的安排,读者可以更好地理解和阅读该篇文章,系统地了解Step特征提取的定义、方法和发展趋势,对相关领域的研究和应用具有一定的指导和参考意义。
基于遥感图像的舰船目标检测及特征提取技术遥感技术在海洋领域的应用日益广泛,尤其是在海洋航行、海上资源管理和海上安全等领域。
舰船目标检测及特征提取技术是遥感技术的一个重要应用领域,本文将重点介绍这一方面的研究进展,以及未来的发展趋势。
舰船目标检测及特征提取技术是指利用遥感图像中的舰船目标进行识别和分类,并获取船舶相关信息的技术。
传统的舰船目标检测方法主要基于像元或区域的特征提取和分类,其中最常用的是基于像元的检测方法。
但是,这种方法需要进行阈值选取和区域合并等操作,容易受到光照和噪声的影响,精度有限。
因此,近年来,基于深度学习的舰船目标检测方法受到了越来越多的关注。
深度学习是一种通过神经网络来实现特征自动提取和分类的方法,有着较高的准确性和强大的泛化能力。
在舰船目标检测中,深度学习方法主要基于卷积神经网络(CNN)和循环神经网络(RNN)进行目标检测和特征提取。
基于CNN的舰船目标检测方法主要包括两个步骤:图像区域提取和目标分类。
其中图像区域提取方法主要有滑动窗口方法和区域建议方法。
滑动窗口方法是一种基于像素的全局搜索方法,将图像分为相同大小的正方形区域进行分类。
而区域建议方法则是根据预测目标在图像中的位置提出候选区域,然后对这些候选区域进行检测分类。
这两种方法都需要对图像进行多次块处理,计算量大,效率低。
但是,研究表明,通过引入卷积层、池化层、ReLU激活函数等来提高CNN的效率,可以有效地减少计算量和处理时间。
基于RNN的舰船目标检测方法则是针对序列数据的特点进行设计的,主要应用于视频或雷达数据的检测。
这种方法通过循环神经网络的结构来建立时间序列模型,从而提取数据的动态时间特征,进而进行目标检测和识别。
在应用中,RNN可以与CNN结合使用,形成CNN-RNN网络,以实现更好的检测效果。
总体而言,基于深度学习的舰船目标检测方法具有准确率高、泛化能力强、对目标的适应性好等优点,是目前研究的热点和趋势。
智能视频监控中的目标识别与异常行为建模与分析一、本文概述随着科技的快速发展,智能视频监控在各个领域的应用越来越广泛,特别是在公共安全、交通管理、商业防盗等领域发挥着重要的作用。
智能视频监控的核心技术之一是对视频中的目标进行准确识别,并对异常行为进行有效的建模与分析。
本文旨在探讨智能视频监控中的目标识别与异常行为建模与分析的相关技术、方法及其实际应用。
本文将介绍目标识别在智能视频监控中的重要性,并概述目前常用的目标识别算法和技术,如深度学习、卷积神经网络等。
本文将详细阐述异常行为建模与分析的关键技术,包括行为特征提取、行为模式识别、异常行为检测与预警等。
本文还将探讨如何将目标识别与异常行为建模与分析相结合,以实现更高效的智能视频监控。
本文将通过案例分析,展示智能视频监控在公共安全、交通管理等领域的应用效果,为相关领域的研究和应用提供参考和借鉴。
通过本文的阐述,读者将能够全面了解智能视频监控中的目标识别与异常行为建模与分析的相关技术和方法,为其在实际工作中的应用提供有力支持。
二、智能视频监控技术概述随着科技的飞速发展,智能视频监控技术已成为现代安全领域的重要支柱。
该技术集成了图像处理、模式识别等多种先进科技,实现了从传统的模拟监控向数字化、网络化、智能化的跨越。
智能视频监控的核心在于对视频流进行高效处理和分析,从而实现对目标对象的自动识别、跟踪以及异常行为的建模与分析。
在智能视频监控系统中,目标识别技术扮演着至关重要的角色。
它依赖于计算机视觉和机器学习算法,通过对视频帧中的图像进行处理和分析,实现对目标对象的精确识别和定位。
这些目标对象可以是人、车辆、物品等,识别过程通常包括目标检测、特征提取和分类识别等步骤。
异常行为建模与分析是智能视频监控的另一个重要方面。
在复杂的监控场景中,如何准确识别并预警异常行为一直是研究的热点和难点。
异常行为通常指的是与正常行为模式不符或违反预设规则的行为。
智能视频监控系统通过构建行为模型,对监控场景中的目标对象进行持续跟踪和分析,一旦检测到异常行为,系统将立即触发报警机制,为安全监控提供及时有效的支持。
基于深度学习的信号检测与分类在当今科技飞速发展的时代,信号处理技术在众多领域都发挥着至关重要的作用,从通信、医疗到工业控制,无处不在。
而基于深度学习的信号检测与分类方法的出现,更是为这一领域带来了革命性的变革。
要理解基于深度学习的信号检测与分类,首先得明白什么是信号。
简单来说,信号就是携带信息的物理量,它可以是声音、图像、电磁波等等。
而信号检测就是要从复杂的环境中发现这些有价值的信号,分类则是要将检测到的信号按照其特征和所属类别进行划分。
传统的信号检测与分类方法往往依赖于人工设计的特征提取和分类算法。
比如,在音频信号处理中,可能会先计算音频的频谱特征,然后基于这些特征使用支持向量机等分类算法进行分类。
但这种方法存在很大的局限性,因为人工设计的特征往往难以全面准确地反映信号的本质特征,而且对于复杂多变的信号场景适应性较差。
深度学习的出现改变了这一局面。
深度学习是一种基于多层神经网络的机器学习方法,它能够自动从大量的数据中学习到有用的特征和模式。
在信号检测与分类任务中,深度学习模型可以直接输入原始的信号数据,通过多层的神经网络结构自动提取深层次的特征,并进行准确的分类。
以图像信号为例,卷积神经网络(CNN)是常用于图像信号处理的深度学习模型。
CNN 通过卷积层和池化层的组合,能够有效地提取图像中的局部特征和全局特征。
比如,在识别手写数字的任务中,CNN可以自动学习到数字的形状、线条等特征,从而实现准确的分类。
对于音频信号,循环神经网络(RNN)及其变体,如长短期记忆网络(LSTM)和门控循环单元(GRU),则表现出色。
因为音频信号往往具有时间序列的特点,RNN 系列模型能够很好地处理这种时间依赖关系。
比如,在语音识别任务中,这些模型可以根据语音信号的前后顺序,准确地识别出所说的内容。
在实际应用中,基于深度学习的信号检测与分类面临着一些挑战。
首先是数据问题。
深度学习模型需要大量的标注数据进行训练,如果数据量不足或者标注质量不高,模型的性能就会受到很大影响。