Speeding Up Multi-class SVM Evaluation by PCA and Feature Selection

格式：pdf
大小：216.80 KB
文档页数：9

下载文档原格式

svm使用详解

1.文件中数据格式label index1:value1 index2:value2 ...Label在分类中表示类别标识，在预测中表示对应的目标值Index表示特征的序号，一般从1开始，依次增大Value表示每个特征的值例如：3 1:0.122000 2:0.7920003 1:0.144000 2:0.7500003 1:0.194000 2:0.6580003 1:0.244000 2:0.5400003 1:0.328000 2:0.4040003 1:0.402000 2:0.3560003 1:0.490000 2:0.3840003 1:0.548000 2:0.436000数据文件准备好后，可以用一个python程序检查格式是否正确，这个程序在下载的libsvm文件夹的子文件夹tools下，叫checkdata.py,用法：在windows命令行中先移动到checkdata.py所在文件夹下，输入：checkdata.py 你要检查的文件完整路径（包含文件名）回车后会提示是否正确。

2.对数据进行归一化。

该过程要用到libsvm软件包中的svm-scale.exeSvm-scale用法：用法：svmscale [-l lower] [-u upper] [-y y_lower y_upper] [-s save_filename] [-r restore_filename] filename （缺省值： lower = -1，upper = 1，没有对y进行缩放）其中， -l：数据下限标记；lower：缩放后数据下限；-u：数据上限标记；upper：缩放后数据上限；-y：是否对目标值同时进行缩放；y_lower为下限值，y_upper 为上限值；（回归需要对目标进行缩放，因此该参数可以设定为–y -1 1 ）-s save_filename：表示将缩放的规则保存为文件save_filename；-r restore_filename：表示将缩放规则文件restore_filename载入后按此缩放；filename：待缩放的数据文件（要求满足前面所述的格式）。

(完整版)支持向量机(SVM)原理及应用概述

支持向量机（SVM ）原理及应用一、SVM 的产生与发展自1995年Vapnik(瓦普尼克)在统计学习理论的基础上提出SVM 作为模式识别的新方法之后，SVM 一直倍受关注。

同年，Vapnik 和Cortes 提出软间隔(soft margin)SVM ，通过引进松弛变量i ξ度量数据i x 的误分类(分类出现错误时i ξ大于0)，同时在目标函数中增加一个分量用来惩罚非零松弛变量(即代价函数)，SVM 的寻优过程即是大的分隔间距和小的误差补偿之间的平衡过程；1996年，Vapnik 等人又提出支持向量回归 (Support Vector Regression ，SVR)的方法用于解决拟合问题。

SVR 同SVM 的出发点都是寻找最优超平面(注：一维空间为点；二维空间为线；三维空间为面；高维空间为超平面。

)，但SVR 的目的不是找到两种数据的分割平面，而是找到能准确预测数据分布的平面，两者最终都转换为最优化问题的求解；1998年，Weston 等人根据SVM 原理提出了用于解决多类分类的SVM 方法(Multi-Class Support Vector Machines ，Multi-SVM)，通过将多类分类转化成二类分类，将SVM 应用于多分类问题的判断：此外，在SVM 算法的基本框架下，研究者针对不同的方面提出了很多相关的改进算法。

例如，Suykens 提出的最小二乘支持向量机 (Least Square Support Vector Machine ，LS —SVM)算法，Joachims 等人提出的SVM-1ight ，张学工提出的中心支持向量机 (Central Support Vector Machine ，CSVM)，Scholkoph 和Smola 基于二次规划提出的v-SVM 等。

此后，台湾大学林智仁(Lin Chih-Jen)教授等对SVM 的典型应用进行总结，并设计开发出较为完善的SVM 工具包，也就是LIBSVM(A Library for Support Vector Machines)。

基于粒子群算法和支持向量机的黄花菜叶部病害识别

中®农f(8報 2022,38(8): 135-140Chinese Agricultural Science Bulletin基于粒子群算法和支持向量机的黄花菜叶部病害识别孙瑜'，张永梅'，武玉军2C山西农业大学信息科学与工程学院，山西太谷030801 ;2大同大学，山西大同037000)摘要:使用数字图像处理技术，以黄花菜叶部病害图像为识别对象，基于L a b空间和K-m e a n s聚类算法分割病害区域，提取目标区域的颜色特征、方向梯度直方图(histogram of oriented gradient,H O G)特征和形状特征，分别建立单一特征模型和特征融合模型，采用粒子群(particle swarm optimization，P S O)算法通过交叉验证优化支持向量机(support vector machine,S V M)模型的惩罚因子和核参数，建立基于P S O-S V M的多特征融合分类模型识别黄花菜病害。

基于S V M的多特征融合分类模型识别率高于单一特征分类模型，识别率可达为81.67%;基于P S O-S V M多特征融合分类模型识别率高达92.39%。

基于P S O-S V M的多特征分类模型识别率高，可以及时、便捷、高效地识别黄花菜病害。

关键词：图像处理；黄花菜;病害识别；支持向量机;粒子群算法；多特征融合中图分类号:T P391.41 文献标志码:A论文编号:casb2021-1215Recognition of Hemerocallis citrina Leaf Disease Based on PSO and SVMSUN Yu', ZHANG Yongmei', WU Yujun2(College of Information Science and Engineering, Shanxi Agriculture University, Taigu, Shanxi 030801;2Datong University,Datong, Shanxi 037000)Abstract：By using digital image processing technology, the disease image of H em ero ca llis c itrin a leaf was taken as the recognition object. The disease area was segmented based on Lab space and K-means clustering algorithm, and the color characteristics, histogram of oriented gradient (HOG) and shape characteristics of the target areas were extracted from the images. The single- feature model and multi- feature model were established respectively based on the extracted features. Particle swarm optimization (PSO) algorithm was used to optimize the penalty factor and kernel parameter of the support vector machine (SVM) model through cross validation. Multi-feature classification model based on PSO-SVM was established to identify diseases of H.c itrin a leaves. The recognition rate of SVM based multi-feature classification model was higher than that ofsingle-feature classification model, and the recognition rate could reach 81.67%. The recognition rate of multifeature classification model based on PSO-SVM was as high as 92.39%. The multi-feature classification model based on PSO- SVM has high recognition rate and can identify the disease of H. c itrin a leaf timely, conveniently and efficiently.Keywords：image processing; H em ero ca llis citrin a;disease recognition; support vector machine (SVM);particle swarm optimization (PSO); multi-feature fusion0引言典型范例[|]。

基于PCA-MFCC支持向量机快速语音识别

式（２）中，为与第个样本对应的Ｌａｇｒａｎｇｅ乘子，非零Ｏ／对应的样本点就是支持向量。
对问题（２）求解后，可以得到相应的决策函数
本（，Ｙ）， ∈Ｒ，Ｙ ∈ ｛＋１，一１），＝１， …，ｆ输
题，即
ｆ１ｌＺ
１支持向量机
在线性可分的二分类问题中，设有Ｚ个训练样
｛ｆｍａｘ（）＝ ∑ 一寺一 ∑∑ ｙ＝ｌｙｙｊ（）（２）
【ｓ．ｔ．０ ≤ ≤Ｃ， ∑ａｉＹ＝０＝ｌ， …，
号处理。
）＝ｓｇｎ［ ∑Ｏｔ。Ｙｉ（。Ｘｉ）＋ｂ］
（３）
４期
庞陟儒，等：基于ＰＣＡ — ＭＦＣＣ支持向量机快速语音识别
１０３５
式（３）中，
（至少有一个
≠０）为最优解，ｂ
（Ｍｅｌ频率离散小波倒谱系数）特征提取算法过程如
为分类阈值，为待识别的样本。对于非线性可分的数据集，可以通过一个非线性函数（）将训练集数据映射到一个高维线性特征空间ｚ，其对应的决策函数变为
｛＋１，一１｝的两类之一。训练ＳＶＭ就是要在特征空间中，寻找能将两类样本正确分开的最优分类超平面＋ｂ＝０，并使得离平面最近的每类点（称为
支持向量，ＳｕｐｐｏｒｔＶｅｃｔｏｒ）与该平面的距离达到最大

gaitcad_matlab

To use the toolbox for the design of a data mining algorithm, a training data set is required. This data set is normally given by a binary Matlab project file, containing matrices and vectors with predefined structures and names. This data set is normally given by a binary Matlab project file, containing matrices with given names. Additionally, the user is able to add own textual identifiers and further information to the matrices and structures. Missing information is compensated by standard values and identifiers. The import of data from text files (single files or complete directories, single features or time series) is possible. The training data set is organized with n = 1, ..., N data points, each containing • sz time series (described by a matrix with the dimension sz × K, with K - number of sample points), • s single features (vector with the dimension s) • sy discrete output variables (vector with the dimension sy). The management of multiple output variables (i.e. diagnoses with respect to diseases in medical applications, decisions for therapies, qualitative evaluations of therapy successes, gender, age-groups etc.) for each data point allows a flexible selection of multiple classification problems. Additionally, input and output variables may be switched depending on the problem. Gait-CAD implements the standardized data mining process proposed by [2]. The main components are shown in Figure 2. Gait-CAD permits a comfortable handling of numerous algorithms for the • selection of data points (e.g. detection of outliers, discarding of incomplete data points and features, selection of parts of data sets), • feature extraction (e.g. spectrograms, FFT analysis, correlation analysis, linear filtering, calculation of extrema, mean values, fuzzification etc.), • evaluation and selection of features and time series (e.g. multivariate analysis of variances, t-test, information measures, regression analysis), • feature aggregation (e.g. discriminant analysis, principal component analysis - PCA, independent component analysis - ICA), • supervised and unsupervised classification (e.g. decision trees, cluster algorithms, Bayes classifier, artificial neural networks (ANN), nearest neighbour algorithms, support vector machines - SVM, fuzzy systems), and • validation strategies (e.g. cross-validation, bootstrap). Additionally, there are various possibilities to visualize results, automatically log results and process steps in text and LaTeX files, rename variables etc. For some functions, Gait-CAD uses additional commercial Matlab toolboxes (e.g. Signal, Statistics, Neural Network, and Wavelet toolbox from the MathWorks, Inc.) or freely available GNU-GPL toolboxes. But most of the selfimplemented functions require only a standard Matlab installation. The feature extraction is realized with plugins. Plugins are single Matlab functions called plugin_*.m, which are included in a special directory or in the working diAD screenshot Gait-CAD is an open source software. The German version is available since November 2006, the English one since January 2008 It is licensed under the conditions of the GNU General Public License (GNU-GPL) of The Free Software Foundation. The download is possible using the downloading section at http://www.iai.fzk.de/projekte/biosignal/index.html.

基于PCA-SVM的柴油凝点近红外光谱软测量法

ｆｒＣＯｎｅｓｔｎＰｉｔｏｅｅｕＩｏｄｎａｉｏｎｆＤｉｓＩｅＯＦ
翼德金２，
（江学院电子工程系。九江九，
互晓
３２０；３０５合肥工业大学仪器科学与光电工程学院合肥２００），３０９
ＫｅｗｒｓｏｎｉＣｎｅｓｔｎｐｉＰｉｃａｃｍｎｎａａｓＰＡ）Ｓｐｒｖｃｒａｈｅ（ＶＮａ－ｆｒｄｓｅ— ｙｏｄ：ＳｆｓｓｇｏｄｎａｏｎｒｉｌｏｐｅｔｎｌｉＣｕｐｔｅｔｃｉＳＭ）ｅｒｎａｅｐｃｔｅｎｉｏｔｎｐｏｙｓ（ｏｏｍｎｉｒｔｓｐＮＲ）ｒｃｙ（ＩＳｏｏ
过化学计量学方法或数学模型方法建立柴油凝点与特
征光谱之间的相关模型，并利用该模型对待测油品的凝点值进行分析预测。但相关研究也表明，柴油作
为一种多烃混合物，其光谱结构十分复杂，谱图重叠现象严重，用特征峰等简单谱分析方法难以达到测试要
０引言
柴油是重要的石油化工产品，凝点指的是在试其验条件下冷却到液面不移动的最高温度。柴油的凝点
是划分柴油牌号的重要依据，也是作为柴油生产的关键质量指标之一。目前测定柴油凝点的主要方法是冷
红外光谱区（０２５０ｎ吸收光谱所提供的信息，７０～０ｍ）研究与柴油油品组成性质相关的近红外光谱数据，通
ｔｏｒｄｍｅｓｏａｐｃ．ＦｉａｌｈｅｓｆｅｓｎｄｌｆｒｃｎｅｓｔｎｐｉｔｓｕｌｙａｏｔｎＶＭｅｒｓｉｎａｇｒｔｍ．Ｅｘｅｍｅ－ｏｌｗｅｉｎｉｎｌｓａｅｎｌｙ。ｔｔｓｎｉｇｍｏｅｏｄｎａｉｎｏｏｏｏＷａｂｉｂｄｐｉｇＳｔｒｇｅｓｏｌｏｈｉｐｒｎｉｔｅｕｔｈｗｔａｏａｎｇｗｉＢＰ。ＳｌａｒｓｌｓｏｈｔｃｍｐｒｓｉｈｔＶＭａｄＰｎＣＡ－ＢＰ。ｔｅｐｏｓｄｍｅｈｄｏｅｓｈｇｅｒｃｓｏｈｒｐｅｏｔｏｆｒｉｈｒｐｅｉｉｎ。ａｄｉｌｓｒｔｈｅｓａｄｒｍｅｕ－ｎｓｃｏｅｏｔｔｎａｄｓａｒｉｇｒｓｌ。ｓｔｆｓｏｌｎａｕｅｎｆｃｎｅｓｔｎｐｉｔｎｅｕｔｏｉｉｎｉｅｍｅｓｒｍｅｔｏｏｄｎＰＡＳＭ及近红外光谱（ＩＳ分析技术的柴油凝点软测量方法。首先，用多项式卷积对原始的柴油ＮＰＣ —ＶＮＲ）采ＩＳ

三维荧光光谱结合PCA-SVM对几种浓香型白酒的鉴别

三维荧光光谱结合PCA-SVM对几种浓香型白酒的鉴别徐瑞煜;朱焯炜;胡扬俊;张毅;陈国庆【期刊名称】《光谱学与光谱分析》【年(卷),期】2016(36)4【摘要】In this paper ,a method for discrimination of different bands liquor with strong aroma type based on three‐dimensional fluorescence spectrum technology was developed .Firstly ,the three‐dimensional fluorescence spectra of seven different brands liquor were measured by the FLS920 fluorescence spectrometer which produced by Edinburgh in England .The spectral shows that different bands liquors have similar fluorescence ch aracteristics and it ’s difficult to distinguish them only with Fluorescent characteristic parameters .Because of this ,the first‐order and second‐order partial derivatives respect to fluorescenceemission wavelength on each of the excitation wavelength were carried out in this paper .Daubechies‐7 (db7) orthonormal wavelet with compact support was used to compress the spectral data .The forth approximate coefficients were finally chosen as the new data matrix .Then the new data matrix was analyzed by principal component analysis (PCA) and the principal components were ex‐tracted to be used as the inputs of support vector machine (SVM ) .The K‐fold cross validation was applied to optimize the pa‐rameters c and γand the prediction model was constructed in the end .Fourteen samples were selected randomly fromeach brand that in total of ninety‐eight samples were selected as the training set ,and the rest forty‐two samples were collected as the predic‐tion set .The effect of three different spectral data after processing on the model is compared :original data ,the first‐order and second‐order partial derivatives on the spectral data .The results show that the three‐dimensional fluorescence spectra with the pretreatment of second‐order partial derivatives coupled with PCA and SVM can make a good performance on the brands identifi‐cation of strong aroma typeliquors ,the accuracy of the established model and prediction accuracy were 98.98% and 100% ,re‐spectively .This method has the advantage of easy operation ,high speed ,low cost and provides a good help in the detection and identification of Chinese liquor .%提出一种利用三维荧光光谱技术鉴别不同品牌浓香型白酒的方法。

支持向量机的特征选取方法

支持向量机的特征选取方法支持向量机（Support Vector Machine，简称SVM）是一种常用的机器学习算法，被广泛应用于分类和回归问题。

在实际应用中，选择合适的特征对于SVM的性能至关重要。

本文将介绍一些常用的支持向量机特征选取方法，帮助读者更好地理解和应用SVM算法。

一、特征选取的重要性特征选取是指从原始数据中选择出最具有代表性和区分性的特征，以提高分类或回归模型的性能。

在SVM中，特征选取的目标是找到最佳的特征子集，以提高分类超平面的判别能力和泛化能力。

二、过滤式特征选取方法过滤式特征选取方法是一种独立于具体学习算法的特征选择方法，它通过对特征进行评估和排序，然后选择排名靠前的特征子集。

常用的过滤式特征选取方法有相关系数法、卡方检验法和信息增益法等。

1. 相关系数法相关系数法是一种衡量特征与目标变量之间线性关系的方法。

它通过计算特征与目标变量之间的相关系数，选择相关性较高的特征。

在SVM中，相关系数法可以帮助我们筛选出与目标变量相关性较强的特征，提高分类模型的性能。

2. 卡方检验法卡方检验法是一种用于检验特征与目标变量之间独立性的方法。

它通过计算特征与目标变量之间的卡方值，选择卡方值较大的特征。

在SVM中，卡方检验法可以帮助我们找到与目标变量相关性较高的特征，提高分类模型的准确性。

3. 信息增益法信息增益法是一种衡量特征对于目标变量分类能力的方法。

它通过计算特征对目标变量的信息增益，选择信息增益较大的特征。

在SVM中，信息增益法可以帮助我们选择对目标变量具有较强分类能力的特征，提高分类模型的性能。

三、嵌入式特征选取方法嵌入式特征选取方法是一种将特征选取与学习算法结合起来的方法，通过学习算法自身的特性选择最佳的特征子集。

常用的嵌入式特征选取方法有L1正则化方法、决策树方法和基于遗传算法的方法等。

1. L1正则化方法L1正则化方法是一种通过在目标函数中加入L1范数惩罚项来实现特征选取的方法。

利用支持向量机进行变量重要性分析与筛选

利用支持向量机进行变量重要性分析与筛选在数据分析和机器学习领域，变量重要性分析与筛选是一项关键任务。

通过确定哪些变量对于预测模型的性能和准确性具有最大的影响，我们可以优化模型并提高其预测能力。

支持向量机（Support Vector Machine，SVM）是一种强大的机器学习算法，具有广泛的应用领域。

在本文中，我们将探讨如何利用支持向量机进行变量重要性分析与筛选。

首先，让我们简要了解支持向量机的基本原理。

支持向量机是一种监督学习算法，用于分类和回归问题。

其基本思想是通过在特征空间中构建一个最优的超平面，将不同类别的数据样本分开。

支持向量机通过最大化超平面与最近的数据点之间的间隔，实现对数据的有效分类。

在变量重要性分析中，我们可以利用支持向量机的特性来评估不同变量对于分类或回归的贡献程度。

通过训练支持向量机模型，并观察每个变量对模型性能的影响，我们可以得出变量的重要性排序。

具体而言，我们可以使用以下方法来实现变量重要性分析与筛选。

首先，我们需要准备一个包含所有变量和目标变量的数据集。

接下来，我们将数据集分为训练集和测试集，以便在训练支持向量机模型时进行验证。

然后，我们使用支持向量机算法对训练集进行训练，并利用测试集评估模型的性能。

在训练过程中，支持向量机将为每个变量分配一个权重，该权重表示该变量对于模型的贡献程度。

较高的权重意味着该变量对于模型的性能具有更大的影响。

我们可以根据这些权重来确定变量的重要性，并进行筛选。

一种常用的方法是基于权重的排序。

我们可以按照变量权重的大小对变量进行排序，从而得出变量的重要性顺序。

具有较高权重的变量被认为对于模型的性能具有更大的影响，因此可以被保留下来。

相反，具有较低权重的变量可能对模型的性能影响较小，可以被剔除。

另一种方法是基于变量的影响度量。

我们可以通过计算在去除某个变量后模型性能的变化来评估该变量的重要性。

如果去除某个变量后模型性能显著下降，那么该变量被认为对于模型的性能具有重要影响，应该保留。

基于FS-PCA-MSCD的地铁轴承可视化诊断方法

基于FS-PCA-MSCD的地铁轴承可视化诊断方法杨建伟;白永亮;武慧杰;化凤芳【期刊名称】《北京建筑工程学院学报》【年(卷),期】2016(032)003【摘要】针对地铁轴承的可视化故障诊断能力,本文提出了基于特征选择(Feature Selection,FS)与多尺度类距离(Multi Scale Class Distance,MSCD)的轴承故障诊断方法.首先对地铁齿轮箱轴承振动信号进行采集,获得不同故障类型的轴承故障样本集;然后基于FS方法提取故障样本中存在的敏感特征值,并利用获得的特征向量进行主成分分析(Principal Component Analysis,PCA),基于MSCD方法对各故障聚类进行再分类,提高故障类的可分性,获得可视化程度高的故障诊断结果.利用该方法对地铁齿轮箱轴承故障数据进行可视化故障诊断,诊断结果表明该方法能够提取敏感故障特征并获得具有较高故障可分性与可视化的诊断结果.该方法为地铁轴承在线故障分析能力提供了技术支持,在地铁运行维护与故障诊断方面均具有广阔的应用前景.【总页数】6页(P116-120,131)【作者】杨建伟;白永亮;武慧杰;化凤芳【作者单位】北京建筑大学机电与车辆工程学院城市轨道交通车辆服役性能保障北京市重点实验室,北京100044;北京建筑大学机电与车辆工程学院城市轨道交通车辆服役性能保障北京市重点实验室,北京100044;北京建筑大学机电与车辆工程学院城市轨道交通车辆服役性能保障北京市重点实验室,北京100044;北京建筑大学机电与车辆工程学院城市轨道交通车辆服役性能保障北京市重点实验室,北京100044【正文语种】中文【中图分类】TH17【相关文献】1.基于EMD与SVM的地铁列车滚动轴承故障诊断方法分析 [J], 彭松;黄志辉;胡奇宇2.基于FS-PCA-MSCD的地铁轴承可视化诊断方法 [J], 杨建伟;白永亮;武慧杰;化凤芳;3.基于加权改进D-S证据融合理论的地铁车辆转向架轴承故障诊断方法 [J], WANG Yuanfei;PEI Chunxing;SUN Hairong4.基于小波神经网络的地铁轴承故障诊断方法 [J], 徐欣怡;徐永能;任宇超5.基于小波神经网络的地铁轴承故障诊断方法 [J], 徐欣怡;徐永能;任宇超因版权原因，仅展示原文概要，查看原文内容请购买。

结合特征选择的二叉树SVM多分类算法

（南京理工大学自动化学院，江苏南京２０９）１０４
摘要：为解决现有二叉树ＳＭ多分类算法采用固定的特征集和结构存在分类精度较低的问题，出了一种结合特征选择Ｖ提的二叉树ＳＭ多类分类算法。采用自上而下分裂的方式构造整个二叉树结构，Ｖ首先计算各节点的所有可能分割，以分离并度和相似度作为依据为各分割选择有效的分类特征子集，以相应的特征子集计算各分割的类间距，最后选择类间距最大再的分割生成子节点。实验结果表明，算法分类精度较高且计算复杂度低。该
ＦＡＮＢａ — ｈｏＷＡＮＧｉｎｙ，Ｂ０Ｙｕｍｉｇｉｃａ，Ｊａ－ｕ — ｎ
（ｅａｍｅｔｆｕｏｔｎＮａｊｇｉｅｓｙｏｃｎｅｎｅｈｏｏｙＮｎｉ１０４ｈｎ）Ｄｐｒｎｔｍａｏ，ｎｉｖｒｉｆＳｉｃｄＴｃｎｌｇ，ａｊｇ２９，ＣｉａｔｏＡｉｎＵｎｔｅａｎ０
ａｎｖｌｉａｙｔｅＶＭｌ — ｌｓｌｓｉｃｔｎａｇｒｔｍｔａｕｅｓｌｃｉｎｉｒｐｓｄｏｅｎｒｅＳｂｒｍｕｔｃａｓｃａｓｆａｉｌｏｉｉｉｏｈｗｉｆｔｒｅｅｔｐｏｏｅ．ＴｈｎｉｅｂｎｒｅｓｓｕｔｒｄｉｈｅｏｓｅｅｔｉａｔｅｉｔｃｕｅａｒｙｒｒｎｔｐｄｗｎｓｌｙＦｒｅｃｏｅａｌｏｓｂｅｐｒｉｏｓａｅｃｌｕａｅｒｔ，ａｄｔｅｅｉｔｒｃａｓｄｓｎｅｏａｈｐｒｉｏｓｏ — ｏｐｉｗａ．ｏａｈｎｄ，ｌｐｓｉｌａｔｉｎｒａｃｌｔｄｆｓｌｔｔｉｙｎｎｔｅ－ｌｓｉｔｃｆｃａｔｉｎｉｈｈｎａｅｔ

基于空洞卷积与特征增强的单阶段目标检测算法

基金项目：国家自然科学基金（6 1 9 6 1 0 3 8）。作者简介：姜竣（1996—），男，硕士研究生，主研方向为目标检测、计算机视觉；翟东海，副教授、博士。收稿日期：2020-05-13 修回日期：2020-06-16 E⁃mail：junjiang@
基于空洞卷积与特征增强的单阶段目标检测算法
姜竣 1，翟东海 1，2
（1. 西南交通大学信息科学与技术学院，成都 611756；2. 西藏大学工学院，拉萨 850000）
摘要：基于卷积神经网络目标检测算法的浅层特征图包含丰富的细节信息，但缺乏语义信息，而深层特征图则相反。为充分利用浅层和深层特征图特征，解决多尺度目标检测问题，提出一种新的单阶段目标检测算法 (AFESSD)。以 SSD 算法为基础，分别对该算法中相邻的 2 个特征图进行特征融合，从而丰富浅层特征层的语义信息。通过对并行空洞卷积机制进行改进，构建多尺度特征提取模块，将融合后的特征图通入多尺度特征提取模块的方式丰富其多尺度信息，同时提升主干网络的特征提取能力。在 PASCAL VOC2007 测试集上的实验结果表明，AFE-SSD 算法的 mAP 为 79.8%，检测速度为 58.8 frame/s，与 SSD、DSSD 算法相比，mAP 分别提升了 2.4 和 1.2 个百分点，验证了所提特征融合方式及多尺度提取模块的有效性。关键词：卷积神经网络；SSD 算法；特征融合；空洞卷积；目标检测
开放科学（资源服务）标志码（O S ID）：
中文引用格式：姜竣，翟东海 .基于空洞卷积与特征增强的单阶段目标检测算法［J］.计算机工程，2021，47（7）：232-238，248. 英文引用格式：JIANG J，ZHAI D H. Single-stage object detection algorithm based on dilated convolution and feature enhancemen［t J］.Computer Engineering，2021，47（7）：232-238，248.

时间序列分类中的SVM算法

时间序列分类中的SVM算法随着时间序列数据的不断涌现和应用范围的不断扩大，时间序列分类算法也越来越受到重视。

而SVM算法作为一种受欢迎的分类算法，也被广泛应用于时间序列分类问题。

SVM算法的基本原理SVM算法在处理分类问题时，会将数据集映射到高维空间中，通过寻找一个最优的超平面来对数据进行分类。

具体来说，在特征空间中，SVM算法会尽可能地找到一个能够将两个不同类别的数据分开的超平面。

而对于非线性分类问题，SVM通过核函数的转换，将数据集映射到高维空间中，从而实现分类。

SVM算法在时间序列分类中的应用在时间序列分类中，SVM算法也能够发挥出其优异的分类能力。

对于一个时间序列，可以将其表示成一个向量形式。

然后，SVM算法通过核函数的转换，将时间序列映射到高维空间中进行分类。

下面以UCR时间序列分类数据集为例，介绍SVM算法在时间序列分类中的应用。

读取数据首先，需要将时间序列数据集读取进来。

UCR时间序列分类数据集是一个经典的时间序列数据集，包含了许多不同的数据集，每个数据集都对应一个不同的分类问题。

加载数据集的方法可以使用相关的Python库，如下所示：``` pythonfrom sklearn.datasets import load_X_train, y_train, X_test, y_test = load_('GunPoint')```其中，'GunPoint'是UCR数据集中的一个数据集名称，X_train 和y_train表示训练集数据和标签，X_test和y_test表示测试集数据和标签。

特征提取在进行分类之前，需要对时间序列进行特征提取。

常见的时间序列特征提取方法包括峰值、均值、标准差、自相关、互相关等方法。

以峰值特征为例，可以使用np.argmax()函数获取时间序列中的峰值位置。

代码如下所示：``` pythonimport numpy as npdef max_feature(X):return np.argmax(X)X_train_ = np.apply_along_axis(max_feature, axis=1, arr=X_train) X_test_ = np.apply_along_axis(max_feature, axis=1, arr=X_test) ```这里使用了np.apply_along_axis()函数，可以对每个时间序列应用max_feature()函数，最终得到峰值特征。

解决数据样本共线性的机器学习技巧

解决数据样本共线性的机器学习技巧在机器学习领域，共线性是一个常见且具有挑战性的问题。

共线性可以发生在数据样本中的特征之间，这可能导致模型效果下降，模型参数不稳定甚至无法解释。

因此，解决数据样本共线性问题是一项重要的任务。

本文将介绍一些解决数据样本共线性的机器学习技巧，帮助您提高模型的性能和可解释性。

1. 特征选择特征选择是一种常用的解决数据样本共线性问题的技巧。

通过选择最佳的特征子集，可以降低特征之间的相关性，从而减少共线性的问题。

常见的特征选择方法包括过滤式方法、包裹式方法和嵌入式方法。

过滤式方法使用统计方法来评估特征与目标变量之间的相关性，例如皮尔逊相关系数或互信息。

然后，根据相关性的得分对特征进行排序，选择得分最高的特征子集。

包裹式方法通过使用目标变量进行模型训练和评估来选择特征子集。

具体地，使用某种搜索算法（如递归特征消除算法）来找到最佳的特征子集，以最大化模型的性能。

嵌入式方法是将特征选择和模型训练合并在一起的方法。

常见的嵌入式方法包括Lasso回归和岭回归。

这些方法可以通过正则化项来约束模型的复杂度，以减少共线性的影响。

2. 主成分分析（PCA）主成分分析是一种常用的降维技术，可以用来解决数据样本共线性问题。

通过将原始特征转换为一组无关的主成分，可以降低特征间的相关性。

具体来说，主成分分析通过线性变换将原始特征投影到一个新的特征空间，使得新的特征之间是无关的。

然后，可以选择最重要的主成分来进行模型训练和预测。

3. 正则化方法正则化方法是一种常用的解决数据样本共线性问题的技巧。

通过在模型的损失函数中引入正则化项，可以约束模型的复杂度，减少共线性的影响。

常见的正则化方法包括L1正则化和L2正则化。

L1正则化可以使得一些特征的权重为零，从而实现特征选择和降维。

L2正则化可以减小特征的权重，从而减少特征之间的相关性。

4. 数据处理数据处理是解决数据样本共线性问题的另一种重要技巧。

通过对数据进行标准化、归一化或离散化等处理，可以减小特征之间的尺度影响和相关性。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

SpeedingUpMulti-classSVMEvaluationbyPCAandFeatureSelectionHanshengLei,VenuGovindarajuCUBS,CenterforUniﬁedBiometricsandSensorsStateUniversityofNewYorkatBuﬀaloAmherst,NY14260Email:{hlei,govind@cse.buﬀalo.edu}

AbstractSupportVectorMachine(SVM)isthestate-of-artlearningmachinethathasbeenveryfruitfulnotonlyinpatternrecog-nition,butalsoindataminingareas,suchasfeatureselec-tiononmicroarraydata,noveltydetection,thescalabilityofalgorithms,etc.SVMhasbeenextensivelyandsuccessfullyappliedinfeatureselectionforgeneticdiagnosis.Inthispa-per,wedothecontrary,i.e.,weusethefruitsachievedintheapplicationsofSVMinfeatureselectiontoimproveSVMit-self.Byreducingredundantandnon-discriminativefeatures,thecomputationaltimeofSVMisgreatlysavedandthustheevaluationspeedsup.WeproposecombiningPrincipalComponentAnalysis(PCA)andRecursiveFeatureElimi-nation(RFE)intomulti-classSVM.WefoundthatSVMisinvariantunderPCAtransform,whichqualiﬁesPCAtobeadesirabledimensionreductionmethodforSVM.Ontheotherhand,RFEisasuitablefeatureselectionmethodforbinarySVM.However,RFErequiresmanyiterationsandeachiterationneedstotrainSVMonce.ThismakesRFEinfeasibleformulti-classSVMifwithoutPCAdimensionre-duction,especiallywhenthetrainingsetislarge.Therefore,combiningPCAwithRFEisnecessary.OurexperimentsonthebenchmarkdatabaseMNISTandothercommonly-useddatasetsshowthatPCAandRFEcanspeeduptheevalua-tionofSVMbyanorderof10whilemaintainingcomparableaccuracy.1IntroductionTheSupportVectorMachine(SVM)wasoriginallyde-signedforbinaryclassiﬁcationproblem[1].Itseparatestwoclasseswithmaximummargin.Themarginisde-scribedbySupportVectors(SV)whicharedeterminedbysolvingaQuadraticProgramming(QP)optimizationproblem.ThetrainingofSVM,dominatedbytheQPoptimization,usedtobeveryslowandlackofscalabil-ity.AlotofeﬀortshavebeendonetocracktheQPproblemandenhanceitsscalability[17,13,14].Thebottleneckliesinthekernelmatrix.SupposewehaveNdatapointsfortraining,thenthesizeofthekernelmatrixwillbeN×N.WhenNismorethanthou-sands(say,N=5000),thekernelmatrixistoobigtostayinthememoryofacommonpersonalcomputer.ThishadbeenachallengeforSVMuntiltheSequentialMinimumOptimization(SMO)wasinventedby[14].ThespacecomplexityofSVMtrainingisdramaticallybroughtdowntoO(1)bySMO.Thus,thetrainingprob-lemwasalmostsolved,althoughtheremightbelurkingmorepowerfulsolutions.WiththesupportofSMO,thegreatscalabilityofSVMhasdemonstrateditspromisingpotentialsindataminingareas[19].Inthepastdecade,SVMhasbeenwidelyappliedinpatternrecognitionaswellasdataminingwithfruitfulresults.However,theSVMitselfalsoneedsimprovementinbothtrainingandtesting(evaluation).AlotofworkhavebeendonetoimprovetheSVMtrainingandtheSMOcanbeconsideredasthestate-of-artsolutionforthat.Comparatively,onlyafeweﬀortshavebeenputattheevaluationsideofSVM[2,4,10].Inthispaper,weproposeamethodforSVMeval-uationenhancementviaPrincipleComponentAnaly-sis(PCA)andRecursiveFeatureElimination(RFE).PCAisanorthogonaltransformationofcoordinatesys-temthatpreservestheEuclideandistanceoforiginalpoints(eachpointisconsideredasavectoroffeaturesorcomponents).ByPCAtransform,theenergyofpointsareconcentratedintotheﬁrstfewcomponents.Thisleadstodimensionreduction.Featureselectionhasbeenheavilystudied,especiallyforthepurposeofgeneselec-tiononmicroarraydata.Thecommonsituationinthegenerelatedclassiﬁcationproblemis:therearethou-sandsofgenesbutonlynomorethanhundredsofsam-ples,i.e.,thenumberofdimensionsismuchmorethanthenumberofsamples.Inthiscondition,theprob-lemofoverﬁttingarises.Amongthosegenes,whichofthemarediscriminative?Findingtheminimumsubsetofgenesthatinteractcanhelpcancerdiagnosis.RFEinthecontextofSVMhasachievedexcellentresultsonfeatureselection[5].Here,wedothecontrary,i.e.,weusethefruitsoftheapplicationofSVMinfeatureselectiontoimproveSVMitself.Therestofthispaperisorganizedasfollows.Aftertheintroduction,webrieﬂydiscussthebackgroundofSVM,PCAandRFEaswellassomerelatedworksin§2.Then,weproveSVMisinvariantunderPCAanddescribehowtoincorporatePCAandRFEintoSVMtospeedupSVMevaluationin§3.Experimentalresultsonbenchmarkdatasetsarereportedin§4.Finally,conclusionisdrawnin§5.2BackgroundandRelatedWorksInthissection,wediscussthebasicconceptsofSVMandhowRFEisincorporatedintoSVMforfeatureselectionongeneexpressions.Inaddition,PCAisalsointroduced.WeprovethatSVMisinvariantunderPCAtransformationandtheproposecombiningPCAandRFEsafelytoimproveSVMevaluation.2.1SupportVectorMachines(SVM)ThebasicformofaSVMclassiﬁercanbeexpressedas:(2.1)g(x)=w·φ(x)+b,whereinputvectorx∈󰀎n,wisanormalvectorofaseparatinghyper-planeinthefeaturespaceproducedfromthemappingofafunctionφ(x):󰀎n→󰀎n󰀁(φ(x)canbelinearornon-linear,n󰀂canbeﬁniteorinﬁnite),andbisabias.SinceSVMwasoriginallydesignedfortwo-classclassiﬁcation,thesignofg(x)tellsvectorxbelongstoclass1orclass-1.Givenasetoftrainingsamplesxi∈󰀎n,i=1,···,Nandcorrespondinglabelsyi∈{−1,+1},theseparatinghyper-plane(describedbyw)isdeterminedbyminimizingthestructureriskinsteadoftheempiricalerror.Minimizingthestructureriskisequivalenttoseekingtheoptimalmarginbetweentwoclasses.Thewidthofthemarginis2w·w=2󰀃w󰀃2.Plussometrade-oﬀbetweenstructureriskandgeneralization,thetrainingofSVMisdeﬁnedasaconstrainedoptimizationproblem:minw,b12w·w+CN󰀁i=1ξi(2.2)subjecttoyi(w·φ(xi)+b)≥1−ξi,ξi≥0,∀i,whereparameterCisthetrade-oﬀ.Thesolutionto(2.2)isreducedtoaQPoptimiza-tionproblem:maxaaTa−12aTHa(2.3)subjectto0≤αi≤C,∀i,N󰀁i=1yiαi=0,wherea=[α1,···,αN]T,andHisaN×Nmatrix,calledthekernelmatrix,witheachelementH(i,j)=yiyjφ(xi)·φ(xj).SolvingtheQPproblemyields:w=N󰀁i=1αiyiφ(xi),(2.4)b=N󰀁j=1αiyjφ(xi)·φ(xj)+yi,∀i.(2.5)EachtrainingsamplexiisassociatedwithaLa-grangecoeﬃcientαi.ThosesampleswhosecoeﬃcientαiisnonzeroarecalledSupportVectors(SV).OnlyasmallportionoftrainingsamplesbecomeSVs(say,3%).Substitutingeq.(2.4)to(2.1),wehavetheformalexpressionofSVMclassiﬁer: