用于图像分类的浅层结构深度学习方法
- 格式:doc
- 大小:1.07 MB
- 文档页数:11
计算机视觉技术中的图像分类方法计算机视觉是研究如何使计算机能够理解和解释视觉信息的一门学科。
图像分类作为计算机视觉的一个重要研究领域,旨在将图像按照预先定义的类别进行分类。
图像分类是许多计算机视觉任务的基础,例如目标检测、人脸识别和图像检索等。
本文将介绍计算机视觉技术中的图像分类方法以及其应用。
一、传统的图像分类方法传统的图像分类方法主要基于手工设计的特征和机器学习算法。
常用的特征包括颜色直方图、纹理特征和形状特征等。
机器学习算法包括SVM(支持向量机)、AdaBoost(自适应增强)和K近邻等。
1.1 颜色直方图颜色直方图是图像最常用的特征之一。
它统计了图像中每个颜色的像素个数,反映了图像的颜色分布情况。
通过将图像的颜色空间量化为离散的颜色表示,可以将图像转换为一个特征向量。
然后可以使用机器学习算法对这些特征向量进行训练和分类。
1.2 纹理特征纹理特征描述了图像中的表面纹理信息。
常用的纹理特征包括灰度共生矩阵和小波变换等。
灰度共生矩阵计算了图像中不同像素值的频率和位置关系,可以用于描述纹理的粗糙度、对比度和方向等信息。
小波变换将图像分解为不同尺度和方向的频域特征,可提取图像的纹理信息。
1.3 形状特征形状特征描述了图像中物体的几何形态。
常用的形状特征包括边缘直方图、轮廓描述子和物体的尺度不变特征变换(SIFT)等。
边缘直方图统计了物体边缘的方向和位置,可用于表示物体的形状。
轮廓描述子通过将物体的边缘描述为一组特征向量,然后使用机器学习算法进行分类。
SIFT是一种基于尺度和旋转不变性的特征表示方法,可以在不同尺度和旋转角度下提取物体的局部特征。
1.4 机器学习算法传统的图像分类方法主要使用机器学习算法进行分类。
SVM是一种常用的机器学习算法,它可以将输入数据映射到高维空间,并寻找一个最优的超平面来区分不同类别的数据。
AdaBoost是一种集成学习算法,它通过训练一系列弱分类器来构建一个强分类器。
大数据分析中的图像处理与特征提取方法在大数据分析领域,图像处理与特征提取方法是非常重要的工具和技术。
随着互联网和智能设备的迅速发展,数据量的爆炸增长给传统的数据处理方式带来了巨大的挑战。
而图像处理和特征提取方法则可以帮助我们从大量的图像数据中提取有价值的信息和模式。
本文将介绍一些在大数据分析中常用的图像处理和特征提取方法。
首先,图像处理方法是对图像进行预处理和改变的过程。
大数据中的图像处理方法可以分为两大类:基础图像处理和深度学习方法。
基础图像处理方法包括图像去噪、图像增强、图像分割和图像配准等。
图像去噪是一种减小或消除图像中噪声的方法,可以提高图像的质量和清晰度。
图像增强则是通过调整图像的亮度、对比度和色彩饱和度等参数,提高图像的视觉效果。
图像分割是将图像分成多个区域或对象的过程,可以用于图像目标检测和图像分析。
图像配准是将多幅图像进行对齐和融合的过程,可以用于图像拼接和图像融合等应用。
深度学习方法是一种基于神经网络的图像处理方法,其主要思想是通过多层神经网络对图像进行特征提取和分类。
深度学习方法在大数据分析中广泛应用于图像识别、目标检测、图像生成和图像分割等任务。
深度学习方法具有较强的自适应性和泛化能力,可以处理复杂的图像数据,并取得了在许多任务上的优秀成果。
特征提取方法是从图像中提取有意义和有区分度的特征信息。
在大数据分析中,特征提取是一个关键步骤,它可以帮助我们理解和描述图像数据的特征和模式。
常用的特征提取方法包括传统的特征提取方法和深度学习方法。
传统的特征提取方法包括颜色特征、纹理特征和形状特征等。
颜色特征是图像中像素的颜色分布和色彩空间的统计特征,可以用于图像分类和图像检索等任务。
纹理特征是描述图像纹理和表面结构的统计特征,可以用于图像分割和纹理识别等任务。
形状特征是描述图像中物体形状的几何和拓扑特征,可以用于物体检测和形状匹配等任务。
这些传统的特征提取方法在大数据分析中仍然具有重要的作用。
基于深度学习的图像分类方法近年来,随着深度学习技术的不断发展,图像分类问题得到了极大的改善。
深度学习是一种机器学习方法,其通过神经网络对数据进行学习,可以提高准确率和泛化能力。
在图像分类中,深度学习可以通过训练神经网络来实现自动的图像分类。
传统的图像分类方法主要采用特征提取和特征分类两个步骤。
特征提取通常使用手工设计的特征或者基于局部统计信息的方法,而特征分类通常基于传统机器学习算法,比如支持向量机(SVM)和随机森林(Random Forest)。
然而,这种方法的局限性在于需要先选取合适的特征才能进行分类,但是特征提取是基于人的经验和先验知识,很难在所有情况中都表现得很好。
同时,由于传统方法不具有学习能力,因此很难解决大规模数据的分类问题。
基于深度学习的图像分类方法则采用了端到端的方式,即级联许多图像层来直接从原始图像中提取特征,通过最后的全连接层将信息映射至分类结果。
这种方法不需要手动选择特征,将特征提取和分类任务同时进行。
同时,深度学习方法可以使用大量数据进行训练,具有强大的学习能力。
深度学习方法最成功的应用就是卷积神经网络(CNN)。
CNN 采用卷积层、池化层、全连接层等不同结构的神经网络,通过前向传导算法从原始图像中直接获取特征。
CNN 在图像分类中表现出了很好的效果,其精度已经比传统方法取得了更高的水平。
然而,深度学习虽然通过神经网络提供了非常强大的图像分类方法,但是仍然存在一些限制。
首先,深度学习需要大量的训练数据,过拟合问题也需要特别注意。
其次,CNN 的识别结果可能难以解释,包括卷积层、池化层和参数选择等都需要通过经验来调优。
因此,如何调整神经网络结构和参数,使得其从数据中学习到最佳的分类特征,以及解释深度网络结果的能力,仍然需要进一步研究。
近年来,又出现了一种新的深度学习方法,即生成对抗网络(GAN)。
GAN 由两个神经网络组成,一个生成网络和一个判别网络。
生成网络用于生成伪造的样本,而判别网络用于区分伪造的样本和真实的样本。
浅层模型与深层模型性能评估研究随着人工智能技术的不断发展与普及,深度学习模型成为了重要的研究方向之一。
由于深度学习能够自动学习输入数据的抽象表示,不仅可以应用于图像处理、自然语言处理、语音识别等领域,而且在工业、金融、医疗等行业中也有广泛的应用。
但在实际应用过程中,我们常常会遇到强大的浅层模型(如逻辑回归、决策树等)能够胜任某些任务的情况。
那么,我们如何评估浅层模型与深层模型的性能呢?一、浅层模型与深层模型的优缺点浅层模型由于计算简单,参数较少,训练时间较短,易于解释等特点,一直是机器学习领域中被广泛使用的模型之一。
但它也有局限性,如难以应对复杂的非线性问题,对于大规模数据集的处理不够高效等。
与之相对的,深度模型能够学习更为复杂的抽象特征,处理大规模数据的性能也更加卓越,但它的计算量大、模型参数多、训练时间长、可解释性欠佳等也是普遍存在的问题。
二、性能评价指标在评估浅层模型和深层模型的性能之前,需要先了解性能评价指标。
常见的性能评价指标包括准确率(accuracy)、查准率(precision)、查全率(recall)、F1值等。
准确率是指分类正确的比例;查准率是指预测为正的样本中实际为正的比例;查全率是指实际为正的样本中被预测为正的比例;F1值综合了查准率和查全率的表现。
在不同的任务和数据集下,需要选择不同的评价指标。
三、性能测评方法在性能测评中,通常需要将数据划分为训练集、验证集和测试集,分别用于训练、模型选择和性能评估。
对于浅层模型,如Logistic回归和决策树等,由于它们的计算量和模型参数相对较少,可采用交叉验证和参数网格搜索等方法来优化模型性能,一般不需要太复杂的调参策略。
而对于深度学习模型,如深度神经网络、卷积神经网络和循环神经网络等,需要使用更为复杂的调参方法来优化模型性能,如随机搜索、贝叶斯超参数优化等。
同时,深度学习模型的训练时间较长,可能会遭遇过拟合、梯度消失和梯度爆炸等问题。
基于深度学习的图像分类模型深度学习是人工智能领域中的一个重要分支,其强大的图像分类能力使之成为许多计算机视觉任务的首选方法。
基于深度学习的图像分类模型能够根据输入的图像数据自动学习特征,并将其分为不同的类别。
本文将详细介绍基于深度学习的图像分类模型的原理、发展历程以及常用的模型架构。
1. 深度学习的图像分类模型原理基于深度学习的图像分类模型的核心原理是使用深层神经网络从图像数据中学习特征表示和分类决策。
这些模型通常包含卷积神经网络(CNN)和全连接神经网络(FCN)两个主要组成部分。
卷积神经网络通过一系列的卷积层、池化层和激活函数层构建,用于提取输入图像中的局部特征。
卷积层通过滤波器的卷积操作将原始图像转化为特征图,池化层则对特征图进行降采样,保留主要特征。
激活函数层则为模型添加非线性能力,增强学习的表达能力。
全连接神经网络仅在最后几层使用,负责将卷积网络提取的特征进行分类。
全连接层通过权重矩阵将特征映射到不同的类别,最终输出模型对输入图像的分类结果。
2. 基于深度学习的图像分类模型的发展历程基于深度学习的图像分类模型的发展可以追溯到2012年的ImageNet竞赛中,当时Hinton等人提出了AlexNet模型,成功地将深度学习应用于图像识别任务,并取得了优异的成绩。
随后,深度学习模型在图像分类领域取得了长足的进步。
在此之后,出现了一系列的深度学习模型,如VGGNet、GoogLeNet、ResNet 等。
这些模型通过增加网络的深度、宽度和复杂性来提高模型的表示能力,进一步提升图像分类的准确性。
同时,一些创新的组件如残差连接、多尺度卷积等也被提出,有效地解决了深层网络训练的困难。
3. 常用的基于深度学习的图像分类模型目前,许多基于深度学习的图像分类模型被广泛使用。
以下是几个常用的模型:- AlexNet:作为深度学习在图像分类任务中的先驱,AlexNet在ImageNet竞赛中取得了显著的成绩。
面向遥感影像分类、目标识别及提取的深度学习方法研究一、内容概述随着遥感技术的不断发展,遥感影像在各个领域的应用越来越广泛。
针对遥感影像的分类、目标识别及提取,本文提出了一种基于深度学习的方法研究。
本文首先分析了当前遥感影像处理技术的发展现状和存在的问题,指出了利用深度学习方法解决遥感影像分类、目标识别及提取问题的重要性和紧迫性。
本文介绍了所提出的深度学习模型,包括网络结构、损失函数、优化算法等。
通过大量实验验证了所提方法的性能和有效性。
总结了本文的主要工作和贡献,并对未来的研究方向进行了展望。
本文的研究对于推动遥感影像处理技术的发展具有重要意义,可为相关领域的研究和应用提供参考和借鉴。
1. 遥感影像的重要性及其应用领域随着科技的飞速发展,遥感技术在地理信息获取、环境监测和资源勘查等领域发挥着越来越重要的作用。
遥感影像作为遥感信息的主要载体,其重要性和应用价值日益凸显。
高分辨率遥感影像能够全面呈现地物的外观和属性,为全球气候变化、土地利用、城市规划等领域的科学研究提供丰富的数据支持;而借助深度学习技术,遥感影像的分类、目标识别以及信息提取等问题也得以有效解决,推动了遥感信息化、智能化水平的显著提升。
为了满足各类遥感应用的需求,对高分辨率遥感影像的处理和分析能力也在不断提高。
借助深度学习算法,遥感影像能够被更有效地处理、分析和利用。
遥感影像已经成为地理信息科学、计算机视觉、模式识别等多个学科领域的研究热点,为众多领域的科研和应用提供了强大的技术支撑。
遥感影像的重要性及其在各大领域的应用价值是不容忽视的。
而深度学习方法的发展为遥感影像的获取、处理、分析和应用带来了更多的可能性和挑战,预示着遥感技术在未来将有更广泛的应用前景。
2. 深度学习在遥感影像处理中的研究现状与挑战随着深度学习技术的飞速发展,其在遥感影像处理领域的应用也日益广泛。
通过构建深度神经网络模型,实现对遥感影像的自动分类、目标识别以及信息提取已经取得了显著的进展。
机器视觉目标识别方法解析:Blob分析法、模板匹配法、深度学习法Blob分析法(BlobAnalysis)在计算机视觉中的Blob是指图像中的具有相似颜色、纹理等特征所组成的一块连通区域。
Blob分析(BlobAnalysis)是对图像中相同像素的连通域进行分析(该连通域称为Blob)。
其过程就是将图像进行二值化,分割得到前景和背景,然后进行连通区域检测,从而得到Blob块的过程。
简单来说,blob分析就是在一块“光滑”区域内,将出现“灰度突变”的小区域寻找出来。
举例来说,假如现在有一块刚生产出来的玻璃,表面非常光滑,平整。
如果这块玻璃上面没有瑕疵,那么,我们是检测不到“灰度突变”的;相反,如果在玻璃生产线上,由于种种原因,造成了玻璃上面有一个凸起的小泡、有一块黑斑、有一点裂缝,那么,我们就能在这块玻璃上面检测到纹理,经二值化(BinaryThresholding)处理后的图像中色斑可认为是blob。
而这些部分,就是生产过程中造成的瑕疵,这个过程,就是Blob分析。
Blob分析工具可以从背景中分离出目标,并可以计算出目标的数量、位置、形状、方向和大小,还可以提供相关斑点间的拓扑结构。
在处理过程中不是对单个像素逐一分析,而是对图像的行进行操作。
图像的每一行都用游程长度编码(RLE)来表示相邻的目标范围。
这种算法与基于像素的算法相比,大大提高了处理的速度。
针对二维目标图像和高对比度图像,适用于有无检测和缺陷检测这类目标识别应用。
常用于二维目标图像、高对比度图像、存在/缺席检测、数值范围和旋转不变性需求。
显然,纺织品的瑕疵检测,玻璃的瑕疵检测,机械零件表面缺陷检测,可乐瓶缺陷检测,药品胶囊缺陷检测等很多场合都会用到blob分析。
但另一方面,Blob分析并不适用于以下图像:1.低对比度图像; 2.必要的图像特征不能用2个灰度级描述; 3.按照模版检测(图形检测需求)。
总的来说,Blob 分析就是检测图像的斑点,适用于背景单一,前景缺陷不区分类别,识别精度要求不高的场景。
浅层与深层特征融合的图像识别方法研究目前图像识别技术已经被广泛应用于人工智能、机器人、自动驾驶等领域。
而图像识别的性能提升,主要取决于特征提取方法的优化。
本文将介绍一种基于浅层和深层特征融合的图像识别方法。
一、浅层特征和深层特征分析1.浅层特征浅层特征是指图像的颜色、形状、纹理等直观感受特征。
通常使用传统的特征提取方法(如SIFT、HOG)从图像中提取出浅层特征,用于训练和测试图像分类器。
浅层特征的主要优点是计算速度快,特征维度相对较低,容易获得良好的性能。
但是,浅层特征缺点是容易受到噪声和光照变化等因素的影响,泛化能力有限,识别准确度相对较低。
2.深层特征深层特征是指通过使用深度神经网络从图像中提取的抽象特征。
深度神经网络的架构深度可以达到十几层乃至几十层,每一层都可以将低级别的特征转化成高层次的抽象特征。
深层特征的主要优点是它在处理大量数据时,具有非常强的可适应能力,可以捕捉到更抽象和更具有代表性的特征。
深层特征缺点是需要大量的计算资源和大量的训练数据,对实时应用的支持有限。
二、浅层和深层特征融合方法在现实应用中,如何有效地融合浅层和深层特征,使得图像识别算法可以发挥两者优点,是当前研究的热点之一。
一种常见的方法是将两种特征进行串联或并联,具体有以下方法:1.串联方法在串联方法中,浅层特征和深层特征将在特征空间中级联。
由于深度神经网络的高维抽象特征具有更强的语义含义,将浅层特征与深层特征级联将使各自有利的特性形成更有效的特征,从而提高识别精度。
在这种方法中,深度神经网络一般会进行预训练,并在输入层添加浅层特征以生成新的融合特征,在这个过程中减少了过拟合,提高了模型泛化的能力。
2.并联方法在并联方法中,浅层特征和深层特征分别输入到不同的分类器中,然后将它们的各自的输出结合起来形成最终的输出结果。
这种方法可以减少不同层之间信息的丢失,但同时也增加了复杂性。
三、实验结果分析基于浅层和深层特征融合的图像识别方法已经在很多领域进行了实验,并获得了较佳的性能。
卷积神经网络(CNN)是一种用于图像识别和图像分类的深度学习模型。
它通过多层卷积和池化操作来提取图像中的特征,并通过全连接层进行分类。
在实际应用中,图像中的特征可能存在多个尺度和层次,因此如何有效地融合多尺度特征成为了一个重要问题。
本文将介绍卷积神经网络中的多尺度特征融合技术。
1. 多尺度特征提取在卷积神经网络中,通过卷积层和池化层可以逐渐减小特征图的尺寸,从而提取出不同尺度的特征。
一般来说,卷积层越深,提取的特征尺度越大。
例如,浅层卷积层可能提取出图像中的细微纹理特征,而深层卷积层可能提取出图像中的整体结构特征。
因此,卷积神经网络中存在多个尺度的特征。
2. 多尺度特征融合为了更好地利用多尺度的特征,研究者提出了多种多尺度特征融合技术。
其中,一种常见的方法是使用金字塔结构。
金字塔结构是一种分层的特征表示方法,可以将不同尺度的特征分别提取出来,并在不同层次上进行融合。
这种方法可以有效地提高模型对多尺度特征的感知能力,从而提高图像识别和分类的准确性。
另一种常见的多尺度特征融合方法是使用跨层连接。
跨层连接是指将不同尺度的特征直接连接在一起,从而形成一个更加丰富的特征表示。
这种方法可以有效地提高特征的丰富度和多样性,从而提高模型的泛化能力。
3. 多尺度特征融合的应用多尺度特征融合技术已经在许多图像识别和分类任务中得到了应用。
例如,在目标检测任务中,通过使用多尺度特征融合技术,可以提高模型对不同尺度目标的检测能力。
在图像分割任务中,通过使用多尺度特征融合技术,可以提高模型对图像中不同尺度目标的分割精度。
在图像生成任务中,通过使用多尺度特征融合技术,可以提高生成图像的质量和多样性。
总结卷积神经网络中的多尺度特征融合技术是一种有效的特征表示方法,可以提高模型对多尺度特征的感知能力,从而提高图像识别和分类的准确性。
在未来的研究中,我们可以进一步探索多尺度特征融合技术在其他领域的应用,并不断改进和优化这一技术,以提高模型的性能和泛化能力。
用于图像分类的浅层结构深度学习方法Asma ElAdel∗, Ridha Ejbali∗, Mourad Zaied∗and Chokri Ben Amar∗
∗REsearch Group in Intelligent Machines, National School of Engineers of sfax, B.P
1173, Sfax, Tunisia
Email: {asma.eladel, ridha ejbali, mourad.zaied and chokri.benamar}@
摘要——本论文介绍了一种新的图像分类方案。
该方案提出了一种用于深度学习的卷积神经网络(CNN):利用多分辨率分析法(MRA)计算每一张用于分类的图像在不同的抽象层次中输入层与隐层之间的连接权值。
然后,利用Adaboost 算法选择出能代表每一类图像的最佳的特征和对应的权值。
这些权值将作为隐层与输入层之间的连接权值,并且在测试阶段用于对所给的图像的分类。
所提出的方法在不同的数据集上进行了测试,所获得的结果证明了该方法具有较好的效率和较快的速度。
关键词:多分辨率分析,Adaboost,深度学习,小波,图像分类
一、介绍
图像分类是计算机视角中最具挑战性的问题之一,特别是在类别数量巨大的情况下。
有许多解决这个问题的方法,例如小波相关向量机(WRVM)[1],分别应用于不同类别对象上,以形成每个对象独立特征空间的独立主成分分析法[2],全局显著和局部差异相结合的不寻常特征编码法[3],以及用来学习可述性视觉词袋(BOW)表现的正则化矩阵分解法[4]。
另外一种最近提出的方法介绍了旨在学习图像层次表示的深度学习的方法。
在这种方法中,为了理解数据的意义,图像可以看作是由一些非线性特征经过多层次的抽象而形成的。
高层次的特征是从低层次特征中得到的,并以此形成层次化表示[5] [6] [7]。
这类方法的基础是利用了机器学习的不同结构。
这种结构的其中一种是前馈结构,前馈结构中多层神经网络和卷积网络在图像分类[8] [9] [10] [11],目标识别[12],人脸识别[13]和语音识别[14]等分类任务中都取得了良好的效果。
这些网络的设计,分类,自动推断和学习能力都引起了人们的注意。
但是到目前为止,它们的训练仍然需要大量的计算,同时还要选择适当的方法以防止过拟合现象。
另外一个不足是特征变换阶段的次数是随机确定的,也就是说网络层次的数量和大小影响了抽象过程的数量。
而且,分类仅仅是在最后的抽象层上对特征进行选择而完成。
此外,我们还要知道每一个抽象层次中更多的重要细节(也即特征),以减少分类阶段的复杂性。
在此背景下,Y.Zou等人[15]通过模拟影像中的固定点提出了一种显著特征的深度学习方法。
另外,Weston等人[16]提出一种用于图像分类的非线性半监督的嵌入算法,称为嵌入式卷积神经网(Embed CNN)。
以及,Xu[17]创新地提出了一种称为空间金字塔深层神经网络(SPDNN)的半监督分类方法,这是基于一个新的深层结构集成神经网络和空间金字塔模型。
在本文中,我们得到了两个具体的成果:首先,我们提出了一种改进的前馈深层结构。
我们称之为基于二元多分辨率分析的改进型前馈卷积神经网络[18] [19] [20]。
这种方法在不同的抽象层次中使用快速小波变换(FWT)[21]。
这一
成果的优点在于我们可以使用浅层结构(一个隐层)取代多层结构进行深度学习。
此外,多分辨率分析法(MRA)可以让我们确切知道深度学习层次的必要数量。
同时,由于对图像不同层次的抽象都是通过进行多分辨率分析法进行的,所以我们可以得到对应于各级的图像特征,这可以很好地帮助我们完成分类。
第二个成果是利用Adaboost算法从不同层次的抽象中更重要的,能更好代表每一类图像的特征[22]。
所提出的方法能通过简单的结构实现卷积神经网络的优点,同时能减少计算的复杂度。
本文的结构如下:第二部分介绍了我们所提出的图像分类方法的核心思想,其中我们会重点介绍在不同层次抽象中的MRA特征提取法,特征选择和分类方法。
第三部分是实验结果和讨论。
最后一部分是结论。
二、所提出的方法
所提出的方法是一种用于图像分类的浅层结构深度学习方法。
一般的深度学习方法是通过改变神经网络中层的数量和大小得到不同层次的抽象。
分类仅仅是在最后一层抽象的特征上完成的。
在这种结构中,我们不确定所提取的特征能不能代表图像所有有用的信息。
在本次实验中,我们提出了一种基于二元多分辨率分析法改进的前馈卷积神经网络。
前馈意味着信息只能向前传递,从输入节点经过隐层节点到达输出节点。
所提出的基于MRA结构的主要优点是:第j层的特征可以转化为第j-1层的特征,或者直接使用j-1次二元小波代换后转化为第一层的特征。
过程如图1所示。
这种学习和分类的步骤将在A部分和B部分分别介绍。
图1
A 学习图像过程
学习阶段是单隐层卷积神经网络对每一幅参考图像进行处理的过程。
其中,第一层(输入层)代表的是图像的每一个像素,隐层代表的是所有抽象层次中提取出来的特征,最后一层(输出层)代表的是图像的类型。
结构如图2所示。
图2
学习算法步骤如下:
第一步:构建候选小波库
第二步:计算输入层与隐层之间所有的连接权值
第三步:利用二元多分辨率分析法计算不同层次抽象隐层所对应的的输入
a
i 第四步:把sigmoid函数作为激活函数
第五步:利用Adaboost算法选择能描述每一类图像特点的特征
第六步:确定每一类图像所对应的隐层与输出层之间的连接权值
从图3可知,经过多分辨率分析后,每一幅参考图像都被分成了k个层次的抽象特征,可以将其定义为离散小波变换的设计方法。
这种方法把信号f(图像)分解为逼近部分(A)和三个细节部分:水平细节(HD)、垂直细节(VD)和对角线细节(DD)。
在新的抽象层次中,得到的逼近部分将会被进一步分解为新的逼近部分和细节部分,如此循环直到抽象层次达到分析所要求的最大值。
最
a作为输入层与隐层之间的连接权值。
后,把从所有层次中提取出来的细节系数
i
为了加快计算出这些系数,我们使用多分辨率分析中的快速小波变换(FWT)。
这一算法有效地减少了耗时的训练和分类步骤。
图3
此外,MRA 的优点在于分析的网络层次的数量不是随机的,而是可以直接从图像的尺寸中得到的。
因此我们可以通过固定图像的抽象层次控制学习深度。
同时,由于MRA 分析是在不同的抽象层次中分析图像,所以它可以提供各层次抽象中相应的能代表图像的特征,这在分类阶段将会十分有用。
一旦我们计算得出所有输入层与隐层的连接权值,也就是隐层的输入i a ,我们就采用取值在[0 1]的sigmoid 函数作为激活函数。
下一步就是利用Adaboost 算法,从这些特征i a 中滤选出能描述每一类图像的最佳的特征。
(见算法1)
算法1 Adaboost 算法
给定m 组训练数据,(1x ,1y ),……(m x ,m y ),其中
初始化)(1i D =1/m :训练样本i 的权重,这决定了该样本被选择为成分分类器的概率。