基于SVM的湿地鸟类物种识别方法
- 格式:doc
- 大小:34.00 KB
- 文档页数:8
基于SVM的图像识别与分类算法研究一、前言随着计算机技术的不断发展,图像识别与分类技术也在不断提高。
其中,基于支持向量机(SVM)的图像识别与分类算法以其高效性、可靠性和准确性等优势成为研究热点。
本文旨在探讨基于SVM的图像识别与分类算法及其应用。
二、SVM原理SVM是一种监督学习算法,其核心是构建一个最优的超平面,将样本点分为两类,并使得两类样本点间的距离最大。
SVM分为线性可分和线性不可分两种情况。
1. 线性可分SVM线性可分SVM是在特征空间中找到一个超平面,使得能够将不同类别的样本点完全分开,这个超平面叫做分隔超平面。
对于一个样本点$x_i=(x_{i1},x_{i2},...,x_{in})^T$,其对应的类别标志为$y_i \in (-1,1)$。
超平面的表达式为:$$w^T x+b=0$$其中,w是法向量,b是位移。
对于任意的$X$在分隔面上任一点$(x,w^T x+b)=0$,分类标准为:$$f(x)=sign(w^T x+b)$$其中,函数$sign(x)$表示规定了符号规则的函数,即:$$sign(x)=\begin{cases}1 & (x\geq 0) \\ -1 & (x<0)\end{cases}$$显然超平面的位置是存在多种可能的。
SVM寻找最优的超平面的算法本质是一种凸二次规划问题,采用拉格朗日乘子法求解。
2. 线性不可分SVM在实际应用中,很多情况下用一个超平面将不同类别的样本点分割开来是不可能的,这时候就需要使用一些非线性算法将高维空间的数据转化为线性可分的问题,使得可以用SVM进行分类。
通常使用的方法是通过核函数将原始空间映射到一个高维特征空间来实现。
三、基于SVM的图像识别与分类算法步骤1. 数据预处理在进行图像识别与分类之前,需要将原始图像经过预处理。
主要包括以下两个方面:(1)图像归一化处理:将不同大小的图像重置为相同的大小,统一图片的亮度、对比度等。
基于SVM算法的视频物体识别近年来,随着计算机技术和硬件设备的发展,视频监控系统得到越来越广泛的应用。
在人们日常生活中,视频监控系统可以用来保护公共安全、监控商业活动、进行环保和交通监控等。
然而,面对海量的视频数据,如何从中快速准确地提取出目标物体,以提供更高效的服务,是目前视频监控系统普遍面临的难题。
视频物体识别是视频监控系统中最重要的任务之一。
它的目的是从视频监控画面中提取出感兴趣的目标物体,并对其进行分类和跟踪。
目前,基于SVM算法的视频物体识别技术已经成为该领域的热点研究方向。
SVM(Support Vector Machine,支持向量机)算法是一种基于统计学习理论的分类算法。
它通过将数据映射到高维空间中,将数据样本划分到不同的类别中。
SVM算法具有计算效率高、分类精度高、对高维数据和小样本数据都具有较强适应性等优点,因此被广泛应用于模式识别、图像处理和自然语言处理等领域。
SVM算法在视频物体识别中的应用,主要分为以下几个步骤:1. 特征提取:视频物体识别的第一步是从视频流中提取出感兴趣的图像帧。
在图像帧中,通常需要提取出一些特征向量,如颜色、形状等。
这些特征向量可以作为SVM算法的输入。
常用的特征提取算法有HOG算法、SIFT算法和LBP算法等。
2. 数据预处理:在构建SVM分类器前,还需要对数据进行预处理。
这包括数据标准化和数据降维。
标准化是将数据进行归一化处理,使得各特征向量之间具有相同的重要性。
降维是将高维数据压缩到低维数据中,从而减小数据量的同时,仍能保持数据的重要性。
3. SVM分类器构建:SVM分类器的构建通过对已标注的训练样本进行学习,得到一个最优分类超平面。
该超平面将样本空间划分成两个子区域,分别对应两个不同类别。
分类器的训练包括两个方面的问题,一是确定最优的超平面,二是确定分类边界。
这需要通过选择合适的核函数和正则化系数等参数来实现。
4. SVM分类器应用:SVM分类器应用于视频物体识别时,需要将每个视频帧输入分类器中进行分类。
基于hog与svm的物体识别方法嘿,咱今儿就来聊聊这基于 hog 与 svm 的物体识别方法。
你说这科技发展得多快呀,以前咱识别个物体那得多费劲,得靠咱这一双眼睛瞪得老大,还不一定能看准咯。
可现在呢,有了这 hog 和 svm 呀,就像给咱的眼睛装上了超级放大镜和智能分析器!hog 呢,就好比是一个超级细心的记录员,它能把物体的各种特征,像形状啦、轮廓啦,都给仔仔细细地记录下来。
你想想看,它就像一个特别会观察的小侦探,不放过任何一个小细节。
svm 呢,就像是一个超厉害的裁判,根据 hog 记录的那些信息,快速又准确地判断出这到底是个啥物体。
咱平常生活里,这物体识别方法用处可大了去了。
比如说,你在路上走,突然看到一个奇怪的东西,要是没有这技术,你可能得琢磨半天这是啥。
但有了它呀,一下子就能告诉你答案,嘿,这不是那啥嘛!再比如说,在工厂里,要快速分辨各种零件,靠人工得多累呀,还容易出错。
但有了基于 hog 与 svm 的物体识别方法,那效率不得蹭蹭往上涨啊!你说这是不是很神奇?就好像给机器赋予了一双慧眼一样。
而且呀,它还在不断进步呢!以后说不定能识别得更准更快,那可真是太棒啦!那时候,我们的生活得变得多方便呀。
咱再想想,要是没有这技术,那得有多少麻烦事儿呀。
就像没有导航的时候,我们找路得多费劲。
现在有了导航,跟着走就行啦,多轻松。
这基于 hog 与 svm 的物体识别方法也是一样,给我们带来了巨大的便利。
它就像是一个默默工作的小助手,在我们看不到的地方发挥着大作用。
你说,它是不是很了不起呀?咱可得好好感谢那些研究出这个方法的科学家们,让我们能享受到这么好的技术。
总之呢,这基于 hog 与 svm 的物体识别方法真的是太厉害啦!它让我们的生活变得更加智能,更加便捷。
咱可得好好期待它以后还能给我们带来啥样的惊喜呢!难道不是吗?。
基于深度学习的鸟类自动识别技术研究在自然界中,鸟类的种类繁多,防护森林和自然保护区内经常可以看到各种各样的鸟类。
然而,鸟类的形态复杂多样,种类繁多,在野外进行鸟类的观察与识别是一件非常困难的事情,因此寻找一种自动识别鸟类的技术显得尤为重要。
近年来,随着深度学习的快速发展,人工智能在图像处理领域得到了广泛的应用,鸟类自动识别技术也得到了长足的进展。
基于深度学习的鸟类自动识别技术是一种应用广泛的新技术,其依靠输入图片的颜色,纹理和形状等特征,通过大量的图片训练,提取并学习鸟类的特征,从而实现对鸟类的准确自动识别。
目前,基于深度学习的鸟类自动识别技术已经被广泛研究和应用。
具体来说,该技术实现的方法主要包括图像预处理、特征提取和分类器训练三个步骤。
首先,图像预处理是基于深度学习的鸟类自动识别技术的第一步,其目的是使输入的鸟类图片能够获得最佳的处理结果。
在预处理过程中,需要对原始的鸟类图片进行一系列处理,如剪裁、缩放、灰度化、图像增强等,从而获得更为清晰高质的图片。
其次,特征提取是基于深度学习的鸟类自动识别技术的另一个关键步骤。
该技术利用卷积神经网络(CNN)等深度学习模型,能够提取出鸟类图片中的各种纹理、形状等特征,形成一组高维特征向量。
这些特征向量的提取过程需要经过卷积层、池化层、全连接层等多个过程。
最后,分类器的训练是基于深度学习的鸟类自动识别技术的关键环节。
在这个过程中,需要使用大量的鸟类图片来训练分类器,从而得到高精度的深度学习模型。
训练的过程主要是通过反向传播算法来优化深度学习模型中的权值和偏移量,使其能够更加准确地识别不同种类的鸟类。
总的来说,基于深度学习的鸟类自动识别技术主要依靠数据训练和深度神经网络模型优化来实现。
目前,该技术已被成功应用于多种领域,如鸟类监测、生态保护等。
通过该技术,不仅能够减轻人工监测的工作难度和成本,同时也能够帮助人们更好地了解鸟类的分布和生态习性,从而更好地保护和管理野生动物资源。
基于SVM的地面成像光谱数据田间杂草识别研究
李颖
【期刊名称】《遥感信息》
【年(卷),期】2014(029)001
【摘要】为提高当前田间杂草识别精度,利用地面成像光谱数据研究多特征参与的SVM田间杂草识别方法,根据地面成像光谱数据的特点提取田间作物杂草的多种可区分特征,包括纹理特征、连续统去除后的光谱特征和高光谱植被指数特征,并对高维特征集进行降维,利用多种多特征组合参与SVM田间杂草识别.实验结果证明,在训练样本一致的前提下,多特征参与的SVM田间杂草识别精度优于仅使用原始光谱特征时的情况,使用包含原始光谱特征、纹理特征、高光谱植被指数特征和连续统去除后的光谱特征的多特征组合时田间杂草识别精度最高.
【总页数】5页(P40-43,50)
【作者】李颖
【作者单位】中国气象局河南省农业气象保障与应用技术重点实验室,郑州450003;河南省气象科学研究所,郑州450003
【正文语种】中文
【中图分类】TP79
【相关文献】
1.基于地面成像光谱数据特征的湿地典型植被类型识别研究——以东洞庭湖核心区湿地为例 [J], 凌成星;刘华;鞠洪波;张怀清;孙华;由佳;李伟娜
2.基于纹理特征与改进SVM算法的玉米田间杂草识别 [J], 王宏艳;吕继兴
3.基于多光谱图像和 SVM 的玉米田间杂草识别 [J], 乔永亮;何东健;赵川源;唐晶磊
4.基于近地光谱特征的玉米田间杂草识别研究 [J], 胡盈盈; 王瑞燕; 郭鹏涛; 李茂芬; 梁伟红; 李玉萍
5.基于图像处理的田间杂草识别研究进展与展望 [J], 袁洪波;赵努东;程曼
因版权原因,仅展示原文概要,查看原文内容请购买。
鸟类细粒度识别方法鸟类是生物界中数量众多、种类繁多的一类动物,对于鸟类的研究可以帮助我们更好地了解自然界的生物多样性。
鸟类的识别一直是鸟类学家和爱好者关注的话题,传统的鸟类识别方法主要依靠人工观察和判断。
然而,随着计算机视觉和人工智能技术的发展,鸟类细粒度识别方法逐渐进入了人们的视野。
鸟类细粒度识别是指对于同一种鸟类,对其中的不同亚种和个体进行精确识别的方法。
鸟类的细粒度识别对于生态学、保护学和进化生物学等领域的研究具有重要意义。
鸟类的形态特征包括羽毛的颜色、大小和形状,喙的形状和颜色等,这些特征对于识别鸟类亚种和个体起着至关重要的作用。
鸟类细粒度识别的方法主要包括特征提取和分类器设计两个步骤。
特征提取是将鸟类图像中的有用信息提取出来,常用的特征包括颜色直方图、纹理特征和形状特征等。
这些特征通过计算机视觉和图像处理技术可以从图像中提取出来,并转化为计算机可以理解的数字数据。
特征提取过程中需要考虑到鸟类图像的不同尺度和角度变化,以及光照条件的变化。
在特征提取的基础上,需要设计一个分类器来将不同亚种和个体的鸟类进行识别和分类。
常用的分类器包括支持向量机(SVM)、随机森林(Random Forest)和深度学习方法等。
分类器的训练过程中需要使用大量的标注数据进行训练,同时需要考虑到数据集的平衡性和分布情况。
训练好的分类器可以用于对新的鸟类图像进行分类和识别。
与传统的鸟类识别方法相比,鸟类细粒度识别方法具有以下优势:1. 高精度:鸟类细粒度识别方法采用计算机视觉和图像处理技术,能够从图像中准确提取出鸟类的特征,并进行精确的分类和识别。
2. 高效性:鸟类细粒度识别方法可以处理大量图像数据,在较短的时间内完成识别任务,提高了工作效率。
3. 可推广性:鸟类细粒度识别方法可以推广到其他物种和领域,如动物识别、植物识别等,具有广阔的应用前景。
然而,鸟类细粒度识别方法也存在一些挑战和问题。
首先,鸟类个体之间的差异很小,特征提取的难度较大;其次,训练数据的标注工作需要耗费大量的时间和精力;另外,鸟类图像数据的获取和存储也是一个难题。
基于SVM模式识别系统的设计与实现1.1 主要研究内容(1)现有的手写识别系统普遍采用k近邻分类器,在2000个数字中,每个数字大约有200个样本,但实际使用这个算法时,算法的执行效率并不高,因为算法需要为每个测试向量做2000次距离计算,每个距离计算包括了1024个维度浮点运算,总计要执行900次,此外需要保留所有的训练样本,还需要为测试向量准备2MB的存储空间。
因此我们要做的是在其性能不变的同时,使用更少的内存。
所以考虑使用支持向量机来代替kNN方法,对于支持向量机而言,其需要保留的样本少了很多,因为结果只是保留了支持向量的那些点,但是能获得更快更满意的效果。
(2)系统流程图step1. 收集数据(提供数字图片)step2. 处理数据(将带有数字的图片二值化)step3. 基于二值图像构造向量step4. 训练算法采用径向基核函数运行SMO算法step5. 测试算法(编写函数测试不同参数)1.2 题目研究的工作基础或实验条件(1)荣耀MagicBook笔记本(2)Linux ubuntu 18.6操作系统pycharm 2021 python31.3 数据集描述数据集为trainingDigits和testDigits,trainingDigits包含了大约2000个数字图片,每个数字图片有200个样本;testDigits包含了大约900个测试数据。
1.4 特征提取过程描述将数字图片进行二值化特征提取,为了使用SVM分类器,必须将图像格式化处理为一个向量,将把32×32的二进制图像转换为1×1024的向量,使得SVM可以处理图像信息。
得到处理后的图片如图所示:图1 二值化后的图片编写函数img2vector ,将图像转换为向量:该函数创建1x1024的NumPy 数组,然后打开给定的文件,循环读出文件的前32行,并将每行的头32个字符值存储在 NumPy 数组中,最后返回数组,代码如图2所示:图2 处理数组1.5 分类过程描述 1.5.1 寻找最大间隔寻找最大间隔,就要找到一个点到分割超平面的距离,就必须要算出点到分隔面的法线或垂线的长度。
基于SVM技术实现手写数字分类识别的研究1. 引言1.1 研究背景手写数字分类识别是图像识别领域的一个重要应用,其在数字识别、验证码识别、自动化审核等方面都具有广泛的应用价值。
随着深度学习的快速发展,各种卷积神经网络在图像识别领域取得了巨大成功,但是在一些特定应用场景下,传统的支持向量机(SVM)技术仍然具有其独特优势。
鉴于SVM技术在图像识别领域的表现,本研究旨在探究如何基于SVM技术实现手写数字分类识别,提高识别准确度和效率,为相关领域的研究和应用提供参考借鉴。
通过对SVM技术及手写数字分类识别方法的深入研究与实验验证,期望能够为该领域的发展做出一定的贡献。
1.2 研究目的研究目的是通过利用SVM技术实现手写数字分类识别,提高数字识别的准确性和效率。
手写数字分类识别是计算机视觉领域的一个重要研究方向,对于识别手写数字图像具有广泛的应用价值,如数字识别、自动化识别等。
本研究旨在探讨如何利用SVM技术对手写数字图像进行分类识别,并通过实验验证其准确性和实用性。
通过研究,希望能够提高手写数字分类识别的准确率,降低误识率,提高识别速度,为数字识别领域的发展提供参考和借鉴。
本研究还旨在比较SVM技术与其他常用的手写数字分类方法的优劣,探讨SVM技术在手写数字识别中的应用前景和潜力。
通过本研究,将为进一步完善和优化手写数字识别系统提供重要的理论和实践基础。
2. 正文2.1 SVM技术介绍支持向量机(Support Vector Machine,SVM)是一种常用的机器学习方法,主要用于分类和回归分析。
SVM的基本思想是通过寻找最优超平面来对数据进行分类,即找到能够最大化间隔的超平面,从而实现对不同类别的有效分类。
SVM的核心是构建一个能够将不同类别的数据分割开的决策边界,该决策边界由支持向量所确定。
支持向量是训练数据集中离决策边界最近的样本点,它们对SVM的模型起着关键作用。
除了线性核函数外,SVM还可以使用非线性核函数来处理非线性可分的数据。
AI鸟类监测识别系统在内乡湍河湿地的应用分析
王庆合;申军伟;汪汇洋;张浩;余建基;赵娣;杨森
【期刊名称】《河南林业科技》
【年(卷),期】2024(44)1
【摘要】分析了内乡湍河湿地省级自然保护区2022年6月至2023年6月AI鸟类监测识别系统的监测数据,显示AI鸟类监测识别系统在水鸟监测中具有灵敏度高、不间断监测、干扰小的优势,但也存在监测范围受限、数量统计和鸟种识别有偏差
的问题。
建议将AI鸟类监测识别系统作为人工监测的补充手段。
研究鸟类在固定
位点的活动规律时,用AI鸟类监测识别系统效果较好。
【总页数】3页(P39-40)
【作者】王庆合;申军伟;汪汇洋;张浩;余建基;赵娣;杨森
【作者单位】南阳市白河国家湿地公园保护发展中心;河南内乡湍河湿地省级自然
保护区服务中心;南阳市自然保护地和野生动植物保护中心
【正文语种】中文
【中图分类】TP274
【相关文献】
1.武夷山九曲溪湿地鸟类联网监测及识别系统
2.内乡县湍河第四级拦河坝工程规划方案探讨
3.关于建立内乡湍河湿地自然保护区的初步研究
4.内乡湍河湿地保护区
主要植物蛀干害虫的发生与防治5.河南内乡20吨硫酸罐车侧翻湍河司机死亡硫酸泄漏
因版权原因,仅展示原文概要,查看原文内容请购买。
基于SVM分类器的对象识别算法研究随着计算机技术的飞速发展,人工智能技术正逐渐走进人们的生活,其中计算机视觉技术的应用越来越广泛。
对象识别作为计算机视觉中的重要环节,是指通过对图像数据进行分析和处理,自动判断出图像中的物体种类和位置,实现对物体的自动辨识。
而基于SVM分类器的对象识别算法,是当今计算机视觉领域中常用的一种算法,本文将对其进行研究和探讨。
一、SVM分类器基本原理SVM(支持向量机,Support Vector Machine)是一种常用的机器学习算法,它在数据分类和回归分析等领域有着广泛的应用。
SVM分类器可以实现对数据的分类和回归预测,通过一个超平面来划分不同的类别,使得同一类别的数据分布在超平面同侧,不同类别的数据分布在超平面两侧。
SVM分类器的基本原理如下:1. 构造超平面SVM分类器是一种基于超平面的分类器算法,其基本思想是寻找一个最优的超平面,将不同类别的数据区分开来。
对于一个n维数据,其可以表示为:x=(x1,x2,...,xn), 中y为数据的类别,y∈{-1,1}。
所谓的超平面是指:w*x+b=0,其中w为超平面的法向量,b为超平面的截距。
SVM分类器的目标就是寻找一个最优的超平面,使得不同类别的数据能够被区分开来,此时,超平面可以表示为:w*x+b>=1或者w*x+b<=-1。
2. 求解最优化问题在SVM分类器中,通过优化方法(拉格朗日乘子法)求解最优化问题,得到超平面的参数,并将数据划分成两个类别。
实际上,在进行求解时,我们将数据划分成两个部分,一部分是支持向量,另一部分不是。
对于支持向量,它们到超平面的距离是最小的,而其他数据到超平面的距离是不超过1的。
因此,我们可以将SVM分类器的优化问题表示为:min(w,b)1/2*||w||^2,其中||w||表示向量w的范数,这个问题是一个凸优化问题,可以通过一些数值计算的方法来求解。
二、基于SVM分类器的对象识别算法SVM分类器是一种非常优秀的机器学习算法,其在对象识别方面也有着广泛的应用。
基于SVM的湿地鸟类物种识别方法摘要:随着图像识别技术与物联网技术的迅速发展,对于动植物进行联网物种识别成为一个备受关注的研究热点。
将闽江口湿地水鸟在线监测保护作为研究对象,把图像分析处理技术引入到鸟类物种在线识别的研究中,通过分析,利用鸟类彩色图像的颜色、形状和纹理等特征,提出了一个基于svm决策树的分类方法。
该方法的分类能力、泛化性能和分类正确率都较过去方法有所提高。
经过多次试验,验证了这个方法可解决多类多分问题,并实现了对闽江口多种鸟类的有效分类识别。
关键词:svm;特征提取;鸟类物种识别中图分类号:tp317.4文献标识码:a文章编号:1672-7800(2012)012-0165-030引言随着全球环境的日益恶化,动植物生存环境破坏严重,许多物质濒临灭绝的危险,其中,鸟类物种也因各种因素而遭受危害。
为了提高对于鸟类保护的意识,人们试图运用图像识别技术与物联网技术进行鸟类观测与识别保护,但是,目前所采用的语言识别研究在实际中并不是很有效。
因此,为了解决鸟类物种识别并提高识别的准确度,将图像分析处理引入鸟类物种识别分类,研究基于彩色图像的鸟类物种联网在线自动分类识别机制尤为必要。
图像识别技术与鸟类观测保护相结合,开展深入的鸟类物种识别和湿地联网保护研究,将具有重大的生态和社会意义。
1鸟类物种特征的提取与选择1.1鸟类颜色特征的提取与选择鸟类的羽毛颜色作为颜色特征是最为直观显著的彩色图像特征,不但反映了彩色图像的整体特性,而且具有旋转、平移不变性、尺度和较高的鲁棒性。
因此,颜色特征的提取与选择是图像特征提取与选择的重要内容。
目前,主要的颜色特征表示方法有直方图、颜色矩、颜色集及颜色相关图等。
1.2形状特征提取与选择鸟类的体形也即是其形状特征,利用鸟类形状特征的几何属性和统计特性来进行描述,提取形状特征来区分鸟类的品种。
例如,不变矩是图像检索最常用的形状特征。
由于图像区域的某些矩对于平移、旋转、尺度等几何变换具有一些不变的特性,因此,矩的表示方法在目标物体的分类、识别上具有重要意义。
1.3鸟类纹理特征的提取与选择对于鸟类的物种而言,其纹理特征都有所不同。
随着gabor滤波在数字图像分析处理及识别领域的广泛应用,通过gabor滤波和小波变换进行图像纹理分析,有利于鸟类图像纹理特征的提取。
利用塔式算法(又称mallat算法)将小波理论和传统的滤波联系起来,并且使得人们在进行小波变换时不必给出小波的具体表达式,大大降低了小波的应用难度。
假设尺度函数φj,k(x)和小波函数ψj,k(x)对应的滤波器系数矩阵分别用h和g表示,原始图像用c0表示,则可得图像的二维小波分解为:cj+1=hcjh*dhj+1=gcjh*dvj+1=hcjg*ddj+1=gcjg*(1)将图像进行分解,每次分解后得到4个部分,分别用ll、hl、lh、hh表示。
子带ll为低频成分,代表近似分量,携带了原图像的大部分信息。
lh、hl、hh为高频成分,是细节分量,携带了原始图像的细节信息。
其中,lh表示垂直细节分量,hl表示水平细节分量,hh表示对角细节分量。
如图1所示,给出了图像3层小波分解的结构图,是鸟类图像的小波分解实例。
2多类分类研究鸟类的物种图像识别分类是一个多分类的问题,综合考虑到鸟类物种的特征表达及分类器的设计等问题,最终决定选用基于层次分解的决策树方案来解决这个问题。
该方法将svm与二叉决策树的思想结合在一起来考虑,生成的多类别分类器如图2所示。
3基于svm决策树的鸟类图像自动识别3.1自动识别流程自动识别流程如图3所示。
3.2图像的预处理由于鸟类图像的获取环境不同,如摄像角度、光照强度具有不确定性,再加上成像设备、摄影技术方面的差异,使得鸟类图像受到不同程度的降质问题。
对于同一物种的鸟类,其图像数据可能存在较大的差异,而不同物种的鸟类,其图像数据可能由于这些因素存在差异反而变小。
因此,在提取特征之前,必须对鸟类采取一些措施,减少同一物种鸟类之间的差异,增强不同物种鸟类之间的差异。
这些措施又称为图像预处理,分别为规格化图像、去除背景和光线补偿。
3.3带先验信息的svm决策树分类结合特征提取与分析选择,对图3中的层次分类器进行进一步细化设计,提出一种带先验信息的svm决策树分类方案,如图4所示。
该方案是基于层次分解的,共分为4层分类器。
分别为特殊颜色分类器、颜色统计特征分类器、形状分类器及纹理分类器。
3.3.1特殊色分类器特殊色分类器是基于先验知识的分类器,属于非监督的分类器。
它用于提取蓝绿色和浅红色并进行粗分类。
以绿嘴鸭、遗鸥为例,经过实验分析,提取浅红色特征的范围为0≤h≤0.34,s≥0.32,v≥0.11,所占比例阈值为9.1%。
大于9.1%的则表示该鸟类身上存在浅红色,视为有花纹的鸟类;小于9.1%的表示该鸟类身上并不存在浅红色,视为非彩色鸟类。
提取浅红色特征后,彩色图像里有些鸟类身上具有一部分其它鸟类所没有的特别颜色,这3种鸟类个体中带有一部分蓝绿色,并且占到鸟类个体总像素的一定比例以上。
观察其统计直方图,可以发现这3类图像其色调分量h分布于0.31~0.62之间的像素占了鸟类个体总像素的一定比例。
并且其色调纯度s与亮度v也必须大于一定的值,则可以显示蓝绿色,否则不显示为蓝绿色。
遗鸥虽然也有大量像素色调分量h分布在0.51~0.62之间,但由于其色调纯度s太低,因此在其图上并未显示出蓝绿色。
从绿头鸭的分析来看,提取一定范围内的蓝绿色,统计其像素个数,并计算其占鸟类个体所占比例。
根据这一特征,将具有这些特别颜色的鸟类与其它鸟类区分开来。
经过实验最终确定提取的蓝绿色范围为0.3≤h≤0.55,s≥0.3,v≥0.13,所占比例阈值为1%。
大于1%表示该图存在蓝绿色;否则视为不存在蓝绿色,则为其它鸟类。
如图5所示。
3.3.2颜色统计特征分类器颜色统计特征分类器是通过对图像3个通道的一阶矩(均值)和二阶矩(方差)共6个特征进行学习训练,构成svm分类器。
分类时,则同样将测试图像转换为hsv颜色空间,并计算非背景像素hsv 三通道的均值和方差。
然后通过svm分类器进行分类。
svm分类器选用径向基核函数。
经过特殊色分类器分类后,同一类中不同物种的鸟类颜色特征距离还是比较远的。
如黑白鸟类,有的鸟类物种大部分是白色,有的大部分是灰色,而有些则是黑色占据较大比例。
而对于具有浅红色特征的鸟类,有些物种鸟类全身是花纹,而有些只有一部分。
因此,可以利用低阶颜色矩对鸟类进行进一步划分。
3.3.3形状分类器主要提取鸟类外接矩形的长宽比及致密度。
该类特征比较直观。
通过观察发现,许多鸟类在停落时,其身体的长度一般小于身体的高度,如苍鹭、牛背鹭、东方白鹳等;反之,如大杓鹬、遗鸥等鸟类不管其姿态怎么变化,其身体长度一般大于其高度。
还有就是有些鸟类的身体比较饱满,其致密度较高;有些鸟类脖子又细又长,或者嘴巴比较长,则其致密度就比较低。
3.3.4纹理分类器纹理分类器中使用的是db2小波对图像进行4层分解。
对鸟类图像进行分解,获得各个子带输出图像如图6所示。
对其中的15个子带图像进行特征值提取,计算其平均能量和方差,分别对彩色图像的3个通道图像进行纹理特征提取,共提取98个纹理特征。
对训练集的图像提取纹理特征进行分类训练,形成svm分类器。
4图像识别分析4.1实验环境与实验数据硬件配置:sempron 2500+ 1.75g cpu、1g内存,80g硬盘ibm-pc 机;软件配置:windows 2003 server;开发环境: matlab 6.5、ls_svmlab、dipum工具箱。
采用水鸟网络监测专网。
闽江河口湿地鸟类共有80余种,本次实验随机选取其中15类,自行采集样本图像。
根据识别对象要求设计图像采集原则如下:①鸟类处于停落姿态;②图像中的鸟类个体大小、清晰度足以进行鸟类物种辨别;③图像为彩色图像。
每类采集8幅样本图像,合计共120幅图像,jpeg格式。
经图像预处理后,每类取4幅作为训练样本,其余作为测试样本,共计60个训练样本,60个测试样本。
4.2总体分类实验结果取测试集60个样本进行测试,其中,纹理特征分别用gabor分类器和小波分类器进行测试,分类识别结果如表1所示。
通过实验进行验证,总体来说,分类识别结果达到了预期要求。
5结语将图像分析处理引入鸟类物种识别分类研究中,旨在探索基于彩色图像的鸟类物种自动分类识别机制的建立。
在分析模式识别理论及传统鸟类物种分类识别方法的基础上,重点研究了图像特征的提取与选择,通过提取鸟类图片特征,进行一定的数学变换分析,选取最能代表鸟类物种的分类特征。
并且,在此基础上研究了多类分类方法,构建出一种带先验信息的svm决策树多类分类系统。
最后通过训练选取的鸟类特征,并选取测试集通过该分类系统进行实验,取得了较好的识别效果。
本研究方法在鸟类联网进行在线物种识别过程中有着重要的实际意义。
参考文献:[1]刘江华,陈佳品,程君实.基于gabor小波特征提取和支持向量机的人脸识别[j].计算机工程与应用,2003(8).[2]程思宁,武丹丹,张俊芬,等.基于小波分析的人脸识别算法[j].长春工业大学学报:自然科学版,2006(1).[3]周金萍.matlab 6.5图形图像处理与应用实例[m]. 北京:科学出版社,2003.[4]庄晨辉.湿地与水鸟[m].北京:中国林业出版社,2009.[5]何东健.数字图像处理[m].第2版.西安:西安电子科技大学出版社,2008.[6]黄志开.彩色图像特征提取与植物分类研究[d].合肥:中国科学技术大学,2006.[7]huang j. color-spatial image indexing and application[d]. new york:cornell university,1998.[8]daugman j g.uncertainty relation for resolution in space, spatial frequency and orientation optimized bytwo-dimensional visual cortical filters[j].journal of the optical society of america, 1985(7).[9]陈伟斌.基于彩色图像的鸟类物种识别研究[d].福州:福州大学,2009.(责任编辑:孙娟)。