可见光图像目标检测技术综述
- 格式:pdf
- 大小:659.21 KB
- 文档页数:11
第389期 电信技术研究 RESEARCH ON TELECoMMUNlCATIoN TECHNOLOGY 20 1 5年第1期
可见光图像目标检测技术综述
李鹏 韩莉杰 曹海波 李春兰
摘要:可见光图像目标检测是计算机视觉中的研究热点和难点。对目标检测技术的
三个核心问题——目标表述、目标检测模型训练和目标检测定位的研究现状进行了综述, 并对目标检测技术的下一步研究方向进行了探讨。
关键词:目标检测;目标表述;检测器模型;目标定位;特征提取
1 引言
可见光图像目标检测技术(object de. tection)¨ 】是21世纪计算机视觉领域中兴起
的新课题。目标检测技术通过对己知类别样
本图像集的学习,训练目标模型与检测器, 在测试图像中检测定位特定类别目标一一如 人脸[¨、行人[ 、车辆 、交通标志[ 等。目
标检测技术作为图像检索、图像分类、目标
跟踪、视频分割等技术的起点与支撑,近年
米一直是学术领域与-I:业界的研究热点。
国内外该领域知名研究机构有: 内基梅 隆人学、麻省理 学院、加州大学、斯坦福人
学、瑞+联邦理 J 人学、牛津大学、清华大学、 浙江人学、国防科技人学、上海交通人学、华
中科技人学、北京理 l 人学、厦门大学、法国
国家信息与自动化研究所(INRIA)、中科院以 及三菱重jI 、洛马、微软、谷歌等。
相关的一些国际权威期刊有:International
Journal of Computer Vision、IEEE Transactions
on Pattern Analysis and Machine Intelligence、 IEEE TransactiOns on Multimedia、 IEEE
Transactions on Image Processing、 IEEE
Transactions on Circuits and Systems for Video
Technology、Pattern Recognition、 IEEE Transactions on Signal Processing、Optical En-
gineering、Signal Processing、Computer Vision
・56‘ and Image U nderstandlng、IET Transaction on Computer Vision以及Neurocomputing等。另外,
一些重要的学术会议如SPIE举办的系列会议、
ICCV(International Conference on Computer
Vision)、CVPR(IEEE Conference on Computer Vision and Pattern Recognition)、 ECCV
(European Conference on Computer Vision)、
NIPS(Conference on Neural Info・rmation Pro— cessing Systems)、ICPR(International Con— ference on Pattern Recognition) I ISPRS Con— gress(Congress of the International Society for Photogrammetry and Remote Sensing)等也发表
了人昂目标检测方面的文章,并开设专题分会
对这个问题进行讨论。国内的相关权威期刊有 软件学报、电子学报、自动化学报、L}I国图象
图形学报、信号处理、红外与毫米波学报等。 自Viola—Jones[ 】f 2001年提出具有里程碑 意义的基j Harr特征与Adaboost算法 】的人
脸检测算法以米,目标检测技术得到了K足发 展,并广泛应用于安防、国防、交通、传jI!f!等
多个领域。目标检测研究需要解决三个共性核 心问题 , ]:目标表述、训练目标检测模 与利
用目标模型在测试图像中检测定位目标。这三 个核心问题是相互联系的[ 。】:目标表述是基础:
目标模型训练是建立目标检测器的关键步骤;
在测试图像中的目标检测定位是目标检测研究
的最终目的。
综述:吖见光图像目标检测技术综述
本文从目标检测的三个核心问题出发,系 统地介绍了当前目标检测技术的研究现状与进 展,提山了未米需要重点解决的若干问题。
2 目标表述
目标表述是目标检测研究中的基础问题。
目标表述 ¨ 通过某些算子从目标图像中提
取表达图像内容信息的统计量~一视觉特征一
一来表达目标。依据视觉特征反映图像局部像 素或者全部像素的统计特性,目标表述可分为
全局(globa1)表述、局部(1oca1)表述以及
全局与局部结合的表述。
2.1目标的全局表述
目标的全局表述利用图像的全局特征从整
体上描述整幅目标图像的视觉属性,例如色调、 纹理、亮度、拓扑结构等。目标的全局表述受
噪声影响较小,计算比较简单,但也存在识别 能力相对较弱的缺点。常见的全局表述方法有 很多[2,1 3-14],其中基 J 直方图(histogram)的
表述与基于形状特征统计量的表述是近年米文 献中经常使用的两类全局表述方法[101 】。
2.1.1基于直方图的全局表述
直方图是一种最典型的目标全局表述,是
通过对图像中各种底层视觉特征(如颜色、边
缘、纹理、梯度等)出现的频率进行统计得到 的[2,1 3-14]。视觉特征的直方图在图像检索、目
标跟踪、目标识别等应用中发挥了重要作用。
早期的直 图(颜色、灰度直方图等)难以有 效反映目标的局部结构统计信息,直到Dalai 与Triggs[2】提出目标的梯度方向直方图(HOG,
Histogram of Oriented Gradient),人大提高了基 __r直方图的目标全局表述方法的能力,并成功
应用丁行人检测等场景。其形成过程如下:将
目标图像划分成叫做元胞(cel1)的小空间区域,
在每个冗胞上计算其内像素梯度或边缘点梯度, 将所有 C胞上的直方图级联起来即成为HOG 特征。
2.1.2基于形状特征统计量的全局表述
形状特征是人类视觉系统在物体识别中需
辨识的关键信息之一,也是图像的核心底层特 征之一。图像的形状信息不随图像颜色等特征
的变化而变化,是一种稳定性较高的特征。对
j:物体的形状,常采用诸如矩形度、圆形度、 不变矩、形状链码、图等来进行表征 。
2.2目标的局部表述
目标的局部表述是通过在图像中检测并描 述局部特征实现的[12】。局部特征【ll_ 的提出生
要是相对全局特征而言,一般指的是利用算子
作用在图像的局部 域得到的统计量。在图像 内容复杂、噪声干扰较大、存在局部遮挡、目
标姿态发生较大变化等情况下,利用局部信息 进行Et标识别是非常有效的。人多数局部特征
对亮度、尺度、平移和旋转具有一定的不变性。
对目标局部进行表述一般需要局部特征检测和
局部特征描述两个步骤。
2.2.1局部不变特征的检测
局部特征检测是特征描述的前提,按照特 征层次的不同,文献中的局部不变特征检测算
法可分为角点不变特征检测和blob不变特征
检测算法两类。
(1)角点特征 目前,角点还没有严格的数学定义,对角
点的定义有多种不同的表述。A.Rosenfeld和 E.Johnston[ 】提出,利用曲线上某点前后臂的
夹角的余弦值来估算该点的曲率,并将局部曲 率最大点定义为角点。角点集中了图像上的很
多重要的形状信息,对掌握目标轮廓特征具有 决定作用。角点只包含图像中大约0.05%的像
素,是一种高效的对图像进行局部表述的特征。 常见的角点特征 】有Moravec算子、Harris算
子、SUSAN算子、Harris.Laplace算子、FAST 算子等。常用角点特征发展历程如图1f 】所示。
・57・
电信技术研究 第389期 RESEARCH ON TELEcoMMuNICATloN TEcHNoLoGY 20l5年第1期
多
1 977‘78 ‘82 ‘87 ‘88 ‘90 ‘92 ‘97 ‘98 ‘99 ‘99 ‘2004 ‘07
, r 、 ● t , / , .、 t T 、 一 , 一
、 图l 角点特征发展历程
\f/
、l/ \上/ /T\
图2 SIFT描述符生成示意图
(2)blob特征 与角点特征不同,基f blob的不变特征用
域的形式描述了图像的局部结构信息,町以用 米检测角点特征尤法表示的比较平滑的图像 域。在所表述的图像 域较人时,blob特征也被
称作 域特征。当其表述的图像区域趋近为一个 像素时,blob特征町以被认为是一种特殊的角点 特征。常见的blob特征有:Hessian算子[1¨、高
斯筹分算子DoG(Differenc—of-Gaussian)[ 们、
SURF算子[ ¨、Harris/Hessian—Affine区域特征…】、 MSER 域特征…1、基于图像块的特征(patch)
p]等。与角点特征相比,blob特征度量一个 域
内像素的统计特性,对图像的尺度变化、仿射变 换等具有更强的不变性,但也比角点特征需要更
多的计算晕。角点特征与blob特征具有良好的
互补特性,实际应用L卜I■者常相互结合使用。例 如经典的高斯差分算子[20,221检测尺度空间中的 局部极值点,构成了著名的SIFT[ ]特征的基础。
2.2.2局部不变特征的描述
特征描述的目的是罩化特征的视觉属性并
・58・ 表述特征信息,是特征匹配检测的前提。文献 给出了大量的局部不变特征描述办法,人敛 以把它们分为基于分布的特征描述办法、基J 矩的特征描述方法、基一-_进制模式的特征描 述方法【 j等。
(1)基_J:分布的特征描述办法
基于分布的特征描述方法以David Lowe
提山的描述DoG特征点的SIFT(Scale Invariant Feature Transform)[ 特征为代表。 Mikolajczyk[¨】通过试验比较证明,SIFT特征
描述符在多数情况下优,J 其他特征描述符。图 2为SIFT特征描述符的示意图,SIFT描述符
是梯度位置和方向的直方图。在SIFT特征点
(由DoG算子提取)的特征尺度上以梯度土办 向为参照的SIFT描述符,对相似变换具有不
变性。 在SIFT特征基础上发展起来一些描述性
更强的特征:包括GLOH(Gradient loca— tion—orientation histograms) …】特征、
Color—SIFT[ 1 ASIFT(Affine SIFT)[241等;