一种自适应阈值的运动目标提取算法
- 格式:pdf
- 大小:484.67 KB
- 文档页数:4
改进型ViBe算法及其在运动目标提取中的应用杨青;张著洪【摘要】提出一种基于阈值半径自适应更新及阴影与鬼影检测的改进型ViBe算法,解决运动场景下ViBe算法的目标提取效果易受背景高频扰动、摄像机抖动、阴影、鬼影的影响问题.算法设计中,依据当前帧的像素点梯度与背景图序列对应像素点的灰度均方差设计阈值自适应更新策略;依据背景图在HSV空间中的像素值设计阴影去除规则;利用前景-邻域直方图的相似度匹配规则设计鬼影清除规则.实验结果表明,改进型ViBe算法在保留原有的高效性的同时,能够较好地消除视频图像中隐含的阴影和鬼影,以及抖动对目标提取的影响.【期刊名称】《贵州大学学报(自然科学版)》【年(卷),期】2019(036)002【总页数】5页(P74-78)【关键词】ViBe算法;鬼影检测;阴影消除;阈值半径自适应更新【作者】杨青;张著洪【作者单位】贵州大学大数据与信息工程学院,贵州贵阳550025;贵州大学大数据与信息工程学院,贵州贵阳550025【正文语种】中文【中图分类】TP391运动目标检测与跟踪是动态场景下运动目标行为分析的关键问题,也是视频分析的重要环节,对有效提取运动目标和正确分析目标的运动行为具有重要的现实意义。
已有的背景建模法种类繁多,如帧间差分法[1]、基于关键点的建模法[2]、光流法[3]、混合高斯算法[4]、ViBe算法[5]等。
ViBe算法是一种被较为广泛采纳的背景建模方法,由于其不考虑目标运动速度对目标提取效果的影响,因此相较于帧间差分法和基于关键点的建模法,获得的噪声模型更能恰当反映实时场景的背景状况;与此同时,相较于光流法和混合高斯算法,ViBe算法的设计思想简单、计算量小,能满足实时目标检测的要求。
可是,该方法的随机更新策略也导致目标提取的效果受到鬼影、阴影、背景高频扰动和摄像机抖动的影响。
鬼影是因视频初始帧存在运动目标而产生,其对后续目标的检测会造成较大影响;已有研究成果中[6-8],胡小冉[6]利用视频帧前n帧构建初始背景,进而此背景进行背景建模。
回波检测算法
以下是几种常见的回波检测算法:
- 恒虚警检测器(CFAR):是一种广泛使用的自适应阈值检测算法,能够在不同的背景噪声下保持虚警率恒定。
常见的CFAR算法有:CA-CFAR(单元平均CFAR)、GO-CFAR(最大值保护CFAR)、SO-CFAR(序列排序CFAR)等。
- 能量检测法:该方法基于目标信号在时间或频率域具有较高能量的特点。
通过计算接收信号的能量并将其与预定阈值进行比较,以检测目标是否存在。
- 高阶统计量检测:这类方法利用高阶统计特性(如偏度、峰度等)来检测目标,因为目标信号和背景噪声的高阶统计特性通常有明显差异。
- 基于模型的检测:这种方法通过对信号进行建模来区分目标信号和背景噪声。
例如,在径向速度上应用多普勒滤波器可以检测出运动目标。
- 联合检测与估计(JDE):JDE方法将目标检测与参数估计相结合,可以在检测到目标的同时估计其参数,如速度、距离等。
- 空时自适应处理(STAP):STAP是一种在空域和时域上同时进行自适应滤波的方法,能够有效抑制杂波和干扰,提高目标检测性能。
- 机器学习和深度学习方法:近年来,基于机器学习和深度学习的方法在雷达目标检测领域取得了显著的进展。
例如,支持向量机(SVM)、随机森林(RF)、神经网络(NN)和卷积神经网络(CNN)等算法已成功应用于雷达信号处理。
这些算法可以单独使用,也可以结合使用以提高检测性能。
实际应用中,需要根据具体的雷达系统、场景和目标特性来选择合适的目标检测算法。
2021年2月第2期Vol. 42 No. 2 2021小型微型计算机系统Journal of Chinese Computer Systems一种自适应运动目标检测算法及其应用李善超,车国霖,张果,杨晓洪(昆明理工大学信息工程与自动化学院,昆明650500)E-mail :991186428@ qq. com摘要:针对ViBe 算法在动态背景下存在鬼影消除时间长、算法适应性差、前景检测噪声多的问题,本文提出一种基于ViBe 算法框架的改进算法.该算法釆用鬼影检测法标记第1帧中的鬼影区域,并向位于鬼影区域的背景模型中强制引入背景样本,从而快速抑制鬼影;在像素分类过程中,引入自适应分类阈值,解决全局阈值易受动态噪声干扰的问题;在背景模型更新中,根 据像素分类的匹配值来动态决定更新因子,提高算法适应场景变化的能力.定性与定量的对比实验结果表明,本文算法相较于ViBe 算法能够有效地检测动态背景下的运动目标,应用于河流漂浮物检测场景中也有较好的效果.关键词:ViBe ;动态背景;运动目标检测;自适应方法;河流漂浮物检测中图分类号:TP391文献标识码:A 文章编号:1000-1220(2021)02-0381-06Adaptive Moving Target Detection Algorithm and Its ApplicationLI Shan-chao ,CHE Guo-lin ,ZHANG Guo,YANG Xiao-hong(Faculty of Information Engineering and Automation ,Kunming University of Science and Technology ,Kunming 650500,China)Abstract : Aiming at the problem that ViBe algorithm has long ghost elimination time , poor algorithm adaptability and high foreground detection noise in dynamic background , this paper proposes an improved algorithm based on ViBe algorithm framework. The algorithmuses the ghost detection method to mark the ghost region in the first frame , and forces the background sample into the background model in the ghost region to quickly suppress the ghost. In the pixel classification process , the adaptive classification threshold is intro ・ duced to solve the problem that the global threshold is susceptible by dynamic noise interference. In the background model update , theupdate factor is dynamically determined according to the matching number of the pixel classification to improve the algorithm's abilityto adapt to scene changes. The comparison experimental results of qualitative and quantitative shows that the algorithm in this paper can effectively detect moving targets in dynamic background compared to the ViBe algorithm , and it also has a better effect in the de tection of river floating objects.Key words : ViBe ; dynamic background ; moving target detection ; adaptive method ; river floating debris1引言运动目标检测在智能视频监控的应用中扮演着重要的角 色,是计算机视觉领域的一个研究热点⑴•运动目标检测的 实质是在视频序列中定位运动中的目标,而准确的前景检测 是目标分类、目标跟踪和行为识别研究的重要基石⑺叫运动目标检测算法按类别可分为帧差法⑴、光流法⑷、背景建模 法"向3种.帧差法原理简单且易于设计,然而其检测结果存 在空洞和鬼影的问题.光流法虽然精度高,但由于其计算量大,不适用于对实时性有较高要求的场景.背景建模法是在初 始化过程中构建出由背景样本组成的模型,并将当前帧与背 景模型进行差分,从而对像素进行分类,最后得到运动目标.其具有精度高实时性好的特点.背景模型的准确性决定了背景建模法的检测精度,主要影响检测精度的因素有鬼影问题、 动态背景、噪声干扰等⑴.高斯混合模型(GMM ,Gaussian mixture model)[8]是运动目标检测算法中最为经典的算法,其本质是基于像素样本统 计信息的背景建模方法,能够对复杂背景进行准确建模,然而 其计算复杂度较高GMG 算法切是统计背景模型的概率,采 用贝叶斯逐像素分割,但在动态场景中其检测精确度较低.核 密度估计算法(KDE,Kernel Density Estimation)[10]是一种非 参数背景建模方法,其通过大量的背景样本估算背景像素的概率密度函数,从而根据像素背景概率来分类像素,然而其内 存占用与计算复杂度都较高.Bamich 等人⑴•切于2009年提出一种非参数化视频背景提取算法(ViBe , Visual BackgroundExtractor),该算法是为每个像素设置一个样本集,并与新帧像素进行阈值比较,从而对像素进行分类,其具有实时性好、鲁棒性高和易于集成于嵌入式设备的特点.然而ViBe 算法仍 存在一些不足,限制了其在动态场景中的应用.例如:1)当初 始化图像中存在运动中的目标时,ViBe 算法会在后续帧中检 测到鬼影,降低了算法的检测精度且鬼影消除时间长;2)ViBe 算法在动态场景中检测精度低,容易受动态噪声干扰;3) ViBe 算法的背景模型更新策略无法适应背景动态的变化.针对ViBe 算法存在的问题,本文提出一种自适应运动目收稿日^:2020-03-06 收修改稿日期:202045-11基金项目:国家重点研发计划项目(2017YFB0306405)资助;国家自然科学基金项目 (61364008)资助.作者简介:李善超,男,1994年生,硕士研究生,研究方向为数字图像处理;车国霖,男,1975年生,硕士,副教授,研究方向为 智能控制;张 果,男,1976年生,博士,副教授,研究方向为智能測控;杨晓洪,女,1964年生,高级工程师,研究方向为综合自动化.382小型微型计算机系统2021年标检测算法.本文将从以下3个方面对ViBe算法进行改进.1)采用鬼影检测法标记鬼影区域并强制引入背景样本,加速鬼影的抑制;2)采用自适应匹配阈值的方法进行像素分类,提高算法抗干扰的能力;3)根据像素分类的匹配值动态调整更新因子,提高算法适应场景变化的能力.本文采用CDNET 数据集中dynamicBackground视频类中的5个视频序列和3组河流漂浮物的视频序列进行研究,以本文算法和其他5种算法为例,定性、定量对实验结果做出质量评价和分析.研究结果表明,本文算法相较于ViBe算法在召回率、精确率和F 度量值方面均有提高,错误分类比更低,达到了预期的目标.2ViBe算法原理ViBe算法是基于样本随机聚类的背景建模算法,具有运算效率高、易于设计、易于集成嵌入设备的特点,能够实现快速的背景建模和运动目标检测.算法的步骤包括背景模型初始化、像素分类过程和背景模型更新.2.1背景模型初始化1)背景模型定义:ViBe算法的背景模型是由N个背景样本组成的,v(x)是像素x的像素值,则背景模型M(x)定义如公式(1)所示:=|Vj(x),v2(x),v N(x)|(1)2)背景模型初始化:ViBe算法利用视频序列第1帧建立背景模型,从第2帧开始算法就可以有效地检测运动目标.背景模型初始化是在像素x的8邻域Nc(x)中选取一个像素值作为背景样本,重复N次,如公式(2)所示:(N g(x)=Ui,¾,--,¾IJ(2)〔M(x)=1v(ylyeN c(x))I3)随机选取策略:背景建模时,背景样本始终采用随机选取邻域像素的策略,以使背景模型更加稳定可靠.2.2像素分类过程ViBe算法采用计算欧氏距离来进行像素的分类. S”(v(x))是以像素值v(x)作中心,匹配阈值R为半径的二维欧氏空间,若v(x))与M(x)的交集H{•}中元素个数不小于最小匹配数则认为像素x是背景像素,如公式(3)所示:H{Sx(v(x))n I V,(x),v2(x),—,v w(x)I I(3) 2.3背景模型更新1)保守更新机制:ViBe算法通过保守更新机制进行背景模型更新,即如果像素被分类为背景像素,则以i/e(e是更新因子)的概率替代背景模型中的任一样本.假设时间是连续且选择过程是无记忆性的,在任一dt时间后,背景模型的样本随时间变化的概率如公式(4)所示:P(t,t+dt)=e-1"(^)d,(4)公式(4)表明,背景模型样本值的预期剩余寿命都呈指数衰减,背景模型的样本更新与时间无关.2)随机更新机制:ViBe算法通过随机更新机制进行样本替换,使得每个样本的存在时间成平滑指数衰减,提高了算法适应背景变化的能力,避免了旧像素长期不更新带来的模型劣化的问题.3)空间传播机制:ViBe算法也将背景像素引入邻域的背景模型中,保证了邻域像素空间的一致性.例如,用背景像素替换任一邻域(x)中的任一样本.ViBe算法首次将随机聚类技术应用于运动目标检测中,使得算法在背景模型初始化、像素分类过程、背景模型更新3个方面都比较简单,保证了算法的实时性,因此ViBe算法被广泛应用于现实生活中3提出的改进算法ViBe算法采用随机采样、非参数化和无记忆的更新策略,使得其具有较好的性能,但其在动态场景下仍然存在不能快速抑制鬼影、难以消除动态噪声以及无法适应场景动态变化的问题,本文将从以下3个方面对ViBe算法进行改进.3.1鬼影检测ViBe算法利用第1帧建立背景模型,但也不可避免的将第1帧中存在的运动目标前景像素引入到背景模型中,导致鬼影问题和彫响算法的检测精度.假设背景模型M(x)是由第1帧中的前景像素样本f(x)组成的,当运动目标离开时,ZU)不在背景像素值b(x)的S”(b(x))圆内,背景像素被错误的分类为前景,如公式(5)所示,则在第1帧中运动目标所在的区域就会出现虚拟的前景(鬼影).rM(x)=|/;(x)J2(x),―J N(x)}(s&(x))nM(x)=0本文针对这一问题,应用鬼影检测法标记出第1帧中的鬼影区域,并向位于鬼影区域的背景模型中强制引入背景样本,减少其中前景像素的数量,从而快速抑制鬼影.鬼影检测法借鉴了帧间差分法并对其进行改进,其原理是提取视频序列的前3帧图像,第1帧图像分别与后两帧图像做差分运算,设定差分阈值并对差分后的图像进行二值化分类,将二值化结果做逻辑或操作和形态学操作,即得到标记有第1帧运动目标的鬼影模板Ghost(x),在鬼影模板Ghost(x)中大于0的位置是第1帧中鬼影区域的.具体定义如公式(6)、公式(7)和公式(8)所示:if I厶(x)-厶+|(兀)I>Tif\IM一人+|(x)lwTM)={o-/“2(x)IWTGhost(x)=£>i(x)or D2(x)(6)(7)(8)式中:D(x)为二值化图像,人(x)为第R帧输入图像,一般A=1为图像差分阈值,。
万方数据万方数据・2382・计算机应用研究第27卷称为(F,B)的最大类间方根一算术均值距离(maxclusters’squarerootarithmeticmeandivegence,MCSAM)。
2.2算法步骤自适应阈值的运动目标提取算法的具体步骤如下:a)初始化:Threshold=Ave,No=0,N1=0,Gmyo=0,Gray。
=0,MCSAM(F,B)=0,Times=0(表示迭代次数)。
b)如果Times<T(T为阈值调整次数,即最大迭代次数),Times++;否则,转步骤f)。
c)遍历图像,由上述定义分别计算Ⅳo,N。
,Grayo,Gray。
d)计算Aveo,AveI,∞o,∞1,Ave,CSAM(Fi,B1)。
e)如果MCSAM(F,B)<CSAM(f,曰;),则令MCSAM(F,B)=CSAM(Fi,B;),Threshold=Threshold+Step(Step表示阈值调整步长),转步骤b);否则,不变,Threshold=Threshold—Step,转步骤b)。
f)此时的MCSAM(,,鳓就是所要寻找的最佳阈值,算法结束。
将运动目标和背景作为两个聚类,把聚类问的方根一算术均值距离最大作为阈值选择的准则是本算法的核心。
背景和运动目标之间的CSAM越大,说明构成图像的两部分差别越大,当部分目标错分为背景或者部分背景错分为目标时,都会导致两部分差别变小,使得CSAM值变小。
因此,MCSAM意味着错分的概率最小,该方法能保证运动目标提取的准确性。
2.3阈值更新策略本文的算法主要采用两种方法进行阈值更新。
第一种是定时更新,即在规定时间段中(通常3—5min),抽取10张连续图像序列利用该算法计算下一时间段差分图像的分割阈值。
这种方式适用于背景缓慢变化的情况,如一天当中太阳光照的缓慢变化。
第二种方法¨21是实时更新,若在当前帧图像与背景模型差分后所得差分图像中,∞。
大于某一个阈值(通常取80%),则认为整个背景发生了变化;若连续多帧图像中这一比值依然很大,则不仅更新背景模型,同时更新阈值Thresh—old。
这种方式适用于背景发生突变时的情况,如室内突然开灯或关灯。
此外,如果图像中某些固定区域(非整幅图像)在较长时间内一直保持变化状态,有两种情况:一种是该区域像素灰度均值平稳变化,则认为该处背景的实际状态发生了变化(如户外汽车的停泊和驶走),此时执行分割阈值更新操作;另一种情况是该区域像素灰度均值变化不平稳,则该处背景可能存在显示器屏幕一类的物品,此时标记该区域,只检测该区域以外的图像,进行阈值更新。
3实验结果利用本文的算法对大量实际视频图像序列进行了运动目标提取的实验,并且在实验中总结了阈值调整次数Tin螂和阈值调整步长Step的最优选择方法。
3.1阈值调整次数和阈值调整步长的确定阈值调整次数和阈值调整步长为本算法中可调整的参数。
对视频中图像序列计算分割阈值时,可通过改变阈值调整步长Step和阈值调整次数Tim鹤的值,比较每帧图像的分割阈值。
由实验统计数据可知:分割阈值准确度与阈值调整步长成反比,与阈值调整次数成正比,即阈值调整步长Step越小,阈值调整次数Times越大,得到的分割阈值准确度越高,但同时也带来了巨大的计算量。
因此,本文采用如下办法解决此问题:首先固定Times值,选择阈值变化减缓时的最小Step值;然后固定Step,寻找阈值变化减缓时的最小Times值;将选定的Step作为阈值调整步长,Times作为阈值调整次数。
3.2运动目标提取实验利用本文算法对不同情况下的多组视频序列进行了运动目标提取实验,视频包括室内、室外、开关照明等场景,并将运动目标区域提取结果与基于背景差法的运动目标提取结果进行了比较。
其中,后处理采用数学形态学的开运算。
实验1图3为摄像头获取的室内场景关灯条件下的视频序列,其中,(a1)(a2)(a3)分别是该图像序列中第50、110和150帧图像;图3(c)为利用本文算法分别对图1(a)中图像进行运动目标提取的结果,运动目标完整,且干扰噪声点较少;图3(b)是利用普通背景差法进行运动目标提取的结果,可以看到除由于未进行阴影消除出现伪影外,效果与图3(c)相差不多。
(c)基于自适应闻值运动目标提取算法的提取结果图3室内人侧面走过摄像头视频(关灯情况下)实验2图4为摄像头获取的室内场景突然开灯情况下的视频序列。
其中,(a1)(a2)(a3)分别是该图像序列中第250、310和350帧图像;图4(b)是利用背景差法进行运动目标提取的结果,可以看到,提取效果较差,这是由于照明环境的突然变化,使背景模型发生改变,而运动目标提取阈值固定不变所导致的结果;图4(C)是利用本文算法对运动区域提取阈值进行了自动调整,使得分割更灵活可行,因此,提取结果依然是运动目标完整,且干扰噪声点较少,从而验证了本算法对环境亮度突变的鲁棒性。
实验3图5为摄像头获取的室外场景视频序列,室外场景中通常存在一些微小的变化区域,如树叶的轻微摆动。
由于本文算法后处理采用了数学形态学方法,可以有效去除这些微小变化引起的误检。
但是,当背景中变动区域的运动幅度非常大,如狂风中摇摆的树木等,则该处理方法便无法完全去除变动区域的影响。
执行时间也是本算法的一个重要检测指标,本文使用1.8GHzIntelPentium@DCPU,512MB内存的普通Pc机,图像分万方数据第6期孙明玉,等:一种自适应闽值的运动目标提取算法・2383・辨率320x240pixels,所有实验的运动目标提取速度均大于25f西,满足实时处理要求。
4结束语图5室外场景视频随着机器视觉系统的应用越来越广泛,运动目标的枪测与提取问题成为研究热点。
本文提出了一种白适应阈值的运动目标提取算法,该算法按照像素灰度值将图像划分为运动目标和背景区域两个聚类,利用聚类间的方根一算术均值最大作为选择分割阈值的准则,采用定时和实时两种阈值更新策略,从而实现了运动目标的准确完整提取,为进一步的目标识别或跟踪提供了有力保障。
参考文献:[1]SMITHSM,BRADYJM.ASSET-2:real-timemotionsegmentationandshapetracking[J].IEEETransonPAMI,1995,17(8):814-820.【2]MEIERT,NGANKN.Automaticsegmentationofmovingobjectsforvideoobjectplanegeneration[J].IEEETransollCircuitsandSystemsforVideoTechnology,1998,8(5):525・538.[3]卓志敏,杨雷,杨萃元,等.一种复杂环境下的红外成像运动目标检测方法[J].宇航学报。
2008,29(1):339-343.[4]明英,蒋晶钰.基于Cauchy分布的红外视频运动目标检测[J].缸外与毫米波学报,2008,27(1):65-71.[5]STAUFFERc,GRIMSONWEL.Adaptivebackgroundmixturemodelsforreal—timetracking[C]//ProcoftheIEEEComputerSocie—tyConferenceonComputerVisionandPatternRecognition.1999:246—252.[6]BASHARATA,GRITAIA,SHAHM.Learningobjectmotionpat・ternsforanomalydetectionandimprovedobject[C]//ProcofCVPR.2008:lt8.[7]KORNPROBSTP,DERICHER,AUBERTG.Imagesequencearia・lysisviapartialdifferenceequations[J].JournalofMathematicalImagingandVision,1999,”(1):5—26.[8]张文涛,李晓峰,李在铭.高速密集视频目标场景下的运动分析[J].电子学报,2000,28(10):114-117.[9]岑峰,威飞虎,陈茂林.长期视频监控系统的多分布模型背景差方法[J].红外与毫米波学报,2002,21(1):59—63.[10]侯志强,韩崇昭.基于像素灰度归类的背景重构算法[J].软件学报,2005,16(9):1568-1576.[1i]MrlTALA,PARAGIOSN.Motion—basedbackgroundsubtractionusingadaptivekerneldensityestimation[C]//Procofthe2004IEEEComputerSocietyConferenceonComputerVisionandPatternReeog-nition.2004:302—309.[12]HARITAOGLUI,HARWOODD,DAVISL.W4:real—timesurveil—lanceofpeopleandtheiractivities[J].IEEETransonPAMI,2000,22(8):809—830.(上接第2379页)参考文献:[1]GONZALEARC,WOODSRE.Digtalimageprocessing[M].NewYork:AcademicPress,2000.[2]何坤,周激流.基于局部保边函数的低信噪比图像去噪[J].四川大学学报:工程科学版,2009,41(2):179-184.[3]HWANGH,HADADADRA.Adaptivemedianfiltersnewalgo-rithmsandresults[J].IEEETransonImageProcessing,1995,4(4):499—502.[4]ZHANGShu-qun,KARINMA.Ahi.Stimpulsedetectorforswitchingmedianfilter[J].IEEESignalProcessingLetters,2002。
9(11):360,363.[5]张旭明,徐滨士.去除脉冲噪声的自适应开关中值滤波[j].光电工程。
2006,33(6):78・83.[6]CHENTao。
WUHang—ren.Adaptiveimpulsedetectionusingcenter.weishtedmedianfilters[J].IEEESignalProcessingLetters,2001,8(1):1-3.[7]RAFAELCG,RICHARDEW.数字图像处理[M].2版.北京:电子工业出版社,2007.[8]陈守水,杨新.一种基于两阶段的脉冲噪声滤除算法[J].信号处理,2008,24(4):627・630.[9]CHENHC,WANGWen-jun.Efficientimpulsenoisereductionvialocaldirectionalgradientsandfuzzylogic[J].FuzzySetsandSys-toms,2009,160(13):1841・1857.[10]VILLEDvande.NACHTEGAELM.Noisereductionbyfuzzyimagefiltering[J].IEEETransonFuzzySystem,2003,11(4):429.436.[11]SCHULTES,NACHTEQAEI。