多视频运动对象实时分割及跟踪技术

格式：pdf
大小：509.97 KB
文档页数：6

下载文档原格式

运动目标检测和跟踪的研究及应用

5.学位论文王世平基于DSP的运动目标检测与跟踪2007
在人所感知到的环境信息中,视觉信息占了非常大的比重,其中动态视觉信息更是其主要组成部分.感知环境中的这些动态视觉信息已成为计算机视觉的一个重要的研究方向.运动目标检测与跟踪是应用视觉和运动图像编码研究领域的一个重要课题,在许多领域有着广泛的应用. 本文主要研究了基于DSP的运动目标检测与跟踪问题,包括硬件平台的构建和运动检测跟踪算法软件设计与实现. 在运动目标检测部分,介绍了现有的几种常用的检测算法,针对传统帧差算法,检测出的运动目标不够完整的缺点,进行了改进;针对传统的背景重建算法运算量大,耗时的缺点,提出基于块的背景重建,均通过实验验证了方法的有效性. 在运动目标跟踪部分,首先介绍了Kalman滤波的基本原理,在此基础上提出了基于Kalman滤波的跟踪算法;然后详细分析了本文目标跟踪系统所采用的波门算法,为后面系统的实现打下了理论基础. 详细介绍了基于DAM6416P图像处理平台的跟踪系统的实现, 整个系统工作过程为DSP先对采集到的图像进行预处理,然后采用帧差法检测运动目标,接着采用基于双波门算法根据目标的质心位置来判断是否移动云台以及云台移动方向,从而实现对运动目标的实时跟踪. 从实验数据与结果看,本文研究的跟踪系统在一定条件下能够准确、及时地检测跟踪目标,达到了预期效果.
2.学位论文何西华视频运动目标检测与跟踪算法研究2008
视频环境的运动目标检测与跟踪是当前计算机视觉研究中一个非常活跃的领域。计算机视觉研究的目标是使计算机具有通过一幅或多幅图像认知周围环境信息的能力。运动图像序列中包含了比静态图像更多的有用信息。运动对象的检测与提取,是将视频图像序列划分成若干的运动对象,并在时间轴上对这些运动对象进行跟踪,为以后的研究工作奠定基础,如基于对象的编码技术以及基于内容的视频检索等。目标跟踪则是随着数字视频技术的发展及应用而产生的一个新的研究课题,其在军事以及民用等诸多领域中有着广泛的应用。本文主要研究了基于视频序列运动目标检测与跟踪的基本理论和关键技术。重点研究背景模型下运动目标的检测和提取,运动目标阴影的处理,以及运动目标跟踪等方面的内容。论文首先对的相关背景知识作了介绍。其中包括目标检测与跟踪系统中采用的运动约束假设和外部环境约束假设;目标检测技术采用的主要算法,包括静态图像中的目标检测和运动目标检测;目标跟踪基础知识,包括跟踪的基本概念,目标的常用的四种表示方法等。在运动目标检测研究方面,首先介绍了当前主要目标检测和提取算法的原理,通过试验对帧间差分法和自适应背景相减法进行分析。在此基础上提出将背景减除与帧间差分方法结合的目标检测算法。实验表明,该方法能够在较大程度上满足系统的要求,提高检测结果精度。针对阴影对目标检测造成的不利影响,最后本论文还总结了目标抑制阴影的几种算法。在运动目标跟踪研究方面,首先归纳了在目标跟踪中常被采用的视觉特征、统计特征、变换系数特征和代数特征;分析了目标的三种线性运动模型;阐述了目标特征搜索匹配的主要算法,并重点研究了基于目标颜色直方图特征的均值偏移目标跟踪算法(Mean-ShiftAlgorithm),在此基础上提出了一种联合目标位置预测的改进的跟踪算法,通过对均值偏移算法和改进的跟踪算法通过的分析和实验比较,表明本论文的改进跟踪算法较均值偏移跟踪算法由于利用了目标的空间位置信息,提高了目标跟踪的可靠性和有效性。

图像定位及跟踪技术大解析

图像定位及跟踪技术大解析
在科学技术日新月异的今天，人们对机器设备的智能性、自主性要求也越来越高，希望其完全替代人的角色，把人们从繁重、危险的工作任务中解脱出来，而能否像人一样具有感知周围环境的能力已成为设备实现智能化自主化的关键。

广义的“图像跟踪”技术，是指通过某种方式(如图像识别、红外、超声波等)将摄像头中拍摄到的物体进行定位，并指挥摄像头对该物体进行跟踪，让该物体一直被保持在摄像头视野范围内。

狭义的“图像跟踪”技术就是我们日常所常谈到的，通过“图像识别”的方式来进行跟踪和拍摄。

因为红外、超声波等方式，都受环境的影响，而且要专门的识别辅助设备，在实际应用中已经逐步被“图像识别”技术所替代。

“图像识别”是直接利用了摄像头拍摄到的图像，进行NCAST图像差分及聚类运算，识别到目标物体的位置，并指挥摄像头对该物体进行跟踪。

图像跟踪系统采用特有的NCAST目标外形特征检测方法，被跟踪者无需任何辅助设备，只要进入跟踪区域，系统便可对目标进行锁定跟踪，使摄像机画面以锁定的目标为中心，并控制摄像机进行相应策略的缩放。

系统支持多种自定义策略，支持多级特写模式，适应性强，不受强光、声音、电磁等环境影响。

目标物体的边缘检测
物体的形状特征在大多数情况下变化不多，基于目标形状轮廓的跟踪方法与基于区域的匹配方法相比，可以更精确的分割目标。

边缘是运动目标的最基本特征，表现在图像中就是指目标周围图像灰度有阶跃变化或屋顶变化的那些像素集合，它是图像中局部亮度变化最显著的部分。

边缘检测就是采用某种算法来定位灰度不连续变化的位置，从而图像中目标与背景的交界线。

图像的灰度变化可以用灰度梯度来表示。

像素偏移追踪算法

像素偏移追踪算法1.引言1.1 概述像素偏移追踪算法是一种用于视频处理和计算机视觉的高级技术。

它通过在视频序列中检测像素的移动和变化，以定位目标对象并跟踪其运动轨迹。

该算法结合了图像处理和机器学习的方法，能够在各种环境条件下实现准确的目标追踪。

在传统的目标追踪算法中，常常面临光照变化、背景干扰等挑战，导致追踪失效或错误。

而像素偏移追踪算法通过分析像素之间的关系，可以更加准确地确定目标的位置和运动路径。

该算法采用了基于对象特征的自适应滤波器，能够自动适应目标的变化，并及时更新追踪模型，从而提高追踪的鲁棒性和准确性。

像素偏移追踪算法的应用非常广泛。

在监控系统中，该算法可以用于目标的实时追踪和监测，帮助警方及时发现异常行为并采取相应措施。

在无人驾驶领域，该算法可以用于车辆识别和跟踪，实现智能驾驶的功能。

此外，像素偏移追踪算法还可以应用于视频编辑、虚拟现实等领域，为多媒体技术提供基础支持。

本篇文章将详细介绍像素偏移追踪算法的基本原理和应用领域。

首先，我们将介绍算法的核心思想和关键步骤，包括特征提取、背景建模和目标跟踪等。

然后，我们将讨论该算法在不同领域的应用案例，以及相关技术的发展趋势。

最后，我们将对该算法的优势和不足进行总结，并展望未来的研究方向和应用前景。

通过本文的阅读，读者将能够深入了解像素偏移追踪算法的工作原理和实际应用，以及该算法在计算机视觉和图像处理领域的重要性和潜力。

希望本文能为读者提供有益的信息和启发，促进该领域的研究和应用进一步发展。

在1.2文章结构部分，我们将对整篇文章的组织结构进行说明。

本文将分为四个主要部分进行阐述。

第一部分是引言部分，我们将在这一部分中介绍文章的背景和目的。

我们将简要概述像素偏移追踪算法的基本原理和应用领域，并阐明为什么这个主题值得研究和讨论。

第二部分是正文部分，我们将详细介绍像素偏移追踪算法的基本原理。

我们将深入解释算法的实现细节，包括像素间的偏移量计算方法、像素变化的追踪和预测方法等。

视频侦查的步骤和方法

视频侦查的步骤和方法视频侦查是一种应用于安全监控领域的重要技术手段，通过分析视频数据来识别和追踪目标对象。

下面将介绍视频侦查的步骤和方法。

首先，视频侦查的步骤可以分为以下几个方面：采集视频数据、数据预处理、目标检测、目标跟踪以及结果分析与应用。

采集视频数据是视频侦查的第一步。

合理选择摄像机的位置和数量，保证能够全面覆盖监控区域。

同时，确保摄像机的设备性能和参数设置满足需求，如分辨率、帧率等。

数据预处理是为了提高视频质量和减少误差。

这一步骤包括去噪、图像增强、图像分割等技术。

去噪可以消除图像中的噪声，提高图像质量；图像增强可以提升图像的对比度和清晰度；图像分割可以将图像分成多个区域，便于后续的目标检测和跟踪。

目标检测是视频侦查的核心内容之一。

它是通过对视频中的每一帧图像进行分析，确定其中的目标位置和特征。

目标检测可以通过传统的计算机视觉方法，如边缘检测、颜色分析、形状识别等，也可以通过深度学习方法来实现。

目标跟踪是在目标检测的基础上，对目标在连续帧中的运动轨迹进行预测和追踪。

目标跟踪可以分为基于特征的跟踪和深度学习方法。

对于前者，可以利用目标的外观、形状和运动特征进行跟踪；对于后者，可以通过训练深度神经网络来实现目标的连续追踪。

结果分析与应用是视频侦查的最后一步。

在目标检测和跟踪之后，需要对得到的结果进行分析和应用。

这包括目标的行为分析、目标的特征提取、目标的识别等。

通过对这些结果的分析，可以提供给决策者有关于目标的相关信息，进一步帮助其做出判断和决策。

下面将介绍几种常见的视频侦查方法。

第一种方法是基于传统计算机视觉方法的视频侦查方法。

这种方法主要基于图像处理和模式识别的技术，如边缘检测、相关滤波等。

虽然这种方法在目标检测和跟踪方面有一定的局限性，但其在一些简单场景下仍具有一定的优势。

第二种方法是基于深度学习的视频侦查方法。

深度学习是近年来兴起的一种人工智能技术，能够通过大量的训练数据自动学习目标的特征和规律。

《基于深度学习的多目标跟踪关联模型设计》

《基于深度学习的多目标跟踪关联模型设计》一、引言随着深度学习技术的飞速发展，多目标跟踪技术已成为计算机视觉领域的重要研究方向。

多目标跟踪是指在视频序列中同时对多个目标进行检测、跟踪和关联的过程。

这一过程在智能监控、自动驾驶、人机交互等领域具有广泛的应用前景。

本文将介绍一种基于深度学习的多目标跟踪关联模型设计，旨在提高多目标跟踪的准确性和实时性。

二、相关技术背景2.1 深度学习深度学习是机器学习的一个分支，通过模拟人脑神经网络的工作方式，实现从原始数据中自动提取特征并进行预测或分类的任务。

在多目标跟踪领域，深度学习能够有效地提取目标的特征信息，从而提高跟踪的准确性和稳定性。

2.2 多目标跟踪多目标跟踪是对视频序列中多个目标进行检测、跟踪和关联的过程。

这一过程需要解决目标检测、目标关联和轨迹预测等问题。

其中，目标关联是多目标跟踪的核心问题之一，需要设计有效的算法来提高关联的准确性和实时性。

三、模型设计3.1 模型架构本模型采用基于深度学习的多阶段架构，包括目标检测、特征提取、目标关联和轨迹预测等模块。

首先，通过深度神经网络对视频帧进行目标检测，提取出多个目标的特征信息。

然后，利用特征提取模块对目标特征进行进一步处理，提取出更具有区分性的特征信息。

接着，通过目标关联模块对不同帧中的目标进行关联，形成目标的轨迹信息。

最后，通过轨迹预测模块对目标的未来轨迹进行预测，为后续的决策和控制提供支持。

3.2 目标检测目标检测是多目标跟踪的基础，本文采用基于深度学习的目标检测算法（如Faster R-CNN、YOLO等）对视频帧进行目标检测。

通过训练深度神经网络模型，实现对目标的快速准确检测，并提取出目标的特征信息。

3.3 特征提取特征提取是提高多目标跟踪准确性的关键步骤。

本文采用基于卷积神经网络（CNN）的特征提取方法，对目标特征进行进一步处理和提取。

通过训练深度神经网络模型，实现对目标特征的自动学习和提取，从而得到更具有区分性的特征信息。

视频监控中的目标检测及自动跟踪技术

视频监控中的目标检测及自动跟踪技术董云云;鲍海燕;王溢琴【摘要】目标跟踪是计算机视觉和图像处理领域的重要研究课题.本文提出了一种目标跟踪方法,包括检测和跟踪两个模块.检测模块完成识别目标,生成具有最佳学习的、可靠性的目标信息;跟踪模块使用特征点提取的目标信息跟踪感兴趣区域,该模块使用Camshift和光流估计来测算目标位置.实验结果表明,所提出的方法可以用来自动跟踪视频中移动的目标.【期刊名称】《山西师范大学学报（自然科学版）》【年(卷),期】2017(031)001【总页数】5页(P65-69)【关键词】目标跟踪;SURF;Camshift【作者】董云云;鲍海燕;王溢琴【作者单位】晋中学院信息技术与工程学院,山西晋中030619;晋中学院信息技术与工程学院,山西晋中030619;晋中学院信息技术与工程学院,山西晋中030619【正文语种】中文【中图分类】TP18;TP393.030 引言随着视频监控和图像处理技术的发展，目标跟踪已经成为计算机视觉和图像处理领域内的重要研究课题.如何快速和实时的跟踪目标是课题研究中遇到的主要问题.目前各个领域监控数目呈指数式增长，但是大部分监控并没有发挥其应有的作用.如果可以将目标跟踪应用于金融机构的视频监控，就可以有效地防止不法分子的入侵，避免不必要的损失；如果可以将目标跟踪应用于交通监控中，就可以有效地避免交通违法逃逸事件的发生；如果可以将目标跟踪应用于企业生产中，对企业的安全生产也会起到监督指导作用.由于不同领域的安全问题日益突出，因此开发实时的目标检测和跟踪系统至关重要.对监控的视频进行分析的主要步骤有目标检测和目标跟踪.目标检测之前首先进行目标识别，识别该区域中哪些对象为目标.目标检测是定位和分割视频中的感兴趣目标，逐帧地跟踪和分析目标.目前大部分目标检测及跟踪采用背景减除法，它是静态场景中运动目标分割的常用技术.通过减去对时间段内的图像进行平均而创建的当前图像，尝试检测移动目标区域.但是背景减除模型计算复杂，时空开销较大，并且受到较多的延迟，影响实时监视的性能.许多研究者提供了各种应用场景中的目标跟踪算法，包括自动监控、视频索引、人机交互、机器人指导和流量监控等.当前研究目标跟踪算法的使用主要是粒子滤波算法和Camshift算法[1，2].粒子滤波算法可以很好地跟踪物体，但因为其计算复杂，不能满足实时性的要求[3].与粒子滤波算法相比，基于颜色特征的Camshift算法更简单，也可以实现更好的跟踪效果[4].Avidan将支持向量机集成到基于光流的跟踪器中，但是在这样的特征空间下学习分类器计算起来比较复杂[5].本文提出了一种目标跟踪方法，包括检测和跟踪两个模块.目标检测模块使用基于构造的数据库的位置敏感散列快速识别目标，初始化和更新目标的信息以便跟踪它，该模块能够学习目标信息，当目标跟踪失败时基于当前帧重新学习目标信息，重新检测目标.目标跟踪模块通过使用特征点和直方图跟踪目标，在评估目标信息之后重新学习目标信息.1 目标检测及跟踪方法1.1 目标检测对视频监控进行目标检测，首先要进行的是特征提取.目标的每个关键点由某些维向量描述，这些称为特征描述符.一个好的描述符必须具备以下特征：处理亮度变换、旋转变换、尺寸变换、规模变化、照射角度变化.其功能很明显，目标跟踪必须不受尺度缩放和旋转变换的影响，不受视觉点变化的影响，不受照明和遮挡条件的影响，且特征提取的时空开销不应该太大，要满足实时跟踪的要求.通常用于特征提取的方法是目标识别中的SIFT (Scale invariant feature transform ,SIFT)和SURF(Speeded- up robust features,SURF )[6].SIFT旨在解决底层特征提取中的实际应用问题，一般用于图像匹配中.SIFT包括两个阶段：特征提取和描述.描述阶段主要解决特征匹配中的底层特征的应用.SIFT方法中的底层特征提取，根据图像尺度不变、旋转不变、照明条件不变来选择显著性特征.但是SIFT方法随着图像尺寸的增大，因为其高维特征，数据量大量增加，匹配时间较长，因此计算时间也随之增加[7].SURF算法中，使用对Hessian矩阵的行列式来定位特征，Hessian矩阵由理想滤波器构成，它将输入图像与给定尺度的高斯二阶导数进行卷积.SURF使用积分图像概念，积分图是从输入图像快速计算得来的，可以加速任何直立矩形区域的计算.给定输入图像点(x,y)，通过点(x,y)和原点之间的值的和来计算积分图像.SURF具有快速特征提取的特性，减少在SIFT方法中特征提取和匹配步骤中操作的复杂性[8]，可以减少处理时间，使用特征提取方法和特征描述符得到较好的处理结果.要获取有关初始目标的信息，使用提前学习的数据库.基于SURF提取当前帧中的特征点和描述符，在数据库中高速搜索目标信息，使用位置敏感哈希(locality Sensitive Hashing, LSH)来匹配当前帧的特征信息.1.1.1 SURF(Speeded- up robust features, SURF )SURF通过快速Hessian来自动检测和定位图像中的兴趣点.理论上，兴趣点检测是基于尺度空间理论的，文中的目标检测基于Hessian矩阵，给定图像中的一个点X=(x,y)，在点X，尺度为σ的Hessian 矩阵H=(X,σ)定义如下(1)其中，Lxx(X,σ)为图像I中点X处的高斯二阶导数的卷积为图像I中点X处的高斯二阶导数的卷积(X,σ)则表示一阶偏导在x方向上，二阶偏导在y方向上，g(σ)的定义(2)在SURF中，使用箱式滤波器估计二阶高斯导数，并使用积分图像快速评估图像.在原始图像中，通过扩展箱的大小来制定不同尺度的图像金字塔.箱式滤波器是高斯二阶导数的近似值.卷积结果的近似由Dxx、Dxy和Dyy表示，Hessian的行列式Det(H)=Dxx·Dyy-(0.9×Dyy)2(3)不同尺度的图像金字塔，图像被重复平滑以达到更高级别的金字塔.由于使用积分图像和箱式滤波器，不需要对先前的滤波器层的输出运用相同的滤波器.将图像分成八度，每个度包含不同尺寸的图像模板，图像的尺寸s=1.2*N/9，箱式滤波器的尺寸为N*N.1.1.2 位置敏感哈希 (locality Sensitive Hashing,LSH)在N维空间，从海量的点中高效求出距某点最近的点即为NN问题，解决NN问题的一个重要技术是位置敏感哈希(locality Sensitive Hashing, LSH).LSH观点为：原始空间中的两个相邻数据点，点p和点q在同一个桶中连续碰撞的可能性.如果点p和点q彼此接近，那么它们碰撞的可能性就越大；如果p和q之间的距离越远，它们碰撞的概率就较小.对原始的数据经过一系列hash之后，原本相邻的两个数据点变换到了新的数据空间中，它们还是在同一个桶中，相邻的概率还是很大，但是原先不相邻的数据点经过一系列hash之后被映射到同一个桶的概率很小. LSH系列需要满足以下两个条件如果d(q,p)<=d1，概率h(q)=h(p)的概率至少为p1；如果d(q,p)>=d2，概率h(q)=h(p)的概率至少为p2；d(q,p)表示q和p之间的距离，d1<d2, h(q)和h(p)分别表示对q和p进行hash 变换.如果散列函数同时满足上述两个条件，可以称它为(d1,d2,p1,p2)敏感，当通过(d1)敏感性的一个或多个散列函数对数据进行散列时，可以获得一个或者多个哈希表.这个过程称为位置敏感哈希.创建和查询LSH过程为：(1)输入参数；(2) 创建LSH函数；(3) 插入点；(4) 计算每个hash表的hash值；(5) hash值唯一化；(6) hash值相同的归入一类； (7) 计算所有创建的LSH.1.2 目标跟踪目标跟踪方法通常使用MeanShift和CamShift.MeanShift是一种基于外部特征的跟踪算法，利用它可以实现非严格的目标跟踪[9]，该算法是一种由直方图定义的跟踪目标的有效方法.CamShift也是目标跟踪的重要算法之一[10]，它是计算机视觉中平均偏移算法的改写.MeanShift和CamShift算法的主要区别是：MeanShift是基于静态分布的；CamShift基于连续自适应概率分布.文中目标跟踪模块使用Camshift和光流估计来测算目标位置和目标信息.每个目标的位置，通过目标信息进行评估和确认.目标信息由特征点、描述符、包含目标的窗口、期望目标的位置和其直方图组成.跟踪目标被用于学习目标信息的可信度方面的评估.为了评估目标的可信性，将跟踪的目标信息与标准信息进行比较：最可靠的目标信息定义为级别1，级别1是检测模块中的初始化目标信息.所使用的目标信息主要分为两部分：直方图信息和特征点信息.直方图信息对目标建模是最重要的.使用直方图信息进行以下的工作：(1)定义子窗口；(2)定义和分析目标的形态；(3)标记特征点.定义子窗口：通过将直方图与标准目标直方图进行比较，基于光流的期望目标窗口和CamShift之间选择子窗口.根据直方图的最高速率将每个子窗口划分为正和负子窗口.由包括匹配关键点的正子窗口更新目标的直方图信息.目标的形态定义和分析：分析正直方图和负直方图的分布以定义目标的形状.正子窗口由目标直方图的最大频率定义，可以通过在正子窗口的地图中的负分布来提取目标的形态特征和形状.特征点属于正子窗口，被标记为与正子窗口相同.因此，子窗口包含关于目标的直方图的信息和特征.使用特征点是一种通过匹配特征点来识别目标的简单方法.使用ORB特征点，可以进行以下工作：重新检测目标、预期目标窗口、评估目标的可信性.重新检测目标：当目标跟踪失败时，使用特征点和描述符来检测期望目标窗口，匹配当前训练特征点.期望目标窗口：可以通过使用光流计算单应性来预测目标位置的改变.可信度水平通过确定可信目标的信息来评估.评估可信度水平时，考虑包含正面子窗口的目标信息，目标的形态形状，标签的匹配分布以及基于光流和CamShift的预期窗口.如果决定可信度，则可以通过其他信息来学习提取的目标信息.当目标无法跟踪时，检测模块使用学习目标信息再次检测目标，学习到的目标信息被初始化，具有最高可信度级别的目标信息被更新为标准信息(级别1)，再次学习检测到的目标信息.重新检测模块通过匹配子窗口和特征点来识别对象.2 实验及结果实验处理真实的视频监控场景.第一个视频序列如图1所示，是交通视频监控中路况比较简单的视频.第二个视频序列如图2所示，是商务区商场门口的视频监控.将所提方法在视频中进行测试，运行在台式电脑上，处理器为Intel(R) Core(TM)i5- ***************和8 GB的内存，使用opencv实现所提出的对象的检测和自动跟踪.图1 交通监控目标跟踪Fig.1 Object tracking in traffic monitoring图1为交通视频中目标跟踪的部分结果图，从视频出现运动的目标开始跟踪，图1a视频120帧时，检测到路边出现的行人，矩形框出运动的行人；图1b为视频220帧时，黄色的吉普车出现，算法可以检测出现的多个目标，汽车和行人都被检测到(矩形框框出)并且跟踪；图1c为视频320帧，检测到运动的目标(黑色越野车和行人)，并且分别跟踪；图1d视频的420帧出现多辆汽车，视频中依然有运动的行人，但是红色和黑色车辆出现遮挡的情况并且运行速度基本一致，检测为同一个运动目标，加上白色车辆和行人，共三个运动的目标.图2为商务区行人目标跟踪的部分程序运行结果.图2a为视频80帧时，此时视频中只有年轻女子一个运动目标，程序检测出运动目标，将目标用矩形框框出来，图2b为视频的110帧时，此时监控画面中进入一对夫妻，但是距离较近，并且运动速度一致，所以将此认为一个运动目标.图2c为视频210帧时的监控画面，年轻女子在170帧离开监控，此后一直到210帧，夫妻离开监控视频；图2d为280帧时，拿手机的男士进入视频画面，其作为新的运动目标对其进行跟踪.由实验结果可以看出，所提方法可以检测并且跟踪运动的目标.但是此跟踪算法不能区分开遮挡、运动速度一致并且距离较近的运动目标.图2 商务区行人目标跟踪Fig.2 Object tracking in business district3 结论视频监控系统需要处理越来越多的数据来识别和跟踪目标.这样的系统需要能够处理大量数据的技术，以便通过提取目标的特征来识别和跟踪目标.因此，为了有效地跟踪视频序列内的移动目标，提出使用先进的特征匹配和Camshift的目标识别和跟踪方法，用于实时环境中的目标跟踪.所提出的算法使用不变的特征来提取目标，减少特征描述符的维度.将所提出的方法用于真实的视频场景中进行实验，结果表明，该方法可以在各种环境中自动地跟踪目标.【相关文献】[1] Bi H, Ma J, Wang F. An improved particle filter algorithm based on ensemble Kalman filter and Markov chain Monte Carlo method[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(2): 447～459.[2] Kulkarni M, Wadekar P, Dagale H. Block division based CAMShift algorithm for real- time object tracking using distributed smart cameras[C].//Multimedia (ISM) 2013 IEEE International Symposium on IEEE,2013.292～296.[3] Mei X, Ling H. Robust visual tracking and vehicle classification via sparse representation[J]. IEEE Transactions on Pattern Analysis and MachineIntelligence,2011,33(11):2259～2272.[4] Cong D, Shi P, Zhou D. An improved camshift algorithm based on RGB histogram equalization[C].//Image and Signal Processing (CISP) 2014 7th International Congress on IEEE, 2014.426～430.[5] Avidan S.Ensemble tracking[J].IEEE transactions on pattern analysis and machine intelligence, 2007, 29(2): 261～271.[6] Stommel M.Binarising SIFT- descriptors to reduce the curse of dimensionality in histogram-based object recognition[J]. International Journal of Signal Processing Image Processing and Pattern Recognition,2010,3(1):25～36.[7] Du M, Wang J, Li J, et al.Robot robust object recognition based on fast SURF feature matching[C].//Chinese Automation Congress (CAC) 2013.IEEE,2013.581～586.[8] Wang J, He F, Zhang X, et al. Tracking objects through occlusions using improved Kalman filter[C].//Advanced Computer Control (ICACC) 2010 2nd International Conference on IEEE, 2010,(5):223～228.[9] Leichter I, Lindenbaum M, Rivlin E. Mean shift tracking with multiple reference color histograms[J].Computer Vision and Image Understanding,2010,114(3):400～408.[10] Wang Z, Yang X, Xu Y, et al.CamShift guided particle filter for visual tracking[J].Pattern Recognition Letters, 2009,30(4):407～413.。

基于光流法的运动目标检测与跟踪技术

基于光流法的运动目标检测与跟踪技术基于光流法的运动目标检测与跟踪技术摘要：本文针对运动目标检测与跟踪问题，提出了一种基于光流法的新型技术。

通过对光流场的计算和分析，可以实现对视频图像中的运动目标进行准确检测和跟踪。

本文首先介绍光流法的基本原理和常用算法，然后提出了一种改进的光流法算法，包括光流计算、光流场分析和目标检测与跟踪过程。

最后，通过实验验证了该方法的有效性和准确性。

一、绪论运动目标的检测和跟踪是计算机视觉领域的重要研究方向之一。

在许多实际应用中，如视频监控、自动驾驶等，准确地检测和跟踪运动目标对于实现自动化和智能化具有重要意义。

光流法作为一种经典的运动目标检测和跟踪方法，已经被广泛应用于计算机视觉领域。

二、光流法的基本原理光流法是通过分析图像中的像素在时间上的变化来计算出运动场的一种方法。

其基本原理是基于一个假设：在连续帧之间，邻近的像素之间有相似的运动。

因此，通过计算相邻帧之间像素的灰度值差异，可以推导出运动场的信息。

三、光流法的常用算法1. Horn-Schunck 算法：该算法是光流法中最经典的方法之一。

它假设了连续图像之间的亮度恒定，并通过最小化光流误差方程求解运动场。

2. Lucas-Kanade 算法：该算法是利用局部邻域的光流约束，求解光流方程组的一个最小二乘解。

相比于 Horn-Schunck 算法，该算法对亮度变化敏感度较低。

四、改进的光流法算法为了提高光流法在运动目标检测和跟踪中的准确性和鲁棒性，本文提出了一种改进的光流法算法。

该算法主要包括以下几个步骤：1. 基于稀疏光流法计算光流：在计算光流时，为了降低计算复杂度，采用了稀疏光流法，选择了一部分具有代表性的像素进行光流计算。

2. 光流场分析：通过对光流场的统计分析，提取出关键信息，如目标的位置、速度和方向等。

同时，为了减少运动目标检测中的误检，对光流场进行滤波和优化处理。

3. 运动目标检测：基于光流场分析的结果，通过设定一定的阈值和规则，将光流场中的运动目标提取出来。

copy motion track to pip

copy motion track to pip如何将运动跟踪复制到画中画画中画（Picture-in-Picture，PIP）是一种视频编辑技术，可以将一个视频或图像叠加到另一个视频中的一个小窗口中。

运动跟踪（Motion Tracking）是另一项功能强大的视频编辑技术，可以自动识别视频中的运动物体，并在其上应用特效或图像。

当你想要将运动跟踪效果应用到画中画中时，这需要一些特定的步骤和视频编辑软件。

在本文中，我将为你介绍如何将运动跟踪复制到画中画中。

步骤1：选择适当的视频编辑软件首先，选择一款适合你需求的视频编辑软件。

目前市面上有很多优秀的视频编辑软件可供选择，比如Adobe Premiere Pro、Final Cut Pro和DaVinci Resolve等。

这些软件都提供了强大的运动跟踪和画中画功能。

步骤2：导入素材安装和启动选定的视频编辑软件后，导入你想要编辑的视频素材。

点击软件界面上的“导入”按钮或直接将视频文件拖放到软件窗口中即可。

步骤3：打开运动跟踪工具接下来，在视频编辑软件中打开运动跟踪工具。

不同软件的操作方式略有差异，但通常你可以在工具栏或导航菜单中找到运动跟踪功能。

步骤4：选择目标对象使用鼠标或其他指示设备，在视频帧中选择你要应用运动跟踪的对象。

这个对象可以是一个移动的物体、一个人的脸、或者任何其他你感兴趣的图像区域。

步骤5：开始运动跟踪启动运动跟踪工具后，开始进行运动跟踪。

具体操作方式因软件而异，但通常你需要点击“开始”或类似的按钮，软件将自动分析所选择的对象在视频中的运动轨迹。

步骤6：调整运动跟踪参数根据需要，你可以调整运动跟踪的参数以获得更准确的跟踪结果。

例如，你可以调整跟踪尺寸、跟踪精度、跟踪框的形状等。

步骤7：应用运动跟踪效果当运动跟踪完成后，你可以将所选对象上应用特效或图像。

这些特效可以是文字、形状、滤镜、调整图像属性等。

步骤8：创建画中画效果完成运动跟踪后，现在是时候创建画中画效果了。

基于背景差分法和光流法的视频动态目标检测与跟踪

跟踪方法并初步验证了系统算法的可行性。
ｌ基于背景差分法的视频运动目标检测
背景差分法是常用的运动目标检测方法之一，方法该
标识另、ｑ目标跟踪和行为分析。其中目标检测是最基础的部分，他部分都是以目标检测结果为基础的。目标跟踪其是被应用得最多的，在公共场合中对可疑人物的跟踪、如机器人视觉中对物体的视觉追踪、通监控中的违章车辆交
整个过程相对简单，易于推广和使用。一般的设计人员更即可完成，整个万向传动装置的设计易于实现不同型号使的模型的建立，同样地这种方法应用于其它的零件模型的参数化中，利于提高整个设计效率，不需要花费太多有且
参考文献：
［］李玉萍．于ＰｏＥ的减速器大齿轮２维建模及参数化设计［］１基ｒ／－Ｊ．
机械设计与研究，０７３．２０（）
下实现三维实体参数化设计的方法，采用基于Ｐｏ比ｒ／
时间。
［］李原，３张涛，哲，曹等．支持操作的装配仿真技术研究［］工程设Ｊ．
计，００１．２０（）
Ｅ］林龙震．ｒ／ＯＯＬＴｗｉｆｅ．［．４ＰｏＴＫＩｌｉ２０Ｍ］北京：ｄｒ电子工业出版社，

监控视频中的目标跟踪技术研究

监控视频中的目标跟踪技术研究目录一、引言二、监控视频中的目标识别技术三、监控视频中的目标跟踪技术A.滤波器跟踪B.卡尔曼滤波跟踪C.粒子滤波跟踪D.支持向量机跟踪四、监控视频中的目标跟踪应用五、未来展望六、结论一、引言随着监控视频技术的不断发展，监控视频的应用场景也越来越广泛，从普通的商业中心到安全防护系统都可以看到监控视频的存在。

而在实际应用中，往往需要对视频中的目标进行跟踪，以便对该目标进行更多的信息分析和处理。

本文将针对监控视频中的目标跟踪技术进行详细的探讨和研究，以期为相关研究者提供一定的参考和支持。

二、监控视频中的目标识别技术对于监控视频中的目标跟踪来说，目标识别是非常重要的一步。

目标识别可以通过视频图像的分割和特征提取来实现。

常见的视频图像分割方法包括区域分割法、阈值法、边缘检测法和局部特征能量分布法等。

而视频特征提取能够准确的从图像中提取出目标的特征，并用于后续的目标跟踪。

图像特征提取方法包括颜色特征、纹理特征、形状特征等。

在这些特征中，颜色特征是最常用的，因为它容易在图像中提取并且对实时应用来说非常快速。

三、监控视频中的目标跟踪技术前面已经提到了目标识别能够将目标从监控视频中分离出来，而目标跟踪能够在视频的多帧中保持目标的连续性。

常见的目标跟踪技术包括：A.滤波器跟踪滤波器跟踪是通过计算每一帧的图像和目标的预测坐标之间的差异，根据差异来进行目标预测和跟踪。

但是由于图像中可能存在噪声和模糊等问题，使得滤波器跟踪技术的精度不高。

B.卡尔曼滤波跟踪卡尔曼滤波跟踪是一种基于状态估计的目标跟踪算法。

其核心思想是通过对目标运动状态的预测和测量数据的融合，来实现目标的精确跟踪。

相比于滤波器跟踪，卡尔曼滤波跟踪更加稳定和准确，但是对于运动状态存在不确定性时，其效果较差。

C.粒子滤波跟踪粒子滤波跟踪是一种无模型的目标跟踪算法。

该算法通过随机生成一些粒子，根据粒子和目标之间的距离来计算出目标的位置，并不断更新粒子位置，从而实现对目标的跟踪。

一种基于光流的行人目标跟踪与分割方法

一种基于光流的行人目标跟踪与分割方法姜守帅;高阳;吕佳;陈林资【摘要】为了对非限制场景中的行人目标实现跟踪和分割,研究了一种基于光流的行人目标跟踪与分割方法.采用传统光流场的计算方法,获取行人运动所产生的光流场,将光流场中像素点的幅值信息及像素点在帧间运动的方向角度信息相结合,使光流场中所包含的前景目标物体的运动信息更加完整,更具鲁棒性.根据行人在连续帧间运动时,行人和背景之间边界位置像素点亮度变化的特点,实现对行人目标的跟踪.采用改进的内外映射方法,获取动态目标内部像素点,实现对视频前景行人目标的分割.实验结果表明,该方法能够准确地实现对非限制场景中行人目标的跟踪与分割.【期刊名称】《桂林航天工业学院学报》【年(卷),期】2017(022)004【总页数】9页(P389-397)【关键词】光流;运动目标分割;内外映射;行人跟踪【作者】姜守帅;高阳;吕佳;陈林资【作者单位】桂林航天工业学院机械工程系,广西桂林 541004;桂林航天工业学院机械工程系,广西桂林 541004;桂林航天工业学院机械工程系,广西桂林 541004;桂林航天工业学院机械工程系,广西桂林 541004【正文语种】中文【中图分类】TP391.41对非限制场景中动态目标检测方法[1]的研究是近年来机器视觉领域和模式识别领域的一个研究热点，同时也是一个研究难点。

对动态目标分割理论的研究一般是在对静态图像进行检测分割[2-3]的理论基础上发展起来的。

随着动态目标分割算法的不断改进发展，它已经成为模式识别，视频编辑，人类的运动学分析等众多领域的基础。

并且非限制场景中高效快速的动态目标分割方法既可以大大节省后续处理的时间，又可以大大提高后续处理的精度，使对整体处理的难度大大降低，从而使工作效率大大提高。

静态图像分割技术[4-5]的发展已日臻完善，而非限制场景中动态目标分割技术目前正处于快速发展的阶段，各类算法层出不穷。

但是实际应用中视频分割技术对其鲁棒性有很大要求，即在人类视觉系统能够承受的范围内相对稳定、准确地分割视频中的前景运动目标。

一种基于CNN的运动对象分割算法

一种基于CNN的运动对象分割算法蒋鹏;陈松【摘要】提出一种基于细胞神经网络的运动对象分割算法.通过引进除噪模板和改进边缘检测模板,去除了图像采集和处理过程中的噪声影响,得到比较满意的图像边缘信息.实验结果验证了算法的有效性,而且处理速度与图像大小无关,能够实现图像实时处理.%Based on cellular neural networks ( CNN ) , a moving objects segmentation method are proposed. By introducing noise removing templates and improving edge detection templates,which remove the noise of acquisition and processing, and satisfying information about image edge is got. Experimental results demonstrate the effectiveness of the method, such as calculation speed independent of image size,real-time performance.【期刊名称】《科学技术与工程》【年(卷),期】2011(011)032【总页数】4页(P7944-7947)【关键词】细胞神经网络;除噪模板;边缘检测模板;运动对象【作者】蒋鹏;陈松【作者单位】重庆交通大学信息科学与工程学院,重庆 400074;重庆交通大学信息科学与工程学院,重庆 400074【正文语种】中文【中图分类】TP391.41图像分割较早就得到人们广泛的重视和研究，也在实际中得到大量的应用，视频分割与图像分割存在着紧密的联系，很多图像分割的方法都可以用到视频分割中去。

尽管对图像分割已进行了大量的研究，并已提出了上千种各式各样的算法，但尚没有一种适合于所有图像的通用的分割算法。

vos检测报告

vos检测报告VOS检测报告随着人工智能技术的不断发展，视频对象分割（Video Object Segmentation，简称VOS）成为了计算机视觉领域中一个重要的研究方向。

VOS旨在从视频序列中准确地分割出感兴趣的对象，为视频编辑、虚拟现实、自动驾驶等领域的应用提供支持。

本文将以VOS检测报告为标题，介绍VOS技术的原理、应用和研究进展。

一、VOS技术原理VOS技术的核心目标是从视频序列中分割出感兴趣的对象。

其基本原理是利用计算机视觉和机器学习的方法，通过对视频序列中每一帧图像进行像素级别的分析和分类，来实现对象的准确分割。

VOS 技术通常包括以下几个步骤：1.1 目标检测与跟踪在进行对象分割之前，首先需要对视频序列中的对象进行检测与跟踪。

目标检测是指在每一帧图像中定位和识别感兴趣的对象，而目标跟踪则是指在不同帧之间追踪对象的运动轨迹。

1.2 像素级别的分割通过对目标检测和跟踪的结果进行进一步的处理，VOS技术能够对每个像素进行分类，将其分为属于对象的像素和背景的像素。

这一过程需要利用机器学习算法，例如卷积神经网络（ConvolutionalNeural Network，CNN），来训练模型并对像素进行分类。

1.3 时间一致性处理由于视频序列中的对象会发生运动和形变，为了保持分割结果的连续性和一致性，VOS技术还需要对不同帧之间的分割结果进行时间一致性处理。

这一处理过程可以通过利用光流估计算法来实现，以保持对象的形状和位置的连续性。

二、VOS技术应用VOS技术在许多领域都有着广泛的应用前景。

以下是几个主要的应用方向：2.1 视频编辑VOS技术可以用于视频编辑软件中，帮助用户快速而准确地选择和分割视频中的对象。

通过将VOS技术与视频编辑软件相结合，用户可以方便地对视频进行剪辑、合成和特效处理，提高视频编辑的效率和质量。

2.2 虚拟现实VOS技术在虚拟现实领域中也有着广泛的应用。

通过将现实世界中的对象分割出来，VOS技术可以为虚拟现实系统中的虚拟对象提供与现实世界的交互。

智能视频监控中的目标识别与异常行为建模与分析

智能视频监控中的目标识别与异常行为建模与分析一、本文概述随着科技的快速发展，智能视频监控在各个领域的应用越来越广泛，特别是在公共安全、交通管理、商业防盗等领域发挥着重要的作用。

智能视频监控的核心技术之一是对视频中的目标进行准确识别，并对异常行为进行有效的建模与分析。

本文旨在探讨智能视频监控中的目标识别与异常行为建模与分析的相关技术、方法及其实际应用。

本文将介绍目标识别在智能视频监控中的重要性，并概述目前常用的目标识别算法和技术，如深度学习、卷积神经网络等。

本文将详细阐述异常行为建模与分析的关键技术，包括行为特征提取、行为模式识别、异常行为检测与预警等。

本文还将探讨如何将目标识别与异常行为建模与分析相结合，以实现更高效的智能视频监控。

本文将通过案例分析，展示智能视频监控在公共安全、交通管理等领域的应用效果，为相关领域的研究和应用提供参考和借鉴。

通过本文的阐述，读者将能够全面了解智能视频监控中的目标识别与异常行为建模与分析的相关技术和方法，为其在实际工作中的应用提供有力支持。

二、智能视频监控技术概述随着科技的飞速发展，智能视频监控技术已成为现代安全领域的重要支柱。

该技术集成了图像处理、模式识别等多种先进科技，实现了从传统的模拟监控向数字化、网络化、智能化的跨越。

智能视频监控的核心在于对视频流进行高效处理和分析，从而实现对目标对象的自动识别、跟踪以及异常行为的建模与分析。

在智能视频监控系统中，目标识别技术扮演着至关重要的角色。

它依赖于计算机视觉和机器学习算法，通过对视频帧中的图像进行处理和分析，实现对目标对象的精确识别和定位。

这些目标对象可以是人、车辆、物品等，识别过程通常包括目标检测、特征提取和分类识别等步骤。

异常行为建模与分析是智能视频监控的另一个重要方面。

在复杂的监控场景中，如何准确识别并预警异常行为一直是研究的热点和难点。

异常行为通常指的是与正常行为模式不符或违反预设规则的行为。

智能视频监控系统通过构建行为模型，对监控场景中的目标对象进行持续跟踪和分析，一旦检测到异常行为，系统将立即触发报警机制，为安全监控提供及时有效的支持。

使用AI技术进行视频分析和处理的步骤

使用AI技术进行视频分析和处理的步骤随着人工智能（AI）技术的快速发展，它在多个领域的应用越来越广泛。

视频分析和处理是其中一项重要应用。

通过利用AI技术，可以对视频进行自动化分析、提取特征、识别目标对象并进行编辑等操作。

本文将介绍使用AI技术进行视频分析和处理的基本步骤。

一. 视频预处理在开始视频分析和处理之前，首先需要对视频进行预处理。

这个步骤旨在确保视频质量良好，并减少后续处理中可能出现的误差。

1. 视频去噪与清晰度增强使用AI技术可以去除视频中的噪声并增强图像的清晰度。

通过训练模型学习图像数据集，可以准确识别并去除不必要的干扰信号，并提高画面质量。

2. 时序校正与同步由于录制设备和播放设备之间的差异以及不同帧率之间可能存在不匹配，需要对视频进行时序校正和同步。

通过使用AI算法对视频帧进行缩放、插值等操作来实现帧率匹配，从而保证整个过程中视觉效果的连续性。

二. 视频目标检测与追踪视频中可能存在多个目标对象，而AI技术可以帮助我们准确地识别和追踪这些目标。

这对于视频分析和处理非常重要。

1. 目标检测通过使用深度学习等AI技术，可以对视频中的每一帧进行目标检测。

通常采用的方法是使用特定的神经网络模型，如卷积神经网络（CNN），来训练并识别感兴趣的目标。

通过不断调整模型参数，可以提高目标检测的准确性和稳定性。

2. 目标追踪在完成目标检测后，接下来需要对目标进行跟踪。

AI技术可以通过在视频的每一帧上利用位置和外观信息进行匹配，并估计目标的运动轨迹。

这样一来，在整个视频序列中能够连续、精确地跟踪目标对象。

三. 视频内容分析与特征提取AI技术还可以在视频内容上进行进一步的分析，并提取其中的关键特征。

这将有助于后续处理任务，如智能剪辑、内容推荐等。

1. 视频分类与分类通过训练机器学习模型，可以对视频内容进行分类和识别。

例如，对于视频中的动作识别、情感分析等任务，AI技术可以帮助我们自动化地完成。

2. 特征提取AI技术可以从视频中提取出有用的特征，以便进一步分析和处理。

动作跟踪系统介绍

动作跟踪系统技术概述动作跟踪顾名思义动作捕捉，动作捕捉（Motion capture），简称动捕（Mocap），是指记录并处理人或其他物体动作的技术。

它广泛应用于军事，娱乐，体育，医疗应用，计算机视觉以及机器人技术等诸多领域。

在电影制作和电子游戏开发领域，它通常是记录人类演员的动作，并将其转换为数字模型的动作，并生成二维或三维的计算机动画。

捕捉面部或手指的细微动作通常被称为表演捕捉（performance capture）。

在许多领域，动作捕捉有时也被称为运动跟踪（motion tracking），但在电影制作和游戏开发领域，运动跟踪通常是指运动匹配（match moving）。

《魔戒》里的咕噜姆、《泰迪熊》里的毛绒熊、《阿凡达》里的部落公主……电影里那些经典虚拟形象生动的表演总能深深打动观众，而它们被赋予生命的背后都源于一项重要的科技技术——动作捕捉。

多个摄影机捕捉真实演员的动作后，将这些动作还原并渲染至相应的虚拟形象身上。

这个过程的技术运用即动作捕捉，英文表述为Motion Capture。

这项上世纪70年代就被利用于电影动画特效制作的技术，如今正在被广泛应用在电影制作和游戏开发等领域。

以《指环王》中的虚拟数字角色咕噜为例：第一步、捕捉真实演员的肢体和面部运动数据第二步、将真实演员的动作赋予数字角色图三、最终合成的效果对于动画企业而言，在前期脚本、原画完成后，动画制作的主要工作集中在角色动画的调关键帧上，如果面对一个40集的生活动画片，那么其中角色动画部分就有最少320分钟的角色部分，需要6个高级调帧工程师调整几个月才能实现，而且后期的修改还需要很多时间。

如果是动作要求更多的动画片，比如说武打题材的动画片，则需要更多的人，更长的周期。

运用运动捕捉就可以完全越过这些枯燥的技术操作，将动画师的精力都放在片子的创意上，动画制作只需要找到合适的演员捕捉就可以了，运动捕捉平台可以将捕捉对象的动作实时生成动画，人物的动作、动物的动作、甚至多人的动作都能够迅速生成。

一种基于帧内图像分区的视频对象自动分割算法

一
种基于帧内图像分区的视频对象自动分割算法
杨文明，廖庆敏，刘济林
（．清华大学深圳研究生院清华一理大生物识别联合实验室，广东深圳５５１１０５８
２．浙江大学信息与通信工程研究所，浙江杭州３０２）１０７
维普资讯
第１３卷第３期
电路与系统学报
ＪＯＵＲＮＡＬＯＦＣＩＲＣＵＩＴＳＡＮＤＹＳＥＭＳＳＴ
ＶｏＩ１ＮＯ３．３．Ｊｅ，２８ｕｎ００
文章编号：１０・２９（０８０－１－５０７０４２０）３０ｌ１０
差也服从高斯分布，则相邻两帧图像的噪声之差仍然服从高斯分布，这样图像中静止背景区域的帧差将服从高斯分布，相反，运动区域的帧差可以看作与运动特性相关的非高斯信号，这样运动区域的检测就可以通过高斯检验模型来完成Ｊ。高斯检验模型可以实现从高斯信号中提取非高斯信号的功能，对运动区域的检测就是采用高阶统计的方法判断某区域帧差是否服从高斯分布来确定该区域是否处于
中图分类号：Ｔ３１Ｐ９．４
文献标识码。Ａ
１
ቤተ መጻሕፍቲ ባይዱ
引言
目前，视频对象自动分割方式可以自动地从视频序列中提取运动对象，无需人工辅助，能够达到

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

浙　江　大　学　学　报(工学版)

JournalofZhejiangUniversity(EngineeringScience)Vol.42No.9

Sep.2008

收稿日期:2007204227.浙江大学学报(工学版)网址:www.journals.zju.edu.cn/eng

作者简介:孙志海(1981-),男,福建漳州人,博士生,主要从事视频运动对象分割的研究.E2mail:eeszh@163.com

通讯联系人:朱善安,男,教授,博导.E2mail:zsa@cee.zju.edu.cn

DOI:10.3785/j.issn.10082973X.2008.09.030多视频运动对象实时分割及跟踪技术

孙志海,朱善安(浙江大学电气工程学院,浙江杭州310027)

摘　要:利用帧间差异积累信息进行自适应背景建模,采用背景差的方法检测视频运动对象区域.设计了一种变系数的空域滤波器,有效地对背景差图像进行了增强,使获得的视频运动对象区域更具有空域连通特性.给出了一种改进的基于Otsu法的自适应阈值化方法,能更准确地对背景差图像进行阈值化.采用形态学边界提取技术对视频运动对象轮廓进行提取.在获得视频运动对象轮廓的基础上,用区域生长法对视频运动对象进行定位,将矩形中心坐标视为视频运动对象的质心坐标.用基于空间欧氏距离最短的方法对每个视频运动对象质心进行关联跟踪并绘制轨迹.试验结果表明,该方法实时有效.

关键词:运动对象分割;运动对象跟踪;差异积累;空域滤波;背景更新中图分类号:TP391.41 文献标识码:A 文章编号:10082973X(2008)0921631205

Real2timesegmentationandtrackingtechniqueofmultiplemovingobjectsinvideosequence

SUNZhi2hai,ZHUShan2an(CollegeofElectricalEngineering,ZhejiangUniversity,Hangzhou310027,China)

Abstract:Effectivebackgroundwasmodeledbyaccumulativeframe2to2framedifferences,andforegroundcouldbeextractedusingbackgroundsubtractionoperation.Avariablecoefficientspatialfilterwaspresen2ted,whichcouldeffectivelyenhancethebackgroundsubtractionimageandmaketheforegroundregionhasmuchmorespatialconnectivity.AnimprovedOtsu2basedsegmentationmethodwaspresentedtoaccuratelythresholdthebackgrounddifferenceimage.Morphologicaloperationwasusedinextractingcontoursofmovingobjects.Aftergettingthecontoursofmovingobjects,regiongrowingsegmentationmethodwasappliedtolocatetheforegroundregion,andtherectanglecentrewasseenasthemasscentreofthemovingobjects.MovingobjectsweretrackedusingminimalEuclideandistanceandthemotiontrajectorieswerealsopainted.Experimentalresultsshowedthatproposedalgorithmwaseffectiveandefficient.Keywords:movingobjectsegmentation;movingobjecttracking;differenceaccumulation;spatialfilte2ring;backgroundupdate

视频运动对象分割及跟踪处于整个视觉监视系统的最底层,是各种后续高级处理如视频分析[1]、视频编码[2]、视频检索[3]以及视频监控[4]等的基础.运动对象分割是指从视频流中实时提取出运动对象,而运动对象跟踪则是指对目标进行连续的跟踪以确定其运动轨迹.尽管文献[5～7]报道了有关视频运动对象分割的算法,但视频运动对象自动分割的问题还没完全解决.实时自动分割视频语义对象的难点有:对复杂场景快速准确的背景建模;环境变化及噪声影响算法的鲁棒性;算法通用性差,复杂的分割算法满足不了应用的实时性要求;多运动对象的分割及跟踪[627]对分割算法提出了更高的要求.© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

Bailo等人[8]从算法实时性角度出发,利用高斯分

布特性构建自适应背景更新模型,实现了对视频运动对象的分割,此类算法需要估计镜头噪声或静止背景中由噪声所引起的方差,算法自适应程度较不理想.Yang等人[9]利用视频像素水平及帧水平特性有选择地更新背景模型,然后采用形态学后处理方法对视频运动对象进行分割,该算法对图像RGB颜色空间的三维数据均进行了处理,当视频窗口变大时,算法处理速度成倍下降,影响实时性.Chen等人[10]提出了一种采用背景记录技术恢复背景区域,结合背景差和邻帧差信息分割视频运动对象的算法,该算法如果没有准确的前景物体分割,背景记录技术得到的背景信息则不可靠,反而影响了下一帧运动对象分割的准确性.

本文结合实际视频运动对象的特点,针对实际拍摄的交通视频系列,给出了一种多视频运动对象实时分割及跟踪技术.

1　分割及跟踪技术框架多视频运动对象实时分割及跟踪的技术框架如图1所示.主要有5部分:自适应背景建模;空域滤波、轮廓提取;目标定位、质心标记;运动对象质心关联;轨迹绘制.

利用每隔一段时间内每个像素的帧间积累差异信息自适应建立背景模型,利用背景差技术检测出运动物体区域;根据背景差图像的特点,设计了一种变系数的空域滤波器,结合形态学处理的方法对背景差图像进行空域滤波并提取出视频运动对象轮廓;采用区域生长法对视频运动对象进行定位和质心标记;在视频运动对象分割的基础上,利用运动对象质心建立视频运动对象帧间向量,并比较运动对象的帧间向量模值,对视频运动对象质心进行关联跟踪及轨迹绘制.

2　视频运动对象分割2.1　自适应背景建模设有M帧视频序列f(x,y,t

1),f(x,y,t2)

…,f(x,y,t

M),取f(x,y,t1)为基准图像,则一幅

差异积累图像是由将基准图像和视频序列后续图像进行对比得到的[11].当基准图像和序列中图像之

间在某个像素位置上出现一次较小差异就令计数器计数一次,这种计数器在差异积累图像每个像素的位置上都有一个.当第k帧图像与基准图像相比较

图1　多视频运动对象实时分割及跟踪技术框架Fig.1　Frameofreal2timesegmentationandtrackingtech2niqueofmultiplemovingobjectsinvideosequence

时,差异积累图像中一个给定像素的输入项给出在此位置上对应的像素与基准图像中同一位置的像素间灰度级变化的次数.随着时间的更新,差异积累图像可视为一个像素值在动态更新的矩阵D(x,y,

tk),差异大小是根据某阈值Tf设定好的.如取第k-r帧图像f(x,y,tk-r)为求取差异积累图像的参

考帧,则当前帧f(x,y,t

k)与参考帧f(x,y,tk-r)

之间的差异图像F(x,y,tkγ)以及差异积累动态矩阵D(x,y,t

k)分别如式(1)、(2)所示,通过分析差

异积累动态矩阵来决定某像素属于前景或背景:

F(x,y,tkγ

1;|f(x,y,tk)-f(x,y,tk-r)|>Tf,

0,其他,

(1)

D(x,y,tk)=D(x,y,tk-1)+1,F(x,y,tkγ)=　0,D(x,y,tk-1)0,其他.

(2)

式(2)表示当某位置像素的帧间差异较小时,使D(x,y,tk)加1,否则D(x,y,tk)赋值为0,表示该像素的帧间差异比较大,λ记录每个像素差异积累

2361浙　江　大　学　学　报(工学版) 第42卷