帧间预测运动估计算法研究
- 格式:doc
- 大小:28.00 KB
- 文档页数:4
Apr. 2020Vol. 47 No. 22020年4月 第47卷第2期西安电子科技大学学报
JOURNAL OF XIDIAN
UNIVERSITY
doi:10.19665/j.issnl001-2400.2020.02.009
SHVC中帧内预测快速算法
李 强,左 静
,王海宁
(重庆邮电大学通信与信息工程学院,重庆400065)
摘要:为了降低质量可分级高性能视频编码的复杂度,提出了帧内预测快速算法。首先,利用层间和空间 编码单元深度相关性,
预测增强层编码单元的深度值范围;然后,在每一编码深度层下,通过Jarque-Bera
检
验层间预测模式的残差系数是否服从正态分布,判断层间预测模式是否为最优模式,以便跳过高复杂度的
帧内预测;最后,对当前的深度进行假设检验,
判断编码单元内残差系数是否呈现显著性差异,以便提前终
止深度划分。实验结果表明,与标准可分级高性能视频编码编码器相比,所提出算法在保持整体编码效率
的前提下,平均降低了约79%的增强层编码时间° 关键词:视频编码;帧内预测;深度划分;模式决策;提前终止 中图分类号:TP919.8 文献标识码:A 文章编号:1001-2400(2020)02-0060-07
Fast algorithm for intra prediction in quality
SHVC
LI Qiang-
ZUO
Jing- WANG
Haining
(College of Communication and Information Engineering, Chongqing University of Posts and
Telecommunications, Chongqing
400065,
China)
Abstract:
In order to reduce the coding complexity of quality Scalable High efficiency Video
运动估计与运动补偿运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。
运动估计是从视频序列中抽取运动信息的一整套技术。
运动估计与运动补偿技术MPEG-4采用I-VOP、P-VOP、B-VOP三种帧格式来表征不同的运动补偿类型。
它采用了H.263中的半像素搜索(half pixel searching)技术和重叠运动补偿(overlapped motion compensation)技术,同时又引入重复填充(repetitive padding)技术和修改的块(多边形)匹配(modified block(polygon)matching)技术以支持任意形状的VOP区域。
此外,为提高运动估计算法精度,MPEG-4采用了MVFAST(Motion Vector Field Adaptive Search Technique)和改进的PMVFAST(Predictive MVFAST)方法用于运动估计。
对于全局运动估计,则采用了基于特征的快速顽健的FFRGMET(Feature-based Fast and Robust Global Motion Estimation Technique)方法。
编解码器用来减少视频序列中的空域冗余。
它也可以用来进行去交织(deinterlacing)的操作。
定义运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。
分类包括全局运动补偿和分块运动补偿两类。
运动补偿是一种描述相邻帧(相邻在这里表示在编码关系上相邻,在播放顺序上两帧未必相邻)差别的方法,具体来说是描述前面一帧(相邻在这里表示在编码关系上的前面,在播放顺序上未必在当前帧前面)的每个小块怎样移动到当前帧中的某个位置去。
这种方法经常被视频压缩/视频编解码器用来减少视频序列中的空域冗余。
它也可以用来进行去交织(deinterlacing)的操作。
tpsrc极致码流算法tpsrc极致码流算法是一种用于视频编码的算法,旨在提高视频编码的效率和质量。
该算法通过优化编码过程中的各个环节,从而达到更高的压缩比和更好的视觉质量。
下面将对tpsrc极致码流算法进行详细介绍。
## 算法原理tpsrc极致码流算法主要包括以下几个方面的优化:### 1. 帧内预测帧内预测是视频编码中常用的一种技术,它利用当前帧中已经编码的像素值来预测未编码像素值。
tpsrc极致码流算法通过改进帧内预测算法,提高了预测准确性和效率。
### 2. 帧间预测帧间预测是指利用已经编码的前一帧或后一帧像素值来预测当前帧像素值。
tpsrc极致码流算法通过引入更复杂的运动估计算法和补偿技术,提高了帧间预测的准确性和效果。
### 3. 熵编码熵编码是一种无损压缩技术,它通过对数据进行统计分析并建立合适的概率模型,将出现概率较高的数据用较短的编码表示,从而达到压缩数据的目的。
tpsrc极致码流算法通过改进熵编码算法,提高了编码效率和质量。
### 4. 量化量化是视频编码中一种重要的过程,它将连续的像素值转换为离散的数值,从而减少需要存储和传输的数据量。
tpsrc极致码流算法通过优化量化算法,提高了图像细节的保留和恢复能力。
## 算法特点tpsrc极致码流算法具有以下几个特点:### 1. 高压缩比tpsrc极致码流算法通过优化各个环节,提高了视频编码的压缩比。
相比传统的视频编码算法,tpsrc能够在保持相同视觉质量的情况下,减少存储和传输所需的带宽。
### 2. 高视觉质量tpsrc极致码流算法在提高压缩比的同时,也注重保持视频的视觉质量。
通过改进预测、补偿和熵编码等技术,tpsrc能够更好地保留图像细节和运动信息。
### 3. 低延迟tpsrc极致码流算法在编码和解码过程中,能够实现较低的延迟。
这对于实时视频传输和交互式视频应用非常重要,能够提升用户体验。
### 4. 跨平台兼容tpsrc极致码流算法可以在不同的硬件平台上运行,并且与各种视频编解码器兼容。
基于帧间差分法的目标运动检测算法
摘要
针对目前视频监控领域中,目标运动检测技术在视频分析研究中具有很大的应用价值,本文提出了一种基于帧间差分法的目标运动检测算法。
该算法通过采用基于帧间差分法的处理技术来实现对目标物体的运动检测,提高了目标物体的跟踪精度和算法的鲁棒性。
实验证明该算法较传统方法具有更好的检测效果和更高的遥测率,具有一定的实际应用价值。
关键词:帧间差分法;目标运动检测;跟踪精度;算法鲁棒性;遥测率。
一、背景介绍
目标运动检测技术在视频图像处理领域中具有广泛的应用价值,特别是在视频监控领域中有着广泛应用。
目标运动检测技术可以通过对视频图像进行处理,对图像中的目标物体进行跟踪和检测,从而实现对目标物体的监控。
目前,针对目标物体的运动检测技术主要有两种:基于背景差分法和基于帧间差分法。
其中,基于帧间差分法的目标运动检测技术在处理速度和检测精度方面具有许多优势。
本文旨在。
ipb帧原理
IPB(Inter-picture prediction with bi-directional frames)是一种视频压缩技术,用于视频编码中的预测帧压缩算法。
IPB帧原理是基于帧间预测的概念。
在视频编码中,一个视频序列会被分解成一系列的帧,其中包括I帧(Intra-frame,关键帧)、P帧(Predictive frame,前向预测帧)和B帧(Bi-directional frame,双向预测帧)。
I帧是独立的编码图像帧,不依赖其他帧。
P帧和B帧是通过对前后帧进行预测来编码的。
IPB帧原理中的P帧是通过对前向帧(通常是前一帧)进行预测来进行编码的。
P帧仅存储与前一帧的差异信息,而不需要存储整个帧的像素数据。
这种预测可以通过运动估计算法来实现,找到前一帧中与当前帧最相似的部分,然后使用运动矢量来表示两帧之间的位移。
B帧则是通过对前后帧(通常是前一帧和后一帧)进行预测来编码的。
B帧可以利用前一帧和后一帧之间的相似性来实现更高的压缩率。
通过寻找两个方向的运动估计矢量,可以对当前帧进行更准确的预测。
IPB帧原理充分利用了视频序列中的时间和空间相关性,通过预测帧来减少存储和传输的数据量,实现视频压缩。
这种预测的准确性和效果取决于运动估计算法的性能和编码器的设置。
MEMC,全称为Motion Estimate and Motion Compensation,即运动估计和运动补偿,是一种液晶电视中用到的运动画质补偿技术。
其原理是采用动态映像系统,在传统的两帧图像之间加插一帧运动补偿帧,将普通平板电视的50/60Hz 刷新率提升至100/120Hz。
这样,运动画面更加清晰流畅,优于常态响应效果,从而达到清除上一帧图像的残影、提高动态清晰度的效果,将影像拖尾降至人眼难以感知的程度。
MEMC运动补偿技术基于帧间的运动信息。
连续的帧之间往往存在着相似的运动模式,这是由于连续帧之间的场景变化通常较小所导致的。
因此,通过对前后帧之间的运动进行预测和补偿,可以实现对视频信号的高效编码和压缩。
MEMC运动补偿技术的工作流程一般分为三个步骤:运动估计、运动补偿和残差编码。
首先是运动估计阶段。
运动估计的目标是通过比较当前帧与参考帧之间的像素差异,找到最佳的运动矢量来表示两帧之间的运动信息。
常用的运动估计算法包括全搜索法、三步搜索法和快速多尺度搜索法等。
全搜索法是一种最简单但计算量最大的方法,它对于每个像素点都进行全范围的搜索,找到最佳的运动矢量。
而三步搜索法和快速多尺度搜索法则通过逐级递进的搜索方式,在保证精度的前提下降低了计算复杂度。
接下来是运动补偿阶段。
在运动补偿过程中,根据前一帧的运动信息和运动矢量,对当前帧进行像素的位移调整,从而实现对运动部分的补偿。
运动补偿的目的是尽可能减小当前帧与参考帧之间的残差,以便更高效地进行残差编码。
运动补偿可以通过两种方式实现:帧内预测和帧间预测。
帧内预测是指利用当前帧内的像素信息进行预测,而帧间预测是指利用前一帧或后一帧的像素信息进行预测。
最后是残差编码阶段。
在运动补偿后,会产生一些未能被完全预测和补偿的像素差异,即残差。
为了进一步提高压缩效率,需要对残差进行编码。
常用的残差编码方法包括变长编码和熵编码等。
变长编码是一种根据像素值频率分布进行编码的方法,可以根据像素值频率的不同进行不同长度的编码。
帧间差分法运动目标检测过程及原理帧间差分法(Frame Difference Method)是一种常用的视频运动目标检测方法,它通过比较视频帧之间的变化来检测目标的运动。
这种方法广泛应用于视频监控、交通管理、智能交通等领域,并且在实际应用中取得了不错的效果。
1.视频帧获取:需要获取视频输入,并将视频分解成一帧一帧的图像。
2.帧间差分计算:对于连续的两帧图像,通过对两帧图像进行减法操作,计算出图像像素点之间的差值。
这个差值可以表示出两帧图像之间的变化情况,有助于检测出图像中的运动目标。
3.差分图像处理:得到帧间差分图像后,需要对其进行一定的处理,以便进一步提取出图像中的运动目标。
常见的处理方法包括阈值处理、形态学操作等。
4.目标提取与分析:将处理后的帧间差分图像进行目标提取,得到目标的边界信息。
可以进一步对目标进行形状、大小、速度等特征分析。
5.目标跟踪与识别:通过目标提取和特征分析,可以对目标进行跟踪和识别,得到目标的运动轨迹和行为信息。
帧间差分法的原理:帧间差分法主要包括以下几个关键步骤:1.差分计算:通过对两帧图像进行像素级的差分计算,得到一个差分图像。
通常采用的方法是直接相减或者采用其他像素级的差分运算方法。
2.阈值处理:得到的差分图像中可能存在一些噪声或者细微的变化,需要通过设置一个合适的阈值来将目标的变化和噪声区分开来。
3.形态学操作:通过形态学操作,可以进一步处理差分图像,去除一些不必要的细节,加强目标的轮廓信息。
4.目标提取:根据处理后的差分图像,可以得到目标的二值图像,进而提取出目标的轮廓信息。
帧间差分法的优点包括不需要训练数据、对目标的尺度不敏感、对光照变化不敏感等。
帧间差分法在应对复杂场景、目标遮挡、背景复杂等情况下仍然存在一定的局限性,需要结合其他方法进行改进和完善。
帧间差分法运动目标检测过程及原理帧间差分法是一种常用的运动目标检测方法,其原理是通过比较连续视频帧之间的差异来识别出运动的目标。
帧间差分法的具体步骤如下:1. 彩色图像转为灰度图像:将连续的彩色图像转换为灰度图像,这样可以减少计算量,并保留图像中的大部分运动信息。
2. 选择参考帧:从视频流中选择一个帧作为参考帧。
3. 计算差分图像:将参考帧与其后的每一帧进行差分操作,得到差分图像。
差分图像的每个像素点表示了相邻两帧之间的像素差异。
4. 二值化处理:将差分图像进行二值化处理,得到二值化差分图像。
可以采用简单的阈值分割方法,将差分图像中像素值大于某个阈值的点标记为前景点,即表示运动目标。
5. 形态学处理:对二值化差分图像进行形态学处理,可以进一步去除噪声和连通不完整的运动目标。
常用的形态学处理操作包括膨胀、腐蚀等。
6. 特征提取与轨迹跟踪:对得到的运动目标进行轮廓提取、面积计算等操作,可以提取出一些目标的特征信息。
通过对多个连续帧之间运动目标的匹配及轨迹跟踪,可以实现目标的检测和跟踪。
帧间差分法的原理基于连续视频帧之间的像素变化,通过计算相邻帧之间的灰度差异,可以得到物体的运动信息。
当物体发生运动时,相邻帧之间的灰度值会发生较大的变化,而静止物体的灰度值变化较小。
通过对差分图像进行二值化处理,可以将运动目标从背景中分离出来。
帧间差分法的优点是实现简单、计算速度快,适用于实时视频监控和目标跟踪等应用。
但同时也存在一些局限性,比如对光照变化敏感、对背景杂乱的环境容易产生误检和误识别等问题。
帧间预测运动估计算法研究
帧间预测编码法是视频编码过程中消除冗余的重要方法。
运动估计和运动补偿技术是视频帧间预测编码中的核心技术。
详细研究了块匹配运动估计的基本原理,重点介绍了几种经典的块匹配运动估计算法,通过实验定性地评价了各算法的性能特点,分析了各算法的优缺点,总结出了运动估计算法优化的方向,对目前运动估计技术的研究和设计具有重要意义。
标签:帧间预测编码;时间冗余;块匹配;运动估计;运动矢量
Abstract:Motion estimation and motion compensation are the core technologies in video inter-frame prediction coding. The basic principle of block matching motion estimation is studied in detail,and several classical block matching motion estimation algorithms are introduced in detail. The performance characteristics of each algorithm are evaluated qualitatively through experiments,and the advantages and disadvantages of each algorithm are analyzed.
Keywords:interframe prediction coding;time redundancy;block matching;motion estimation;motion vector
引言
幀间预测是视频编码的关键内容,而运动估计是其核心。
据统计在H.264/A VC编码中运动估计约占全部计算量的60%到80%,所以运动估计算法的性能至关重要。
块匹配算法广泛应用标准视频编码。
在基于块匹配的运动估计算法中,对每一帧图像都被分成大小相同的宏块,然后以宏块为基本处理单元。
最后对预测差值、运动矢量和相应的参考索引进行编码。
1 帧间预测原理
1.1 运动估计
在序列图像中,邻近帧存在着一定的相关性。
因此,可将活动图像分成若干块或宏块,在参考帧中定义的搜索区域,按照一定的匹配准则,搜索出每个块或宏块在参考帧图像中的匹配块,并得出两者之间的空间位置的相对偏移量,即运动矢量。
当前块从参考帧中求取最佳匹配块得到运动矢量的过程被称为运动估计[2]。
运动估计的原理如图1。
假设当前帧为P,参考帧为Pr,当前编码块为B,B*与B在图像中坐标位置相同。
在Pr中,按照搜索准则,寻找与B块相减残差最小的匹配块Br。
这个过程就是运动估计,Br左上角坐标(xr,yr)与B*左上角坐标(x,y)之差,
即为运动矢量(Motion Vector,MV)。
1.2 运动补偿
运动估计得到的运动矢量同参考帧补偿出当前帧的预测帧的过程叫做运动补偿(Motion Compensation,MC),预测帧与当前帧相减得到预测误差[3]。
再对预测误差进行进一步处理。
2 运动估计算法
全搜索算法[4](Exhaustive Search method,ES)能够得到全局最优的运动矢量,但该算法的运算量巨大无法实时应用。
快速搜索算法[5]简单,计算量小,加速比较大,但有时会陷入局部最优值,搜索的准确度不高。
经典的快速搜索算法[6]有:三步法(Three Step Search method,TSS),二维对数法,交叉搜索法,新三步法(New Three Step Search method,NTSS),四步法(Four Step Search method,FSS),菱形法[7](Diamond Search method,DS),十字菱形搜索法,自适应十字搜索法(Adaptive Rood Pattern Search method,ARPS),六边形搜索法。
2.1 全局搜索算法
全局搜索算法是以每个像素为单位,在搜索区域内,按照一定的搜索规则,寻找匹配误差最小的块,计算出运动矢量,这样在每个像素的位置都会找到一个运动矢量,形成运动矢量集合。
2.2 三步搜索法
三步法是首先将图像分成不重叠的的块,在搜索区域内,按照一定的搜索准则分三步搜索。
第一步,从块中心开始以4步为步长的9个点的区域内计算最小误差值。
第二步,以第一步的最小值的点为中心,步长为2步的9个点的区域内计算最小的误差值。
第三步:以第二步的最小SAD值的点为中心,步长为1步的9个点的区域内计算最小误差值,这个最小点即为最佳匹配点。
三步法一共计算点数为:25个点。
它的优点是搜索步骤固定简单,只有三步,易于硬件实现新三步法、简单快速三步法(Simple and Efficient Three Step Search method,SESTSS)、四步法等都是在三步法的基础上进行改进的运动估计算法。
2.3 菱形法
菱形法不同于三步法及其改进的算法,它利用运动矢量的中心偏置特性,对搜索模式进行了改进,采用大小菱形模板。
大菱形由9个点组成,围绕中心点的8个点形成一个大菱形的形状。
小菱形是由5个点组成的菱形。
菱形法的第一步:在大菱形中搜索计算9个点(大菱形)的SAD,找到最小值点,如果在中心,则转至第三步;如果不在中心,转至第二步。
第二步:以第一步的最小值点为中心继续构建大菱形搜索,直至最小值位于中心。
第三步:以上一步的最小值点为中心构建5个小菱形搜索,计算结束。
菱形法的优点:计算量少,搜索速度快,
可以尽可能避免找到局部最优的位置,得到的性能更好。
六边形搜索法、十字形搜索等算法是在菱形法的基础上进行改进的运动估计算法。
3 实验结果与分析
3.1 实验平台和实验条件设置
仿真实验在配置为Intel(R)Core(TM)CPU i7-8550@1.80GHz 1.99Hz,8.00GB内存,Windows10的PC平台下,使用Matlab2014b作为仿真平台,对ES、TSS、NTSS、SESTSS、FSS、DS、ARPS算法进行实验,测试视频为caltrain 的前31帧。
运动估计块采用边长为16个像素的正方形,搜索范围为距当前块的上下左右各15个像素。
最佳搜索点采用最小绝对误差匹配准则。
测试指标采用搜索点数和峰值信噪比(Peak Signal to Noise Ratio,PSNR)。
3.2 實验结果和分析
每帧图像在所采用算法下的峰值信噪比PSNR如图2所示。
实验所用31帧图像的平均搜索点数和平均峰值信噪比PSNR值如表1所示。
图2表明,出全局ES算法的PSNR值最高,搜索的精确性最好,得到的运动矢量最佳。
四步法FSS和菱形法DS与全局搜索ES算法的PSNR性能上相近,帧PSNR值相差不到0.3dB。
从表1可以看出ES算法虽然PSNR最高,但是搜索点数是快速搜索算法的10~20倍,搜索速度很慢。
三步法相比ES算法在PSNR上有一定的下降,但是搜索速度快约10倍。
新三步法是在三步法基础改进的,与三步法在搜索速度上相当,但是PSNR上有明显的提高。
菱形法采用大小菱形模板,在搜索速度和PSNR上均有明显的提升。
自适应十字形搜索法在PSNR上和菱形法一致,搜索速度上却提升近一倍。
4 结束语
本文在分析块匹配运动估计原理的基础上,实现了几种经典的块匹配运动估计算法,通过实验结果和数据证明了不同运动估计算法的优劣,进而从理论上分析了这些经典算法优劣的原因,为更加鲁棒和快速的运动估计算法的研究设计提供了思路,有利于视频帧间预测编码的进一步研究。
参考文献:
[1]朱秀昌,刘峰,胡栋.视频编码和传输新技术[M].北京:电子工业出版社,2014:7.
[2]陈靖,刘京,曹喜信.深入理解视频编解码技术:基于H.264标准及参考模型[M].北京:北京航空航天大学出版社,2012:20-29.
[3]张晓星.基于块匹配的运动估计算法研究与实现[D].北京交通大学,2008.
[4]蒋晓悦,赵荣椿.几种块匹配运动估计算法的比较[J].计算机应用研究,2004,21(7):1-3.
[5]刘书平.H.264运动估计算法比较与分析[J].现代计算机,2017(9):41-46.
[6]吴晓军,白世军,卢文涛.基于H.264视频编码的运动估计算法优化[J].电子学报,2009,37(11):2541-2545.
[7]刘海峰,郭宝龙,冯宗哲.用于块匹配运动估值的正方形-菱形搜索算法[J].计算机学报,2002,25(7):747-752.。