基于运动矢量空间相关性的H.264分像素运动估计
- 格式:pdf
- 大小:686.54 KB
- 文档页数:5
基于H.264/AVC视频编解码的运动估计算法研究随着近年来多媒体技术的飞速发展,在视频编解码方面,新的视频编解码技术不断涌现。
H.264是国际电信联盟(ITU)和运动图像专家组(MPEG)组成的联合专家组(JVT)制定的视频编码标准,这一编码标准可获得很高的编码效率,适合低宽带、高质量网络视频应用的需要。
但是,H.264为了提高编码效率,采用了许多高计算复杂度的算法,使编解码计算量很大。
运动估计算法作为视频压缩编码系统的核心算法,占整个系统运算量的60%左右。
高质量的运动估计算法是高效视频编码的前提和基础。
因此,如何提高运动估计算法的效率,使算法搜索过程更健壮、更快速、更高效成为目前研究的热点之一。
本文在深入学习和研究运动估计原理及现有的快速运动估计算法的基础上,针对已有的自适应十字模板搜索法(ARPS)和模式选择算法分别提出了基于自适应扁平搜索模板的改进ARPS算法、基于图像运动剧烈程度分级的快速模式选择算法等改进的运动估计算法。
在基于自适应扁平搜索模板的改进ARPS算法中,该算法在初始预测运动矢量、算法提前终止准则等方面提出了新的观点和方法,同时针对物体的不同运动趋势采用不同的搜索模板。
实验证明,本文提出的改进算法在不影响图像质量的前提下较大地降低了计算复杂度。
在基于图像运动剧烈程度分级的快速模式选择算法中,该算法基于图像的运动剧烈程度进行阈值分级,通过图像所在的级别采用不用的预测模式,从而达到快速模式选择的目的。
实验证明,本文提出的快速模式选择算法与H.264视频编解码中原有的全模
式搜索算法相比在基本保持原算法率失真特性良好的前提下较大幅度的提高了编码效率。
视频编码技术在过去几年最重要的发展之一是由ITU和ISO/IEC的联合视频小组 (JVT)开发了H.264/MPEG-4 AVC[8]标准。
在发展过程中,业界为这种新标准取了许多不同的名称。
ITU在1997年开始利用重要的新编码工具处理H.26L(长期),结果令人鼓舞,于是ISO决定联手ITU组建JVT并采用一个通用的标准。
因此,大家有时会听到有人将这项标准称为JVT,尽管它并非正式名称。
ITU在2003年5月批准了新的H.264标准。
ISO在2003年10 月以MPEG-4 Part 10、高级视频编码或AVC的名称批准了该标准。
H.264 实现的改进创造了新的市场机遇H.264/AVC在压缩效率方面取得了巨大突破,一般情况下达到MPEG-2及MPEG-4简化类压缩效率的大约2倍。
在JVT进行的正式测试中,H.264在85个测试案例中有78%的案例实现1.5倍以上的编码效率提高,77%的案例中达到2倍以上,部分案例甚至高达4倍。
H.264 实现的改进创造了新的市场机遇,如:600Kbps的VHS品质视频可以通过ADSL线路实现视频点播;高清晰电影无需新的激光头即可适应普通 DVD。
H.264标准化时支持三个类别:基本类、主类及扩展类。
后来一项称为高保真范围扩展 (FRExt)的修订引入了称为高级类的4个附加类。
在初期主要是基本类和主类引起了大家的兴趣。
基本类降低了计算及系统内存需求,而且针对低时延进行了优化。
由于B帧的内在时延以及CABAC的计算复杂性,因此它不包括这两者。
基本类非常适合可视电话应用以及其他需要低成本实时编码的应用。
主类提供的压缩效率最高,但其要求的处理能力也比基本类高许多,因此使其难以用于低成本实时编码和低时延应用。
广播与内容存储应用对主类最感兴趣,它们是为了尽可能以最低的比特率获得最高的视频质量。
尽管H.264采用与旧标准相同的主要编码功能,不过它还具有许多与旧标准不同的新功能,它们一起实现了编码效率的提高。
分数像素运动矢量代价产生器的VLSI设计
王庆春;曹喜信;何晓燕;魏红雅
【期刊名称】《电视技术》
【年(卷),期】2007(31)4
【摘要】针对H.264/AVC视频编码器的系统芯片设计,通过分析分数像素运动估计(FME)模块的数据并行度和硬件利用率,探讨了分数像素运动矢量代价产生器的复用结构,再依据FME模块的具体设计约束,提出了可以复用产生1/2像素和1/4像素运动矢量代价的硬件实现结构,并且在FPGA开发板上进行了分数像素运动矢量代价产生器的设计验证.
【总页数】4页(P15-18)
【作者】王庆春;曹喜信;何晓燕;魏红雅
【作者单位】北京大学深圳研究生院,集成微系统重点实验室,广东,深圳,518055;安康学院物理与计算机系,陕西,安康,725000;北京大学,软件与微电子学院,北
京,102600;安康学院物理与计算机系,陕西,安康,725000;北京大学深圳研究生院,集成微系统重点实验室,广东,深圳,518055
【正文语种】中文
【中图分类】TN919.8
【相关文献】
1.分数像素运动估计的VLSI结构设计 [J], 王庆春;何晓燕;曹喜信
2.AVS分数像素插值算法的VLSI实现 [J], 王方晴;王祖强
3.基于运动矢量空间相关性的H.264分像素运动估计 [J], 曾接贤;郑大芳;符祥
4.一种基于FBMA算法的整像素运动估计芯片的VLSI设计 [J], 何卫锋;毛志刚;吕志强;尹海丰
5.用于H.264的高性能整像素运动估计VLSI的设计 [J], 黄卫锋;桑红石;郑兆青;沈绪榜
因版权原因,仅展示原文概要,查看原文内容请购买。
ComputerEngineeringandApplications计算机工程与应用 基于运动矢量空间相关性的H.264分像素运动估计 曾接贤,郑大芳,符祥 ZENG Jiexian,ZHENG Dafang,FU Xiang
南昌航空大学软件学院,南昌330063 School of Software,Nanchang Hangkong University,Nanchang 330063,China
ZENG Jiexian,ZHENG Dafang,FU Xiang.H.264 fractional pixel motion estimation based on spatial correlation of mo— tion vector.Computer Engineering and Applications,2013,49(15):175—178.
Abstract:With the development of fast integer pixel motion estimation algorithms,the proportion of the computational cost of fractional pixel motion estimation in that of the whole motion estimation has become more and more significant.To reduce the complexity of fractiona1 pixel motion estimation.a novel method of H.264 fractional pixel motion estimation based on the spatial correlation of motion vector is proposed.It predicts Integer Pixel Motion Block(IPMB)using the spatial correlation of motion vector.It skips the fractional pixel search process for IPMB.Experimental results show that combined with the full fractional pixel search algorithm,the proposed algorithm can reduce 60%of fractional pixel search points while maintaining the search accu- racy basically compared with the pure full fractional pixel search algorithm.The proposed algorithm can be combined with other fractional pixel search algorithm to get better coding performance. Key words:H.264;motion vector;spatial correlation;motion estimation;Integer Pixel Motion Block(IPMB)
摘 要:随着整像素运动估计快速算法的发展,分像素运动估计的计算量在运动估计中所占比重越发明显。为了减少分 像素运动估计的计算量,提出了一种利用运动矢量空间相关性来预测整像素运动块,对整像素运动块进行分像素搜索过 程跳过的分像素运动估计方法。实验结果表明,该算法与全分像素搜索算法结合使用,在基本保持搜索精度不变的情况 下,比单纯的全分像素搜索算法减少60%左右的分像素搜索点。该算法可与其他快速分像素搜索算法结合使用,以获得 更好的编码性能。 关键词:H.264;运动矢量;空间相关性;运动估计;整像素运动块 文献标志码:A 中图分类号:TN919.81 doi:10.3778/j.issn.1002.8331.1111.0334
l 引言 运动估计是视频压缩编码中的关键技术之一,它可消 除视频信号的时间冗佘,它的效率直接影响到编码速度, 压缩率和视频解码后的图像质量。H.264中由于采用分层 设计、多帧参论、多模式运动估计、1/4像素精度运动估计等 技术,提高了预测精度,降低了匹配误差,从而获得比其他 标准更好的压缩性能。但是,它的计算复杂度却大幅度增 加。因此,研究高效快速的运动估计算法具有重要意义。 典型的运动估计包括整像素运动估计和分像素运动 估计。整像素运动估计由于其搜索点数多而备受关注,许 多快速运动估计算法致力于整像素运动估计计算复杂度 降低的研究。随着整像素运动估计快速算法的发展,整像 素搜索点数u 可以减少到10个以下,这使得分像素运动估 计的计算量高于或相当于整像素运动估计的计算量。因 此,分像素运动估计快速算法的发展对于整个运动估计的 计算量的减少变得尤为重要。目前分像素运动估计快速 算法主要有三类:一类是基于运动补偿预测误差模型的算 法,如H.264/AVC中快速1/4像素运动估计算法 和具有低 计算复杂度的基于模型的1/4像素运动估计 等,这类算法 根据最优整像素点的一个整像素运动领域的数学模型建 立误差模型,避免了运算量很大的分像素内插运算和分像 素搜索过程,但算法的匹配精度较低。另一类是采用提前 终止搜索策略的算法,如改进的面向H.264/AVC的快速运 动估计策略 ,这类算法通过阈值判定,提前结束分像素搜 索,但存在阈值选取或计算问题——阈值过大,搜索准确 度就会降低,阈值过小,搜索速度很难有明显提高。还有
基金项目:国家自然科学基金(No.61165011);江西省科技支撑计划项目(No.20112BBG70092);航天科技创新基金。 作者简介:曾接贤(1958一),男,教授,主要研究领域为图像处理与模式识别,计算机视觉;郑大芳(1988一),女,硕士,主要研究领域为图像 处理与模式识别;符祥(1980一),男,博士,讲师,主要研究领域为数字图像处理和计算机视觉。E—mail:zengjx58@163.com 收稿日期:2011-11-18 修回日期:2011—12—20 文章编号:1002—8331(2013)15-0175—04 CNKI出版日期:2012-04—25 http://www.cnki.net/kcms/detail/11.2127.TP.20120425.1720.043.html Computer Engineering and Applications计算机工程与应用 一类是基于图像平坦区域预测的算法,这类算法避免了前 两类算法的缺陷,如针对H.264的基于平坦区域预测的分 像素运动估计 。该算法采用中值预测运动矢量和模式1 的运动矢量,通过预测整像素匹配宏块,从而跳过部分宏 块的分像素搜索过程,达到提高搜索速度的目的,但对于 未预测为整像素匹配宏块的宏块,其中可能含有整像素运 动块,对这部分整像素运动块进行分像素搜索就是浪费。 针对文献[5】的不足,本文提出了一种基于运动矢量空 间相关性的H.264分像素运动估计算法,简称MVSCBS算 法。该算法充分利用运动矢量空间相关性来预测整像素 运动块,并对整像素运动块只进行整像素搜索,不进行分 像素搜索。实验结果表明,本文算法结合全分像素搜索算 法使用,基本保持了搜索精度的同时,可比文献【5】中的算 法减少1 O%左右的分像素搜索点。
2 H.264中的分像素搜索算法 H.264中采纳了两种分像素搜索算法:分像素全搜索 (FFPS)和基于中心的快速分像素搜索(CBFPS) 。 2.1分像素全搜索 分像素全搜索算法如图1所示。该算法首先计算最佳 整像素位置周围的8个1/2像素位置(如图1所示中的空心 方框“口”处),找到最佳1/2像素位置(如图1所示中的实心 方框“・”处);然后计算最佳1/2像素位置周围的8个1/4像 素位置(如图1所示中的空心三角“△”处),找到最佳1/4像 素位置(如图1所示中的实心三角“▲”处),作为分像素搜 索的最佳运动矢量。由于分像素搜索在计算匹配误差值 时增加了Hadamard变换,所以最佳整像素位置的匹配误差 值在分像素运动估计时要重新计算。分像素全搜索算法 总共需要搜索17个点,其中包括8个1/2像素位置,8个1/4 像素位置和1个最优整像素位置。
— —一 —__{ — } 叫 h ——一
1 j—— ——一 一 —
— 一 — }一 ——{
0整像素位置 ●最佳整像素位置 口1/2像素位置 -最佳1/2像素位置 △1/4像素位置 ▲最佳1/4像素位置
图1分像素全搜索 2.2基于中心的快速分像素搜索 基于中心的快速分像素搜索算法如图2所示。该算法 首先根据式(1)计算(pred X,pred),比较该点处的匹配Y
误差值和最佳整像素位置的匹配误差值的大小,选匹配误 差值较小的位置作为搜索起始点;然后再循环使用小菱形 模板进行搜索,直到最小匹配误差点为搜索模板的中心时 停止;最后选取最小匹配误差点为最终的分像素匹配点。 frac, =(pred 一mv)%fl (1) 其中,fraCpred=(predx,predj),pred 是相邻块运动
矢量的中值,mp为当前块的整像素运动矢量,%是求模 操作,在1/4像素的情况下, =4。
索_+ 、范围
——1 j—一 、
}— 一 搜索范围
l
0整像素位置 ●最佳整像素位置 ★(pred_x,predj) △1/4像素位置 ▲1/4像素匹酉己位置
图2基于中心的快速分像素搜索
3 MVSCBS算法 3.1 MVSCBS算法的切入点 H.264的运动估计采用七种模式,并选取匹配误差最 小的模式作为帧间预测模式。每种模式的运动估计都是 首先进行整像素运动估计,然后以最优整像素位置为中 心,在一个整像素运动领域内进行分像素精确搜索。但是 当分像素搜索之后最佳点仍为整数位置时,分像素搜索过 程就是浪费。表1显示了在五个图像测试序列中的最终运 动矢量分别为整像素运动矢量和分像素运动矢量的比 例。从表1可以看出,18.33%以上的运动块的最终运动矢 量都是整像素运动矢量。特别是对于运动程度比较低的 测试序列,70%以上的运动块的最终运动矢量在整像素位 置,如claire序列的整像素运动矢量比例占74.25%。设经 过分像素搜索之后最佳点仍为整像素位置的运动块为整 像素运动块(Integer Pixel Motion Block,IPMB)。可以提 前预测这些IPMB,从而跳过IPMB的分像素搜索过程,这 就是MVSCBS算法的切入点。通过跳过这些IPMB的分 像素搜索,可以减少运动估计时间,从而提高编码效率。