H.265HEVC视频编码率失真优化技术研究
- 格式:doc
- 大小:12.48 KB
- 文档页数:3
超高清视频编码技术研究与优化策略分析随着时代的发展和科技的进步,超高清视频成为了人们追求高品质视觉享受的新选择。
超高清视频编码技术的研究和优化既关乎视频产业的未来发展,更关系到观众的视觉体验。
一、超高清视频编码技术概述超高清视频通常指的是分辨率高达3840X2160的4K Ultra HD视频,甚至还包括更高分辨率的8K Ultra HD视频。
与传统视频相比,超高清视频的数据量更大,文件大小更大,需要更多的存储空间和更快的传输速度。
为了解决这一问题,人们需要对超高清视频进行编码和压缩。
超高清视频编码技术主要包括两种编码方式:基于运动估计的视频编码技术和基于图像分割的视频编码技术。
前者是目前应用最广泛的一种编码技术,其核心原理是根据视频帧之间的差异性来进行编码,通过运动场景中不需要显示的部分的省略和运动场景中的优化编码,从而达到编码和压缩的目的。
而基于图像分割的编码技术,则是通过对图像进行分割,把图像分成一系列区块,并且根据不同区域来制定不同的编码策略。
这种编码技术可以更加精细地控制视频清晰度和画面质量,但是需要更加复杂的硬件和算法支持。
二、超高清视频编码技术的优化策略为了提高超高清视频编码的效率和质量,以下几种优化策略值得探讨:1. H.265/HEVC编码器H.265/HEVC编码器是当前最先进的超高清视频编码器,其编码效率比H.264/AVC编码器高出40%以上。
它采用并行级别框架,利用熵编码和上下文自适应二进制算法,从而实现了更高效的视频压缩。
通过采用H.265/HEVC编码器,可以有效降低超高清视频的带宽和存储需求,从而提高视频的传输速度和观看体验。
2. 图像预测技术图像预测技术是超高清视频编码的一种常用技术。
它通过预测视频中下一帧的图像内容,并将预测结果与已有的图像进行比对,从而实现视频编码和压缩。
此外,还有一种叫做块匹配预测算法的技术可以被使用,它可以在运动场景中用于实现更加高效的块匹配和运动估计。
H.265-HEVC视频编码率失真优化技术研究H.265/HEVC视频编码率失真优化技术研究近年来,随着多媒体技术的飞速发展,高清视频的传输和存储需求不断增加。
为了满足这一需求,高效视频编码标准H.265/HEVC(High Efficiency Video Coding)应运而生。
H.265/HEVC相较于之前的H.264/AVC,在同等画质下能够显著降低视频数据的比特率,从而减少带宽和存储的需求。
本文旨在探究H.265/HEVC视频编码率失真优化技术,以提高视频编码的效率和质量。
在H.265/HEVC视频编码中,压缩比率是衡量编码效果的重要指标之一,它直接影响到视频质量和带宽需求。
传统视频编码技术主要集中在服务于均匀和静态场景,往往难以适应复杂动态场景。
为了提高编码的质量和效率,研究人员提出了许多优化技术。
在H.265/HEVC编码中,这些技术主要集中在两个方面:编码帧类型选择和量化参数优化。
首先,编码帧类型选择是H.265/HEVC编码中的关键环节。
在编码过程中,通常将视频帧分为三种类型:关键帧(I帧)、预测帧(P帧)和双向预测帧(B帧)。
关键帧是自身完整编码的帧,P帧通过对前一关键帧的预测编码得到,B帧则通过对前后关键帧预测得到。
关键帧通常占用更多的比特率,而P帧和B帧则主要利用帧间预测技术进行压缩。
因此,合理选择关键帧和非关键帧类型,能够在一定程度上降低编码率。
其次,量化参数优化也是H.265/HEVC编码中的重要环节。
量化参数指的是编码过程中决定数据精度的参数,通过增大量化参数可以减小比特率,但也会引起严重的失真。
因此,如何选择合适的量化参数以在保证一定质量的前提下最小化比特率是一项具有挑战性的任务。
目前,研究人员提出了一系列的自适应量化技术,通过评估视频帧的复杂度和重要性,动态地调整量化参数,以最大限度地实现编码率和失真的平衡。
除了上述两个方面的技术,H.265/HEVC视频编码中还包括帧内预测、变形编码、熵编码等诸多优化技术。
高效视频编码方法的研究与优化随着数字媒体的迅猛发展,视频编码技术在多媒体通信、娱乐和广告等领域起着至关重要的作用。
高效的视频编码方法可以实现更好的视频质量和更低的比特率,为高清视频传输和存储提供更好的支持。
本文将对高效视频编码方法进行研究与优化,探讨其相关原理和技术。
一、视频编码方法的概述视频编码是将视频信号转换为数字信号的过程,主要包括视频采样、变换编码和熵编码三个步骤。
视频编码的目标是尽可能地减少视频数据的冗余,并以最小的比特率保持良好的视觉质量。
二、现有的视频编码方法1. H.264/AVC编码标准H.264/AVC是一种广泛使用的视频编码标准,具有较好的压缩性能和较低的编码延迟。
它通过使用运动估计、帧内预测、帧间预测等技术,实现了更高的编码效率和更好的视频质量。
2. H.265/HEVC编码标准H.265/HEVC是H.264/AVC的下一代编码标准,具有更高的压缩性能和更低的比特率。
它引入了更先进的帧内预测、帧间预测和变换编码技术,能够进一步提高视频质量和减小比特率。
三、视频编码方法的优化方向1. 运动估计优化运动估计是视频编码中的关键环节,其精度和速度直接影响整个编码系统的性能。
通过改进运动搜索算法、优化运动矢量预测算法等方式,可以提高运动估计的准确性和速度。
2. 变换编码优化变换编码对视频质量和压缩性能都有较大的影响。
研究优化变换系数选择方法、设计高效的变换系数量化方法等,可提高视频质量和减小比特率。
3. 熵编码优化熵编码是视频编码中的最后一步,主要包括数据压缩和解压缩两个过程。
优化熵编码算法,如改进上下文建模、利用自适应码率控制等技术,可以进一步提高编码效率和视频质量。
四、视频编码方法的研究挑战1. 视频编码的高效性与复杂度之间的平衡高效视频编码方法通常需要更复杂的算法和更高的计算资源。
如何在保持良好视频质量的同时降低编码算法的复杂度,是一个亟待解决的难题。
2. 视频编码的实时性和延时之间的平衡实时视频通信要求较低的编码延时,而高效视频编码方法往往需要较长的编码时间。
超高清视频编码优化算法研究随着互联网的不断普及以及数字媒体技术的迅速发展,高清视频已经成为当下最为普及的视频格式之一。
然而,随着互联网的加速普及和数字媒体技术的不断突破,超高清视频格式的需求也随之逐渐转变为了市场上消费者的主要需求之一。
不过,在现阶段的技术条件下,超高清视频需要更多的存储空间、更大的带宽以及更高的编码和解码处理效率,因此超高清视频编码优化算法研究成为了开发者们所面临的主要难题之一。
因此,本文将从数据压缩、编解码和算法优化等多个方面出发,探讨超高清视频编码的挑战以及优化算法研究的最新进展。
超高清视频编码的挑战超高清视频的数据量非常巨大,需要更多的存储空间和带宽来进行传输和处理。
在传输过程中,数据的压缩对于超高清视频的传输至关重要。
除此之外,更高效的编解码算法也可以极大地提升超高清视频的传输控制效率和视频播放质量。
由此可见,超高清视频编码的研究和优化是应对挑战的有效措施,而在实际的应用过程中,这种技术的成功应用可以帮助节约服务器和用户端的资源和费用。
数据压缩技术在超高清视频传输过程中,相对于普通视频来说,数据量往往会增加无数倍。
此时,数据压缩技术成为了一项不可或缺的技术。
超高清视频压缩技术分为有损压缩和无损压缩两种类型。
在有损压缩上,可以利用图像压缩技术来实现数据压缩。
基于可视化差异性的压缩已经成为本领域重要的研究内容之一。
通过将图像分解为多个小块,并且对每个小块进行处理,最后将处理后的块合并成原图像,该方法可以保证图像质量的同时降低数据的维度和复杂度,提高数据传输的效率。
在无损压缩方面,使用算法来实现无损压缩方法,例如,在视频编码过程中,可以使用交替运动估算方法来优化算法,在卡尔曼滤波的帮助下,可以实时处理高分辨率的视频,将相似的元素压缩成帧内的算法几乎不损失图像质量的代价下进行数据压缩。
超高清视频编解码技术超高清视频的编码和解码技术是影响数据传输和处理效率的另一个因素。
在超高清视频编解码方面,研究重点主要集中在编码效率和解码速度两方面。
H.265/HEVC编译码优化研究及仿真验证
随着多媒体应用的深入,人们对视频的传输和存储不断提出新的要求,与
H.264/AVC编码标准相比,H.265/HEVC视频压缩编码算法的主要优点是压缩率高,但是编码复杂度也相应增加,其编码参数繁多,在视频系统中,如何选择合理的参数,优化实时编码和传输的效果,是众多视频应用中算法选择面临的困境。
基于这一问题,结合本文项目应用背景,论文研究H.265/HEVC视频压缩编码算法的参数对视频性能的影响,并实现软件仿真。
论文在特定视频应用环境下,针对不同视频序列和不同网络传输条件进行编码参数优化研究,开发编码压缩仿真软件,在应用中保证编码和传输的实时性的同时,尽可能提高视频编码质量。
论文主要研究内容如下:(1)针对影响
H.265/HEVC编码效果的参数,然后进行基于参数选择的编码优化研究。
对H.265/HEVC复杂度较高的模块进行了重点分析,提取出对编码性能影响较大的参数。
采用了一种基于码率(带宽)-质量-复杂度的视频质量评价方法,在给定编码环境下,针对不同视频序列和不同传输环境进行了实验,并通过视频质量评价方法,对不同编码参数组合的性能优劣进行了判定,给出了能够保证实时编码和传输的较优参数组合。
(2)设计并开发了一套基于H.265/HEVC的视频编解码仿真平台。
该平台分为视频编码服务端和视频接收处理端,视频编码服务端主要实现了编码和码流发送功能,视频接收处理端主要实现了码流接收和解码播放功能。
通过仿真试验,对H.265/HEVC编码参数优化的结果进行了仿真验证。
学校代码10699分类号TN919.8密级学号**********题目高效视频编码H.265/HEVC率失真优化关键技术研究作者杨楷芳信息与通信工程学科、专业冯燕指导教师2017年01月申请学位日期西北工业大学博士学位论文(学位研究生)题目:高效视频编码H.265/HEVC 率失真优化关键技术研究作者:杨楷芳学科专业:信息与通信工程指导教师:冯燕2017年01月Title: Research on Rate-distortion Optimization Techniques for H.265/HEVCByYang Kai-fangUnder the Supervision of ProfessorFeng YanA Dissertation Submitted toNorthwestern Polytechnical UniversityIn partial fulfillment of the requirementFor the degree ofDoctor of EngineeringXi’an P. R. ChinaJanuary 2017摘要摘 要近些年,随着互联网技术和多媒体技术的快速发展,高清甚至超高清视频业务逐渐走入人们的生活。
这在引起视频数据量迅速增加的同时也给视频的存储和传输带来了巨大的挑战。
2013年1月,视频编码联合组(Joint Collaborative Team on Video Coding,JCT-VC)发布了新一代的面向高清视频的视频编码标准H.265/HEVC,与其前一代视频编码标准H.264/A VC相比,H.265/HEVC可以在保证同等重建视频主观质量前提下节省50%的码率。
率失真优化是视频编码中提高编码效率的关键技术。
率失真优化基于香农的率失真编码理论,通过权衡编码码率与失真,在满足码率限制的前提下,获得尽量高的重建视频质量,进而提高视频编码的率失真性能。
超高清视频编码标准的研究与优化随着科技的不断进步和发展,我们的视野也在不断地拓展和升级。
从最初的黑白电视到如今的液晶电视、4K电视,人们的观看体验得到了很大的提升。
在视频领域,超高清视频编码标准的研究与优化正是为了进一步提高视频的画质和视觉体验。
一、超高清视频编码标准的现状目前,主流的超高清视频编码标准主要包括H.264、H.265和VP9等编码标准。
其中,H.264是最早被广泛采用的压缩标准,具有广泛的应用范围和高效的压缩率,但在超高清视频领域存在局限性;H.265相比H.264,在保证视频质量的前提下,可以进一步提高压缩效率,适合在高清视频和超高清视频的编码过程中使用,但相对来说还没有得到广泛的普及和采用;VP9则是由Google开发的一种全新的视频编码标准,适用于4K和8K超高清视频,但因为它的授权问题和设备兼容性的限制,目前大多数厂商并没有采用这种编码标准。
二、超高清视频编码标准的优化与应用为了进一步优化超高清视频的压缩效率和画质表现,人们在H.264和H.265等超高清视频编码标准的基础上进行了深入的研究和探索,通过不断地优化编码算法和加强压缩技术,取得了不小的进展。
在这个过程中,深度学习技术也被广泛应用于视频编码领域,例如Google的BPG(Better Portable Graphics)格式,通过深度学习技术,可以将图像和视频的细节再现得更为真实和逼真。
同时,随着4K和8K超高清视频的商业应用,一些高端智能电视和监视摄像头等设备的硬件性能和存储容量也得到了大幅提升,这也为视频编码带来了更多的选择和可能性。
例如,由于4K和8K视频数据量较大,采用HEVC/H.265进行编码可以有效地降低视频数据的大小,节省存储空间,同时也提高了视频的色彩深度和清晰度。
另外,一些短视频网站和应用也采用了H.265编码来实现更高质量、更小的视频。
三、超高清视频编码标准面临的挑战和展望尽管目前超高清视频编码标准的研究和优化已经取得不小的进展,但是仍然面临着一些挑战和问题。
面向HEVC的快速编码优化算法研究为了缓解高清、超高清视频的急剧增长给网络传输带来的冲击,VCEG和MPEG 两大国际标准化组织于2013年发布了新一代视频编码标准——高性能视频编码标准(HEVC,也称为H.265)。
HEVC继承了H.264/AVC的核心技术架构,对各个编码模块都进行了技术创新,在保证相同甚至更好的视频压缩质量的同时,减少40%以上的比特率。
但是,灵活的编码技术直接导致了HEVC编码复杂度急剧上升,严重阻碍了HEVC的推广和应用。
针对HEVC的高编码复杂度问题,本文系统地比较研究了HEVC 的核心技术,归纳总结了编码技术的演变过程,给出了编码技术进一步发展的趋势,重点提出了降低帧内、帧间和变换编码复杂度的快速算法,有效地提高了HEVC的实时编码性能,对HEVC的应用普及具有指导意义。
本文的主要工作及贡献如下:1.系统地比较研究了HEVC的核心技术,归纳总结了编码技术的演变过程,给出了编码技术进一步发展的趋势。
在研究HEVC标准的发展历程之后,对HEVC的编码框架和编码结构进行了分析。
然后归纳总结了HEVC的帧内预测、帧间预测、变换量化、熵编码、环路滤波、并行处理等关键编码技术的演变过程和发展趋势,并对比分析了各视频编码标准的应用领域和编码复杂度变化情况。
最后,研究HEVC各关键编码技术对编码复杂度的影响,结合目前HEVC编码快速算法的研究现状,对比分析给出了本文快速编码优化算法的重点研究方向:帧内编码快速算法、帧间编码快速算法和变换编码快速算法。
2.提出了一种基于图像纹理分析的帧内编码快速算法,依据相邻编码树单元(CTU)之间的图像纹理相关性,以及图像中方向边缘纹理对编码(CU)尺寸决策的影响,提前确定帧内CU尺寸的范围,减少遍历的CU尺寸。
首先分析了影响帧内编码复杂度的帧内预测划分方式、预测模式和帧内编码过程,并归纳总结了帧内编码快速算法的研究现状。
然后,结合理论验证了视频图像的空间相关性,研究了不同的图像区域纹理描述方法。
HEVC-H.265帧内编码关键技术软硬件优化HEVC/H.265帧内编码关键技术软硬件优化摘要:高效视频编码(High Efficiency Video Coding,HEVC)是当前最新的国际视频编码标准,其目标是在不损失视觉质量的情况下,显著提高视频编码的效率。
其中,帧内编码是HEVC的重要组成部分,对编码效率起着至关重要的作用。
本文主要讨论HEVC/H.265帧内编码的关键技术和软硬件优化方法,旨在提高帧内编码的性能和效率。
1. 引言近年来,随着高清视频的普及和互联网的高速发展,对视频编码的需求和要求也越来越高。
HEVC作为一种先进的视频编码标准,以其出色的压缩效率和高质量的解码性能被广泛应用于多媒体应用中。
帧内编码是HEVC中最重要的编码模式之一,因此对其进行技术优化和硬件加速具有重要意义。
2. HEVC/H.265帧内编码原理HEVC/H.265帧内编码采用了一系列创新的算法和技术,包括预测、变换、量化和编码等过程。
预测是帧内编码的核心过程,通过利用空间和时间上的相关性对当前帧像素进行预测,以减小编码器所需的位数。
变换过程通过将预测残差从空域转换为频域,使得编码的残差更加易于压缩。
量化和编码过程则是对变换系数进行量化和熵编码,以减小编码后的数据量。
3. 帧内编码关键技术为提高HEVC/H.265帧内编码的效率和性能,需要研究和优化以下几个关键技术:3.1 预测算法预测算法是帧内编码的核心,准确的预测可以显著降低编码残差的能量。
常用的预测算法包括帧内预测、帧间预测和运动补偿。
在帧内预测中,通常使用邻域像素值进行预测,而帧间预测则通过参考帧进行预测。
运动补偿则可以根据运动矢量对编码残差进行补偿,从而提高编码的效率。
3.2 变换算法变换算法是将预测残差从空域转换为频域的关键过程。
HEVC/H.265中采用了一种新的变换算法——倒装正交转换(Inverse Discrete Cosine Transform,IDCT)。
视频编码中率失真优化技术相关研究视频编码是将视频信号转化为数字码流的过程,目的是实现高效的压缩和解压缩。
在视频编码中,有一项重要的任务是优化码率失真,即在限制带宽或存储容量的情况下,尽量保持图像质量。
为了实现这一目标,研究者们开展了大量的相关研究,并提出了许多有效的技术。
一、传统编码方法传统的视频编码方法主要利用压缩算法和运动估计技术来实现码率失真的优化。
其中,压缩算法包括离散余弦变换(DCT)、变长编码(VLC)等。
运动估计技术主要利用了视频序列中的时间和空间相关性,通过预测当前帧与已编码的参考帧之间的差异来表示当前帧,从而减少编码所需的位数。
然而,传统的编码方法存在一些问题。
首先,这些方法在处理复杂场景时,难以保持良好的图像质量。
其次,这些方法对图像的编码效果较为依赖,一旦输入图像发生变化,例如存在运动物体或快速变化的场景,编码效果就会大幅下降。
因此,需要进一步研究和改进传统的编码方法。
二、基于深度学习的编码方法近年来,随着深度学习的迅速发展,基于深度学习的编码方法逐渐被广泛应用于视频编码中的码率失真优化。
深度学习模型通过学习大量数据的特征,能够有效地提取图像中的关键信息并进行有损压缩。
基于深度学习的编码方法主要包括两个步骤:特征提取和特征压缩。
特征提取通过卷积神经网络等模型来提取输入图像的关键特征。
特征压缩则通过神经网络模型将特征映射到码率失真结构上。
通过基于深度学习的编码方法,研究者们取得了显著的成果。
相比传统编码方法,基于深度学习的编码方法在复杂场景下能够更好地保持图像质量,并且对于运动物体或快速变化的场景具有更好的鲁棒性。
三、改进的运动估计技术运动估计是视频编码中的关键环节,直接影响了编码效果和图像质量。
为了提高运动估计的准确性和效率,在视频编码中,研究者们提出了一系列改进的运动估计技术。
其中,多帧预测技术是一种重要的改进方法。
该方法通过利用多个参考帧之间的关系,来提高运动估计的精度和鲁棒性。
摘要摘要视频是多媒体业务中最常用的媒体之一。
然而,由于视频数据量巨大,未经压缩的视频数据很难在带宽有限的网络中传输。
作为视频应用的关键技术之一,视频编码致力于去除视频数据中的冗余,以达到减少数据量的目的。
随着基于移动设备的视频直播等新型多媒体业务的兴起,对视频编码的实时性、压缩效率和抗误码性能提出了极大的挑战。
作为视频编码的重要环节,帧内编码仅依靠视频帧自身空域的信息进行编码,并为后续的帧编码提供参考,是视频编码在较差网络环境下避免错误传播以提高传输质量的关键技术之一。
在新一代视频编码标准H.265/HEVC中,帧内编码加入了大量新的编码工具,使得其编码性能得到了显著提升,同时也导致其编码复杂度过高,不适用于大多数新兴多媒体业务。
因此,本文以高编码速度、高编码性能和低运算量为目标,对H.265/HEVC的帧内编码技术进行了优化研究。
本文从减少不必要的帧内预测模式和划分组合数目这两个角度入手来降低帧内编码复杂度;并综合考虑了算法并行度、编码速度稳定程度与算法复杂度的可调节性,设计出了一种基于H.265/HEVC的快速帧内编码系统。
针对H.265/HEVC帧内预测模式数目较多这一情况,本文首先设计了一种计算复杂度低、并行度高的图像纹理提取方法,通过利用特征提取值的分布、图像纹理和最优预测模式之间的关系,设计和实现了一种基于纹理分布的快速帧内预测模式预测算法。
以X265的1.7版帧内编码性能为参照,使用本算法控制编码时间减少80%的同时,在高码率环境下PSNR平均降低0.47dB,比特率平均上升1.5%;低码率环境下PSNR平均降低0.03dB,比特率平均上升7%。
针对H.265/HEVC帧内编码划分组合数过多这一情况,本文首先提取影响率失真代价的编码参数(图像纹理、量化参数、预测单元大小),再分析其与率失真代价之间的关系,进而提出一种基于图像纹理的快速率失真代价预测算法。
为避免以率失真代价最小原则筛选划分组合时陷入局部最优点,本文还提出了一种划分置信度的评价模型,利用划分组合的率失真代价估计值对划分组合成为最优的可能性做出评估,最终去除冗余的划分组合。
高清视频编解码技术的优化和改进研究随着高清视频在互联网上的流行,对视频编解码技术的要求也越来越高。
然而,视频编解码技术的发展并不容易。
当前,市面上的主流视频编解码技术主要是H.264、H.265以及VP9。
这三种编码技术各有优点和缺点,但都有一些需要优化和改进的方面。
一、H.264编码技术H.264是目前最广泛应用的视频编码技术之一,因为它拥有高压缩比和良好的视觉质量。
不过,随着分辨率的不断提高和网络速度的提升,H.264编码技术的缺点也渐渐暴露出来。
首先,H.264所需要的算力非常高,因为它采用了复杂的算法来提高视频的压缩率和画质。
其次,H.264格式的解码器体积非常大,这使得移动设备上播放视频时需要消耗更多的电量和资源。
为了解决这些问题,可以尝试采用一些新的技术来优化和改进H.264编码技术。
例如,可以采用更高效的算法来提高压缩率和画质,并尝试减少解码器的体积和消耗。
二、H.265编码技术H.265编码技术是目前最新的视频编码技术之一。
相比H.264,H.265具有更高的压缩率和更好的画质,可以解决H.264在高分辨率和高码率情况下的压缩问题。
不过,H.265也有其缺点。
首先,H.265格式的解码器需要更高的算力,这在移动设备上可能会导致卡顿和电量消耗增加。
其次,H.265的编码复杂度也非常高,这使得它的编码速度较慢,不利于实时性要求较高的应用。
为了解决这些问题,可以寻找更高效的视频编解码算法,并尝试通过硬件加速和其他优化技术来提高编码速度和优化移动设备上的解码器性能。
三、VP9编码技术VP9是Google开发的视频编码技术,目前在YouTube等Google产品中广泛应用。
相比于H.264和H.265,VP9通过更加高效的算法消耗更少的带宽,从而提供更好的视频体验。
它还具有更广泛的兼容性,可以应用于不同的设备和平台。
不过,VP9在优化方面也存在一些挑战。
为了获取更高的压缩率和画质,VP9对编码算法有着更高的要求,这可能需要更多的算力来实现。
高效视频编码算法研究与优化随着互联网的快速发展和智能设备的普及,视频数据的传输和存储需求显著增加。
为了更好地实现视频数据的压缩和传输,研究和优化视频编码算法显得尤为重要。
本文将重点探讨高效视频编码算法的研究与优化方法,包括现有的编码标准以及各种优化技术。
首先,我们需要了解当前主流的视频编码算法。
最著名的视频编码标准是H.264/AVC和H.265/HEVC。
H.264/AVC是目前广泛使用的视频编码标准之一,具有良好的压缩性能和广泛的应用。
而H.265/HEVC是其后继者,具有更高的编码效率和更低的比特率。
这些标准都采用了先进的压缩技术,如运动估计、变换、量化等。
然而,这些编码标准仍然存在一些问题,如压缩效率、计算复杂度和延时等。
针对这些问题,不断有研究者提出了各种优化方法和算法。
其中,一种常见的优化方法是改进运动估计算法。
运动估计是视频编码中最重要的环节之一,它能够利用时间相关性来减小视频序列的冗余。
通过优化运动估计算法,可以降低编码复杂度、提高压缩效率和减少码率波动。
另一个关键的优化方向是变换和量化算法的优化。
变换可以将时域的图像转换为频域的系数,这有助于减小图像的冗余性。
目前常用的变换方法是离散余弦变换(DCT),但它在高频部分的编码效率相对较低。
因此,研究者们提出了各种改进的变换方法,如整数变换(Integer Transform)等。
另外,量化是将变换系数映射到有限的比特数的过程,也能够对压缩效率产生影响。
通过优化量化算法,可以平衡图像质量和比特率之间的关系,提高编码效率。
此外,还有一些其他的优化方法,如熵编码、帧内预测、运动补偿等。
熵编码是一种基于统计模型的编码方法,可以充分利用图像中的统计特性来减小码率。
帧内预测是通过对当前帧的预测来减小编码代价。
运动补偿则是根据前一帧的信息来表示当前帧的运动信息,从而减小冗余。
这些方法的优化都能够对编码性能产生积极的影响。
总之,高效视频编码算法的研究和优化是当前互联网视频传输和存储领域非常重要的任务之一。
视频编解码技术与性能优化研究随着智能手机、平板电脑和笔记本电脑的广泛普及,人们对高质量视频的需求越来越高。
在现代信息时代,视频成为媒体最重要的内容之一,人们不仅希望看清楚,还需要稳定、快速的视频流。
在这样的背景下,视频编解码技术相应得到了越来越多的关注。
一、视频编解码技术视频编解码技术(Video Codec)指的是用压缩技术将原始视频进行编码成压缩格式的过程,以及将压缩格式的视频解码回原始视频的过程。
目前视频编解码技术比较广泛的压缩格式有 H.264、H.265、VP9 和 AV1 等。
这些压缩格式的特点是带宽、存储、传输等资源占用较少,对于高清、全高清、4K 及以上的高清视频都能较好地进行压缩和传输。
H.264(Advanced Video Coding,AVC)是一种广泛采用的视频压缩标准,它可以实现极高的压缩比,同时保持画面清晰、色彩鲜艳。
而 H.265(High Efficiency Video Coding,HEVC)则是 H.264 的升级版,可以将视频数据流压缩至原来 H.264 的一半左右,是一种更为先进的视频压缩技术。
VP9 是一种由 Google 推出的编解码器,可以实现更高的编码效率和图像质量。
AV1 则是一个集合了多种优秀技术的视频编解码器,具有更好的压缩压缩性能和更高的图像质量。
二、视频编解码技术的性能优化在实际应用中,对于视频编解码技术的性能优化,可以从以下几个方面入手。
1. 硬件加速硬件加速是一种提高性能和效率的方案,它可以有效减少 CPU 的负担,提高数据的传输速度。
通常采用图形处理器(GPU)或数字信号处理器(DSP)来处理视频流数据,这些设备的处理效率比 CPU 高很多。
2. 多线程技术多线程技术是指将工作分解为多个独立的任务,通过多个线程同时执行,以提高系统的响应速度和处理能力。
在视频编解码技术中,可以采用多线程技术并行编解码,以提高效率。
3. 分辨率和帧率的控制分辨率是指图像的尺寸,是视频画面的清晰程度的重要指标。
摘要摘要随着高清视频在生活中的普及,在各种应用场景下对视频的压缩成为一项挑战,硬件实现的视频编码解决方案成为某些场景中的唯一选择。
H.265/HEVC是目前国际上最新一代视频编码标准,而变换编码是其中的一个重要环节。
变换编码是以变换单元为单位利用变换算法进行计算的过程,因此对变换模块硬件实现时涉及两个问题,一是变换单元TU大小决策,二是变换算法DCT的实现。
H.265/HEVC中采用率失真优化技术对TU大小进行决策,复杂度较高,且由于二维DCT中需要用到转置存储矩阵对一维DCT结果进行转置,对资源消耗较高,这两点都不易于硬件实现。
因此本文提出一种基于内曼皮尔逊准则的TU大小决策算法,能够节省部分TU的率失真计算过程,并给出两种较节省资源的DCT硬件结构。
针对TU大小选择过程中每种TU组合需进行率失真代价间的比较,导致选择过程时间复杂度较高的问题,本文提出一种根据TU的率失真代价大小对TU尺寸提前决策的算法。
通过对TU的率失真代价与TU是否分割的关系进行统计分析,将TU 分为两类分割与不分割,引入内曼皮尔逊准则,建立TU提前决策门限值的门限公式,并通过核密度估计与梯形面积逼近的方法,对门限公式中的未知量求解。
通过建立的门限公式,能够对TU的大小进行提前决策,从而节省部分TU需被分割后继续计算率失真代价的过程。
为了测试算法的性能,本文进行了大量实验,结果表明本文提出的TU决策算法与原编码器算法相比,TU选择的时间能够节省30%左右。
针对DCT算法硬件实现时对资源消耗较高的问题,本文提出了两种较节省资源的结构。
首先利用不同尺寸变换系数矩阵间的关系,给出在大尺寸一维DCT结构中复用小尺寸一维DCT结构的设计,并使用移位与相加的操作来代替乘法器,进一步减少资源使用。
然后结合流水线思想,给出无乘法器的二维DCT直接结构。
在直接结构的基础上,首先利用多个小块RAM代替直接结构中的寄存器实现的转置存储矩阵,然后结合蝶形算法中对输入数据对称提取的原理,给出DCT变换变序结构。
HEVCH.265理论知识(10)——率失真优化这一章很重要一、率失真优化的目标就是:1、在一定的码率(码率也表现为数据压缩的程度,码率越低,数据压缩的越厉害)限制下,减少视频的失真(减少失真就会提高视频的主观质量,看的人就会喜欢o(*≧▽≦)ツ)!2、在允许一定的失真下,把视频压缩到最小!二、编码器的率失真优化的工作主要是按照某种策略选取最优的编码参数,以实现最优的编码性能三、率失真函数RD 是在假定信源在给定的情况下,在用户可以容忍的失真度内再现数据消息所必需获得的最小平均互信信息,直白一点说,就是在允许的失真内,数据可以压缩的极限!我们对数据的压缩不能超过这个极限,否则,数据在解码端就不能再现了!因此我们的工作就是,在不超过这个极限的前提下,尽量使数据压缩得更小!四、在多种候选编码参数中选择最优的编码参数!1、视频失真的度量:ssd、sad、mse、psnr都可以度量失真度!2、使用一组特定的编码参数对视频进行编码的时候,我们可以获得该编码参数的条件下的码率和失真,即率失真性能(R,D)3、遍历所有可行的编码参数组合就可以得到所有的(R,D),在满足一定的码率限制(R)的情况下,找到是的失真(D)最小的一组参数!即最优的参数4、拉格朗日方法就是率失真优化中最常用的优化工具5、根据目标码率,先确定量化参数QP,然后根据QP确定出拉格朗日参数λ!然后根据λ和一组编码参数计算失真五、率失真优化在编码器中不同层次(CTU级、CU级、PU级、TU级等)的运用。
附:CTU可以划分成为CU、CU在预测的时候被划分成为PU、CU在变换量化的时候被划分成为TU1、在CTU级的应用。
在总比特数R受限的情况下选择一个CU (CU从8x8到64x64)的划分模式,使得一个CTU的总失真D最小。
2、在CU级的应用。
在总比特数R受限的情况下,适当的选择选择PU划分模式和TU(TU从4x4到32x32)划分模式,使得一个CU 的总失真D最小。
H畅264视频编码率失真优化和码率控制技术研究进展崔子冠1,2,朱秀昌1,2,干宗良1,2,唐贵进1,2,刘 峰1,2(1.南京邮电大学江苏省图像处理与图像通信重点实验室,江苏南京210003;2.南京邮电大学宽带无线通信与传感网技术教育部重点实验室,江苏南京210003) 摘 要: 在H畅264率失真优化和码率控制(RC)技术研究的基础上,根据控制目的将率失真优化和RC的发展分为3个阶段:即率失真建模,考虑质量波动对主观质量的影响,以主观失真为指导的RC.分析了各阶段有代表性的RC技术及其特点,指明了RC需要进一步研究的关键和难点问题.对面向传输的错误弹性编码、可分级编码、多描述编码、以及立体与多视编码中的RC技术进行总结,分析进一步发展趋势.对下一代高性能视频编码(HEVC)中的RC应该如何发展进行了探讨.关键词: 视频编码;率失真优化;码率控制;H畅264中图分类号: TN919畅8 文献标识码: A 文章编号: 0372-2112(2013)12-2443-08电子学报URL:http://www.ejournal.org.cn DOI:10.3969/j.issn.0372-2112.2013.12.019AdvancesinRateDistortionOptimizationandRateControlTechniquesforH.264VideoCodingCUIZi-guan1,2,ZHUXiu-chang1,2,GANZong-liang1,2,TANGGui-jin1,2,LIUFeng1,2(1.ImageProcessingandImageCommunicationLab,NanjingUniversityofPostsandTelecommunications,Nanjing,Jiangsu210003,China;2.KeyLabofBroadbandWirelessCommunicationandSensorNetworkTechnology,NanjingUniversityofPostsandTelecommunications,MinistryofEducation,Nanjing,Jiangsu210003,China)Abstract: Basedontheresearchesofratedistortionoptimization(RDO)andratecontrol(RC)techniquesforH.264,thispaperdividesthedevelopmentofRDOandRCintothreephasesbasedonRCintention,namelyratedistortionmodeling,consideringtheeffectofqualityfluctuationonsubjectivequality,subjectivedistortionguidedRC;analyzesthecharacteristicsofrepresentativeRCtechniquesofeachphase,andfocusesonthekeyanddifficultissuesofRCneededtobefurtherresearched.ThensummarizestheRCschemesfortransmissionorientederrorresilientvideocoding,scalablevideocoding(SVC)andmultipledescriptioncoding(MDC)aswellasstereoandmulti-viewvideocoding,andanalyzesfurtherresearchtrends.Finally,howtodeveloptheRCschemesforhighefficiencyvideocoding(HEVC)isdiscussed.Keywords: videocoding;ratedistortionoptimization;ratecontrol;H畅2641 引言 目前主流的H畅264编码标准基于预测加变换的混合框架,采用多种帧内与帧间模式和基于率失真优化(RateDistortionOptimization,RDO)的模式选择等技术,获得了极高的压缩效率.下一代高性能视频编码(HighEf-ficiencyVideoCoding,HEVC)即H畅265在许多编码模块中进一步改进,其压缩效率比H.264又提高一倍.码率控制(RateControl,RC)是视频编码(VC)中的关键模块,根据各种约束(如目标码率、缓冲区、延迟、计算复杂度、信道状况等)自适应调节编码参数来规范输出码流使之适合信道带宽,并最优化视频质量.RC分两步:一是在收稿日期:2012-12-25;修回日期:2013-07-01;责任编辑:孙瑶基金项目:国家自然科学基金(No.61071091,No.61071166,No.61071167,No.61101105);江苏省高校自然科学基金(No.12KJB510019);南邮校科研基金(No.NY212015,No.NY212083);教育部博点基金(No.20113223120001);工业与信息化部通信软科学课题(No.2011-R-70);江苏高校优势学科建设工程—“信息与通信工程”;江苏省自然科学青年基金(No.BK20130867)第12期2013年12月电 子 学 报ACTAELECTRONICASINICAVol.41 No.12Dec. 2013约束条件下为编码单元(BasicUnit,BU)分配最优目标比特;二是根据率失真模型(RateDistortionModel,RDM)设计准确的控制技术使实际码率尽量接近目标码率.公式表述如下:min1N∑Ni=1Di(Qi),s.t.∑Ni=1Ri(Qi)尘RT(1)其中Qi为量化参数,Di(Qi)与Ri(Qi)为第i个BU的失真与码率,RT为目标码率.此有约束的最优化问题可由Lagrange乘子法转化为无约束问题,建立Lagrange代价函数,通过调节参数使代价函数最小即可,即:minJ=D+λR(2)其中λ是Lagrange乘子,J是代价函数.鉴于RC对VC的重要性,近年来针对H畅264在各种环境下的编码与传输问题,已经提出了很多有效的RC技术.文献[1]对2007年之前的RC技术进行了综述,但不断出现的新需求使RC的发展日新月异.本文主要对2007年以后RC的最新发展进行总结.第2节根据控制目的将单层VC(即一个信源编码产生一个码流)的RC分为RDM建模、考虑质量波动对主观质量的影响、以主观失真为指导的RC这3个阶段,总结各阶段有代表性的RC技术及其特点.在此基础上,第3节重点指明单层VC的RC需要进一步研究的关键和难点问题.第4节对面向传输的错误弹性编码(ErrorResilientVideoCoding,ERVC)、可分级编码(ScalableVideoCoding,SVC)、多描述编码(MultipleDescriptionCoding,MDC)、以及立体与多视编码(Multi-ViewVideoCoding,MVC)中的RC技术进行总结,分析进一步发展趋势.第5节对HEVC中的RC应该如何发展进行探讨.第6节总结全文.2 单层VC中RDO和RC研究进展2畅1 RDM建模H畅264在2003年颁布之后,由于其高效的压缩性能和网络适应性,基于H畅264的各种应用开始蓬勃发展,亟需准确的RDM和高效的RC技术以精确控制码率.H畅264基于RDO选择最优的编码模式,新技术的引入使得编码残差呈现出与以往标准不同的特性.因此这一阶段的主要任务在于考虑H畅264编码特性对残差分布准确建模,并建立准确的RDM.目前精确控制H畅264的I帧及P帧输出码率的目标已基本实现.由于I帧及P帧编码特性不同,导致RDM也不相同.下面分别对I帧及P帧的残差分布及有代表性的RDM进行对比和分析.2.1.1 P帧残差分布及有代表性的RDM残差DCT系数的分布对RDM建模非常重要,文献[2]认为DCT系数服从Laplacian分布并给出严格数学分析.目前H畅264RC中广泛使用的二次RDM就是根据Laplacian分布推导而来[3,4].文献[5]发现Laplacian分布具有指数形式,导致拖尾衰减过快,而实际DCT系数直方图常有大量的拖尾系数,因此用Cauchy分布对DCT系数进行建模更准确.文献[6]直接建立R及D与DCT系数为零的比率ρ之间的关系,也取得了准确的控制效果.基于这些统计分布提出的有代表性的RDM及其特点总结于表1.注意,这一阶段RC的目标主要是为了精确控制R,因此RDM常表现为R-量化步长(Qstep)的函数关系,而D模型常用简单的D=kQstep或D=kQ2step这种形式,即认为D与Qstep或Q2step成正比.如H畅264最有代表性的RC提案JVT-G012[3]采用线性MAD预测模型解决蛋鸡悖论,根据流量传输模型为BU分配目标比特,并用二次RDM计算Qstep,以较低的计算复杂度获得了较好的RC效果.基于RDM的RC算法具有类似的控制框架,在此框架下很多学者提出了有效的改进机制,主要集中于RDM的进一步改进[7]、BU目标比特的优化分配、BU的灵活划分、头码率的准确估计、缓冲区与延迟的有效管理、编码复杂度的有效测量、模型参数更新时历史数据点的有效选择等方面.表1 P帧残差分布及有代表性的RDM残差分布文献RDMLaplacian分布[3]R-H=a/Qstep+b/Q2step×MAD[4]R-H=A×Q2step+B×Qstep+C[8]R-H=α·SATD(Qstep)/QstepCauchy分布[5]R=aQ-αstep,D=bQβstepρ域模型[6]R(ρ)=θ×(1-ρ),D(ρ)=σ2e-α(1-ρ)2畅1畅2 I帧复杂度测量及RC编码常采用GOP结构,大部分帧都采用P帧编码,因此P帧RC研究较多而I帧RC研究较少,但I帧作为每个GOP的起始参考帧非常重要,有效进行I帧RC将有助于提高整个GOP的编码质量.文献[9]采用梯度信息测量I帧复杂度,计算简单但与I帧编码特性不符,改进效果有限.文献[10]用统计窗中所有像素与其均值的平均绝对差测量I帧复杂度,且分析4×4块是否具有水平、垂直、及左右对角线方向的条纹,若存在复杂度即设为零.此方法是想将H畅264帧内预测特性考虑进去,但只判断4种条纹方向及判断出条纹后复杂度即设为零与H畅264帧内编码特性不符,导致I帧复杂度测量仍不够准确.I帧RC要解决好3个问题:(a)准确的I帧复杂度4442 电 子 学 报2013年测量;(b)I帧目标比特最优分配;(c)准确的I帧R-Q模型.针对这3个问题,文献[11]通过边缘检测估计4×4块的预测模式和残差,用残差的平均绝对值测量I帧复杂度,之后提出一种新的R-Qstep模型,同时考虑缓冲区和序列特性为I帧分配合适的目标比特,得到了较好的I帧RC效果,IPPP方式编码时序列PSNR波动减少了60%以上.文献[11]与JVT-G012[3]及JVT-W042对Mobile序列编码的效果如图1.2畅2 考虑质量波动对主观质量的影响通过建立准确的R-Q模型精确控制输出码率的目标基本完成之后,RC研究的重点开始转向在R限制下为用户提供更好的主观感受,其中最小化失真变化的RC和基于感兴趣区域(ROI)的RC很有代表性.2畅2畅1 最小化失真变化的RC之前RC的目标都是在R限制下最小化平均失真(MINAVE),由于视频内容的多样性这种优化策略在编码时可能产生明显的质量波动,从而影响主观感受.针对R限制下对质量平稳性要求严格的应用(如视频流),就需要将最大失真(MINMAX)或失真方差(MIN-VAR)最小化,目的在于得到平滑一致的视频质量.公式表示如下:min(maxi∈1,…,NDi(Qi)),s.t.∑Ni=1Ri(Qi)尘RT(3)如文献[12],为常质量应用,基于MINMAX提出一种帧层多次编码方法,在最大失真与平均失真的控制上都好于JM算法.文献[13]在R约束下对时域滑动窗中的帧实施MINVAR准则,并用Lagrange乘子法进行求解,得到了一致的图像质量.文献[14]对质量平滑和码率(缓冲区)平稳这一矛盾问题进行研究,提出自适应窗口大小机制在保持质量平滑的同时保证缓冲区在安全水平以内.2畅2畅2 基于ROI的RC针对传统RC把图像所有区域同等看待的缺点,利用人眼对图像不同区域的关注度不同,首先检测出ROI区域如人脸、运动目标等,之后在R限制下对ROI细量化,对非ROI粗量化,以保证ROI的空时质量来优化主观感受[15].基于ROI的RC在低码率应用中(如视频会话)有广泛的应用前景.难点在于:(a)编码之前要先检测出ROI,准确地分割视频对象需要较高计算量而较小的计算量无法得到准确的检测效果;(b)根据关注度设定经验加权系数在ROI与非ROI之间进行R分配和QP调整,会产生较明显的方块效应;(c)最大问题在于RDM仍以(加权)MSE作为失真度量,其编码结果是使(加权)PSNR最优,与主观质量仍不完全一致.2畅3 以主观失真为指导的RCRC第二阶段开始考虑为用户提供更好的主观感受,但失真准则仍是客观失真.基于均方误差的峰值信噪比(PSNR)计算简单且物理意义明确,在视频质量评价中广泛应用,但PSNR与主观质量并不成正比,这是由于人类视觉系统(HVS)对视频质量的感知是高度非线性的,以PSNR为指导的RC不能得到最优的主观质量.因此如何根据HVS特性建立一种主观质量评价方法并用以指导视频编码成为一项重要的研究课题[16,17].即RC第三阶段的研究重点由第一阶段R模型的精确建模(以精确控制输出码率)转到主观D模型的有效建模(以获得最优的主观R-D性能).视频质量专家组(VQEG)和相关学者在这方面也做了初步研究,其中最具代表性的有基于视觉失真敏感度(VDS)或显著度(Saliency)的RC、基于恰可察觉失真(JND)的RC和基于结构相似性(SSIM)的质量评价与编码方法.2畅3畅1 基于VDS或Saliency的RC这类方法与基于ROI的RC有些类似,区别在于更充分地利用HVS特性建立VDS或Saliency图,以此进行优化的R分配.相比ROI与非ROI两级划分,R分配更加合理,主观质量更优.如文献[18]根据运动、纹理及空时掩模效应建立VDS图进行R分配以优化视觉质量.文献[19]融合运动、色彩、方向等多种特征建立Saliency图来指导R分配.2畅3畅2 基于JND的RCJND指人眼不能感知到的最大失真,即人眼对JND阈值以下的D不敏感.JND可对感知冗余有效建模,考虑了空时对比敏感度、亮度适应效应、对比度掩模效应等对主观失真建模及R调节具有很好的指导作用,如可对感知重要的区域细量化以保证质量而对感知冗余进行有效删除.文献[20]基于多种空时视觉特性建立JND模型以此指导视频编码.文献[21]根据视网膜的凹5442第 12 期崔子冠:H畅264视频编码率失真优化和码率控制技术研究进展性(Foveation)增强JND提出FJND模型,并用于MB层QP及λ调整.2畅3畅3 基于SSIM的质量评价与编码方法文献[22]基于HVS对结构信息更加敏感的特性提出基于块的SSIM测量,克服了PSNR基于点而忽略像素之间相关性的缺点,与主观质量非常一致且计算量较小,已被引入JM中以评价编码视频的主观质量.基于SSIM的质量评价及编码方法近年来得到广泛研究,但SSIM形式较为复杂,其与R或Q之间的闭解形式很难得到,是SSIM用于VC的难点所在.文献[23]提出SSIM失真与R存在指数关系,在BU层进行基于SSIM失真的最优R分配;之后将SSIM失真引入RDO模式选择中,发现基于SSIM的R-D曲线与基于MSE的R-D曲线相邻点处切线的坡度非常相似,使用之前关键帧的RDM和前一编码帧的R-D数据对来自适应的预测当前帧的λ.文献[24,25]将SSIM失真引入RDO框架后,先提出一种减少参考的SSIM估计模型并结合R模型提出了帧层自适应的λ,之后在MB层进一步根据运动信息和视觉速度感知的不确定性来调节λ.文献[26,27]首次提出SSIM-Qstep存在线性关系,并结合R模型进行SSIM最优的MB层RC;进一步将SSIM引入RDO框架,提出MB层自适应的分析型λ来更好地调节R和SSIM失真.相比之前算法的最大贡献在于得到了λ与Qstep以及图像特性(复杂度)之间的解析式.文献[26,27]与JVT-G012[3]对Deadline序列的编码效果如图2.3 单层VC需要进一步研究的问题 (1)对场景变换(SC)的处理及GOP变长编码.目前编码大多采用固定GOP结构,即周期性地插入I帧而不考虑序列特性.当序列包含SC或剧烈运动时编码效率很低且质量波动较大,在低码率应用中尤其严重,如果在编码时考虑SC并自适应地插入I帧则可更好地对P帧进行预测从而提高编码性能.如文献[28]基于SC检测提出了GOP长度自适应的编码机制.(2)λ自适应调整.在MB层QP确定之后,H畅264引入λ进行RDO模式选择,λ仅是QP的函数并控制着R与D之间的权衡.不同图像具有不同的率失真特性,根据图像内容自适应地调整λ有望获得更好的率失真性能.如文献[29]对基于MSE的RDO中的λ在MB层根据编码复杂度自适应调整.文献[30]发现λ与视频信号的R-D特性之间存在线性关系,提出一种启发式的不依赖于QP的λ计算方法,改进了编码效率.(3)多维RC.传统RC都是在R约束下调节QP来优化视频质量,而帧率与图像分辨率常作为预定值独立于QP.这类机制在高码率应用中性能较好,但在低码率应用中常导致空间质量很低甚至被动跳帧引起时域质量的大幅波动.如JM通过监测缓冲区,一旦超过阈值(缓冲区的80%)就跳过下一帧,这种被动跳帧在以下两种情况经常发生:一是I帧编码后由于R剧增导致后续P帧被连续跳过;二是剧烈运动或SC时,由于I宏块数增加导致后续带有重要信息的帧被跳过.HVS对低运动序列更注重空间质量而对高运动序列更注重时域连续性[31],因此低码率应用中可以根据序列特性和缓冲区联合调节帧率、空间分辨率和QP(即多维RC)以优化空时质量.如何准确估计跳过帧与编码帧的失真,并用以确定跳帧数目和下一编码帧的QP使局部窗中帧平均失真最小是研究难点.编码端自适应跳帧与解码端插帧相结合[32],以及编码端空间下采样与解码端上采样相结合[33]来提高编码效率和解码端空时质量是今后一个重要的研究课题.(4)便于硬件实现的RC.传统RC都是基于软件实现的,由于算法的复杂性不适合硬件系统采用.但近年来随着视频电话、数字摄像机等广泛应用,亟需适合硬件实现的RC机制来提高这些设备的编码性能.便于硬件实现的RC算法[34]需要具备以下特性:(a)低复杂度,考虑到计算能力和功耗;(b)较小的缓冲区需求和延迟,考虑到编码实时性;(c)算法设计上要便于硬件实现,比如指令级优化.(5)联合功率或复杂度RDO(PRDO、CRDO)的RC.随着便携设备和网络技术的发展,带宽不再是限制视频通信的唯一条件,便携设备的功耗和续航能力也是设计编码算法时要考虑的关键因素之一.功耗主要来自于编码与传输两部分,编码功耗随计算复杂度单调增加,而传输功耗与压缩码流的大小成正比.因此如何在功耗或复杂度约束下最优化视频的R-D性能成为一项重要的研究课题.目前大多数研究是将功耗约束转化为计算复杂度约束,并在传统R-D分析的基础上加上功率或复杂度约束,建立统一的功率[35]或复杂度R-D分析模型[36],通过调整复杂度控制参数达到功耗和R-D性能的联合最优.关键问题在于:(a)建立合适的功耗或计算复杂度测量方法;(b)建立简单有效的PRD或CRD分析模型;(c)对分析模型的有效求解.(6)视频流中的RC及多路复用中的RC.随着6442 电 子 学 报2013年H畅264在视频流和多路复用中的广泛应用,需要有效的RC算法在延迟受限的情况下进行常质量控制.文献[37]为视频流提出一种延迟失真优化(DDO)分析框架,以寻求延迟与失真之间的最优平衡来保证接收端连续高质量的播放.文献[38]为多路视频在共享信道中的高效传输使用双帧技术进行码流间及帧间联合最优比特分配,以最小化总体MSE失真.另外把编码端的R-D分析与网络参数联合优化以提供端到端的服务质量保证(QoS)也是将来的一个研究热点.(7)视频转码的RC.转码是指码流从一个码率转换到另一个码率,或在不同编码格式之间相互转化.其中RC是视频转码中的关键问题[39],对码率自适应、码流串连影响重大,RC的好坏直接影响转码过程中引入的质量下降程度.4 面向传输及多视中的RC进展4畅1 ERVC与联合信源信道RC无线网络中如何在编码端根据丢包特性通过调节编码参数以提高码流的抗误码性能是一项重要的研究课题.H畅264的抗误码机制主要有:帧内MB刷新,自适应参考帧,自适应冗余图像,数据分区等.帧内MB刷新主要有随机或定期刷新、基于运动信息或视觉关注度的刷新,但这类机制没有充分考虑信源与信道的状况无法达到编码效率与抗误码性能的最优平衡.由于信源和信道的时变特性,帧内MB刷新数目和位置的选择至关重要,因为帧内MB会降低压缩效率而位置不佳将不能阻止误码传播,因此有必要建立一种针对丢包环境下的RDM和RC机制在R-D最优意义下选择帧内刷新率与刷新位置[40].自适应参考帧[41]是为了解决由于信道误码造成的编码端与解码端参考帧不匹配的问题.自适应冗余图像[42]通过编码适当的冗余信息以减轻信道误码对解码质量的影响.数据分区可以将编码信息按照重要性分开传输,以便对重要数据实施更强的保护.联合信源信道RC与ERVC类似,也是基于端到端RDM联合最优地选择编码模式和QP.文献[43]针对丢包网络提出一种RDM,克服了RC与误码恢复互不相关的缺点,在R限制下能充分利用信道带宽并使得信源编码与信道传输的总失真最小.文献[44]把端到端总失真视为信源量化失真、错误传播失真和错误隐藏失真三项之和,很好地揭示了丢包环境下真正的R-D关系.无线网络鲁棒视频传输最核心的问题在于:(a)端到端失真的准确建模;(b)在编码端准确估计解码端失真;(c)用总失真指导编码参数的调整.如文献[45]的帧层失真估计尤其考虑了H.264的新特性(如分像素的运动补偿、帧内预测和去块效应滤波等内插操作)对失真建模的影响.文献[46]使用有限状态Markov链对连续丢包信道中的传输失真进行建模.最近文献[47,48]对传输失真中的截断与误码扩散两个重要特性进行建模,并根据信源与信道特性得到了传输失真的递归计算公式,相比之前的失真模型更加准确而且计算复杂度更低.4畅2 SVC的RCSVC将视频编码成一个基本层和多个增强层,解码端根据运算能力及网络状况选择解码部分码流以获得所需的视频质量.SVC中RC的关键问题在于根据各层之间相关性进行最优的R分配与控制[49,50],难点在于:(a)根据不同层的特性提出更加准确的RDM;(b)不同层之间的最优R分配;(c)如何保证SVC编码质量的平稳性.4畅3 MDC的RCMDC相比SVC的优点是每个描述均可独立解码,而SVC中基本层一旦丢失,则增强层无用.MDC中RC的关键问题在于根据不同的多描述方案[51]在多个描述之间最优分配R以最小化D.目前MDC的RC算法较少且控制效果一般,这是因为不同的MDC方案会产生不同的编码特性,导致不同描述及其之间的R-D特性难以建模.因此MDC的RC需要根据具体的多描述方案来分析R和D特性,如文献[52]为基于分层次B帧的MDC进行最优R分配以平衡编码效率和错误弹性.4畅4 立体与MVC的RC立体与MVC除了提供2D视频信息,还提供表现3D场景的深度或多视信息,丰富了用户体验,必将成为今后VC领域的研究热点.立体与MVC中RC的关键问题在于2D视频与深度之间以及多个视点之间有效分配R以最优化视频的感知质量,其中深度序列编码的R-D特性和不同视点之间相关性分析与建模是RC成功的必要条件,这也是立体与MVC中RC今后研究的热点,比如文献[53]为分别从视点层、视频/深度层、及帧层分配R,满足了信道与缓冲区的需求;文献[54]利用二次R模型和线性D模型对3DTV广播的左/右视点的R进行联合控制.另外,2DVC中基于主观质量或ERVC思想都可以推广到3DVC的RC中以改进主观R-D性能与错误鲁棒性.如文献[55]为MVC提出基于立体视觉关注度的R分配算法.文献[56]对MVC在丢包网络中传输由于随机丢帧产生的信道失真进行建模.5 HEVC的RC 针对高清视频的HEVC在2013年颁布之后,必然会在视频编码领域引发新一轮的研究热潮.但截止目前,极少有对HEVC中RC进行研究的文献出现.HEVC7442第 12 期崔子冠:H畅264视频编码率失真优化和码率控制技术研究进展中RC研究的关键问题在于:(a)考虑新的编码技术对纹理信息和头信息码率所产生的影响,建立准确的纹理与非纹理RDM来指导R的分配与控制,在准确控制R的同时提高编码R-D性能;(b)引入主观失真,在一定R下通过调节QP以最优化主观质量.文献[57]认为HEVC编码单元或变换单元预测与变换的深度不同,四叉树预测残差的统计特性也不同,用Laplacian混合分布来描述残差,得到HEVC编码的R和D模型.文献[58]同样基于Laplacian分布推导出R-Q与D-Q模型,计算QP时同时考虑了帧间质量波动和缓冲区约束,得到了一致的视频质量.6 结论 从对RC最新研究成果的分析可见,针对H畅264的基于客观质量的RDM和RC研究得已较为成熟,而主观失真建模及在RC中的应用、面向无线网络的ERVC、面向异构网络的SVC及MDC中的RC、丰富用户体验的立体与MVC中的RC、以及针对高清视频的HEVC中的RC研究成果较少,控制精度不够且复杂度高,将成为今后RC技术研究的重点和难点.参考文献[1]ChenZZ,NganKN.Recentadvancesinratecontrolforvideocoding[J].SignalProcessing:ImageCommunication,2007,22(1):19-38.[2]LamE,GoodmanJW.AmathematicalanalysisoftheDCTcoefficientdistributionsforimages[J].IEEETransactionsonImageProcessing,2000,9(10):1661-1666.[3]LiZG,PanF,LimKP.AdaptivebasicunitlayerratecontrolforJVT[A].Proceedingsofthe7thJVT-G012Meeting[C].PattayaII,Thailand:JVT,2003.1-33.[4]袁武,林守勋,牛振东,等.H.264/AVC码率控制优化算法[J].计算机学报,2008,31(2):329-339.YuanWu,LinShou-xun,NiuZhen-dong,etal.EfficientratecontrolschemesforH.264/AVC[J].ChineseJournalofCom-puters,2008,31(2):329-339.(inChinese)[5]KamaciN,AltunbasakY,MersereauRM.FramebitallocationfortheH.264/AVCvideocoderviaCauchy-density-basedrateanddistortionmodels[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2005,15(8):994-1006.[6]HeZ,MitraSK.Optimumbitallocationandaccurateratecon-trolforvideocodingviaρ-domainsourcemodeling[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2002,12(10):840-849.[7]霍炎,李生红,荆涛.基于广义拉普拉斯分布的低时延速率控制算法[J].电子学报,2010,38(5):1078-1083.HuoYan,LiSheng-hong,JingTao.Low-delayratecontrolbasedongeneralizedLaplaciandistribution[J].ActaElectroni-caSinica,2010,38(5):1078-1083.(inChinese)[8]KwonD,ChenM,KuoC.RatecontrolforH.264videowithenhancedrateanddistortionmodels[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2007,17(5):517-529.[9]YanB,SunK.JointcomplexityestimationofI-frameandP-frameforH.264/AVCratecontrol[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2012,22(5):790-798.[10]LeeG,LinH,WangM.Ratecontrolalgorithmbasedonintra-picturecomplexityforH.264/AVC[J].IETImageProcess-ing,2009,3(1):26-39.[11]崔子冠,朱秀昌.H.264图像复杂度自适应的I帧码率控制算法[J].电子与信息学报,2010,32(11):2547-2553.CuiZi-guan,ZhuXiu-chang.Imagecomplexityadaptiveintra-frameratecontrolalgorithmforH.264[J].JournalofElec-tronicsandInformationTechnology,2010,32(11):2547-2553.(inChinese)[12]CherniavskyN,ShavitG,RingenburgMF,etal.MultiStage:AMINMAXbitallocationalgorithmforvideocoders[J].IEEETransactionsonCircuitsandSystemsforVideoTech-nology,2007,17(1):59-67.[13]LeeH,SullS.AVBRvideoencodingforlocallyconsistentpicturequalitywithsmallbufferingdelayunderlimitedband-width[J].IEEETransactionsonBroadcasting,2012,58(1):47-56.[14]XuL,LiS,NganKN,etal.Consistentvisualqualitycontrolinvideocoding[J].IEEETransactionsonCircuitsandSys-temsforVideoTechnology,2013,23(6):975-989.[15]WuG,FuY,HuangS,etal.Perceptualquality-regulablevideocodingsystemwithregion-basedratecontrolscheme[J].IEEETransactionsonImageProcessing,2013,22(6):2247-2258.[16]NaccariM,PereiraF.AdvancedH.264/AVC-basedperceptu-alvideocoding:architecture,tool,andassessment[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2011,21(6):766-782.[17]WuG,WuT,ChienS.Algorithmandarchitecturedesignofperceptionengineforvideocodingapplications[J].IEEETransactionsonMultimedia,2011,13(6):1181-1194.[18]TangCW.Spatiotemporalvisualconsiderationsforvideocod-ing[J].IEEETransactionsonMultimedia,2007,9(2):231-238.[19]LiZC,QinSY,IttiL.Visualattentionguidedbitallocationinvideocompression[J].ImageandVisionComputing,2011,29(1):1-14.[20]WeiZ,NganKN.Spatio-temporaljustnoticeabledistortionprofileforgrayscaleimage/videoinDCTdomain[J].IEEE8442 电 子 学 报2013年TransactionsonCircuitsandSystemsforVideoTechnology,2009,19(3):337-346.[21]ChenZZ,GuillemotC.Perceptually-friendlyH.264/AVCvideocodingbasedonfoveatedjust-noticeable-distortionmodel[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2010,20(6):806-819.[22]WangZ,BovikAC,SheikhH,etal.Imagequalityassess-ment:fromerrorvisibilitytostructuralsimilarity[J].IEEETransactionsonImageProcessing,2004,13(4):600-612.[23]OuT,HuangYH,ChenHH.SSIM-basedperceptualratecontrolforvideocoding[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2011,21(5):682-691.[24]WangSQ,RehmanA,WangZ,etal.SSIM-motivatedrate-distortionoptimizationforvideocoding[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2012,22(4):516-529.[25]WangSQ,RehmanA,WangZ,etal.PerceptualvideocodingbasedonSSIM-inspireddivisivenormalization[J].IEEETransactionsonImageProcessing,2013,22(4):1418-1429.[26]崔子冠,朱秀昌.H.264结构相似性最优的宏块层码率控制算法[J].电子与信息学报,2011,33(6):1339-1344.CuiZi-guan,ZhuXiu-chang.StructuralsimilarityoptimalMBlayerratecontrolalgorithmforH畅264[J].JournalofElectron-icsandInformationTechnology,2011,33(6):1339-1344.(inChinese)[27]崔子冠,朱秀昌.基于结构相似的H.264主观率失真性能改进机制[J].电子与信息学报,2012,34(2):433-439.CuiZi-guan,ZhuXiu-changSubjectiverate-distortionperfor-manceimprovementschemeforH.264basedonSSIM[J].JournalofElectronicsandInformationTechnology,2012,34(2):433-439.(inChinese)[28]PaulM,LinWS,LauC,etal.ExploreandmodelbetterI-framesforvideocoding[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2011,21(9):1242-1254.[29]ZhangJ,YiXQ,LingN,etal.ContextadaptiveLagrangemultiplier(CALM)forrate-distortionoptimalmotionestima-tioninvideocoding[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2010,20(6):820-828.[30]袁武,牛振东,林守勋,等.不依赖于量化参数的视频编码控制优化技术[J].计算机学报,2011,34(8):1519-1527.YuanWu,NiuZhen-dong,LinShou-xun,etal.AnadaptableQP-independentapporachtorate-distortionoptimizationforvideocoding[J].ChineseJournalofComputers,2011,34(8):1519-1527.(inChinese)[31]MaZ,XuM,OuY,etal.Modelingofrateandperceptualqualityofcompressedvideoasfunctionsofframerateandquantizationstepsizeanditsapplications[J].IEEETransac-tionsonCircuitsandSystemsforVideoTechnology,2012,22(5):671-682.[32]CuiZG,GanZL,ZhuXC.Jointspatial-temporalqualityimprovementschemeforH.264lowbitratevideocodingviaadaptiveframeskip[J].KSIITransactionsonInternetandIn-formationSystems,2012,6(1):425-444.[33]RheeC,KimJ,LeeH.Bitratecontrolusingaheuristicspatialresolutionadjustmentforareal-timeH.264/AVCencoder[J].EURASIPJournalonAdvancesinSignalProcessing,2012,87:1-12.[34]KuoC,ChangL,FanK,etal.Hardware/softwarecodesignofalow-costratecontrolschemeforH.264/AVC[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2010,20(2):250-261.[35]HeZ,ChengW,ChenX.Energyminimizationofportablevideocommunicationdevicesbasedonpower-rate-distortionoptimization[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2008,18(5):596-608.[36]SuL,LuY,WuF,etal.Complexity-constrainedH.264videoencoding[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2009,19(4):1-15.[37]OzcelebiT,TeklapAM,CivanlarMR.Delay-distortionopti-mizationforcontent-adaptivevideostreaming[J].IEEETransactionsonMultimedia,2007,9(4):826-836.[38]TiwariM,GrovesT,CosmanPC.Delayconstrainedmulti-plexingofvideostreamsusingdual-framevideocoding[J].IEEETransactionsonCircuitsandSystemsforVideoTech-nology,2010,19(4):1022-1035.[39]XuL,KwongS,WangHL,etal.Auniversalratecontrolschemeforvideotranscoding[J].IEEETransactionsonCir-cuitsandSystemsforVideoTechnology,2012,22(4):489-501.[40]宋彬,蒋小兵,秦浩,等.基于H.264具有抗分组丢失能力的帧内刷新算法[J].电子学报,2009,37(1):221-224.SongBin,JiangXiao-bing,QinHao,etal.Apacketlossre-silientintrarefreshalgorithmbasedonH畅264[J].ActaElec-tronicaSinica,2009,37(1):221-224.(inChinese)[41]TuW,SteinbachE.Proxy-basedreferencepictureselectionforerrorresilientconversationalvideoinmobilenetworks[J].IEEETransactionsonCircuitsandSystemsforVideoTech-nology,2009,19(2):151-164.[42]ZhuC,WangY,HannukselaM,etal.Errorresilientvideocodingusingredundantpictures[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2009,19(1):3-14.[43]陈川,余松煜.联合编码模式选择的码率控制算法[J].电子学报,2004,32(5):763-768.ChenChuan,YuSong-yu.Jointcodingmodeselectionandratecontrolalgorithm[J].ActaElectronicaSinica,2004,329442第 12 期崔子冠:H畅264视频编码率失真优化和码率控制技术研究进展(5):763-768.(inChinese)[44]ZhangY,GaoW,LuY,etal.Jointsource-channelrate-distor-tionoptimizationforH畅264videocodingovererror-pronenet-works[J].IEEETransactionsonMultimedia,2007,9(3):445-454.[45]WangY,WuZ,BoyceJM.Modelingoftransmission-loss-in-duceddistortionindecodedvideo[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2006,16(6):716-732.[46]LiZC,ChakareskiJ,NiuX,etal.ModelingandanalysisofdistortioncausedbyMarkov-modelburstpacketlossesinvideotransmission[J].IEEETransactionsonCircuitsandSys-temsforVideoTechnology,2009,19(7):917-931.[47]ChenZF,PahalawattaPV,TourapisAM,etal.Improvedes-timationoftransmissiondistortionforerror-resilientvideocod-ing[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2012,22(4):636-647.[48]ChenZF,WuDP.Predictionoftransmissiondistortionforwirelessvideocommunication:Analysis[J].IEEETransac-tionsonImageProcessing,2012,21(3):1123-1137.[49]刘家瑛,郭宗明,ChoY.面向H.264/SVC空域-质量域可伸缩编码的码率分配算法[J].电子学报,2010,38(9):2112-2117.LiuJia-ying,GuoZong-ming,ChoY.BitallocationalgorithminH畅264/SVCspatial-qualitywithdependentR-Dmodeling[J].ActaElectronicaSinica,2010,38(9):2112-2117.(inChinese)[50]李晓峰,周宁,刘洪盛,等.一种基于缩减栅格算法的SVC联合信源/信道编码方法[J].电子学报,2011,39(4):859-864.LiuXiao-feng,ZhouNing,LiuHong-sheng,etal.Ajointsource/channelcodingwithreducedtrellisalgorithmforthescalableextensionofH畅264/AVC[J].ActaElectronicaSini-ca,2011,39(4):859-864.(inChinese)[51]KamnoonN,AgrafiotisD,CanagarajahC.Flexibleadaptivemultipledescriptioncodingforvideotransmission[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2012,22(1):1-11.[52]TsaiW,YouH.MultipledescriptionvideocodingbasedonhierarchicalBpicturesusingunequalredundancy[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2012,22(2):309-320.[53]LiuYW,HuangQM,MaSW,etal.Anovelratecontroltechniqueformultiviewvideoplusdepthbased3Dvideocod-ing[J].IEEETransactionsonBroadcasting,2011,57(2):562-571.[54]ChangY,KimM.Ajointratecontrolschemeinahybridstereoscopicvideocodecsystemfor3DTVbroadcasting[J].IEEETransactionsonBroadcasting,2013,59(2):265-280.[55]ZhangY,JiangGY,YuM,etal.Stereoscopicvisualatten-tion-basedregionalbitallocationoptimizationformultiviewvideocoding[J].EURASIPJournalonAdvancesinSignalProcessing,2010,60:1-24.[56]ZhouY,HouCP,XiangW,etal.Channeldistortionmodel-ingformulti-viewvideotransmissionoverpacket-switchednetworks[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2011,21(11):1679-1692.[57]LeeB,KimM.Modelingratesanddistortionsbasedonamix-tureofLaplaciandistributionsforinter-predictedresiduesinquadtreecodingofHEVC[J].IEEESignalProcessingLet-ters,2011,18(10):571-574.[58]SeoC,MoonJ,HanJ.Ratecontrolforconsistentobjectivequalityinhighefficiencyvideocoding[J].IEEETransactionsonImageProcessing,2013,22(6):2442-2454.作者简介崔子冠 男,1982年1月出生于河南郑州.2011年获南京邮电大学工学博士学位,现为南京邮电大学通信与信息工程学院讲师,主要研究方向为视频编码与传输.E-mail:cuizg@njupt.edu.cn朱秀昌 男,1947年8月出生于江苏丹徒.教授,博士生导师,江苏省图像处理与图像通信重点实验室主任,主要研究方向为图像处理与多媒体通信.干宗良 男,1979年9月出生于新疆石河子.2007年获南京邮电大学工学博士学位,现为南京邮电大学通信与信息工程学院讲师,主要研究方向为图像处理与视频通信.0542 电 子 学 报2013年。
H.265/HEVC视频编码率失真优化技术研究
随着信息与多媒体技术的飞速发展,各类视频应用尤其是高清视频应用越来越广泛地出现在人们的日常生活和工作中。
而由此带来的视频高清化和高帧率化趋势对视频的压缩性能提出了更高的要求。
为此,两大国际标准化组织ITU-T VCEG与ISO/IEC MPEG于2013年共同推出了新一代高效视频编码标准H.265/HEVC。
与上一代视频编码标准H.264/AVC相比,H.265/HEVC使用了更加灵活的块划分方式并采用了大量更为先进的编码技术,因而其编码性能较之前者能够提高一倍左右,但其编码复杂度也随之大幅提升。
本文基于H.265/HEVC视频编码标准,主要研究了其编码过程中的率失真优化技术以及速率控制技术,提出了一种率失真优化量化(RDOQ)技术的快速实现方法、一种考虑视频帧间内容依赖性的自适应量化参数(QP)分配方法以及一种考虑视频内容特性的帧级比特分配方法。
主要研究成果包括:1.针对H.265/HEVC中率失真优化量化(RDOQ)技术复杂度过高的问题,提出了一种快速RDOQ实现方法。
首先,通过分析多个可选量化值对应的量化失真与编码比特数,本文对各非零变换系数的可选量化值数目进行了一定程度的限制。
其次,本文算法通过计算不同可选量化值失真与编码比特数之间的差异来选取最优量化值,从而避免了分别计算多个可选量化值的率失真代价;最后,在分析H.265/HEVC中残差系数的熵编码过程的基础上,提出了一种基于自信息量的CABAC快速比特估计算法,用于快速计算不同可选量化值编码比特数的差异。
实验结果表明,与HM中原有的RDOQ算法相比,本文提出的快速算法可平均降低74.7%
的计算复杂度,而编码性能平均只损失0.58%。
2.结合H.265/HEVC视频编码过程中的全局率失真优化策略,提出了一种考虑视频帧间内容依赖性的自适应量化参数(QP)与拉格朗日因子λ分配方法。
首先,本文在分析帧间预测残差产生过程的基础上提出了一种用于估计帧间内容依赖性强度的模型;其次,利用该模型对H.265/HEVC中的分级B 帧结构各编码层之间的依赖性进行了分析,并依据各编码层在GOP中的重要性得出了各层对应的拉格朗日因子之间的关系;最后,本文利用上述关系以及量化参数与拉格朗日因子之间的关系为各视频帧自适应计算量化参数值。
实验结果表明,与HM默认量化参数设置方式相比,本文提出算法能够获得3.49%的编码性能提升,同时也能够减小编码视频的质量波动,而编码复杂度仅提升1.37%。
3.针对H.265/HEVC 视频编码器的速率控制模块,提出了一种考虑视频内容特性以及目标速率大小的帧级比特分配算法。
首先,本文通过分析最优比特分配的优化问题得出了影响帧级比特分配结果的两个因素:视频内容特性与目标速率大小;其次,在分析帧内与帧间编码过程的基础上,提出了一种用于反映视频内容特性的指标;最后,本文分析了视频内容特性、目标速率大小以及分配权值三者之间的关系,并在此基础上建立了考虑视频内容特性和目标速率大小的帧级比特分配模型,用于实现帧级比特分配。
实验结果表明,与HM现有的比特分配算法相比,本文提出算法能够获得5.23%的编码性能提升,同时也能减小不同GOP之间的码率波动,而编码复杂度仅增加0.41%。