基于H_264的数字视频压缩图像质量的评价
- 格式:pdf
- 大小:401.15 KB
- 文档页数:3
摄像头编码方式在如今网络普及的时代,越来越多的摄像头被应用在各种场合中。
而一个好的视频监控系统不仅要求摄像头本身画面的清晰度,更需要考虑数据的传输和存储问题。
其中编码方式就显得尤为关键。
在摄像头传输数据过程中,首先需要将图像以数字信号的形式进行采样和量化,即编码。
编码方式的不同会影响画面质量、数据大小和传输速度,因此在选择摄像头和监控系统时需要根据实际情况进行选择。
常见的编码方式有MJPEG、H.264、H.265等,下面将分别介绍它们的特点。
MJPEG(Motion JPEG)MJPEG是一种基于JPEG格式的视频编码方式,它采用每帧图像单独压缩的方式,画质相对较好,适用于在带宽充足的局域网中传输。
但是,由于每帧图像单独压缩,因此数据大小会比较大,传输速度相对较慢。
对于需要实时监控的场合来说,MJPEG不是很理想的选择。
但是,对于需要高画质图像或需要识别细节的应用场合来说,MJPEG则是一个较好的选择。
H.264H.264是目前应用最为广泛的视频编码标准之一。
它采用先预测再压缩的方式,即通过预测下一帧图像的内容来减少数据的冗余度,从而降低数据的大小。
同时,它还支持多速率编码,可以根据不同带宽和画质要求进行选择。
因此,H.264适用于带宽较低的互联网环境中传输数据。
在实时视频监控场景中,H.264具有较高的压缩比和传输速度,而且能够在保证画质的前提下保证数据的大小。
因此,大多数监控设备和应用都采用了H.264编码方式。
H.265H.265是近年来新推出的一种视频编码标准,它在H.264的基础上进行了优化。
同样采用先预测再压缩的方式,H.265可以在保证画质的同时,将数据大小进一步降低。
因此,H.265相对H.264来说,可以在同样带宽下使用更高的画质,或者在同样画质下使用更低的数据大小。
它适用于带宽较低的3G/4G网络、网络流媒体等应用场合。
目前H.265的应用还比较少,主要原因在于它需要更高的算力和带宽,而且相对H.264来说兼容性较差。
H.264标准的特点及应用随着人类精神需求和空间需求的提升,人们不再满足面对面的语言交流,空间距离的增加导致人们面对面的语言交流变得越来越少,人们更需要在时空中交流与交往。
当传统的交流方式难以实现时,更需要视觉、感观以及信息交流。
正因为如此,促进了卫星通信、微波通信、有线/无线传输技术的发展,也推动信息压缩技术和宽带传输技术,同时推动了安防业的迅猛发展。
视频信息传输和视频通讯的猛增,给视频压缩技术带来了很大挑战。
无论是互联网还是无线网络,都需要一种新型的压缩算法,新算法要求高压缩比,且能适应不同的网络环境。
以较小的失真、较高的压缩比、更小的花费、较低的码率在信道中传递视频,进行多媒体通信是今后视频压缩技术研究的一个方向。
H.264,又称MPEG-4part10,也称AVC(AdvancedVideoCoding),是一个数字视频压缩标准,由VCEG(ITU-TVideoCodingExpertsGroup)和MPEG(ISO/IECMovingPictureExpertsGroup)联合组成的JVT(JointVideoTeam)于2003年3月正式发布[1,2]。
H.264标准的主要目标就是在同等保真条件下,提高编码效率。
这是一对矛盾,既然要求图像不失真,则图像传输的比特数就大,在网络带宽一定的情况下,图像信号传输的速度就快,因此,只有提高编码效率才能实现。
H.264的源起在以往众多的视频编码算法中,被广泛认可并应用于实际的是ISO/IEC制定的MPEG-X和ITU-T制定的H.26x两大系列视频编码国际标准。
H.261是早期的编码标准,主要是规范ISDN网上的会议电视和可视对讲。
它采用的是可减少时间冗余的帧间预测和减少空间冗余的DCT变换的混合编码方法,以及ISDN信道匹配,其输出码率是P×64kbit/s。
P较小时,传输清晰度不太高的图像;P较大时,可以传输清晰度较好的会议电视图像。
新一代的视频编码标准H.264文 / 摘要:H.264是国际电联最新通过的新一代甚低码率视频编码标准。
本文旨在阐述H.264视频编码标准的关键技术,并介绍了其在视频会议中的应用。
关键词:H.264 视频编码多帧预测视频会议一、引言ITU-T和ISO/IEC JTC1是目前国际上制定视频编码标准的正式组织,ITU-T的标准称之为建议,并命名为H.26x 系列,比如H.261、H.263等。
ISO/IEC的标准称为MPEG-x,比如MPEG-1、MPEG-2、MPEG-4等。
H.26x系列标准主要用于实时视频通信,比如视频会议、可视电话等;MPEG系列标准主要用于视频存储(DVD) 、视频广播和视频流媒体(如基于Internet、 DSL的视频,无线视频等等)。
除了联合开发H.262/MPEG-2标准外,大多数情况下,这两个组织独立制定相关标准。
自1997年,ITU-T VCEG与ISO/IEC MPEG再次合作,成立了Joint Video Team (JVT),致力于开发新一代的视频编码标准H.264。
1998年1月,开始草案征集;1999年9月,完成了第一个草案;2001年5月,制定了其测试模式TML-8;2002年6月,JVT第5次会议通过了H.264的FCD板;2002年12月,ITU-T 在日本的会议上正式通过了H.264标准,并于2003年5月正式公布了该标准。
国际电信联盟将该系统命名为H.264/AVC,国际标准化组织和国际电工委员会将其称为14496-10/MPEG-4 AVC。
二、H.264标准概述H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。
但它采用“回归基本”的简洁设计,不用众多的选项,获得比H.263++好得多的压缩性能;加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同解析度以及不同传输(存储)场合的需求。
H.264编码技术简介摘要:本文介绍了H.264编码基本概况,技术特点,并与其他标准进行了比较。
简单介绍了H.264视频编码标准的几个关键技术,并针对目前H.264在监控领域的应用做了讲解。
目录摘要: (1)一.引言 (2)二. H.264视频编码基本概况 (2)2.1 什么是H.264编码? (2)2.2 720P H.264高清成市场主流 (2)2.3 H.264 视频编码标准状况 (2)2.4 H.264 视频编码技术先进性 (3)2.5 H.264的核心竞争力是什么? (5)2.6 Main Profile (6)三、H.264与其他标准的比较 (6)3.1H.264与其他标准的比较 (6)3.2 H.264的技术特点 (8)3.2.1 分层设计 (8)3.2.2 高精度、多模式运动设计 (8)3.2.3 帧内预测功能 (8)3.2.4 4×4块的整数变换 (8)3.2.5 统一的VLC (8)3.3 H.264的主要特点 (9)四、关键技术 (10)五、H.264在监控的应用 (12)5.1 TOYA SDVR 7IV 系统简介 (12)5.2 TOYA SDVR 7IV 系统主要特点 (12)5.3 主要技术规格 (13)5.4 系统功能 (13)5.5 TOYA SDVR 7IV系统应用 (13)六、H.264的总体优缺点 (14)七、小结 (15)八、参考文献 (16)一.引言随着社会的不断进步和多媒体信息技术的发展,人们对信息的需求越来越丰富,方便、快捷、灵活地通过语音、数据、图像与视频等方式进行多媒体通信已成不可或缺的工具。
其中视觉信息给人们直观、生动的形象,因此图像与视频的传输更受到广泛的关注。
然而,视频数据具有庞大的数据量,以普通的25帧每秒,CIF格式(分辨率为352×288)的视频图像为例,一秒钟的原始视频数据速率高达3.8M字节。
不对视频信号进行压缩根本无法实时传输如此庞大的数据量,因此,视频压缩技术成为研究热点。
h.264视频压缩标准
H.264视频压缩标准。
H.264视频压缩标准,又称为MPEG-4 AVC(Advanced Video Coding),是一
种先进的视频压缩标准,它可以提供高质量的视频压缩,并在网络传输和存储中占用较少的带宽和空间。
H.264标准已经成为了广泛应用于数字视频广播、高清DVD、蓝光光盘、视频会议等领域的主流压缩标准。
H.264视频压缩标准的特点之一是它具有更高的压缩效率。
相比于之前的MPEG-2标准,H.264可以将视频压缩至更小的尺寸,而且在保持高质量的同时,
大大降低了存储和传输成本。
这使得H.264标准成为了数字视频广播和高清视频存储的首选。
此外,H.264标准还具有更好的网络适应性。
它可以根据不同的网络带宽和传
输条件,自动调整视频的压缩比率和质量,以保证视频在不同网络环境下的流畅播放和高清画质。
这使得H.264标准在视频会议、网络直播等领域得到了广泛的应用。
另外,H.264标准还支持多种视频分辨率和帧率,可以适应不同的显示设备和
播放环境。
它还支持多种视频编码参数的调整,可以根据具体应用场景进行灵活配置,以满足不同的需求。
总的来说,H.264视频压缩标准是一种高效、灵活、高质量的视频压缩技术,
它已经成为了数字视频领域的主流标准,为用户带来了更好的观看体验,为视频行业带来了更高的效率和更低的成本。
随着数字视频技术的不断发展,H.264标准仍
然会在未来的一段时间内继续发挥重要作用。
数字视频压缩技术H264详解一个基于分组方式的接口,打包和相应的信令属于NAL的一部分。
这样,高编码效率和网络友好性的任务分别由VCL和NAL来完成。
VCL层包括基于块的运动补偿混合编码和一些新特性。
与前面的视频编码标准一样,H.264没有把前处理和后处理等功能包括在草案中,这样可以增加标准的灵活性。
NAL负责使用下层网络的分段格式来封装数据,包括组帧、逻辑信道的信令、定时信息的利用或序列结束信号等。
例如,NAL支持视频在电路交换信道上的传输格式,支持视频在Internet上利用RTP/UDP/IP传输的格式。
NAL包括自己的头部信息、段结构信息和实际载荷信息,即上层的VCL数据。
(如果采用数据分割技术,数据可能由几个部分组成)。
(2)高精度、多模式运动估计H.264支持1/4或1/8像素精度的运动矢量。
在1/4像素精度时可使用6抽头滤波器来减少高频噪声,对于1/8像素精度的运动矢量,可使用更为复杂的8抽头的滤波器。
在进行运动估计时,编码器还可选择“增强”内插滤波器来提高预测的效果。
在H.264的运动预测中,一个宏块(MB)可以按图2被分为不同的子块,形成7种不同模式的块尺寸。
这种多模式的灵活和细致的划分,更切合图像中实际运动物体的形状,大大提高了运动估计的精确程度。
在这种方式下,在每个宏块中可以包含有1、2、4、8或16个运动矢量。
在H.264中,允许编码器使用多于一帧的先前帧用于运动估计,这就是所谓的多帧参考技术。
例如2帧或3帧刚刚编码好的参考帧,编码器将选择对每个目标宏块能给出更好的预测帧,并为每一宏块指示是哪一帧被用于预测。
(3)4某4块的整数变换H.264与先前的标准相似,对残差采用基于块的变换编码,但变换是整数操作而不是实数运算,其过程和DCT基本相似。
这种方法的优点在于:在编码器中和解码器中允许精度相同的变换和反变换,便于使用简单的定点运算方式。
也就是说,这里没有“反变换误差”。
变换的单位是4某4块,而不是以往常用的8某8块。
视频编码标准H.264/AVCH.264/AVC 是ITU-T VCEG 和ISO/IEC MPEG 共同开发的视频处理标准,ITU-T作为标准建议H.264,ISO/IEC作为国际标准14496-10(MPEG-4 第10部分)高级视频编码(AVC)。
MPEG-2视频编码标准(又称为ITU-T H.262[2])已有10年的历史了,由MPEG-1扩充而来,支持隔行扫描。
使用十分广泛,几乎用于所有的数字电视系统,适合标清和高清电视,适合各种媒体传输,包括卫星、有线、地面等,都能有效地传输。
然而,类似xDSL、UMTS(通用移动系统)技术只能提供较小的传输速率,甚至DVB-T,也没有足够的频段可用,提供的节目很有限,随着高清电视的引入,迫切需要高压缩比技术的出现。
应用于电信的视频编码经历了ITUT H.261、H.262(MPEG-2)、H.263、H.263+、H.263++,提供的服务从ISDN和T1/E1到PSTN、移动无线网和LAN/INTERNET网。
最近MPEG-4 第二部分进入了实用领域,提供了视频形状编码,目标是与MPEG-2一样获得广泛的数字电视应用。
1998年,视频编码专家组(VCEG-ITU-T SG16 Q.6)启动了H.26L工程,旨在研制出新的压缩标准,与以前的任何标准相比,效率要提高一倍,同时具有简单、直观的视频编码技术,网络友好的视频描述,适合交互和非交互式应用(广播、存储、流煤体)。
2001年12月,VCEG和运动图像专家组(MPEG-ISO/IEC JTC 1/SC 29/WG 11)组成了联合视频组(JVT,Joint Video Team),研究新的编码标准H.264/AVC,该标准于2003年3月正式获得批准。
视频的各种应用必须通过各种网络传送,这要求一个好的视频方案能处理各种应用和网络接口。
H.2 64/AVC为了解决这个问题,提供了很多灵活性和客户化特性。
新一代视频编码主客观评价结果一致性探究孟昭旭1 朱宏宣2(1.北京电影学院中国电影高新技术研究院,北京100088)(2.北京电影学院影视技术系,北京100088)ʌ摘要ɔ本文首先介绍了新一代视频编码V V C ㊁A V 1和A V S 3的特点以及常用的视频质量主客观评价方法,然后使用P S N R ㊁S S I M 和基于机器学习的VMA F 指标,对新一代视频编码进行客观指标评价,最后进行主观评价实验得出主观质量分,分析客观指标评价结果和主观评价结果的一致性㊂ʌ关键词ɔ视频编码 主观评价 VMA F H .266 A V S 3 A V 1ʌ中图分类号ɔJ 911引言近年来,电影㊁电视㊁互联网视频尤其是用户生产内容快速增长,视频技术指标不断提升,网络流媒体平台开始支持4K ㊁8K ㊁H D R 片源,视频数据量呈指数式上升,而存储技术的发展和存储媒介容量的增长却远远滞后,因此,更高的压缩率成为了存储海量视频内容的必然选择㊂在这种情况下,新一代视频编码V V C ㊁A V 1和A V S 3应运而生,其压缩效率相较于目前广泛使用的视频编码A V C 和H E V C 有较大的提升㊂为了量化新一代视频编码的压缩效果,需要对画面质量进行评价,其方法可以分为主观评价和客观指标评价两种方式㊂主观评价是衡量视频质量最准确的方法,因为人对视频质量的感知是主观的㊂客观指标评价快速便捷,只要确定了客观指标的计算公式,即可自动化批量评价视频,但是客观指标评价结果与主观评价结果并不完全相符,存在一定的差异㊂近年来,出现了一些更符合人类视觉特征的客观评价指标,例如VMA F ,其评价结果更接近主观结果㊂针对主客观评价结果差异的问题,本文在应用新一代视频编码进行压缩测试的基础上,对各视频编码在不同码率下的压缩画面进行主客观评价结果的对比实验,探究客观指标评价结果的准确性㊂本次测试共涉及五种视频编码:A V C (H .264)㊁H E V C (H .265)㊁V V C (H .266)㊁A V 1㊁A V S 3㊂其中,A V C 仍是目前使用最广泛的视频编码,H E V C 是当下性能表现优异,已经得到成熟应用的视频编码㊂因此,选取A V C 和H E V C 作为对照组,新一代视频编码V V C ㊁A V 1和A V S 3作为实验组㊂2测试使用的五种视频编码简介2.1应用最广泛的视频编码系列 H .26x 系列A V C ,即A d v a n c e d V i d e o C o d i n g,高级视频编码,也被称作I T U-T H .264或M P E G-4P a r t10,由联合视频组(J V T )在2003年确立第一版标准㊂[1]A V C 编码与之前的编码相比,压缩率大大提ʌ作者信息ɔ孟昭旭(1992-),男,北京电影学院中国电影高新技术研究院硕士研究生在读,主要研究方向:数字电影技术;朱宏宣(1981-),男,北京电影学院中国电影高新技术研究院副研究员,主要研究方向:数字电影技术㊂21 现代电影技术N o .6/2021 A D V A N C E D M O T I O N P I C T U R E T E C H N O L O G Y视听科技教研升,同时编解码复杂度控制得较好,编解码速度较快,这使得A V C 编码迅速普及㊂由于其广泛的平台支持性,截至2020年,A V C 编码依然是视频行业中使用率最高的编码㊂[2]H E V C ,即H i g h E f f i c i e n c y V i d e o C o d i n g,高效视频编码,也被称作I T U-T H .265或M P E G-H P a r t 2,由视频编码联合协作组(J C T-V C )于2013年标准化㊂H E V C 在同等视频质量下的压缩率比A V C 提高25~50%,是当前性能较强的视频编码㊂但是,与A V C 相比,H E V C 的授权费不仅更贵,而且混乱,与H E V C 相关的专利由多个专利池负责收费[3],这也导致H E V C 至今为止都没能像A V C 编码一样普及㊂V V C ,即V e r s a t i l e V i d e o C o d e c,多功能视频编码,也被称为I T U-T H .266或M P E G-I P a r t3,由联合视频专家组(J V E T )于2020年7月发布了第一版标准㊂V V C 在相同的视频感知质量下可以比H E V C 提高50%的压缩率㊂[4]V V C 在制定的过程中充分地考虑了视频的高技术指标趋势并进行了针对性的优化,如8K 高分辨率㊁12b i t 高位深㊁P Q 和H L G 高动态范围曲线㊁R e c .2020宽色域㊁全景视频㊁3D 视频等㊂因此对于高技术指标的视频,V V C 能表现出更优异的压缩性能㊂[5]2.2开源免费的编码 A V 1A V 1视频编码是由开放媒体联盟(A l l i a n c e f o rO pe n M e d i a )开发的开源㊁免费的视频编码,于2018年发布了第一版标准㊂[6]开放媒体联盟是一个非盈利组织,成员包括谷歌㊁微软㊁苹果㊁英伟达等互联网和芯片企业,旨在开发无版权的音视频编码标准,以满足网络视频压缩和传输的开放标准需求㊂A V 1编码继承于谷歌的开源免费编码V P 8和V P 9,与它们相比,A V 1具有更高的压缩率㊂由于其开源免费,性能优良,A V 1正在取得越来越广泛的应用㊂2.3我国自主研发的音视频编码标准 A V S 3A V S ,即A u d i o V i d e o c o d i n g St a n d a r d ,音视频编码标准,由我国的数字音视频编解码技术标准工作组负责开发制定㊂工作组制定的A V S 1㊁A V S 2两代编码,已分别于2006年和2016年被颁布为国家标准㊂[7]目前A V S 标准广泛应用于我国的广播电视领域,正在进军互联网视频领域和监控领域㊂2019年3月,数字音视频编解码技术标准工作组完成了A V S 3基准档草案,性能超过A V S 2编码30%左右㊂[8]目前,由北京大学深圳研究生院团队开发的A V S 3编解码器 天枢 u A V S 3e 和天璇 u A V S 3d 已经开源发布㊂其中, 天枢 编码速度与A V S 3标准参考软件相比有数十倍的提升㊂[9]3视频质量评价方法3.1主观评价 M O SMO S ,即M e a n O pi n i o n S c o r e ,平均意见分,其分数范围一般是1~5分㊂由于MO S 评判的环境不一,比如显示器大小㊁观看距离㊁环境亮度等不同,所以每个MO S 测量结果都需要标注测试时的具体环境参数,同时不建议直接使用不同测试环境下得到的MO S 分进行横向对比㊂[10]由于需要人工参与并标准化测试场景,所以进行MO S 评价费时费力,不方便大规模部署,应用范围受限㊂3.2基础客观评价指标 P S N RP S N R ,即P e a k S i gn a l -t o -N o i s e R a t i o ,峰值信噪比,指的是信号的最大可能功率与噪声功率之比㊂P S N R 公式如(1)所示,单位是d B :P S N R=10l o g 10(MA X2M S E)(1)式(1)中:MA X=2n-1,n 为图像的位深度㊂M S E 为均方误差,即原始图像与压缩图像每个像素误差的平方和的平均值㊂P S N R 是用来评估有损压缩质量的最常用的指标之一㊂一般情况下,P S N R 的值越高,压缩画面的质量越好㊂如果对8b i t 位深的图像进行压缩,P S N R 的值一般在30d B 至50d B 之间;如果是无损压缩,那么M S E 为0,P S N R 的值为无限大㊂[11]P S N R 的局限性在于只考虑了每个像素之间的绝对差别,但人眼并不是逐个像素去观看画面的,因此并不符合人眼的视觉感知特点,这意味着即使是相同P S N R 的两段压缩视频,也有可能呈现出不同的主观质量㊂31 现代电影技术N o .6/2021 A D V A N C E D M O T I O N P I C T U R E T E C H N O L O G Y视听科技教研3.3考虑人类视觉特点的客观评价指标 S S I MS S I M ,即S t r u c t u r a l S i m i l a r i t yI n d e x M e a s u r e ,结构相似性指数㊂它由德州奥斯汀大学的Z h o uW a n g 等人于2004年开发㊂S S I M 指标设计的初衷是提升对图像主观质量预测的准确度㊂[12]S S I M 主要评价人类可感知到的图像差别㊂给定图像x 和图像y ,S S I M 的公式如下:S S I M (x ,y )=l (x ,y )αc (x ,y )βs (x,y)γ(2)式(2)中:lx ,y =2μx μy +c 1μ2x +μ2y +c 1,c x ,y =2σx σy +c 2σ2x +σ2y+c 2,s x ,y =σx y +c 3σx σy +c 3㊂u x 和u y 是平均值,σx 和σy 是标准差,σx y 是协方差,c 1=(k 1L )2,c 2=(k 2L )2,c 3=c 2/2,L=2n-1,n 为图像的位深度,默认取α=β=γ=1,k 1=0.01,k 2=0.03㊂S S I M 的值在0和1之间,一般情况下,其值越高,压缩画面的质量越好㊂由于考虑到了画面中亮度㊁对比度和结构特征,S S I M 在一定程度上更符合人类的主观感知㊂3.4基于机器学习的客观评价指标 V M A FVMA F ,即V i d e o M u l t i m e t h o d A s s e s s m e n tF u s i o n ,视频多方法评估融合,是由N e t f l i x 公司开发的一种基于机器学习的视频客观评价指标㊂N e t -f l i x 为了解决海量流媒体的质量控制问题,开发了VMA F 指标,其预测视频主观质量的准确度高于P S N R 和S S I M 等传统指标㊂[13]VMA F 的原理是提取视频的空域和时域特征,特征提取过程中会考虑到人类视觉特点如对比度掩蔽效应和亮度掩蔽效应㊂然后召集测试者在特定测试环境下对视频质量进行主观评价得到MO S 分㊂最后通过支持向量机(S VM )将这些特征值和MO S 分数拟合得到VMA F 模型㊂[14]VMA F 分值范围在0到100之间,分值越高,代表压缩画面的质量越好,一般来说,75分以上有较好的观感㊂VMA F 依然存在局限性㊂对于不同观看媒介上的同一段视频,比如手机和电视,其主观感受是不同的,所以针对不同的观看媒介需要训练不同的VMA F 模型,比较繁琐㊂另外,VMA F 和P S N R ㊁S S I M 一样,是一种完全参考评价指标(F u l l -r e f e r -e n c e ),VMA F 分数是相对于原始参考视频而言的,不代表绝对质量,即VMA F 分数只适用于对比同一视频源所产生的压缩视频的质量,而不适用于横向对比不同视频源所产生的压缩视频的质量㊂[15]4主客观评价结果一致性测试实验实验主要分为客观测试和主观测试两部分㊂5种视频编码均参与P S N R ㊁S S I M ㊁VMA F 客观指标测试,但是由于A V C 编码在实验所要求的低码率下必然存在明显瑕疵和画面崩坏,不具备主观测试意义,因此A V C 编码不参与主观测试㊂4.1测试参考序列的准备表1 五段测试参考序列的信息参考序列序列内容风景特写肖像运动物体运动人物镜头数75665时长25s 20s 25s 25s 25s图1 测试序列截图:依次为风景㊁特写㊁肖像㊁运动物体㊁运动人物测试参考序列来自于各品牌摄影机官网示例素材和网络无版权素材,均为摄影机R AW 格式文件㊂选取有代表性的片段导入达芬奇软件中进行剪辑和处理,将内容相似的若干个镜头组合为一段测试参考序列,最终组合成5段测试参考序列:风景㊁特写㊁肖像㊁运动物体㊁运动人物,以求尽可能模拟视频中可能出现的各种内容㊂最终,将这5段参考序列输出为25帧率㊁1920ˑ1080分辨率㊁8b i t 位深㊁S T 1886E O T F 和R e c .709色域的I 420像素格41 现代电影技术N o .6/2021 A D V A N C E D M O T I O N P I C T U R E T E C H N O L O G Y视听科技教研式的无压缩Y U V 文件,作为最高质量源参考文件㊂4.2测试参考序列的编解码将5段参考序列的Y U V 源文件分别使用5种编码压缩至0.1㊁0.2㊁0.5㊁1㊁2㊁5M b p s 6档码率,得到150个压缩视频文件㊂接着用相应的解码器解码这些文件,得到150个解码重建后的Y U V文件㊂上述过程中使用符合对应编码标准的开源编解码器进行编解码㊂A V C ㊁H E V C ㊁V V C ㊁A V 1㊁A V S 3使用的编解码器分别为x 264㊁x 265㊁V V e n C /V V d e C ㊁a o m -a v 1㊁u A V S 3e /u A V S 3d ㊂其中x 264㊁x 265编解码器可直接通过F F m p e g 调用,新一代视频编码的编解码器V V e n C /V V d e C ㊁a o m -a v 1㊁u A V S 3e /u A V S 3d 可下载源码并编译后使用㊂表2 编码测试片段使用的命令示例功能命令编码V V C v v e n c a p p -c c o n f i g .c f g -i r e f e r e n c e .yu v -s 1920x 1080-r 25--f o r m a t y u v 420-b o u t pu t .b i n 编码A V S 3u a v s 3e -i r e f e r e n c e .y u v -w 1920-h 1080--i n p u t _b i t _d e p t h 8--f p s _n u m 25--f p s _d e n 1--r c _t y p e 2--t b r 1000-o o u t pu t .a v s 34.3客观评价过程客观指标的计算是通过逐一对比测试参考序列的源Y U V 文件和各个码率解码重建后的Y U V 文件完成的㊂其中,P S N R 和S S I M 指标的计算可以通过调用F F m p e g 中的C o m pl e x F i l t e r 模块进行,VMA F 评价指标已开源,可下载并编译后使用,本次测试中使用的VMA F 模型版本为0.6.1㊂图2 客观测试数据(局部)4.4主观评价过程主观测试使用的显示设备为O L E D 电视,电视机对角线约127厘米,分辨率3840ˑ2160,亮度100尼特,E O T F 设置为S T 1886,色域设置为R e c 709㊂待测试画面分辨率为1920ˑ1080,恰好能在电视机上以像素点一一对应的方式显示4组画面㊂将A V 1㊁A V S 3㊁V V C ㊁H E V C 编码压缩重建的视频随机分配到画面左上㊁右上㊁左下㊁右下4个不同位置,对5段测试序列分别使用5种不同的分配顺序,并将分配顺序记录下来㊂邀请10位测试者,每位测试者单独进行测试㊂测试者采用坐姿,距离电视机1.5米,水平视角约47度㊂每位测试者需观看风景㊁特写㊁肖像㊁运动物体㊁运动人物5段测试序列,每段测试序列有6种码率,共30段视频,每段视频的左上㊁右上㊁左下㊁右下4个位置分别对应某一种编码㊂测试者每观看完某一测试序列的某一码率后,立刻对4个不同位置的画面进行主观质量分(1~5)评价,并将结果记录在表格中,记录完成后再观看下一段视频,这一过程重复进行直至观看完30段视频㊂测试者在测试时并不清楚不同画面位置所对应的编码,因此更能保证测试结果的准确性㊂测试结束后收集10张主观质量评分表㊂根据事先记录的画面分配顺序,将表格中左上㊁右上㊁左下㊁右下四个画面位置还原为对应的视频编码,然后计算每种编码在每段测试序列的每种码率下的得分,最后将得分归一化至0~100㊂图3 主观测试环境和主观评测表(局部)4.5实验结果和分析由于篇幅所限,不再单独展示每段测试序列的结果,而是取5段测试序列结果的平均值作为最终的客观指标测试结果和主观质量评价结果㊂从图4可以看出,主观和客观评测均显示在任何压缩码率下,新一代视频编码的画面质量都优于H E V C ,更明显优于A V C ,而且码率越低这种优势越明显㊂在小于0.2M b ps 的超低码率下,A V 1㊁A V S 3㊁V V C 编码的客观得分虽然稍有差距,但主51 现代电影技术N o .6/2021 A D V A N C E D M O T I O N P I C T U R E T E C H N O L O G Y视听科技教研观感受上三种编码画面均有可分辨的瑕疵,只是瑕疵具有不同的特点;当码率升至1M b ps 以上时,A V 1㊁A V S 3㊁V V C 压缩编码之间的差距就变得极小,在主观上几乎无法区分,此时只能分辨出H E V C 编码的画质更差一些;如果画面中运动内容较少,比如在观看肖像㊁风景测试序列时,就更难分出差别㊂值得一提的是,当画面中存在剧烈运动且在0.1M b ps 的极低码率下,H E V C 出现了画面崩坏的现象,A V 1㊁A V S 3㊁V V C 虽然也会观察到明显的块状效应和模糊,但至少保证了画面质量在 可观看 的范围内,这也更加体现了新一代压缩编码的优势,在超低码率下能保证更好的观感㊂图4五段测试序列测试结果平均值图5 P S N R ㊁S S I M ㊁VMA F 与主观评价分的关系对P S N R ㊁S S I M 测试结果进行归一化处理,得到3种客观指标测试结果与主观评价结果关系的散点图㊂如果客观指标测试结果与主观评价结果完全一致,那么所有的点都会落在直线y =x 上㊂在此规定指标D ,其值为散点图中的每个点到直线y =x 的距离的平方和㊂D 值越小,说明客观评价与主观评价的一致性越高㊂经计算,P S N R ㊁S S I M ㊁VMA F 的D 值分别为725.8㊁616.1㊁195.6㊂由此得出在本次实验中VMA F 指标的评测结果与主观评价结果的一致性程度更高,优于P S N R 和S S I M ,能够在一定程度上更好地预测视频的主观质量㊂5结语本文应用新一代视频编码进行视频压缩,并在此基础上对压缩画面进行主客观评价,探究评价结果的一致性㊂本次实验过程中也有可改进之处,例如在主观实验中如何布局主观评分表才能更方便测试者快速进行打分,如何设置测试序列时长和镜头切换速度才能使测试者既有时间充分记忆对比画面内容又能保证其注意力不会下降㊂在今后的实验中,将会基于测试者的反馈进行改进㊂新一代视频编码与现有视频编码相比,压缩效率和质量得到了明显提升,主观和客观评测都印证了这一点㊂相信在不久的将来,新一代视频编码会在电影㊁电视㊁互联网视频中得到广泛的应用,届时我们就能以更小的存储代价和更窄的带宽需求观看到质量更高的画面内容㊂另外,随着VMA F 等基于人类视觉特征和机器学习的新型客观指标的完善和推广,在批量控制视频质量㊁权衡码率和画质的关系时,客观评价指标将成为越来越有力的工具㊂参考文献[1]I T U-T .R e c o mm e n d a t i o n I T U-T H .264.A d v a n c e d v i d -e o c o d i n g f o r g e n e r i c a u d i o v i s u a l s e r v i c e s [S ].h t t ps ʒ//w w w .i t u .i n t /r e c /T -R E C -H .264-201906-I /e n ,2019-06.[2]B i t m o v i n .2020V i d e o D e v e l o p e r R e p o r t [E B /O L ].h t t ps ʒ//g o .b i t m o v i n .c o m /v i d e o -d e v e l o p e r -r e po r t -2020,2020.[3]A d r i a n P e n n i n gt o n .C O D E C WA R S :T H E B A T T L E B E -TW E E N H E V C A N D A V 1[E B /O L ].h t t p sʒ//w w w .i b c .o r g/t r e n d s /c o d e c -w a r s -t h e -b a t t l e -b e t w e e n -h e v c -a n d -a v 1/2710.a r t i c l e,2018-03-07.[4]F r a u n h o f e r HH I .F r a u n h o f e r HH I i s p r o u d t o p r e s e n t t h en e w s t a t e -o f -t h e -a r t i n g l o b a l v i d e o c o d i n g :H .266/V V C b r i n gs v i d e o61 现代电影技术N o .6/2021 A D V A N C E D M O T I O N P I C T U R E T E C H N O L O G Y视听科技教研t r a n s m i s s i o n t o n e w s p e e d [E B /O L ].h t t p s ʒ//n e w s l e t t e r .f r a u n h o f e r .d e /-v i e w o n l i n e 2/17386/465/11/14S H c B T t /V 44R E L L Z B p/1,2020-07-06.[5]I T U-T .R e c o mm e n d a t i o n I T U-T H .266.V e r s a t i l e v i d e oc od i n g [S ].h t t ps ʒ//w w w .i t u .i n t /r e c /T -R E C -H .266-202008-P ,2019-08-29.[6]A l l i a n c e f o r O p e n M e d i a .T h e A l l i a n c e f o r O pe n M e d i a K i c k s t a r t s V i d e o I n n o v a t i o n E r a w i t h A V 1R e l e a s e [E B /O L ].h t t pʒ//a o m e d i a .o r g /p r e s s %20r e l e a s e s /t h e -a l l i a n c e -f o r -o pe n -m e d i a -k i c k s t a r -t s -v i d e o -i n n o v a t i o n -e r a -w i t h -a v 1-r e l e a s e ,2018-03.[7]A u d i o V i d e o c o d i n g S t a n d a r d W o r k g r o u p of C h i n a .A V S 标准进展[E B /O L ].h t t p ʒ//w w w .a v s .o rg .c n /a v s S t a n d a r d .a s p.[8]A u d i o V i d e o c o d i n g S t a n d a r d W o r k g r o u p of C h i n a .A V S 工作组第68次会议在青岛顺利召开[E B /O L ].h t t p ʒ//w w w .a v s .o r g .c n /n e w s /r e a d n e w s .a s p?i d =175,2019-03-10.[9]A u d i o V i d e o c o d i n g S t a n d a r d W o r k g r o u p of C h i n a .A V S 3开源编码器 天枢 [E B /O L ].h t t p s ʒ//e c o s y s t e m .a v s .o rg .c n /a v s 3开源编码器天枢,2020.[10]I T U-T .R e c o mm e n d a t i o n I T U-T P .800.1:M e a n o pi n -i o n s c o r e (MO S )t e r m i n o l o g y [S ].h t t p sʒ//w w w .i t u .i n t /r e c /T -R E C -P .800.1-201607-I /e n ,2016-07-29.[11]T .W e l s t e a d .F r a c t a l a n d W a v e l e t I m a g e C o m pr e s s i o n T e c h n i qu e s [M ].1999-12-10.[12]Z h o u W a n g,A l a n C .B o v i k ,H a m i d R .S h e i k h a n d E e r o P .S i m o n c e l l i .I m a g e Q u a l i t y A s s e s s m e n t :F r o m E r r o r V i s i b i l i t y to S t r u c t u r a l S i m i l a r i t y [J /O L ].I E E E T R A N S A C T I O N S O N I MA G E P R O C E S S I N G ,2004,13(4).[13]Z h i L i ,A n n e A a r o n ,I o a n n i s K a t s a v o u n i d i s ,A n u s h M o o r -t h y a n d M e g h a M a n o h a r a .T o w a r d A P r a c t i c a l P e r c e pt u a l V i d e o Q u a l i t y M e t r i c [E B /O L ].h t t p sʒ//n e t f l i x t e c h b l o g.c o m /t o w a r d -a -p r a c t i c a l -p e r c e p t u a l -v i d e o -q u a l i t y-m e t r i c -653f 208b 9652,2016-06-06.[14]李智.V M A F :未毕之旅[E B /O L ].h t t p s ʒ//c l o u d .t e n c e n t .c o m /d e v e l o pe r /a r t i c l e /1525375,2019-10-23.[15]Z h i L i ,C h r i s t o s B a m p i s ,J u l i e N o v a k ,A n n e A a r o n ,K yl e S w a n s o n ,A n u s h M o o r t h y a n d J a n D e C o c k .VMA F :T h e J o u r n e y C o n t i n u e s [E B /O L ].h t t p sʒ//n e t f l i x t e c h b l o g .c o m /v m a f -t h e -jo u r -n e y-c o n t i n u e s -44b 51e e 9e d 12,2018-10-26.作者贡献声明:孟昭旭:设计论文框架,进行实验,撰写论文,全文文字贡献80%;朱宏宣:改进和修订论文,全文文字贡献20%㊂A n I n v e s t i g a t i o n i n t o C o n s i s t e n c y o f S u b j e c t i v e a n d O b je c t i v e E v a l u a t i o n R e s u l t sf o r N e x t G e n e r a t i o n V i d e o C o d i n gҺMeng Zhaoxu (China Film High -Tech Research Institute,Beijing Film Academy)ҺZhu Hongxuan (Department of Film and Television Technology,Beijing Film Academy)A b s t r a c t :T h i s p a p e r f i r s t l y i n t r o d u c e s t h e c h a r a c t e r i s t i c s o f t h e n e w g e n e r a t i o n v i d e o c o d i n g VV C ,A V 1a n d A V S 3a n d t h e c o m m o n s u b j e c t i v e a n d o b j e c t i v e v i d e o q u a l i t y e v a l u a t i o n m e t h o d s ,t h e n u s e s P S N R ,S S I M a n d V M A F p a r a m e t e r s b a s e d o n m a c h i n e l e a r n i n gt o e v a l u a t e t h e o b j e c t i v e p a r a m e t e r s o f t h e n e w g e n e r a t i o n v i d e o c o d i n g ,a n d f i n a l l y c o n d u c t s s u b j e c t i v e e v a l u a t i o n e x pe r i m e n t s t o o b t a i n t h e s u b j e c t i v e q u a l i t y s c o r e ,a n d a n a l y s e s t h e c o n s i s t e n c y b e t w e e n t h e o b j e c t i v e p a r a m e t e r s e v a l u a t i o n r e s u l t s a n d t h e s u b j e c -t i v e e v a l u a t i o n r e s u l t s .K e y w o r d s :V i d e o e n c o d i n g ;S u b je c t i v e e v a l u a t i o n ;V M A F ;H .266;A V S 3;A V 171 现代电影技术N o .6/2021 A D V A N C E D M O T I O N P I C T U R E T E C H N O L O G Y视听科技教研。
视频压缩标准视频压缩是指将视频文件通过一定的编码和压缩算法,减少其文件大小,以便更方便地存储、传输和播放。
在数字化时代,视频内容的需求越来越大,而视频文件通常会占用较大的存储空间,因此视频压缩成为了一项重要的技术。
在视频压缩中,标准起着至关重要的作用,它们规定了视频压缩的方式、参数和规范,为视频压缩提供了统一的参照。
本文将介绍几种常见的视频压缩标准及其特点。
一、H.264/AVC。
H.264/AVC是一种广泛使用的视频压缩标准,它具有高压缩比和良好的视频质量。
H.264/AVC支持多种分辨率和帧率,适用于不同的应用场景,如网络视频、蓝光光盘、数字电视等。
其压缩效率高,能够在保证视频质量的前提下,显著减小视频文件的大小,节省存储和传输成本。
此外,H.264/AVC还支持多种编码参数和功能,如运动补偿、变换编码、熵编码等,能够更好地适应不同的视频内容和场景。
二、H.265/HEVC。
H.265/HEVC是H.264/AVC的后继标准,它在视频压缩性能上有了显著的提升。
H.265/HEVC采用了更加先进的编码技术,如更高效的运动估计、更灵活的变换块大小、更优化的熵编码等,使得其在相同视频质量下,能够实现更大幅度的压缩。
H.265/HEVC广泛应用于4K、8K超高清视频、虚拟现实等领域,能够满足对高清晰度、高帧率的视频内容的需求。
三、VP9。
VP9是由Google开发的开源视频编解码器,它主要用于网络视频的压缩和传输。
VP9采用了先进的编码技术,如更高效的预测模式、更灵活的变换块大小、更优化的熵编码等,能够实现与H.265/HEVC相当的压缩性能。
与H.265/HEVC相比,VP9具有更好的兼容性和开放性,能够更好地适应不同的平台和设备。
四、AV1。
AV1是由Alliance for Open Media开发的开源视频编解码器,它旨在提供更高效的视频压缩性能。
AV1采用了一系列先进的编码技术,如更高效的预测模式、更灵活的变换块大小、更优化的熵编码等,能够实现比VP9更高的压缩比。
H.264标准简介H.264标准简介H.264/MPEG-4 A VCH.264,或称MPEG-4第十部分,是由ITU-T视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(JVT,Joint Video Team)提出的高度压缩数字视频编解码器标准。
ITU-T的H.264标准和ISO/IEC MPEG-4第10部分(正式名称是ISO/IEC 14496-10)在编解码技术上是相同的,这种编解码技术也被称为A VC,即高级视频编码(Advanced Video Coding)。
该标准第一版的最终草案已于2003年5月完成。
H.264是ITU-T以H.26x系列为名称命名的标准之一,同时A VC是ISO/IEC MPEG一方的称呼。
这个标准通常被称之为H.264/A VC(或者A VC/H.264或者H.264/MPEG-4 A VC或MPEG-4/H.264 A VC)而明确的说明它两方面的开发者。
该标准最早来自于ITU-T的称之为H.26L的项目的开发。
H.26L 这个名称虽然不太常见,但是一直被使用着。
有时候该标准也被称之为“JVT 编解码器”,这是由于该标准是由JVT组织并开发的(作为两个机构合作开发同一个标准的事情并非空前,之前的视频编码标准MPEG-2也是由MPEG和ITU-T两方合作开发的,因此MPEG-2在ITU-T的命名规范中被称之为H.262)。
H.264/A VC项目最初的目标是希望新的编解码器能够在比相对以前的视频标准(比如MPEG-2或者H.263)低很多的位元率下(比如说,一半或者更少)提供很好的视频质量;同时,并不增加很多复杂的编码工具,使得硬件难以实现。
另外一个目标是可适应性,即该编解码器能够在一个很广的范围内使用(比如说,即包含高码率也包含低码率,以及不同的视频分辨率),并且能在各种网络和系统上(比如组播、DVD存储、RTP/IP包网络、ITU-T多媒体电话系统)工作。
第32卷增刊2006年8月 光学技术OPTICAL TECHN IQU E Vol.32Suppl.August 2006文章编号:100221582(2006)S 20110203基于H.264的数字视频压缩图像质量的评价Ξ侯素芳1,芦汉生1,殷玉吉吉(1.北京理工大学信息科学技术学院光电工程系,北京 100081;2.中国计量科学研究院光学处,北京 100013)摘 要:针对H.264数字视频压缩标准,选用双刺激连续质量标度法完成了对受损程度不同的标准自然图像序列的主观评价,开发出了基于Visual C ++的PSNR 客观评价软件,实验表明用PSNR 计算出的客观评价值与主观评价值具有较好的相关性。
关键词:H.264;视频序列;编解码;主观评价;客观评价;相关性中图分类号:TN919.81;TN949.6+1 文献标识码:AThe evaluation of digital video compression image quality on H.264HOU Su 2fang 1,LU Han 2sheng 1,Y I N Y u 2zhe 2(1.Department of Photoeletric Engineering ,School of Information Science and Technology ,Beijing Institute of Technology ,Beijing 100081,China )(2.Department of Optics ,National Institute of Metrology P.R.China 100013,China )Abstract :According to H.264digital video compression standard ,the subjective evaluation is conducted in accordance with Double Stimulus Continuous Quality Scale (DSCQS )method.The three nature image sequences are encoded into bitstreams with different quality.The software of Peak Signal Noise Ratio (PSNR )algorithm based on Visual C ++is completed.The experi 2mental results show PSNR algorithm correlates well with the subjective assessment data.K ey w ords :H.264;sequence ;codec ;subjective evaluation ;objective evaluation ;correlate1 引 言近年来Internet 和无线通信在全球迅猛发展,人类的脚步已经步入了“信息时代”。
信息时代的重要特征是信息的数字化,视频图像信息作为人类的主要信息来源,其数字化后的数据量之大是非常惊人的,巨大的数据量给视频信号的存储、处理、传输、显示等都带来了极大的挑战,因此如何对视频图像信号进行有效的压缩编码一直都是学术界和工业界非常关注的问题。
作为面向电视电话、电视会议的新一代编码方式H.264标准草案[1]已由ITU 和ISO/IEC 的MPEG 组织组成的联合视频小组J V T 于2002年5月共同制定完成。
H.264视频压缩技术是通过去除视频信号中的冗余达到压缩数据的目的,但它们在提供较大压缩比的同时也带来了图像质量的损伤。
由于人眼实际看到的是解压缩以后的图像,因此对重建图像质量的评价是人们非常关心的问题。
针对H.264视频压缩标准[2],完成了对压缩图像质量的主观评价和客观评价,并对主客观评价值的相关性进行了分析。
2 H.264编码框架H.264编解码的根本方法仍然采用了经典混合编码算法的基本结构[3],如图1所示。
图中的虚线框部分为H.264相对于其它编码标准所特有的功能。
解码过程为编码过程的逆过程,如图2所示。
图1 H.264编码器示意图图2 H.264解码器示意图11Ξ收稿日期:2005211230 E 2m ail :housfang @作者简介:侯素芳(19802),女,山西省人,北京理工大学光电工程系硕士研究生,从事数字视频压缩技术及视频质量测量的研究。
3 压缩图像质量的评价方法及实验结果 3.1 主观图像质量评价方法[4]选用双刺激连续质量标度法,依据国际电联ITU B T 2500建议书[1]中关于图像质量主观评价的一般要求对测试序列进行了主观评价。
图3为主观评价系统方框图。
图3 主观评价系统方框图(1)评价用测试序列实验中对3段测试用的标准自然图像序列各自生成了受损程度不同的序列,用以评价图像质量。
图像序列分别为视频格式7203576,4:2:0的Mo 2bilecalendar 序列(较明显的水平、垂直、旋转运动,但速度都不快),3523288的Stefan 序列(场景切换快,运动员快速奔跑),3523288的Akiyo 序列(大面积静止,Akiyo 讲话头部摆动的场景)各250帧。
(2)评价观看员每次实验评价人员20名,分成4组,每组5人(前排2人,后排3人),观看员的视力和色觉正常。
(3)观看条件在实验室环境下进行。
显示器屏幕尺寸:20英寸监视器。
观看距离约为图像高(H )的4—6倍。
(4)测试程序,评分方法及评分标度均按严格双刺激连续质量标度法的一般要求进行。
3.2 主观评价结果表1,2,3分别给出了这3段序列的主观评价实验结果。
逐步改变编码参数量化步长QP 值时,生成了不同程度的受损序列,分别为表中的受损序列1,2,3,4,5。
(压缩比=原始序列大小/受损序列大小)由表1,2,3的主观评价结果可以看出:(1)由于观看员在评价时,并不知道哪一序列是原始序列,所以原始序列的质量等级不是全“优”。
(2)随着量化步长QP 值的增大,压缩比越高,重建序列从受损序列1到受损序列5,其图像质量总体来说是从“优”逐渐过渡到“劣”。
3.3 客观图像质量评价方法完成了用PSNR 模型进行数字图像客观评价表1 Mobilecalendar 序列主观评价结果原始序列受损序列1受损序列2受损序列3受损序列4受损序列5优87.78%83.33%27.78% 5.55%0.0%0.0%良12.22%16.67%72.22%55.56%0.0%0.0%中0.0%0.0%0.0%38.89%55.56%0.0%差0.0%0.0%0.0%0.0%44.44%38.89%劣0.0%0.0%0.0%0.0%0.0%61.11%QP 值025********压缩比1∶111.25∶147.36∶1114.36∶1280.21∶1435.17∶1表2 Stefan 序列主观评价结果原始序列受损序列1受损序列2受损序列3受损序列4受损序列5优81.11%83.33%38.89% 5.56%0.0%0.0%良17.78%16.67%50.0%61.11%0.0%0.0%中 1.11%0.0%11.11%33.33%44.44%0.0%差0.0%0.0%0.0%0.0%50.0%27.78%劣0.0%0.0%0.0%0.0% 5.56%72.22%QP 值025********压缩比1∶18.57∶122.61∶138.57∶166.51∶1132.99∶1表3 Akiyo 序列主观评价结果原始序列受损序列1受损序列2受损序列3受损序列4受损序列5优88.89%83.33%66.67% 5.56%0.0%0.0%良11.11%16.67%33.33%72.22% 5.55%0.0%中0.0%0.0%0.0%22.22%77.78% 5.55%差0.0%0.0%0.0%0.0%16.67%27.78%劣0.0%0.0%0.0%0.0%0.0%66.67%QP 值025********压缩比1∶1115.27∶1336.41∶1634∶11030.25∶11373.67∶1的软件[5]。
PSNR 模型是把原始参考视频和失真视频在每一个对应帧中的每一个对应像素之间进行比较,由于其是在像素级上进行操作,因而对视频时域和空域上的失真非常敏感。
它的计算公式为:PS N R =10lg25521M N∑Mm =1∑Nn =1(Om ,n-r m ,n )2(1)其中M 3N 为图像大小;O m ,n 和r m ,n 分别代表原始图像和失真图像在点(m ,n )处的像素值。
图4为PSNR 模型进行客观评价的程序流程图。
3.4 客观评价结果 表4 Mobilecalendar 序列客观评价结果原始序列受损序列1受损序列2受损序列3受损序列4受损序列5QP 值02535404550PSNR∞36.8630.2027.6825.7624.41表5 Stefan 序列客观评价结果原始序列受损序列1受损序列2受损序列3受损序列4受损序列5QP 值02535404550PSNR∞39.8033.3130.7328.4026.04表6 Akiyo 序列客观评价结果原始序列受损序列1受损序列2受损序列3受损序列4受损序列5QP 值02535404550PSNR∞41.0439.3637.6135.6233.46111增刊侯素芳,等: 基于H.264的数字视频压缩图像质量的评价图4 PSNR 客观评价程序流程图 由表4,5,6的客观评价结果可以看出:随着量化步长QP 值的增大,压缩比越高,PSNR 值越小,重建图像质量越差。
3.5 主观评价值与客观评价值的对应关系表7 3段序列的主观评价与客观评价的对应关系质量等级质量标度M obilecanendar 序列的PSNR 值Stefan 序列的PSNR 值Akiyo 序列的PSNR 值优(差别)不可感觉35—∞38—∞40—∞良可感觉,但不讨厌30—3533—3838—40中稍有讨厌27—3030—3336—38差讨厌25—2727—3034—36劣非常讨厌0—250—270—34 3.6 实验结论(1)对图像序列的主观评分与观看员的年龄有关。
年青观看员的评分普遍比中老年观看员的评分要低(这符合人类的视觉生理机能变化与年龄的关系),所以在进行主观评价时,要选择各年龄段的人作为观看员。
(2)对图像序列的主观评分与观看距离有关。
观看距离为6H 的观看员相对4H 的观看员不易觉察到轻微的质量损伤,所以评分值普遍高一些。