下一代数字视频技术
- 格式:doc
- 大小:97.50 KB
- 文档页数:5
随着5G 大规模商用,全球业界已开启对下一代移动通信技术(6G )的研究探索。
面向2030年及未来,人类社会将进入智能化时代,社会服务均衡化、高端化,社会治理科学化、精准化,社会发展绿色化、节能化将成为未来社会的发展趋势。
从移动互联,到万物互联,再到万物智联,6G 将实现从服务于人、人与物,到支撑智能体高效联接的跃迁,通过人机物智能互联、协同共生,满足经济社会高质量发展需求,服务智慧化生产与生活,推动构建普惠智能的人类社会。
在数学、物理、材料、生物等多类基础学科的创新驱动下,6G 将与先进计算、大图1 6G总体愿景图数据、人工智能、区块链等信息技术交叉融合,实现通信与感知、计算、控制的深度耦合,成为服务生活、赋能生产、绿色发展的基本要素。
6G 将充分利用低中高全频谱资源,实现空天地一体化的全球无缝覆盖,随时随地满足安全可靠的“人机物”无限连接需求。
6G 将提供完全沉浸式交互场景,支持精确的空间互动,满足人类在多重感官、甚至情感和意识层面的联通交互,通信感知和普惠智能不仅提升传统通信能力,也将助力实现真实环境中物理实体的数字化和智能化,极大提升信息通信服务质量。
6G将构建人机物智慧互联、智能体高效互通的新型网络,在大幅提升网络能力的基础上,具备智慧内生、多维感知、数字孪生、安全内生等新功能。
6G将实现物理世界人与人、人与物、物与物的高效智能互联,打造泛在精细、实时可信、有机整合的数字世界,实时精确地反映和预测物理世界的真实状态,助力人类走进人机物智慧互联、虚拟与现实深度融合的全新时代,最终实现“万物智联、数字孪生”的美好愿景。
到2030年,社会服务均衡化、高端化,社会治理科学化、精细化等发展需求将驱动6G为人类社会提供全域覆盖、虚实共生的联接能力;技术产业的突破创新、生产方式的转型升级将驱动6G向跨界协同、细智高精的方向迈进,成为推动经济增长的新引擎;环境可持续发展以及应对重大突发性事件的需求将推动6G构筑起横跨天地的网络连接,实现从人口覆盖走向地理全覆盖。
媒体编码技术是现代通信领域的重要组成部分,它负责将各种形式的媒体,如音频、视频和图像等,转化成数字信号,以便于存储、传输和处理。
随着科技的不断发展,媒体编码技术也在不断演进。
本文将探讨几种常见的媒体编码技术,旨在对其特点与优劣进行了解。
一、音频编码技术音频编码技术是将声音信号转化为数字信号的过程。
在音频编码技术中,最常见的编码方式是脉冲编码调制(PCM)。
PCM将模拟信号转化为一系列数字值,并以固定的采样率和位深度表示。
这种编码方式在音质保真度上表现出色,但是它需要较大的存储空间和传输带宽,且传输过程中容易受到干扰。
为了克服PCM的缺点,媒体编码技术发展出了诸如MP3、AAC等有损压缩的音频编码格式。
这些编码技术通过舍弃一些听觉上难以察觉的信号细节,来降低数据量和提高传输效率。
尽管有损压缩技术降低了音质,但它大大减少了存储和传输的需求,从而成为音频编码领域的重要突破。
二、视频编码技术视频编码技术的核心是将视频信号转化为数字信号,并通过有损压缩算法来减小数据量。
在视频编码技术中,最常见的编码方式是和HEVC。
已经成为了当前主流的视频编码标准,而HEVC则是下一代视频编码技术的代表。
以其出色的压缩性能和高质量的视频传输而闻名。
它能够将视频压缩至原始文件大小的20%至50%,而不会显著降低视频质量。
然而,编码需要较高的计算能力和图像处理速度,对硬件性能要求较高。
而HEVC则在保证视频质量的同时,进一步减小了数据量。
它通过采用更为复杂的编码算法,将压缩率提高了50%以上。
然而,由于HEVC的高算法复杂度,实时编码和解码技术的实现仍然具有一定难度。
三、图像编码技术图像编码技术是将图像信号转化为数字信号的过程。
在图像编码技术中,最常见的编码方式是JPEG和PNG。
JPEG是一种有损压缩的图像编码标准,通过丢弃图像中的一部分信息,来降低数据量和提高传输效率。
JPEG编码适用于色彩较为丰富的图像,但对于包含锯齿状边缘的图像会出现失真。
5G技术在广播电视中的应用与发展随着信息技术的不断发展和创新,5G技术已经逐渐成为人们关注的焦点之一。
5G技术的应用已经开始渗透到各行各业,包括广播电视行业。
本文将介绍5G技术在广播电视中的应用与发展,分析其未来的发展前景和挑战。
1. 5G技术简介5G技术是第五代移动通信技术的简称,它将成为继2G、3G和4G之后的下一代移动通信技术。
5G技术具有高速、低时延、大连接等特点,将为人们的日常生活和各行各业带来巨大的变革和提升。
2. 5G技术在广播电视中的应用(1)高清视频传输5G技术具有超高速的传输速率和低时延的特点,可以实现更高质量的高清视频传输。
传统的广播电视方式局限于有线传输和卫星传输,而5G技术则可以实现无线高清视频传输,为观众提供更清晰、更流畅的观看体验。
(2)虚拟现实和增强现实随着虚拟现实和增强现实技术的发展,广播电视行业也开始探索这两种新型的媒体形式。
而5G技术的低时延特点将为虚拟现实和增强现实的应用提供更加稳定和流畅的传输支持,为用户带来更加身临其境的观看体验。
(3)个性化推荐和服务5G技术的大连接特点将为广播电视行业实现更加精准的用户画像和个性化推荐服务。
通过大数据分析和人工智能技术,广播电视平台可以根据用户的观看习惯和兴趣爱好,为用户提供个性化的节目推荐和服务,提升用户体验。
(4)直播和互动5G技术的低时延和大连接特点可以为广播电视行业实现更加流畅和高质量的直播体验。
5G技术还可以为用户提供更加便捷和高效的互动功能,例如在线投票互动、实时评论互动等,增强用户参与感和粘性。
3. 5G技术在广播电视中的发展5G技术在广播电视中的应用还处于起步阶段,但随着5G技术的不断成熟和普及,其在广播电视中的应用前景将会更加广阔。
未来,5G技术将为广播电视行业带来以下发展趋势:(1)高质量内容生产5G技术的高速传输和低时延将为广播电视行业提供更加高效的内容生产和传输支持。
广播电视平台可以通过5G技术实现更高质量的内容制作和传输,为观众提供更加优质的节目和体验。
如何选择合适的视频编解码技术近年来,随着互联网的迅猛发展,视频在人们生活中扮演着越来越重要的角色。
从在线教育到实时视频通话,从电影娱乐到企业会议,视频应用无处不在。
然而,视频文件的大小庞大,网络带宽的限制以及设备性能的差异等问题给视频传输和存储带来了很大的挑战。
当今,我们需要选择合适的视频编解码技术来优化视频的传输和存储。
本文将从视频编解码技术的基本原理、常用的编解码标准以及选择合适的技术方案三个方面来探讨如何选择合适的视频编解码技术。
一、视频编解码技术的基本原理视频编解码技术是指将视频信号转换为数字信号进行传输和存储的过程。
其中,编码(Encode)是将模拟视频信号通过压缩算法转换为数字信号的过程,而解码(Decode)则是将编码后的数字信号恢复为模拟视频信号的过程。
编码技术的目标是在保证视频质量的前提下尽量减小视频文件的大小。
基本的编解码技术包括采样、量化、变换、熵编码等。
二、常用的编解码标准1. /AVC/AVC是目前应用最广泛的视频编码标准之一。
它采用了先进的压缩算法,在同样视频质量的条件下,可以比其他标准更高效地压缩视频文件。
/AVC广泛应用于在线视频、数字电视、蓝光光盘等领域。
然而,/AVC编码解码算法复杂,对硬件设备的要求较高,因此在一些资源有限的设备上会存在性能瓶颈。
2. /HEVC/HEVC是/AVC的后继者,被视为下一代视频编码标准。
与/AVC相比,/HEVC可以在相同视频质量下减小一半以上的文件大小。
这使得/HEVC在高清视频、4K视频等领域具有更大的应用潜力。
然而,由于/HEVC编解码算法更加复杂,对硬件设备的要求更高,其普及和应用依然面临困难。
三、选择合适的技术方案在选择合适的视频编解码技术时,应综合考虑以下几个因素:1. 应用场景不同的应用场景对视频编解码技术有不同的要求。
例如,对于实时视频通话应用,要求实时性较高,且需要较低的延迟。
这时,选择效率更高、延迟更低的编解码技术更为合适。
详细介绍WiMAX物理层关键技术及演进〖转载〗小熊在线-无极鸟北京2007年04月17日发表评论查看评论[文章简介]阅读. 人次WiMAX技术发展迅速,但是为了获得高效可靠的通信性能,并支持更高速率的移动环境,需要物理层关键技术进一步演进…… (5355 字)以IEEE 802.16e标准为基础的宽带无线技术已经成为WiMAX技术的主流,接入无线网络已经成为很多人生活的一部分。
为了满足人们对传输速率日益增长和高速移动性的要求,IEEE在相继推出了802.16a、802.16d、802.16e后,IEEE即将提出下一代的先进空口技术标准——802.16m。
2006年12月IEEE启动了IEEE 802.16m标准的制订工作,很多全球著名厂家将参与其中。
小熊在线WiMAX物理层的技术特点[1]:(1)在物理层采用正交频分复用,实现高效的频谱利用率。
小熊在线(2)双工方式:支持时分双工(TDD)、频分双工(FDD),同时也支持半双工频分双工(HFDD)。
FDD需要成对的频率,TDD则不需要,而且可以实现灵活的上下行带宽动态分配。
半双工频分双工方式降低了终端收发器的要求,从而降低了对终端收发器的要求。
小熊在线(3)可支持移动和固定的情况,移动速度最高可达120 km/h。
小熊在线(4)带宽划分灵活,系统的带宽范围为1.25 MHz~20 MHz。
WiMAX规定了几个系列的带宽:1.25 MHz 的倍数系列、1.75 MHz的倍数系列。
其中1.25 MHz倍数系列包括:1.25 MHz、2.5 MHz、5 MHz、10 MHz、20 MHz等,1.75 MHz倍数系列包括:1.75 MHz、3.5 MHz、7 MHz、14 MHz等。
小熊在线(5)使用先进的多天线技术提高系统容量和覆盖范围。
小熊在线(6)采用混合自动重传(HARQ)技术。
混合自动重传操作中融合了前向纠错(FEC)的功能,使得每一次分组包的发送操作都能够为最终的正确解码做出贡献。
数字化时代给中国电影带来了什么在数字化时代背景和媒介融合的大趋势下,中国电影表现出一些与以往不同的特征。
把握行业发展契机,总结经验,从中发现行业发展的短板,中国影业才能走得更远。
标签:中国电影;3D;CG;IMAX;VFX;VR数字3.0时代,互联网全面渗透到商业组织的研发和生产环节。
传媒文化发展的机遇转瞬即逝,产业化是不可回避的话题。
在数字化时代背景和媒介融合的大趋势下,观众的兴趣点、审美,包括对演员和题材的偏好都发生了变化,中国电影也表现出与以往不同的样貌。
一、数字化时代的电影现状2013年第16届上海国际电影节,《浩劫》《林肯》等五部精彩影片首次以4K 的格式与中国观众见面。
据好莱坞的电影公司称,标准化4K (4096水平像素)和2K(2048水平像素)格式将是下一代数字电影发行和放映的标准。
目前国内大多数的数字电影是2K的,还有部分数字电影是1.3K和0.8K的。
德国ARRI 公司和美国RED公司的数字摄影机水平已经很高,不仅能拍摄4K高清晰图像,还可以将图像以电子格式存储在硬盘里,从而实现了全数字化制作。
中国成为这类摄影机销售的主要市场。
数字化拍摄在中国遍地开花,前后期制作也随之变化。
二、数字化时代的中国电影不管怎样,拿别人的技术拍自己的电影也是个不错的选择,毕竟感性消费时代需要用各类电影作品来满足消费市场,机会不容错过。
3D 技术满足你的视觉想象。
2009年詹姆斯·卡梅隆执导的3D科幻电影《阿凡达》成为世界电影史上第一部全球票房超过27亿美元的电影,让观众深刻体验到空前的视觉震撼。
2013年《地心引力》与2015年《火星救援》的口碑与票房再次印证了运用3D技术拍摄电影是大趋势。
2011年徐克执导的3D 古装武侠片《龙门飞甲》是中国第一部真正意义上的3D武侠电影,也是获得官方认证的IMAX 3D电影,取得了新世纪以来功夫电影少有的票房佳绩。
《龙门飞甲》用3D技术虚拟出环境,把人物置于虚拟现实交替的空间中搏杀,实现了由现实到虚拟的空间转换。
视频编解码技术与性能分析随着互联网的普及和技术的不断提升,视频已经成为互联网中不可或缺的一部分。
而视频编解码技术是视频播放和传输中最核心的技术之一。
本文将介绍视频编解码技术的原理和影响性能的因素,并对常见的视频编解码标准进行比较和性能分析。
一、编解码技术原理及应用视频编解码技术是为了在网络传输或者存储时减小视频数据体积,提升视频传输效率和播放性能而存在的。
首先,我们需要了解编码和解码两个概念。
编码:把一个视频或者音频文件等数字信号转换成压缩后的数字数据或者码字流的过程。
解码:把一个压缩后的数字数据或码字流转换成原始的数字信号,以便展现或者传递的过程。
常用视频编解码技术:H.264/AVC、H.265/HEVC、VP9、AV1等。
H.264/AVC是目前市场上应用最为广泛的视频编码标准之一。
在同等视频质量下,H.264/AVC相对于H.263/MP4减少了50%左右的比特率,具有良好的广泛性、可扩展性和高效性等优点,被应用在多种视频传输场景中。
但是,H.264/AVC在一些场景下会出现码率过高、画面质量劣化和编解码延迟过大等问题。
H.265/HEVC是近几年出现的一种新型视频编码标准。
相较于H.264/AVC,H.265/HEVC在同等画质下,可以将视频压缩率提高到原来的一半左右,但是编解码和计算复杂度提高,需要更高的计算性能支持。
VP9是由Google推出的、开源、免费的视频编解码技术标准。
相比于H.264/AVC,VP9在压缩效率上有所提升,但是它的编解码复杂度较高,需要更高的计算能力来保证视频正常播放。
AV1是由AOM(Alliance for Open Media)制定的、基于VP10的下一代视频编解码技术标准。
它使用更为先进的压缩算法,同样可以在不影响画质的情况下将视频的比特率减少一半左右。
但是,相比VP9,AV1的编解码复杂度更高,需要更高的计算性能支持。
二、视频性能分析、方案对比在不同的视频播放场景下,选择合适的视频编解码标准和参数设置是至关重要的。
附件:高技术产业化“十一五”规划国家发展和改革委员会目 录前言一、“十五”发展情况 (1)二、指导思想、发展原则与目标 (4)(一)指导思想 (4)(二)发展原则 (4)(三)发展目标 (5)三、发展重点 (6)(一)信息产业领域 (6)(二)生物产业领域 (7)(三)航空产业领域 (7)(四)航天产业领域 (8)(五)新材料领域 (8)(六)新能源领域 (8)(七)现代农业领域 (9)(八)先进制造领域 (9)(九)循环经济领域 (10)(十)海洋领域 (10)四、重大专项 (10)(一)软件和集成电路专项 (11)(二)下一代互联网专项 (11)(三)新一代移动通信专项 (11)(四)数字音视频专项 (12)(五)新型元器件专项 (12)(六)信息安全专项 (12)(七)生物医药专项 (13)(八)现代中药专项 (13)(九)生物医学工程专项 (14)(十)生物质工程专项 (14)(十一)现代农业专项 (14)(十二)民用飞机专项 (15)(十三)卫星应用专项 (15)(十四)新材料专项 (16)(十五)新能源专项 (16)(十六)节能减排专项 (17)五、保障措施 (17)(一)加强宏观引导 (17)(二)促进技术转移 (18)(三)强化产业化能力建设 (18)(四)完善投融资体系 (19)前 言高技术产业化是自主创新的重要组成部分。
推进高技术产业化,是做强做大高技术产业,促进产业技术升级,培育新兴产业,推动经济结构调整,提高产业核心竞争力的重要举措。
根据《高技术产业发展“十一五”规划》的总体要求,《高技术产业化“十一五”规划》重点部署了信息、生物、航空、航天、新材料、新能源、现代农业、先进制造、循环经济、海洋等十大领域高技术产业化的主要任务和若干重大专项,是发展改革委系统“十一五”期间开展高技术产业化工作的指导性文件。
一、“十五”发展情况“十五”是我国高技术产业化全面推进的五年。
按照中央、国务院关于加强技术创新,发展高科技,实现产业化的总体部署,制定政策措施,实施重大专项,初步形成了政府引导、企业实施、社会参与的产业化工作新局面。
数字电视摘要:数字电视是一个从节目采集、节目制作节目传输直到用户端都以数字方式处理信号的端到端的系统。
基于DVB技术标准的“广播式”和“交互式”的数字电视.采用先进用户管理技术能将节目内容的质量和数量做得尽善尽美,并为用户带来更多的节目选择和更好的节目质量效果。
与模拟电视相比,数字电视具有图像质量高、节目容量大(是模拟电视传输通道节目容量的l0倍以上)和伴音效果好等等特点。
各发达国家根据自己的国情,已分别制定出由模拟电视向数字电视过渡的方案和产业目标。
数字电视被各国视为新世纪的战略技术。
数字电视成了继电信引爆IT之后的又一大“热点”。
引言:随着对更高清晰度电视系统的研制和开发,人们对视觉效果和电视媒体的技术要求越来越高,所以电视数字化技术越来越受到各个国家的高度重视。
数字技术标志着一场真正意义上的革命,其意义远远超过了单纯技术的巨变。
一方面,它将促使信息传播网络和接收硬件系统的一体化;另一方面,它将同时强化媒体的新型关系,改变消费媒体传输信息的方式。
一、数字电视的基本知识所谓数字电视,就是将传统的模拟电视信号经过抽样、量化和编码转换成用二进制数代表的数字式信号,然后进行各种功能的处理、传输、存储和记录,也可以用电子计算机进行处理、监测和控制。
在传统的模拟电视中,模拟全电视信号通过调制在无线电射频载波上发送出去。
数字电视则是将电视信号进行数字化采样,必须发展数据压缩技术,在原模拟电视频道带宽内传输高速率的数字信号。
目前,数字电视的传输途径可分为三种:数字卫星电视、数字有线电视和数字地面开路电视。
这三种数字电视的信源编码方式相同,都是MPEG-2的复用数据包,但由于它们的传输途径不同,它们的信道编码也采用了不同的调制方式。
同时运用了很多编码技术,比如关于数字电视的信源编解码技术,在HDTV视频压缩编解码标准方面,美国、欧洲、日本没有分歧,都采用了MPEG-2标准。
MPEG(Moving Picture Expert Group)意思是"运动图像专家组",压缩后的信息可以供计算机处理,也可以在现有和将来的电视广播频道中进行分配。
数字视频编解码技术标准及其发展趋势解读下一代视频压缩标准HEVC(H.265) 在数字视频应用产业链的快速发展中,面对视频应用不断向高清晰度、高帧率、高压缩率方向发展的趋势,当前主流的视频压缩标准协议H.264(AVC)的局限性不断凸显。
同时,面向更高清晰度、更高帧率、更高压缩率视频应用的HEVC(H.265)协议标准应运而生。
本文重点分析了下一代视频压缩协议标准HEVC(H.265)的技术亮点,并对其在未来应用中将给整个产业带来的深刻变化予以展望。
H.264(AVC)从2003年5月草稿发布以来,凭借其相对于以往的视频压缩标准在压缩效率以及网络适应性方面的明显优势,逐步成为视频应用领域的主流标准。
根据MeFeedia 的数据,由于iPad 以及其它新兴设备大多支持H.264 硬件加速,至2011年底,80%的视频使用H.264编码,并且随着支持H.264解码的设备不断增多,这一占有率还将进一步增长。
但是,随着数字视频应用产业链的快速发展,视频应用向以下几个方向发展的趋势愈加明显:l 高清晰度(Higher Definition):数字视频的应用格式从720 P向1080 P全面升级,在一些视频应用领域甚至出现了4K x 2K、8K x 4K的数字视频格式;l 高帧率(Higher frame rate ):数字视频帧率从30 fps向60fps、120fps甚至240fps的应用场景升级;l 高压缩率(Higher Compression rate ):传输带宽和存储空间一直是视频应用中最为关键的资源,因此,在有限的空间和管道中获得最佳的视频体验一直是用户的不懈追求。
由于数字视频应用在发展中面临上述趋势,如果继续采用H.264编码就出现的如下一些局限性:(1) 宏块个数的爆发式增长,会导致用于编码宏块的预测模式、运动矢量、参考帧索引和量化级等宏块级参数信息所占用的码字过多,用于编码残差部分的码字明显减少。
广电CDN网络技术浅析及典型案例分析摘要:随着我国科学技术的不断发展,传统网络信息技术发展受到局限,无法满足当下市场需求,网络信息技术逐渐步入正轨,被各大网络运营商运用。
本文分析了广电CDN网络技术的重要性和特点,重点介绍了其在广播电视领域的应用现状和发展趋势。
通过具体的案例分析,探讨了广电CDN网络技术实际应用,并对其性能进行了评估。
同时,本文也揭示了广电CDN网络技术在应用过程中可能遇到的问题,并提供了解决方案和建议。
总体而言,广电CDN网络技术的应用将极大地促进广播电视行业的发展和进步。
关键词:广电;CDN网络技术;案例随着互联网视频的快速发展,传统的网络架构已经无法满足高清、4K、大流量的视频播放需求。
于是,CDN(内容分发网络)技术应运而生,成为了解决这一问题的有效手段之一。
而在广播电视领域,由于视频直播等需求的增加,广电CDN网络技术也得到了应用和发展。
本文旨在对广电CDN网络技术进行简单的分析和介绍,并结合相关案例进行实际应用探讨,以期为同行业人员提供参考与借鉴。
一、CDN网络技术的相关概念CDN(Content Delivery Network)网络技术是一种通过分布在全球各地的服务器节点,将网站或应用程序的静态和动态内容缓存到离用户最近的服务器上以提高网站性能和可靠性的服务系统。
CDN网络技术的基本原理是将源服务器上的内容复制到全球各地的CDN节点服务器上,在用户请求时从最近的节点服务器上发送相应的内容,从而减少因距离、带宽等问题导致的延迟和网络拥堵,提高用户访问速度和稳定性。
二、CDN网络技术的基本构成CDN技术主要由源服务器、复制服务器、请求路由系统、内容分发系统以及记账系统五部分有机组成,具体功能介绍如下:1、源服务器:主要是存储和提供计算机程序、操作系统、媒体文件等内容的源代码以及其他数据。
2、复制服务器:复制服务器的主要功能是存储源服务器中的数据(如文件、媒体和应用程序)的本地副本,以提高用户访问这些数据的速度和可用性。
下一代数字视频技术一、前言移动互联网的迅速发展为人们的生存方式带来深刻的变化,商务、社交、娱乐等各方面的信息流量呈爆炸式增长,其中视频信息流量占据了很大的比例,现在每分钟上传到YouTube的视频就达100小时。
数字视频的信息量非常大,用现有的数字视频压缩技术制成的标清数字视频每小时约为1~2GB,目前数字视频向高清或超高清方向发展的趋势愈加明显:(1)高清晰度(Higher Definition):数字视频的分辨率从720 P向1080 P全面升级,在一些视频应用领域甚至出现了4K×2K、8K×4K的数字视频图像;(2)高帧率(Higher frame rate ):数字视频的帧率从30 fps向60fps、120fps甚至240fps 的应用场景升级。
高清或超高清视频的信息量将数倍的增加,给传输带宽和存储空间带来更大的压力。
传输带宽和存储空间是视频应用中最为关键的资源,以更少的资源获得更高清的视频体验一直是用户的不懈追求,下一代数字视频技术即是在此背景下发展起来的。
二、数字视频技术的发展历程对于数字视频技术的研究始于上世纪八十年代,第一个实用的数字视频编码标准H.261于1990年由ITU-T制定的,其后ITU-T制定了H.262(MPEG-2)、H.263、H.263+、H.263++、H.264(MPEG-4 A VC)和H.265等视频编码标准。
另一个视频编码标准的制定者是ISO/IEC组织的活动图像专家组MPEG(Moving Picture Expert Group),MPEG制定了MPEG-1、MPEG-2(H.262)、MPEG-4、MPEG-4 A VC(H.264)等视频编码标准,其中MPEG-2(H.262)和MPEG-4 A VC(H.264)是ISO/IEC MPEG与ITU-T组织联合制定分别发布的。
我国于1996年以MPEG China的名义正式参与国际MPEG专家组的工作,并开展数字视音频技术的研究工作。
2002年我国成立“数字视音频编解码技术标准化工作组(简称A VS)”,并决定与MPEG China合并,两个组织的名称继续保留,分别用于国内和国际。
A VS工作组制定了A VS1-P2等视频编码标准,并于2006年颁布为国标GB/T 20090.2-2006,之后于2012年在国标的基础上升级为A VS+,形成了广电行业标准GY/T 257.1-2012。
A VS标准针对视频监控的伸展档A VS-S2又于2013年被国际电子电气工程师协会(IEEE)标准化委员会接受并颁布为IEEE 1857标准。
2013年12月31日国家质检总局、国家标准委批准发布了《信息技术先进音视频编码第2部:视频》(修订)(国标代号GB/T 20090.2-2013)、《信息技术先进音视频编码第10部:移动语音和音频》(国标代号GB/T 20090.10-2013)为国家标准,标准将于2014年7月15日正式实施。
下图为ITU-T、MPEG、A VS三个标准化组织的视频技术发展历程。
图1 数字视音频压缩标准的发展历程值得一提的是,除上述之外还有其它一些很好的视频压缩技术,如Google公司的VP8、VP9和微软公司的VC-1等。
三、下一代数字视频技术下面将简要介绍一下以H.265/HEVC、VP9、A VS2等为代表的下一代数字视频技术。
3.1H.265/HEVCH.264是目前应用最广泛的数字视频编解码标准,H.265是其后继者,于2013年1月ITU-T正式发布。
H.265/HEVC标准共有三种模式:Main、Main 10、Main Still Picture。
Main模式支持8位色深,Main 10模式支持10位色深,将用于超高清电视(UHDTV)上,Main和Main10模式都将色度采样格式限制为4:2:0。
H.265视频压缩标准的核心目标是在H.264/A VC high profile的基础上将压缩效率提高一倍,即在保证相同视频图像质量的前提下,视频流的码率减少50%。
H.265使用了先进的技术用以提高压缩效率、提高鲁棒性和错误恢复能力、减少实时的时延、减少信道获取时间和随机接入时延、降低复杂度等。
H.265标准将能更好地适应各种类型的网络,如Internet、LAN、Mobile、ISDN、NGN等。
H.265/HEVC与H.264/A VC的编码架构大致相似,仍然属于预测加变换的混合编码,主要也包含:帧内预测(intra prediction)、帧间预测(inter prediction)、转换(transform)、量化(quantization)、去区块滤波器(deblocking filter)、熵编码(entropy coding)等模块,其主要的技术特点为:(1)灵活的编码结构在H.265/HEVC编码架构中,整体被分为编码单位(coding unit,CU)、预测单位(predict unit,PU) 和转换单位(transform unit,TU )等三个基本单位。
与H.264每个宏块大小都是固定的16x16像素不同,H.265的编码单位可以选择从最小的8×8到最大的64×64。
H.265采用一种自适应的变换技术,即根据当前块信号的特性,自适应的选择变换块大小,如信息量不多的区域划分的宏块较大(如64×64),而细节多的地方划分的宏块就相应的小一些(如8×8),这样一方面能够提供更好的能量集中效果,并能在量化后保存更多的图像细节,就相当于对图像进行了有重点的编码,从而降低了整体的码率,编码效率就相应提高了。
H.265还提供了更多不同的工具来降低码率,其帧内预测模式支持33种方向(H.264只支持8种),并且提供了更好的运动补偿处理和矢量预测方法。
(2)采样点自适应偏离(Sample Adaptive Offset)经去区块滤波器(deblocking filter)之后,在帧间预测环路内引入一个非线性的幅值映射并建立一个映射表,目的是在解码时通过查映射表获得参数使得更好地重建原始图像的幅值,从而减少失真。
(3)自适应环路滤波(Adaptive Loop Filter)经去区块滤波器(deblocking filter)和SAO之后,自适应环路滤波(ALF)在编解码环路内用于恢复重建图像,以达到重建图像与原始图像之间的均方差最小。
(4)并行化处理H.265/HEVC引入了一些新的特性以强化并行处理能力和为包传输而改良的片结构,这两个特性在某些应用中可能会十分有用,具体实现可以根据情况采用。
这些特性有:a)并行块(Tile):可以把一帧图像分割成称之为Tile的矩形区域,其目的是增强并行处理的能力同时又不引入新的错误扩散。
Tile是可以互相独立解码的区域,由几乎数量相等的CTU(Coding Tree Unit)组成。
b)错峰并行处理WPP(Wavefront Parallel Processing):WPP功能启用时,将图像分片被分成数个CTU行,第一行正常处理,第二行在第一行处理完两个CTU之后开始处理,第三行在第二行处理完两个CTU之后开始处理,以此类推。
c)依赖更小片(Dependent slice segments):允许数据与错峰并行处理或者并行块关联起来。
在碎片化的包传输网络中,相对于一次编码一整片而言,这种做法可以更快进入解码流程,从而降低延迟。
与错峰并行处理一起使用时,它也需要类似错峰的机制。
这项设计尤为适合低延迟要求下的并行处理。
H.265/HEVC在很多特性上都做了较大的改进以获得较好的编码压缩性能,但是相对于H.264,其算法的复杂性也大大提高了。
3.2VP9VP9是Google公司制定开发的开放视频编解码技术,于2013年6月正式完成制定,是VP8的后继者。
VP9的开发从2011年第三季开始,目标是在同画质下比VP8 编码减少50%,另一个目标则是要在编码效率上超越H.265/HEVC。
VP9支持两种编码格式文档(Profiles):文档0(profile 0)支持4:2:0的色度抽样;文档1(Profile 1)针对硬件播放环境,新增支持4:2:2的色度抽样、4:4:4色度抽样等。
另外Google也在考虑新增一个支持10位色深的编码格式文档(profile)。
VP9 在VP8的基础上做了许多技术改进,比如:(1)引入超大块(Superblock):支持32×32的编码区块,且将来会扩充到64×64;(2)优化宏块分割:将具有相同特征的分成一个宏块(macroblock);(3)多种预测改进措施:如新的帧内预测功能和策略,应用多种多样的预测器或参考帧的混合预测,与新变换相关联的新预测模式等;(4)熵编码改进:与上下文有关的宏块跳跃编码;参考帧与上下文有关的编码;(5)新变换方式:如更大的DCT(8×8 DCT,16×16 DCT),不对称DST(ADST)等;3.3H.265和VP9比较H.265/HEVC不仅提升图像质量,同时达到H.264/MPEG-4 A VC两倍之压缩率(等同于同样画面质量下比特率减少了50%),可支持4K分辨率甚至到超高清视频,最高分辨率可达到8192×4320(8K×4K分辨率)。
Google公司的VP9在相同质量下相对于VP8可以减少50%的比特率。
VP9是Google WebM媒体文件的视频编码格式,WebM标准的网络视频更加偏向于开源并且是基于HTML5标准的,WebM旨在开发高质量、开放的视频格式,其重点是解决网络视频服务这一核心的用户体验,Google公司已经发布了第一个支持VP9解码技术的Google Chrome网页浏览器。
从一些组织对H.265和VP9进行的对比测试结果看,VP9的编码效率在H.264之上,但是在H.265之下,两者编码效率相差约1%。
3.4A VS2A VS2是A VS+的下一代,其视频标准(《信息技术先进音视频编码第2部:视频》(修订)(国标代号GB/T 20090.2-2013),简称A VS2视频标准)的首要应用目标是超高清晰度视频。
超高清视频的分辨率相当于高清视频的4倍(4K超高清)或16倍(8K 超高清),需要压缩效率更高的视频编码标准。
测试表明,A VS2视频标准的压缩效率已经比上一代A VS国家标准和A VC/H.264国际标准提高了一倍,在场景类视频编码方面大幅度领先于最新国际标准HEVC,实现复杂度不高于同等级的编码标准。