当前位置：文档之家› 视频压缩编解码标准综述

视频压缩编解码标准综述

摘要：本文从目前视频流传输中最为重要的编解码标准国际电联的H.261、H.263，运动静止图像专家组的M-JPEG，国际标准化组织运动图像专家组的MPEG系列标准，以及在互联网上被广泛应用的Real Video、WMT、QuickTime等方面，详细地介绍了视频压缩编解码标准及其应用。

关键词：视频压缩编解码标准，H.261，H.263，M-JPEG，MPEG，MPEG-1，MPEG-2，MPEG-4，MPEG-7，MPEG-21，Real Video，WMT，QuickTime。

随着Internet带宽的不断增长，在Internet上传输视频的相关技术也成为Internet节研究和开发的热点。目前，许多实验性的高速宽带网络都把视频传输的技术和应用作为研究的重点课题。在Internet上传输视频有许多困难，其根本的原因在于Internet的无连接每包转发机制主要为突发性的数据传输设计，不适用于对连续媒体流的传输。为了在Internet上有效的、高质量的传输视频流，需要多种技术的支持，其中数字视频的压缩编码技术是Internet视频传输中的关键技术之一。此外，在多媒体的传输、处理、应用中还有许多问题：如何在网络上传输视频？如何通过手机上网并接收视频和图像？如何对多媒体数据进行快速有效的检索？如何对多媒体信息进行统一的存取？等等。

目前视频流传输中最为重要的编解码标准有国际电联的H.261、H.263，运

动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准，此外在互联网上被广泛应用的还有Real-Networks的RealVideo、微软公司的WMT以及Apple公司的QuickTime等。具体如下：

一、国际电联的H.261、H.263标准

1．H.261

H.261又称为P*64，其中P为64kb/s的取值X围，是1到30的可变参数，它最初是针对在ISDN上实现电信会议应用特别是面对面的可视和视频会议而设计的。实际的编码算法类似于MPEG算法，但不能与后者兼容。H.261在实时编码时比MPEG所占用的CPU运算量少得多，此算法为了优化带宽占用量，引进了在图像质量与运动幅度之间的平衡折中机制，也就是说，剧烈运动的图像比相对静止的图像质量要差。因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编码。

2．H.263

H.263是国际电联ITU-T的一个标准草案，是为低码流通信而设计的。但实际上这个标准可用在很宽的码流X围，而非只用于低码流应用，它在许多应用中可以认为被用于取代H.261。H.263的编码算法与H.261一样，但做了一些改善和改变，以提高性能和纠错能力。.263标准在低码率下能够提供比H.261更好的图像效果，

两者的区别有：(1)H.263的运动补偿使用半象素精度，而H.261则用全象素精度和循环滤波；(2)数据流层次结构的某些部分在H.263中是可选的，使得编解码可以配置成更低的数据率或更好的纠错能力；(3)H.263包含四个可协商的选项以改善性能；(4)H.263采用无限制的运动向量以及基于语法的算术编码；(5)采用事先预测和与MPEG中的P-B帧一样的帧预测方法；(6)H.263支持5种分辨率，即除了支持H.261中所支持的QCIF和CIF外，还支持SQCIF、4CIF和16CIF，SQCIF相当于QCIF一半的分辨率，而4CIF和16CIF分别为CIF的4倍和16倍。

1998年IUT-T推出的H.263＋是H.263建议的第2版，它提供了12个新的可协商模式和其他特征，进一步提高了压缩编码性能。如H.263只有5种视频源格式，H.263＋允许使用更多的源格式，图像时钟频率也有多种选择，拓宽应用X围；另一重要的改进是可扩展性，它允许多显示率、多速率及多分辨率，增强了视频信息在易误码、易丢包异构网络环境下的传输。另外，H.263＋对H.263中的不受限运动矢量模式进行了改进，加上12个新增的可选模式，不仅提高了编码性能，而且增强了应用的灵活性。H.263已经基本上取代了H.261。

二、M-JPEG

M-JPEG（Motion- Join Photographic Experts Group）技术即运动静止图像（或逐帧）压缩技术，广泛应用于非线性编辑领域可精确到帧编辑和多层图像处理，把运动的视频序列作为连续的静止图像来处理，这种压缩方式单独完整地压缩每一帧，在编辑过程中可随机存储每一帧，可进行精确到帧的编辑，此外M-JPEG的压缩

和解压缩是对称的，可由相同的硬件和软件实现。但M-JPEG只对帧内的空间冗余进行压缩。不对帧间的时间冗余进行压缩，故压缩效率不高。采用M-JPEG数字压缩格式，当压缩比7:1时，可提供相当于Betecam SP质量图像的节目。

JPEG标准所根据的算法是基于DCT（离散余弦变换）和可变长编码。JPEG的关键技术有变换编码、量化、差分编码、运动补偿、霍夫曼编码和游程编码等

M-JPEG的优点是：可以很容易做到精确到帧的编辑、设备比较成熟。缺点是压缩效率不高。

此外，M-JPEG这种压缩方式并不是一个完全统一的压缩标准，不同厂家的编解码器和存储方式并没有统一的规定格式。这也就是说，每个型号的视频服务器或编码板有自己的M-JPEG版本，所以在服务器之间的数据传输、非线性制作网络向服务器的数据传输都根本是不可能的。

三、MPEG系列标准

MPEG是活动图像专家组(Moving Picture Exports Group)的缩写，于1988年成立，是为数字视/音频制定压缩标准的专家组，目前已拥有300多名成员，包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG组织最初得到的授权是制定用于“活动图像”编码的各种标准，随后扩充为“及其伴随的音频”及其组合编码。后来针对不同的应用需求，解除了“用于数字存储媒体”的限制，成为

现在制定“活动图像和音频编码”标准的组织。MPEG组织制定的各个标准都有不同的目标和应用，目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准。

1．MPEG-1标准

MPEG-1标准于1993年8月公布，用于传输1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码。该标准包括五个部分：

第一部分说明了如何根据第二部分（视频）以及第三部分（音频）的规定，对音频和视频进行复合编码。第四部分说明了检验解码器或编码器的输出比特流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。

该标准从颁布的那一刻起，MPEG-1取得一连串的成功，如VCD和MP3的大量使用，Windows95以后的版本都带有一个MPEG-1软件解码器，可携式MPEG-1摄像机等等。

2．MPEG-2标准

MPEG组织于1994年推出MPEG-2压缩标准，以实现视/音频服务与应用互操作的可能性。MPEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定，编码码率从每秒3兆比特～100兆比特，标准的

正式规X在ISO/IEC13818中。MPEG-2不是MPEG-1的简单升级，MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善。MPEG-2特别适用于广播级的数字电视的编码和传送，被认定为SDTV和HDTV的编码标准。

MPEG-2图像压缩的原理是利用了图像中的两种特性：空间相关性和时间相关性。这两种相关性使得图像中存在大量的冗余信息。如果我们能将这些冗余信息去除，只保留少量非相关信息进行传输，就可以大大节省传输频带。而接收机利用这些非相关信息，按照一定的解码算法，可以在保证一定的图像质量的前提下恢复原始图像。一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。

MPEG-2的编码图像被分为三类，分别称为I帧，P帧和B帧。

I帧图像采用帧内编码方式，即只利用了单帧图像内的空间相关性，而没有利用时间相关性。P帧和B帧图像采用帧间编码方式，即同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测，可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分，即P帧中的每一个宏块可以是前向预测，也可以是帧内编码。B帧图像采用双向时间预测，可以大大提高压缩倍数。

MPEG-2的编码码流分为六个层次。为更好地表示编码数据，MPEG-2用句法规定了一个层次性结构。它分为六层，自上到下分别是：图像序列层、图像组(GOP)、图像、宏块条、宏块、块。

MPEG-2标准在广播电视领域中的主要应用如下：

（1）视音频资料的保存

一直以来，电视节目、音像资料等都是用磁带保存的。这种方式有很多弊端：易损，占地大，成本高，难于重新使用。更重要的是难以长期保存，难以查找、难以共享。随着计算机技术和视频压缩技术的发展，高速宽带计算机网络以及大容量数据存储系统给电视台节目的网络化存储、查询、共享、交流提供了可能。

采用MPEG-2压缩编码的DVD视盘，给资料保存带来了新的希望。电视节目、音像资料等可通过MPEG-2编码系统编码，保存到低成本的CD-R光盘或高容量的可擦写DVD-RAM上，也可利用DVD编著软件(如Daikin Scenarist NT、Spruce DVDMaestro等)制作成标准的DVD视盘，既可节约开支，也可节省存放空间。

（2）电视节目的非线性编辑系统及其网络

在非线性编辑系统中，节目素材是以数字压缩方式存储、制作和播出的, 视频压缩技术是非线性编辑系统的技术基础。目前主要有M-JPEG和MPEG-2两种数字压缩格式。

M-JPEG技术即运动静止图像（或逐帧）压缩技术，可进行精确到帧的编辑，但

压缩效率不高。

MPEG-2采用帧间压缩的方式，只需进行I帧的帧内压缩处理，B帧和P帧通过侦测获得，因此，传输和运算的数据大多由帧之间的时间相关性得到，相对来说，数据量小，可以实现较高的压缩比。随着逐帧编辑问题的解决，MPEG-2将广泛应用于非线性编辑系统，并大大地降低编辑成本，同时MPEG-2的解压缩是标准的,不同厂家设计的压缩器件压缩的数据可由其他厂家设计解压缩器来解压缩,这一点保证了各厂家的设备之间能完全兼容。

由于采用MPEG-2 IBP视频压缩技术，数据量成倍减少，降低了存储成本，提高了数据传输速度，减少了对计算机总线和网络带宽的压力，可采用纯以太网组建非线性编辑网络系统已成为可能，而在目前以太网是最为成熟的网络，系统管理比较完善，价格也比较低廉。

基于MPEG-2的非线性编辑系统及非线性编辑网络将成为未来的发展方向。

（3）卫星传输

MPEG-2已经通过ISO认可，并在广播领域获得广泛的应用，如数字卫星视频广播(DVB-S)、DVD视盘和视频会议等。目前，全球有数以千万计的DVB-S用户，DVB-S信号采用MPEG-2压缩格式编码，通过卫星或微波进行传输，在用户端经MPEG-2卫星接收解码器解码，以供用户观看。此外，采用MPEG-2压缩编码技

术，还可以进行远程电视新闻或节目的传输和交流。

（4）电视节目的播出

在整个电视技术中播出是一个承上启下的环节，对播出系统进行数字化改造是非常必要的，其中最关键一步就是构建硬盘播出系统。MPEG-2硬盘自动播出系统因编播简便、储存容量大、视频指标高等优点，而为人们所青睐。但以往MPEG-2播出设备因非常昂贵，而只有少量使用。随着MPEG-2技术的发展和相关产品成本的下降，MPEG-2硬盘自动系统播出可望得到普及。

3．MPEG-4标准

运动图像专家组MPEG 于1999年2月正式公布了MPEG-4（ISO/IEC14496）标准第一版本。同年年底MPEG-4第二版亦告底定，且于2000年年初正式成为国际标准。

MPEG-4与MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具体压缩算法，它是针对数字电视、交互式绘图应用（影音合成内容）、交互式多媒体（、资料撷取与分散）等整合及压缩技术的需求而制定的国际标准。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内，旨在为多媒体通信及应用环境提供标准的算法及工具，从而建立起一种能被多媒体传输、存储、检索等应用领域普遍采用的统一数据格式。

MPEG-4的编码理念是：MPEG-4标准同以前标准的最显著的差别在于它是采用基于对象的编码理念，即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象，分别编码后，再经过复用传输到接收端，然后再对不同的对象分别解码，从而组合成所需要的视频和音频。这样既方便我们对不同的对象采用不同的编码方法和表示方法，又有利于不同数据类型间的融合，并且这样也可以方便的实现对于各种对象的操作及编辑。例如，我们可以将一个卡通人物放在真实的场景中，或者将真人置于一个虚拟的演播室里，还可以在互联网上方便的实现交互，根据自己的需要有选择的组合各种视频音频以及图形文本对象。

MPEG-4系统的一般框架是：对自然或合成的视听内容的表示；对视听内容数据流的管理，如多点、同步、缓冲管理等；对灵活性的支持和对系统不同部分的配置。

与MPEG-1、MPEG-2相比，MPEG-4具有如下独特的优点：

（1）基于内容的交互性

MPEG-4提供了基于内容的多媒体数据访问工具，如索引、超级、上下载、删除等。利用这些工具，用户可以方便地从多媒体数据库中有选择地获取自己所需的与对象有关的内容，并提供了内容的操作和位流编辑功能，可应用于交互式家庭购物，淡入淡出的数字化效果等。MPEG-4提供了高效的自然或合成的多媒体数

据编码方法。它可以把自然场景或对象组合起来成为合成的多媒体数据。

（2）高效的压缩性

MPEG-4基于更高的编码效率。同已有的或即将形成的其它标准相比，在相同的比特率下，它基于更高的视觉听觉质量，这就使得在低带宽的信道上传送视频、音频成为可能。同时MPEG-4还能对同时发生的数据流进行编码。一个场景的多视角或多声道数据流可以高效、同步地合成为最终数据流。这可用于虚拟三维游戏、三维电影、飞行仿真练习等

（3）通用的访问性

MPEG-4提供了易出错环境的鲁棒性，来保证其在许多无线和有线网络以及存储介质中的应用，此外，MPEG-4还支持基于内容的的可分级性，即把内容、质量、复杂性分成许多小块来满足不同用户的不同需求，支持具有不同带宽，不同存储容量的传输信道和接收端。

这些特点无疑会加速多媒体应用的发展，从中受益的应用领域有：因特网多媒体应用；广播电视；交互式视频游戏；实时可视通信；交互式存储媒体应用；演播室技术及电视后期制作；采用面部动画技术的虚拟会议；多媒体；移动通信条件下的多媒体应用；远程视频监控；通过ATM网络等进行的远程数据库业务等。MPEG-4主要应用如下：

（1）应用于因特网视音频广播

由于上网人数与日俱增，传统电视广播的观众逐渐减少，随之而来的便是广告收入的减少，所以现在的固定式电视广播最终将转向基于TCP/IP的因特网广播，观众的收看方式也由简单的遥控器选择频道转为网上视频点播。视频点播的概念不是先把节目下载到硬盘，然后再播放，而是流媒体视频（streaming video），点击即观看，边传输边播放。

现在因特网中播放视音频的有：Real Networks公司的Real Media，微软公司的Windows Media，苹果公司的QuickTime，它们定义的视音频格式互不兼容，有可能导致媒体流中难以控制的混乱，而MPEG-4为因特网视频应用提供了一系列的标准工具，使视音频码流具有规X一致性。因此在因特网播放视音频采用MPEG-4，应该说是一个安全的选择。

（2）应用于无线通信

MPEG-4高效的码率压缩，交互和分级特性尤其适合于在窄带移动网上实现多媒体通信，未来的手机将变成多媒体移动接收机，不仅可以打移动电视、移动上网，还可以移动接收多媒体广播和收看电视。

（3）应用于静止图像压缩

静止图像（图片）在因特网中大量使用，现在网上的图片压缩多采用JPEG技术。MPEG-4中的静止图像（纹理）压缩是基于小波变换的，在同样质量条件下，压缩后的文件大小约是JPEG压缩文件的十分之一。把因特网上使用的JPEG图片转换成MPEG-4格式，可以大幅度提高图片在网络中的传输速度。

（4）应用于电视

传统用于窄带电视业务的压缩编码标准，如H261，采用帧内压缩、帧间压缩、减少象素和抽帧等办法来降低码率，但编码效率和图像质量都难以令人满意。MPEG-4的压缩编码可以做到以极低码率传送质量可以接受的声像信号，使电视业务可以在窄带的公用网上实现。

（5）应用于计算机图形、动画与仿真

MPEG-4特殊的编码方式和强大的交互能力，使得基于MPEG-4的计算机图形和动画可以从各种来源的多媒体数据库中获取素材，并实时组合出所需要的结果。因而未来的计算机图形可以在MPEG-4语法所允许的X围内向所希望的方向无限发展，产生出今天无法想象的动画及仿真效果。

（6）应用于电子游戏

MPEG-4可以进行自然图像与声音同人工合成的图像与声音的混合编码，在编码方式上具有前所未有的灵活性，并且能及时从各种来源的多媒体数据库中调用素材。这可以在将来产生象电影一样的电子游戏，实现极高自由度的交互式操作。

4．MPEG-7标准

MPEG-7标准被称为“多媒体内容描述接口”，为各类多媒体信息提供一种标准化的描述，这种描述将与内容本身有关，允许快速和有效的查询用户感兴趣的资料。它将扩展现有内容识别专用解决方案的有限的能力，特别是它还包括了更多的数据类型。换而言之，MPEG-7规定一个用于描述各种不同类型多媒体信息的描述符的标准集合。该标准于1998年10月提出。

MPEG-7的目标是支持多种音频和视觉的描述，包括自由文本、N维时空结构、统计信息、客观属性、主观属性、生产属性和组合信息。对于视觉信息，描述将包括颜色、视觉对象、纹理、草图、形状、体积、空间关系、运动及变形等。

MPEG-7的目标是根据信息的抽象层次，提供一种描述多媒体材料的方法以便表示不同层次上的用户对信息的需求。以视觉内容为例，较低抽象层将包括形状、尺寸、纹理、颜色、运动（轨道）和位置的描述。对于音频的较低抽象层包括音调、调式、音速、音速变化、音响空间位置。最高层将给出语义信息：如“这是一个场景：一个鸭子正躲藏在树后并有一个汽车正在幕后通过。”抽象层与提取特征的方式有关：许多低层特征能以完全自动的方式提取，而高层特征需要更多人的交互作用。MPEG-7还允许依据视觉描述的查询去检索声音数据，反之也一

样。

MPEG-7的目标是支持数据管理的灵活性、数据资源的全球化和互操作性。

MPEG-7标准化的X围包括：一系列的描述子（描述子是特征的表示法，一个描述子就是定义特征的语法和语义学）；一系列的描述结构（详细说明成员之间的结构和语义）；一种详细说明描述结构的语言、描述定义语言（DDL）；一种或多种编码描述方法。

在我们的日常生活中，日益庞大的可利用音视频数据需要有效的多媒体系统来存取、交互。这类需求与一些重要的社会和经济问题相关，并且在许多专业和消费应用方面都是急需的，尤其是在网络高度发展的今天，而MPEG-7的最终目的是把网上的多媒体内容变成象现在的文本内容一样，具有可搜索性。这使得大众可以接触到大量的多媒体内容，MPEG-7标准可以支持非常广泛的应用，具体如下：

（1）音视数据库的存储和检索；

（2）广播媒体的选择（广播、电视节目）；

（3）因特网上的个性化新闻服务；

（4）智能多媒体、多媒体编辑；

（5）教育领域的应用（如数字多媒体图书馆等）；

（6）远程购物；

（7）社会和文化服务（历史博物馆、艺术走廊等）；

（8）调查服务（人的特征的识别、辩论等）；

（9）遥感；

（10）监视（交通控制、地面交通等）；

（11）生物医学应用；

（12）建筑、不动产及内部设计；

（13）多媒体目录服务（如，黄页、旅游信息、地理信息系统等）；

（14）家庭娱乐（个人的多媒体收集管理系统等）。

原则上，任何类型的AV（Audio-Video）材料都可以通过任何类型的查询材料来检索，例如，AV材料可以通过视频、音乐、语言等来查询，通过搜索引擎来匹配查询数据和MPEG-7的音视频描述。下面给出几个查询例子：

音乐：在键盘上弹几个音符就能得到包含（或近似）要求曲调的音乐作品列表，或以某种方式匹配音符的图象，例如，从情感方面。

图形：在屏幕上画几条线就能得到类似图形、标识、表意文字（符号）等的一组图象。

运动：对一组给定的物体，描述在物体之间的运动和关系，就会得到实现所描述的时空关系的动画列表。

电影拍摄剧本（剧情说明）：对给定的内容，描述出动作就会得到发生类似动作的电影拍摄剧本（剧情说明）列表。

四、MPEG-21标准

互联网改变了物质商品交换的商业模式，这就是“电子商务”。新的市场必然带来新的问题：如何获取数字视频、音频以及合成图形等“数字商品”，如何保护多媒体内容的知识产权，如何为用户提供透明的媒体信息服务，如何检索内容，如何保证服务质量等。此外，有许多数字媒体(图片、音乐等)是由用户个人生成、使用的。这些“内容供应者”同商业内容供应商一样关心相同的事情：内容的管理和重定位、各种权利的保护、非授权存取和修改的保护、商业XX与个人隐私的保护等。目前虽然建立了传输和数字媒体消费的基础结构并确定了与此相关的诸多要素，但这些要素、规X之间还没有一个明确的关系描述方法，迫切需要一

种结构或框架保证数字媒体消费的简单性，很好地处理“数字类消费”中诸要素之间的关系。MPEG-21就是在这种情况下提出的。

制定MPEG-21标准的目的是：(1)将不同的协议、标准、技术等有机地融合在一起；(2)制定新的标准；(3)将这些不同的标准集成在一起。MPEG-21标准其实就是一些关键技术的集成，通过这种集成环境就对全球数字媒体资源进行透明和增强管理，实现内容描述、创建、发布、使用、识别、收费管理、产权保护、用户隐私权保护、终端和网络资源抽取、事件报告等功能。

任何与MPEG-21多媒体框架标准环境交互或使用MPEG-21数字项实体的个人或团体都可以看作是用户。从纯技术角度来看，MPEG-21对于“内容供应商”和“消费者”没有任何区别。MPEG-21多媒体框架标准包括如下用户需求：(1)内容传送和价值交换的安全性；(2)数字项的理解；(3)内容的个性化；(4)价值链中的商业规则；(5)兼容实体的操作；(6)其它多媒体框架的引入；(7)对MPEG之外标准的兼容和支持；(8)一般规则的遵从；(9)MPEG-21标准功能及各个部分通信性能的测试；(10)价值链中媒体数据的增强使用；(11)用户隐私的保护；(12)数据项完整性的保证；(13)内容与交易的跟踪；(14)商业处理过程视图的提供；(15)通用商业内容处理库标准的提供；(16)长线投资时商业与技术独立发展的考虑；

(17)用户权利的保护，包括：服务的可靠性、债务与保险、损失与破坏、付费处理与风险防X等；(18)新商业模型的建立和使用。

五、其它压缩编码标准

1．Real Video

Real Video是Real Networks公司开发的在窄带(主要的互联网)上进行多媒体传输的压缩技术。

2．WMT

WMT是微软公司开发的在互联网上进行媒体传输的视频和音频编码压缩技术，该技术已与WMT服务器与客户机体系结构结合为一个整体，使用MPEG-4标准的一些原理。

3．QuickTime

QuickTime是一种存储、传输和播放多媒体文件的文件格式和传输体系结构，所存储和传输的多媒体通过多重压缩模式压缩而成，传输是通过RTP协议实现的。

标准化是产业化成功的前提，H.261、H.263推动了电视、视频会议的发展。早期的视频服务器产品基本都采用M——JPEG标准，开创视频非线性编辑时代。MPEG-1成功地在中国推动了VCD产业，MPEG-2标准带动了DVD及数字电视等多种消费电子产业，其它MPEG标准的应用也在实施或开发中，Real-Networks 的Real Video、微软公司的WMT以及Apple公司的QuickTime带动了网络流媒体的发展，视频压缩编解码标准紧扣应用发展的脉搏，与工业和应用同步。未来是

信息化的社会，各种多媒体数据的传输和存储是信息处理的基本问题，因此，可以肯定视频压缩编码标准将发挥越来越大的作用。

视频压缩编码技术及应用

2005年第9期信息技术中图分类号:T N919.31 文献标识码:B 文章编号:1009-2552(2005)09-0047-02 MPEG4视频压缩编码技术及应用赵　巍,艾斯卡尔 (新疆大学电子系,乌鲁木齐830046) 摘　要:MPEG4是国际标准组织制定的多媒体通信的标准,文中概述了MPEG4的背景,MPEG4与MPEG1,MPEG2的主要区别以及MPEG4的主要技术。最后,展望了MPEG4的应用前景。关键词:MPEG4;视频对象平面 MPEG4video compression coding technology and its application ZHAO Wei,Askar (Dep artment of E lectron.Xinjiang U niversity,U rumqi830046,China) Abstract:The MPEG4standard is w orked out for multimedia communications by IS O.This paper deseribes the background of MPEG4’s appearance,the basic structure of MPEG4,the main differences between MPEG4 and MPEG1Π2,the key technology of MPEG4.Finally,it forecasts the foreground of its application. K ey w ords:MPEG4;VOP 0　前言解决视频、音频数字化后数据量大与数字存储媒体和通信网容量小的矛盾的主要途径之一就是压缩。为此,国际标准化组织先后于1993年和1995年制定了视频、音频编码的国际标准MPEG1和MPEG2。MPEG1,MPEG2技术当初制定时,它们定位的标准均为高层媒体表示与结构,但随着计算机软件及网络技术的快速发展,MPEG1,MPEG2技术的弊端就显示出来了:交互性及灵活性较低,压缩的多媒体文件体积过于庞大,难以实现网络的实时传播。因此,制定出了新的多媒体通信标准MPEG4。 1　MPEG4与MPEG1,MPEG2的比较MPEG1,MPEG2都是采用第一代压缩编码技术,着眼于图像信号的统计特性来设计编码器,属于波形编码的范畴。第一代压缩编码方案把视频序列按时间先后分为一系列帧,每一帧图像又分成宏块以进行运动补偿和编码。这种编码存在以下缺陷: (1)将图像固定地分成相同大小的块,在高压缩比的情况下会出现严重的块效应,即马赛克效应; (2)不能对图像内容进行访问、编辑和回放等操作; (3)不能充分利用人类视觉系统(H VS,Huaman Visual System)的特性。 MPEG4代表了基于模型Π对象的第二代压缩编码技术,它充分利用了人眼视觉特性,抓住了图像信息传输的本质,从轮廓、纹理思路出发,支持基于视觉内容的交互功能,这适应了多媒体信息的应用由播放型转向基于内容的访问、检索及操作的发展趋势。 MPEG4为支持基于内容编码而提出了AV (AVO,Audio Visual Object)对象的概念,在MPEG4中所见的视音频已不再是过去MPEG1,MPEG2中图像帧的概念,而是一个个视听场景(AV场景)。不同的AV场景由不同的AV对象组成,AV对象是听觉,视觉或视听内容的表示单元,其基本单位是原始AV 对象,它可以是自然的或合成的声音,图像。原始AV对象具有高效编码,高效存储与传输以及可交互操作的特性,它又可进一步组成复合AV对象。因此,MPEG4标准的基本内容就是对AV对象进行高效编织,组织,存储与传输。MPEG4B不仅可提供高压缩率,同时也可实现更好的多媒体内容互动性及全方位的寸取性,它采用开放的编码系统,可随时加入新的编码算法模块,同时也可根据不同应用需求现场配置解码器,以支持多种多媒体应用。收稿日期:2005-03-02 作者简介:赵巍,男,硕士生,研究方向为数字图像处理。 — 7 4 —

视频格式和压缩标准大全

网络摄像机和视频服务器作为网络应用的新型产品，适应网络传输的要求也必然成为产品开发的重要因素，而这其中视频图像的技术又成为关键。在目前中国网络摄像机和视频服务器的产品市场上，各种压缩技术百花齐放，且各有优势，为用户提供了很大的选择空间。 JPEG 、M-JPEG 有相当一部分国内外网络摄像机和视频服务器都是采用JPEG，Motion-JPEG压缩技术，JPEG、M-JPEG采用的是帧内压缩方式，图像清晰、稳定，适于视频编辑，而且可以灵活设置每路的视频清晰度和压缩帧数。另外，因其压缩后的格式可以读取单一画面，因此可以任意剪接，特别适用与安防取证的用途。 Wavelet Transform 小波变换也属于帧内压缩技术，由于这种压缩方式移除了图像的高频成分，仅保留单帧图像信号，特别适用于画面变更频繁的场合，且压缩比也得到了一定的提高，因此也被一些网络摄像机和视频服务器所采用，例如，BOSCH推出的NetCam-4系列数字网络摄像机，深圳缔佳生产的NETCAM系列网络摄像机等。 H.263 H.263是一个较为成熟的标准，它是帧间预测和变换编码的混合算法，压缩比较高，尤其适用低带宽上传输活动视频。采用H.263技术生产的网络型产品，其成本较为适中，软/硬件丰富，适合集中监控数量较多的需求，如深圳大学通信技术研究所开发的SF－10网络摄像机和SF-20视频服务器，深圳新文鼎开发的W750视频服务器和W74GM网络摄像机等采用的都是这一压缩技术。 MPEG-4 MPEG-4的着眼点在于解决低带宽上音视频的传输问题，在164KHZ的带宽上，MPEG-4平均可传5－7帧/秒。采用MPEG-4压缩技术的网络型产品可使用带宽较低的网络，如PSTN，ISDN,ADSL等，大大节省了网络费用。另外，MPEG-4的最高分辨率可达720×576，接近DVD 画面效果，基于图像压缩的模式决定了它对运动物体可以保证有良好的清晰度。MPEG-4所有的这些优点，使它成为当前网络产品生产厂商开发的重要趋势之一。另外，也有部分厂商采用的是MPEG-1,MPEG-2压缩格式，除此之外，有的厂商还采用多种压缩技术相结合的方式，例如，有些国外推出的网络摄像机，其压缩方式就是MPEG-4,与JPEG 相结合，在可以看到JPEG静止图像的同时，利用MPEG-4高级压缩功能，令到高质量的动态图像也能在低带宽上传输。纵观以上这些压缩技术，虽然MPEG-4以其良好的图像压缩性能，可支持非常低的宽带上达到视频会议的质量，从而成为未来网络型产品开发的主流方向，但就现在市场的应用情况来看，MPEG-4暂时还没有占到主导地位，究其原因，主要是由于虽然MPEG-4的国际标准已经制定，但MPEG-4的算法是公开的因而厂商各自为政，良莠不齐，对后续的二次开发带来了严重的影响，另外，MPEG－4在图像质量上也有待提高，在复杂的网路环境中，数据流

常见的几种高清视频编码格式

高清视频的编码格式有五种，即H.264、MPEG-4、MPEG-2、WMA-HD以及VC-1。事实上，现在网络上流传的高清视频主要以两类文件的方式存在：一类是经过MPEG-2标准压缩，以tp和ts为后缀的视频流文件；一类是经过WMV-HD(Windows Media Video High Definition)标准压缩过的wmv文件，还有少数文件后缀为avi或mpg，其性质与wmv是一样的。真正效果好的高清视频更多地以H.264与VC-1这两种主流的编码格式流传。 H.264编码 H.264编码高清视频 H.264是由国际电信联盟(iTU-T)所制定的新一代的视频压缩格式。H.264 最具价值的部分是更高的数据压缩比，在同等的图像质量，H.264的数据压缩比能比当前DVD系统中使用的 MPEG-2高2～3倍，比MPEG-4高1.5～2倍。正因为如此，经过H.264压缩的视频数据，在网络传输过程中所需要的带宽更少，也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时，H.264只需要1Mbps～2Mbps 的传输速率，目前H.264已经获得DVD Forum与Blu-ray Disc Association采纳，成为新一代HD DVD的标准，不过H.264解码算法更复杂，计算要求比WMA-HD 还要高。从ATI的Radeon X1000系列显卡、NVIDIA的GeForce 6/7系列显卡开始，它们均加入对H.264硬解码的支持。与MPEG-4一样，经过H.264压缩的视频文件一般也是采用avi 作为其后缀名，同样不容易辨认，只能通过解码器来自己识别。总的来说，常见的几种高清视频编码格式的特点是能够以更低的码率得到更高的画质，相同效果的MPEG2与H.264影片做比较，后者在容量上仅需前者的一半左右。这也就意味着，H.264不仅能够节省HDTV的存储空间，而且还可以

视频压缩编解码标准

广州市诚讯电子有限公司培训教程之视频压缩编解码标准

目前视频流传输中最为重要的编解码标准有国际电联的H.261、H.263 、H.264 ，运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准，此外在互联网上被广泛应用的还有Real-Networks的RealVideo、微软公司的WMV以及Apple公司的QuickTime等。监控系统大致可分为信号采集、传输、记录三部分。应用不同的视频压缩格式会影响到图像清晰度、画面延时、稳定性，主要的视频压缩算法包括：M-JPEG、Mpeg、H.264、Wavelet（小波压缩）。

MPEG系列标准 MPEG-1标准：广泛的应用在VCD 的制作和一些视频片段下载的网络应用上面，可以说99% 的VCD 都是用MPEG1 格式压缩的。我们目前习惯的MP3，并不是MPEG-3，而是MPEG 1 layer 3，属于MPEG 1中的音频部分。MPEG 1的像质等同于VHS，存储媒体为CD-ROM，图像尺寸320×240，音质等同于CD，比特率为1.5Mbps。 MPEG-2标准: MPEG组织于1994年推出MPEG-2压缩标准，以实现视/音频服务与应用互操作的可能性。PEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定，编码码率从每秒3Mbps～100Mbps。MPEG-2不是MPEG-1的简单升级，MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善。MPEG-2特别适用于广播级的数字电视的编码和传送，被认定为DVD 和HDTV的编码标准。 MPEG-3标准: 是ISO/IEC最初为HDTV 开发的编码和压缩标准，要求传输速率在20Mbits/sev- 40Mbits/sec间，但这将使画面有轻度扭曲，而且由于MPEG2 的高速发展，此算法已被淘汰； MPEG-4标准: 传输速率要求较低，与MPEG-1和MPEG-2相比，更适于交互AV服务以及远程监控。此算法也是目前在监控领域应用比较广泛、成熟的；

几种视频压缩技术概述

几种视频压缩技术概述（返回）（一）、JPEG——静止图像压缩标准 1、 JPEG 国际标准化组织（ID）和国际电报电话咨询委员会（CCITT）联合成立的专家组织JPEG （Joint Photographic experts group经过五年艰苦细致地工作后，于是1991年3月提出了ISO CDIO918号建议草案：多灰度静止图像的数字压缩编码（简称JPEG标准）。这是一个适用于彩色和单多多灰度或连续色调静止数字图像的压缩标准。它包括基于 DPCM（差分脉冲编码调制）、DCT（离散余弦变换）和Huffman编码的有损压缩算法两个部分。前者不会产生失真，但压缩比很小；后一种算法进行图像压缩住处虽有损失但压缩比可以很大，压缩20倍左右时，人眼基本上看不出失真。JPEG标准有三个范畴： A、基本顺序过程Baseline sequential processes实现有损图像压缩。重建图像质量达到人眼难以实现图像质量达到人眼难以观察出损失的要求。采用8*8像素自适应DCT算法、量化及H uffman型的熵编码器。 B、基于DCT的扩展过程（Extended DCT Based Process）使用累进行工作方式，采用自适应算术的编码过程。 C、无失真过程（Lossless Process）采用预测编码及Huffman（或算术编码），可保证重建图像数据与原始图像数据完全相同。基中的基本顺序过程是JPEG最基本的压缩过程：符合JPEG标准的硬软件编码/解码器都必须支持和实现这个过程。另两个过程是可选扩展，对一些特定的应用项目有很大实用价值。（1）、JPEG算法基本JPEG算法操作可分成以下三个步骤：通过离散余弦变换（DCT）去除数据冗余；使用量化表对DCT系数进行量化，量化表是根据人类礼堂系统和压缩图像类型的特点进行优化的量化系数矩阵；对量化后的DCT系数时行编码使其熵达到最小，熵编码采用 Huffman可变字长编码（2）、离散余弦变换 JPEG采用8*8子块的二维离散余弦变换算法。在编者按码器的输入端，把原始图像（对

H265视频编码标准详解

数字视频编解码技术标准及其发展趋势解读下一代视频压缩标准HEVC(H.265) 在数字视频应用产业链的快速发展中，面对视频应用不断向高清晰度、高帧率、高压缩率方向发展的趋势，当前主流的视频压缩标准协议H.264(AVC)的局限性不断凸显。同时，面向更高清晰度、更高帧率、更高压缩率视频应用的HEVC(H.265)协议标准应运而生。本文重点分析了下一代视频压缩协议标准HEVC(H.265)的技术亮点，并对其在未来应用中将给整个产业带来的深刻变化予以展望。 H.264(AVC)从2003年5月草稿发布以来，凭借其相对于以往的视频压缩标准在压缩效率以及网络适应性方面的明显优势，逐步成为视频应用领域的主流标准。根据MeFeedia 的数据，由于iPad 以及其它新兴设备大多支持H.264 硬件加速，至2011年底，80%的视频使用H.264编码，并且随着支持H.264解码的设备不断增多，这一占有率还将进一步增长。但是，随着数字视频应用产业链的快速发展，视频应用向以下几个方向发展的趋势愈加明显： l 高清晰度(Higher Definition)：数字视频的应用格式从720 P向1080 P全面升级，在一些视频应用领域甚至出现了4K x 2K、8K x 4K的数字视频格式; l 高帧率(Higher frame rate )：数字视频帧率从30 fps向60fps、120fps甚至240fps的应用场景升级; l 高压缩率(Higher Compression rate )：传输带宽和存储空间一直是视频应用中最为关键的资源，因此，在有限的空间和管道中获得最佳的视频体验一直是用户的不懈追求。由于数字视频应用在发展中面临上述趋势，如果继续采用H.264编码就出现的如下一些局限性： (1) 宏块个数的爆发式增长，会导致用于编码宏块的预测模式、运动矢量、参考帧索引和量化级等宏块级参数信息所占用的码字过多，用于编码残差部分的码字明显减少。 (2) 由于分辨率的大大增加，单个宏块所表示的图像内容的信息大大减少，这将导致相邻的4 x 4或8 x 8块变换后的低频系数相似程度也大大提高，导致出现大量的冗余。 (3) 由于分辨率的大大增加，表示同一个运动的运动矢量的幅值将大大增加，H.264中采用一个运动矢量预测值，对运动矢量差编码使用的是哥伦布指数编码，该编码方式的特点是数值越小使用的比特数越少。因此，随着运动矢量幅值的大幅增加，H.264中用来对运动矢量进行预测以及编码的方法压缩率将逐渐降低。 (4) H.264的一些关键算法例如采用CAVLC和CABAC两种基于上下文的熵编码方法、deblock滤波等都要求串行编码，并行度比较低。针对GPU/DSP/FPGA/ASIC等并行化程度非常高的CPU，H.264的这种串行化处理越来越成为制约运算性能的瓶颈。为了面对以上发展趋势，2010年1月，ITU-T VCEG(Video Coding Experts Group) 和

视频编码标准汇总及比较

视频编码标准汇总及比较 MPEG-1 类型：Audio&Video 制定者：MPEG(Moving Picture Expert Group) 所需频宽：2Mbps 特性：对动作不激烈的视频信号可获得较好的图像质量，但当动作激烈时，图像就会产生马赛克现象。它没有定义用于额外数据流进行编对码的格式，因此这种技术不能广泛推广。它主要用于家用VCD，它需要的存储空间比较大。优点：对动作不激烈的视频信号可获得较好的图像质量。缺点：当动作激烈时，图像就会产生马赛克现象。它没有定义用于额外数据流进行编对码的格式，因此这种技术不能广泛推广。应用领域：Mixer 版权方式：Free 备注：MPEG-1即俗称的VCD。MPEG是ISO/IEC JTC1 1988年成立的运动图像专家组（Moving Picture Expert Group）的简称，负责数字视频、音频和其他媒体的压缩、解压缩、处理和表示等国际技术标准的制定工作。MPEG-1制定于1992年，它是将视频数据压缩成1~2Mb/s的标准数据流。对于清晰度为352×288的彩色画面，采用25帧/秒，压缩比为50：1时，实时录像一个小时，经计算可知需存储空间为600MB左右，若是8路图像以每天录像10小时，每月30天算，则要求硬盘存储容量为1440GB，则显然是不能被接受的。 --------------------------------------------------------------------------------------------- MPEG-2

类型：Audio&Video 制定者：MPEG(Moving Picture Expert Group) 所需频宽：视频上4.3Mbps，音频上最低的采样率为16kHz 特性：编码码率从每秒3兆比特～100兆比特，是广播级质量的图像压缩标准，并具有CD 级的音质。MPEG-2的音频编码可提供左、右、中及两个环绕声道，以及一个加重低音声道，和多达7个伴音声道。作为MPEG-1的兼容性扩展，MPEG-2支持隔行扫描视频格式和其它先进功能，可广泛应用在各种速率和各种分辨率的场合。但是MPEG-2标准数据量依然很大，不便存放和传输。优点：MPEG-2的音频编码可提供左、右、中及两个环绕声道，以及一个加重低音声道，和多达7个伴音声道，具有CD级的音质。可提供一个较广的范围改变压缩比，以适应不同画面质量、存储容量以及带宽的要求。支持隔行扫描视频格式和其它先进功能，可广泛应用在各种速率和各种分辨率的场合。缺点：压缩比较低，数据量依然很大，不便存放和传输，如用于网络方面则需要较高的网络带宽，因此不太适合用于Internet和VOD点播方面。应用领域：Mixer 版税方式：按个收取(最初的收费对象为解码设备和编码设备，中国DVD制造商每生产一台DVD需要交纳专利费16.5美元。向解码设备和编码设备收取的专利授权费每台2.5美元) 备注：MPEG-2是其颁布的（活动图像及声音编码）国际标准之一，制定于1994年，是为高级工业标准的图像质量以及更高的传输率而设计，为了力争获得更高的分辨率（720×486），提供广播级视频和CD级的音频，它是高质量视频音频编码标准。在常规电视的数字化、高清晰电视HDTV、视频点播VOD，交互式电视等各个领域中都是核心的技术之一。由于MPEG-2在设计时的巧妙处理，使得大多数MPEG-2解码器也可播放MPEG-1格式的数据，如VCD。MPEG-2的音频编码可提供左、右、中及两个环绕声道，以及一个加重低音声道，和多达7个伴音声道。我们平时所说的DVD就是采用MPEG-2编码压缩，所以可有8种语言的配音。除了作为DVD的指定标准外，MPEG-2的应用前景非常的广阔，

视频压缩编码及常用格式

视频压缩编码及常用格式数据压缩编码已经拥有很长的历史，压缩编码的理论基础是信息论。从信息的角度看，压缩就是去除数据中的消除冗余。即保留不确定的信息，去除确定的信息，用一种更接近信息本质的描述来代替原有冗余的描述压缩的目的是在尽可能保证视觉效果的前题下减少数据率。视频压缩比是指压缩后的数据量与压缩前的数据量之比。由于视频是连续的静态图像，因此其压缩编码算法与静态图像的压缩算法有某些共同的地方，但是运动的视频还有其本身的特性，因此在压缩是还要考虑其运动特性，这样才能达到高效果压缩的目的。自从上世纪四十年代第一台电视机问世以来，视频技术的研究与应用已经有近六十年的历史。当前电视技术均为模拟视频技术，经过几十年的发展和完善，已经十分成熟。世界通行的模拟电视制式主要有：PAL（欧洲、中国）NTSC（北美、日本）和SECAM（法国）。随着计算机技术近二十年的发展，特别是九十年代以来互联网的广泛应用，多媒体数字视频技术已经成为了当前信息科学中十分活跃的研究方向。数字化技术的引用。使得对视频信号的捕获、处理、压缩和储存都有了革命性的进步特别是在视频数据的压缩和储存上。国际电信联合会（ITC）于1990年正式提出了ITU-TH261建议，这是第一个关于使用化视频图像压缩编码的国际标准提议。九十年代中，IUT在该建议上提出了MPEG1、MPEG2、MPEG4、H.263和JPEG2000等压缩标准。这些标准的制定和颁布，极大的促进了数字视频压缩与编码技术的研究和实用化。视频编码标准的发展视频编码技术在近年得到了迅速的发展和广泛的应用，并在日渐成熟，起标准是多个视频编码国际化标准的制定与应用，即国际标准化组织ISO和国际电工委员会IEC关于静态图像的编码标准JPEG、国际电信联盟ITU-T关于电视、电话会议的视频编码标准H261、H.263及H.264和ISO/TEC关于活动图像的编码标准MPEG-1,MPEG-2、MPEG-4等。这些标准图像编码算法融合了各种性能优良的图像编码方法，代表了目前编码的发张水平。 MPEG-1 MPEG-1标准于1993年8月公布，用于传输1.5Mbps数据传输的数据储存媒体运动图像及其伴音的编码。该标准包括五个部分：第一：说明如何根据第二部（视频）以及第三部分（音频）的规定，对音频和视频进行复合编码。第四部分说明检验解码器或编码器的输出比流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。 MPEG-1取得一连串的成功，如VCD和MP3的大量使用，可携式MPEG-1摄像

音频、视频压缩有哪些技术标准

音频、视频压缩有哪些技术标准？视频压缩技术有：MPEG-4、H263、H263+、H264等 MPEG-4视频编码技术介绍 MPEG是“Moving Picture Experts Group”的简称，在它之前的标准叫做JPEG，即“Joint Photographic Experts Group”。当人们用到常见的“.jpg”格式时，实际上正在使用JPEG的标准。JPEG规范了现代视频压缩的基础，而MPEG把JPEG 标准扩展到了运动图象。 MPEG-4视频编码标准支持MPEG-1、MPEG-2中的大多数功能，它包含了H.263的核心设计，并增加了优先特性和各种各样创造性的新特性。它提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码，同时也支持基于内容的图像编码。采纳了基于对象(Object-Based)的编码、基于模型(Model-based)的编码等第二代编码技术是MPEG-4标准的主要特征。 MPEG4与MPEG1、MPEG2的比较从上表可以看出，MPEG1和MPEG2主要应用于固定媒体，比如 VCD 和 DVD ，而对于网络传输，MPEG4具有无可比拟的优势。 H.263/H.263+/H.264视频编码技术介绍 1.H.263视频编码标准 1.H.263是最早用于低码率视频编码的ITU-T标准，随后出现的第二版(H.263+)及H.263++增加了许多选项，使其具有更广泛的适用性。 H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准。它是在H.261基础上发展起来的，其标准输入图像格式可以是

S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亚取样图像。 H.263与H.261相比采用了半象素的运动补偿，并增加了4种有效的压缩编码模式。 2.H.263+视频压缩标准 1.ITU-T在H.263发布后又修订发布了H.263标准的版本2，非正式地命名为H.263+标准。它在保证原H.263标准核心句法和语义不变的基础上，增加了若干选项以提高压缩效率或改善某方面的功能。原 H.263标准限制了其应用的图像输入格式，仅允许5种视频源格式。 H.263+标准允许更大范围的图像输入格式，自定义图像的尺寸，从而拓宽了标准使用的范围，使之可以处理基于视窗的计算机图像、更高帧频的图像序列及宽屏图像。为提高压缩效率，H.263+采用先进的帧内编码模式；增强的PB-帧模式改进了H.263的不足，增强了帧间预测的效果；去块效应滤波器不仅提高了压缩效率，而且提供重建图像的主观质量。为适应网络传输，H.263+增加了时间分级、信噪比和空间分级，对在噪声信道和存在大量包丢失的网络中传送视频信号很有意义；另外，片结构模式、参考帧选择模式增强了视频传输的抗误码能力。 3.H.264视频压缩标准 1.H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准。对信道时延的适应性较强，既可工作于低时延模式以满足实时业务，如会议电视等；又可工作于无时延限制的场合，如视频存储等。 2.提高网络适应性，采用“网络友好”的结构和语法，加强对误码和丢包的处理，提高解码器的差错恢复能力。 3.在编/解码器中采用复杂度可分级设计，在图像质量和编码处理之间可分级，以适应不同复杂度的应用。 4.相对于先期的视频压缩标准，H.264引入了很多先进的技术，包括 4×4整数变换、空域内的帧内预测、1/4象素精度的运动估计、多参考帧与多种大小块的帧间预测技术等。新技术带来了较高的压缩比，同时大大提高了算法的复杂度。 G.7xx系列典型语音压缩标准介绍 G.7xx 是一组 ITU-T 标准，用于视频压缩和解压过程。它主要用于电话方面。在电话学中，有两个主要的算法，分别定义在 mu-law 算法（美国使用）和 a-law 算法（欧洲及世界其他国家使用），两者都是对数关系，但对于计算机的处理来说，后者的设计更为简单。国际电信联盟G系列典型语音压缩标准的参数比较：

下一代视频编码标准HEVC分析研究

北京航空航天大学 2012－2013学年第一学期期末《视频编码技术及其应用》课程大作业班级_____学号__________ 姓名____________成绩 _________ 2012 年1 月5日

下一代视频编码标准HEVC分析研究（北京航空航天大学计算机学院）目录摘要 (3) 关键字 (3) Abstract (3) Key Words (3) 1、引言 (3) 1.1背景简介 (3) 1.2当前视频编码的主要挑战 (4) 1.3 H.264的缺点 (5) 1.4 HEVC的主要特征 (5) 2、HEVC技术分析 (6) 2.1 灵活的编码结构 (6) 2.2 多方向帧内预测 (7) 2.3 大尺度DCT变换 (7) 2.4 自适应采样点补偿 (7) 2.5 并行化的熵编码 (7) 3、结论 (8) 4、参考文献 (8)

摘要下一代视频编码标准HEVC是继H.264之后视频编码领域的又一重大突破，该标准主要针对目前日益盛行的高清、超高清视频而开发，在克服H.264标准不足的同时，提出了多种针对高清视频编码的新技术。本文首先介绍了视频编码的背景和当前视频编码领域的主要挑战，随后分析了H.264编码标准的不足之处，进而引出了下一代视频编码标准HEVC。通过对HEVC中一些新技术的分析介绍，阐明了HEVC在高清视频领域的优势，对于详细了解HEVC的框架结构有提纲挈领的作用。关键字视频编码；HEVC；超高清视频编码；自适应采样点补偿；并行化熵编码 Abstract HEVC(High Efficiency Video Coding) is another breakthrough in video coding field after H.264, it concentrates on High Definition or Super High Definition video coding. In this paper, the background of video coding and some challenges of current video coding field is introduced first. After analysing some shortages of H.264, the author brings out the features of HEVC. The advantages of HEVC in High Definition video coding is clarified by analysing some new technologies in HEVC. This paper will be a introduction to details about HEVC. Key Words Video Coding; HEVC; Super High Definition Video Coding; Sample Adaptive Offset; Parallelization of Entropy Coding 1、引言 1.1背景简介当前世界上的视频编码标准主要来源于国际电信联盟(ITU-T)的视频编码专家组VCEG和国际标准化组织(ISO)的运动图像专家组MPEG，他们基于不同的应用需求，分别制定了H.26x和MPEG系列视频编码标准。ITU的H.26x系列标准主要应用在实时的视频通信系统中，而MPEG系列标准则主要用于数字监控系统、视频存储、广播电视及因特网领域[1]。 2001年MPEG和VCEG又成立了视频联合工作组JVT，制定了H.264/AVC(即MPEG-4的第10部分)视频编码标准。H.264标准使得视频压缩效率提高到了一个

各种音视频编解码学习详解

各种音视频编解码学习详解编解码学习笔记（一）：基本概念媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起，在运营商和应用开发商中，媒体业务份量极重，其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系，需要理清媒体的codec，比较搞的是，在豆丁网上看运营商的规范标准，同一运营商同样的业务在不同文档中不同的要求，而且有些要求就我看来应当是历史的延续，也就是现在已经很少采用了。所以豆丁上看不出所以然，从wiki上查。中文的wiki信息量有限，很短，而wiki的英文内容内多，删减版也减肥得太过。我在网上还看到一个山寨的中文wiki，长得很像，红色的，叫―天下维客‖。wiki的中文还是很不错的，但是阅读后建议再阅读英文。我对媒体codec做了一些整理和总结，资料来源于wiki，小部分来源于网络博客的收集。网友资料我们将给出来源。如果资料已经转手几趟就没办法，雁过留声，我们只能给出某个轨迹。基本概念编解码编解码器（codec）指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将信号或者数据流进行编码（通常是为了传输、存储或者加密）或者提取得到一个编码流的操作，也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中。容器很多多媒体数据流需要同时包含音频数据和视频数据，这时通常会加入一些用于音频和视频数据同步的元数据，例如字幕。这三种数据流可能会被不同的程序，进程或者硬件处理，但是当它们传输或者存储的时候，这三种数据通常是被封装在一起的。通常这种封装是通过视频文件格式来实现的，例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 这些格式中有些只能使用某些编解码器，而更多可以以容器的方式使用各种编解码器。 FourCC全称Four-Character Codes，是由4个字符（4 bytes）组成，是一种独立标示视频数据流格式的四字节，在wav、avi档案之中会有一段FourCC来描述这个AVI档案，是利用何种codec来编码的。因此wav、avi大量存在等于―IDP3‖的FourCC。视频是现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要，人们设定了不同的视频文件格式来把视频和音频放在一个文件中，以方便同时回放。视频档实际上都是一个容器里面包裹着不同的轨道，使用的容器的格式关系到视频档的可扩展性。参数介绍采样率采样率（也称为采样速度或者采样频率）定义了每秒从连续信号中提取并组成离散信号的采样个数，它用赫兹（Hz）来表示。采样频率的倒数叫作采样周期或采样时间，它是采样之间的时间间隔。注意不要将采样率与比特率（bit rate，亦称―位速率‖）相混淆。采样定理表明采样频率必须大于被采样信号带宽的两倍，另外一种等同的说法是奈奎斯特频率必须大于被采样信号的带宽。如果信号的带宽是100Hz，那么为了避免混叠现象采样频率必须大于200Hz。换句话说就是采样频率必须至少是信号中最大频率分量频率的两倍，否则就不能从信号采样中恢复原始信号。对于语音采样： ?8,000 Hz - 电话所用采样率, 对于人的说话已经足够 ?11,025 Hz ?22,050 Hz - 无线电广播所用采样率 ?32,000 Hz - miniDV 数码视频camcorder、DAT (LP mode)所用采样率 ?44,100 Hz - 音频CD, 也常用于MPEG-1 音频（VCD, SVCD, MP3）所用采样率

视频压缩编码标准H.264详解

视频压缩编码标准H.264详解 ——新疆大学2006级工硕郭新军 JVT（Joint Video Team，视频联合工作组）于2001年12月在泰国Pattaya 成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。JVT的工作目标是制定一个新的视频编码标准，以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。目前JVT的工作已被ITU-T接纳，新的视频压缩编码标准称为H.264标准，该标准也被ISO接纳，称为AVC（Advanced Video Coding）标准，是MPEG-4的第10部分。 H.264标准可分为三档：基本档次（其简单版本，应用面广）；主要档次（采用了多项提高图像质量和增加压缩比的技术措施，可用于SDTV、HDTV和DVD等）；扩展档次（可用于各种网络的视频流传输）。 H.264不仅比H.263和MPEG-4节约了50％的码率，而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制，有利于网络中的分组传输，支持网络中视频的流媒体传输。H.264具有较强的抗误码特性，可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输，从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输，网络亲和性好。一、H.264视频压缩系统 H.264标准压缩系统由视频编码层（VCL）和网络提取层（Network Abstraction Layer，NAL）两部分组成。VCL中包括VCL编码器与VCL解码器，主要功能是视频数据压缩编码和解码，它包括运动补偿、变换编码、熵编码等压缩单元。NAL则用于为VCL提供一个与网络无关的统一接口，它负责对视频数据

视频压缩编解码标准综述

视频压缩编解码标准综述摘要：本文从目前视频流传输中最为重要的编解码标准国际电联的H.261、H.263，运动静止图像专家组的M-JPEG，国际标准化组织运动图像专家组的MPEG系列标准，以及在互联网上被广泛应用的Real Video、WMT、 QuickTime等方面，详细地介绍了视频压缩编解码标准及其应用。关键词：视频压缩编解码标准，H.261，H.263，M-JPEG，MPEG，MPEG-1，MPEG-2，MPEG-4，MPEG-7，MPEG-21，Real Video，WMT，QuickTime。随着Internet带宽的不断增长，在Internet上传输视频的相关技术也成为Internet节研究和开发的热点。目前，许多实验性的高速宽带网络都把视频传输的技术和应用作为研究的重点课题。在Internet上传输视频有许多困难，其根本的原因在于Internet的无连接每包转发机制主要为突发性的数据传输设计，不适用于对连续媒体流的传输。为了在Internet上有效的、高质量的传输视频流，需要多种技术的支持，其中数字视频的压缩编码技术是Internet视频传输中的关键技术之一。此外，在多媒体的传输、处理、应用中还有许多问题：如何在网络上传输视频？如何通过手机上网并接收视频和图像？如何对多媒体数据进行快速有效的检索？如何对多媒体信息进行统一的存取？等等。目前视频流传输中最为重要的编解码标准有国际电联的H.261、H.263，运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准，此外在互联网上被广泛应用的还有Real-Networks的RealVideo、微软公司的WMT 以及Apple公司的QuickTime等。具体如下：一、国际电联的H.261、H.263标准 1．H.261 H.261又称为P*64，其中P为64kb/s的取值范围，是1到30的可变参数，它最初是针对在ISDN上实现电信会议应用特别是面对面的可视电话和视频会议而设计的。实际的编码算法类似于MPEG算法，但不能与后者兼容。H.261在实时编码时比MPEG所占用的CPU运算量少得多，此算法为了优化带宽占用量，引进了在图像质量与运动幅度之间的平衡折中机制，也就是说，剧烈运动的图像比相对静止的图像质量要差。因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编码。 2．H.263 H.263是国际电联ITU-T的一个标准草案，是为低码流通信而设计的。但实际上

视频格式与编码压缩标准的关系

视频格式与编码压缩标准的关系通过引入下面三个概念来介绍视频压缩知识。分别是：视频文件格式（简称：文件格式），视频封装格式（简称：视频格式），视频编码方式（简称：视频编码）一，视频文件格式（简称：文件格式）：我们知道Windows系统中的文件名都有后缀，例如1.doc，2.wps，3.psd等等。Windows设置后缀名的目的是让系统中的应用程序来识别并关联这些文件，让相应的文件由相应的应用程序打开。例如你双击1.doc文件，它会知道让Microsoft Office去打开，而不会用Photoshop去打开这个文件。所以常见的视频文件格式如1.avi，2.mpg 这些都叫做视频的文件格式，它由你电脑上安装的视频播放器关联。你可以随意改扩展名，但是真的对视频一点影响都没有，千万不要以为avi 改成mp4，视频就变成mp4 格式了。二，视频封装格式（简称：视频格式）：AVI，MPEG，VOB是一种视频封装格式，相当于一种储存视频信息的容器。它是由相应的公司开发出来的。我们可以在自己的电脑上看到的1.avi，2.mpg，3.vob这些视频文件格式的后缀名即采用相应的视频封装格式的名称。以下集中介绍几种封装格式： 1，AVI格式（后缀为.AVI）：它的英文全称为Audio Video Interleaved，即音频视频交错格式。它于1992年被Microsoft公司推出。这种视频格式的优点是图像质量好。由于无损AVI可以保存alpha通道，经常被我们使用。缺点太多，体积过于庞大，而且更加糟糕的是压缩标准不统一，最普遍的现象就是高版本Windows媒体播放器播放不了采用早

各种音视频编解码学习详解 h264

各种音视频编解码学习详解h264 ，mpeg4 ，aac 等所有音视频格式编解码学习笔记（一）：基本概念媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起，在运营商和应用开发商中，媒体业务份量极重，其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系，需要理清媒体的codec，比较搞的是，在豆丁网上看运营商的规范标准，同一运营商同样的业务在不同文档中不同的要求，而且有些要求就我看来应当是历史的延续，也就是现在已经很少采用了。所以豆丁上看不出所以然，从wiki上查。中文的wiki信息量有限，很短，而wiki的英文内容内多，删减版也减肥得太过。我在网上还看到一个山寨的中文wiki，长得很像，红色的，叫―天下维客‖。wiki的中文还是很不错的，但是阅读后建议再阅读英文。我对媒体codec做了一些整理和总结，资料来源于wiki，小部分来源于网络博客的收集。网友资料我们将给出来源。如果资料已经转手几趟就没办法，雁过留声，我们只能给出某个轨迹。基本概念编解码编解码器（codec）指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将信号或者数据流进行编码（通常是为了传输、存储或者加密）或者提取得到一个编码流的操作，也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中。容器很多多媒体数据流需要同时包含音频数据和视频数据，这时通常会加入一些用于音频和视频数据同步的元数据，例如字幕。这三种数据流可能会被不同的程序，进程或者硬件处理，但是当它们传输或者存储的时候，这三种数据通常是被封装在一起的。通常这种封装是通过视频文件格式来实现的，例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 这些格式中有些只能使用某些编解码器，而更多可以以容器的方式使用各种编解码器。 FourCC全称Four-Character Codes，是由4个字符（4 bytes）组成，是一种独立标示视频数据流格式的四字节，在wav、a vi档案之中会有一段FourCC来描述这个AVI档案，是利用何种codec来编码的。因此wav、avi大量存在等于―IDP3‖的FourCC。视频是现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要，人们设定了不同的视频文件格式来把视频和音频放在一个文件中，以方便同时回放。视频档实际上都是一个容器里面包裹着不同的轨道，使用的容器的格式关系到视频档的可扩展性。参数介绍采样率采样率（也称为采样速度或者采样频率）定义了每秒从连续信号中提取并组成离散信号的采样个数，它用赫兹（Hz）来表示。采样频率的倒数叫作采样周期或采样时间，它是采样之间的时间间隔。注意不要将采样率与比特率（bit rate，亦称―位速率‖）相混淆。

浅谈H.265视频编解码技术标准的概念

浅谈H.265视频编解码技术标准的概念于国际电联ITU-T 和国际标准化组织ISO，ITU 的H.26×系列视频压缩标准经过了H.261、H.263，h.263+这样一个演进过程。而ISO 的视频压缩标准是MPEG 系列，从MPEG1、MEPG2 到MPEG4，之后两个标准化组合走向合作，成立了JVT，推出了在当前最有效的视频压缩标准，H.264/AVC。从H.264 标准发布到如今已经有五年时间，在这五年中H.264 的应用范围不断扩展，成熟度不断提高，而ITU—T 在H.264 取得初步成功的时候，ITU—T 的视频编码特别小组VCEG 于2005 年就对视频编码技术提出了更长远的设想。并规划在技术成熟时推出新一代的视频编码标准H.265。2012 年8 月，爱立信公司推出了首款H.265 编解码器，而在仅仅六个月之后，国际电联(ITU)就正式批准通过了HEVC/H.265 标准，标准全称为高效视频编码(HighEfficiencyVideoCoding)，相较于之前的H.264 标准有了相当大的改善。提出H.265 标准.是为了给音视频服务提供更好的视频编码方法。音视频服务包括会话式和非会话式音视频服务。其中会话式音视频服务包括视频会议和可视电话，非会话式音视频服务包括流媒体、广播、文档下载、媒体存储/播放和数字摄像机。H.265 标准围绕着现有的视频编码标准H.264，保留原来的某些技术，同时对一些相关的技术加以改进。新技术使用先进的技术用以改善码流、编码质量、延迟和算法复杂度之间的关系，达到最优化设置。具体的研究内容包括：提高压缩效率、提高鲁棒性和错误恢复能力、减少实时的迟延、减少信道获取时间和随机接入迟延、降低复杂度等。H.264 由于算法优化，可以低于1Mbps 的速度实现标清数字图像传送;H.265 则可以实现利用1~2Mbps 的传输速度传送720P(分辨率1280×720)普通高清音视频传送。事实上，H.265 视频压缩技术早在H.264 发布后不久，即进行了关键技术领