当前位置:文档之家› 9章 视频压缩技术基础

9章 视频压缩技术基础

9章 视频压缩技术基础
9章 视频压缩技术基础

1

浙江工业大学信息学院古辉

gh@https://www.doczj.com/doc/021887432.html,

多媒体技术

多媒体技术

第九章基本视频压缩技术

2

多媒体技术

第九章基本视频压缩技术

z

9.1 电视图像的数据率z

9.2 视频数据压缩算法

3

多媒体技术

9.1 电视图像的数据率

z

图像采集的两种方式

RGB

红(R)、绿(G)、蓝(B)

显示到显示器上需要用RGB 格式

YUV

Y 表示亮度,U 和V 表示色差空间。U 和V 是构成彩色的两个彩色分量,Y 和U 、V 是相互独立的。

YUV 优点:黑白电视可接收彩色电视信号;利用YUV 的独立性和人眼的特性来降低数字图像的存贮容量。

两者之间的转换

Y = 77/256R + 150/256G + 29/256B

U = -44/256R -87/256G + 131/256B + 128 V = 131/256R -110/256G -21/256B + 128

4

多媒体技术

9.1 电视图像的数据率

z

YUV 格式

使用相同的分辨率对图像的亮度信号和色差信号进行采样;

对图像的亮度信号和色差信号采用不同的采样频率(Subsampling ,子采样)。

YUV444,YUV422,YUV411,YUV420 ;

YUV420指在水平和垂直方向上每2个连续的采样点上取2个Y 样本,1个红色色差Cr 样本,1个蓝色色差Cb 样本;

YUV411水平方向上每4个连续的采样点取4个亮度Y 样本,1个红色色差Cr 样本,1个蓝色色差Cb 样本。

5

多媒体技术

9.1 电视图像的数据率

z

ITU(国际电汜联仫)-R BT.601标褡数诉徙(4:2:2ó样太阋)

亮度(Y): ( 采样频率13.5MHz/s)

858样本/行×525行/帧×30帧/秒×10比特/样本= 135Mb/s(NTSC)864样本/行×625行/帧×25帧/秒×10比特/样本= 135Mb/s(PAL)

Cr (R-Y) : ( 采样频率6.75MHz/s)

429样本/行×525行/帧×30帧/秒×10比特/样本= 68Mb/s(NTSC)429样本/行×625行/帧×25帧/秒×10比特/样本= 68Mb/s (PAL)

Cb (B-Y): ( 采样频率6.75MHz/s)

429样本/行×525行/帧×30帧/秒×10比特/样本= 68Mb/s (NTSC)429样本/行×625行/帧×25帧/秒×10比特/样本= 68Mb/s (PAL)

总计: 270兆比特/秒

6

多媒体技术

9.1 电视图像的数据率

z

荧光屏上显示的有效图像的数据传输率计算:

亮度(Y):

720样本/行×480行/帧×30帧/秒×10比特/样本= 104Mb/s (NTSC)720样本/行×576行/帧×25帧/秒×10比特/样本= 104Mb/s (PAL) 色差( Cr, Cb):

2×360样本/行×480行/帧×30帧/秒×10比特/样本=104Mb/s (NTSC)2×360样本/行×576行/帧×25帧/秒×10比特/样本=104Mb/s (PAL)

z

总计: 207 Mb/s ;如果采样精度由10位降为8比特,彩色数字电视信号的数据传输率为166 Mb/s 。

7

多媒体技术

9.1 电视图像的数据率

z

VCD Video 图像数据率的估算

Video-CD 存储器的数据传输率可达到1.4112 Mb/s, 分配给电视信号的数据传输率为1.15 Mb/s, 存储166 Mb/s 的数字电视信号压缩比高达166/1.15 ≈144:1。显然,需要进行压缩。

MPEG-1电视图像压缩技术不能达到这样高的压缩比。

为此首先把NTSC 和PAL 数字电视转换成公用中分辨率格式CIF(Common Intermediate Format)的数字电视,这种格式相当于VHS(Video Home System)的质量,于是彩色数字电视的数据传输率就减小到

352×240×30×8×1.5 ≈30 Mb/s (NTSC) 352×288×25×8×1.5 ≈30 Mb/s (PAL)

所需要的压缩比为:30/1.15 ≈26:1。这就是MPEG-1 (YUV420) 技术所能获得的压缩比。≈8

多媒体技术

9.1 电视图像的数据率

z

DVD 电视图像数据率的估算

DVD-Video 存储器的数据传输率可以达到10.08 Mb/s ,

但一张4.7 GB 的单面单层DVD 盘要存放133分钟的电视节目,按照数字电视信号的平均数据传输率为4.1 Mb/s 来计算,压缩比要达到:166/4.10 ≈40:1。

如果电视图像的子采样使用4:2:0格式,每个样本的精度为8比特,数字电视信号的数据传输率就减小到124 Mb/s ,即

720×480×30×8×1.5 ≈124 Mb/s (NTSC) 720×576×25×8×1.5 ≈124 Mb/s (PAL)

使用DVD-Video 来存储720×480×30或者

720×576×25的数字电视图像所需要的压缩比为:124/4.1 ≈30:1。

9

多媒体技术

表9.1 动态视频压缩利用的各种冗余信息9.2 视频数据压缩算法

z

电视图像数据压缩的方法

压缩方法归纳在表9.1中。电视图像本身在时间和空间上都含

有冗余信息,图像自身的构造也有冗余性。此外,利用人的视觉特性也可对图像进行压缩,这叫做视觉冗余。

时间冗余

空间冗余不确定因素

其他

非线性量化,位分配

人的视觉特性视觉冗余基于知识的编码收发两端的共有认识

知识冗余轮廓编码,区域分割图像本身的构造图像构造冗余帧间预测,移动补偿时间方向上的相关性变换编码,预测编码像素间的相关性统计特性

目前使用的主要方法内容种类

10

多媒体技术

9.2 视频数据压缩算法

z

MPEG 专家组定义了三种图像:

帧内图像I(intrapictures)

预测图像P(predicted pictures)

插补(双向预测)图像B(bidirectionally interpolated)

图9.1 MPEG 专家组定义了三种图像

11

多媒体技术

9.2 视频数据压缩算法

z

帧内图像I的压缩编码算法

帧内图像I 不参照任何过去的或者将来的其他图像帧,采用类似JPEG 压缩算法。如果电视图像是RGB 空间表示,则首先把它转换成YCrCb 空间表示的图像。

每个图像平面分成8×8的图块,对每个图块进行离散余弦变换DCT(discrete Cosine Transform)。

DCT 变换后经过量化的交流分量系数按照Zig-zag 的形状排序,然后再使用无损压缩技术进行编码。

DCT 变换后经过量化的直流分量系数用差分脉冲编码DPCM(Differential Pulse Code Modulation),交流分量系数用行程长度编码RLE(run-length encoding),然后再用霍夫曼(Huffman)编码或者用算术编码。

它的编码框图如图9.2所示。

12

多媒体技术

9.2 视频数据压缩算法

图9.2 帧内图像I 的压缩编码算法框图

13

z

预测图像P的压缩编码算法

编码也是以图像宏块(macroblock)为基本编码单元,一个宏块定义为I ×J 像素的图像块,一般取16×16。

使用两种类型的参数表示:一种参数是当前要编码的图像宏块与参考图像的宏块之间的差值,另一种参数是宏块的移动矢量。移动矢量的概念如图9.3所示。

图9.3 移动矢量

的概念

14

求解差值方法如图9.4所示。假设编码图像宏块为M PI ,参考图像宏块为M RJ ,它们的差值就是这两个宏块中相应像素值之差。对所求得的差值进行彩色空间转换,并作4:1:1的子采样得到Y,Cr 和Cb 分量值,然后仿照JPEG 压缩算法对差值进行编码,计算出的移动矢量也要进行霍夫曼编码。

图9.4 预测图像P 的压缩编码

算法框图

15多媒体技术

9.2 视频数据压缩算法

z

求解移动矢量的方法定义在图9.5中。在求两个宏块差值之前,需要找出编码图像中的预测图像编码宏块M PI 相对于参考图像中的参考宏块M RJ 所移动的距离和方向,这就是移动矢量(motion vector)。

图9.5 移动矢量的

算法框图

16

多媒体技术

绝对差值AE 均方误差MSE

平均绝对帧差MAD

9.2 视频数据压缩算法

最佳匹配判据

[]∑∑≤≤==???×=

2

12

2

1)

16(,

),(),(1j y

x

i j i d j d i g j i f J

I MSE ∑∑≤≤==???×=

2

12

1)

16(,),(),(1j y

x

i j i d

j d i g j i f J

I MAD )

16(,),(),(15

15

0==???=∑∑

==j i d j d

i g j i f AE j y x

i 17

多媒体技术

图9.6 二维对数搜索法(2D-logarithmic search)

9.2 视频数据压缩算法

二维对数搜索法(2D-logarithmic search)

这种方法采用MSE 匹配判据。搜索策略是沿着最小失真方向搜索。在搜索时,每移动一次就检查5个搜索点。

在例子中,步骤1, 2, …, 5得到的近似移动矢量d 为(i ,j-2)、(i, j-4)、(i+2, j-4)、(i+2,j-5)和(i+2, j-6),最后得到的移动矢量为d(i+2, j-6)。

18

多媒体技术

图9.7 三步搜索法(three-step search)

9.2 视频数据压缩算法

三步搜索法(three-step search)

这种搜索法与二维对数搜索法很接近。不过在开始搜索时,搜索点离(i,j)这个中心点很远,第一步就测试8个搜索点,如图9.7所示。在这个例子中,点(i+3,j-3)作为第一个近似的移动矢量d1;第二步,搜索点偏离(i+3,j-3)较近,找到的点假定为(i+3,j-5);第三步给出了最后的移动矢量为d(i+2,j-6)。本例采用MAD 作为匹配判据。

19

图9.8 对偶搜索法(conjugate search)

对偶搜索法(conjugate search)

该法使用MAD 作为匹配判据,示例如图9.8。在第一次搜索时,通过计算点(i-1,j)、(i ,j)和(i+1,j)处的MAD 值来决定i 方向上的最小失真。如果计算结果表明点(i+1,j)处的MAD 为最小,就计算点(i+2,j)处的MAD ,并从(i ,j),(i+1,j)和(i+2,j)的MAD 中找出最小值。按这种方法一直进行下去,直到在i 方向上找到最小MAD 值及其对应的点。假定在i 方向上找到的点为(i+2,j)。在i 方向上找到最小MAD 值对应的点之后,就沿j 方向去找最小MAD 值对应的点,方法与i 方向的搜索方法相同。最后得到的移动矢量为d(i+2,j-6)。20

z

双向预测图像B 的压缩编码算法

双向预测图像B 的压缩编码框图如图9.9所示。具体计算

方法与预测图像P 的算法类似。

图9.9 双向预测图像B 的压缩编码算法框图

21

多媒体技术

两幅B 位于两个参考图像间每15帧插入一幅I

9.2 视频数据压缩算法

z

MPEG Video 典型流结构

表9.2 MPEG 三种图像压缩后的典型值(比特)

图像类型

I P B 平均数据/帧MPEG-1 CIF 格式(1.15 Mb/s)150 00050 00020 00038 000MPEG-2 601 格式(4.00 Mb/s)

400 000

200 000

80 000

130 000

22

多媒体技术

第九章基本视频压缩技术

本次课结束再见!

视频压缩编码方法简介—AVI

视频压缩编码方法简介—AVI AVI(Audio Video Interleave)是一种音频视像交插记录的数字视频文件格式。1992年初Microsoft公司推出了AVI技术及其应用软件VFW(Video for Windows)。在AVI文件中,运动图像和伴音数据是以交织的方式存储,并独立于硬件设备。这种按交替方式组织音频和视像数据的方式可使得读取视频数据流时能更有效地从存储媒介得到连续的信息。构成一个AVI文件的主要参数包括视像参数、伴音参数和压缩参数等: 1、视像参数 (1)、视窗尺寸(Video size):根据不同的应用要求,AVI的视窗大小或分辨率可按4:3的比例或随意调整:大到全屏640×480,小到160×120甚至更低。窗口越大,视频文件的数据量越大。 (2)、帧率(Frames per second):帧率也可以调整,而且与数据量成正比。不同的帧率会产生不同的画面连续效果。 2、伴音参数:在AVI文件中,视像和伴音是分别存储的,因此可以把一段视频中的视像与另一段视频中的伴音组合在一起。AVI 文件与WAV文件密切相关,因为WAV文件是AVI文件中伴音信号的来源。伴音的基本参数也即WAV文件格式的参数,除此以外,AVI文件还包括与音频有关的其他参数: (1)、视像与伴音的交织参数(Interlace Audio Every X Frames)AVI格式中每X帧交织存储的音频信号,也即伴音和视像交替的频率X是可调参数,X的最小值是一帧,即每个视频帧与音频数据交织组织,这是CD-ROM上使用的默认值。交织参数越小,回放AVI文件时

读到内存中的数据流越少,回放越容易连续。因此,如果AVI文件的存储平台的数据传输率较大,则交错参数可设置得高一些。当AVI文件存储在硬盘上时,也即从硬盘上读AVI文件进行播放时,可以使用大一些的交织频率,如几帧,甚至1秒。 (2)、同步控制(Synchronization) 在AVI文件中,视像和伴音是同步得很好的。但在MPC中回放AVI文件时则有可能出现视像和伴音不同步的现象。 (3)、压缩参数:在采集原始模拟视频时可以用不压缩的方式,这样可以获得最优秀的图像质量。编辑后应根据应用环境环择合适的压缩参数。 3、 AVI数字视频的特点 (1)、提供无硬件视频回放功能:AVI格式和VFW软件虽然是为当前的MPC设计的,但它也可以不断提高以适应MPC的发展。根据AVI格式的参数,其视窗的大小和帧率可以根据播放环境的硬件能力和处理速度进行调整。在低档MPC机上或在网络上播放时,VFW的视窗可以很小,色彩数和帧率可以很低;而在Pentium级系统上,对于64K色、320×240的压缩视频数据可实现每秒25帧的回放速率。这样,VFW就可以适用于不同的硬件平台,使用户可以在普通的MPC上进行数字视频信息的编辑和重放,而不需要昂贵的专门硬件设备。 (2)、实现同步控制和实时播放:通过同步控制参数,AVI可以通过自调整来适应重放环境,如果MPC的处理能力不够高,而AVI文件的数据率又较大,在WINDOWS环境下播放该AVI文件时,播放器可

高清视频编码器中文说明书H265-H264汇总

H.265/H.264高清视频编码器 上海禾鸟电子科技有限公司荣誉出品

一、产品简介 H.265/H.264高清视频编码器有HDMI\SDI\VGA三种高清接口产品,是由上海禾鸟电子自主研发的用于高清视频信号编码及网络传输直播的硬件设备,采用最新高效 H.265/H.264高清数字视频压缩技术,具备稳定可靠、高清晰度、低码率、低延时等特点。输入高清HDMI、SDI、VGA高清视频、音频信号,进行编码处理,经过DSP芯片压缩处理,输出标准的TS网络流,直接取代了传统的采集卡或软件编码的方式,采用硬编码方式,系统更加稳定,图像效果更加完美,广泛用于各种需要对高清视频信号及高分辨率、高帧率进行采集并基于IP 网络传送的场合,强大的扩展性更可轻易应对不同的行业及需求,可作为视频直播编码器,录像,传输等应用。采用工业控制精密设计,体积小,方便安装,功率小于5W,更节能,更稳定。 特点: ●高性能硬件编码压缩 ●支持H.265高效视频编码 ●支持H.264 BP/MP/HP ●支持AAC/G.711高级音频质编码格式 ●CBR/VBR码率控制,16Kbps~12Mbps ●网络接口采用100M、1000M 全双工模式 ●主流,副流可推流不同的服务器 ●支持高达720P,1080P@60HZ的高清视频输入 ●支持图像参数设置 ●HDMI编码支持HDCP协议,支持蓝光高清 ●支持HTTP,UTP,RTSP,RTMP,ONVIF 协议 ●主流与副流采用不同的网络协议进行传输 ●WEB操作界面,中英文配置界面可选 ●WEB操作界面权限管理 ●支持广域网远程管理(WEB) ●支持流分辨率自定义输出设置 ●支持码流插入中英文字功能,字体背景、颜色可选 ●支持码流插入3幅透明图像水印功能,XY轴可设置 ●支持一键恢复出厂配置 二、产品应用: 1、4G移动直播高清前端采集 2、高清视频直播服务器 3、视频会议系统视频服务器 4、数字标牌高清流服务器 5、教学直播录像系统前端采集 6、IPTV电视系统前端采集

最新的高效音视频编码及视频图像处理技术

最新的高效音视频编码及视频图像处理技术 在视频领域,图像视频的很多问题困扰着广大IT技术人员。现在给大家介绍几种明显改善图像视频质量的方法。小弟知识浅薄,还请各位大虾多多指教,资深前辈可以飘过。 缩放(scaler) 通过缩放(scaler)算法处理过的图像视频质量明显提高,更加清晰,而且保持图像的平滑性的同时还加入了对图像的增强处理,使放缩后的图像细节更加丰富。 1、算法复杂度低,运算量小,处理速度快 2、支持任意比例放大和缩小 3、放大后的图像边缘不会产生锯齿现象 4、放大后的图像细节更丰富,边缘不模糊 视频图像预处理(Video image processing) 图片或视频拍摄时,由于光线(不足或过曝),设备原因,天气影响等会使图片或视频有噪声。视频会议当室内光线较暗时,拍摄的视频效果非常一般,所以就可以应用该算法将视频图像进行预处理,可以得到非常好的效果,而且可以压缩图像的大小,提高视频码率,使图像视频更加清晰。 插帧(FRC)当视频帧率过低时,画面会一卡一卡的,会给人带来非常差的视觉效果。那么就可以通过插帧(FRC)算法来将视频插成高帧率的视频,使视频更加流畅顺滑,何乐而不为呢。 当某些特殊场合,如网络视频,由于受带宽的影响,数据传输只需要传输低帧率的视频源,在终端通过插帧算法(FRC)可以将低帧率提高到所需要的高帧率,大大节省带宽和存储空间,又可以改善视频画面的流畅程度,应用范围非常广泛。 去隔行(de-interlacing) 去隔行应用范围更是广泛,视频源隔行丢数据,可以通过该算法在终端自动恢复丢失的数据,仅利用极少的资源便可以大幅提高视频的质量,节约带宽。 这些算法都可以大幅提高视频图像的质量,应用了这些算法之后可以使产品在该领域鹤立鸡群。

视频文件格式和视频编码方式区别

目前网上的各种视频格式可以说是泛滥成灾,加上各个PMP(Portable Media Player,便携式媒体播放器)生产厂家的对自己产品在功能方面的炒作,使得很多人对视频格式的名称都是一头的雾水。 经常有些童鞋问我类似下面的问题。 A问我说:“我的MP4分明写着能播放AVI吗?为什么这一个AVI文件就播放不了?” B问:“我的MP4支持Mpeg-4啊,为什么Mp4文件不能播放呢?” 好的,下面我从最基本的概念给大家解释一下,顺便回答这两个问题 首先大家要清楚两个概念,视频文件格式和视频编码方式。 视频文件格式一般情况下从视频文件的后缀名就能看出来,比如AVI,Mp4,3gp,mov,rmvb等等。这些格式又叫做容器格式(container format),顾名思义就是用来装东西的,你可以把它想象成为一个便当盒,或者野餐篮(兄弟,你没吃早饭吧)。 通常我们从网上下载的电影都是有声音的(废话,难道你只看默片!众人扔香蕉皮),所以容器格式中一般至少包含有两个数据流(stream),一个视频流,一个音频流,就好比是一个便当盒里装着的配菜和米饭。 视频编码方式则是指容器格式中视频流数据的压缩编码方式,例如Mpeg-4,,,等等。而视频数据采用了何种编码方式是无法单单从文件格式的后缀上看出来的。就是说你无法从一个盖着盖子的便当盒外面看出里面装了什么配菜。 如果你想播放一个视频文件,第一步你的播放器(不论是软件的还是硬件的)要能够解析相应的容器格式,这一步也叫做解复用(demux),第二步你的播放器要能够解码其中所包含视频流和音频流。这样影片才能播放出来。 打个不太恰当的比方,播放器好比你雇用的一个试菜员,由他来品尝便当(视频文件),然后告诉你便当里装了什么东西。(没天理阿!我想自己吃,好的当然可以,0x00 00 01 B6 05 FF 36 1A 50 …… ……,俄~) 所以试菜员首先要懂得如何打开便当盒,还要知道吃的出来便当盒里装了什么配菜,这样你才能获得你想要的信息。 回过头来看前面的两个问题,用以上的比喻翻译一下。 问题A,我的试菜员能打开AVI这种便当的,为什么我不能知道里面装了什么? 回答很简单,虽然他能够打开便当,但是吃不出里面的东西是什么。理论上没有一个播放器能够播放所有的AVI格式的电影,因为你不知道我会往里面放什么配菜。 问题B,我的试菜员吃过Mpeg-4这种牛排阿,为什么不能打开Mp4这种便当盒呢? 这个问题通过翻译之后看起来已经不是问题了,Mpeg-4是视频编码方式,而Mp4是容器格式,两者本来就不是一个范畴里的东西。 好了下面简单介绍一下流行的视频格式。 AVI是音频视频交错(Audio Video Interleaved)的英文缩写,它是Microsoft公司开发的一种数字音频与视频文件格式,允许视频和音频交错在一起同步播放。 AVI文件的格式是公开并且免费的,大量的视频爱好者在使用这种文件格式。很多PMP 唯一能支持的格式就是AVI格式,一般的PMP都带有可以转换其他格式视频成为AVI格式的软件。 AVI文件采用的是RIFF(Resource Interchange File Format,资源互换文件格式)文件结构,RIFF是Microsoft公司定义的一种用于管理windows环境中多媒体数据的文件格

视频压缩与MPEG降噪技术

视频压缩和MPEG 降噪技术 作者:Phuc-Tue Le Dinh and Jacques Patry, Algolith 理论上,数字电视(DTV)画面品质优于传统的模拟电视,没有鬼影、雪花、颤动和色彩失真等等问题。而且,模拟电视信号正如可以论证的那样,最大的缺陷就是画面斑点甚多,且因为对高频信号响应不足而导致画面不够细腻,简单地说,就是带宽不够。图像越细致,分辨率就越高,所需要的带宽就越大。 很久以前,美国官方就把可用频谱中的每6MHz 带宽分配给美国广播公司的每一个频道以提供模拟电视信号,这种对视频带宽的限制及其对应的显示标准(NTSC 制式),就决定了传统电视机的特征,并在几十年时间里决定了电视画面的质量。 随着数字电视的出现,广播公司看到了能更充分地利用其分配的带宽的机会。的确,从他们的角度来看,数字电视最突出的优点莫过于容许在同样的带宽内传输更多的频道,并且同样能支持后续的高清晰度电视节目(HDTV)。 冗长的数据 HDTV 对技术的要求非常高。传 统传播模拟信号的NTSC 信号在 一个频道6MHz 带宽内最低要使 用4.2MHz 的带宽,并以29.97Hz 的场频扫描525线。经过数字量 化和编码压缩之后,该信号可以 被记录在DVD 上,其位传输bit 率从2Mbits/s 到10Mbits/s (支 持自适应),平均为4Mbits/s 。 比较而言,典型的HDTV 具有5 倍于模拟TV 的分辨率。因此在同样条件下,传输数据率应该是模拟信号的5倍才能达到同样的性能。 无论是传统的空中广播(OTA)、有线电视公司的机顶盒,还是卫星电视,他们都在传输信号时受到带宽的制约,在受限的带宽上他们还要附加占用带宽的服务,包括互动广播、收费频道和电视节目表等等。 那么,怎样才能解决问题呢?采用压缩技术是一种办法。 数字视频压缩引起失真 目前最常用的数字视频压缩算法是MPEG-2。从现有的卫星电视传输、有线数字电视传输到空中数字广播,MPEG -2在各种应用中已经被国际上广为采用。 MPEG-2首先通过运动补偿去除时间冗余,然后将一帧图像分割成一个个8x8的相素点阵,在每个点阵内使用DCT (离散余弦变换)去除空间冗余。DCT 完成后通过量化和重组后压缩就完成了,然后进行可变长编码,最后进行霍夫曼编码。整个压缩过程极大的减少了比特率(>10:1压缩比)。 然而,比特率的减少也带来了问题,因为编码损失了一些原始的视频信息,有可能引起严重的负作用,所以,MPEG-2被称为有损编码。它丢弃了被认为视觉上较为次要的图像信息。压缩得越大,编码后的图像与原始图像的差异就越大。图像质量和逼真度现在取决于所选择的(或通常是施加的)压缩级别。因为它直接与可用带宽相关,我们必须问问自己,什么时候才不出现过度的视频压缩呢? 带宽的限制

常见的几种高清视频编码格式

高清视频的编码格式有五种,即H.264、MPEG-4、MPEG-2、WMA-HD以及VC-1。事实上,现在网络上流传的高清视频主要以两类文件的方式存在:一类是经过MPEG-2标准压缩,以tp和ts为后缀的视频流文件;一类是经过WMV-HD(Windows Media Video High Definition)标准压缩过的wmv文件,还有少数文件后缀为avi或mpg,其性质与wmv是一样的。真正效果好的高清视频更多地以H.264与VC-1这两种主流的编码格式流传。 H.264编码 H.264编码高清视频 H.264是由国际电信联盟(iTU-T)所制定的新一代的视频压缩格式。H.264 最具价值的部分是更高的数据压缩比,在同等的图像质量,H.264的数据压缩比能比当前DVD系统中使用的 MPEG-2高2~3倍,比MPEG-4高1.5~2倍。正因为如此,经过H.264压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时,H.264只需要1Mbps~2Mbps 的传输速率,目前H.264已经获得DVD Forum与Blu-ray Disc Association采纳,成为新一代HD DVD的标准,不过H.264解码算法更复杂,计算要求比WMA-HD 还要高。 从ATI的Radeon X1000系列显卡、NVIDIA的GeForce 6/7系列显卡开始,它们均加入对H.264硬解码的支持。与MPEG-4一样,经过H.264压缩的视频文件一般也是采用avi 作为其后缀名,同样不容易辨认,只能通过解码器来自己识别。 总的来说,常见的几种高清视频编码格式的特点是能够以更低的码率得到更高的画质,相同效果的MPEG2与H.264影片做比较,后者在容量上仅需前者的一半左右。这也就意味着,H.264不仅能够节省HDTV的存储空间,而且还可以

视频编码的基本原理及基本框架

视频编码的基本原理及基本框架 视频图像数据有极强的相关性,也就是说有大量的冗余信息。其中冗余信息可分为空域冗余信息和时域冗余信息。压缩技术就是将数据中的冗余信息去掉(去除数据之间的相关性),压缩技术包含帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术。 去时域冗余信息 使用帧间编码技术可去除时域冗余信息,它包括以下三部分: -运动补偿 运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。 -运动表示 不同区域的图像需要使用不同的运动矢量来描述运动信息。运动矢量通过熵编码进行压缩。-运动估计 运动估计是从视频序列中抽取运动信息的一整套技术。 注:通用的压缩标准都使用基于块的运动估计和运动补偿 去空域冗余信息 主要使用帧内编码技术和熵编码技术: -变换编码 帧内图像和预测差分信号都有很高的空域冗余信息。变换编码将空域信号变换到另一正交矢量空间,使其相关性下降,数据冗余度减小。 -量化编码 经过变换编码后,产生一批变换系数,对这些系数进行量化,使编码器的输出达到一定的位率。这一过程导致精度的降低。

熵编码是无损编码。它对变换、量化后得到的系数和运动信息,进行进一步的压缩。 视频编码的基本框架 H.261 H.261标准是为ISDN设计,主要针对实时编码和解码设计,压缩和解压缩的信号延时不超过150ms,码率px64kbps(p=1~30)。 H.261标准主要采用运动补偿的帧间预测、DCT变换、自适应量化、熵编码等压缩技术。只有I帧和P帧,没有B帧,运动估计精度只精确到像素级。支持两种图像扫描格式:QCIF 和CIF。 H.263 H.263标准是甚低码率的图像编码国际标准,它一方面以H.261为基础,以混合编码为核心,其基本原理框图和H.261十分相似,原始数据和码流组织也相似;另一方面,H.263也吸收了MPEG等其它一些国际标准中有效、合理的部分,如:半像素精度的运动估计、PB帧预测等,使它性能优于H.261。 H.263使用的位率可小于64Kb/s,且传输比特率可不固定(变码率)。H.263支持多种分辨率:SQCIF(128x96)、QCIF、CIF、4CIF、16CIF。 与H.261和H.263相关的国际标准 与H.261有关的国际标准 H.320:窄带可视电话系统和终端设备; H.221:视听电信业务中64~1 920Kb/s信道的帧结构; H.230:视听系统的帧同步控制和指示信号; H.242:使用直到2Mb/s数字信道的视听终端的系统。 与H.263有关的国际标准 H.324:甚低码率多媒体通信终端设备; H.223:甚低码率多媒体通信复合协议; H.245:多媒体通信控制协议; G.723.1.1:传输速率为5.3Kb/s和6.3Kb/s的语音编码器。 JPEG 国际标准化组织于1986年成立了JPEG(Joint Photographic Expert Group)联合图片专家小组,主要致力于制定连续色调、多级灰度、静态图像的数字图像压缩编码标准。常用的基于离散余弦变换(DCT)的编码方法,是JPEG算法的核心内容。

几种视频压缩技术概述

几种视频压缩技术概述 (返回) (一)、JPEG——静止图像压缩标准 1、 JPEG 国际标准化组织(ID)和国际电报电话咨询委员会(CCITT)联合成立的专家组织JPEG (Joint Photographic experts group经过五年艰苦细致地工作后,于是1991年3月 提出了ISO CDIO918号建议草案:多灰度静止图像的数字压缩编码(简称JPEG标准)。 这是一个适用于彩色和单多多灰度或连续色调静止数字图像的压缩标准。它包括基于 DPCM(差分脉冲编码调制)、DCT(离散余弦变换)和Huffman编码的有损压缩算法两个 部分。前者不会产生失真,但压缩比很小;后一种算法进行图像压缩住处虽有损失但压 缩比可以很大,压缩20倍左右时,人眼基本上看不出失真。JPEG标准有三个范畴: A、基本顺序过程Baseline sequential processes实现有损图像压缩。重建图像质量达 到人眼难以实现图像质量达到人眼难以观察出损失的要求。采用8*8像素自适应DCT算 法、量化及H uffman型的熵编码器。 B、基于DCT的扩展过程(Extended DCT Based Process)使用累进行工作方式,采用自 适应算术的编码过程。 C、无失真过程(Lossless Process)采用预测编码及Huffman(或算术编码),可保 证重建图像数据与原始图像数据完全相同。 基中的基本顺序过程是JPEG最基本的压缩过程:符合JPEG标准的硬软件编码/解码器都 必须支持和实现这个过程。另两个过程是可选扩展,对一些特定的应用项目有很大实用 价值。 (1)、JPEG算法 基本JPEG算法操作可分成以下三个步骤:通过离散余弦变换(DCT)去除数据冗余;使 用量化表对DCT系数进行量化,量化表是根据人类礼堂系统和压缩图像类型的特点进行 优化的量化系数矩阵;对量化后的DCT系数时行编码使其熵达到最小,熵编码采用 Huffman可变字长编码 (2)、离散余弦变换 JPEG采用8*8子块的二维离散余弦变换算法。在编者按码器的输入端,把原始图像(对

视频编解码三大技术:现状与未来发展

视频编解码技术视频编码技术是网络电视发展的最初条件。只有高效的视频编码才能保证在现实的互联网环境下提供视频服务。H.264或称为MPEG-4第十部分(高级视频编码部分)是由ITU-T和ISO/IEC联手开发的最新一代视频编码标准。H.264可应用于网络电视、广播电视、数字影院、远程教育、会议电视等多个行业。 视频编解码三大技术 网络适应性是影响网络监控设备能否取得更快发展和普及的重要因素,因此,接下来将会有大量的网络适应性技术被应用到IP前端与管理平台中,视频编码器也不例外。在这些网络适应性技术中,与存储、传输、管理相关的三个方面应该是最迫切的。 1、ANR技术 与存储相关的网络适应性技术主要是ANR。ANR的前提是视频编码器支持本地存储,同时系统部署有中心存储。网络正常时,所有录像在中心完成;当网络发生故障时,支持ANR的视频编码器和中心管理平台将同时侦测到故障,并各自建立与时间相关的日志,同时视频编码器启动本地录像,利用本身内置的存储介质进行存储;在网络恢复正常后,视频编码器与中心管理平台将比较各自建立的日志,检查比对网络失效时的数据,然后由视频编码器将本地存储的录像上传至中心存储设备,完成后自动删除本地录像。ANR技术一方面可以提升存储可靠性,另一方面可以保证录像文件的完整性和统一管理性。 2、速率调整 与传输相关的网络适应性技术主要是指速率调整技术。网络正常时,视频编码器以正常编码速率上传监控码流到中心平台;当网络发生拥塞时,视频编码器能自动检测到拥塞,然后通过自动调整视频分辨率、视频帧率等编码参数进行码流占用带宽的调整,以保证监控码流可以稳定上传;当网络恢复时,视频编码器再自动恢复之前的编码传输。 3、人性化设计 与管理相关的网络适应性技术主要是指人性化设计。网络发生拥塞时,要能够主动提示管理人员和浏览人员并记录;前端视频编码器IP地址与其他设备冲突时,要能够有一定的机制通知中心管理平台,由平台主动提示相关工作人员并记录等等。 视频编解码发展现状与未来 向网络化发展的趋势意味着许多产品越来越需要支持多种标准。在视频监控应用中,未来的监控产品研发明显趋势之一是支持新的视频标准,如H.264/A VC、A VS等,而支持多种格式编解码的能力也很关键。此外,对基于不同编码标准、不同帧速率、不同分辨率的视频流进行格式转换的能力是另一项关键能力。 未来视频编码技术发展的趋势,是标准化和专业化并存。标准化的内涵,不仅是遵循提高压缩率的核心价值来制定新的视频编码标准,而且是在物联网大产业的趋势下,与主流数字化多媒体技术紧密结合,制定形成跨行业、跨应用的更大范围、统一开放的标准体系。专业化,则是在标准化的基础之上,以底层属性互相兼容为前提,针对各领域的专业需求进行百花齐放的扩展,形成贴近应用而各具特色的产品。 在跨越式前进的同时,视频编解码技术将为视频监控向高清化、智能化、网络化源源不断的输入“能量”,推动监控产业繁荣发展。 作为主要应用领域之一,监控行业已经走在编解码技术发展的前沿。可以预见,随着技术的不断发展,越来越多的视频压缩标准可以针对具体应用提供越来越高的压缩效率和越来越丰富的工具。另外,向网络化发展的趋势意味着许多产品越来越需要支持多种标准。 而在视频监控应用中,未来的监控产品研发明显趋势之一是支持新的视频标准,如H.264/A VC、A VS等,而支持多种格式编解码的能力也很关键。此外,对基于不同编码标准、不同帧速率、不同分辨率的视频流进行格式转换的能力是另一项关键能力。

视频压缩编码方法简介—AVI

视频压缩编码方法简介—A V I A VI(Audio Video Interleave)是一种音频视像交插记录的数字视频文件格式。1992年初Microsoft公司推出了A VI技术及其应用软件VFW(Video for Windows)。在A VI文件中,运动图像和伴音数据是以交织的方式存储,并独立于硬件设备。这种按交替方式组织音频和视像数据的方式可使得读取视频数据流时能更有效地从存储媒介得到连续的信息。构成一个A VI文件的主要参数包括视像参数、伴音参数和压缩参数等。 1.视像参数 (1)视窗尺寸(Video size)。根据不同的应用要求,A VI的视窗大小或分辨率可按4:3的比例或随意调整,大到全屏640×480,小到160×120甚至更低。窗口越大,视频文件的数据量越大。 (2)帧率(Frames per second)。帧率也可以调整,而且与数据量成正比。不同的帧率会产生不同的画面连续效果。 2.伴音参数。在A VI文件中,视像和伴音是分别存储的,因此可以把一段视频中的视像与另一段视频中的伴音组合在一起。A VI文件与WA V文件密切相关,因为WA V文件是A VI文件中伴音信号的来源。伴音的基本参数也即WA V文件格式的参数,除此以外,A VI文件还包括与音频有关的其他参数。 (1)视像与伴音的交织参数(Interlace Audio Every X Frames)。A VI格式中每X帧交织存储的音频信号,也即伴音和视像交替的频率X是可调参数,X的最小值是一帧,即每个视频帧与音频数据交织组织,这是CD-ROM上使用的默认值。交织参数越小,回放A VI文件时读到内存中的数据流越少,回放越容易连续。因此,如果A VI文件的存储平台的数据传输率较大,则交错参数可设置得高一些。当A VI文件存储在硬盘上时,也即从硬盘上读A VI文件进行播放时,可以使用大一些的交织频率,如几帧,甚至1秒。 (2)同步控制(Synchronization)。在A VI文件中,视像和伴音是同步得很好的。但在MPC中回放A VI文件时则有可能出现视像和伴音不同步的现象。 (3)压缩参数。在采集原始模拟视频时可以用不压缩的方式,这样可以获得最优秀的图像质量。编辑后应根据应用环境选择合适的压缩参数。 3.A VI数字视频的特点 (1)提供无硬件视频回放功能。A VI格式和VFW软件虽然是为当前的MPC设计的,但它也可以不断提高以适应MPC的发展。根据A VI格式的参数,其视窗的大小和帧率可以根据播放环境的硬件能力和处理速度进行调整。在低档MPC机上或在网络上播放时,VFW的视窗可以很小,色彩数和帧率可以很低;而在Pentium级系统上,对于64K色、320×240的压缩视频数据可实现每秒25帧的回放速率。这样,VFW就可以适用于不同的硬件平台,使用户可以在普通的MPC上进行数字视频信息的编辑和重放,而不需要昂贵的专门硬件设备。 (2)实现同步控制和实时播放。通过同步控制参数,A VI可以通过自调整来适应重放环境,如果MPC 的处理能力不够高,而A VI文件的数据率又较大,在WINDOWS环境下播放该A VI文件时,播放器可以通过丢掉某些帧,调整A VI的实际播放数据率来达到视频、音频同步的效果。 (3)可以高效地播放存储在硬盘和光盘上的A VI文件。由于A VI数据的交叉存储,VFW播放A VI数据时只需占用有限的内存空间,因为播放程序可以一边读取硬盘或光盘上的视频数据一边播放,而无需预先把容量很大的视频数据加载到内存中。在播放A VI视频数据时,只需在指定的时间内访问少量的视频图像和部分音频数据。这种方式不仅可以提高系统的工作效率,同时也可以实现迅速地加载和快速地启动播放程序,减少播放A VI视频数据时用户的等待时间。 (4)提供了开放的A VI数字视频文件结构。A VI文件结构不仅解决了音频和视频的同步问题,而且具有通用和开放的特点。它可以在任何Windows环境下工作,而且还具有扩展环境的功能。用户可以开发自己的A VI视频文件,在Windows环境下可随时调用。 (5)A VI文件可以再编辑。A VI一般采用帧内有损压缩,可以用一般的视频编辑软件如Adobe Premiere 或MediaStudio进行再编辑和处理。

常见的几种高清视频编码格式

常见的几种高清视频编码 格式 The Standardization Office was revised on the afternoon of December 13, 2020

高清视频的编码格式有五种,即、MPEG-4、MPEG-2、WMA-HD以及VC-1。事实上,现在网络上流传的高清视频主要以两类文件的方式存在:一类是经过MPEG-2标准压缩,以tp和ts为后缀的视频流文件;一类是经过WMV- HD(Windows Media Video High Definition)标准压缩过的wmv文件,还有少数文件后缀为avi或mpg,其性质与wmv是一样的。真正效果好的高清视频更多地以与VC-1这两种主流的编码格式流传。 编码 编码高清视频 是由国际电信联盟(iTU-T)所制定的新一代的视频压缩格式。最具价值的部分是更高的数据压缩比,在同等的图像质量,的数据压缩比能比当前DVD系统中使用的 MPEG-2高2~3倍,比MPEG-4高~2倍。正因为如此,经过压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时,只需要1Mbps~2Mbps的传输速率,目前已经获得DVD Forum与Blu-ray Disc Association采纳,成为新一代HD DVD的标准,不过解码算法更复杂,计算要求比WMA-HD还要高。 从ATI的Radeon X1000系列显卡、NVIDIA的GeForce 6/7系列显卡开始,它们均加入对硬解码的支持。与MPEG-4一样,经过压缩的视频文件一般也是采用avi 作为其后缀名,同样不容易辨认,只能通过解码器来自己识别。 总的来说,常见的几种高清视频编码格式的特点是能够以更低的码率得到更高的画质,相同效果的MPEG2与影片做比较,后者在容量上仅需前者的一半左右。这也就意味着,不仅能够节省HDTV的存储空间,而且还可以在手机等带

浅谈常见的视频文件格式及其压缩技术

龙源期刊网 https://www.doczj.com/doc/021887432.html, 浅谈常见的视频文件格式及其压缩技术 作者:陈香芹 来源:《中国新技术新产品》2016年第03期 摘要:随着科学技术的进步,人们生活节奏的加快,视频文件的格式越来越多,人们总 是希望能找到最方便使用的视频文件格式。本文介绍了常见的视频文件格式及其压缩技术。目前广泛使用的视频压缩标准是MPEG-2和MPEG-4,其中简要介绍了MPEG-4的关键技术。 关键词:视频文件格式;视频压缩技术;MPEG 中图分类号:TP391 文献标识码:A 1 视频文件简介 为了方便存储视频文件的需要,人们制订了不同的视频文件格式,把视频和音频放在一个文件同时播放。从广义上来讲,视频文件可以分为动画文件和影像文件两大类。 1.1 动画文件的分类 动画文件是由相互有关联的若干帧静止图像所组成的图像序列,这些有关联的图像按一定顺序连续播放便形成一组动画,一般用来完成简单的动态过程,适用于比较抽象、难于理解的文件中。常见的动画文件格式有GIF和FLIK。 1.2 影像文件的分类 影像文件,主要指那些包含了实时的音频、视频信息的多媒体文件,其多媒体信息通常来源于视频输入设备,具有很强的表现力。 (1)MICROSOFT流媒体文件 ASF(Advanced Systems Format)和WMV即两个独立于编码方式的在Internet上实时传 播多媒体的技术标准,两者都具有本地或网络回放、可扩充的媒体类型、部件下载、以及扩展性等优点。 (2)AVI AVI(Audio Video Interleaved),是音频视频交错的英文缩写,是将语音和影像同步组合在一起的文件格式,它对视频文件采用的是有损压缩标准,应用范围非常广泛。AVI文件目前主要应用在多媒体光盘上,用来保存电视、电影等各种影像信息。

高清视频编码封装格式知多少

高清视频编码方式何其多 今天我们就为大家普及一下关于购买高清播放机之前需要了解的关于视频文件的知识,了解了视频文件的解码格式以及封装格式,相信大家就会对高清有进一步的了解,也有可能爱上他,知道自己也需要一个。为自己去买一个抱回家。下篇文章也会介绍一下关于音频方面的相关知识,请大家继续关注。 当我们去观察一个视频的文件时候,我们会发现在后缀名上即:“.***”,发现各不相同,许多人就迷迷糊糊了,为了让大家有一个清晰的思路,话不多少,笔者尽力借助各种资料以让每个人都明白的方式来阐述给大家。 普及了O(∩_∩)O~ 编码方式: 在高清视频编码格式方面,我们可以经常会见到以下这几个命名:MPEG-2 TS、Divx、Xvid、H.264、WMV-HD和VC-1。目前发展过程中,MPEG-2、H.264、VC-1是其中最为关注的。由于在高清视频格式后来发展过程中,由于两家公司,东芝与sony的竞争中,就是HD-DVD 与蓝光的较量中,虽然最后HD-DVD退出了竞争,以蓝光的胜利结束,但是他们都选择支持这三种编码格式,也说明了他们的有很大的竞争优势。也是后来被关注最多的格式。

各种格式的发展历程 ■ MPEG编码 首先我们先介绍一下MPEG。MPEG是英文Moving Picture Experts Group的简称,翻译过来也就是运动图像专家组。该专家组建于1988年,可以说很早,他们专门负责建立视频和音频标准,而成员都是为视频、音频及系统领域的技术专家。简单讲就是个行业里的组织,专门对数字内容做出业界规范的组织。 MPEG 大家现时泛指的MPEG-X版本,就是由ISO(International Organization for Standardization)所制定而发布的视频、音频、数据的压缩标准。ISO是国际标准制定组织,我们喝的牛奶或者用的什么产品上经常看的的ISO9000之类的就是一个意思。 MPEG发展的很早,目前也分类很多,了解了他对大家帮助很大。 ● MPEG1:MPEG1是最早出现的,这时候我们就广泛认识到这个组织和他们的标准了。还记得VCD吗?VCD 就是其中最主要的代表。VCD这个具体的格式是从日本而来的,并遵守MPEG1规格。 ● MPEG2:其代表是DVD。一般为480P(640*480)。DVD当时都符合这个标准。 ● MPEG4:Xvid 和H.264(下文重点提到)同属于MPEG4格式,是高于MPEG1、2的新一代数字媒体格式。 ● MPEG-2是由MPEG和ITU-T双方合作开发的。因此MPEG-2在ITU-T的命名规范中被称之为H.262。有时候我们还会看到“MPEG2-HD”或“MPEG2-TS”字样,其实这都是在说MPEG-2(为我们普通消费者增加了多少麻烦啊!!)。 之所以叫做MPEG2-HD是为了区别DVD常采用的MPEG2而做的区分。因为480P格式的

视频编解码芯片

芯片厂商如何改变视频监控行业(1) 随着中国安防市场近年来的迅速增长,芯片市场也随之得到了强劲发展。安防行业的需求逐渐明确,芯片厂家开始关注并主动去推广安防这个潜力巨大的市场。安防行业的发展吸引了越来越多的芯片厂商加入,成为继工业自动化、消费电子、电话机等领域之后一个新的利润角逐场。 然而,表象背后,是否会续写PC电脑行业的悲哀,频频受制于英特尔?“狼来了”的口号是否会在安防行业响起?值得我们欣慰的是,安防行业产品种类繁多,应用情况又各不相同,这也就决定了芯片厂商还没有能力“一手遮天”。 未来,将会有越来越多的芯片厂商将目光投向SoC芯片,致力于提高集成度,引入先进工艺,降低系统成本,改善系统性能以增强市场竞争力。为下游用户带来更多价值,从而推动产业向更深、更广的范围发展。 目前,中国已成为全球最大的安防市场。中国安防产值从十年前两百多亿元增长到目前的两千亿元,安防各类产品、系统、解决方案的应用层出不穷,安防市场出现难得的“百花齐放”的景象。然而,繁华背后却隐藏着些许担忧。核心技术的缺失,阻碍了中国安防技术源动力的蓬勃发展,成为中国安防市场向高端科技领域进军的掣肘。那么,是谁在禁锢着安防技术?谁又在影响和改变着安防呢?毋庸置疑,芯片决定着安防技术的级别。 随着“平安城市”、“北京奥运”等重大项目的带动,中国视频监控市场呈现迅猛发展的态势,以年均40%的速度傲视整个安防市场。视频监控市场需求的不断增长,除了引起安防监控设备厂商的关注,同样也引起了视频监控核心器件——芯片生产商的广泛关注。作为安防产品的上游核心客户,芯片厂商“跺一跺脚”就会直接影响着安防设备生产商们的生死存亡。TI、NXP、ADI、Techwell等一大批国际半导体企业将目光投向中国安防市场,量身打造一些符合中国安防市场使用的芯片,对推动中国安防市场的蓬勃发展起到了一定积极的作用。另外,像中国台湾和中国大陆的一些芯片商也纷纷拿出“看家本领”,进一步推动了中国安防市场的发展。海思、中星微、升迈、映佳等纷纷涉足视频监控处理芯片领域。 芯片厂商发力视频监控市场 1999年,恩智浦PNX1300芯片在中国推广并得到应用之后,2003年,TI推出通用数字媒体处理器TMS320DM642,正式进军中国数字视频监控领域。2006年左右,海思作为全球率先推出H.264 SoC监控专用芯片的半导体公司,在綷-历了三年多的调研和研发之后,进入到大家的视野之中。几乎在同一时间,台湾升迈开始整合ARMcore,兼容FA526CPU 和MPEG4/MJPEGcodec及多项外围IP,为数字监控量身打造视频编解码芯片SoC。 基于国内蓬勃发展的监控形势,海思自2006年在全球推出首款针对安防应用的H.264 SoC开始,至今已綷-发展到了第三代SoC芯片,已成为国内领先的视频监控解决方案供应商。海思半导体有限公司成立于2004年10月,前身是建于1991年的华为集成电路设计中心。作为领先的本土芯片提供商,海思的产品线覆盖无线网络、固定网络、数字媒体等领域的芯片及解决方案,并成功应用于全球100多个国家和地区。 在中国芯片业发展的历史上,有这样一家公司为历史所铭记,它的名字叫“中星微电子有限公司”。这家承担了国家战略项目——“星光中国芯工程”的企业,致力于数字多媒体芯片的开发、设计和产业化。中星微电子从2006年开始投入IP视频监控系统的研发和设计,在网络摄像机专用芯片、终端以及运营级网络视频监控平台等方面持续投入,并取得了一系列的成果。目前,中星微依靠多媒体芯片、视频编解码、智能、网络产品开发的技术积累,提供多媒体处理芯片、高清网络摄像机、硬件视频智能分析终端、视频监控统一媒体平台四大视频监控组件,并在此基础上提供视频监控应用解决方案。 有专家指出,安防用的芯片具有几个显著特点:一是长时间不间断工作,二是多视频的

音频、视频压缩有哪些技术标准

音频、视频压缩有哪些技术标准? 视频压缩技术有:MPEG-4、H263、H263+、H264等 MPEG-4视频编码技术介绍 MPEG是“Moving Picture Experts Group”的简称,在它之前的标准叫做JPEG,即“Joint Photographic Experts Group”。当人们用到常见的“.jpg”格式时,实际上正在使用JPEG的标准。JPEG规范了现代视频压缩的基础,而MPEG把JPEG 标准扩展到了运动图象。 MPEG-4视频编码标准支持MPEG-1、MPEG-2中的大多数功能,它包含了H.263的核心设计,并增加了优先特性和各种各样创造性的新特性。它提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码,同时也支持基于内容的图像编码。采纳了基于对象(Object-Based)的编码、基于模型(Model-based)的编码等第二代编码技术是MPEG-4标准的主要特征。 MPEG4与MPEG1、MPEG2的比较 从上表可以看出,MPEG1和MPEG2主要应用于固定媒体,比如 VCD 和 DVD ,而对于网络传输,MPEG4具有无可比拟的优势。 H.263/H.263+/H.264视频编码技术介绍 1.H.263视频编码标准 1.H.263是最早用于低码率视频编码的ITU-T标准,随后出现的第二 版(H.263+)及H.263++增加了许多选项,使其具有更广泛的适用性。 H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准。 它是在H.261基础上发展起来的,其标准输入图像格式可以是

S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亚取样图像。 H.263与H.261相比采用了半象素的运动补偿,并增加了4种有效的 压缩编码模式。 2.H.263+视频压缩标准 1.ITU-T在H.263发布后又修订发布了H.263标准的版本2,非正式 地命名为H.263+标准。它在保证原H.263标准核心句法和语义不变 的基础上,增加了若干选项以提高压缩效率或改善某方面的功能。原 H.263标准限制了其应用的图像输入格式,仅允许5种视频源格式。 H.263+标准允许更大范围的图像输入格式,自定义图像的尺寸,从而 拓宽了标准使用的范围,使之可以处理基于视窗的计算机图像、更高 帧频的图像序列及宽屏图像。为提高压缩效率,H.263+采用先进的帧 内编码模式;增强的PB-帧模式改进了H.263的不足,增强了帧间预 测的效果;去块效应滤波器不仅提高了压缩效率,而且提供重建图像 的主观质量。为适应网络传输,H.263+增加了时间分级、信噪比和空 间分级,对在噪声信道和存在大量包丢失的网络中传送视频信号很有 意义;另外,片结构模式、参考帧选择模式增强了视频传输的抗误码 能力。 3.H.264视频压缩标准 1.H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一 代视频压缩编码标准。对信道时延的适应性较强,既可工作于低时延 模式以满足实时业务,如会议电视等;又可工作于无时延限制的场合, 如视频存储等。 2.提高网络适应性,采用“网络友好”的结构和语法,加强对误码和 丢包的处理,提高解码器的差错恢复能力。 3.在编/解码器中采用复杂度可分级设计,在图像质量和编码处理之 间可分级,以适应不同复杂度的应用。 4.相对于先期的视频压缩标准,H.264引入了很多先进的技术,包括 4×4整数变换、空域内的帧内预测、1/4象素精度的运动估计、多参 考帧与多种大小块的帧间预测技术等。新技术带来了较高的压缩比, 同时大大提高了算法的复杂度。 G.7xx系列典型语音压缩标准介绍 G.7xx 是一组 ITU-T 标准,用于视频压缩和解压过程。它主要用于电话方面。在电话学中,有两个主要的算法,分别定义在 mu-law 算法(美国使用)和 a-law 算法(欧洲及世界其他国家使用),两者都是对数关系,但对于计算机的处理来说,后者的设计更为简单。 国际电信联盟G系列典型语音压缩标准的参数比较:

新一代视频编码技术---H.265HEVC高效视频编码技术

新一代视频编码技术--- H.265/HEVC高效视频编码技术 音视频信息包含图像、语音、文字等各种信息,是人与人之间沟通的重要媒介,因此以音视频为核心的视频会议、视频指挥、视频监控、可视电话等各种音视频系统成为现代各个行业和领域信息化建设领域的重点。然而,高清晰的实时图像数据量巨大,以图像分辨率为1920X1080,颜色取样深度为24bit,每秒帧数为60帧的实时高清视频为例,未经压缩处理的图像通过网络传输每秒的流量将达到355.957MB。 为了实现在有限带宽下传输如此高数据量的视频图像,音视频应用系统通过使用编码设备将图像进行压缩编码大幅降低数据量后再通过网络传输,目前这些编码设备主要采用H.264编码技术。H.264又称MPEG-4part10,由VCEG和MPEG联合组成的JVT (JointVideoTeam)于2003年3月正式发布,经过十余年的发展,H.264已被业内的厂商广泛的采纳和使用。 H.264采用帧内、帧间预测技术,高精度、多模式的位移估计,整数变换编码以及先进的量化处理和滤波处理,在同等保真条件下,大幅提高了编码效率。但是,H.264也存在一定的局限性,例如,由于图像分辨率的大大增加,单个宏块所表示的图像内容信息大大减少,H.264所采用的4×4或8×8宏块经过整数变换后,低频系数相似程度也大大提高,出现大量冗余,导致H.264编码对高清视频的压缩效率明显降低,而目前720P,1080P高清图像已经成为音视频应用系统的主流,未来图像分辨率将达到4K(4096 x 2160)、8K(8192×4320),H.264已经无法满足用户对高清视频图像传输的需求。 新一代视频编码技术---H.265/HEVC高效视频编码技术的出现为解决这问题提供了手段。 H.265/HEVC在现有的主流视频编码标准H.264上保留了一些较为成熟的技术和继承其现有的优势,同时采用了基于四叉树结构的编码分割、预测编码技术等先进的编码技术,视频压缩效率将比H.264提高大约一半,可以轻松实现在低带宽下实现1080P图像的传输,同时支持4K、8K高清图像的传输。业内厂商纷纷开展了H.265/HEVC编码产品的研发和应用,例如武汉兴图新科已率先实现H.265/HEVC编码器的规模化应用,推出支持HDSDI 、DVI、HDMI 等各种视频制式的H.265/HEVC高清编码器,该型号的编码器在同等图像质量下,图像数据量只有MPEG2的1/16,MPEG4的1/6,H.264的1/2,同时实现在高达25%丢包率的不稳定网络环境下稳定传输。随着用户对高清和超高清视频的需求,基于H.265/HEVC标准的编码器将得到广泛的应用。

相关主题
文本预览
相关文档 最新文档