一种快速的多媒体视频解码算法

  • 格式:pdf
  • 大小:233.92 KB
  • 文档页数:7

下载文档原格式

  / 7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2000年第21卷第4期华 北 工 学 院 学 报V ol.21 N o.4 2000 (总第72期)JOURNAL OF NORTH CHINA INSTITUTE OF TECHNOLOGY(Sum N o.72)

文章编号:1006-5431(2000)04-0354-07

一种快速的多媒体视频解码算法

马 礼1,张永梅1,马 兰2,张永莲3

(1.华北工学院计算机科学与技术系,山西太原030051; 2.长征航天控制工程公司,北京100038;

3.十三冶职工医院,山西太原030009)

摘 要: 目的 找出一种对多媒体视频流的快速解码方案.方法 对多媒体信息流的编码解码过程进行剖

析,提出粗跳、细跳算法定位视频流中的I图像.结果 找到了一种快速搜索I图像的算法.结论 多媒体信

息流的解码可以用较快的算法实现,从而提高解码速度、节省解码用时间.

关键词: 多媒体;视频;系统流;节目流;解码;编码

中图分类号: T P37 文献标识码:A

0 引 言

随着经济的发展和科学技术的进步,当今人类社会的列车已进入了信息化的新时代.在这一阶段,有关多媒体技术的研究、开发、和应用显得格外有生气,并且以极快的速度向普及和产业化方向深入,这种技术的发展是前所未有的.

进入信息时代的现代社会,各种信息以极快的速度出现,人们对信息的需求在日益增加,这个增加不仅表现在数量的剧增,同时还表现在信息种类的不断增加.这个巨大的社会需求(或者说市场需求)就是多媒体通信技术发展的基本的内在动力.另一方面,电子技术、计算机技术、电视技术及芯片技术的飞速发展,为多媒体技术的发展提供了确实的外部保证.在美国洛杉矶召开的1993年首届国际多媒体会议上共发表了52篇论文,包括17篇专题,其中约有一半的专题与通信有关[2].此项技术必将为21世纪的信息时代做出更大的贡献[1].

目前,多媒体信息的传输技术在国内外的研究较多,并有相应的产品推出.如中国公用数字数据网(CHINADDN),利用数字传输通道(光纤,微波,卫星)和数字交叉复用节点组成的数字数据传输网,为用户提供各种速率的高质量的专用电路和其他新业务,以满足用户多媒体通信和组建中、高速计算机通信网的需要.DDN与传统的模拟电话专线不同,其显著特点是采用数字电路,传输质量高,延时小,通信速率可根据需要选择;电路可以自动迂回,可靠性高;一线可以多用,既可以通话,传真,传输数据,还可以组建会议电视系统等[1].

在众多的多媒体研究领域内,媒体的编码和解码技术是人们一直在探求的主题,如何对多媒体信息进行高效编码,对于容量大得惊人的数据量来说,其重要程度是可以想象的,同样,解码方法的研究、再现方案的提出和实现,也为业内人士所关注.在经过对多媒体的解码方法进行研究和实验后,本文提出一种快速搜索关键图像的方法,以达到快进、快倒等特殊效果,在实际应用中取得了较好的效果.

1 解码方案

1.1 图像和视频信号的表示彩色空间

彩色是一种心理感觉,它与照明源的分布及观察者的视觉有关.例如,晚上的天空看上去呈黑色或 收稿日期:2000-06-16

 作者简介:马 礼(1968-),男,讲师,硕士.从事专业:计算机应用.

灰色,白天则呈不同深浅的蓝色,日出时又出现桔红或红色.这表明色感依赖于光的物理成分和视觉系统的生理学,并进而引起色彩的心理感觉:亮度、色度和饱和度.

在各种彩色模型中,最成功的是三基色模型.在三基色模型中,认为人眼有红,绿,蓝三种色感细胞,它们的最大感光灵敏度分别落在红色、绿色和蓝色区域.由此可推断出,任何色彩都可用红,绿,蓝三种基色相加来配制.根据三基色原理,用三幅红、绿、蓝为基色的图像可生成一幅彩色图像.

在编码时采用亮度、色度空间,即YUV 空间,用YU V 空间表示图像有一个问题需要解决,就是现在所有的显示系统都采用R ,G ,B 值来驱动显示器,这就要求在每个像素之前,必须把YUV 值转换成RGB 值,其转换关系如式(1)、式(2)所示.

RGB 到YUV 的转换关系

Y

U V

=

0.2990.5870.114-0.1687-0.33130.50.5-0.4187-0.0813R G B (1) YUV 到R GB 的转换关系

R

G B =

10 1.4021-0.34414-0.714141 1.17720Y U V (2) YUV 格式能把大部分图像信息量集中到亮度分量上,把小部分的信息量集中到色度分量上.1.2 MPEG 信息编码格式

按M PEG 格式经过编码的多媒体视频流,分为6个层次.

1.2.1 块

块是亮度和色度成分的正交8×8部分,它是编码器和解码器的最小单位.块的数据是按Z 型扫描存放.其中第一个数据为DC 系数,该系数按差分编码;剩下的63个为AC 系数,AC 系数按行程编码.

1.2.2 宏块

宏块由16×16个像素组成,宏块头标中包含了防止下溢的宏块填补代码“00000001111”;宏块地址增量(1~11位长),它表示当前宏块和过去编码宏块地址之间的差分值,用它可求出当前宏块的绝对地址,在求宏块地址增量时,有可能出现转义码“00000001000”,它表示当前地址增量再加33;还有1~6位长的宏块类型,对于I 图像则只有两种宏块类型,“1”表示不重新设置量化器尺度,“01”表示重新设置量化器尺度,这时接着的5位为重新设置量化器尺度的值.宏块头标之后是定义宏块中6个块的数据,6个块中有4个亮度块和2个色度块,它们的存放顺序是从顶到底,从左到右:先Y,后U 和V.

1.2.3 片

片由整数个以光栅扫描顺序排列的宏块组成.开始的宏块是图像的左上角,然后从左到右,从上到下按光栅扫描顺序存放,片之间不能覆盖,且不能有间隙.片在一个图像中可以有不同的大小,一个图像中开始代码的最低8位,定义了该片中第一个宏块在图像中的第几行.片由片头标(00000101-000001AF)和若干宏块组成,在片头标中除了片开始代码以外,接下来的5位是量化器尺度,该值不能为0.片头标之后定义宏块的代码.

1.2.4 图像

一个图像(Picture )相应于动态视频的帧,它有4种类型:

(1)I 图像或称帧内编码图像,这种图像不参考任何其他图像而被解码;

(2)P 图像或称预测编码图像,这种图像解码时用到了前面的I 图像或P 图像的运动补偿;

(3)B 图像(双向预测编码图像),这种图像解码时用到前面和后面的I 或P 图像的运动补偿;

(4)D 图像,这种图像只对应于快速向前搜索模式.

图像由图像头标和一系列片组成.图像头标以图像开始代码“00000100”开始,接着的10位是图像的时间引用,定义图像的显示顺序(由于图像不以显示顺序传送,而是以解码器解码它们所需的顺序(位流355(总第72期)一种快速的多媒体视频解码算法(马 礼等)