当前位置:文档之家› 多媒体数据压缩技术

多媒体数据压缩技术

多媒体数据压缩技术
多媒体数据压缩技术

第6章多媒体数据压缩技术

【教学内容】

1.多媒体数据压缩编码的必要性、可能性和压缩方法的分类;

2.量化;

3.统计编码;

4.变换编码;

5.多媒体数据压缩编码国际标准。

【教学目的与要求】

数字化后的音频和视频等媒体信息具有数据海量特性,与当前硬件技术所能提供的计算机存储资源和网络带宽之间有很大差距(虽然现在的存储器的容量越来越大),解决这一问题的关键技术就是数据压缩技术,即多媒体数据压缩编码的必要性。由于数据中存在着大量的冗余,所以多媒体数据压缩才是可行的。介绍常用的编码方法,数据压缩编码的国际标准:JPEG、MPEG等。

1.熟练掌握:多媒体数据压缩编码的必要性、可能性;

哈夫曼编码;

JPEG压缩编码。

2.掌握:量化;

统计编码;

变换编码。

1.一般了解:压缩编码的分类;

多媒体数据压缩编码的其他国际标准,如MPEG-1,

MPEG-2,MPEG-4,MPEG-7等;

【考核知识点】

多媒体数据压缩编码的必要性;多媒体数据压缩的可行性;哈夫曼编码、算术编码的基本原理;数据压缩编码的国际标准:JPEG、MPEG的基本原理。

随着通信、计算机和大众传播这三大技术更紧密的融合,计算机已不局限于数值计算、文字处理的范畴,同时成为处理图形、图像、文字和声音等多媒体等多种信息的工具。

数字化后的视频和音频等媒体信息具有数据海量性,与当前硬件技术所能提供的计算机存储资源和网络带宽之间有很大差距,可以通过数据压缩技术解决该关键问题。在多媒体计算机技术的发展与进步的进程中,数据压缩技术扮演着举足轻重的角色。

本章重点介绍一些重要的压缩编码方法,也介绍现有的多媒体数据压缩的国际标准:JPEG、MPEG、H.21、H.23可视通信的国际标准。这些压缩算法和国际标准可以广泛地应用于多媒体计算机、多媒体数据库、常规电视数字化、高清电视(HDTV)以及交互式电视(Interactive TV)系统中。目前,正在开展应用的项目有:可视电话、视频会议、多媒体电子邮件、音频、视频点播和IP电话等。

6.1 多媒体数据压缩技术概述

6.1.1 多媒体数据压缩编码的必要性

由于媒体元素种类繁多、构成复杂,即数字计算机所要处理、传输和存储等对象为数值、文字、语言、音乐、图形、动画、静态图像和电视视频图像等多种媒体元素,并且使他们在模拟量和数字量之间进行自由转换、信息吞吐、存储和传输。目前,虚拟现实技术要实现逼真的三维空间、3D立体声效果和在实境中进行仿真交互,带来的突出的问题是媒体元素数字化后数据量大得惊人。在前几章中曾介绍过诸如声音、图像等信号的海量表现,下面不妨再举几个例子说明:

(1)陆地卫星的水平、垂直分辨率分别为3240和2340,4波段、采样精度为7位,那么一幅图像的数据量为2340×3240×7×4/8=26.5MB,按每天30幅计算,每天的数据量就有26.5×30=795MB,每年的数据量高达283GB。

(2)高保真立体声音频信号的采样频率为44.1kHz、16位采样精度,一分钟存储量为10.34MB。一片CD-ROM(存储量为650MB)可存放约63

分钟的音乐。如果使用48 kHz采样频率的话,需要的存储量就更大了。

(3)数字电视图像(International Consultative Committee For Radio,ICCR)格式,PAL制式、8:8:8采样,每帧数据量为720×576×3=1.19MB;每秒的数据量为1.19×25=29.75MB;一片CD-ROM只能存放650÷1.19=546帧图像,或一片CD-ROM可存储节目的时间为650÷29.75=21.85秒。

从以上的例子可以看出,数字化信息的数据量十分庞大,无疑给存储器的存储量、通信干线的信道传输率以及计算机的速度都增加了极大的压力。如果单纯靠扩大存储器容量、增加通信干线传输率的办法来解决问题是不现实的。通过数据压缩技术可以大大降低数据量,以压缩的形式存储和传输,既节约了存储空间,又提高了通信干线的传输效率,同时也使计算机得以实时处理音频、视频信息,保证播放出高质量的视频和音频节目。

6.1.2 多媒体数据压缩的可能性(可行性)

经研究发现,与音频数据一样,图像数据中存在着大量的冗余。通过去除那些冗余数据可以极大地降低原始图像数据量,从而解决图像数据量巨大的问题。

图像数据压缩技术就是研究如何利用图像数据的冗余性来减少图像数据量的方法。因此,进行图像压缩研究的起点是研究图像数据的冗余性。

(1)空间冗余。在静态图像中有一块表面颜色均匀的区域,在这个区域中所有点的光强和色彩以及色饱和度都相同,具有很大的空间冗余。这是由于基于离散像素采样的方法不能表示物体颜色之间的空间连贯性导致的。

(2)时间冗余。电视图像、动画等序列图片,当其中物体有位移时,后一帧的数据与前一帧的数据有许多共同的地方,如背景等位置不变,只有部分相邻帧改变的画面,显然是一种冗余,这种冗余称为时间冗余。

(3)结构冗余。在有些图像的纹理区,图像的像素值存在着明显的

分布模式。例如,方格状的地板图案等,称此为结构冗余。如果已知分布模式,就可以通过某一过程生成图像。

(4)知识冗余。对于图像中重复出现的部分,我们可以构造出基本模型,并创建对应各种特征的图像库,进而使图像的存储只需要保存一些特征参数,从而可以大大减少数据量。知识冗余是模型编码主要利用的特性。

(5)视觉冗余。事实表明,人的视觉系统对图像的敏感性是非均匀性和非线性的。在记录原始的图像数据时,对人眼看不见或不能分辨的部分进行记录显然是不必要的。因此,大可利用人的视觉的非均匀性和非线性,降低视觉冗余。

(6)图像区域的相同性冗余。它是指在图像中的两个或多个区域所对应的所有像素值相同或相近,从而产生的数据重复性存储,这就是图像区域的相似性冗余。在以上的情况下,当记录了一个区域中各像素的颜色值,则与其相同或相近的其他区域就不需要记录其中各像素的值。采用向量量化(Vector quantization)方法就是针对这种冗余性的图像压缩编码方法。

随着对人的视觉系统和图像模型的进一步研究,人们可能会发现图像中存在着更多的冗余性,使图像数据压缩编码的可能性越来越大,从而推动图像压缩技术的进一步发展。

6.1.3 多媒体数据压缩方法的分类

多媒体数据压缩方法根据不同的依据可产生不同的分类。

1.第一种分类方法是根据解码后数据是否能够完全无丢失地恢复原始数据,可分为两种:

(1)无损压缩:也称为可逆压缩、无失真编码、熵编码等。

工作原理为去除或减少冗余值,但这些被去除或减少的冗余值可以在解压缩时重新插入到数据中以恢复原始数据。它大多使用在对文本和数据的压缩上,压缩比较低,大致在2:1~5:1之间。典型算法有:哈夫曼编码、香农-费诺编码、算术编码、游程编码和Lenpel-Ziv编码等。

(2)有损压缩:也称不可逆压缩和熵压缩等。这种方法在压缩时减少了数据信息是不能恢复的。在语音、图像和动态视频的压缩中,经常采用这类方法。它对自然景物的彩色图像压缩,压缩比可达到几十倍甚至上百倍。

什么是熵?数据压缩不仅起源于20世纪40年代由Claude Shannon首创的信息论,而且其基本原理即信息究竟能被压缩到多小,至今依然遵循信息论中的一条定理,这条定理借用了热力学中的名词“熵”(Entropy)来表示一条信息中真正需要编码的信息量:

考虑用0和1组成的二进制数码为含有n个符号的某条信息编码,假设符号Fn在整条信息中重复出现的概率为Pn,则该符号的熵也即表示该符号所需的位数位为:

En=-log2(Pn)

整条信息的熵也即表示整条信息所需的位数为:E=∑En

举个例子,对下面这条只出现了a、b、c三个字符的字符串:

Aabbaccbaa

字符串长度为10,字符a、b、c分别出现了5、3、2次,则a、b、c在信息中出现的概率分别为0.5、0.3、0.2,他们的熵分别为:

Ea=-log2(0.5)=1

Eb=-log2(0.3)=1.737

Ec=-log2(0.2)=2.322

整条信息的熵也即表达整个字符串需要的位数为:

E=Ea*5+Eb*3+Ec*2=14.855位

回想一下如果用计算机中常用的ASCII编码,表示上面的字符串我们需要整整80 位呢!现在知道信息为什么能被压缩而不丢失原有的信息内容了吧。简单地讲,用较少的位数表示较频繁出现的符号,这就是数据压缩的基本准则。

我们该怎样用0、1这样的二进制数码表示零点几个二进制位呢?确实很困难,

但不是没有办法。一旦我们找到了准确表示零点几个二进制位的方法,我们就有权利向无损压缩的极限挑战了。

第二种分类方法是按照压缩技术所采用的方法来分的,如P111表6-1所示:

表6-1 多媒体数据编码算法分类

实际上连续模拟信号进行数字采样表示时,通常采用奈斯特采样速率。若量化器为N级,即N=2b,则每一个采样的样本用b位的二进制代码表示。在信号的量化中,每一色彩分量一般用8位表示。PCM编码器和解码器位于一个图像编码系统的起点和终点,它们实际上分别是A/D 转换器和D/A转换器,以下所讨论的压缩技术编码方法都是在多媒体数据模拟信号经过编码后再进行的。

2.第二种分类方法是按具体编码算法来分:

(1)预测编码(Predictive Coding,PC):这种编码器记录与传输的不是样本的真实值,而是真实值与预测值之差。对于语音,就是通过预测去除语音信号时间上的相关性;对于图像来讲,帧内的预测去除空间冗余、帧间预测去除时间上的冗余。预测值由预编码图像信号的过

去信息决定。由于时间、空间相关性,真实值与预测值的差值变化范围远远小于真实值的变化范围,因而可以采用较少的位数来表示。另外,若利用人的视觉特性对差值进行非均匀量化,则可获得更高压缩比。

(2)变换编码(Transform Coding,TC):在变换编码中,由于对整幅图像进行变换的计算量太大,所以一般把原始图像分成许多个矩形区域,对子图像独立进行变换。变换编码的主要思想是利用图像块内像素值之间的相关性,把图像变换到一组新的“基”上,使得能量集中到少数几个变换系数上,通过存储这些系数而达到压缩的目的。采用离散余弦编码DCT变换消除相关性的效果非常好,而且算法快速,被普遍接受。

(3)统计编码:最常用的统计编码是哈夫曼编码,出现频率大的符号用较少的位数表示,而出现频率小的符号则用较多位数表示,编码效率主要取决于需要编码的符号出现的概率分布,越集中则压缩比越高。哈夫曼编码可以实现熵保持编码,所以是一种无损压缩技术,在语音和图像编码中常常和其他方法结合使用。

6.2 量化

通常量化是指模拟信号到数字信号的映射,它是模拟量转化为数字量必不可少的步骤。由于模拟量是连续的,而数字量是离散量,因此量化操作实质上是用有限的离散量代替无限的连续模拟量的多对一映射操作。

6.2.1 比特率

比特率是采样率和量化过程中使用的比特数的产物。用例子说明更容易理解,电话通信中,语音信号的带宽约3kHz,根据奈奎斯特定理,意味着采样频率应不低于6kHz。为了留下一定余量可选择标准采样频率为8kHz,使用一个8位的量化器,那么该电话通信所要求的比特率为:8K×8=64Kb/s。

比特率是数据通信的一个重要参数。公用数据网的信道传输能力常常是以每秒传送多少Kb或多少Gb信息量来衡量的。P112表6-2列出了

电话通信、远程会议通信(高音质)、数字音频光盘(CD)和数字音频带(DAT)等几类应用中比特率的相关比较。

表6-2 数字音频格式比较

信息量与数据量的关系:I=D-du

I:信息量;D:数据量;du:冗余量

6.2.2 量化原理

量化处理是使数据比特率下降的一个强有力的措施。脉冲编码调制(PCM)的量化处理在采样之后进行,从原理分析的角度看,图像灰度值是连续的数值,而我们实际看到的是用0~255的整数表示的图像灰度,这是经过A/D转换后的以256级灰度分层量化处理了的离散数值,这样就可以用㏒2256=8位表示一个图像像素的灰度值。或色差信号值,假设是彩色图像。

我们所讨论的多媒体数据压缩编码中的量化,是指以PCM码作为输入,经正交变换、差分或预测处理后,在熵编码之前,对正交变换系数、差值或预测误差的量化处理。量化输入值的动态范围很大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称作量化级,一般希望量化后的数值用较少的比特数就可以表示。每个量化输入被强行归一到与其接近的某个输出,即量化到某个级。量化处理总是把一批输入量化到一个输出级上,所以量化处理是一个多对一的处理过程,一般是个不可逆过程,量化处理中有信息丢失,即会引起量化误差或量化噪声。

6.2.3 标量量化器的设计

1.量化器的设计要求

通常设计量化器有下述两种情况:

(1)给定量化分层级数,满足量化误差最小。

(2)限定量化误差,确定分层级数,满足用尽量小的平均比特数表示量化输出的要求。

显然,这是一对相互矛盾的要求,设计量化器只能折衷处理。

2.量化方法和量化特性

量化方法有标量量化和矢量量化之分,标量量化又可分为均匀量化、非均匀量化和自适应量化。P113图6-1画出了一个标量量化过程的示意图。图6-1中的a区是待量化的函数,是一幅图像的灰度差值图。

设其灰度值范围为0~255,从而使灰度差的范围为-255~255,需要㏒2512=9位表示一个输入,当限定量化输出级m=8时,那么量化输出仅用㏒28=3位表示就可以了,这时出现大量化级到小量化级的对应问题。

图6-1中的b区画出了“均匀量化”处理的量化箱示意图。当m=8,共有W1,W2,W3,……,W8,8个等宽的量化箱,量化箱的宽度和等于输入的动态范围-255~255,也就是说把-255~255数分成8等份。每一等份对应一个量化箱,第k等份的量化值以该量化箱的中心值为准,在该量化箱内所有的输入均被定义为k级。

图6-1中的c区的量化箱不等宽,中间大概率处的箱窄,两边小概率处的箱宽,表示不均匀量化。同样被量化为8级,c区的量化误差小于b区。

量化器的量化特性曲线,有多种多样,P114图6-2给出一个8级均匀量化特性曲线,图6-3给出一个非均匀量化特性曲线。

数据压缩技术中一个关键问题是量化器的设计和量化特性的选择。因为量化是一个有信息丢失的不可逆过程。量化器的好坏,不仅直接影响数据压缩率,而且量化误差对解压缩后的恢复图像的质量有很大影响。比如,斜率过载、颗粒噪声、边缘繁忙、假轮廓等现象都会使图像产生不愉快的视觉效果。自适应量化器,可以弥补上述缺点。

6.2.4 矢量量化

矢量量化编码是近年来图像和语音信号编码技术中颇为流行的一种新型量化编码方法,一般是有失真的编码方法。矢量量化的名字是相对于标量量化而提出的。对于PCM 数据,一个数一个数进行量化叫标量量化。若对这些数据分组,每组K 个数构成一个K 维矢量,然后以矢量为单元,逐个矢量进行量化,称矢量量化。

矢量量化可以更有效地提高压缩比。以P 114图6-4矢量量化编码、解码原理框图说明矢量量化的优越性。

图中输入量是一个待编码的K 维矢量,即先将输入图像分割成m 个方块,每个块的尺寸为n 2,然后把每一个方块以列(行)堆叠成K (K=n 2)维矢量,作为编码输入矢量。码本C 是一个具有N 个K 维矢量的集合,C={y i },i=1,2,……,N 。码本C 实际是一个长度为N 查找表,这个查

找表的每一个分量就是一个K 维矢量y i ,称为码字。在接收端和发送端

各有完全相同的码本C 。

矢量量化编码过程就是从码本C 中搜索一个与输入矢量最接近的码字y i 的过程。想在码本C 中找到一个完全一致的码字的概率是很小的,

一般在可接受的误差范围内就可以算匹配成功,即用该码字y i 代表输入矢量。传输时并不传送码字y i 本身,而只传其下标号“i ”。当码本长度

为N ,为传送下标所需要的比特数为㏒2N 。传送一个像素所需的平均比特数为K

1·㏒2N 。 可见,矢量量化的关键问题是设计一个良好的码本。

6.3 统计编码

数据压缩技术的理论基础是信息论。根据信息论的原理,可以找到最佳数据压缩编码方法,数据压缩的理论极限是信息熵。如果要求在编码过程中不丢失信息量,即要求保存信息熵,这种信息保持编码又称作熵保存编码,或者叫熵编码。熵编码是无失真数据压缩,用这种编码结果经解码后无失真地恢复出原图像。当考虑到人眼对失真不易觉察的生理特征时,有些图像编码不严格要求熵保存,信息可允许部分损失以换

取高的数据压缩比,这种编码是有失真数据压缩,通常运动图像的数据压缩是有失真编码,这就是著名的香农(Shannon )率失真理论,即信息编码率与允许的失真关系的理论。

信息量和信息熵

信息是用不确定性的量度定义的。一个消息的可能性越小,其信息越多;消息的可能性越大,其信息越少。在数学上,所传输的消息是其出现概率的单调下降函数。所谓信息量是指从N 个相等可能事件中选出一个事件所需要的信息度量或含量,也就是在辨认N 个事件中特定的一个事件的过程中所需要提问“是或否”的最少次数。例如,要从64个数中选定某一个数,可以先提问“是否大于32”,不论回答是或否都消去了半数的可能事件,这样继续部下去,只要提问6次这类问题,就能从64个数中选定某一个数。这是因为每提问一次都会得到1比特的信息量。因此在64个数中选定某个数所需要的信息量是:

lb64=6(b)

信息论把一个事件(字符x i )所携带的信息量定义为:

I(x i )=-log 2P(x i ) i=1,2,…,n

其中P(x i )为事件发生(字符出现)概率,I(x i )即信源X 发出x i 时所携带的信息量。

信源X 发出的x i (i=1,2,…,n),共n 个随机事件的自信息统计平均(求数学期望),即

H(X)=E{I(x i )}

=∑=n

i xi P 1

)(·I(x i ) =-∑=n

i xi P 1

)(·log 2P(x i ) H(X)在信息论中称为信源X 的熵(Entropy),它的含义是信源X 发出任一个随机变量的平均信息量。熵的大小与信源的概率模型有着密切的关系。

6.3.1 哈夫曼编码

香农的信息保持编码只是指出存在一种无失真的编码,使得编码平均码长逼近熵值这个下限,但它并没有给出具体的编码方法。信息论中介绍了几种典型的熵编码方法,如Shannon 编码法、Fano 编码法和Huffman 编码法,其中尤其以哈夫曼编码法为最佳,在多媒体编码系统中常用这种方法作熵保持编码。

哈夫曼编码方法于1952年问世。迄今为止,仍经久不衰,广泛应用于各种数据压缩技术中,且仍不失为熵编码中的最佳编码方法。

Huffman 编码法利用了最佳编码定理:在变字长码中,对于出现概率大的信息符号以短字长编码,对于出现概率小的信息符号以长字长编码。如果码字长度严格按照符号概率的大小的相反顺序排列,则平均码字长度一定小于按任何其他符号顺序排列方式得到的码字长度。

哈夫曼编码方法的具体步骤归纳如下:

(1)概率统计(如对一幅图像,或m 幅同种类型图像作灰度信号统计),得到n 个不同概率的信源信息符号。

(2)将信源信息符号的n 个概率,按概率大小排序。

(3)将n 个概率中的最后两个小概率相加,这时概率个数减为n-1个。

(4)将n-1个概率按大小重新排序。

(5)重复步骤(3),将新排序后的最后两个小概率再相加,相加所得到的和与其余概率再排序。

(6)如此反复重复n-2次,最后只剩下两个概率序列。

(7)以二进制码元(0,1)赋值(如大概率用“0”表示,小概率用“1”表示),构成哈夫曼字,至此编码结束。

例:设有7个符号的信源X={x 1,x 2,x 3,…,x 7},概率分布为

P=P(x i ){0.35,0.20,0.15,0.10,0.10,0.06,0.04},做出哈夫曼编码。

码字的平均码长N 用下面公式计算

N =∑-n j PjLj 1

=∑-7

1)(j PiLj

=(0.35+0.20)×2+(0.15+0.10+0.10)×3+(0.06+0.04)×4 =2.55bits/pel

哈夫曼码字长度和信息符号出现概率大小次序正好相反,即大概率信息符号分配码字长度短,小概率信息符号分配码字长度长。

6.3.2 算术编码*(专科)

1.算术编码基本原理

算术编码方法比哈夫曼编码、游程编码等熵编码方法都复杂,但是它无需传送像哈夫曼编码的哈夫曼码表,同时算术编码还有自适应能力的优点,所以算术编码是实现高效压缩数据中很有前途的编码方法。

算术编码从全序列出发,采用递推形式的连续编码。它不是将单个信源符号映射成一个码字,而是将整个输入符号序列映射为实数轴上的

[0,1]区间内的一个间隔,其长度就等于该序列的概率,并在该间隔内选择一个代表性的二进制小数,作为实际的编码输出,使其平均码长逼近信源的熵,从而达到高效编码的目的。

2.例子

由于算术编码复杂且原理不是上面讲得那么简单,所以用一个具体例子加以说明。

设输入数据为eaiou ,其出现概率和所设定的取值范围如下: 字符: a e i o u 概率: 0.2 0.3 0.1 0.2 0.2 范围:[0,0.2] [0.2,0.5] [0.5,0.6] [0.6,0.8] [0.8,1.0] “范围”给出了字符的赋值区间,该区间是根据字符发生的概率划分的。至于把某个具体字符分配在哪个区间范围,对编码本身没有影响,只要保证编码器和译码器对字符的概率区间相同即可。

设high 为编码间隔的高端,显然high=1;low 为编码间隔的低端,

low=0;range为编码间隔的长度,range=high-low;rangelow为编码字符分配的间隔低端;rangehigh为编码字符分配的间隔高端。

于是一个字符编码后,新的low和high按下式计算:

Low=low+range×rangelow high=low+range×rangehigh

(1)在第一个字符e被编码时,e的rangelow=0.2,rangehigh=0.5,因此按照以上介绍的公式:

Low=low+range×rangelow=0+1×0.2=0.2

high=low+range×rangehigh=0+1×0.5=0.5

range=high-Low=0.5-0.2=0.3

此时分配给字符e的范围为[0.2,0.5]。

(2)第二个字符a编码时使用新生成范围[0.2,0.5],a的rangelow=0,rangehigh=0.2。则

Low=low+range×rangelow=0.2+0.3×0=0.2

High=low+range×rangehigh=0.2+0.3×0.2=0.26

range=high-Low=0.26-0.2=0.06

此时分配给a的范围为[0.2,0.26]。

(3)第三个字符i编码时用新生成的范围,i的rangelow=0.5,rangehigh=0.6,则:

Low=low+range×rangelow=0.2+0.06×0.5=0.23

High=low+range×rangehigh=0.2+0.06×0.6=0.236

range=high-Low=0.236-0.23=0.006

(4)第四个字符o编码,o的rangelow=0.6,rangehigh=0.8,则:Low=0.23+0.006×0.6=0.2336

High=0.23+0.006×0.8=0.2348

range=high-Low=0.2348-0.2336=0.0012

此时分配给o的范围为[0.2336,0.2348]。

(5)第五个字符u编码时,u的rangelow=0.8,rangehigh=1.0,,则:

Low=0.2336+0.0012×0.8=0.23396

High=0.2336+0.0012×1.0=0.2342

此时分配给u的范围为[0.23396,0.2342]。

编码结果如P117表6-3。

表6-3 输入字符的算术编码结果

随着字符的输入,代码的取值范围越来越小,当字符串eaiou被全部编码后,其范围在[0.23396,0.2342]内,即在此范围内的数值代码都唯一地对应于字符串eaiou。我们可以取这个区间的下限0.23396作为对源数据流eaiou进行压缩编码后的输出代码。于是,可以用一个浮点数表示一个字符串,达到少占存储空间的目的。

(6)译码的时候又是如何处理呢?译码过程的实现比较简单。以上例为例,根据上面给定字符的概率和取值范围,对代码0.23396进行译码,步骤如下:

①根据代码所在范围确定当前代码的第一个字符,并输出。由于

0.23396在[0.2,0.5]的范围内,所以,代码对应的第一个字符是e。输出字符e。

②用0.23396减去e发生在概率取值的下限0.2,使代码变为

0.03396,再除以e范围的宽度0.5-0.2=0.3,得到0.1132,落入区间[0,0.2],所以对应后续字符为a。

③转到②,将0.1132作为代码继续确定下一个译码字符的范围。重复上述步骤直到整个字符串处理完毕为止。

所以,有人说算术编码是“向极限挑战”。

6.3.3 游程编码

在一幅图像中具有许多颜色相同的图块,如:一行上有许多连续的像素都具有相同的颜色,甚至许多行上的颜色都相同。所以在存储彩色时,只需存储一个像素的颜色,然后再存储具有相同颜色的像素数目或者相同颜色的行数,这样势必可以大大压缩数据量。这种压缩编码称为游程编码(Run Length Encoding,RLE)。简单的说RLE压缩就是将一串连续的相同数据转化为特定的格式达到压缩数据量的目的。

例如,有一幅灰度图像,第n行的像素值如P118图6-6所示。用RLE 编码方法得到的代码为:80315084180。代码中加下划线表示的数字是行程长度,其后面不加下划线的数字代表像素的颜色值。如,有下划线的50表示有连续50个像素具有相同颜色值8。

上例中,用游程编码的11个代码表示原来的73个代码,压缩比达到了7:1。可见RLE确实是一种实现起来简单、还原后得到的数据与压缩前的数据完全相同的无损压缩技术。但是RLE所能获得的压缩比有多大,主要取决于图像本身的特点。如果图像中具有相同颜色的图像块越大,图像块数目越少,获得的压缩比就越高;反之,压缩比就越小。对于重复色彩特别少的图像,如果仍然使用RLE编码方法,不仅不能压缩图像数据,反而可能使原来的图像数据变得更大。不过RLE编码技术仍可以和其他编码技术联合应用。

6.4 变换编码

预测编码是一种较好地去除音频、图像信号相关性的编码技术,而变换编码也可以有效地去除图像信号的相关性,而且其性能还往往优于预测编码。

6.4.1 变换编码的基本原理

变换编码不是直接对空域图像信号编码,而是首先在数据压缩前对原始输入数据作某种正交变换,把图像信号映射变换到另外一个正交向量空间,产生一批变换系数,然后再对这些变换系数进行编码处理。它

首先在发送端将原始图像分割成n个子图像块,每个子图像块经过正交变换、滤波、量化和编码后经信道传输到达接收端,接收端做解码、逆变换、综合拼接,恢复出空域图像。P119图6-7给出了过程示意图。

数字图像信号经过正交变换为什么能压缩数据量呢?举一个简单例子说明:一时域三角函数y(t)=Asin2πft,当t从-∞到+∞变化时,y(t)是一个正弦波。假如将其变换到频域表示,只需幅值A和频率f两个参数就足够了,可见y(t)在时域描述,数据之间的相关性大,数据冗余度大;而转到频域描述,数据相关性大大减少,数据冗余量减少,参数独立,数据量减少。

再如,有两个相邻的数据样本x

1与x

2

,每个样本采用3位编码,因

此各有23=8个幅度等级。而两个样本的联合事件,共有8×8=64种可能,

可用P120图6-8(a)的二维平面坐标表示。其中x

1轴与x

2

轴分别表示相邻

两样本可能的幅度等级。对于慢变信号,相邻两样本x

1与x

2

同时出现相

近幅度等级的可能性较大。因此,如图6-8(a)阴影区内450斜线附近的联合事件的出现概率也就越大,将阴影区之边界称为相关圈,信源的相关性越强,则相关圈越扁;反之,圈越圆。为了对圈内各点的位置进行编码,就要对两个差不多大的坐标值分别进行编码。当相关性越弱时,

此相关圈就越显圆形状,说明x

1处于某一幅度等级时,x

2

可能出现在不

相同的任意幅度等级上。

现在对该数据对进行正交变换,从几何上相当于坐标系逆时针转过

450,变成y

1、y

2

坐标系,如P120图6-8(b)所示,此时相关圈正好y

1

标轴下。且该圈越扁长,它在y

1上的投影就越大,面在y

2

上的投影就越

小。因而从y

1、y

2

坐标来看,任凭y

1

在较大范围内变化,而y

2

却可以“岿

然不动”或只有“微动”。这就意味着变量y

1、y

2

之间在统计上更加相互

独立。因此,通过这种坐标系旋转变换,就能得到一组去掉大部分甚至全部统计相关性的另一种输出样本。

由此可知,正交变换实现数据压缩的本质在于:经过坐标系适当的旋转和变换,能够把散布在各个坐标轴上的原始数据,在新的、适当的坐标系中集中到少数坐标轴上,因而可用较少的编码位数来表示一组信

号样本,实现高效率的压缩编码。

变换编码技术已有近30年的历史,理论较完备,技术上比较成熟,广泛应用各种图像数据压缩,诸如单色图像、彩色图像、静止图像、运动图像,以及多媒体计算机技术中的电视帧内图像压缩和帧间图像压缩等。

正交变换的种类很多,如傅里叶(Fouries)变换、沃尔什(Walsh)变换、哈尔(Haar)变换、斜(slant)变换、余弦变换、正弦变换、K-L (Karhunen-Loeve)变换等。

6.4.2 最佳的正交变换——K-L变换

离散Karhunen-Loeve(K-L)变换是以图像的统计特性为基础的一种正交变换,也称为特征向量变换或主分量变换。主分量变换技术早在1933年就被霍特林(Hotelling)发现,他曾对这种正交变换作深入的分析。当今在图像处理书中提到的霍特林变换、K-L变换,其实所指的是同一种正交变换方法——主分量法。

K-L变换从图像统计特性出发用一组不相关的系数来表示连续信号,实现正交变换。

K-L变换使向量信号的各个分量互不相关,因而在均方误差准则下,它是失真最小的一种变换,故称为最佳变换。虽然K-L变换是最佳正交变换方法,但是由于它没有通用的变换矩阵,因此,对于每一个图像数据都要计算相应的变换矩阵,计算量相当大,很难满足实时处理的要求,所以在实际应用中很少用K-L变换对图像数据进行压缩。由于它的“最佳”特性,所以常作为对其他变换技术性能的评价标准。

K-L变换的压缩性能是:对语音而言,用K-L变换在13.5Kb/s下得到的语音质量可与56Kb/s的PCM编码相比拟;对图像来讲,2位/pixel 的质量可与7位/pixel的PCM编码相当。

6.4.3 离散余弦变换

余弦变换是傅里叶变换的一种特殊情况。在傅里叶级数展开式中,如果被展开的函数是实偶函数,那么,其傅里叶级数只包含余弦项,再

将其离散化,由此可导出余弦变换,或称之为离散余弦变换(discrete cosine transform,DCT)。

将众多的正交变换技术比较后,人们发现离散余弦变换编码DCT与K-L变换性能最接近,而该算法的计算复杂度适中,又具有算法快速的特点,所以近来的图像数据压缩中采用离散余弦变换编码方法受到重视,特别是20世纪90年代迅速崛起的计算机多媒体技术中,JPEG、MPEG、H.261等压缩标准,都用到离散余弦变换编码进行数据压缩。

DCT变换原理:DCT是一种正交变换,它将信号从空间域变换到频率域。在频率域中,大部分的能量集中在少数几个低频系数上,而且代表不同空间频率分量的系数间的相关性大为减弱,只利用几个能量较大的低频系数就可以很好地恢复原始图像,见附图1。对于其余的那些低能量系数,可允许其有较大的失真,甚至可以将其设置为0,这是DCT能够进行图像数据压缩的本质所在。

DCT可分为一维离散余弦变换、二维离散余弦变换、借助傅里叶变换(FFT)实现离散余弦变换、二维快速离散余弦变换等。

6.4.4 变换后的压缩

经过正交变换后,进一步的数据压缩依靠区域滤波,匹配主观视觉特性的量化和变字长编码。

1.区域滤波和量化

区域滤波是一个简单的数据压缩方法,它将经过某种正交变换所得的系数矩阵分成几个区域,对每一区域按照空间频率的权重取一种量化级数,然后根据这个量化级数进行量化。

另一种更细致的量化方法是根据视觉对图形的敏感程度(通过主观实验确定),对于变换系数矩阵中的每个变换系数分别乘以一个视觉加权系数,由这一系数决定分配编码量的多少。例如,MPEG-2采用8×8个DCT,则对应于64个变换系数,有一个8×8视觉加权矩阵。在对每个变换系数加权处理后,再统一采用一个通用的量化器进行量化。这一过程实际上相当于对不同的变换系数采用粗、细不同的量化。

2.“0”的游程编码

如P122图6-9所示,DCT变换后,变换系数矩阵中除主对角线外的元素很多是0,或接近于0,再加上视觉加权处理和量化,会产生更多的0。对于同一数据的成串出现最好使用游程编码。

如果一行编码,0在对角线附近,编码过程就会断掉,一个游程就会结束,可以采用zig-zag扫描读取方式,如P122图6-9所示。

6.5 数据压缩编码国际标准

从20世纪80年代开始,世界上已有几十家公司纷纷投入到多媒体计算机系统的研制和开发工作。20世纪90年代已有不少精彩的多媒体产品问世,诸如荷兰菲利浦和日本索尼联合推出的CD-I,苹果公司Macintosh为基础的多媒体功能的计算机系统,Intel和IBM公司联合推出的DVI。此外,还有Microsoft公司的MPC及苹果的Quick Time等,这些多媒体计算机系统各具特色,丰富多彩,竞争异常激烈。

具有人机交互特色的多媒体技术,使计算机进入普通家庭,进入人们的生活、学习、娱乐及人们的精神生活领域。人们像使用家用电器一样地使用计算机。计算机能听懂人的话语;计算机成为能讲话的实用型产品进入市场,也为时不远了。

Internet技术的迅猛发展与普及,推动了世界范围的信息传输和信息交流。

在色彩缤纷、变幻无穷的多媒体世界中,用户如何选择产品,如何自由地组合、装配来自不同厂家的产品部件,构成自己满意的系统,这就涉及一个不同厂家产品的兼容性问题,因此需要一个全球性的统一的国际技术标准。

国际标准化协会(International Standardization Organization,ISO)、国际电子学委员会(International Electronics Committee,IEC)、国际电信协会(International Telecommunication Union,ITU)等国际组织及CCITT,于20世纪90年代领导制定了多个重要的多媒体国际标准。如H.261、H.263、JPEG和MPEG等标准。

数据压缩技术综述

龙源期刊网 https://www.doczj.com/doc/6a5864331.html, 数据压缩技术综述 作者:汪见晗 来源:《科学与财富》2016年第04期 摘要:在现今的电子信息技术领域,正发生着一场有长远影响的数字化革命。由于数字 化的多媒体信息尤其是数字视频、音频信号的数据量特别庞大,如果不对其进行有效的压缩就难以得到实际的应用。因此,数据压缩技术已成为当今数字通信、广播、存储和多媒体娱乐中的一项关键的共性技术。本文从专利文献的视角对数据压缩技术的发展进行了全面的统计分析,总结了与数据压缩相关的专利申请趋势、主要申请人分布,介绍了数据压缩技术的重点技术分支及其发展历程,并分析了全球数据压缩技术演进特点,并绘制了国内重点申请人的技术发展路线图。 关键词:数据压缩;发展路线 1 数据压缩介绍 1.1 数据压缩的分类 目前,通用的主流压缩方法分为无损压缩和有损压缩。无损压缩利用数据的统计冗余进行压缩。数据统计冗余度的理论限制为2:1到5:1,所以无损压缩的压缩比一般比较低。这类方法广泛应用于文本数据、程序和特殊应用场合的图像数据等需要精确存储数据的压缩,通常的无损压缩编码方法有香农-范诺编码,霍夫曼(Huffman)编码,算术编码,字典压缩编码等。 有损压缩方法利用了人类视觉、听觉对图像、声音中的某些频率成分不敏感的特性,允许压缩的过程中损失一定的信息。虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像的影响较小,却换来了比较大的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩,按照应用领域来分,有损压缩编码分为图像压缩编码,视频压缩编码,音频压缩编码。 2 数据压缩专利申请数据分析 本章主要对全球和国内数据压缩专利申请情况以及国内外专利重要申请人进行分析,从中得到技术发展趋势,以及各阶段专利申请人所属的国家分布和主要申请人。其中以每个同族中最早优先权日期视为该申请的申请日,一系列同族申请视为一件申请。 2.1 全球专利申请状况 2.1.1 全球数据压缩专利申请量

多媒体技术基础(数据压缩、标准、音频、图像)作业及答案

第二章作业 作业总体要求: 1.认真独立的完成 2.让文件名重新命名为自己的学号,然后通过http://10.66.4.241提交。 一.选择题 1.下列说法中不正确的是【B】。 A.有损压缩法会减少信息量 B.有损压缩法可以无失真地恢复原始数据 C.有损压缩法是有损压缩 D.有损压缩法的压缩比一般都比较大 2.下列属于无损压缩的是【B 】。 A.WA VE文件压缩成MP3文件 B.TXT文件压缩成RAR文件 C. BMP文件压缩成JPEG文件 D.A VI文件压缩成RM文件 3.图像序列中的两幅相邻图像,后一幅图像与前一幅图像之间有较大的相关, 这是【 D 】。 A. 空间冗余 B.时间冗余 C.信息熵冗余 D.视觉冗余 4.衡量数据压缩技术性能好坏的主要指标是【C】。 (1)压缩比(2)算法复杂度(3)恢复效果(4)标准化 A. (1)(3) B. (1)(2)(3) C. (1)(3)(4) D.全部 5.MPEG标准不包括下列哪些部分【C 】。 A.MPEG视频 B.MPEG音频 C.MPEG系统 D.MPEG编码 6.下列属于静态图像编码和压缩标准的是【B 】。 A.JPEG B.MPEG-1 C.MPEG-2 D.MPEG-4 7.声音信号是声波振幅随时间变化的【A 】信号. A.模拟 B.数字

C.无规律 D.有规律 8.在数字视频信息获取与处理过程中,下述顺序正确的是【A 】。 A.采样、A/D变换、压缩、存储、解压缩、D/A变换 B.采样、D/A变换、压缩、存储、解压缩、A/D变换 C.采样、压缩、A/D变换、存储、解压缩、D/A变换 D.采样、压缩、D/A变换、存储、解压缩、A/D变换 9.一般来说,表示声音的质量越高,则【C 】 A.量化位数越多和采样频率越低 B.量化位数越少和采样频率越低 C.量化位数越多和采样频率越高 D.量化位数越少和采样频率越高 10.5分钟双声道、16位采样位数、44.1kHZ采样频率声音的不压缩数据量是 【 B 】。 A. 48.47MB B. 50.47MB C. 105.84MB D. 25.23MB 11.下列采集的波形声音【 D 】的质量最好。 A、单声道,8位量化,22.05kHz采样频率 B、双声道,8位量化,44.1kHz采样频率 C、单声道,16位量化,22.05kHz采样频率 D、双声道,16位量化,44.1kHz采样频率 12.频率在20HZ-20KHZ的被称为【 A 】 A. 可听声波 B. 次声波 C.超声波 D.超音波 13.MIDI是音乐与【 A 】结合的产物. A.计算机 B.通信 C.高科技 D.通讯 14.Windows中使用录音机录制的声音文本的格式是【B 】 A. MIDI B.WA V C.MP3 D.MOD

数据压缩,算法的综述

数据压缩算法的综述 S1******* 许申益 摘要:数据压缩技术在数据通讯和数据存储应用中都有十分显著的益处。随着数据传输技术和计算机网络通讯技术的普及应用,以及在计算机应用中,应用软件的规模和处理的数据量的急剧增加,尤其是多媒体技术在计算机通讯领域中的出现,使数据压缩技术的研究越来越引起人们的注意。本文综述了在数据压缩算法上一些已经取得的成果,其中包括算术编码、字典式压缩方法以及Huffman码及其改进。 关键字:数据压缩;数据存储;计算机通讯;多媒体技术 1.引言 数据压缩技术在数据通讯和数据存储应用中都有十分显著的益处。在数据的存储和表示中常常存在一定的冗余度,一些研究者提出了不同的理论模型和编码技术降低了数据的冗余度。Huffman 提出了一种基于统计模型的压缩方法,Ziv Jacob 提出了一种基于字典模型的压缩方法。随着数据传输技术和计算机网络通讯技术的普及应用,以及在计算机应用中,应用软件的规模和处理的数据量的急剧增加,尤其是多媒体技术在计算机和通讯两个领域中的出现,使数据压缩技术的研究越来越引起人们的注意。本文综述了在数据压缩算法上的一些已经取得的成果。 本文主要介绍了香农范诺编码以及哈弗曼算法的基本思想,运用其算法的基本思想设计了一个文件压缩器,用Java 语言内置的优先队列、对象序列化等功能实现了文件压缩器的压缩和解压功能。 2数据压缩算法的分类 一般可以将数据压缩算法划分为静态的和动态的两类。动态方法又是又叫做适应性(adaptive)方法,相应的,静态方法又叫做非适应性方法(non-adaptive)。 静态方法是压缩数据之前,对要压缩的数据经过预扫描,确定出信源数据的

数据压缩的基本原理和方法(pdf 87页)

第三章多媒体数据压缩

3.1 数据压缩的 基本原理和方法

3.1 数据压缩的基本原理和方法 ?压缩的必要性 音频、视频的数据量很大,如果不进行处理,计算机系统几乎无法对它进行存取和交换。 例如,一幅具有中等分辨率(640×480)的真彩色图像(24b/像素),它的数据量约为7.37Mb/帧,一个 100MB(Byte)的硬盘只能存放约100帧图像。若要达到每秒25帧的全动态显示要求,每秒所需的数据量为 184Mb,而且要求系统的数据传输率必须达到184Mb/s。 对于声音也是如此,若采用16b样值的PCM编码,采样速 率选为44.1kH Z ,则双声道立体声声音每秒将有176KB的 数据量。

3.1 数据压缩的基本原理和方法 ?视频、图像、声音有很大的压缩潜力 信息论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。 原始信源的数据存在着很多冗余度:空间冗余、时间冗余、视觉冗余、听觉冗余等。

3.1.1 数据冗余的类型 ?空间冗余:在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。 –一幅图象中同一种颜色不止一个象素点,若相邻的象素点的值相同,象素点间(水平、垂直)有冗余。 –当图象的一部分包含占主要地位的垂直的源对象时,相邻 线间存在冗余。

3.1.1 数据冗余的类型 ?时间冗余:时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。 –音频的前后样值之间也同样有时间冗余。 –若图象稳定或只有轻微的改变,运动序列帧间存在冗余。

多媒体数据压缩技术综述

南昌大学研究生(工程硕士)2006~2007学年第二学期 期末考试试卷 课程名称:《多媒体技术》专业:软件工程 学生姓名:学号:C2007271 学院:信息工程学院得分: 任课教师签:洪春勇时间:2007.8 多媒体数据压缩技术综述 摘要:本文侧重介绍多媒体各种数据类型和数据描述,讨论数据

压缩技术在各种媒体数据上的应用及发展趋势。 关键词:多媒体数据、数据压缩、JPEG、MPEG-4、发展趋势、一、引言 多媒体在我国的定义是:能对多种载体(媒介)上的信息和多种存储体(媒介)上的信息进行处理的技术。多媒体传统关键技术主要集中在以下四类中:数据压缩技术、大规模集成电路(VLSI)制造技术、大容量的光盘存储器(CD-ROM)、实时多任务操作系统。因为这些技术取得了突破性的进展,多媒体技术才得以迅速的发展。网络技术的发展使多媒体技术的应用空间得到了快速拓展。但是网络现状的局限性也使得各种多媒体技术应用受到制约,因此对于多媒体数据的压缩技术显得非常重要和关键。 二、多媒体数据类型及其数据描述 (一)多媒体数据类型 1.文字 文字是人与计算机之间进行信息交换的主要媒体。在计算机发展的早期,比较实用的终端为一般文字终端,在屏幕上显示的都是文字信息。由于人们在现实生活中用语言进行交流,所以开始时文字终端比较流行,但是后来出现了图形、图像、声音等媒体,这样也就相应地出现了多种终端设备。在现实世界中,文字是人们进行通信的主要形式,文字包括西文与中文。在计算机中,文字用二进制编码表示,即使用不同的二进制编码来代表不同的文字。

2.音频 音频(Audio)指的是20HZ~20kHz的频率范围,但实际上“音频”常常被作为“音频信号”或“声音”的同义语,是属于听觉类媒体,主要分为波形声音、语音和音乐。 3.视觉媒体 能够利用视觉传递信息的媒体都是视觉媒体。位图图像、矢量图像、动态图像、符号等都是视觉媒体。 4.动画 动画是指运动的画面,动画在多媒体中是一种非常有用的信息交换工具。计算机动画的研究始于20世纪60年代初期。1963年Bell实验室制作了第一部计算机动画片。最初主要集中在二维动画的研制,作为示教和辅助制作传统动画片之用。三维计算机动画的研究始于20世纪70年代初,但真正进入实用化还是80年代中后期。随着具有实时处理能力的超级图形工作站的出现,以及三维造型技术、真实感图形生成技术的迅速发展,推出了一些可生成具有高逼真度视觉效果的实用化、商品化的三维动画系统。20世纪90年代初,计算机动画技术成功地应用于电影特技,取得了出色的成就,由此可见计算机动画技术的重要意义。(二)多媒体数据的描述 1.音频文件 在多媒体声音处理技术中,最常见的几种声音存储格式是:WAVE波形文件,MIDI音乐数字文件和目前非常流行的MP3

多媒体数据压缩实验报告

多媒体数据压缩实验报告 篇一:多媒体实验报告_文件压缩 课程设计报告 实验题目:文件压缩程序 姓名:指导教师:学院:计算机学院专业:计算机科学与技术学号: 提交报告时间:20年月日 四川大学 一,需求分析: 有两种形式的重复存在于计算机数据中,文件压缩程序就是对这两种重复进行了压 缩。 一种是短语形式的重复,即三个字节以上的重复,对于这种重复,压缩程序用两个数字:1.重复位置距当前压缩位置的距离;2.重复的长度,来表示这个重复,假设这两个数字各占一个字节,于是数据便得到了压缩。 第二种重复为单字节的重复,一个字节只有256种可能的取值,所以这种重复是必然的。给 256 种字节取值重新编码,使出现较多的字节使用较短的编码,出现较少的字节使用较长的编码,这样一来,变短的字节相对于变长的字节更多,文件的总长度就会减少,并且,字节使用比例越不均

匀,压缩比例就越大。 编码式压缩必须在短语式压缩之后进行,因为编码式压缩后,原先八位二进制值的字节就被破坏了,这样文件中短语式重复的倾向也会被破坏(除非先进行解码)。另外,短语式压缩后的结果:那些剩下的未被匹配的单、双字节和得到匹配的距离、长度值仍然具有取值分布不均匀性,因此,两种压缩方式的顺序不能变。 本程序设计只做了编码式压缩,采用Huffman编码进行压缩和解压缩。Huffman编码是一种可变长编码方式,是二叉树的一种特殊转化形式。编码的原理是:将使用次数多的代码转换成长度较短的代码,而使用次数少的可以使用较长的编码,并且保持编码的唯一可解性。根据 ascii 码文件中各 ascii 字符出现的频率情况创建 Huffman 树,再将各字符对应的哈夫曼编码写入文件中。同时,亦可根据对应的哈夫曼树,将哈夫曼编码文件解压成字符文件. 一、概要设计: 压缩过程的实现: 压缩过程的流程是清晰而简单的: 1. 创建 Huffman 树 2. 打开需压缩文件 3. 将需压缩文件中的每个 ascii 码对应的 huffman 编码按 bit 单位输出生成压缩文件压缩结束。

压缩技术

压缩技术Compression Techniques基本的压缩技术有: 空格压缩(Null Compression) 将一串空格用一个压缩码代替,压缩码后面的数值代表空格的个数。 游长压缩(Run-Length Compression)它是空格压缩技术的扩充,压缩任何4个或更多的重复字符的串。该字符串被一个压缩码、一个重复字符和一个代表重复字符个数的值所取代。关键字编码(Key-word encoding)创建一张由表示普通字符集的值所组成的表。频繁出现的单词如for、the或字符对如sh、th,被表示为一些标记(token),用来保存或传送这些字符。 哈夫曼统计方法(Huffman statistical method)这种压缩技术假定数据中的字符有一个变化分布,换句话说,有些字符的出现次数比其余的多。字符出现越频繁,用于编码的位数就越少。这种编码方案保存在一张表中,在数据传输时,它能被传送到接收方调制解调器使其知道如何译码字符。 因为压缩算法是基于软件的,所以实时环境中,存在着额外开销,会引起不少问题。而文件备份、归档过程中的压缩不会有什么问题。使用高性能的系统有助于消除大部分的额外开销和性能问题。另外,压缩消除了文件的可移植性,除非解压缩软件也与文件一起传送。 注意,有些文件已经被压缩,进一步的外部压缩不会有任何好处,一些图形文件格式,如标签映象文件格式(TIFF),就已经包含了压缩。 存储系统压缩Storage System Compression存储系统压缩 在讨论文件存储的压缩算法之前,应该明确文件压缩不同于磁盘编码。磁盘编码通常由磁盘驱动器把更多的数字1和0写到磁盘的物理表面上。文件压缩把文件中的字符和位串挤压到更小的尺寸。它在文件信息传送到硬盘驱动器的写头之前由软件完成。现代的使用编码的硬盘驱动器只是从CPU接收1和o的位流,并且把它们压挤到比没有使用编码小得多的空间中。磁盘编码简单讨论到这儿,下面将着重讨论文件压缩。 磁盘记录系统如硬盘驱动器通过改变磁盘表面的磁场来记录信息。两种可能状态间的磁场变化称为磁通翻转(flux transition)。简单地说,磁通翻转代表数字1,磁通不翻转代表数字0。编码提供了一种方法使每个磁通翻转代表更多数字信息。改进调频制 MFM(Modified frequency modulation)将一个磁通翻转表示多个1,将磁通不翻转表示多个0。编码技术包括下述几种。 游长受限码(Run Length limited(RLU))把位组合格式表示为代码,可以用较少的磁通翻转来存储。与MFM相比,存储容量提高了50%。 改进的游长受限码(Advanced run length limited(ARLL) 通过把位组合格式转换成能用四倍密度磁通翻转来存储的代码,从而把MFM的记录密度翻了一倍。 因为磁盘编码是由硬盘驱动器在硬件级自动处理的,这里没有必要进一步讨论。当你购买一个硬盘驱动器,它使用一种编码方案而获得一定的容量,但是只要驱动器的容量满足你的要求,购买后,就不必关心它的编码方案了。 文件压缩文件压缩的实现有几种方式,提供的各种工具使你能每次压缩一个文件,或压缩一组文件。一组文件能压缩成单个文件,更易于传送到其它用户,解压缩工具把文件解开。一个流行的共享文件压缩工具称为PKZIP(威斯康辛州Glendale的PKWARE公司),

数据压缩

数据压缩浅述 数据压缩是指在不丢失信息的前提下,缩减数据量以减少存储空间,提高其传输、存 储和处理效率的一种技术方法。或按照一定的算法对数据进行重新组织,减少数据的 冗余和存储的空间。数据压缩包括有损压缩和无损压缩。 例如,如果我们将“compression”编码为“comp”那么这篇文章可以用较少的数据 位表示。一种流行的压缩实例是许多计算机都在使用的ZIP 文件格式,它不仅仅提供 了压缩的功能,而且还作为归档工具(Archiver)使用,能够将许多文件存储到同一个文件中。 无损压缩算法通常利用了统计冗余,这样就能更加简练地、但仍然是完整地表示发送 方的数据。 如果允许一定程度的保真度损失,那么还可以实现进一步的压缩。例如,人们看图画 或者电视画面的时候可能并不会注意到一些细节并不完善。同样,两个音频录音采样 序列可能听起来一样,但实际上并不完全一样。有损压缩算法在带来微小差别的情况 下使用较少的位数表示图像、视频或者音频。 一些机制是可逆的,这样就可以恢复原始的数据,这种机制称为无损数据压缩;另外 一些机制为了实现更高的压缩率允许一定程度的数据损失,这种机制称为有损数据压缩。 事实上,多媒体信息存在许多数据冗余。例如,一幅图像中的静止建筑背景、蓝天和 绿地,其中许多像素是相同的如果逐点存储,就会浪费许多空间,这称为空间冗余。 又如,在电视和动画的相邻序列中,只有运动物体有少许变化,仅存储差异部分即可,这称为时间冗余。此外还有结构冗余、视觉冗余等,这就为数据压缩提供了条件。 总之,压缩的理论基础是信息论。从信息的角度来看,压缩就是去除掉信息中的冗余,即去除掉确定的或可推知的信息,而保留不确定的信息,也就是用一种更接近信息本 质的描述来代替原有的冗余的描述,这个本质的东西就是信息量。 许多无损数据压缩系统都可以看作是四步模型,有损数据压缩系统通常包含更多的步骤,例如它包括预测、频率变换以及量化。? 无损压缩是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与 原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。一 个很常见的例子是磁盘文件的压缩。根据目前的技术水平,无损压缩算法一般可以把

《数据压缩技术》教学设计

数据压缩技术 一、课程标准中的相关内容 1.认识多媒体技术对人类生活、社会发展的影响 2.初步了解多媒体信息采集、加工原理 3.掌握应用多媒体技术促进交流并解决实际问题的思想与方法 二、教学目标 1.知识与技能 ①理解压缩的含义 ②理解实现数据压缩的条件 ③分别了解无损压缩和有损压缩 ④了解无损压缩的简单原理 ⑤初步掌握二叉树编码 2.过程与方法 ①通过阅读、观察、探索等方式理解数据压缩技术 ②设计一系列渐进式问题引导学生自主探究。 3.情感态度与价值观 ①理解和领悟交流的乐趣 ②培养分析能力和信息归纳能力 ③加深对本学科的技术分支认识 三、学生分析 本课的教学对象是高中一年级的学生。学生通过在初中阶段的系统学习,已经地掌握了一定信息处理能力,如文本处理,图像处理,压缩处理等,但大部分学生对此多局限于操作层面,与原理上的理解认知并不同步。特别是对于技术层面较高的知识,学生之间的差异就更大了。本课时对操作和理解原理能力同步性要求较高,为了让学生能够顺利的完成任务,获得成就感,任务的设计必须有一定的层次关系,且有充足的学习资源配套使用。 四、教材分析

本内容选自选修2《多媒体技术应用》第3.2.6节《数据压缩技术》(P46)。高中阶段的课程,尤其是选修模块,较初中阶段更强调理论与实践的结合——已不是单纯的熟练操作,还应从原理上去把握技术的实质,这也体现了课标中“原理性”的要求。 对于数据压缩技术,其实很多学生使用计算机的时候都在不知不觉中享受着它带来的便利,只是他们对此并没有足够的认识而已。课本对数据压缩技术的介绍概括性较强。如果仅仅照本宣科的话,学生的理解是有一定困难的,也容易让他们对原理性的知识产生抗拒感。经过对教材的多次梳理,我确定了教学的重点为数据压缩技术的概念、类型和实现条件;难点为二叉树编码的原理。 五、教学重点难点 1.教学重点: ①压缩的概念与实现条件 ②压缩的两种基本类型——无损压缩和有损压缩 2.教学难点: ①理解压缩实现的原理 ②初步掌握二叉树编码 六、教学策略 新课程标准中特别强调从问题解决出发,让学生亲历处理信息、开展交流、相互合作的过程。特别强调结合学生的生活和学习实际设计问题,让学生在活动过程中掌握应用信息技术解决问题的思想和方法,同时鼓励学生将所学的信息技术积极应用到生产、生活乃至技术革新等实践活动中。本节主要采用“问题解决”的教学模式。“问题解决”教学模式是指依据教学内容和要求,由教师创设问题情境,以问题的发现、探究和解决来激发学生求知欲和主体意识,培养学生的实践和创新能力的一种教学模式。其中,教师创设问题情境是教学设计的中心环节,即围绕某一“问题”进行渐进式的、全方位的设问。流程如下图所示

数据压缩原理

AIX 上总有一种压缩方式适合你 当今世界每天产生大量的数据,有些数据我们需要进行压缩,压缩数据的好处不言而喻:节省空间;方便传输;加密保护等等。很多压缩工具应运而出,每种工具都有自己的特点。对于AIX 平台上的压缩方法也很多compress、pack、gzip、pax、tar 等等。本文将首先简单介绍一下压缩的基本原理然后详细介绍AIX 平台的常用压缩工具并针对它们各自的特色进行比较,让读者对对AIX 平台的压缩有针对性的认识,从而能够根据不通的需要选择合适的压缩工具。 数据压缩的原理 数据压缩是指在不丢失信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率的一种技术方法。或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间。数据压缩包括有损压缩和无损压缩。无损压缩是可逆的;有损压缩是不可逆的。 计算机处理信息是以二进制数(0 和1)的形式表示的,压缩软件把二进制信息中相同的字符串以特殊字符标记起来,从而实现缩小文件大小来达到压缩的目的。压缩的理论基础是信息论。从信息的角度来看,压缩就是去除掉信息中的冗余,即去除掉确定的或可推知的信息,而保留不确定的信息,也就是用一种更接近信息本质的描述来代替原有的冗余的描述,这个本质的东西就是信息量。 数据压缩的硬件和软件工具也非常多,本文将针对AIX 平台常见的几种数据压缩工具进行介绍和比较并提供常用的示例进行解说,希望您能从中选择合适的压缩工具进行压缩。 AIX 平台上,通常我们看到的 .Z .gz .z .ar .tar 后缀的文件都是压缩文件。通过compress 可以生 成 .Z 压缩文件,通过compress、uncompress、gzip 可以解压 .Z 格式的压缩文件;通过gzip 可以生成 .gz 压缩文件,通过gzip 可以解压 .gz 格式的压缩文件;通过pack 可以生成 .z 压缩文件,通过unpack、gzip 可以解压 .z 格式的压缩文件;通过pax 可以生成 .ar 压缩文件,通过pax 可以解压 .ar 格式的压缩文件;通过pax、tar 可以生成 .tar 压缩文件,通过pax、tar、untar、可以解压 .tar 格式的压缩文件。图 1 描述了各种类型文件的压缩及解压可以选择的AIX 工具。 图 1. 不同文件类型的压缩及解压

数据压缩技术技术发展的现状及趋势

数据压缩技术技术发展的现状及趋势 摘要:由于数字化的多媒体信息尤其是数字视频、音频信号的数据量特别庞大,如果不对其进行有效的压缩就难以得到实际的应用。因此,数据压缩技术已成为当今数字通信、广播、存储和多媒体娱乐中的一项关键的共性技术。 关键字:数据压缩现状趋势 Abstract: As digital multimedia information, especially digital video, audio signals particularly large amount of data, if not its effective compression can hardly be practical application. Therefore, the data compression technology has become the digital communication, broadcasting, storage, and multimedia entertainment in a key common technologies. Keywords: data compression Status Trend 一.数据压缩的概念及现状 数据压缩,通俗地说,就是用最少的数码来表示信号,其作用是:能较快地传输各种信号。 对于数据压缩技术而言,最基本的要求就是要尽量降低数字化的在码事,同时仍保持一定的信号质量。不难想象,数据压缩的方法应该是很多的,但本质上不外乎上述完全可逆的冗余度压缩和实际上不可逆的嫡压缩两类。冗余度压缩常用于磁盘文件、数据通信和气象卫星云图等不允许在压缩过程中有丝毫损失的场合中,但它的压缩比通常只有几倍,远远不能满足数字视听应用的要求。在实际的数字视听设备中,差不多都采用压缩比更高但实际有损的媳压缩技术。 数据压缩主要分为2种: 1.数据中间常存在一些多余成分,既冗余度。如在一份计算机文件中,某些符号会重复出现、某些符号比其他符号出现得更频繁、某些字符总是在各数据块中可预见的位置上出现等,这些冗余部分便可在数据编码中除去或减少。冗余度压缩是一个可逆过程,因此叫做无失真压缩。 2.数据中间尤其是相邻的数据之间,常存在着相关性。如图片中常常有色彩均匀的背影,电视信号的相邻两帧之间可能只有少量的变化影物是不同的,声音信号有时具有一定的规律性和周期性等等。因此,有可能利用某些变换来尽可能地去掉这些相关性。但这种变换有时

多媒体数据压缩编码的国际标准

第四章多媒体数据压缩编码技术 考核目的: 考核学生对多媒体数据压缩编码的基本原理和算法、数据压缩编码的分类和方法、多媒体数据压缩编码的国际标准等内容的理解和掌握。 考核的知识点: 什么是多媒体数据压缩、为什么信息能被压缩、常用的压缩编码和算法(统计编码、预测编码、变换编码)、多媒体数据压缩编码的国际标准JPEG、MPEG-1等内容。 考核要求: 掌握:数据压缩编码的方法、常用的压缩编码和算法、JPEG的原理和实现技术。 理解:量化的原理和量化器的设计、MPEG-1的原理和实现技术。 了解:其它的国际标准等。 4.1 多媒体数据压缩编码的重要性和分类 一.多媒体数据压缩编码的重要性 多媒体信息传送面临的最大难题是海量数据存储与传送电视信号数字化后的数据量问题,数据压缩是解决问题的重要途径。 二.多媒体数据压缩的可能性 1.空间冗余 2.时间冗余 3.信息熵冗余 ●信息量:指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。 ●信息熵:指一团数据所带的信息量,平均信息量就是信息熵(entropy)。 4.结构冗余 图象有非常强的纹理结构。 5.知识冗余 图像的理解与某些基础知识有关。 6.视觉冗余 视觉冗余是非均匀、非线性的。 三.多媒体数据压缩方法的分类

1.按压缩方法分: (1). 有失真压缩 (2). 无失真压缩 2.编码算法原理分: (1)预测编码:PCM、DPCM、ADPCM等 (2)变换编码:傅里叶(DFT)、离散余弦(DCT)、离散正弦(DST)等 (3)统计编码:哈夫曼、算术等 (4)静图像编码:方块、逐渐浮现等 (5) 电视编码:幀内预测、幀间编码等 (6) 其他编码:矢量量化、子带编码等 4.2量化 一.量化原理 量化处理是使数据比特率下降的一个强有力的措施。 数据压缩编码中的量化处理,不是指A/D变换后的量化,而是指以PCM码作为输入,经正交变换、差分、或预测处理后,熵编码之前,对正交变换系数、差值或预测误差的量化处理。 量化输入值的动态范围很大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称作量化级,希望量化后的数值用较少的比特数便可表示。每个量化输入被强行归一到与其接近的某个输出,即量化到某个级。 量化处理总是把一批输入,量化到一个输出级上,所以量化处理是一个多对一的处理过程,是个不可逆过程,量化处理中有信息丢失,或者说,会引起量化误差(量化噪声)。 二.标量量化器的设计 1.量化器的设计要求 ●给定量化分层级数,满足量化误差最小。 ●限定量化误差,确定分层级数,满足以尽量小的平均比特数,表示量化输出。 三.量化方法: ●标量量化: 对于PCM数据,一个数一个数地进行量化叫标量量化。 分为:均匀量化、非均匀量化和自适应量化。 四.矢量量化

3、《压缩技术》选择题

《压缩技术》选择题 ()1.二进制数(1111001)2转换成十六进制数是 (A)F1H (B)79H (C)1FH (D)97H ()2、图像文件“风景.bmp”的属性窗口如图所示: 该图像的存储容量约为 (A)2MB (B)938KB (C)1.6MB (D)5MB ()3、一段图像分辨率为1024×768、32位色彩的视频影像,若该视频以25帧/秒的速度播放,则每秒钟播放的数据量约为 (A)24M字节(B)75M字节(C)600M字节(D)800M字节 ()4、在计算机内部,用来传送、存储、加工处理的数据或指令(命令)都是采用(A)ASCII码(B)GB2312码(C)二进制码(D)GBK码 ()5. 用UltraEdit软件观察字符内码,结果如下图所示, 则其中内码"31 30"表示的字符为 (A)2010 (B)20 (C)10 (D)暑 ()6.用UltraEdit软件观察字符内码,结果如图所示: 则字符"瞧瞧你"的内码为 (A)C7 C6 C7 C6 CE D2 (B)C7 C6 CE D2 C7 C6 (C)C7 C6 C7 C6 C4 E3 (D)C7 C6 C4 E3 C7 C6 ()7.小明和小张在讨论WAVE格式音频可以被压缩成MP3格式音频的原因,各自说出了很多理由: ①数据本身存在可被压缩的冗余因素②数据压缩的容量是无限制的 ③数据压缩是为了让数据文件更大④数据压缩允许有少量的失真 ⑤数据压缩是为了让音频文件音质更好 上述理由正确的是 (A)②⑤(B)①④(C)②③(D)③⑤ ()8.下列属于静态图像编码和压缩标准的是 (A)JPEG (B)MPEG-1 (C)MPEG-2 (D)MPEG-4

常用工具软件 多媒体数据压缩及编码技术

常用工具软件多媒体数据压缩及编码技术 在计算机获取原始的声音、图形图像以及视频影像时,其数据量是十分庞大的。如果数据不进行压缩处理,存放该数据文件时将十分困难,并且即使存储下来也是比较浪费存储介质的。例如,一张600MB的光盘也只能存储几十秒的真彩视频影像。 因此,用户需要对所获取的声音、图形图像以及视频影像数据进行压缩。其压缩主要包含下列两种方法。 ●无损压缩 多媒体原始信源数据存在大量的冗余,如动态视频图像帧内像素之间的空间相关性和帧与帧之间的时间相关性都很大,故而原始信源数据有很多的冗余,采用去掉冗余的压缩方法。 ●有损压缩 利用人的视觉对于边缘急剧变化不敏感和对图像的亮度信息敏感、对颜色分辨率弱的特点以及听觉只能听到20Hz~20KHz等特征实现数据压缩,舍弃一些非主要的细节,从而使由压缩数据恢复的图像、声音仍有令人满意的质量的方法。 数据压缩技术的研究已经有许多年了,从PCM编码理论开始,到现在的ADPCM、JPEG、MPEG-1、MPEG-2、H.261等,已经产生了多种针对不同用途的压缩算法、实现手段和相关的数字硬件及软件。目前,被国际社会广泛认可和应用的通用压缩编码标准大致有如下4种。 ●H.261编码 由CCITT(国际电报电话咨询委员会)通过的用于音频视频服务的视频编码解码器(也称Px64标准),它使用两种类型的压缩:一帧中的有损压缩(基于DCT)和用于帧间压缩的无损编码,并在此基础上使编码器采用带有运动估计的DCT和DPCM(差分脉冲编码调制)的混合方式。这种标准与JPEG及MPEG标准间有明显的相似性,但关键区别是它是为动态使用设计的,并提供完全包含的组织和高水平的交互控制。 ●JPEG编码 JPEG(全称是Joint Photogragh Coding Experts Group(联合照片专家组))是一种基于DCT 的静止图像压缩和解压缩算法,它由ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)共同制定,并在1992年后被广泛采纳后成为国际标准。 它是把冗长的图像信号和其它类型的静止图像去掉,甚至可以减小到原图像的百分之一(压缩比100:1)。但是在这个级别上,图像的质量并不好;压缩比为20:1时,能看到图像稍微有点变化;当压缩比大于20:1时,一般来说图像质量开始变坏。 ●MPEG编码 MPEG是Moving Pictures Experts Group(动态图像专家组)的英文缩写,实际上是指一组由ITU和ISO制定发布的视频、音频、数据的压缩标准。它采用的是一种减少图像冗余信息的压缩算法,它提供的压缩比可以高达200:1,同时图像和音响的质量也非常高。现在通常有三个版本:MPEG-1、MPEG-2、MPEG-4以适用于不同带宽和数字影像质量的要求。它的三个最显著优点就是兼容性好、压缩比高(最高可达200:1)、数据失真小。 ●DVI编码 DVI视频图像的压缩算法的性能与MPEG-1相当,即图像质量可达到VHS的水平,压缩后的图像数据率约为1.5Mb/s。为了扩大DVI技术的应用,Intel公司最近又推出了DVI算法的软件解码算法,称为Indeo技术,它能将为压缩的数字视频文件压缩为五分之一到十分之一。

数据压缩技术发展的现状及趋势

数据压缩技术发展的现状及趋势 计科普08 万永振2008441075 摘要:数据压缩技术能够有效减少数据的大小,能够更快的传输数据。由于数字化的多媒体信息尤其是数字视频、音频信号的数据量特别庞大,如果不对其进行有效压缩就难以得到实际的应用。因此,数据压缩技术已成为当今数字通信、广播、存储和多媒体娱乐中的一项关键的共性技术。 Abstract: Data compression techniques can reduce the size of data that can transfer data faster. As the digital multimedia information, especially digital video, audio signals particularly large amount of data, if not its effective compression can hardly be practical application. Therefore, the data compression technology has become the digital communication, broadcasting, storage, and multimedia entertainment in a key common technologies. 1数据压缩的定义 其作用是:能较快地传输各种信号,如传真、Modem通信等;在现有的通信干线并行开通更多的多媒体业务,如各种增值业务;紧缩数据存储容量,如 CD-ROM、VCD 和DVD等;降低发信机功率,这对于多媒体移动通信系统尤为重要。 由此看来,通信时间、传输带宽、存储空间甚至发射能量,都可能成为数据压缩的对象。 2数字压缩技术的发展现状 在各种数据类型中,最难实现的是数字机频的实时压缩,因为视频信号尤其是HDTV信号所占据的带宽甚宽,实时压缩需要很高的处理速度。现在,视频解码以及音频的编码、解码多依赖于专用芯片或数字信号处理器(DSP)未完成,并已有许多厂商推出了音视合一的单片MPEG-1、MPEG-2解码器。我国在发展数据压缩技术过程中,则充分利用了软件人才优势。 在软件实现方面,由于PC主机的处理能力正在飞速提高,直接利用主CPU编程实现各种视听压缩和解码算法对于桌面系统及家用多媒体将越来越有吸引力。 1996年上半年,Intel向全球软件界发布了它的微处理器媒体扩展(MMX)技术。这种技术主要是在Pentium或Pentium Pro芯片中增加了8个64位寄存器和57条功能强大的新指令,以提高多媒体和通信应用程序中某些计算密集的循环速度。MMX采

数据压缩试题库

第一章 填空题: 1、信源编码主要解决传输的问题,信道编码主要解决传输的问题。 2、数据压缩的信号空间包括、、。 3、数据压缩按其压缩后是否产生失真可划分为 和两大类。 第二章 填空题: 1、脉冲编码调制包括、、三个步骤。 2、连续信号的多种离散表示法中,我们最常用的取样方法是。 3、若要将取样信号准确地恢复成原信号,取样频率必须满足定理。 4、黑白电视信号的带宽大约为5MHz,若按256级量化,则按奈奎斯特准则取样时的数据速率为。如果电视节目按25帧/s发送,则存储一帧黑白电视节目数据需内存容量。 5、量化器可分为和两大类。 6、量化器的工作特性可分为、、三个区域。 6、按照处理方法是否线性来判断,我们认为量化过程本身是。 7、我国数字电话网中压扩量化的对数函数采用曲线。 8、信号质量的主观度量方法中最常用的判决方法是。 9、对信号压缩系统的性能评价应从几个性能指标上综合评价,这些性能指标包括、、、。 简答题: 1、量化误差和噪声的本质区别是什么? 2、简述压扩量化的工作过程? 3、数据压缩中的“二次量化”是指什么?它和模数转换时的量化有什么区别? 证明题:

1、试导出以均方误差最小定义的最佳量化方法中量化判决电平k d 和量化输出电平k y 的表达式。 2、证明M-L 量化器的最小量化误差为:{}{}∑-=+≤<-=1 012 2min J k k k k d x d p y x E ε 第三章 填空题: 1、离散无记忆平稳信源的冗余度隐含在 。 2、对于联合信源,其冗余度除了各自本身的冗余度外还隐含在 。 3、离散有记忆信源的的理论极限是 。 4、在限失真编码理论中,使限失真条件下比特数最少的编码称为 。 问答题: 1、什么是平均自信息量(信息熵),平均条件自信息量(条件熵)以及平均互信息量?它们之间有什么关系? 2、简述率失真函数的基本含义,并指出它对信源编码的指导意义。 3、什么是最大离散熵?它对数据压缩有什么指导意义? 证明题: 2、证明 ()()|H Y X H Y ≤,并简述它对数据压缩的意义。 3、证明:()()()Y |X H X H Y X I -=;。 第四章 填空题: 1、统计编码主要是利用消息或消息序列 的分布特性,注重寻找 的最优匹配。 2、长度为L 1,L 2,…,L n 的m 进制唯一可译码存在的充分必要条件是 。

多媒体信息处理技术

第5章多媒体信息处理技术 通过本章学习,了解多媒体信息处理技术的基本问题,包括多媒体数据的分类、多媒体信息的计算机表示、多媒体数据压缩和编码技术、音频卡和视频卡的应用。重点掌握多媒体信息处理技术的基本概念,学会音频卡和视频卡的安装与使用,了解多媒体技术中数据的压缩与编码方法。 5.1 多媒体数据的分类 媒体是承载信息的载体,是信息的表示形式。信息媒体元素是指多媒体应用中可以显示给用户的媒体组成元素,目前主要包括文本、图形、图像、声音、动画和视频等媒体。 一、多媒体数据的特点 多媒体数据具有数据量巨大、数据类型多、数据类型间差别大、数据输入和输出复杂等特点。多媒体数据类型多,包括图形、图像、声音、文本和动画等多种形式,即使同属于图像一类,也还有黑白、彩色、高分辨率和低分辨率之分,由于不同类型的媒体内容和格式不同,其存储容量、信息组织方法等方面都有很大的差异。 二、多媒体数据的分类 1.文字 在计算机中,文字是人与计算机之间信息交换的主要媒体。文字用二进制编码表示,也就是使用不同的二进制编码来代表不同的文字。 文本是各种文字的集合,是人和计算机交互作用的主要形式。 文本数据可以在文本编辑软件里制作,如Word编写的文本文件大都可以直接应用到多媒体应用系统中。但多媒体文本大多直接在制作图形的软件或多媒体编辑软件时一起制作。 2.音频 音频泛指声音,除语音、音乐外,还包括各种音响效果。将音频信号集成到多媒体中,可提供其他任何媒体不能取代的效果,从而烘托气氛、增加活力。 3.图形、图像 凡是能被人类视觉系统所感知的信息形式或人们心目中的有形想象都称为图像。 图形文件基本上可以分为两大类:位图和向量图。 位图图像是一种最基本的形式。位图是在空间和亮度上已经离散化的图像,可以把一幅位图图像看成一个矩阵,矩阵中的任一元素对应于图像的一个点,而相应的值对应于该点的灰度等级。 图形是指从点、线、面到三维空间的黑白或彩色几何图形,也称向量图。图形是一种抽象化的图像,是对图像依据某个标准进行分析而产生的结果。 向量图形文件则用向量代表图中的文件,以直线为例,在向量图中,有一数据说明该元件为直线,另外有些数据注明该直线的起始坐标及其方向、长度或终止坐标,图形文件保存的不是像素点的值,而是一组描述点、线、面等几何图形的大小、形状、位置、维数等其他属性的指令集合,通过读取指令可以将其转换为屏幕上显示的图像。由于大多数情况下不需要对图形上的每一个点进行量化保存,所以,图形文件比图像文件数据量小很多。图形与图像是两个不同的概念。 4.动画 图像或图形都是静止的。由于人眼的视觉暂留作用,在亮度信号消失后亮度感觉仍可保持1/20s~1/10s。利用人眼视觉惰性,在时间轴上,每隔一段时间在屏幕上展现一幅有上下关联的图像、图形,就形成了动态图像。任何动态图像都是由多幅连续的图像序列构成的,序列中的每幅图像称为一帧,如果每一帧图像是由人工或计算机生成的图形时,称为动画;若每帧图像为计算机产生的具有真实感的图像时,称为三维真实感动画;当图像是实时获取

数据压缩技术技术发展的现状及趋势

数据压缩技术技术发展的现状及趋势 班级:计科普08-2 学号:2008441093 姓名:邓明悦 摘要:在现今的电子信息技术领域,正发生着一场有长远影响的数字化革命。由于数字化的多媒体信息尤其是数字视频、音频信号的数据量特别庞大,如果不对其进行有效的压缩就难以得到实际的应用。因此,数据压缩技术已成为当今数字通信、广播、存储和多媒体娱乐中的一项关键的共性技术。对于数据压缩技术而言,最基本的要求就是要尽量降低数字化的在码事,同时仍保持一定的信号质量。不难想象,数据压缩的方法应该是很多的,但本质上不外乎上述完全可逆的冗余度压缩和实际上不可逆的嫡压缩两类。冗余度压缩常用于磁盘文件、数据通信和气象卫星云图等不允许在压缩过程中有丝毫损失的场合中,但它的压缩比通常只有几倍,远远不能满足数字视听应用的要求。在实际的数字视听设备中,差不多都采用压缩比更高但实际有损的嫡压缩技术。只要作为最终用户的人觉察不出或能够容忍这些失真,就允许对数字音像信号进一步压缩以换取更高的编码效率。摘压缩主要有特征抽取和量化两种方法,指纹的模式识别是前者的典型例子,后者则是一种更通用的摘压缩技术。 关键字:数据压缩冗余度失真编码效率 Abstract: In today's electronic and information technology, is undergoing a long-term impact of the digital revolution. As the digital multimedia information, especially digital video, audio signals particularly large amount of data, if not its effective compression can hardly be practical application. Therefore, the data compression technology has become the digital communication, broadcasting, storage, and multimedia entertainment in a key common technologies. For data compression technology, the basic requirement is to minimize the number of things in the code, while still maintaining a certain degree of signal quality. Not difficult to imagine, the data compression should be many, but essentially nothing more than the fully reversible compression and redundancy is actually two types of irreversible entropy compression. Redundancy compression commonly used in disk files, such as data communications and meteorological satellite cloud in the compression process does not allow the slightest loss of occasions, but its compression ratio is usually only a few times, can not meet the requirements of digital audio-visual applications. In practice, the number of audio-visual equipment, almost all use a higher compression ratio but the actual lossy compression technique entropy. As long as people perceive as the end user or can not tolerate these distortions, it allows further compression of digital audio and video signals in exchange for higher coding efficiency. Abstract compression are two methods of feature extraction and quantification, the fingerprint pattern recognition is a typical example of the former, the latter is a more general summary of compression technology.

相关主题
相关文档 最新文档