当前位置:文档之家› 图像压缩技术与算法

图像压缩技术与算法

图像压缩技术与算法
图像压缩技术与算法

图像压缩技术与算法

摘要:随着信息技术的发展,图像信息被广泛应用于多媒体通信和计算机系统中,但是图像数据的一个显著特点就是信息量大。具有庞大的数据量,如果不经过压缩,不仅超出了计算机的存储和处理能力,而且在现有的通信信道的传输速率下,是无法完成大量多媒体信息实时传输的。因此,为了更有效的存储、处理和传输这些图像数据,必须对其进行压缩,因此有必要对图像压缩编码进行研究。由于组成图像的各像素之间,无论是在行方向还是在列方向上都存在着一定的相关性,因此只要应用某种图像压缩编码方法提取或者减少这种相关性,就可以达到压缩数据的目的。

关键词:图像压缩无损压缩有损压缩 Huffman编码 DCT(离散余弦变换)小波变换

所谓的图像压缩编码技术就是对要处理的图像源数据按一定的规则进行变换和组合,从而达到以尽可能少的代码(符号)来表示尽可能多的数据信息。目前,常用的压缩编码方法可以分为两大类:一类是冗余压缩算法,也称无损压缩法、无失真压缩;另一类是熵压缩法,也称有损压缩、有失真压缩。

一、Huffman编码

①Huffman编码的原理

Huffman编码通过减少编码冗余来达到压缩的目的,是一种无损压缩。是把信源符号按概率大小顺序排列,并设法按逆次序分配码字

的长度。在分配码字长度时,首先将出现概率最小的两个符号的概率相加,合成一个概率,再把这个合成的概率看成是一个新组合符号的概率,重复上述做法,直到最后只剩下两个符号的概率为止。

②具体步骤:

(1) 初始化:概率统计得到n个不同概率的信息符号;

(2) 将n个信源信息符号的n个概率,按大小排列;

(3) 最后两个小概率相加,概率个数减为n-1;

(4) 将n-1个概率按大小排列;

(5) 重复(3)和(4) n-2次,直到只剩两个概率序列;

(6) 二进制码元0和1赋值,构建赫夫曼码字。

③编码过程

④优点:

1、降低了编码的时间,改变了编码和解码的时间不对称性。

2、使用硬件实现,编码和解码电路相对简单。

⑤缺点:

1、每个符号的编码长度为整数,若概率不为2的负n次方,

无法达到熵极限。

2、输入的符号数受到可实现码表尺寸的限制。

3、译码复杂。

4、需要输入符号的概率分布。

5、无错误保护功能

Huffman编码过程实际上是构造一个向左倾倒的码数,右上端为根,向左伸出枝,左端各终节点分配着信源符号,所以这种编码方法可以看作从枝到根的编码顺序,编出的码一定是唯一可译的即时码。当然,这种最佳码并非是唯一的,因为“0”和“1”可以任意调换,而且当有的信源符号相等时,选择哪两个符号合并也是任意的。二、DCT(离散余弦变换)

基于离散余弦变换的图像压缩编码过程称为基本顺序过程,它应用于绝大多数图像压缩场合,并且它能在图像的压缩操作中获得较高的压缩比,在压缩比为25:1的情况下,压缩后还原得到的图像与原始图像相比,非图像专家难于找出它们之间的区别,重构图像和源图像的视觉效果基本相同,因而得到了广泛的应用。

①基于DCT的JPEG图像压缩编码算法的表述

在编码过程中,首先将输入图像分解为8*8大小的数据块,然后用正向二维DCT把每个块转变成64个DCT系数值,其中1个数值是直流(DC)系数,即8*8空域图像子块的平均值,其余的63个是交流(AC)系数,接下来对DCT系数进行量化,最后将变换得到

的量化的DCT系数进行编码和传送,形成压缩后的图像格式,在解码过程中,先对已编码的量化的系数进行解码,然后求逆量化并把DCT系数转化为8*8样本像块(使用二维DCT反变换),最后将操作完成后的块组合成一个单一的图像。这样就完成了图像的压缩和解压过程。

基于DCT编码压缩过程框图:

②DCT 变换表达式

二维DCT 的解析式定义可以由下式表示:

二维DCT 反变换(IDCT )解析式定义可以表示为:

i=0,1,2,…,M-1;j=0,1,2,…,N-1。式中,E(u)E(v )=

21

,当u=v=0时;E(u)E(v )=1,其他。

③基于DCT 的JPEG 图像压缩编码算法的步骤:

1、 正向离散余弦变换

2、 量化

3、 Z 字型编码

4、 使用差分脉冲编码调制对直流系数(DC )进行编码

5、 使用行程长度编码对交流系数(AC )进行编码

6、 熵编码

④DCT压缩编程实现:

I=imread('lena.bmp');

I=double(I)/255;

T=dctmtx(8); %计算离散余弦变换矩阵,返回结果为双精度型

B=blkproc(I,[8 8],'P1*x*P2',T,T'); %实现图像的显示块操作

mask=[11110000

11100000

11000000

10000000

00000000

00000000

00000000

00000000];

B2=blkproc(B,[8 8],'P1.*x',mask);

I2=blkproc(B2,[8 8],'P1*x*P2',T',T);

imshow(I),figure,imshow(I2)

⑤实验结果:

左为原始图像,右为压缩后图像。

对比压缩前后的图像可知,压缩后的图像稍显模糊,这是因为该压缩算法为有损压缩,压缩后的图像丢失了原始图像部分数据信息。但由于DCT变换使图像能量集中在左上方的特性,因此压缩图像保留了原始图像大部分的图像特征,其视觉效果与原始图像相差不大。

三、小波变换编码

小波变换是空间(时间)和频率的局部变换,因而能有效地从信号中提取信息。通过伸缩和平移等运算功能可对函数或信号进行

多尺度的细化分析,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求,从而可聚集到信号的任意细节。

小波变换进行图像压缩的基本原理是:根据二维小波分解算法,一幅图像做小波分解后得到一系列不同分辨率的图像,而表现一幅图像最主要的部分是低频部分,如果去掉图像的高频部分而只保留低频部分,则可以达到图像压缩的目的。

程序实现:

%装载并显示原始图像

load tartan;

subplot(2,2,1);

image(X);colormap(map);

title('原始图像');

axis square;

disp('压缩前图像的大小');

whos('X')

%分解图像,提取分解结构中的第一层系数

[c,l]=wavedec2(X,2,'bior3.7');

cA1=appcoef2(c,l,'bior3.7',1);

cH1=detcoef(c,l,1);

cD1=detcoef(c,l,1);

cV1=detcoef(c,l,1);

%重构第一层系数

A1=wrcoef2('a',c,l,'bior3.7',1);

H1=wrcoef2('h',c,l,'bior3.7',1);

D1=wrcoef2('d',c,l,'bior3.7',1);

V1=wrcoef2('v',c,l,'bior3.7',1);

c1=[A1 H1;V1 D1];

%图示第一层各频率信息

subplot(2,2,2);

image(c1);

title('分解后的低频和高频信息');

axis square;

%对图像进行压缩:保留第一层低频信息并对其进行编码

cA1=appcoef2(c,l,'bior3.7',1);

ca1=wcodemat(cA1,440,'mat',0);

ca1=0.5*ca1;

subplot(2,2,3);

image(ca1);

colormap(map);

title('第一次压缩图像');

axis square;

disp('第一次图像压缩的大小');

whos('ca1')

%压缩图像:保留第二层低频信息并对其进行量化编码

cA2=appcoef2(c,l,'bior3.7',2);

ca2=wcodemat(cA2,440,'mat',0);

ca2=0.5*ca2;

subplot(2,2,4);

image(ca2);

colormap(map);

title('第二次压缩图像');

axis square;

disp('第二次图像压缩的大小');

whos('ca2')

实验结果:

近年来,小波变换在静态图像压缩方面也得到了较好的应用,它的特点是压缩比高,压缩速度快,压缩后能保持信号与图像的特征不变,且在传递中可以抗干扰。

四、总结

衡量压缩技术的好坏有3个重要的指标:一是压缩比要大;二是实现压缩的算法要简单;三是恢复效果好。有损压缩能提供较高的压缩比,但由于损失了信源的熵,压缩后的数据是无法准确的恢复;无损压缩能准确无误的恢复原信息,它只是去掉了信源的冗余部分,但却不能提供较高的压缩比。我们在选择算法进行数据压缩时,一定要根据实际情况,选择最佳编码方式,这样才能达到我们压缩的目的。

图像压缩标准知多少

电子科技 2004年第7期(总第178期) 61 图像压缩标准知多少 徐庆征,镇桂勤 (西安通信学院二系,陕西 西安 710106) 摘 要 介绍了一些典型的静止图像压缩标准和活动图像压缩标准,并分析了各自的技术特点及其应用场合。 关键词 图像压缩;JPEG ;H.26x ;MPEG4 中图分类号 TN919.8 图像通信直观生动,包含极其丰富的信息,是人们传递信息的重要媒介。同时,巨大的数据量也给图像的采集、存储、处理和传输带来了极大的困难,严重影响了图像媒体成为主要媒体,因此,压缩数字图像信号的数码率就成为图像通信和图像信号处理领域的首要任务,受到全世界科技工作者的关注。 20世纪80年代以来,国际标准化组织(ISO)和国际电信联盟(ITU)组织了一批专家,开展了大量细致、全面的工作,陆续制定了一系列有关图像通信方面建议和标准,极大地推动了图像编码技术的发展与应用。这些标准可以归为两种类型:静止图像压缩标准和活动图像压缩标准(包括ITU-T 制定的H.263系列和ISO 制定的MPEG-x 系列)。 1 静止图像压缩编码标准 1.1 JBIG 标准 1988年,ISO 和ITU-T 成立了“联合二值图像专家组”(Joint Binary Image Expert Group ,JBIG), 1991年10月提出了ITU-T T.82标准。这一标准确定了具有逐层、逐层兼容顺序和单层顺序3种模式的编码方法,并提出了获得任意低分辨率图像的方法。 1.2 JPEG 标准 收稿日期: 2004-04-21 1986年底,ISO 和ITU-T 成立了联合图像专家小组(Joint Photographic Experts Group ,JPEG),该小组近年来一直致力于静止图像压缩算法的标准化工作。1991年3月正式提出ISO CD10918号建议草案“连续色调静止图像的数字压缩编码”(通常简称为JPEG 标准),这是第一个适用于连续色调、多级灰度、彩色或黑白静止图像的国际标准。 JPEG 标准提供了一种无损编码的模式和3种有损编码模式(基于DCT 的顺序模式、基于DCT 的渐进模式、层次模式)。所有符合JPEG 的 遍解码器都必须支持基准模式,其他模式可作为选择项根据不同的应用目的来取舍。基准模式编解码框图如图1所示。 尽管JPEG 建议主要是应用于静止图像的编码技术,但是在某些场合也可将它应用于视频编辑系统。此时JPEG 把视频序列中的每一帧当作一幅静止图像来处理,这就是所谓的Motion JPEG 的处理方法。 1.3 JPEG-LS 标准 JPEG 组织从1994年开始征集新的无损/近无损(简称JPEG-LS)算法提案,并于1998年2月作 图1 JPEG 基准模式遍解码框图

数字图像压缩技术

数字图像压缩技术 二、JPEG压缩 负责开发静止图像压缩标准的“联合图片专家组”(JointPhotographicExpertGroup,简称JPEG),于1989年1月形成 了基于自适合DCT的JPEG技术规范的第一个草案,其后多次修改,至1991年形成ISO10918国际标准草案,并在一年后成为国际标准,简称JPEG标准。 1.JPEG压缩原理及特点 JPEG算法中首先对图像实行分块处理,一般分成互不重叠的大小的块,再对每一块实行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表实行量化,量化的结果 保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织,然后实行哈夫曼编码。JPEG的特点如下: 优点:(1)形成了国际标准;(2)具有中端和高端比特率上的良好 图像质量。 缺点:(1)因为对图像实行分块,在高压缩比时产生严重的方块效应;(2)系数实行量化,是有损压缩;(3)压缩比不高,小于502。 JPEG压缩图像出现方块效应的原因是:一般情况下图像信号是高度非平稳的,很难用Gauss过程来刻画,并且图像中的一些突变结构例如 边缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其 结果不是最优的3。 2.JPEG压缩的研究状况及其前景2 针对JPEG在高压缩比情况下,产生方块效应,解压图像较差,近年 来提出了很多改进方法,最有效的是下面的两种方法: (1)DCT零树编码

DCT零树编码把DCT块中的系数组成log2N个子带,然后用零树编码方案实行编码。在相同压缩比的情况下,其PSNR的值比EZW高。但在高压缩比的情况下,方块效应仍是DCT零树编码的致命弱点。 (2)层式DCT零树编码 此算法对图像作的DCT变换,将低频块集中起来,做反DCT变换;对新得到的图像做相同变换,如此下去,直到满足要求为止。然后对层式DCT变换及零树排列过的系数实行零树编码。 JPEG压缩的一个最大问题就是在高压缩比时产生严重的方块效应,所以在今后的研究中,应重点解决DCT变换产生的方块效应,同时考虑与人眼视觉特性相结合实行压缩。 三、JEPG2000压缩 JPEG2000是由ISO/IECJTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式—JPEG2000图像压缩标准的编码算法。 1.JPEG2000压缩原理及特点 JPEG2000编解码系统的编码器和解码器的框图如图1所示4。 编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC)位移和分量变换。核心处理部分由离散小波变换、量化和熵编码组成。位流组织部分则包括区域划分、码块、层和包的组织。 JPEG2000格式的图像压缩比,可在现在的JPEG基础上再提升 10%~30%,而且压缩后的图像显得更加细腻平滑。对于当前的JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩,而在 JPEG2000系统中,通过选择参数,能够对图像实行有损和无损压缩。现在网络上的JPEG图像下载时是按“块”传输的,而JPEG2000格式

JPEG2000图像压缩算法标准剖析

JPEG2000图像压缩算法标准 摘要:JPEG2000是为适应不断发展的图像压缩应用而出现的新的静止图像压缩标准。本文介绍了JPEG2000图像编码系统的实现过程, 对其中采用的基本算法和关键技术进行了描述,介绍了这一新标准的特点及应用场合,并对其性能进行了分析。 关键词:JPEG2000;图像压缩;基本原理;感兴趣区域 引言 随着多媒体技术的不断运用,图像压缩要求更高的性能和新的特征。为了满足静止图像在特殊领域编码的需求,JPEG2000作为一个新的标准处于不断的发展中。它不仅希望提供优于现行标准的失真率和个人图像压缩性能,而且还可以提供一些现行标准不能有效地实现甚至在很多情况下完全无法实现的功能和特性。这种新的标准更加注重图像的可伸缩表述。所以就可以在任意给定的分辨率级别上来提供一个低质量的图像恢复,或者在要求的分辨率和信噪比的情况下提取图像的部分区域。 1.JPEG2000的基本介绍及优势 相信大家对JPEG这种图像格式都非常熟悉,在我们日常所接触的图像中,绝大多数都是JPEG格式的。JPEG的全称为Joint Photographic Experts Group,它是一个在国际标准组织(ISO)下从事静态图像压缩标准制定的委员会,它制定出了第一套国际静态图像压缩标准:ISO 10918-1,俗称JPEG。由于相对于BMP等格式而言,品质相差无己的JPEG格式能让图像文件“苗条”很多,无论是传送还是保存都非常方便,因此JPEG格式在推出后大受欢迎。随着网络的发展,JPEG的应用更加广泛,目前网站上80%的图像都采用JPEG格式。 但是,随着多媒体应用领域的快速增长,传统JPEG压缩技术已无法满足人们对数字化多媒体图像资料的要求:网上JPEG图像只能一行一行地下载,直到全部下载完毕,才可以看到整个图像,如果只对图像的局部感兴趣也只能将整个图片载下来再处理;JPEG格式的图像文件体积仍然嫌大;JPEG格式属于有损压缩,当被压缩的图像上有大片近似颜色时,会出现马赛克现象;同样由于有损压缩的原因,许多对图像质量要求较高的应用JPEG无法胜任。 JPEG2000是为21世纪准备的压缩标准,它采用改进的压缩技术来提供更高的解像度,其伸缩能力可以为一个文件提供从无损到有损的多种画质和解像选择。JPEG2000被认为是互联网和无线接入应用的理想影像编码解决方案。 “高压缩、低比特速率”是JPEG2000的目标。在压缩率相同的情况下,JPEG2000的信噪比将比JPEG提高30%左右。JPEG2000拥有5种层次的编码形式:彩色静态画面采用的JPEG 编码、2值图像采用的JBIG、低压缩率图像采用JPEGLS等,成为应对各种图像的通用编码方式。在编码算法上,JPEG2000采用离散小波变换(DWT)和bit plain算术编码(MQ coder)。此外,JPEG2000还能根据用户的线路速度以及利用方式(是在个人电脑上观看还是在PDA上观看),以不同的分辨率及压缩率发送图像。 JPEG2000的制定始于1997年3月,但因为无法很快确定算法,因此耽误了不少时间,直到2000年 3 月,规定基本编码系统的最终协议草案才出台。目前JPEG2000已由ISO和

图像压缩编码方法

图像压缩编码方法综述 概述: 近年来, 随着数字化信息时代的到来和多媒体计算机技术的发展, 使得人 们所面对的各种数据量剧增, 数据压缩技术的研究受到人们越来越多的重视。 图像压缩编码就是在满足一定保真度和图像质量的前提下,对图像数据进行变换、编码和压缩,去除多余的数据以减少表示数字图像时需要的数据量,便于 图像的存储和传输。即以较少的数据量有损或无损地表示原来的像素矩阵的技术,也称图像编码。 图像压缩编码原理: 图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;二是利用人眼的视觉特性。 图像数据的冗余度又可以分为空间冗余、时间冗余、结构冗余、知识冗余 和视觉冗余几个方面。 空间冗余:在一幅图像中规则的物体和规则的背景具有很强的相关性。 时间冗余:电视图像序列中相邻两幅图像之间有较大的相关性。 结构冗余和知识冗余:图像从大面积上看常存在有纹理结构,称之为结构 冗余。 视觉冗余:人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像 的变化并不都能察觉出来。 人眼的视觉特性: 亮度辨别阈值:当景物的亮度在背景亮度基础上增加很少时,人眼是辨别 不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。人眼刚 刚能察觉的亮度变化值称为亮度辨别阈值。 视觉阈值:视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就 察觉不出来,高于它才看得出来,这是一个统计值。 空间分辨力:空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。 掩盖效应:“掩盖效应”是指人眼对图像中量化误差的敏感程度,与图像 信号变化的剧烈程度有关。 图像压缩编码的分类: 根据编码过程中是否存在信息损耗可将图像编码分为: 无损压缩:又称为可逆编码(Reversible Coding),解压缩时可完全回复原始数据而不引起任何失真; 有损压缩:又称不可逆压缩(Non-Reversible Coding),不能完全恢复原始数据,一定的失真换来可观的压缩比。 根据编码原理可以将图像编码分为: 熵编码:熵编码是编码过程中按熵原理不丢失任何信息的编码。熵编码基

图像压缩技术介绍.

图像压缩技术介绍 由于图像和视频本身的数据量非常大,给存储和传输带来了很多不便,所以图 像压缩和视频压缩得到了非常广泛的应用。比如数码相机、USB摄像头、可视电话 、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。 常用的图像的压缩方法有以下几种: 1、行程长度编码(RLE) 行程长度编码(run-length encoding)是压缩一个文件最简单的方法之一。 它的做法就是把一系列的重复值(例如图象像素的灰度值)用一个单独的值再加上 一个计数值来取代。比如有这样一个字母序列aabbbccccccccdddddd它的行程长度编码就是2a3b8c6d。这种方法实现起来很容易,而且对于具有长重复值的串的压缩编码很有效。例如对于有大面积的连续阴影或者颜色相同的图象,使用这种方法压 缩效果很好。很多位图文件格式都用行程长度编码,例如TIFF,PCX,GEM等。 2、LZW编码 这是三个发明人名字的缩写(Lempel,Ziv,Welch),其原理是将每一个字节的值都要与下一个字节的值配成一个字符对,并为每个字符对设定一个代码。当同 样的一个字符对再度出现时,就用代号代替这一字符对,然后再以这个代号与下个 字符配对。 LZW编码原理的一个重要特征是,代码不仅仅能取代一串同值的数据,也能够代替一串不同值的数据。在图像数据中若有某些不同值的数据经常重复出现,也能找到 一个代号来取代这些数据串。在此方面,LZW压缩原理是优于RLE的。 3、霍夫曼编码 霍夫曼编码(Huffman encoding)是通过用不固定长度的编码代替原始数据来实现的。霍夫曼编码最初是为了对文本文件进行压缩而建立的,迄今已经有很多变体。它的基本思路是出现频率越高的值,其对应的编码长度越短,反之出现频率越 低的值,其对应的编码长度越长。 霍夫曼编码很少能达到8∶1的压缩比,此外它还有以下两个不足:①它必须精确地统计出原始文件中每个值的出现频率,如果没有这个精确统计,压缩的效果就 会大打折扣,甚至根本达不到压缩的效果。霍夫曼编码通常要经过两遍操作,第一 遍进行统计,第二遍产生编码,所以编码的过程是比较慢的。另外由于各种长度的 编码的译码过程也是比较复杂的,因此解压缩的过程也比较慢。②它对于位的增 删比较敏感。由于霍夫曼编码的所有位都是合在一起的而不考虑字节分位,因此增 加一位或者减少一位都会使译码结果面目全非。 4、预测及内插编码

网络摄像机各种视频压缩格式的比较

网络摄像机各种视频压缩格式的比较 网络摄像机和视频服务器作为网络应用的新型产品,适应网络传输的要求也必然成为产品开发的重要因素,而这其中视频图像的技术又成为关键。在目前中国网络摄像机和视频服务器的产品市场上,各种压缩技术百花齐放,且各有优势,为用户提供了很大的选择空间。 JPEG 、M-JPEG 有相当一部分国内外网络摄像机和视频服务器都是采用JPEG,Motion-JPEG压缩技术,JPEG、M-JPEG采用的是帧内压缩方式,图像清晰、稳定,适于视频编辑,而且可以灵活设置每路的视频清晰度和压缩帧数。另外,因其压缩后的格式可以读取单一画面,因此可以任意剪接,特别适用与安防取证的用途。 Wavelet Transform 小波变换也属于帧内压缩技术,由于这种压缩方式移除了图像的高频成分,仅保留单帧图像信号,特别适用于画面变更频繁的场合,且压缩比也得到了一定的提高,因此也被一些网络摄像机和视频服务器所采用,例如,BOSCH推出的NetCam-4系列数字网络摄像机,深圳缔佳生产的NETCAM系列网络摄像机等。

H.263 H.263 是一个较为成熟的标准,它是帧间预测和变换编码的混合算法,压缩比较高,尤其适用低带宽上传输活动视频。采用H.263技术生产的网络型产品,其成本较为适中,软/硬件丰富,适合集中监控数量较多的需求,如深圳大学通信技术研究所开发的SF-10网络摄像机和SF-20视频服务器,深圳新文鼎开发的W750视频服务器和W74GM网络摄像机等采用的都是这一压缩技术。 MPEG-4 MPEG -4的着眼点在于解决低带宽上音视频的传输问题,在164KHZ 的带宽上,MPEG-4平均可传5-7帧/秒。采用MPEG-4压缩技术的网络型产品可使用带宽较低的网络,如PSTN,ISDN,ADSL等,大大节省了网络费用。另外,MPEG-4的最高分辨率可达720×576,接近DVD画面效果,基于图像压缩的模式决定了它对运动物体可以保证有良好的清晰度。MPEG-4所有的这些优点,使它成为当前网络产品生产厂商开发的重要趋势之一。 另外,也有部分厂商采用的是MPEG-1,MPEG-2压缩格式,除此之外,有的厂商还采用多种压缩技术相结合的方式,例如,有些国外推出的网络摄像机,其压缩方式就是MPEG-4,与JPEG相结合,在可以看到JPEG静止图像的同时,利用MPEG-4高级压缩功能,令到高

图像压缩编码实验报告

图像压缩编码实验报告 一、实验目的 1.了解有关数字图像压缩的基本概念,了解几种常用的图像压缩编码方式; 2.进一步熟悉JPEG编码与离散余弦变换(DCT)变换的原理及含义; 3.掌握编程实现离散余弦变换(DCT)变换及JPEG编码的方法; 4.对重建图像的质量进行评价。 二、实验原理 1、图像压缩基本概念及原理 图像压缩主要目的是为了节省存储空间,增加传输速度。图像压缩的理想标准是信息丢失最少,压缩比例最大。不损失图像质量的压缩称为无损压缩,无损压缩不可能达到很高的压缩比;损失图像质量的压缩称为有损压缩,高的压缩比是以牺牲图像质量为代价的。压缩的实现方法是对图像重新进行编码,希望用更少的数据表示图像。应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分为以下3类: (1)无损压缩编码种类 哈夫曼(Huffman)编码,算术编码,行程(RLE)编码,Lempel zev编码。(2)有损压缩编码种类 预测编码,DPCM,运动补偿; 频率域方法:正交变换编码(如DCT),子带编码; 空间域方法:统计分块编码; 模型方法:分形编码,模型基编码; 基于重要性:滤波,子采样,比特分配,向量量化; (3)混合编码 JBIG,H.261,JPEG,MPEG等技术标准。 2、JPEG 压缩编码原理 JPEG是一个应用广泛的静态图像数据压缩标准,其中包含两种压缩算法(DCT和DPCM),并考虑了人眼的视觉特性,在量化和无损压缩编码方面综合权衡,达到较大的压缩比(25:1以上)。JPEG既适用于灰度图像也适用于彩色图像。其中最常用的是基于DCT变换的顺序式模式,又称为基本系统。JPEG 的压缩编码大致分

多媒体图像压缩技术

多媒体图像压缩技术 2010级电子信息科学与技术刘小辉2010271022 摘要:随着计算机多媒体技术的不断发展,人们期望更高性能的图像压缩技术的出现。图像压缩是用最少的数据量来表示尽可能多的原图像的信息。多媒体数据压缩技术是现代网络发展的关键性技术之一。由于图像和声音信号中存在各种各样的冗余,为数据压缩提供了可能。数据压缩技术有无损压缩缩和有损压缩两大类,这些压缩技术又各有不同的标准。 Abstract:With the ever-growing multimedia technology, people are looking for ward to new image compression technologies with better performances. Image compression with the least amount of data is represented as much information of original image .Multimedia data compression technology is the modern network development of the key technology of. Because of the image and sound signal in the presence of various kinds of redundancy, compression of data is possible. Data compression technology of lossless and lossy compression two categories, these compression techniques and different standards. 关键字(Keyword):多媒体数据压缩技术(Multimedia data compression technology) 无损压缩和有损压缩(Lossless and lossy compression) 图像和声音信号(The image and sound signal) 最少的数据量(The least amount of data) 随着计算机多媒体技术和通信技术的日益发展,以及网络的迅速普及,图像数据信息以

图像压缩技术文档

J P E G 标准是由国际标准化组织ISO和国际电话电报咨询委员会CCITT为静止图像所建立的第一个国际数字图像压缩标准,它是一个适用范围很广的通用标准,既可以用于灰度图像,又可以用于彩色图像,可以支持各种应用。例如在计算机技术中,基于JPEG 有损压缩的数字水印算法,和嵌入式系统中的JPEG 分层压缩等。在JPEG 各类图像压缩算法中,基于离散余弦变换的图像压缩编码过程称为基本顺序过程,它应用于绝大多数图像压缩场合,并且它能在图像的压缩操作中获得较高的压缩比,并且重构图像与源图像的视觉效果基本相同。 基本原理 基于DCT 顺序型工作模式的JPEG 压缩算法系统的编码器与解码器的结构如图1 所示,量化编码是在进行了二元D C T 的系数量化后,且熵编码部分使用Huffman 编码方法。 图1 系统结构图 1 色彩变换与部分数据取样 色彩变换将计算机屏幕显示使用的RGB 色彩数据按照(1 )式给定的关系,转换成JPEG

中使用的YCbCr 数据,其中Y 是颜色的亮度,CbCr 是色调。 Y=0.2999R+0.5870G+0.1140B Cb = -0.1687R-0.3313G+0.5000B+128 (1) Cr = 0.5000R-0.4187G-0.0813B+128 在取样部分,考虑到人眼对图像的亮度变化敏感,而对颜色的变化迟钝。因此,对反映颜色变化的色调信息只取其部分数据进行处理。本文的JPEG 格式采用的部分取样方式为Yuv411,即每取4 个Y 数据,只取一个Cb 数据和一个Cr 数据。因此,原数据在尚未编码时,已获得50% 的压缩。 2 利用DCT 对空间频率的变换 离散余弦变换(DCT)实现将一组光强数据转换成频率数据。在压缩时,将源图像数据分成8*8 像素构成的像块的集合。经过零偏置将每一取样值从0~255 转为-128~+127,再做DCT 处理。DCT 将每个数据单元的值转换为64 个DCT 系数Svu,其中S00 称为直流系数,其余63 个系数称为交流系数。解压缩是正向变换的反过程。D C T 和IDCT 分别由公式(2)和公式(3)实现。 770 01(21)(21)(,)()()(,)cos cos 41616i j i u j v F u v C u C v f i j ππ==++????=????????∑∑ (2) 7700 1(21)(21)(,)()()(,)cos cos 422u v x u y v f i j C u C v F u v N N ππ==++????=????????∑∑ (3) 上式中(),()C u C v = (当u ,v=0时) (),()1C u C v = (其他情况) 3 量化和熵编码 直流分量和各交流分量可用不同量化间隔量化,低频分量量化得细,高频分量量化得粗。Y 、U 、V 也可用不同的量化表,Y 细量化,U 、V 粗量化。JPEG 规范中,Y 数据和Cb 、Cr 数据各有一个8 × 8 的推荐量化表,根据具体要求可以构造专用的量化表,但量化过程和逆量化过程应使用同样的量化表。量化是在图像文件品质与压缩比例之间做一选择的重要过程,而这也就是JPEG 所谓的失真压缩方式。经量化处理后的数据,应用平均压缩比最高的Huffman 码进行熵编码。 经过上述过程后可得到压缩图像。

摄像头视频采集压缩及传输原理

摄像头视频采集压缩及传输原理 摄像头基本的功能还是视频传输,那么它是依靠怎样的原理来实现的呢?所谓视频传输:就是将图片一张张传到屏幕,由于传输速度很快,所以可以让大家看到连续动态的画面,就像放电影一样。一般当画面的传输数量达到每秒24帧时,画面就有了连续性。 下边我们将介绍摄像头视频采集压缩及传输的整个过程。 一.摄像头的工作原理(获取视频数据) 摄像头的工作原理大致为:景物通过镜头(LENS)生成的光学图像投射到图像传感器表面上,然后转为电信号,经过A/D(模数转换)转换后变为数字图像信号,再送到数字信号处理芯片(DSP)中加工处理,再通过USB接口传输到电脑中处理,通过显示器就可以看到图像了。下图是摄像头工作的流程图: 注1:图像传感器(SENSOR)是一种半导体芯片,其表面包含有几十万到几百万的光电二极管。光电二极管受到光照射时,就会产生电荷。 注2:数字信号处理芯片DSP(DIGITAL SIGNAL PROCESSING)功能:主要是通过一系列复杂的数学算法运算,对数字图像信号参数进行优化处理,并把处理后的信号通过USB等接口传到PC等设备。 DSP结构框架: 1. ISP(image signal processor)(镜像信号处理器) 2. JPEG encoder(JPEG图像解码器) 3. USB device controller(USB设备控制器) 而视频要求将获取的视频图像通过互联网传送到异地的电脑上显示出来这其中就涉及到对于获得的视频图像的传输。 在进行这种图片的传输时,必须将图片进行压缩,一般压缩方式有如H.261、JPEG、MPEG 等,否则传输所需的带宽会变得很大。大家用RealPlayer不知是否留意,当播放电影的时候,在播放器的下方会有一个传输速度250kbps、400kbps、1000kbps…画面的质量越高,这个速度也就越大。而摄像头进行视频传输也是这个原理,如果将摄像头的分辨率调到640×480,捕捉到的图片每张大小约为50kb左右,每秒30帧,那么摄像头传输视频所需的速度为50×30/s=1500kbps=1.5Mbps。而在实际生活中,人们一般用于网络视频聊天时的分辨率为320×240甚至更低,传输的帧数为每秒24帧。换言之,此时视频传输速率将不到300kbps,人们就可以进行较为流畅的视频传输聊天。如果采用更高的压缩视频方式,如MPEG-1等等,可以将传输速率降低到200kbps不到。这个就是一般视频聊天时,摄像头所需的网络传输速度。 二.视频压缩部分 视频的压缩是视频处理的核心,按照是否实时性可以分为非实时压缩和实时压缩。而视频传输(如QQ视频即时聊天)属于要求视频压缩为实时压缩。 下面对于视频为什么能压缩进行说明。 视频压缩是有损压缩,一般说来,视频压缩的压缩率都很高,能够做到这么 高的压缩率是因为视频图像有着非常大的时间和空间的冗余度。所谓的时间冗余度指的是两帧相邻的图像他们相同位置的像素值比较类似,具有很大的相关性,尤其是静止图像,甚至两帧图像完全相同,对运动图像,通过某种运算(运动估计),应该说他们也具有很高的相关性;而空间相关性指的是同一帧图像,相邻的两个像素也具备一定的相关性。这些相关性

浅析图像压缩编码方法

Computer Knowledge and Technology 电脑知识 与技术第6卷第23期(2010年8月)浅析图像压缩编码方法 徐飞 (闽西职业技术学院,福建龙岩364021) 摘要:该文描述了图像压缩编码的概念,原理以及主要分类,介绍了目前常见的三种图像压缩编码方法的原理,特点以及简单讨论了其中两种方法的MATLAB 代码实现。 关键词:图像压缩编码;编码原理;编码分类;编码方法;MATLAB 中图分类号:TP301文献标识码:A 文章编号:1009-3044(2010)23-6584-03 Analysis of the Image Compression Coding Method XU Fei (Minxi Vocational &Technical College,Longyan 364021,China) Abstract:This paper is mainly about the concept,principle and classification of image compression coding,introduces the concepts and characteristic of three kinds of image compression coding methods that are common used,and discusses how to using matlab to accomplish the two common methods which mentions in the front. Key words:image compression coding;coding principle;coding classification;coding method;MATLAB 现代社会是信息社会,随着信息技术的发展,图像信息被广泛应用于多媒体通信、计算机系统和网络中。因为对图像的要求越来越高,图像信息量也越来越大,所以在传输之前需要进行信息处理,必须采用合适的方法对其进行压缩,因此有必要对图像压缩编码方法进行研究。 1图像压缩编码 1.1概述 图像压缩编码就是在满足一定保真度和图像质量的前提下,对图像数据进行变换、编码和压缩,去除多余的数据以减少表示数字图像时需要的数据量,便于图像的存储和传输。即以较少的数据量有损或无损地表示原来的像素矩阵的技术,也称图像编码。 1.2图像压缩编码原理 图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;二是利用人眼的视觉特性。 1.2.1图像数据的冗余度 1)空间冗余: 在一幅图像中规则的物体和规则的背景具有很强的相关性。 2)时间冗余:电视图像序列中相邻两幅图像之间有较大的相关性。 3)结构冗余和知识冗余: 图像从大面积上看常存在有纹理结构,称之为结构冗余。 4)视觉冗余:人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像的变化并不都能察觉出来。 1.2.2人眼的视觉特性 1)亮度辨别阈值:当景物的亮度在背景亮度基础上增加很少时,人眼是辨别不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。人眼刚刚能察觉的亮度变化值称为亮度辨别阈值。 2)视觉阈值:视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就察觉不出来,高于它才看得出来,这是一个统计值。3)空间分辨力:空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。 4)掩盖效应:“掩盖效应”是指人眼对图像中量化误差的敏感程度,与图像信号变化的剧烈程度有关。 1.3图像压缩编码的分类 根据编码过程中是否存在信息损耗可将图像编码分为: 1)无损压缩:又称为可逆编码(Reversible Coding),解压缩时可完全回复原始数据而不引起任何失真; 2)有损压缩:又称不可逆压缩(Non-Reversible Coding),不能完全恢复原始数据,一定的失真换来可观的压缩比。 根据编码原理可以将图像编码分为: 1)熵编码:熵编码是编码过程中按熵原理不丢失任何信息的编码。熵编码基本原理是给出现概率大的信息符号赋予短码字,出收稿日期:2010-06-10 作者简介;徐飞(1982-),男,福建龙岩人,闽西职业技术学院,助教,理学学士,主要研究方向为数字图象,软件开发,软件测试。ISSN 1009-3044Computer Knowledge and Technology 电脑知识与技术Vol.6,No.23,August 2010,pp.6584-6586,6589E-mail:eduf@https://www.doczj.com/doc/28507975.html, https://www.doczj.com/doc/28507975.html, Tel:+86-551-56909635690964

Matlab的图像压缩技术

Matlab的图像压缩技术 一.目的要求 掌握Matlab图像图像压缩技术原理和方法。理解有损压缩和无损压缩的概念,了解几种常用的图像压缩编码方式,利用matlab进行图像压缩算法验证。二.实验内容 1、观察颜色映像矩阵的元素 >> hot(8) ans = 0.3333 0 0 0.6667 0 0 1.0000 0 0 1.0000 0.3333 0 1.0000 0.6667 0 1.0000 1.0000 0 1.0000 1.0000 0.5000 1.0000 1.0000 1.0000 数据显示第一行是1/3红色,最后一行是白色。 2、pcolor显示颜色映像 >> n=16; >> colormap(jet(n)); >> pcolor([1:n+1;1:n+1]); >> title('Using Pcolor to Display a Color )Map'); 图2 显示颜色映像

3、colorbar显示当当前坐标轴的颜色映像>> [x,y,z]=peaks; >> mesh(x,y,z); >> colormap(hsv); >> axis([-3 3 -3 3 -6 8]); >> colorbar; 图3 显示当前坐标轴的颜色映像4、图像格式转换 g=rgb2gray(I); g=rgb2gray(I); >> imshow(g),colorbar; 图4-1 原图像saturn.png

图4-2转换后的图像 5、求解图像的二唯傅里叶频谱 I=imread('cameraman.tif'); >> imshow(I) >> J=fftshift(fft2(I)); >> figure; >> imshow(log(abs(J)),[8,10]) 图5-1 原图像cameraman.png

图像压缩技术的综述

题目:图像压缩技术的综述 学生姓名:徐欢学号: 系别:计算机与信息学院专业:计算机科学与技术 入学年份:年月 导师姓名:陈蕴谷职称学位:讲师硕士研究生 导师所在单位:中国科学院合肥物质研究院 完成时间年月 .引言 随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。 图像数据是用来表示图像信息的,如果不同的方法为表示相同的信息使用了不同的数据量,那么使用较多数据量的方法中,有些数据必然代表了无用的信息,或者是重复的表示了其他数据表示的信息,前者成为数据冗余,后者成为不相干信息。图像压缩编码的主要目的,就是通过删除冗余的或者是不相干的信息,以尽可能地的数码率来存储和传输数字图像数据。 图像压缩编码技术可以追溯到年提出的电视信号数字化,到今天已经有多年的历史了。在此期间出现了很多种图像压缩编码方法,特别是到了年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。 图像编码基础 图像编码压缩是指在满足一定图像质量的条件下,用尽可能少的数据量来表示图像。编码技术比较系统的研究始于信息论,从此理论出发可以得到数据压缩的两种基本途径。一种是联合信源的冗余度也寓于信源间的相关性之中,去除他

视频图像压缩标准主要有哪些

视频图像压缩标准主要有哪些,各自的优缺点及适用范围 作者:李佳璘韩妮娜宋亚希 近10年来,图像编码技术得到了迅速发展和广泛应用,关且日臻成熟,其标志就是几个关于图像编码的国际标准的制定,即国际标准化组织ISO和国际电工委员会IEC关于静止图像的编码标准JPEG、国际电信联盟ITU-T关于电视电话/会议电视的视频编码标准的有H261,H.263和ISO/IEC关于活动图像的编码标准MPEG-1,MPEG-2和MPEG-4等。这些标准图像编码算法融合了各种性能优良的图像编码方法,代表了目前图像编码的发展水平。1、JPEG(Joint Photographic Expert Group) JPEG是ISO/IEC联合图像专家组制定的静止图像压缩标准,是适用于连续色调(包括灰度和彩色)静止图像压缩算法的国际标准。JPEC算法共有4种运行模式,其中一种是基于空间预测(DPCM)的无损压缩算法,另外3种是基于DCT的有损压缩算法。 1)无损压缩算法,可以保证无失真地重建原始图像。 2)基于DCT的顺序模式,按从上到下,从左到右的顺序对图像进行编码,称为基本系统。 3)基于DCT的递进模式,指对一幅图像按由粗到细对图像进行编码。 4)分层模式。以各种分辨率对图像进行编码,可以根据不同的要求,获得不同分辨率的图像。 2、JPEG-2000 与以往的JPEG标准相比,JPEG-2000压缩率比JPEG高约30%,它有许多原先的标准所不可比拟的优点。JPEG-2000与传统JPEG最大的不同,在于它放弃了JPEG所采用的以DCT 变换为主的分块编码方式,而改为以小波变换为主的多分辨率编码方式。 首先,JPEG-2000能实现无损压缩(lossless compression)。在实际应用中,有一些重要的图像,如卫星遥感图像、医学图像、文物照片等,通常需要进行无损压缩。对图像进行无损编码的经典方法——预测法已经发展成熟,并作为一个标准写入了JPEG-2000中。 JPEG-2000还有一个很好的优点就是误码鲁棒性(robustness to bit error)好。因此使用JPEG-2000的系统稳定性好,运行平稳,抗干扰性好,易于操作。 JPEG-2000能实现渐进运输(progressive transmission),这是JPEG-2000的一个极其重要的特征。它可以先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,以满足用户的需要,这在网络传输中具有非常重大的意义。使用JPEG-2000下载一个图片,用户可先看到这个图片的轮廓或缩影,然后再决定是否下载。而且,下载时可以根据用户需要和带宽来决定下载图像质量的好坏,从而控制数据量的大小。 PEG-2000另一个极其重要的优点就是感兴趣区(ROI,Region Of Interest)特性。用户在处理的图像中可以指定感兴趣区,对这些区域进行压缩时可以指定特定的压缩质量,或在恢复时指定特定的解压缩要求,这给人们带来了极大的方便。在有些情况下,图像中只有一小块区域对用户是有用的,对这些区域采用高压缩比。在保证不丢失重要信息的同时,又能有效地压缩数据量,这就是感兴趣区的编码方案所采取的压缩策略。基于感兴趣区压缩方法的优点,在于它结合了接收方对压缩的主观要求,实现了交互式压缩。 3、MPEG-1 国际标准化组织ISO/IEC的运动图像专家组MPEG(Moving Picture Expert Group)一直致力于运动图像及其伴音编码标准化工作,并制定了一系列关于一般活动图像的国际标

图像压缩技术的发展现状与趋势

图像压缩技术的发展现状与趋势 耿玉静1 赵华2 1燕山大学信息科学与工程学院 河北秦皇岛 (066004) 2河北师范大学电子系 河北保定 (071003) E-mail: gyjlunwen@https://www.doczj.com/doc/28507975.html, 摘要文章简要论述了图像和视频压缩技术的研究状况,就目前国际上正在研究的压缩标准和方法作了介绍,并对图像和视频压缩技术的发展趋势和前景进行了初步探讨。 关键词图像压缩,视频编码,视频对象,压缩标准 1.图像压缩的可行性 图像编码压缩的目的是对要处理的图像源数据按一定的规则进行变换和组合[1],从而达到以尽量少的比特数来表征图像,同时尽可能好的复原图像的质量,使它符合预定应用场合的要求。图像数据之所以可以进行压缩,是因为有以下几个方面的原因:组成图像的各像素之间,无论在行方向还是列方向都存在一定的相关性,即原始图像数据是高度相关的,应用某种编码方法提取或减少这些相关性,便可达到压缩数据的目的;从信息论看,描述图像信源的数据是由有效信息量和冗余量两部分组成的,去除冗余量能够节省传输和存储中的开销,同时又不损害图像信源的有效信息量;有些场合允许图像编码有一定的失真,也是图像可以压缩的一个重要原因。 2.图像压缩的分类 图像压缩编码的方法目前有很多种,出发点不同其分类亦有差异。以信息保真度为出发点,可以分为两大类:一类是冗余度压缩法。如著名的哈夫曼编码、香农编码、游程编码等,其特征是压缩比较低(一般不超过8:1),但不丢失任何数据,可以严格恢复原图像,实现编/解码的互逆,故又称可逆编码或无损压缩。另一类是熵压缩法。如预测编码、变换编码、统计编码等,由于在压缩过程中要丢失一些人眼所不敏感的图像信息,且所丢失的信息不可恢复,即图像还原后与压缩前不完全一致,故又称有损压缩。以具体编码技术为出发点,可以分为:预测编码、变换编码、统计编码、轮廓编码、模型编码等。 3.图像压缩技术的现状 20世纪80年代后,ISO、IEC和ITU陆续制定了各种数据压缩与通信的标准与建议。 3.1静止图像压缩标准:JPEG标准&JPEG 2000 标准 3.1.1 JPEG 标准 JPEG 全名为Joint Photographic Experts Group,是一个在国际标准组织(ISO)下从事静止图像压缩标准制定的委员会。JPEG标准从1986年正式开始制订,1988年决定采用以图像质量最好的ADCT(Adaptive Discrete Cosine Transform)方式为基础的算法作标准[2],于1991年3月提出10918号标准[3]“连续色调静止图像的数字压缩编码”,即JPEG标准[4,5]。它在较低的计算复杂度下,能提供较高的压缩比与保真度。 - 1 -

图像压缩(JPEG)编码算法及压缩过程的实现

秋风,秋雨,秋天的景色 ?博客园 ?首页 ?博问 ?闪存 ?新随笔 ?联系 ?订阅 ?管理 随笔- 234 文章- 0 评论- 22 图象压缩(JPEG)编码算法及压缩过程的实现转 图象压缩(JPEG)编码算法及压缩过程的实现 摘要 本文首先介绍了静态图像压缩(JPEG)编码算法的基本原理、压缩的实现过程及其重要过程的离散余弦变换(DCT)算法的实现原理及软件实现的例程,其次着重介绍了压缩过程中的DCT、量化和编码三个重要步骤的实现原理。 关键词:图像压缩有损压缩 JPEG 离散余弦变换 DCT 量化 第一章图像压缩编码的综述 1.1 图象压缩的目的和方法 图象的数字化表示使得图象信号可以高质量地传输,并便于图像的检索、分析、处理和存储。但是数字图像的表示需要大量的数据,必须进行数据的压缩。即使采用多种方法对数据进行了压缩,其数据量仍然巨大,对传输介质、传输方法和存储介质的要求较高。因此图象压缩编码技术的研究显得特别有意义,也正

是由于图象压缩编码技术及传输技术的不断发展、更新,推动了现代多媒体技术应用的迅速发展。 1.1.1 图象压缩的目的 图象采样后,如果对之进行简单的8bit量化和PCM编码,其数据量是 巨大的。以CIF(Common Intermediate Format)格式的彩色视频信号为例,若采样速率为25帧/秒,采样样点的Y、U、V分量均为8bit量化,则一秒钟的数据量为: 352×288×3×8×25=60.83Mbit 要传输或存储这样大的数据量是非常困难的,必需对其进行压缩编码,在满足实际需要的前提下,尽量减少要传输或存储的数据量。 虽然数字图象的数据量巨大,但图象数据是高度相关的。一幅图象的内部相邻象素之间,相邻行之间的视频序列中相邻图象之间有大量冗余信息—空间相关性和时间相关性,可以使用各种方法尽量去除这些冗余信息,减少图象的数据量。 除了时间冗余和空间冗余外,在一般的图象数据中还存在信息熵冗余、结构冗余、知识冗余和视觉冗余。各种冗余就是压缩图象数据的出发点。图象编码的目的就在于采用各种方法去除冗余,以尽量少的数据量来表示个重建图象。 1.1.2图象压缩的几种方法 1.统计和字典的压缩方法 常规程序和计算机熵的数据对于那些基于利用统计变种的压缩,效果很好,这些统计变种表现在单个符号的频率以及符号或短语字符串的频率等方面,而基于字典的系统实际山就是假扮统计程序。可是遗憾的是,这类压缩对于连续色调图象的作用并不很好。 这些程序的主要问题产生于这样的一个事实:照片图象的象素广泛地分布在整个范围。如果将图象中的彩色用频率分布画出,那么频率分布图中,没有我们在统计压缩的成功的情况下所看到的“尖峰”状,实际上,如果延长这个分布图,那么从类似于电视那样的生活图象源中得出的分布图会趋于平展。这意味着,每个象素代码彼此是大约相同的出现机会,决定不存在挖掘熵差的任何机会。 基于字典的压缩程序的运行也有类似的问题,基于扫描照片的图象决定没有任何类型的数据特征以产生相同的短语的多次出现。例如,一个栅格化的图象,

相关主题
文本预览
相关文档 最新文档