北京交通大学图像处理--第5章 图像编码(4)
- 格式:pps
- 大小:1.02 MB
- 文档页数:98
一、霍夫曼编码(Huffman Codes)最佳编码定理:在变长编码中,对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码,如果码字长度严格按照符号出现概率大小的相反的顺序排列,则平均码字长度一定小于按任何其他符号顺序排列方式的平均码字长度。
霍夫曼编码已被证明具有最优变长码性质,平均码长最短,接近熵值。
霍夫曼编码步骤:设信源X 有m 个符号(消息)⎭⎬⎫⎩⎨⎧=m m p x p p x x X ΛΛ2121,1. 1. 把信源X 中的消息按概率从大到小顺序排列,2. 2. 把最后两个出现概率最小的消息合并成一个消息,从而使信源的消息数减少,并同时再按信源符号(消息)出现的概率从大到小排列;3. 3. 重复上述2步骤,直到信源最后为⎭⎬⎫⎩⎨⎧=o o o o o p p x x X 2121为止;4. 4. 将被合并的消息分别赋予1和0,并对最后的两个消息也相应的赋予1和0;通过上述步骤就可构成最优变长码(Huffman Codes)。
例:110005.0010010.000015.01120.00125.01025.0654321x x x x x x P Xi 码字编码过程则平均码长、平均信息量、编码效率、冗余度为分别为:%2%9842.2)05.0log 05.01.0log 1.015.0log 15.02.0log 2.025.0log 25.02(45.205.041.0415.0320.0225.022===⨯+⨯+⨯+⨯+⨯⨯-==⨯+⨯+⨯+⨯+⨯⨯=Rd H N η二 预测编码(Predictive encoding )在各类编码方法中,预测编码是比较易于实现的,如微分(差分)脉冲编码调制(DPCM )方法。
在这种方法中,每一个象素灰度值,用先前扫描过的象素灰度值去减,求出他们的差值,此差值称为预测误差,预测误差被量化和编码与传送。
接收端再将此差值与预测值相加,重建原始图像象素信号。
数字图像处理学第5章图像编码(第二讲)5. 4 统计编码高效编码的主要方法是尽可能去除信源中的冗余成份,从而以最少的数码率传递最大的信息量。
冗余度存在于像素间的相关性及像素值出现概率的不均等性之中。
对于有记忆性信源来说首先要去除像素间的相关性,从而达到压缩数码率的目的。
对于无记忆性信源来说,像素间没有相关性,可以利用像素灰度值出现概率的不均等性,采用某种编码方法,也可以达到压缩数码率的目的。
这种根据像素灰度值出现概率的分布特性而进行的压缩编码叫统计编码。
5.4.1 编码效率与冗余度5.4.2几种常用的统计编码法5.4.1 编码效率与冗余度为了确定一个衡量编码方法优劣的准则,编码效率冗余度设某个无记忆信源共有M个消息,记作。
其中消息各自出现的概率分别为。
可把这个信源用下式表示{}u u u u M123,,,, {}p p p p M 123,,,, X u u u u p p p p M M =⎧⎨⎩⎫⎬⎭123123,,,,,,,, (5—22)根据该信源的消息集合,在字母集中选取符号进行编码。
一般情况下取二元字母集A {1, 0}。
通常,这一离散信源中的各个消息出现的概率并不相等。
根据信息论中熵的定义,可计算出该信源的熵如下式:A a a a a n {,,,}123ia i M i P P X H log 1∑=-=)((5—23)式中H (X )代表熵,P i 代表第i 个消息出现的概率。
例如,设一离散信源如下X u u u u =⎧⎨⎪⎩⎪⎫⎬⎪⎭⎪123412 14 18 18 由式(5—23)可算出该信源的熵H X p p i i i()log =-=∑142=----=1212141418181818742222log log log log 比特/消息设对应于每个消息的码字由N i 个符号组成。
也就是说每个消息所对应的码字长度各为N i 。
那么,每个消息的平均码长可用下式表示ii M i N P N ∑=-=1(5—24)式中代表平均码长,M为信源中包含的消息的个数,Pi 为第i个消息出现的概率,Ni为第i个消息对应的码长。
图形编码知识点总结一、概念图形编码是一种用来表示和传输图像信息的技术。
它是数字图像处理技术的一部分,用来把图像信息转换成数字信号,以便能够存储和传输。
图形编码技术是基于数字信号处理的基础上,通过压缩技术和编码方式,将图像信息转化成数字信号并保存在计算机或其他数字媒体上。
二、图像编码的分类1、无损编码无损编码是指在保持图像质量不变的情况下,将图像数据进行压缩,并进行编码以便于传输和存储。
常见的无损编码算法有无损压缩算法、赫夫曼编码和算术编码等。
无损编码的优点是能够保持图像质量不变,但缺点是无损编码算法产生的文件体积大,传输和存储成本高。
2、有损编码有损编码是指在一定情况下,将图像数据进行压缩并编码,在达到一定压缩比的同时,牺牲一定图像质量的编码方式。
有损编码通过舍弃图像数据中的一些细节信息,将图像数据压缩至较小的存储空间。
有损编码的优点是可以取得较大的压缩比,降低存储和传输成本,但缺点是会对图像质量造成一定程度的影响。
三、图像编码的基本原理1、信号采样信号采样是图像编码的第一步,它是将连续的图像信号转化为离散的数据点。
通过对图像进行采样,可以获得图像在空间和时间上的离散表示。
2、量化量化是将采样得到的离散数据映射为有限数量的离散数值。
量化的目标是将连续的图像信号转化为离散的数字信号集合,以方便图像编码和传输。
3、编码编码是将量化后的离散数据进行数字化处理,通过一定的编码方式将图像数据压缩并进行编码以便传输和存储。
编码方式常见有熵编码、差分编码、矢量量化和小波变换等。
四、常见的图像编码技术1、JPEGJPEG是一种常见的有损图像压缩标准,它采用的是DCT变换和量化技术,能够取得较大的压缩比。
JPEG压缩技术在图像编码中应用广泛,被用于数字摄影、网络传输和数字视频等领域。
2、PNGPNG是一种无损图像压缩标准,它将图像数据进行无损压缩和编码,以便于图像的存储和传输。
PNG压缩技术在需要无损图像保真度的场合得到广泛应用。
图像编码是一种将图像数据转换为更紧凑表示的过程,它在数字图像处理和传输中起着至关重要的作用。
本文将详细解析图像编码的原理和流程,从数据压缩到图像还原,逐步揭示其工作机制。
一、图像编码的基本原理图像编码的基本原理是基于人眼的视觉特性和图像的空间相关性。
人眼对图像的敏感度不均匀,对细节和变化较大的区域更敏感。
因此,图像编码可以通过降低对细节和变化较小的区域的精度来实现压缩。
此外,图像中的相邻像素之间存在一定的相关性,这种相关性可以通过差分编码来利用。
二、图像编码的流程图像编码一般包括以下几个主要的步骤:预处理、变换、量化、编码和解码。
1. 预处理预处理是对原始图像进行一些基本操作,以准备好数据进行后续处理。
常见的预处理操作包括图像去噪、颜色空间转换和亮度调整等。
2. 变换变换是将图像从空间域转换到频域的过程。
常用的变换方法包括离散余弦变换(DCT)和小波变换。
变换的目的是将图像的能量集中在少数重要的频率成分上,减小冗余信息。
3. 量化量化是将变换后的频域系数映射到有限数量的离散级别,以减小数据表示的精度。
量化通常使用固定或自适应的量化表,对不同频率的系数施加不同的量化步长。
4. 编码编码是将量化后的系数进行压缩表示的过程。
常用的编码方法有霍夫曼编码、算术编码和熵编码等。
这些编码方法利用了频率统计和冗余信息的特性,实现了高效的数据压缩。
5. 解码解码是编码的逆过程,将压缩表示的图像数据恢复为原始的图像信息。
解码过程包括解码器的反量化和反变换操作,以及任何必要的后处理步骤。
三、图像编码的应用和发展图像编码技术在图像和视频传输、存储和处理中得到了广泛的应用。
随着网络宽带的提升和存储设备的发展,人们对图像质量和数据压缩比的要求越来越高,图像编码技术也在不断进步。
目前,主流的图像编码标准有JPEG、JPEG 2000和HEVC等。
JPEG 是最常用的静态图像编码标准,它利用了DCT、量化和霍夫曼编码等技术,实现了相对较高的压缩比。
数字图像处理学第5章图像编码(第四讲)5. 6 变换编码图像编码中另一类有效的方法是变换编码。
变换编)映射变换量化器编码器变换编码主要由映射变换、量化及编码几部分操作组成。
映射变换是把图像中的各个像素从一种空间变换到另一种空间,然后针对变换后的信号再进行量化与编码操作。
在接收端,首先对接收到的信号进行译码,然后再进行反变换以恢复原图像。
映射变换的关键在于能够产生一系列更加有效的系数,对这些系数进行编码所需的总比特数比对原始图像进行编码所需要的总比特数要少得多,因此,使数据率得以压缩。
映射变换的方法很多。
图像变换编码基本可分为两大类,某些特殊的映射变换编码法,函数变换编码法。
5.6.1 几种特殊的映射变换编码法特殊映射变换编码法包括诸如行程编码,轮廓编码等一些变换编码方法。
它们特别适用于所谓二值图像的编码。
这类图像包括业务信件、公文、气象图、工程图、地图、指纹卡片及新闻报纸等。
当然在编码技术上同样可分为精确编码和近似编码两类。
•精确编码可以不引入任何畸变,在接收端可以从编码比特流中精确恢复出原始图像。
近似编码会引入一些畸变,但是,这种方法却可以在保证可用性的前提下获得较高的压缩比。
下面通过几种具体的编码方法说明这种变换编码法的基本概念。
1、一维行程编码一维行程编码的概念如图5—42所示。
假如沿着某一扫描行的像素为,它们所具有的灰度值可能为。
在编码之前,可以首先把这些像素映射为成对序列,和。
N x x x x , , , ,321 4321 ,g ,g ,g g ),),,(2211l (g l g ),(33l g ),44l (g其中表示某一灰度值,表示第i 次运行的行程。
也可以说是连续取值为灰度值的像素的个数。
经过这样映射变换后就可以对编码,而不必对像素直接编码。
i l g i ),i i l (g g i由于有些图像如前面提到的二值图像,连续取同一灰度级的像素很多,对映射后的序列进行编码会大大压缩比特率。
图5—42所示的例子可映射成表5—14所示的序列对。
在这个例子中有8级灰度,24个像素。
如果对编码,总的比特数至少要24×3=72bit 。
x i如果对表5—14的序列对编码,灰度值用3位码,行程长度用4位码,每对参数用7位码,共4对,总比特数只要28bit就够了。
可见压缩率是很可观的。
表5—14 序列对i g i l i1 3 625 1034 248 6行程编码可分为行程终点编码和行程长度编码。
如果行程终点的位置由扫描行的开始点算起,并且由到达行程终点的像素计数来确定,就称为行程终点编码。
如果行程终点位置由这一终点与前一终点的相对距离确定,就称为行程长度编码。
对于二值图像来说采用行程长度编码,甚至不需要传送灰度信息。
假定某一扫描线含有3个白色像素,其后是2个黑色像素,接着又是10个白色像素。
这样,在行程长度编码中,只传送行程长度3、2和10就可以了。
每个行程长度告诉沿扫描线的下一个边界点的相对位置。
6.1.2 二维行程编码二维行程编码也叫预测微分量化器(Predictive Differential Quantizer),简称PDQ。
其基本算法如图5—43所示。
PDQ的基本算法是将图像元素阵列变换为整数对△′和△″的序列。
这里△′是相邻扫描行上行程的开始点之间的差。
图中△′是A点和B点的差。
△″是这相邻行行程的差。
对应于A起始点的行程为l1,对应于B起点的行程为l2,因此,△″=l2—l1。
△′是相邻扫描行上行程的开始点之间的差△″是这相邻行行程的差“开始”“消失”•另外,对于图中的暗面积还要有一个“开始”和“消失”的标记。
这样就把一幅图像的像素阵列按相继扫描行变换为△′、△″、开始、消失四个参量的序列,然后便可对这四个参量来编码。
PDQ法利用了扫描线间的相关性,因此,它有更大的压缩潜力。
另外一种方法叫做双重增量编码(Double Delta coding ),简称DDC 。
它是对△′和进行编码而不是对△′和△″编码。
是前一扫描行的暗区后边界与相继扫描行暗区后边界的差。
实验证明,这种方法的压缩比较PDQ 法更大。
∆'''∆'''△′是相邻扫描行上行程的开始点之间的差△///是前一扫描行的暗区后边界与相继扫描行暗区后边界的差“开始”“消失”当在图像中有少数大的暗区时二维行程编码更有效,对于有许多小暗区的图像来说,一维行程编码更有效。
6.2 正交变换编码变换编码中另一类方法是正交变换编码法(或称函数变换编码法)。
这种方法的基本原理是通过正交函数变换把图像从空间域转换为能量比较集中的变换域。
然后对变换系数进行编码,从而达到缩减比特率的目的。
6.2.1 正交变换编码的基本概念正交变换编码的基本原理框图如图5—50所示。
编码器由预处理、正交变换、量化与编码几部分组成,译码器由译码、反变换及后处理组成。
在编码操作中,模拟图像信号首先送入预处理器,将模拟信号变为数字信号。
然后把数字信号分块进行正交变换,通过正交变换就使空间域信号变换到变换域。
然后对变换系数进行量化和编码。
在信道中传输或在存储器中存储的是这些变换系数的码字。
这就是编码端的处理过程。
在译码端,首先将收到的码字进行译码,然后进行反变换以使变换系数恢复为空间域样值,最后经过处理使数字信号变为模拟信号以供显示。
预处理正交变换量化编码传输、存储后处理解码反变换图5—50 正交变换编码原理框图正交变换编码之所以能够压缩数据率,主要是它有如下一些性质:(1)正交变换具有熵保持性质。
这说明通过正交变换并不丢失信息,因此,可以用传输变换系数来达到传送信息的目的。
(2)正交变换有能量保持性质。
这就是第三章提到的各种正交变换的帕斯维尔能量保持性质。
它的意义在于:只有当有限离散空间域能量全部转移到某个有限离散变换域后,有限个空间取样才能完全由有限个变换系数对于基础矢量加权来恢复。
(3)能量重新分配与集中。
这个性质使我们有可能采用熵压缩法来压缩数据。
也就是在质量允许的情况下,可舍弃一些能量较小的系数,或者对能量大的谱点分配较多的比特,对能量较小的谱点分配较少的比特,从而使数据率有较大的压缩。
(4)去相关特性。
正交变换可以使高度相关的空间样值变为相关性很弱的变换系数。
换句话说,正交变换有可能使相关的空间域转变为不相关的变换域。
这样就使存在于相关性之中的多余度得以去除。
综上所述,由于正交变换的结果,相关图像的空间域可能变为能量保持、集中且为不相关的变换域。
如果用变换系数来代替空间样值编码传送时,只需对变换系数中能量比较集中的部分加以编码,这样就能使数字图像传输或存贮时所需的码率得到压缩。
6.2.2 变换编码的数学模型分析正交变换编码的编码过程主要是在变换域上进行。
在这个基础上可以建立以下变换编码的数学模型。
设一图像信源为一向量]['X [][]1210,,-='N X X X X X (5—95)变换后输出一向量[]'Y[][][]Y T X = (5—97)[][] ,, , ,1210-='N Y Y Y Y Y (5—96)取正交变换为[T],那么[X]与[Y]之间的关系为由于[T]是正交矩阵,所以[][][][][]T T I T T -1'==(5—98)这里[I]为单位矩阵,是[T]的转置,是[T]的逆。
反之也有[]'T []T -1[][][]Y T X '=(5—99)也就是说在编码端利用正变换得到[Y],在译码端可用反变换来恢复[X]。
(5—100)[][]][][ ,, , ,][0012100Y T X Y Y Y Y Y M '=='- 0][Y 如果在传输或存贮中只保留M 个分量,M<N ,则可由[Y]的近似值来恢复[X]。
当然是[X ]的近似值。
但是只要选取得当,仍可保证失真在允许的范围内。
][0X 显然,关键问题在于选取什么样的正交变换[T],才能既得到最大的压缩率,又不造成严重的失真。
因此,有必要研究一下由正交变换得到[Y]的统计特性。
[Y]的统计特性中最为重要的是协方差矩阵。
下面讨论一下正交变换后得到的[Y]的协方差矩阵采用何种形式。
当然,[X ]的统计特性可以测得。
[][] ,, , ,1210-=N X X X X X (5—101)设图像信号是N维向量[X ]的协方差矩阵[]()()⎭⎬⎫⎩⎨⎧'--=][][][][X X X X E C X 式中[C X ] 是[X ]的协方差矩阵,是[X]的均值,E 是求数学期望值。
[]X (5—102)又设变换系数向量为[][] ,, , ,1210-='N Y Y Y Y Y (5—103)[C Y ]为[Y ]的协方差矩阵,所以[]()()⎭⎬⎫⎩⎨⎧'--=][][][][Y Y Y Y E C Y (5—104)式中是[Y ]的均值。
][Y由正交变换的定义,有][][][]][[][Y T X X T Y '==因此]][][[ ]}[)][]])([[]{([][ }][)][]])([[]]([{[ })]][[]][])([][[]][{[ })][]])([[]{([]['=''--=''--='--='--=T C T T X X X X E T T X X X X T E X T X T X T X T E Y Y Y Y E C X Y式(5—105)说明,变换系数的协方差矩阵可以通过空间域图像的协方差矩阵的二维变换得到。
由此可以得出结论:]][[ ][]['=T C T C X Y (5—105)即变换系数的协方差矩阵决定于变换矩阵[T]和空]。
间域图像的协方差矩阵[CX] 是图像本身所固有的,因此,关键在而[CX于寻求合适的[T]。
我们希望的两个结果:1) 、如果[C] 是一个对角形矩阵,那就说明系数Y间的相关性完全解除了。
也就是说解除了包含在相关性中的冗余度,为无失真压缩编码打下了基础。
2) 、还希望对角形矩阵中元素的能量尽量集中,以便使舍去若干系数后造成的误差不致于太大,这样,就为熵压缩编码提供了条件。
综上所述,变换编码要解决的关键问题是合理地寻求变换矩阵[T]。
3 . 最佳变换问题在研究各种变换矩阵[T]的过程中,自然要比较它们的优劣,因此,就有一个比较准则问题。
下面讨论最佳变换问题。
(1)最佳变换应满足的条件1).能使变换系数之间的相关性全部解除;2).能使变换系数之方差高度集中。
显然,第一个条件希望变换系数的协方差矩阵为对角形矩阵;第二个条件希望对角形矩阵中对角线上的元素能量主要集中在前M项上,这样就可以保证在去掉N-M 项后的截尾误差尽量小。