北京交通大学图像处理--第5章 图像编码(1)
- 格式:pps
- 大小:794.50 KB
- 文档页数:85
一、霍夫曼编码(Huffman Codes)最佳编码定理:在变长编码中,对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码,如果码字长度严格按照符号出现概率大小的相反的顺序排列,则平均码字长度一定小于按任何其他符号顺序排列方式的平均码字长度。
霍夫曼编码已被证明具有最优变长码性质,平均码长最短,接近熵值。
霍夫曼编码步骤:设信源X 有m 个符号(消息)⎭⎬⎫⎩⎨⎧=m m p x p p x x X ΛΛ2121,1. 1. 把信源X 中的消息按概率从大到小顺序排列,2. 2. 把最后两个出现概率最小的消息合并成一个消息,从而使信源的消息数减少,并同时再按信源符号(消息)出现的概率从大到小排列;3. 3. 重复上述2步骤,直到信源最后为⎭⎬⎫⎩⎨⎧=o o o o o p p x x X 2121为止;4. 4. 将被合并的消息分别赋予1和0,并对最后的两个消息也相应的赋予1和0;通过上述步骤就可构成最优变长码(Huffman Codes)。
例:110005.0010010.000015.01120.00125.01025.0654321x x x x x x P Xi 码字编码过程则平均码长、平均信息量、编码效率、冗余度为分别为:%2%9842.2)05.0log 05.01.0log 1.015.0log 15.02.0log 2.025.0log 25.02(45.205.041.0415.0320.0225.022===⨯+⨯+⨯+⨯+⨯⨯-==⨯+⨯+⨯+⨯+⨯⨯=Rd H N η二 预测编码(Predictive encoding )在各类编码方法中,预测编码是比较易于实现的,如微分(差分)脉冲编码调制(DPCM )方法。
在这种方法中,每一个象素灰度值,用先前扫描过的象素灰度值去减,求出他们的差值,此差值称为预测误差,预测误差被量化和编码与传送。
接收端再将此差值与预测值相加,重建原始图像象素信号。
1.2多媒体编码(图片编码)1.2 多媒体编码 (图片编码)1.2.1 图片编码概述图片编码是将图像数据转换为数字形式以便存储、传输或处理的过程。
图像编码的目标是尽可能减少图像数据的存储空间和传输带宽,同时保持图像质量。
1.2.2 图片编码算法1.2.2.1 无损压缩算法无损压缩算法是通过对图像数据进行编码和解码,以实现不丢失任何图像信息的方式进行压缩。
无损压缩算法常用的包括LZW、Huffman和Run-length等算法。
1.2.2.2 有损压缩算法有损压缩算法是通过对图像数据进行一定的近似处理,以降低存储空间和传输带宽需求的方式进行压缩。
有损压缩算法常用的包括JPEG、JPEG2000和GIF等算法。
1.2.3 JPEG压缩算法JPEG压缩算法是一种广泛使用的有损压缩算法,适用于几乎所有类型的图像。
JPEG压缩算法将图像分为8x8的小块,对每个小块进行离散余弦变换(DCT)并进行量化和编码,以达到压缩的效果。
1.2.3.1 JPEG编码过程1.2.3.1.1 块分割将图像划分为8x8的块。
1.2.3.1.2 离散余弦变换 (DCT)对每个块进行DCT变换。
1.2.3.1.3 量化根据量化表,对DCT系数进行量化。
1.2.3.1.4 编码将量化后的系数进行熵编码。
1.2.3.2 JPEG解码过程1.2.3.2.1 解码对熵编码的数据进行解码。
1.2.3.2.2 逆量化根据量化表,对解码后的系数进行逆量化。
1.2.3.2.3 逆离散余弦变换 (IDCT)对逆量化后的系数进行IDCT变换。
1.2.3.2.4 重构图像将解码后的块进行重组,得到重构的图像。
1.2.4 JPEG2000压缩算法JPEG2000是一种新一代的有损压缩算法,相对于JPEG,它具有更高的压缩效率和更好的图像质量。
JPEG2000压缩算法采用小波变换(Wavelet Transform)和基于位平面的编码技术。
1.2.4.1 JPEG2000编码过程1.2.4.1.1 小波变换对图像进行小波变换。
图像压缩编码(实验报告)一、实验目的1.理解图像压缩目的及意义;2.理解有损压缩和无损压缩的概念;3.了解几种常用的图像压缩编码方法;4.利用MATLAB程序进行图像压缩。
二、实验原理图像压缩主要目的是为了节省存储空间,提高存储、处理、传输速度。
虽然表示图像需要大量的数据,但数据是高度相关的,或者说存在冗余(Redundancy),去掉这些冗余信息可以有效地压缩图像,同时不会损坏图像的有效信息。
信息的冗余量有许多种,如空间冗余,时间冗余,结构冗余,知识冗余,视觉冗余等,数据压缩实质上是减少这些冗余量。
高效编码的主要方法是尽可能去除图像中的冗余成分,从而以最小的码元包含最大的图像信息。
图像压缩的理想标准是信息丢失最少,压缩比例最大。
不损失图像质量的压缩称为无损压缩,无损压缩不可能达到很高的压缩比;损失图像质量的压缩称为有损压缩,高的压缩比是以牺牲图像质量为代价的。
压缩的实现方法是对图像重新进行编码,希望用更少的数据表示图像。
编码压缩方法有许多种,从不同的角度出发有不同的分类方法,从信息论角度出发可分为两大类。
(1)冗余度压缩方法,也称无损压缩、信息保持编码或嫡编码。
具体说就是解码图像和压缩编码前的图像严格相同,没有失真,从数学上讲是一种可逆运算。
(2)信息量压缩方法,也称有损压缩、失真度编码或烟压缩编码。
也就是说解码图像和原始图像是有差别的,允许有一定的失真。
应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分为以下几类:(1)熵编码。
熵编码是纯粹基于信号统计特性的编码技术,是一种无损编码。
熵编码的基本原理是给出现概率较大的符号赋予一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。
常见的熵编码有:哈夫曼(Huffman)编码,算术编码,行程(RLE)编码。
(2)预测编码。
预测编码是利用图像信号的空间或时间相关性,用已传输的像素对当前的像素进行预测,然后对预测值与真实值的差(预测误差)进行编码处理和传输。
图像编码——图像处理第G 组LZW编码:LZW编码对信源输出的不同的长度的符号序列分解固定的长度的码字,且不需要有关符号出现的概率的知识。
LZW编码方法是一种字典方法,在编码的开始阶段要构造一个对信源符号进行编码的码本(字典)。
方法:对于一个固定灰度的图像,开始时字典储存图像所要表示的灰度范围。
比如8比特灰度,那么字典初始化就有0-255灰度条目。
对于编码后的字典条目,直接在后面添加。
在编码时,当前识别序列和字典条目,我们采取了数组的储存方式,但也尝试过采取使用MATLAB中的元胞类型,但编码的效率很低速度很慢。
这是由于在查找字典匹配序列时,使用元胞类型时在电脑的运行内部要经常进行指针的大范围的跳转,查找效率很低。
采用了数组储存后指针指在小范围内移动效率得到明显的提高。
编码的规则很简单。
对图像从行列进行像素扫描,对于第一个像素不进行输出,只当作下一次的当前识别序列。
而对其它的有当前事变序列连接上当前处理的像素值组成一个序列,如果该序列能在字典里找到对应的序列,那么该序列作为下一个的当前序列其它什么也不做。
如果不能找到,则编码输出当前识别序列的字典中的索引值。
这样一直到最后,把最后一个当前的识别序列的字典的索引值直接作为编码接在编码输出序列后面。
对于解码来说,也采用上面的数组的储存结构。
我们只要以编码值在对应建立的字典中去找到对应的字典条目输出就可以的。
但这里存在着一个问题,对一些连续的出现相同的像素的编码值,在解码时不能在字典里面找到字典条目。
难点:正确的解码。
解决方法:对于不能在字典中找到的条目,采用条件判断,之后取前面的识别序列连接上识别序列的第一个像素值作为像素序列的输出和字典输出,当结束后再把当前处理的编码值赋给识别序列。
一切就很正常的进行了由于LZW编码,在编码时运算量特别大,所以编码的效率很低。
主要有几个原因:1、对算有像素都要进行一次扫描2、对于很少出现相似的像素,字典会非常大3、每一次都要去查找一下字典改进方法:1、选取图像像素的最大值(如果少于255,那么可以减少字典大小,同时减少一些计算量)2、采用向后查找方式3、对于字典储存方式上的数组改进方式。
数字图像处理学第5章图像编码(第一讲)模拟图像信号在传输过程中极易受到各种噪声的干扰,而且模拟图像信号一旦受到污染则很难完全得到恢复。
另外,在模拟领域中,要进行人与机器(计算机或智能机),机器与机器之间的信息交换以及对图像进行诸如压缩、增强、恢复、特征提取和识别等一系列处理都是比较困难的。
•所以无论从完成图像通信与数据通信网的结合方面来看,还是从对图像信号进行各种处理的角度来看,图像信号数字化都是首当其冲的重要问题。
图像数字化的关键是编码。
本章将对图像编码进行较为详细的讨论。
5. 1 信源编码图像编码属于信源编码范畴。
其特点是利用图像信号的统计特性及人眼睛的生理和心理特性对图像进行高效编码。
在信息论中将数字通信过程概括为图5—1的形式。
信源信源编码信道编码调制传输信道噪声解调信道解码信源解码信宿图5—1所示的模型是一个数字通信系统模型。
在这样一个模型中有二次编、译码,信源编码、信源译码信道编码、信道译码。
信源编码的主要任务是解决有效性问题,也就是对信源实现压缩处理,使处理后的信号更适宜数字通信系统。
解决有效性问题就是在编码过程中尽量提高编码效率,也就是力求用最少的数码传递最大的信息量。
信道编码的任务是解决可靠性问题。
也就是尽量使处理过的信号在传输过程中不出错或少出错,既使出了错也要有能力尽量纠正错误。
因此,在信道编码中往往引进用作误差控制的数码,以实现自动检错和纠错。
图像编码主要是要研究压缩数码率,即高效编码问题。
编码是信息处理科学中的经典研究课题,就图像编码而言,已有近五十年的历史。
近年来,M.Kunt提出第一代、第二代编码的概念。
•M.Kunt把1948年至1988年这四十年中研究的以去除冗余为基础的编码方法称为第一代编码,如:PCM、DPCM、△M、亚取样编码法,变换域的DFT、DCT、Walsh-Hadamard变换编码等方法以及以此为基础的混合编码法均属于经典的第一代编码法。
第二代编码方法多是八十年代以后提出的新的编码方法,如金字塔编码法、Fractal编码、基于神经元网络的编码方法、小波变换编码法、模型基编码法等。
现代编码法的特点是:①充分考虑人的视觉特性;②恰当地考虑对图像信号的分解与表述;③采用图像的合成与识别方案压缩数据率。
这种分法尽管并没得到图像编码界全体同仁的广泛认可,但笔者认为对了解图像编码发展进程是有益的。
图像编码这一经典的研究课题,经五十多年的研究已有多种成熟的方法得到应用,特别是所谓的第一代编码更是如此。
随着多媒体技术的发展已有若干编码标准由ITU-T制定出来,如JPEG、H.261、H.263、MPEG1、MPEG2、MPEG4、MPEG7、JBIG(二值图像压缩) (Joint Bo-level Image Coding Expert Group)等。
相信经广大科技工作者的不懈努力,在未来会有更多、更有效的编码方法问世,以满足多媒体信息处理及通信的需要。
信源编码的目的是提高编码效率。
是否能提高编码效率?回答是肯定的。
从信息论的角度看,各种信源都存在大量的冗余成分。
如果去掉这些冗余成分,就能提高编码效率。
所以,所谓第一代编码就是围绕着去除冗余度这一中心思想实现数据压缩的。
冗余度在那里?冗余度主要存在于两个主要方面:1)、存在于信源的相关性之中;2)、存在于图像信源各个元素出现概率的不均等之中。
因此,无论是记忆性信源还是无记忆性信源都由压缩的可能。
去掉了冗余成分的信源固然精练了,但是,也变得脆弱了。
抗干扰性能也变差了。
因此,在传书过程中,还要加入一些冗余成分以增加抗干扰能力。
这就是信道编码的任务了。
图像编码的分类图像编码大致可分三类:1)、匹配编码;2)、变换编码;3)、识别编码:(1)、匹配编码这种编码方法是使代码长度与图像信源的概率分布相匹配。
如:出现概率大的编短码,概率小的编长码,总的码率就会下降。
这种编码的长短不一,使得传输、译码、存储均不方便,另一个缺点是编码的先决条件是要知道图像信源的概率分布。
解决办法:1)、寻找一个大体上能代表图像信源的数学模型,如正态分布,指数分布等;2)、实际统计图像信源的概率分布,这种方法更切合实际,但是,往往找不到合适的数学模型,给分析带来不便。
(2)、变换编码首先把图像信源从一个空间变换到另外一个空间,然后对变换系数进行编码。
变换方式大体上可分为两类;预测变换函数变换(3)、识别编码这种方法的关键是识别。
基本原理是用另外一套符号代替原来的信源中的消息,如:电报、速记等均可认为是识别编码的例子。
主要方法:a)关联识别,需要一定数量的样本。
信息与样本比较,判别相似程度。
b)、逻辑识别没有样本,是用逻辑表达式判别被识别对象。
这种编码方法与实际应用还有距离。
从压缩的角度也可以分为;1)、熵压缩法:不可逆的编码法,压缩中有信息损失,但在视觉角度看失去的信息是无关紧要的信息。
2)、无失真编码:是可逆的编码方法。
没有信息损失。
另外,如果从目前已有的实用方案的角度来分类,可以分为三大类,即预测编码,变换编码及统计编码。
而这些方法既适用于静止图像编码,也适用于电视信号编码。
就具体编码方法而言可简略地概括在表5—1中。
表5—1图象高效编码法PCM 预测法正交变换法统计编码其他方法常规编码法亚奈氏取样编码法标准法自适应法标准法自适应法标准法自适应法行程编码轮廓编码DPCM ΔMK-LHT, DWTDFTSTDCTTHar霍夫曼仙农—费诺最后需要着重提及的是,上述各种具体方案并不是孤立的、单一的使用,往往是各种方法重迭、交叉使用,以达到更高的编码效率,在ITU-T的建议标准中这一点尤为突出。
5. 2 图像编码中的保真度准则图像信号在编码和传输过程中会产生误差,尤其是在熵压缩编码中,产生的误差应在允许的范围之内。
在这种情况下,保真度准则可以用来衡量编码方法或系统质量的优劣。
通常,这种衡量的尺度可分为客观保真度准则和主观保真度准则。
5.2.1 客观保真度准则5.2.2 主观保真度准则5.2.1 客观保真度准则通常使用的客观保真度准则有输入图像和输出图像的均方根误差;输入图像和输出图像的均方根信噪比两种。
输入图像和输出图像的均方根误差是这样定义的。
设输入图像是由N×N个像素组成,令其为f(x,y),其中x,y=0,1,2,3…N-1 。
这样一幅图像经过压缩编码处理后,送至受信端,再经译码处理,重建原来图像。
这里令重建图像为g(x,y) 。
它同样包含N N个像素,并且x,y=0,1,2…N-1 在0,1,2,3…..N-1 范围内(x,y)处的任意值,输入像素和对应的输出图像之间的误差可用下式表示而包含N ×N 象素的图像之均方误差为e x y g x y f x y (,)(,)(,)=-2101022101022)],(),([1),(1y x f y x g N y x e N e N y N x N y N x -==∑∑∑∑-=-=-=-=(5—2)(5—1)由式(5—2)可得到均方根误差为[]212e=(5—3) erms如果把输入、输出图像间的误差看作是噪声,那么,重建图像g(x,y)可由下式表示=+(5—4) (,)(,)(,)g x y f x y e x y在这种情况下,另一个客观保真度准则—重建图像的均方信噪比如下式表示21010210102101021010)],(),([),(),(),(y x f y x g y x g y x e y x g N S N y N x N y N x N y N x N y N x s m -==⎪⎭⎫ ⎝⎛∑∑∑∑∑∑∑∑-=-=-=-=-=-=-=-=(5—5)均方根信噪比为S N g x y g x y f x y r m s x N y N x N y N ⎛⎝ ⎫⎭⎪=-⎧⎨⎪⎪⎩⎪⎪⎫⎬⎪⎪⎭⎪⎪=-=-=-=-∑∑∑∑ 010*********(,)[(,)(,)](5—6)5.2.2 主观保真度准则图像处理的结果,绝大多数场合是给人观看,由研究人员来解释的,因此,图像质量的好坏与否,既与图像本身的客观质量有关,也与人的视觉系统的特性有关。
有时候客观保真度完全一样的两幅图像可能会有完全不相同的视觉质量,所以又规定了主观保真度准则。
这种方法是把图像显示给观察者,然后把评价结果加以平均,以此来评价一幅图像的主观质量。
一种方法是规定一种绝对尺度,例如:(1)优秀的:具有极高质量的图像;(2)好的:是可供观赏的高质量的图像,干扰并不明显;(3)可通过的:图像质量可以接受,干扰不讨厌;(4)边缘的:图像质量较低,希望能加以改善,干扰有些讨厌;(5)劣等的:图像质量很差,尚能观看,干扰显著地令人讨厌;(6)不能用:图像质量非常之差,无法观看。
另外常用的还有两种准则,即妨害准则和品质准则。
妨害准则如下五级:(1)没有妨害感觉;(2)有妨害,但不讨厌;(3)能感到妨害,但没有干扰;(4)妨害严重,并有明显干扰;(5)不能接收信息。
品质准则如下七级:(1)非常好;(2)好;(3)稍好;(4)普通;(5)稍坏;(6)恶劣;(7)非常恶劣。
除此之外,还可以采用成对比较法,也就是同时出示两幅图像,让观察者表示更喜欢哪一幅图像,借此排出图像质量的等级。
也有采用随机抽取法来评定图像质量的。
这种方法是把数量相等的原始图像和经编译码后的图像混杂在一起,然后让观察者挑出他认为质量差的图像。
质量较差的图像可定义为处理过的图像,然后统计错挑的概率,显然错挑概率越大说明图像经处理后的劣化越小。
总之,主观保真度评价方法的准则可不同,但其基本原理都一样,当然,对观察者的视觉条件应有一定的要求。
5. 3 PCM编码5.3.1 PCM 编码的基本原理5.3.2 PCM 编码的量化噪声5.3.3 编码器、译码器5.3.1 PCM 编码的基本原理脉冲编码调制(Pulse coding Modulation—PCM )是将模拟图像信号变为数字信号的基本手段。
图像信号的PCM 编码与语音信号PCM 编码相比并没有原则上的区别。
但是,图像信号,特别是电视信号占的频带宽,要求响应速度快,因此,电路设计与实现上有较大的难度。
图像信号PCM 编、译码原理方框图如图5—2所示。
图像信号PCM 编码由前置低通滤波器、取样保持电路、量化器、编码器组成。
图像低通滤波取样保持编码传输信道解码低通滤波解码图像量化图5—3 PCM 编、译码原理方框图限制频带,防止折叠误差时间离散化幅度离散化多值变多比特多比特变多值内插及平滑前置低通滤波器的作用:1)、为满足取样定理的带限要求,以减少折迭误差;2)、对杂散噪声也有一定的抑制作用。
取样保持电路:将完成把时间上连续的模拟信号进行时间离散化的任务。