图像压缩编码
- 格式:docx
- 大小:189.24 KB
- 文档页数:8
语音压缩编码与图像压缩编码语音压缩编码语音压缩编码可分为三类:波形编码、参量编码和混合编码。
这些都属于有损压缩编码。
1.波形编码(1)波形编码的定义波形编码是指对利用调制信号的波形对语音信号进行调制编码的方式。
(2)波形编码的性能要求保持语音波形不变,或使波形失真尽量小。
2.语音参量编码(1)语音参量编码的定义语音参量编码是将语音的主要参量提取出来编码的方式。
(2)语音参量编码的基本原理首先分析语音的短时频谱特性,提取出语音的频谱参量,然后再用这些参量合成语音波形。
(3)语音参量编码的性能要求保持语音的可懂度和清晰度尽量高。
3.混合编码(1)混合编码的定义混合编码是既采用了语音参量又包括了部分语音波形信息的编码方式。
(2)混合编码的基本原理混合编码除了采用时变线性滤波器作为核心外,还在激励源中加入了语音波形的某种信息,从而改进其合成语音的质量。
(3)混合编码的性能要求保持语音的可懂度和清晰度尽量高。
图像压缩编码图像压缩按照图像是否有失真,可分为有损压缩和无损压缩;按照静止图像和动态图像,又可分为静止图像压缩和动态图像压缩。
1.静止图像压缩编码的特点(1)静止数字图像信号是由二维的许多像素构成的;(2)在各邻近像素之间都有相关性;(3)所以可以用差分编码(DPCM)或其他预测方法,仅传输预测误差从而压缩数据率。
2.动态图像压缩编码的特点(1)动态数字图像是由许多帧静止图像构成的,可看成是三维的图像;(2)在邻近帧的像素之间有相关性;(3)动态图像的压缩可看作是在静止图像压缩基础上再设法减小邻近帧之间的相关性。
图像编码是将图像数据转化为一系列数字信号的过程,其目的是通过减少冗余信息,将图像数据压缩存储,以便更有效地传输和处理图像。
在数字图像处理和计算机视觉的广泛应用中,图像编码技术起到了重要的作用。
本文将介绍几种常用的图像编码中的数据压缩技术。
一、无损压缩技术无损压缩技术是指在压缩过程中不损失图像质量的一种方法。
其中最常用的一种是无损预测编码技术。
该技术基于预测和差分编码的思想,将图像中每个像素的值与其周围像素值进行比较,并将差异值编码。
无损预测编码技术可以通过建立预测模型来推断像素值,从而减少编码量。
另一种常见的无损压缩技术是熵编码。
熵编码根据像素值的频率分布,将出现概率较高的像素值用较短的码字表示,而将出现概率较低的像素值用较长的码字表示。
熵编码技术可以充分利用图像中的统计特征,提高编码效率。
二、有损压缩技术有损压缩技术是指在压缩过程中会有部分信息的损失,但通过合理的算法设计,根据人类视觉系统的特性,使得图像的失真不太显著,以达到高压缩比的目的。
其中最常见的有损压缩技术是离散余弦变换(DCT)和小波变换。
离散余弦变换(DCT)将图像划分为小的块,对每个块进行DCT变换得到频域系数。
通过对频域系数进行量化和编码,可以将系数的精度降低,从而减少了数据量。
DCT技术广泛应用于JPEG图像压缩标准中。
小波变换将信号分解为时间和频率域,可以捕捉到信号的时频特征。
图像通过小波变换后,得到的系数可以在频域上局部集中,通过将低系数置零并压缩高系数,可以实现图像的高效压缩。
小波变换技术在图像压缩领域有着广泛的应用,特别是在JPEG2000标准中。
除了DCT和小波变换,还有一种常见的有损压缩技术是基于向量量化的编码方法。
向量量化通过将图像划分为矢量,并将每个矢量映射到一个预定的码本中,从而实现压缩。
向量量化技术在图像编码中具有较好的压缩效果和较低的失真。
当前,图像编码技术在数字图像处理和计算机视觉领域得到了广泛的应用。
图像编码的基本原理图像编码是数字图像处理中的重要环节,它通过对图像进行压缩和编码,实现对图像信息的有效存储和传输。
在图像编码的过程中,需要考虑到图像的信息量、保真度、压缩比等多个因素,因此,图像编码的基本原理显得尤为重要。
首先,图像编码的基本原理包括两个主要方面,压缩和编码。
压缩是指通过一定的算法和技术,减少图像数据的存储空间和传输带宽,而编码则是将压缩后的图像数据转换成数字信号,以便于存储和传输。
在实际的图像编码过程中,通常会采用有损压缩和无损压缩两种方式,以满足不同应用场景的需求。
有损压缩是指在压缩图像数据的同时,会损失一定的信息量,但可以获得更高的压缩比。
常见的有损压缩算法包括JPEG、MPEG等,它们通过对图像进行离散余弦变换、量化、熵编码等步骤,实现对图像数据的有损压缩。
而无损压缩则是在不损失图像信息的前提下,实现对图像数据的压缩。
无损压缩算法主要包括LZW、Huffman编码等,它们通过对图像数据的统计特性进行编码,实现对图像数据的无损压缩。
除了压缩和编码外,图像编码的基本原理还包括了对图像信息的分析和处理。
在图像编码的过程中,需要对图像进行预处理、采样、量化等操作,以便于后续的压缩和编码。
同时,还需要考虑到图像的特性和人眼的视觉感知特点,以实现对图像信息的高效编码和保真传输。
总的来说,图像编码的基本原理涉及到压缩、编码和图像信息处理等多个方面,它是数字图像处理中的重要环节,直接影响到图像的存储、传输和显示质量。
因此,对图像编码的基本原理进行深入理解和研究,对于提高图像处理技术和应用具有重要意义。
希望本文的介绍能够帮助读者更好地理解图像编码的基本原理,为相关领域的研究和应用提供参考。
图像压缩编码方法
图像压缩编码方法是通过减少图像数据的冗余部分来减小图像文件的大小,以便于存储和传输。
以下是常见的图像压缩编码方法:
1. 无损压缩:无损压缩方法可以压缩图像文件的大小,但不会丢失任何图像数据。
常见的无损压缩编码方法包括:
- Huffman编码:基于字符出现频率进行编码,将频率较低的字符用较长的编码表示,频率较高的字符用较短的编码表示。
- 预测编码:根据图像像素间的相关性进行编码,利用当前像素与附近像素的差异来表示像素值。
- 霍夫曼编码:利用霍夫曼树来对图像数据进行编码,降低数据的冗余度。
- 算术编码:根据符号的出现概率,将整个编码空间划分为不同部分,每个符号对应于不同的编码区域。
2. 有损压缩:有损压缩方法可以在压缩图像大小的同时,对图像数据进行一定的丢失,但尽量使丢失的数据对人眼不可见。
常见的有损压缩编码方法包括:
- JPEG压缩:基于离散余弦变换(DCT)的方法,将图像数据转换为频域表示,
然后根据不同频率成分的重要性进行量化和编码。
- 基于小波变换的压缩:将图像数据转换为频域表示,利用小波基函数将图像分解为低频和高频子带,然后对高频子带进行量化和编码。
- 层次编码:将原始图像数据分为不同的预测层次,然后对不同层次的误差进行编码,从而实现压缩。
需要注意的是,不同的压缩编码方法适用于不同类型的图像数据和压缩要求。
有些方法适用于需要高压缩比的情况,但会引入更多的失真,而有些方法适用于需要保留图像质量的情况,但压缩比较低。
因此,在选择图像压缩编码方法时,需要根据具体要求和应用场景进行权衡和选择。
图像编码标准有哪些图像编码标准是指对图像进行数字化表示和传输时所采用的编码规范,它对图像的质量、大小、传输速度等方面都有着重要的影响。
目前,常见的图像编码标准主要包括JPEG、PNG、GIF等。
下面将对这些图像编码标准进行详细介绍。
首先,JPEG(Joint Photographic Experts Group)是一种常见的图像压缩标准,它采用了一种称为离散余弦变换(DCT)的算法来对图像进行压缩。
JPEG图像可以在不同的质量设置下进行压缩,从而在图像质量和文件大小之间取得平衡。
由于其压缩比较高,JPEG图像在网络传输和存储时被广泛应用。
其次,PNG(Portable Network Graphics)是一种无损压缩的图像编码标准,它采用了索引色和真彩色两种编码方式。
相比于JPEG,PNG图像可以保持更高的质量,因为它不会丢失任何图像信息。
此外,PNG图像还支持透明度通道,使其在网页设计和图像处理中有着广泛的应用。
另外,GIF(Graphics Interchange Format)是一种支持动画的图像编码标准,它采用了无损压缩的编码方式。
GIF图像可以包含多帧,从而实现简单的动画效果。
虽然GIF图像在色彩表现和压缩比上不如JPEG和PNG,但在动画方面有着独特的优势,因此在表情包、简单动画等方面被广泛使用。
除了上述几种常见的图像编码标准外,还有一些其他的标准,如TIFF、BMP 等。
它们各自有着不同的特点和适用范围,可以根据实际需求进行选择和应用。
总的来说,图像编码标准在数字图像处理和传输中起着至关重要的作用。
不同的标准适用于不同的场景,选择合适的图像编码标准可以有效地提高图像质量、减小文件大小,从而提升用户体验和系统性能。
因此,在实际应用中,需要根据具体的需求和情况来选择合适的图像编码标准,以达到最佳的效果。
综上所述,图像编码标准是数字图像处理和传输中的重要环节,不同的标准有着各自的特点和适用范围。
MATLAB中的图像压缩和编码方法图像压缩和编码是数字图像处理的重要领域,在各种图像应用中起着至关重要的作用。
在本文中,我们将探讨MATLAB中的图像压缩和编码方法,包括无损压缩和有损压缩,并介绍其中的一些经典算法和技术。
一、图像压缩和编码概述图像压缩是指通过一定的算法和技术来减少图像数据的存储量或传输带宽,以达到节约存储空间和提高传输效率的目的。
而图像编码则是将原始图像数据转换为一系列二进制编码的过程,以便存储或传输。
图像压缩和编码通常可以分为无损压缩和有损压缩两种方法。
无损压缩是指压缩后的数据可以完全还原为原始图像数据,不会引入任何失真或变化。
常见的无损压缩算法有Run-Length Encoding (RLE)、Lempel-Ziv-Welch (LZW)、Huffman编码等。
这些算法通常针对图像中的冗余数据进行编码,如重复的像素值或相似的图像区域。
有损压缩则是在保证一定程度的视觉质量下,通过舍弃或近似原始图像数据来减小存储或传输的数据量。
常见的有损压缩算法有JPEG、JPEG2000、GIF等。
这些算法通过离散余弦变换(DCT)、小波变换或颜色量化等方法,将图像数据转换为频域或颜色空间的系数,并通过量化、编码和压缩等步骤来减小数据量。
二、无损压缩方法1. Run-Length Encoding (RLE)RLE是一种简单高效的无损压缩算法,通过计算连续重复像素值的数量来减小数据量。
在MATLAB中,可以使用`rle`函数实现RLE编码和解码。
例如,对于一幅图像,可以将连续的像素值(如白色)编码为重复的个数,然后在解码时根据重复的个数恢复原始像素值。
2. Lempel-Ziv-Welch (LZW)LZW是一种字典压缩算法,通过将图像中连续的像素序列映射为一个短代码来减小数据量。
在MATLAB中,可以使用`lzwencode`和`lzwdecode`函数实现LZW 编码和解码。
例如,对于一段连续的像素序列,可以将其映射为一个短代码,然后在解码时根据代码恢复原始像素序列。
JPEG是图像压缩编码标准JPEG(Joint Photographic Experts Group)是一种常见的图像压缩编码标准,它是一种无损压缩技术,可以有效地减小图像文件的大小,同时保持图像的高质量。
JPEG压缩技术广泛应用于数字摄影、网页设计、打印和传真等领域,成为了图像处理中不可或缺的一部分。
JPEG压缩编码标准的原理是基于人眼对图像细节的感知特性,通过去除图像中的冗余信息和不可见细节,从而实现图像的压缩。
在JPEG压缩中,图像被分割成8x8像素的块,然后对每个块进行离散余弦变换(DCT),将图像从空间域转换到频域。
接着,对DCT系数进行量化和编码,最后使用熵编码对图像进行压缩。
这样的压缩方式可以显著减小图像文件的大小,同时保持图像的视觉质量。
JPEG压缩标准的优点之一是可以根据需要选择不同的压缩比,从而在图像质量和文件大小之间取得平衡。
在数字摄影中,用户可以根据拍摄场景和要求选择不同的压缩比,以满足对图像质量和文件大小的需求。
此外,JPEG格式的图像可以在不同的设备和平台上进行广泛的应用和共享,具有很好的兼容性。
然而,JPEG压缩也存在一些缺点。
由于JPEG是一种有损压缩技术,因此在高压缩比下会出现明显的失真和伪影。
特别是在连续的编辑和保存过程中,图像的质量会逐渐下降,出现“JPEG失真”。
因此,在图像处理中需要注意选择合适的压缩比,避免过度压缩导致图像质量下降。
另外,JPEG格式不支持透明度和动画等高级特性,对于一些特殊的图像处理需求可能不够灵活。
在这种情况下,可以考虑使用其他图像格式,如PNG和GIF,来满足特定的需求。
总的来说,JPEG作为一种图像压缩编码标准,具有广泛的应用和重要的意义。
它在数字摄影、网页设计、打印和传真等领域发挥着重要作用,为图像处理和传输提供了有效的解决方案。
然而,在使用JPEG格式进行图像处理时,需要注意选择合适的压缩比,避免过度压缩导致图像质量下降。
同时,也需要根据具体的需求考虑使用其他图像格式来满足特定的需求。
JPEG图像压缩与编码解析
JPEG(Joint Photographic Experts Group)压缩格式,以其易于使用、压缩率高而著称,是应用最为广泛的一种图像压缩格式。
JPEG压缩
算法把图像分为内容和质量两个维度来进行压缩。
下面将详细论述JPEG
图像编码与解码的基本原理。
1.JPEG图像编码过程
(1)空间域转换
空间域转换是将原始图像由空间域变换成更加节省存储空间的频域。
JPEG压缩采用的是离散余弦变换(DCT)这种空间域转换方法,它可以把
图像表示成一系列正交基函数的线性组合,每一个函数表示的是对应的图
像量化值。
利用DCT将一幅图像分成8×8(也有可能是16×16)大小的块,每一个块由64(或者256)个相互独立的像素构成,被称为DCT子块。
(2)频段选择
JPEG图像压缩算法采用频段选择的原则,根据图像中的特征,把空
间域转换之后的低频分量即低频信息传��有损,而只把高频分量即高频
信息传递以达到保留重要信息的目的,在JPEG中,特征的保留按照“从
重要的到不重要的”的顺序进行。
(3)变换。
图像压缩的分形编码评价指标图像压缩是一种重要的图像处理技术,它通过减少图像数据的冗余,以达到降低存储空间和传输带宽的目的。
分形编码是图像压缩中一种广泛使用的方法,它基于分形理论,通过寻找图像中的自相似性来进行压缩。
在评价分形编码的效果时,需要使用适当的指标来衡量压缩质量和失真程度。
本文将介绍图像压缩的分形编码评价指标。
一、峰值信噪比(PSNR)峰值信噪比是一种常用的图像质量评价指标,它通过比较原始图像和压缩重建图像之间的差异来评估压缩效果。
峰值信噪比的计算公式如下:PSNR = 10 * log10(MAX^2 / MSE)其中,MAX表示图像像素的最大值(通常为255),MSE表示均方误差,即原始图像与重建图像之间的像素差别的平均平方值。
峰值信噪比的数值越高,表示压缩效果越好,图像失真越小。
二、结构相似性指标(SSIM)结构相似性指标是一种综合考虑亮度、对比度和结构信息的图像质量评价指标。
它通过计算原始图像和压缩重建图像之间的亮度相似度、对比度相似度和结构相似度,并将它们的加权平均作为最终的相似性指标。
结构相似性指标的数值范围是[-1, 1],数值越接近1,表示压缩效果越好,图像失真越小。
三、压缩比(Compression Ratio)压缩比是评估图像压缩效果的重要指标之一。
它定义了压缩前后图像数据的相对大小关系。
压缩比的计算公式如下:压缩比 = 原始图像大小 / 压缩后图像大小压缩比的数值越大,表示压缩效果越好,压缩后的图像数据越小。
四、平均编码率(Average Bitrate)平均编码率是指在对图像进行压缩时,每个像素点所占用的平均比特数。
平均编码率的计算公式如下:平均编码率 = 压缩后图像大小 / 压缩后图像的像素数量平均编码率的数值越小,表示压缩效果越好,所需的比特数越少。
五、复原图像的可视质量除了以上几种常用的评价指标外,评估分形编码的效果还可以通过视觉感知来进行。
即通过直观观察和人眼感知,判断压缩后的图像质量是否达到了满意的程度。
图像编码与压缩的关系解析随着信息时代的到来,图像的应用越来越广泛。
然而,图像的存储和传输占据了大量的存储空间和带宽,因此对图像进行编码和压缩变得至关重要。
本文将讨论图像编码与压缩的关系,以及它们在图像处理中的重要性。
一、图像编码的基本原理图像编码是将图像转换成数字信号以便于存储、传输和处理的过程。
它的基本原理是利用冗余和人眼感知特性来减少图像数据的冗余度。
冗余是指在图像中存在的重复、无效或不必要的信息。
如何最大限度地去除冗余并保持图像质量是图像编码的核心问题。
在图像编码中,最常用的编码方法是离散余弦变换(DCT)。
DCT 将图像分解成不同频率的分量,然后对每个分量进行系数化。
这样做的目的是降低高频部分的系数,使得在保持图像质量的前提下减少存储和传输所需的数据量。
编码后的图像可以通过解码器进行还原,以便于正常显示。
二、图像压缩的概念和分类图像压缩是指通过改变图像的存储方式,减少其所需的存储空间和传输带宽。
它在图像处理领域有着广泛的应用。
根据压缩方式的不同,图像压缩可以分为无损压缩和有损压缩。
无损压缩是指压缩后的图像可以完全恢复成原始图像,没有任何信息的损失。
常见的无损压缩方法有LZW、Huffman编码等。
这种方法适用于对图像质量要求较高的场合,如医学图像和卫星图像等。
有损压缩是指压缩后的图像有一定的信息损失,但在一定程度上保持了图像的可视品质。
有损压缩能够大幅度地减少图像所需的存储空间和传输带宽,并广泛应用于图片存储、传输和显示领域。
常见的有损压缩方法有JPEG、JPEG2000等。
三、图像编码与压缩的关系图像编码和压缩是紧密相关的。
图像编码是为了减少冗余度,从而减少存储和传输所需的数据量;而图像压缩是为了通过改变存储方式减少所需的存储空间和传输带宽。
可以说,图像编码是图像压缩的基础。
在图像编码的过程中,采用的编码方法会影响到图像的压缩比和图像质量。
不同的编码方法对冗余的处理方式不同,从而导致不同的图像压缩效果。
图像压缩编码的方法概述摘要:在图像压缩的领域,存在各种各样的压缩方法。
不同的压缩编码方法在压缩比、压缩速度等方面各不相同。
本文从压缩方法分类、压缩原理等方面分析了人工神经网络压缩、正交变换等压缩编码方法的实现与效果。
关键词:图像压缩;编码;方法图像压缩编码一般可以大致分为三个步骤。
输入的原始图像首先需要经过映射变换,之后还需经过量化器以及熵编码器的处理最终成为码流输出。
一、图像压缩方法的分类1.按照原始信息和压缩解码后的信息的相近程度分为以下两类:(1)无失真编码又称无损编码。
它要求经过编解码处理后恢复出的图像和原图完全一样,编码过程不丢失任何信息。
如果对已量化的信号进行编码,必须注意到量化所产生的失真是不可逆的。
所以我们这里所说的无失真是对已量化的信号而言的。
特点在于信息无失真,但压缩比有限。
(2)限失真编码中会损失部分信息,但此种方法以忽略人的视觉不敏感的次要信息的方法来得到高的压缩比。
图像的失真怎么度量,至今没有一个很好的评判标准。
在由人眼主观判读的情况下,唯有人眼是对图像质量的最有利评判者。
但是人眼视觉机理到现在为止仍为被完全掌握,所以我们很难得到一个和主观评价十分相符的客观标准。
目前用的最多的仍是均方误差。
这个失真度量标准并不好,之所以广泛应用,是因为方便。
2.按照图像压缩的方法原理可分为以下三类:(1)在图像编码过程中映射变换模块所做的工作是对编码图像进行预测,之后将预测差输出供量化编码,而在接受端将量化的预测差与预测值相加以恢复原图,则这种编码方法称为预测编码。
预测编码中,我们只对新的信息进行编码。
并且是利用去除邻近像素之间的相关性和冗余性的方法来达到压缩的目的。
(2)若压缩编码中的映射变换模块用某种形式的正交变换来代替,则我们把这种方式的编码方法称为变换编码。
在变换编码中常用的变换方法有很多,我们主要用到的有离散余弦变换(DCT),离散傅立叶变换(DFT)和离散小波变换(DWT)等。
图像压缩编码的方法
图像压缩编码的方法有许多,常见的包括以下几种:
1. 无损压缩:无损压缩的目标是在压缩图像的同时不损失任何数据。
常见的无损压缩方法有:
- Run Length Encoding (RLE):适用于有大量连续重复像素的图像。
- Huffman 编码:通过统计像素出现的频率和概率来分配不同的编码长度。
- Lempel-Ziv-Welch (LZW) 编码:将连续出现的像素序列映射为较短的编码。
2. 有损压缩:有损压缩的目标是在压缩图像的同时牺牲一部分信息以获得更高的压缩比。
常见的有损压缩方法有:
- 基于变换的压缩方法:如福利耶变换(Discrete Cosine Transform, DCT)和小波变换(Wavelet Transform),将图像从时域转换到频域来减少冗余。
- 基于预测的压缩方法:如差分编码(Differential Encoding)和运动补偿(Motion Compensation),通过计算像素之间的差异来减少冗余。
- 量化:将频域系数或预测误差按照一定的量化步长进行量化,牺牲一部分细节信息。
这些方法可以单独使用,也可以结合使用以实现更高的压缩率。
-。
多媒体技术实验—图像压缩编码
一、实验目的
1.了解有关数字图像压缩的基本概念,了解几种常用的图像压缩编码方式;
2.进一步熟悉JPEG编码与离散余弦变换(DCT)变换的原理及含义;
3.掌握编程实现离散余弦变换(DCT)变换及JPEG编码的方法;
4.对重建图像的质量进行评价。
二、实验原理
1、图像压缩基本概念及原理
图像压缩主要目的是为了节省存储空间,增加传输速度。
图像压缩的理想标准是信息丢失最少,压缩比例最大。
不损失图像质量的压缩称为无损压缩,无损压缩不可能达到很高的压缩比;损失图像质量的压缩称为有损压缩,高的压缩比是以牺牲图像质量为代价的。
压缩的实现方法是对图像重新进行编码,希望用更少的数据表示图像。
应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分为以下3类:
(1)无损压缩编码种类
哈夫曼(Huffman)编码,算术编码,行程(RLE)编码,Lempel zev编码。
(2)有损压缩编码种类
预测编码,DPCM,运动补偿;
频率域方法:正交变换编码(如DCT),子带编码;
空间域方法:统计分块编码;
模型方法:分形编码,模型基编码;
基于重要性:滤波,子采样,比特分配,向量量化;
(3)混合编码
JBIG,H.261,JPEG,MPEG等技术标准。
2、JPEG 压缩编码原理
JPEG是一个应用广泛的静态图像数据压缩标准,其中包含两种压缩算法(DCT 和DPCM),并考虑了人眼的视觉特性,在量化和无损压缩编码方面综合权衡,达到较大的压缩比(25:1以上)。
JPEG既适用于灰度图像也适用于彩色图像。
其
中最常用的是基于DCT变换的顺序式模式,又称为基本系统。
JPEG 的压缩编码大致分成三个步骤:
(1)使用正向离散余弦变换(forward discrete cosine transform,FDCT)把空间域表示的图变换成频率域表示的图。
(2)使用加权函数对DCT系数进行量化,该加权函数使得压缩效果对于人的视觉系统最佳。
(3)使用霍夫曼可变字长编码器对量化系数进行编码。
3、离散余弦变换(DCT)变换原理
离散余弦变换(DCT)是一种实数域变换,其变换核为实数余弦函数,图像处理运用的是二维离散余弦变换,对图像进行DCT,可以使得图像的重要可视信息都集中在DCT的一小部分系数中。
二维DCT变换是在一维的基础上再进行一次DCT变换,公式如下:
11
(0.5)(0.5)
(,)()()(,)cos cos
()
N N
i j
i j
F u v c u c v f i j u v
N N
u
c u
u
ππ
==
++
⎡⎤⎡⎤
=⎢⎥⎢⎥
⎣⎦⎣⎦
=
=
≠
∑∑
(1)
f为原图像,经DCT 变换之后,F为变换矩阵。
(0,0)
F是直流分量,其他为交流分量。
上述公式可表示为矩阵形式:
(0.5)
(,)()cos
T
F AfA
j
A i j c i i
N
π
=
+
⎡⎤
=⎢⎥
⎣⎦
(2)
其中A是变换系数矩阵,为正交阵。
逆DCT 变换:
(,)(,)
T
f i j A F u v A
=
(3)
这里我们只讨论两个N相等的情况,即图像为方形(行列数相等),在实际应用中对不是方阵的数据都应先补齐再进行变换的。
4、图象质量评价
保真度准则是压缩后图象质量评价的标准。
客观保真度准则:原图象和压缩图象
之间的均方根误差或压缩后图象的均方根信噪比。
主观保真度准则:极好、良好、通过、勉强、低劣、不能用。
客观保真度准则 新旧图像的均方误差
(4)
均方根误差
(5)
把压缩后图像表示成原图像和噪声的叠加
(6) 均方信噪比
(7)
三、实验内容及步骤
读取一张大小为512x512的灰度图像(或彩色图像,并将其灰度化) 实验一:
1) 把图像分解成若干个8x8的子块; 2) 对每个子块分别作DCT 变换;
3) 保留变换后的直流分量,将交流分量全部清零; 4) 使用逆DCT 变换,得到新的图像,观察图片变化。
实验二:
1) 直接对整张原图像做DCT 变换; 2) 保留直流分量,交流分量全部清零;
3) 再用逆DCT 变换,得到新的图像,观察图片变化,注意与实验一结果的区别。
实验三:
1) 直接对整张原图像做DCT 变换; 2) 保留直流分量;
3) 尝试保留有限个交流分量的个数;
4) 直到逆DCT 变换以后的图像可以达到可观察的效果,与实验一结果作比较。
对以上三个实验中逆DCT 变换后所获得的图像做质量评价。
()()()11
11
2
200
00
,/,N N N N ms x y x y SNR f x y e x y ----=====∑∑∑∑()()11
22
2001,,N N x y e f x y g x y N --===-⎡⎤⎣⎦∑∑rms e =()()(),,,f x y g x y e x y =+
四、实验结果与分析原图:
实验一:
灰度图:
DCT变换后:
质量评价:
均方根误差=0.0688,均方信噪比=35.2072,客观保真度较好,图片较模糊。
实验二:
灰度图:
DCT变换后:
质量评价:
均方根误差=0.3411,均方信噪比=1.4305,客观保真度非常差,图片全灰,由于DCT变换时只保留了直流分量又没有分块,故保留的信号相对原图来说极少,信号大量丢失,信噪比很低。
实验三:
灰度图:
DCT变换后:
质量分析:
均方根误差=0.0745,均方信噪比=29.9949,这是保留了频域左上角32*32区域后所得的结果,可以发现较实验二比较图像已大为改观,由于保留了部分交流分量,图像的信噪比较实验二有较大提升。
与实验一相比,对512*512图像,分成8*8子块但是只保留子块直流分量情况,类似于全图直接DCT取频域内共64*64散点区域,所以实验三结果的客观保真度与实验一的仍有一定差距。
对于全图直接DCT,保留的交流分量越多,图像效果越好:
32*32:
64*64:
128*128:
256*256:
随着保留的交流分量的增加,图像的均方根误差越来越小,均方信噪比越来越高,图像的客观保真度越来越好。