914768-数字图像处理-数字图像处理第二章(第五讲)离散余弦变换、KL变换
- 格式:ppt
- 大小:3.88 MB
- 文档页数:33
Chapter 2 Orthogonal Transform, K・LTransform and Discrete Cosine Transform本章主要内容•信号矢量空间的概念•正交分解和正交变换•K丄分解•DCT变换1信号矢量空间的概念1.1空间的基本概念•从数学的观点看,“集合”等效于空间。
比如,实数集合构成一维实数空间,记为复数集合构成维复数空间,记为C】。
• 一般我们研究的是带有一矩规律的“空间”,最常见的是“线性空间” o粗略的说,线性空间指这样一种集合,其中任意两元素的线性组合得到集合内的另一元索。
•把集合中的元素和信号Z间建立对应关系,我们就町以把线性空间理解为信号欠星空间。
1.2常见的线性空间• N维实数空间RN和N维复数空间CN•连续时间信号空间厶,定义在复数或实数域上,时间变量为实数:无穷维空间•离散时间信号空间定义在复数或实数域上,自变量为整数:无穷维空间或有限维空间1.3 范数(norm )•范数是矢量长度的度量,与信号的能量特性 和关 •线性空间中元素X 的范数以符号llxll 表示,满 足以下公理(1) 半 lE 定性:||x|| > 0 , |x||= 0 iff x=0(2) 正齐性:||ox||=I ^IH |(3) 三角不等式:||x +y||<||x||+H1.4 RN 和CN 的范数•空间元素* =(“宀,…宀)的卩("为实数) 阶范数定义为:•常用范数为一阶,二阶和无穷阶范数,其中 在两维或三维实数空间中,二阶范数就是欠 量的长度,称为欧式(Euclidean )范数或欧式 矩。
maxI < p < 001.5厶和/的范数J |“)|Ssup|x(r)|,1 < /? < ocp —> QO1・6信号空间1、2和oo阶范数的物理意义•信号作用的强度WI,=血)随■ 814=丘卜")1 M- Y®•信号的能量1 / 78卜冷匚卜⑴S 2[艺卜(/1n=Y•信号的幅度卜IL = sup{ |x(/)|}1.7赋范线性空间•定义了范数的线性空间称为赋范线性空间。
DCT 离散余弦变换离散余弦变换(DCT)是N.Ahmed等人在1974年提出的正交变换方法。
它常被认为是对语音和图像信号进行变换的最佳方法。
为了工程上实现的需要,国内外许多学者花费了很大精力去寻找或改进离散余弦变换的快速算法。
由于近年来数字信号处理芯片(DSP)的发展,加上专用集成电路设计上的优势,这就牢固地确立离散余弦变换(DCT)在目前图像编码中的重要地位,成为H.261、JPEG、MPEG等国际上公用的编码标准的重要环节。
在视频压缩中,最常用的变换方法是DCT,DCT被认为是性能接近K-L变换的准最佳变换,变换编码的主要特点有:(1)在变换域里视频图像要比空间域里简单。
(2)视频图像的相关性明显下降,信号的能量主要集中在少数几个变换系数上,采用量化和熵编码可有效地压缩其数据。
(3)具有较强的抗干扰能力,传输过程中的误码对图像质量的影响远小于预测编码。
通常,对高质量的图像,DMCP要求信道误码率,而变换编码仅要求信道误码率。
DCT等变换有快速算法,能实现实时视频压缩。
针对目前采用的帧内编码加运动补偿的视频压缩方法的不足,我们在Westwater等人提出三维视频编码的基础上,将三维变换的结构应用于视频图像压缩,进一步实现了新的视频图像序列的编码方法。
在基于DCT变换的图像压缩编码方法中,对DCT系数必须做量化处理。
量化过程是一个多对一的映射,例如对一个8×8块的64个DCT变换系数分别除以量化步长后取整。
由于大多数DCT变换系数量化后变为零,因而达到压缩的目的。
由于在量化过程中用到除法,因此通常需要进行浮点运算。
但是,可进行浮点运算的数字信号处理器(DSP)芯片结构比定点DSP芯片复杂,价格一般也比定点DSP芯片高很多。
所以数字图像处理系统中通常采用定点DSP芯片来完成图像压缩运算,这种方法已经成为数字图像处理技术的的一个趋势。
可用于数字图像处理的比较好的定点DSP芯片有德州仪器公司新一代高性能定点DSP芯片TMS320C6200系列。
离散余弦变换编辑本段基本介绍最常用的一种离散余弦变换的类型是下面给出的第二种类型,通常我们所说的离散余弦变换指的就是这种。
它的逆,也就是下面给出的第三种类型,通常相应的被称为"反离散余弦变换","逆离散余弦变换"或者"idct"。
存有两个有关的转换,一个就是线性正弦转换(dstfordiscretesinetransform),它相等于一个长度大概就是它两倍的实奇函数的线性傅里叶转换;另一个就是改良的线性余弦转换(mdctformodifieddiscretecosinetransform),它相等于对交错的数据展开线性余弦转换。
编辑本段主要应用线性余弦转换,尤其就是它的第二种类型,经常被信号处理和图像处理采用,用作对信号和图像(包含静止图像和运动图像)展开有损数据压缩。
这就是由于线性余弦转换具备很强的"能量分散"特性:大多数的自然信号(包含声音和图像)的能量都分散在线性余弦转换后的低频部分,而且当信号具备吻合马尔科夫过程(markovprocesses)的统计数据特性时,线性余弦转换的回去相关性吻合于k-l转换(karhunen-loève转换--它具备最优的回去相关性)的性能。
例如,在静止图像编码标准jpeg中,在运动图像编码标准mjpeg和mpeg的各个标准中都使用了离散余弦变换。
在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进行量化之后进行熵编码。
这时对应第二种类型离散余弦变换中的n通常是8,并用该公式对每个8x8块的每行进行变换,然后每列进行变换。
得到的是一个8x8的变换系数矩阵。
其中(0,0)位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分类。
一个相似的转换,改良的线性余弦转换被用在高级音频编码(aacforadvancedaudiocoding),vorbis和mp3音频放大当中。
离散余弦变换在数字信号处理领域中,除了应用前面介绍的DFT和DWT之外,还有很多种离散正交变换被广泛采用,其中离散余弦变换(DCT)日益受到重视,特别是在数字图像处理技术中,DCT显示许多优点。
通常,以DCT[x(n)]表示对离散时间序列x(n)取一维离散余弦变换,为书写简短借助符号C(k)表示DCT[x(n)],它的定义如下:C(0)=Nx(n) N−1n=0C(k)=2Nx(n)N−1n=0cos[(2n+1)kn2N]逆变换IDCT[C(k)]=x(n)定义如下:x(n)=N 0+2Ncos[(2n+1)kn2N]N−1k=1以上各式中序号N=0,1,2,3,………N-1共N个;K=0,1,2,3,……….N-1也为N个。
从定义表达式容易看出,DCT与DNT的计算有着密切联系,将余弦函数改写为负指数函数取实部的形式可导出如下关系:C k=2Nx n Re[e−j(2n+1)kπ] N−1n=0=2Re[x n e−j(2n+1)kπ2NN−1n=0]如果把x(n)做如下的时域延拓,以x e(n)表示x e n=x n (n=1,2,3,………N−1) 0 (n=N,N+1,………2N−1)则DCT定义表达式可改写为C0=1Nx e2N−1n=0(n)C k=2x e2N−1n=0(n)cos[(2n+1)kπ]=2NRe[x e2N−1n=0n e−j2n+1kπ]=2NRe[e−j kπx e2N−1n=0n e−j2knπ] =2NRe[e−j kπX e(k)]式中X e k为x e(n)的2N点DFT。
可见为求得DCT正变换,可以先求序列x e(n)的2N点DFT(也即FFT),然后在求得C(k).在做DCT变换时也可现在变换域把C(k)做如下延拓,C e k=C k (k=1,2,3,………N−1)0 (k=N,N+1,………2N−1)可导出IDCT的里一种形式x(n)=(-N −2N)C e0+2Re[e j kπ2N C e(k)e j2knπ2N]2N−1k=0这表明为求得IDCT,可先求[e−j kπC e k]的IDFT,然后在计算x(n)在数字图像信号处理的许多实际问题中经常用二维离散余弦变换,其表达式为C(k1,k2)=2Nx(n1,n2)cos[2n1+1k1π2N]N−1n2=0N−1n1=0·cos[2n2+1k2π2N]上式中的k1,k2都不等于零,若其中k1或k2等于零,则二维DCT 如下,C(0,0)=1Nx(n1,n2)N−1n2=0N−1n1=0C(0,k2)=2Nx(n1,n2)N−1n2=0N−1n1=0cos[2n2+1k2π2N]C(k1,0)=2Nx(n1,n2)N−1n2=0N−1n1=0cos[2n1+1k1π2N]相应的IDCT为x(n1,n2)=1N C(0,0)+2NC(0,k2)N−1k2=0cos[2n2+1k2π2N]+2 NC(k1,0)N−1k1=0cos[2n1+1k1π2N]+2NC(k1,k2)N−1n2=0N−1n1=0cos[2n1+1k1π2N]cos[2n2+1k2π2N]。
离散余弦变换的原理离散余弦变换(Discrete Cosine Transform,DCT)是一种将时域信号转换到频域的数学变换方法,常被应用于信号处理和数据压缩领域。
与离散傅里叶变换(Discrete Fourier Transform,DFT)相比,DCT更适用于处理实数信号,并且对于信号能量集中在低频区域的情况下,DCT的能量压缩效果更好。
DCT的原理基于两个基本假设:信号在空域和频域中均为偶函数,以及实数信号的实部和虚部部分的频谱是共轭对称的。
根据这两个假设,DCT可以将一个连续的实值信号分解为一组基函数的加权和,这些基函数是余弦函数的变形。
离散余弦变换的一维公式为:X_k = \sum_{n=0}^{N-1} x_n\cos\left(\frac{\pi}{N}(n+\frac{1}{2})k\right),\ \ k=0,1,...,N-1其中,x_n 表示原始信号的离散样本,X_k 是变换后的频域系数。
为了方便,可以将一维DCT推广到多维DCT。
二维DCT的公式为:X_{k_1,k_2} = \sum_{n_1=0}^{N_1-1}\sum_{n_2=0}^{N_2-1} x_{n_1,n_2} \cos\left(\frac{\pi}{N_1}(n_1+\frac{1}{2})k_1\right)\cos\left(\frac{\pi}{N_2}(n_2+\frac{1}{2})k_2\right),\ \ k_1=0,1,...,N_1-1,\k_2=0,1,...,N_2-1其中,x_{n_1,n_2} 表示原始二维信号的离散样本,X_{k_1,k_2} 是变换后的频域系数。
DCT的主要特性是能够将高能量的信号集中在变换结果的低频系数上,而将较低能量的信号放置在高频系数上。
这个性质使得DCT非常适合在信号压缩领域中的应用。
DCT的逆变换(Inverse Discrete Cosine Transform,IDCT)可以将频域信号重新转换为时域信号。
数字图像处理综述离散余弦变换图像变换在数字图像处理与分析中起着很重要的作⽤,是⼀种常见的有效分析⼿段。
离散余弦变换是与傅⾥叶变换相关的⼀种变换,它类似于离散傅⾥叶变换,但是只使⽤实数。
余弦变换是简化傅⾥叶变换的重要⽅法。
1 离散余弦变换定义离散余弦变换(DCT)是可分离的变换,其变换核为余弦函数,是从⼀种特殊形式的傅⾥叶变换转化过来的。
离散余弦变换本质上仍然是离散傅⽴叶变换,⼆者在频域本质上是相同的。
由于离散余弦变换是⼀种实数变换,其变换矩阵的基向量很好地描述了⼈类视觉的相关性,接近于最佳变换。
1.1⼀维DCT变换⼀维DCT变换公式如下:其中N是⼀维数据的元素总数,c(u)系数使得DCT变换矩阵成为正交矩阵,正交特性在⼆维DCT变换中更能体现其优势。
1.2⼆维DCT变换与⼀维的有限长离散⾮周期信号存在傅⾥叶变换⼀样,图像作为⼀个⼆维离散信号同样存在着⼆维离散变换。
将⼀副N*N的图像f(x,y)沿⽔平⽅向对折镜像,再沿垂直⽅向对折镜像,可成为2N*2N的偶函数图像,那么它的⼆维正、反余弦变换有下⾯两式定义:正变换:反变换:2 DCT算法步骤⼆维离散余弦变化快速算法主要有两种⾏-列分解法(RCM)及⾮⾏-列分解法(NRCM)。
⾏列分解⽅法是将N*N数据按⾏和列⽅向进⾏n个⼀维离散余弦变换计算,产⽣中间矩阵,然后对中间矩阵再按列和⾏的⽅向进⾏n个⼀维离散余弦变换计算,最后得到⼆维离散余弦变换结果。
⾮⾏列分解⽅法即直接分解法。
典型的直接分解算法是2D⽮量基DCT算法。
2D⽮量基算法通常为1D DCT⼆维扩展采⽤⽮量基算法成本会减⾄⾏列分解法的75%。
2D⽮量基DCT算法主要有基于B.G.Lee算法和基于Hou算法。
3 结构框图对于⼆维离散余弦变化⾏-列分解法框图如图3-1所⽰。
图3-1 ⼆维离散余弦变化⾏-列分解法框图4 应⽤环境DCT在图像处理中有很⼴泛的应⽤,并成为⼀些静态图像和视频压缩国际标准的基本处理模块,因⽽采⽤DCT变换可以很⽅便地应⽤于压缩域图像和视频中,同时在图像数字⽔印和图像放⼤处理等领域也有涉及,但同时也有⼀些不⾜之处。
离散余弦变换的定义
离散余弦变换(Discrete Cosine Transform,简称DCT)是一种常用的数字信号处理技术,它通过将信号从频域转换到时域,以达到提取信号特征、减少信号噪声、减少信号传输量等目的。
DCT最初由Aharonov和Brenner(1967)提出,但是它广泛应用于图像压缩,直到1980年才被广泛接受。
1987年,戈德曼发明了快速余弦变换(Fast Cosine Transform,FCT),该变换能够有效地减少计算时间,使得DCT更容易被应用于实际工程中。
DCT的基本原理是将一个信号从时域转换到频域,以提取信号的特征。
它采用一组正交函数(orthogonal functions)作为基函数,用它们来表示信号,并通过变换将信号从时域转换到频域。
DCT还可以用来压缩信号,因为它可以将信号分解成不同频率分量,然后将那些高频分量的幅度降低,这样就可以减少信号的传输量。
它还可以用来抑制信号噪声,因为它可以将噪声分解到低频分量,然后将这些低频分量的幅度降低,从而抑制噪声。
DCT的应用非常广泛,它被广泛应用于数字图像处理、
音频处理和视频处理等领域。
此外,它还被用于信号压缩、抗噪声处理、图像去噪、图像质量评价等。
总之,离散余弦变换是一种非常有用的数字信号处理技术,它可以将信号从时域转换到频域,提取信号特征,减少信号噪声,减少信号传输量,以及用于信号压缩和抗噪声处理等。
它在数字图像处理、音频处理、视频处理和信号处理等领域都有着广泛的应用。