矢量量化器
- 格式:doc
- 大小:74.00 KB
- 文档页数:8
语音信号处理重点、考点、考试题一、填空题:(共7小题,每空2分,共20分) A卷1、矢量量化系统主要由编码器和组成,其中编码器主要是由搜索算法和构成。
2、基于物理声学的共振峰理论,可以建立起三种实用的共振峰模型:级联型、并联型和。
3、语音编码按传统的分类方法可以分为、和混合编码。
4、对语音信号进行压缩编码的基本依据是语音信号的和人的听觉感知机理。
5、汉语音节一般由声母、韵母和三部分组成。
6、人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉的效应。
7、句法的最小单位是,词法的最小单位是音节,音节可以由构成。
二、判断题:(共3小题,每小题2分,共6分)1、预测编码就是利用对误差信号进行编码来降低量化所需的比特数,从而使编码速率大幅降低。
()2、以线性预测分析-合成技术为基础的参数编码,一般都是根据语音信号的基音周期和清/浊音标志信息来决定要采用的激励信号源。
()3、自适应量化PCM就是一种量化器的特性,能自适应地随着输入信号的短时能量的变化而调整的编码方法。
()三、单项选择题:(共3小题,每小题3分,共9分)1、下列不属于衡量语音编码性能的主要指标是()。
(A)编码质量(B)矢量编码(C)编码速率(D)坚韧性2、下列不属于编码器的质量评价的是()(A)MOS (B)DAM(C)DRT(D)ATC3、限词汇的语音合成技术已经比较成熟了,一般我们是采用()作为合成基元。
(A)词语(B)句子(C)音节(D)因素四、简答题:(共2小题,每小题12分,共24分)1、画出矢量量化器的基本结构,并说明其各部分的作用。
2、试画出语音信号产生的离散时域模型的原理框图,并说明各部分的作用。
五、简答题:(共5小题,前三小题,每题5分,后两小题,每题10分,共35分)1、线性预测分析的基本思想是什么?2、隐马尔可夫模型的特点是什么?3、矢量量化器的所谓最佳码本设计是指什么?4、针对短时傅里叶变换Ⅹn(ejw)的定义式,请从两个角度对其进行物理意义的分析。
矢量量化(Vector Quantization)一.矢量量化初步1.基本原理2.设计码本(LBG)3.量化二.矢量量化进一步1.分裂矢量量化(Splitted VQ)2.多极矢量量化(Cascaded VQ)3.树形矢量量化器4.其它各种类型矢量量化器三. 几个矢量量化的工程实现问题1.分级矢量量化中的多路径搜索问题2.用模拟退火(Simulated Annealing) 算法训练最佳码本[2]四. 矢量量化的应用一.矢量量化初步1. 基本原理结论:在信息论中已证明,矢量量化优于标量量化。
❑矢量量化是先将K 个(2≥K )个采样值形成K 维空间K R 中的一个矢量,然后将这个矢量一次进行量化。
它可以大大降低数码率。
❑基础是信息论的分支: 率失真(畸变)理论对于一定的量化速率R(以每个采样信号平均所用的量化比特数来衡量,bit/采样),量化失真D(以量化信号与原信号之间的误差均方值和原信号均方值之比来衡量)是一定的。
矢量量化总是优于标量量化的。
这是因为矢量量化有效地应用了矢量中各分量间的四种相互关联的性质:线性依赖性,非线性依赖性,概率密度函数的形状以及矢量维数。
定义:1) 源:若将K M ⋅个信号采样组成的信源序列{}j x 中每K 个为一组分为M 个随机矢量,构成信源空间{}MXX X X,,,21 =(X在K 维欧氏空间KR中),其中第j 个矢量可记为{}12,,,j k X x x x = ,M j ,,2,1 =。
2) 子空间:把KR无遗漏地划分成nN 2=个互不相交的子空间N R R R ,,,21 ,满足:⎪⎩⎪⎨⎧≠===ji R RR R j i N i K i ,013) 码本:在每个子空间i R 中找一个代表矢量i Y ,令恢复矢量集为:{}N Y Y Y Y ,,,21 =。
Y 也叫输出空间、码本或码书(Code Book),i Y 称为码矢(Code V ector)或码字(Code Word),Y 内矢量的数目N,则叫做码本长度。
第四章矢量量化1、矢量量化?(VQ)是1956年由steinhaus首次提出的,1970年代后期发展起来的数据压缩和编码技术。
它主要应用于:语音编码、语音合成、语音识别和说话人识别。
矢量量化在语音信号处理中占有重要地位。
2、标量量化和矢量量化?✓标量量化:是对标量进行量化,即一维的矢量量化。
将动态范围分成若干个小区间,每小区间有一个代表值。
当输入信号落入某区间时,量化成该代表值。
✓矢量量化:是对矢量进行量化。
将矢量空间分成若干个小区域,每小区域有一个代表矢量。
当输入矢量落入某区域时,量化成该代表矢量。
矢量量化是标量量化的发展。
矢量量化总是优于标量量化,维数越高,性能越优越。
矢量量化有效利用各分量间的互相关性。
1970年代末,Linde,Buzo,Gray和Markel等人首次解决了矢量量化码书生成的方法,并首先将矢量量化用于语音编码获得巨大成功。
如,在语音通信方面,将在原来编码速率为2.4kbit/s的线性预测声码器基础上,将每帧的10个反射系数加以10维的矢量量化,就可使编码速率降低到800bit/s,而声音质量基本未下降。
又如分段声码器,由于采用矢量量化,可以使数码率降低到150bit/s。
3、矢量量化的基本原理?标量量化是对信号的单个样本或参数的幅度进行量化;标量是指被量化的变量,为一维变量。
矢量量化的过程是将语音信号波形的K个样点的每一帧,或有K个参数的每一参数帧构成K维空间的一个矢量,然后对这个矢量进行量化。
标量量化可以说是K=1的矢量量化。
矢量量化的过程和标量量化过程相似。
在标量量化时,在一维的零至无穷大值之间设置若干个量化阶梯,当某输入信号的幅度值落在某相邻的两个量化阶梯之间时,就被量化成两阶梯的中心值。
而在矢量量化时,则将K维无限空间划分为M 个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。
矢量量化的定义将信号序列{}i y 的每K 个连续样点分成一组,形成K 维欧氏空间中的一个矢量,矢量量化就是把这个K 维输入矢量X 映射成另一个K 维量化矢量。
矢量量化有损压缩是利用人眼的视觉特性有针对地简化不重要的数据,以减少总的数据量。
量化是有损数据压缩中常用的技术。
量化可以分为两种,即标量量化与矢量量化。
标量量化每次只量化一个采样点。
而矢量量化在量化时用输出组集合中最匹配的一组输出值来代替一组输入采样值。
根据香农的速率-失真理论,即使信源是无记忆的,利用矢量编码代替标量编码总能在理论上得到更好的性能,矢量量化可以看作标量量化的推广。
基本的矢量量化器编码,传输与解码过程如图所示。
矢量量化编码器根据一定的失真测度在码书中搜索出与输入矢量最匹配的码字。
传输时仅传输该码字的索引。
解码过程很简单,只要根据接收到的码字索引在码书中查找该码字,并将它作为输入矢量的重构矢量。
码字匹配信道查表信宿信源码书码书输入矢量索引索引编码器解码器输出矢量矢量量化编码和解码示意图假定码书}|,,,{110k j N R C ∈=-y y y y ,其中N 为码书的大小,而k 维输入矢量T k x x x ),,(110-= x 与码字T k j j j j y y y ),,()1(10-= y 之间的失真测度采用平方误差测度来表示,即:22210)(),(jjl k l l j y x d y x y x -=-=∑-=则矢量量化码字搜索问题就是在码书C 中搜索与输入矢量x 最匹配的码字bm y ,使得bm y 与x 之间的失真是所有码字中最小的,即:),(min ),(10bm N bm bm d d y x y x -≤≤= 全搜索算法(FS )是一种最原始、最直观的码字搜索算法,它需要计算输入矢量与所有码字之间的失真,并通过比较找出失真最小的码字。
由于FS 算法每次失真计算需要k 次乘法,12-k 次加法,故为了对矢量进行编码需要Nk 次乘法,)12(-k N 次加法和1-N 次比较运算。
而FS 算法的计算复杂度是由码书的大小和矢量维数决定,而高效率矢量量化编码系统往往采用大码书和高维矢量,这时计算复杂度是非常大的,故减少码字搜索的计算负担是非常必要的,必须寻求快速有效的码字搜索算法。
矢量量化矢量量化(VQ —Vector Quantization)是70年代后期发展起来的一种数据压缩技术基本思想:将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化,从而压缩了数据而不损失多少信息矢量量化编码也是在图像、语音信号编码技术中研究得较多的新型量化编码方法,它的出现并不仅仅是作为量化器设计而提出的,更多的是将它作为压缩编码方法来研究的。
在传统的预测和变换编码中,首先将信号经某种映射变换变成一个数的序列,然后对其一个一个地进行标量量化编码。
而在矢量量化编码中,则是把输入数据几个一组地分成许多组,成组地量化编码,即将这些数看成一个k维矢量,然后以矢量为单位逐个矢量进行量化。
矢量量化是一种限失真编码,其原理仍可用信息论中的率失真函数理论来分析。
而率失真理论指出,即使对无记忆信源,矢量量化编码也总是优于标量量化。
在矢量量化编码中,关键是码本的建立和码字搜索算法。
码本的生成算法有两种类型,一种是已知信源分布特性的设计算法;另一种是未知信源分布,但已知信源的一列具有代表性且足够长的样点集合(即训练序列)的设计算法。
可以证明,当信源是矢量平衡且遍历时,若训练序列充分长则两种算法是等价的。
码字搜索是矢量量化中的一个最基本问题,矢量量化过程本身实际上就是一个搜索过程,即搜索出与输入最为匹配的码矢。
矢量量化中最常用的搜索方法是全搜索算法和树搜索算法。
全搜索算法与码本生成算法是基本相同的,在给定速率下其复杂度随矢量维数K以指数形式增长,全搜索矢量量化器性能好但设备较复杂。
树搜索算法又有二叉树和多叉树之分,它们的原理是相同的,但后者的计算量和存储量都比前者大,性能比前者好。
树搜索的过程是逐步求近似的过程,中间的码字是起指引路线的作用,其复杂度比全搜索算法显著减少,搜索速度较快。
由于树搜索并不是从整个码本中寻找最小失真的码字,因此它的量化器并不是最佳的,其量化信噪比低于全搜索。
矢量量化编码1. 引言矢量量化是一种高效的数据压缩技术,它具有压缩比大、解码简单和失真较小等优点。
自从1980年提出矢量量化器(Vector Quantizater)码书设计的LBG算法[Linde et al(1980)]以来,矢量量化(Vector Quantization)技术[Gray(1984)]已经成功地应用到图像压缩和语音编码中。
矢量量化压缩中最核心的技术是码书的设计,码书的优化性直接影响到压缩效率和图像复原质量。
这里主要对码书设计算法进行讨论。
首先介绍了经典的LBG算法及其在图像压缩中的应用;然后,针对LBG算法的不足,结合图像处理的特点,提出了改进的覆盖聚类算法,有效改善了系统性能。
2 .码书的设计码书设计是矢量量化压缩系统的关键环节。
码书设计得越优化,矢量量化器的性能就越好。
实际中,不可能单独为每幅待编码的图像设计一个码书,因此通常是以一些代表性图像构成的训练集为基础,为一类图像设计一个最优码书。
从数学的观点看,矢量量化中的码书设计,实质是把系统的率失真函数看成目标函数,并使之在高维空间中成为最小的全局优化问题。
假设采用平方误差测度作为失真测度,训练集中的矢量数为M,目的是生成含N(N<M)个码字(码矢量)的码书。
码书设计过程就是寻求把M 个训练矢量分成N类的一种最佳方案(使均方误差最小),而把各类的质心矢量作为码书的码字。
可以证明,各种可能的码书个数为(1/ N!)Σ(一1)(N-i)CNiM,其中( 为组合数。
通过测试所有码书的性能可得到全局最优码书。
然而,在N 和M 比较大的情况下,搜索全部码书是根本不可能的。
为了克服这个困难,各种码书设计方法都采取搜索部分码书的方法得到局部最优或接近全局最优的码书。
因此,研究码书设计算法的目的就是寻求有效的算法尽可能找到全局最优或接近全局最优的码书以提高码书性能,并尽可能减少计算复杂度。
3 LBG算法描述经典的码书设计算法是LBG算法[它是Y.Linde,A.Buzo与R.M.Gray 在1980年推出的,其思想是对于一个训练序列,先找出其中心,再用分裂法产生一个初始码书A0,最后把训练序列按码书A0中的元素分组,找出每组的中心,得到新的码书,转而把新码书作为初始码书再进行上述过程,直到满意为止。
最佳矢量量化器码本设计
指导教师姓名: ×××
报告提交日期: 20××年×月×日
摘要
矢量量化技术作为一种有损压缩编码技术在语音信号的存储和低码率传输过程中起到了巨大的推动作用。
本文主要介绍了适量量化的一些基本概念,以及矢量编码器的码本设计方法。
关键词
适量量化矢量量化器
矢量量化
矢量量化介绍
矢量量化是70年代后期发展起来的一种数据压缩技术基本思想:将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化,从而压缩了数据而不损失多少信息。
矢量量化技术是七十年代后期发展起来的一种数据压缩和编码技术,广泛应用于语音编码、语音合成、语音识别和说话人识别、图像压缩等领域。
矢量量化的基本原理是:将若干个标量数据组成一个矢量(或者是从一帧语音数据中提取的特征矢量)在多维空间给予整体量化,从而可以在信息量损失较少的情况下压缩数据量。
矢量量化有效地应用了矢量中各元素间的相关性,因此可以有比标量量更好的压缩效果。
一般来说矢量维数越大量化越优越。
矢量量化原理概述
标量量化
将抽样值的整个动态范围被分成若干个小区间,每个小区间有一个代表值,量化时落入小区间的信号值就用这个代表值代替,或者叫被量化为这个代表值。
这时的信号量是一维的,所以称为标量量化。
矢量量化
若干个标量数据组成一个矢量,矢量量化是对矢量进行量化,和标量量化一样,它把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替,或者叫被量化为这个代表矢量。
矢量量化的要点
首先设计一个好码本。
关键在于如何划分J个区域边界。
这需要大量的输入信号矢量,经过统计实验才能确定,这个过程称为“训练”或“学习”。
应用聚类算法,按照一定的失真度准则(失真测度),对训练的数据进行分类,从而把训练数据在多维空间中划分成一个以码字为中心的胞腔,常用的是LBG算法来实现。
未知矢量的量化。
按照选定的失真度准则(失真测度),把未知矢量,量化为失真度最小的码字。
矢量量化的失真测度
失真测度 (距离测度 )是将输入矢量用码本重构矢量来表征时所产生的误差或失真的度量方法它可以描述两个或多个模型矢量间的相似程度。
失真测度的选择好坏将直接影响到聚类效果和量化精度 ,进而影响到语音信号矢量量化处理系统的性能。
,最常用的失真测度是欧氏距离测度.
欧式距离测度
K维特征矢量:
X i={x i1 , x i2 , …… , x iK}
Y j={y j1 , y j2 , …… , y jK}
均方误差欧式距离
二矢量量化器
1 矢量量化器的定义
维数为k,码本长度为J的矢量量化器Q定义为:从k维欧几里德空间R k到一包含J个输出(重构)点的有限集合C的映射,
Q:R k→C,其中C={y1 ,y2 ,… ,y J}
Y i 属于R k,i=1,…,J
集合C称作码本或码书,码本长度为J 。
码本的J个元素称作码字或码矢量,它们均为R k中的K维矢量。
三最佳矢量量化器
最佳矢量量化器的概念
根据最佳矢量量化器速率的两种定义,分别引出两种最佳矢量量化器的概念。
也就是在两个不同的条件下,分别得到最小失真的矢量量化器。
(1)给定矢量量化器的码书大小N,求最小是真
试中Qx为所有码书大小为N的K维矢量量化器的集合。
(2)给定矢量量化器的输出熵限制R,求最小是真
四最佳矢量量化码本设计
所谓最佳设计,就是从大量信号样本中训练出好的码本;从实际效果出发寻找到好的失真测度定义公式;用最少的搜索及计算失真的运算量。
最佳码本的设计,就是在一定条件下,使得d(X,Y)的统计平均最小。
需满足下列条件:
1 最佳划分:对给定的码书,根据最邻近准则,找出所有码书矢量的最佳区域边界,对信号空间进行最佳划分:对于任意一个矢量X如果它与矢量Yi的失真小于它和其它码字之间的失真,则X应属于某区域边界Si。
2 最佳码书:对给定的区域边界Si ,寻找出最佳码书Yi ,使码书的平均失真最小,码字Yi是Si中所有矢量的质心(形心)。
在设计码本的时候经常用到lbg算法
LBG算法是一种递推算法,从一个事先选定的初始码本开始迭代。
1 把训练序列按照码本中的元素根据最邻近准则分组.
2 对每一分组找质心,得到新的码本,又作为初始码本.
3 再进行分组,重复上述过程,直到系统性能(总失真D)满足要求和不再有明显的改进为止。
下面给出基于平方误差测度和训练矢量集的LBG 算法具体步骤:
步骤1: 给定初始码书,令代次数m = 0,平均失真 ,给定的相对门限。
步骤2:用码书 C (m)中的各码字作为质心,根据最佳划分原则把训练
矢量集X 划分为M 个子集。
即当X ∋时,下式应成立:
步骤3:计算总畸变:
判断相对误差是否满足:
若满足, 则停止算法, 码书C (m)就是所求的码书;否则,转步骤4
步骤 4: 根据最佳码书条件,计算新码字, 即:
由这个新质心, 形成新码书C( m+ 1),置 m = m + 1, 转步骤2。
初始码书的选择影响码书训练的收敛速度和最终码书的性能. 传统的初始码书生产方法有两种:一种为分裂法,一种是随机选择法。
具体操作步骤就不在此赘述了。