第07讲规则脉冲激励线性预测编码
- 格式:ppt
- 大小:2.59 MB
- 文档页数:7
全速率规则脉冲激励线性预测声码器(RPE-LPC)全速率规则脉冲激励线性预测声码器(RPE-LPC)语音编解码器是改良的线性预测编码器(LPC),它将人类声域建模成一系列不同宽度的圆柱体。
通过迫使空气通过这些柱体,即可产生语音。
LPC编码器用一组联立方程来进行建模。
标准LPC编码器不能提供电话系统所需的话音质量(虽能听清语句,但很难或不可能分辨出说话的人)。
GSM系统中采用两种技术来提高LPC编码器的质量,即:长期预测(LTP)与规则脉冲激励(RPE),而全速率编解码器就被称为RPE-LTP线性预测编码器。
输入至RPE-LTP编码器的数据为包括160个采样值的20ms语音,每一个采样值都拥有13位精度。
数据首先通过预加重滤波器来提高信号的高频分量,以获得更好的传输效率。
滤波器一般还消除信号上的任何偏移以简化进一步的计算。
语音产生模型可看成是空气通过一组不同大小的圆柱体。
短期分析级采用自动相关来计算与模型所用的8个圆柱体有关的8个反射系数,同时采用一种称为Schur递归的技术来有效地求解所得到的方程组。
参数被变换成可以更少的位数来进行更佳量化的LAR(log-area ratio)。
这些是传输流的前8个参数。
然后再将编码后的LAR解码成系数,并用来对输入采样值进行滤波。
解码LAR的原因是为了确保编码器使用解码器上的相同信息来进行滤波。
这一级上的其余采样值用于编解码器的LTP级。
160个采样值被分成4个子窗口,每一个子窗口都拥有40个采样值。
长期预测器为每一子窗口产生2个参数:滞后与增益。
滞后由当前帧与后两帧之间的交叉相关峰值确定,而增益则由归一化交叉相关系数决定。
滞后与增益参数被应用到长期滤波器上,同时对现有短期剩余信号进行预测。
RPE级通过十取一及交错将40个剩余采样值转换成13个参数,并用APCM 将所得出的13个值编码,其中最大值用对数编码成6位,然后再将13个参数均表示成3位,总共45位。
LPC 系数预测实验目的语音线性预测的基本思想是:一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近。
通过使实际语音抽样值与线性预测抽样值的均方误差达到最小,可以确定唯一的一组线性预测系数。
本实验要求掌握LPC 原理,利用自相关法,将语音序列加窗,然后对加窗语音进行LP 分析,编写程序求12阶线性预测系数。
实验原理1、线性预测编码LPC 算法由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,从而可以通过使实际语音和线性预测结果之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。
而这组系数就能反映语音信号的特性,可以作为语音信号特征参数来用于语音编码、语音合成和语音识别等应用中去。
假设)(n y 是一实数据列,+∞<<∞-n ,我们可以用过去时刻的N 个数据来预测当前时刻的数据)(n y , 即:+∞<<∞--=∑=n - , )()()(ˆ1Nk N k n y k a n y(1)这里)(k a N 即为预测系数。
定义预测误差)(n e 为)(ˆ)()(n yn y n e -= (2)我们将采用最小均方误差准则来选择)(k a N 的值,使得式(3)总误差N E 最小。
∑∑∑∞-∞==∞-∞=⎥⎦⎤⎢⎣⎡-+==n Nk N n N k n y k a n y n e E 212)()()()((3)这种优化参数)(k a N 的方法导致了求解如下的正则方程组N l l R l k R k ayy Nk yy N,,2, , )()()(1=-=-∑=(4)这里的)(k R yy 是序列)(n y 的自相关系数。
式(4)可写成如下的矩阵形式:N N N r a R -=⋅(5)其中[]TN N N N N a a a )(,),2(),1( =a(6) []Tyy yy yy N N R R R )(,),2(),1( =r(7)注意到)(k R yy 具有)()(j i R j i R yy yy -=-的性质,式(5)中的N R 可写成如下形式⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡----=)0()2()1()2()0()1()1()1()0(yy yy yy yy yy yy yy yy yy N R N R N R N R R R N R R R R (8) 2、Levinson-Durbin 算法Levinson-Durbin 算法是求解正则方程组中的预测系数N a 的有效算法。
语⾳信号处理第⼀章绪论第⼀章绪论1、语⾳信号?语⾳信号是具有声⾳的语⾔,⼈类表⽰信息的常⽤媒体,⼈类通信的有效⼯具。
2、语⾳信号包含的信息?1)说话内容,说什么;2)说话⼈⾝份,谁说的;3)说话⼈说话时的状态,⽣理状态、⼼理状态、情绪等。
(语⾳信号处理主要关⼼前两项)3、为什么要学习和研究语⾳信号处理技术?答:1)语⾳是⼈类最重要、最有效、最常⽤和最⽅便的交换信息的⽅式;2)让计算机能够理解⼈类的语⾔,是⼈类⾃计算机诞⽣以来就梦寐以求的想法;随着计算机的便携化,⼈们渴望摆脱键盘的束缚⽽代之以语⾳输⼊的⽅式。
⽐如苹果公司的iphone⼿机,在其最新版本4s中,推出了siri功能-即语⾳助⼿,可以通过语⾳输⼊,让其充当闹钟,⽐如还可以让它为你找出最近的咖啡厅,另外找出⾏路线往往需要输⼊不少⽂字,省事的话,报出地点,它可以调⽤google地图来找出出⾏⽅案,还可以让它播放⾳乐,发送短信等等。
3)语⾳信号技术始终与当时信息科学最活跃的前沿科学保持密切联系,并且⼀起发展。
语⾳信号处理是以语⾳语⾔学和数字信号处理为基础的涉及多⽅⾯的综合性学科,它与⼼理学、⽣理学、计算机科学、通信与信息科学以及模式识别和⼈⼯智能等学科都有着密切的关系。
对于语⾳信号处理的研究⼀直是数字信号处理技术发展的重要推进⼒量,⽽数字信号处理许多新⽅法的提出,⼜是⾸先在语⾳信号处理中获得成功,⽽后再推⼴到其他领域的。
⽐如,语⾳信号处理算法的复杂性和实时处理的要求,促进了⾼速信号处理器的设计。
⽽这些产品产⽣之后,⼜是⾸先在语⾳信号处理中得到最有效的应⽤的。
4、语⾳信号处理的发展情况1)语⾳信号处理的发展标志是在1940年产⽣的通道声码器技术,该技术打破了以往的“波形原则”,提出了⼀种全新的语⾳通信技术,即从语⾳中提取参数加以传输,在接收端重新合成语⾳。
其后,产⽣了“语⾳参数模型“的思想。
2)40年代后期,研制成功了“语谱仪”,为语⾳信号分析提供了有⼒的⼯具。
码本激励线性预测(CELP)编码3.2.7码本激励线性预测(CELP)编码码本激励线性预测(Codebook Excited Linear Prediction,cELP)编码简称为码本激励编码。
它是一种用码本(Codebook)作为激励源的编码方法。
把残差信号可能出现的、已经量化了的、按一定规则排列的各种样值事先存储在存储器中,好像一本字典一样。
每一个样值组合都有一地址码,所以这个存储器就称为码本。
收、发方各有一个同样的码本。
在线性预测的过程中,并不传输残差信号的本身,而是先在本方的码本中,榆查出与这信号最接近的样值组合的地址码,然后将这个码本的地址码发送到对方。
对方收到这个地址码,从同样的码本中取出这个地址的残差信号,然后通过滤波器得到重建的话音。
由于不传输残差信号的本身,而传输的是码本上的地址码,所以大大减少了传输的比特数,可得到低速率的编码器。
因此只要码本编得好,只要它有足够的数量而义和实际的残差信号十分接近,那么在低速率的编码下就得到较好的话音质量。
因此编一个好的码本是这种编码的关键。
码本的要求如下:①码本中的信号应与实际信号非常相近,即相差最少。
②在满足第一条的条件下,码本容量最小。
这样地址码数目少,即编码的长度最小。
③检查码本找出最接近信号(即搜索码本)的时问最短。
这样处理时间短,时延小。
码本的编制举例如下。
把话音每20ms为一帧,每帧又分为4个子帧,则每个子帧为5ms,采样率为8 000Hz,这样每个子帧共有40个样点。
40个样点经LPC预测分析后可得到残差信号,也是40个样点。
将这40个样点组合用l0比特的编码来代表,l0比特共可编出l 024种序列。
把这l 024种编码序列存储起来就可代表话音中的各种可能的残差信号,这就是码本,这个码本的容量为1024。
显然,只用1024种编码来代表40个样点的各种可能的情况是不够的。
但如果能够选择最可能的1024种情况,使它在实际运用时,合成话音的主观感觉误差最小,那么这个码本就是可以使用。
第1篇一、实验目的本次实验旨在深入理解线性预测编码(Linear Predictive Coding,LPC)的基本原理,掌握LPC在语音信号处理中的应用,并通过实际操作,验证LPC编码和解码的效果。
二、实验原理线性预测编码(LPC)是一种基于线性预测原理的语音信号压缩技术。
其基本思想是:一个语音信号的当前值可以用过去若干个语音信号的线性组合来逼近。
具体来说,假设当前语音信号的值为x[n],过去p个语音信号的值为x[n-1],x[n-2],…,x[n-p],那么可以通过以下线性方程来预测当前值:x[n] = a1x[n-1] + a2x[n-2] + … + apx[n-p]其中,a1,a2,…,ap为预测系数,也称为LPC系数。
通过最小化预测误差,即最小化实际语音信号与预测语音信号之间的差异,可以确定一组最优的预测系数。
这些预测系数可以用来压缩语音信号,因为它们可以表示语音信号的谱包络。
三、实验设备与软件1. 实验设备:计算机、麦克风、扬声器2. 实验软件:MATLAB四、实验步骤1. 数据采集:使用麦克风采集一段语音信号,并将其保存为.wav格式。
2. 预处理:对采集到的语音信号进行预处理,包括去除噪声、提取帧等。
3. LPC分析:对预处理后的语音信号进行LPC分析,估计LPC系数。
4. LPC编码:使用估计的LPC系数对语音信号进行编码,得到压缩后的语音数据。
5. LPC解码:使用编码后的语音数据进行解码,得到重建的语音信号。
6. 性能评估:对比原始语音信号和重建语音信号,评估LPC编码和解码的效果。
五、实验结果与分析1. LPC分析:通过LPC分析,可以得到一组最优的LPC系数。
这些系数可以表示语音信号的谱包络,从而实现语音信号的压缩。
2. LPC编码:使用LPC系数对语音信号进行编码,可以得到压缩后的语音数据。
实验结果表明,LPC编码后的语音数据大小可以显著减小,从而实现语音信号的压缩。
GSM语音编码2008年09月03日星期三 15:51一、语音编码由于GSM系统是一种全数字系统,话音和其它信号都要进行数字化处理,因此移动台首先要将语音信号转换成模拟电信号,以及其反变换,移动台再把这模拟电信号转换成13Kbit/s的数字信号,用于无线传输。
下面我们主要讲一下TCH全速率信道的编码过程。
目前GSM采用的编码方案是13 Kbit/s的RPELTP(规则脉冲激励长期预测),其目的是在不增加误码的情况下,以较小的速率优化频谱占用,同时到达与固定电话尽量相接近的语音质量。
它首先将语音分成20ms为单位的语音块,再将每个块用8 KHZ抽样,因而每个块就得到了160个样本。
每个样本在经过A率13比特(μ率14比特)的量化,因为为了处理A率和μ率的压缩率不同,因而将该量化值又分别加上了3个或2个的“0”比特,最后每个样本就得到了16比特的量化值。
因而在数字化之后,进入编码器之前,就得到了128Kbit/s的数据流。
这一数据流的速率太高了以至于无法在无线路径下传播,因而我们需要让它通过编码器的来进行编码压缩。
如果用全速率的译码器的话,每个语音块将被编码为260比特,最后形成了13Kbit/s的源编码速率。
此后将完成信道的编码。
在BTS侧将能够恢复13Kbit/s的源速率,但为了形成16Kbit/s的TRAU帧以便于在ABIS和ATER接口上传送,因而需再增加3Kbit/s的信令,它可用于BTS来控制远端TCU的工作,因而被称为带内信息。
这3Kbit/s将包括同步和控制比特(包括坏帧指示、编码器类型、DTX指示等)。
总之,带内信息将能使TCH,知道信息的种类(全速率语音、半速率语音、数据),以及采用何种适用的方法用于上行和下行的传输。
在TCU侧,通过为了适应PSTN网络64Kbit/s的传输,因而在它其中的码型速率转换板将完成将速率由13Kbit/s转换为64Kbit/s的工作,二、信道编码信道编码用于改善传输质量,克服各种干扰因素对信号产生的不良影响,但它是以增加比特降低信息量为代价的。
图像压缩的几种常见算法介绍1哈夫曼编码2预测编码3 LZW编码4算术编码5 变换编码1哈夫曼编码哈夫曼编码(Huffman Coding)是一种编码方式,哈夫曼编码是可变字长编码(Variable-Length Coding, VLC)的一种。
Huffman于1952年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码,一般就叫作Huffman编码。
以哈夫曼树即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。
在计算机信息处理中,“哈夫曼编码”是一种一致性编码法(又称"熵编码法"),用于数据的无损耗压缩。
这一术语是指使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。
这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。
这种方法是由David. A. Huffman发展起来的。
例如,在英文中,字母e的出现概率很高,而z的出现概率最低。
当利用哈夫曼编码对一篇英文进行压缩时,e极有可能用1比特(bit)来表示,而z则可能花去25比特(不是26)。
用普通的表示方法时,每个英文字母均占用一个字节(byte),即8位。
二者相比,e使用了一般编码的1/8的长度,z则使用了3倍多。
倘若我们能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例。
哈夫曼压缩是无损的压缩算法,一般用来压缩文本和程序文件。
哈夫曼压缩属于可变代码长度算法族。
意思是个体符号(例如,文本文件中的字符)用一个特定长度的位序列替代。
因此,在文件中出现频率高的符号,使用短的位序列,而那些很少出现的符号,则用较长的位序列。
图1 霍夫曼信源化简图2 霍夫曼编码分配过程2预测编码预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号,然后对实际值和预测值的差(预测误差)进行编码。
预测编码方法1 基本原理预测编码是一种直接利用数据间的相关性去相关,去冗余,实现数据压缩的信源编码技术。
此时,编码传输或存储的并不是信源输出的数据本身,而是当前数据的预测值与实际值之间的差值设信源输出的数据x(n)之间具有某种程度的相关性,利用这些相关性可以根据该时刻前面的某些数据做出当前数据x(n)的预测值p(n),定义两者之间的误差: e (n) =x(n)-p(n)并将d (n)称为预测误差或差值信号。
由于p(n)是利用x(n)与相邻数据之间的相关性进行估计(预测)得到的,因此,当前数据x(n)与预测值p(n)之间的预测误差所构成的差值信号序列{ d (n) }中,数据之间的相关性将减小,{ e (n) }中的信息冗余将降低。
例外,由于预测值p(n)是利用数据之间的相关性进行估计得到的,因此从统计观点来讲,多数预测值p(n)与当前数据的实际取值x(n)比较接近。
于是,虽然差值信号序列{ e (n) }的数值分布区间扩大了一倍,但是预测误差 e (n)的取值将只集中在零附近的一个较小范围内,如图所示。
理论研究表明,e (n) 的概率分布可近似为拉普拉斯(Laplace )分布,即P(e)=其中,e为差值信号e (n)的取值,为的差值信号均方值。
2 差值脉冲编码调制差值脉冲编码调制( Differential Pulse Code Modulation , DPCM)是一种最典型的限失真预测编码方法。
DPCM原理框图如下;在接收端解码恢复的再现数据为f’(x)。
于是,经过系统传输,输入数据与输出数据之间产生误差为;f (x) -f’(x)=可见,再现数据中产生的失真正是由发送端量化器的量化误差造成得,,与解码器是完全无关的。
预测模型可以是一维的,也可以是二维或多维的;可以是线性的,也可是非线性的。
下面先讨论一维线性预测方法。
设预测值为可见,相关性R k 越大,预测误差方差2e σ越小于信号方差,压缩效率也就越高3 线性预测4 量化编码前面已经指出,差值信号 e (n)呈拉普拉斯分布,利用此分布的特点,经过量化,编码便可使总的比特率减小,实现数据压缩。
可变阶数多脉冲激励线性预测语音编码方法
蒋保臣
【期刊名称】《山东大学学报:工学版》
【年(卷),期】2004(34)4
【摘要】多脉冲激励线性预测编码 (MPLPC)方法中 ,合成滤波器的阶数是固定的 .而对于某些语音帧 ,可以用较小的阶数得到相同质量的合成语音 .为了进一步压缩比特率 ,我们研究了可变阶数合成滤波器的语音编码方法 ,即根据当前语音帧的性质决定相应合成滤波器的阶数 .首先用MATLAB(MATrixLABoratory)对此方法进行了仿真 ,然后对重构语音的质量进行了讨论 ,实验证明可以用较低的比特率得到几乎相同质量的语音 .
【总页数】3页(P1-3)
【关键词】可变阶数;语音编码;多脉冲激励
【作者】蒋保臣
【作者单位】山东大学威海分校电子系
【正文语种】中文
【中图分类】TN911
【相关文献】
1.变阶码激励线性预测语音编码 [J], 马震;陈延萍
2.线性预测编码方法在噪声环境下的阶数选择研究 [J], 马道钧;余菲;李鹏
3.小波激励线性预测编码(WELP):一种新的低速语音编码方法 [J], 艾红梅;杨
行峻
4.语音信号多脉冲激励线性预测编码 [J], 傅世友;李志钧
5.多脉冲激励线性预测编码语音合成器 [J], 景为平;李志钧
因版权原因,仅展示原文概要,查看原文内容请购买。