全速率规则脉冲激励线性预测声码器
- 格式:doc
- 大小:374.00 KB
- 文档页数:4
GSM系统的语音编码采用了规则脉冲激励长期预测编码(RPE-LEP编码器,Regular Pulse Excited Long Term Prediction ),RPE-LEP编码器结合了波形编码和声码器两种技术,编码速率低且话音质量高。
原始语音信号是连续的模拟信号,经抽样、量化、编码等过程数字化之后,再送入RPE-LEP编码器,每20ms取样一次,每次输出260bit,所以语音传输全速率信道的速率为260bit/20ms=13kbit/s。
将每20ms取样输出的260bit的语音信号分成两部分,一部分是对差错敏感的,共182bit,如果这部分比特发生错误将严重影响语音质量;另一部分是对差错不敏感的,共78bit。
然后,再对重要部分的182bit 进行分类:最重要的50bit和次重要的132bit,对最重要的50bit加上3个奇偶校验比特,次重要的132bit 再加上4个尾比特。
然后,对这50+3+132+4=189bit进行R=1/2的卷积编码,此时,速率变为[(50+3+132+4)x2+78]/20ms=22.8kbit/s作为信道编码速率。
时隙的格式(普通突发脉冲序列)(见下图)在GSM的TDMA中,帧被定义为每个载频中所包含的8个连续的时隙,相当于FDMA系统中的一个频道。
在每个时隙中,信号以突发脉冲系列(burst)的形式发送。
TDMA帧号是以3.5小时(2715648个TDMA 帧)为周期循环编号的。
每个TDMA帧含8个时隙,整个帧时长约为4.615ms,每个时隙含156.25bit个突发脉冲码元,时隙时长为0.577ms。
GSM规范定义了两种不同的复帧结构,即含26帧、持续时间为120ms和含51帧、持续时间为235.385ms。
26帧的复帧包括26个TDMA 帧,持续时间为120ms,51个这样的复帧组成一个超帧。
这种复帧用于携带TCH (和SACCH加FACCH),用于语音信道及其随路控制信道,其中24个突发序列用于业务,2个突发序列用于信令。
一、填空1.移动通信的工作方式可分为单向通信方式和双向通信方式两类,而后者又分为单工通信方式.双工通信方式和半双工通信方式2.单工制通信就是指通信的双方只能交替地进行发信和收信,不能同时进行。
3.双工制通信就是指移动双方可以同时进行发信和收信,这时发信和收信必须采用不同的工作频率,称为频分双工。
4.移动通信系统中的码分多址是一种利用扩频技术所形成的不同的码序列实现的多址方式。
5.目前在数字移动通信系统中广泛使用的调制技术有连续相位调制技术和线性调制技术两大类。
6.目前移动通信系统中话音编码大致分为两类,即波形编码和参数编码。
7.移动通信网无线区群的激励方式一般分为中心激励和顶点激励。
8.移动通信网无线区群的中心激励是指基地台位于无线小区的中心,并采用全向天线实现无线小区的覆盖。
9.移动GSM网络中,选择无线小区模型的基本原则是在考虑了传播条件.复用方式.多重干扰等因素后必须满足(载干比)的要求。
10.频分双工是指通信双方同时收信.发信,这时收信与发信必须使用不同工作频率。
11.GSM中采用调制方式为(GMSK或高斯滤波最小频移键控)。
12.GSM声码器采用规则脉冲激励长期线性预测编码RPE-LPC,传输速率为13kbit/s。
13.每个发射机都有自己唯一的代码,同时接收机也知道要接收的代码,用这个代码作为信号的滤波器,接收机就能从所有其它信号的背景中恢复成原来的信息码,这个过程称为解扩。
14.半双工制是指通信双方,有一方使用双工方式,即收发信机同时工作,而另一方则采用异频单工方式。
15.TDMA系统是在每帧中可以分配不同的(时隙数)给不同的用户。
16.移动通信中的干扰有邻道干扰.同频道干扰.互调干扰。
17.移动基站控制器—BSC是基地系统—BSS的控制部分,在BSS 中起交换作用。
18.移动短消息中心的主要功能是接收.存储和转发用户的短信息。
19.移动操作维护中心,用于对GSM系统的交换实体进行管理。
多媒体技术与应用简答题1、Authorware主界面由标题栏、菜单栏、工具栏、和组成。
正确答案:【图标栏|设计窗】2、多媒体触摸屏分为四种,分别为电阻式、红外线式、和。
正确答案:【电容感应式|表面声波式】3、帧中第一个字节进入网络的瞬间、到此字节离开网络的瞬间所经历的时间称为。
正确答案:【延迟】4、传送等待时间正确答案:【传送等待时间是指帧中的第一个字节进入网络|到最后一个字节离开网络所需要的时间)。
】5、码激励线性预测声码器正确答案:【是|1985年提出的,一种以码本作为激励源的线性预测编码技术|它的语音合成质量高,抗噪声好,在低速率语音方面有广泛应用。
】6、矢量图正确答案:【用一组指令集合来描述图形的内容,这些指令用来描述构成该图形的所有直线、圆、圆弧、矩形、曲线等图元的位置、维数和形状等。
要点:文件数据量小。
】7、超文本正确答案:【超文本定义为由信息结点和表示结点间相关性的链构成的一个具有一定逻辑结构和语义的网络。
超文本的主要成分是结点和表示结点间关系的链构成的信息网络。
】8、什么是虚拟现实技术?正确答案:【虚拟现实是一项与多媒体密切相关的边缘技术,它通过综合应用图像处理、模拟与仿真、传感、显示系统等技术和设备,以模拟仿真的方式|给用户提供一个真实反映操作对象变化与相互作用的三维图像环境|从而构成一个虚拟世界,并通过特殊的输入输出设备给用户一个与该虚拟世界相互作用的三维交互式用户界面。
】9、简述多媒体作品开发的一般过程。
正确答案:【包括需求分析|规划设计|素材的采集和加工、作品的集成、测试、发布和评价。
】10、列举常见的图像文件格式正确答案:【BMP|JPG|GIF|TIFF,PSD,PNG 】11、地球站,是指设在地球表面上的。
正确答案:【无线电通信站】12、H.323终端都必须支持语音通信,和数据通信可选。
正确答案:【视频】13、音乐检索是以音乐为中心的检索,利用音乐的音符和等特性来检索。
移动通信工程第一章移动通信概述一、填空题1.移动通信的工作方式可分为单向通信方式和双向通信方式两大类别,而后者又分为单工通信方式、双工通信方式和(半双工)通信方式三种。
2.单工制通信就是指通信的双方只能(交替)地进行发信和收信,不能同时进行。
3.双工制通信就是指移动通信双方可(同时)进行发信和收信,这时收信与发信必须采用不同的工作频率,称为频分双工。
4.移动通信系统中的码分多址是一种利用扩频技术所形成的不同的(码序列)实现的多址方式。
5.目前在数字移动通信系统中广泛使用的调制技术主要有(连续相位)调制技术和线性调制技术两大类。
6.目前移动通信系统中话音编码大致可以分成两大类,即波形编码和(参数)编码。
7.移动通信网无线区群的激励方式一般分为中心激励和(顶点)激励。
8.移动通信网无线区群的中心激励是指基地台位于无线小区的中心,并采用(全向天线)实现无线小区的覆盖。
9.移动GSM网络中,选择无线小区模型的基本原则是在考虑了传播条件、复用方式、多重干扰等因素后必须满足(载干比)的要求。
10、频分双工是指通信双方同时收信、发信,这时收信与发信必须使用不同(工作频率)。
11、GSM中采用调制方式为(GMSK或高斯滤波最小频移键控)12、GSM声码器采用规则脉冲激励长期线性预测编码RPE-LPC,传输速率为(13kbit/s)13、每个发射机都有自己唯一的代码,同时接收机也知道要接收的代码,用这个代码作为信号的滤波器,接收机就能从所有其他信号的背景中恢复成原来的信息码,这个过程称为(解扩)14、半双工制是指通信双方,有一方使用双工方式,即收发信机同时工作,而另一方则采用(双频单工)方式。
15、TDMA系统是在每帧中可以分配不同的(时隙数)给不同的用户16、一方面要求馈线的衰耗要小,另一方面其阻抗应尽可能与发射机的输出阻抗和天线的输入阻抗(相匹配)17、馈线的主要作用是把发射机输出的射频载波信号高效地送至天线,一方面要求馈线的衰耗要(小),另一方面其阻抗应尽可能与发射机的输出阻抗和天线的输入阻抗相匹配。
CDMA技术原理及主要特点CDMA是Code Division Multiple Access的英文缩写,中文翻译为码分多址。
CDMA是用于数字蜂窝移动通信的一种先进的无线扩频通信技术,它能满足近年来运营者对大容量、廉价、高质量的移动通信系统的需求。
CDMA中的多址可以被理解为一个滤波问题,多个用户同时使用同一频谱,然后采用不同的滤波器和处理技术,将不同用户的信号互不干扰地接收和解调出来。
移动通信一般采用三种多址方式:FDMA(频分多址)、TDMA(时分多址)和CDMA(码分多址)。
FDMA就是信号功率被集中在频域中一个相对的窄带中传输,不同信号被分配到不同频率的信道里,发往和来自邻近信道的干扰用带通滤波器限制,这样在规定的窄带里只能通过有用信号的能量,而任何其他频率的信号被排斥在外。
模拟的FM蜂窝系统采用的就是FDMA方式。
TDMA就是一个信道由一连串周期性的时隙构成,不同信号的能量被分配到不同的时隙里,利用定时选通来限制邻道的干扰,从而只让在规定时隙中有用的信号能量通过。
现在使用的TDMA蜂窝系统实际上都是FDMA和TDMA的组合。
CDMA 就是每一个信号被分配一个伪随机二进制序列进行扩频,不同信号的能量被分配到不同的伪随机序列里。
在接收机里,信号用相关器加以分离,相关器只接收选定的二进制序列并压缩其频谱,将有用信号的信息识别和提取出来。
CDMA技术作为一种抗干扰的通信手段,很早就在军事通信中得到了应用,但是将CDMA技术应用于民用的数字蜂窝移动通信系统,还是80年代末才由美国Qualcomm公司实现的。
QCDMA系统中采用了许多先进的技术从而保证了系统性能的优势,其标准称为IS-95系列,包含多个标准。
多径衰落是移动通信系统需要克服的主要问题,CDMA系统采用了多种形式的分集,从而很好地解决了这一问题。
CDMA系统采用符合交织、检错和纠错编码等方法实现了时间分集;CDMA系统的信号带宽是1.25MHz,起到了频率分集的作用;基站使用多付接收天线,基站和移动台都使用了Rake 接收机技术,软切换时,移动台和基站同时联系,从中选取最好的信号送给交换机,从而起到了空间分集的作用。
传输附属设备包括码转换器(TC)、子复用器(SM)和基站接口设备(BIE)。
TC 单元在GSM系统中实现GSM用户和PSTN(公共交换电话网)用户间的通信。
SM 单元主要功能是将4 个16 kbit/s信道复用到一个64 kbit/s信道上,从而节省地面传输链路,大多数情况下,将A接口的90个话音业务信道复用到一个PCN 2Mbit/s传输线上。
当BSC和BTS远距离连接(大于15m)时,使用BIE支持的A 接口。
GSM系统主要接口协议分层为信令层1(L1)、信令层2(L2)和信令层3(L3)。
信令层1也称物理层,为信令传输提供物理链路,为高层协议建立相应的控制逻辑信道。
A 接口的物理层是基于PCM 30/32路2 048Mbit/s A律13折线编码的PCM(脉冲编码调制)一次群通道,有32个时隙,每个时隙传输64kbit/s 的信令或业务信息。
目前GSM采用的编码方案是13 Kbit/s的RPELTP(规则脉冲激励长期预测),其目的是在不增加误码的情况下,以较小的速率优化频谱占用,同时到达与固定电话尽量相接近的语音质量。
它首先将语音分成20ms为单位的语音块,再将每个块用8 KHZ抽样,因而每个块就得到了160个样本。
每个样本在经过A率13比特(μ率14比特)的量化,因为为了处理A率和μ率的压缩率不同,因而将该量化值又分别加上了3个或2个的“0”比特,最后每个样本就得到了16比特的量化值。
因而在数字化之后,进入编码器之前,就得到了128Kbit/s的数据流。
这一数据流的速率太高了以至于无法在无线路径下传播,因而我们需要让它通过编码器的来进行编码压缩。
如果用全速率的译码器的话,每个语音块将被编码为260比特,最后形成了13Kbit/s 的源编码速率。
此后将完成信道的编码。
在BTS侧将能够恢复13Kbit/s的源速率,但为了形成16Kbit/s的TRAU帧以便于在ABIS和ATER接口上传送,因而需再增加3Kbit /s的信令,它可用于BTS来控制远端TCU的工作,因而被称为带内信息。
语音信号处理是研究数字信号处理技术对语音信号进行处理的一门科学语音:是声音和语言的结合体,是一连串的音组成的语言的声音。
人的说话过程:想说,说出,传送,接收,理解。
句法的最小单位是单词,词法的最小单位是音节。
语音特征:音色,音调,音强,音长。
语音音素:元音和辅音。
辅音包括浊音(声带振动)和清音共振xx:元音激励进入声道时引起共振特性,产生一组共振频率。
基音频率:浊音的声带振动的基本频率。
汉语是一种声调语言,声调具有辩义作用。
声调的变化就是浊音基音周期的变化。
汉语音节的一般结构:声带,韵母,声调对发音影响最大的是声带。
基音周期:声带每开启和闭合一次的时间,倒数就是基音频率。
语音听觉系统:耳:内耳(将机械信号转化为神经信号),中耳(声阻抗变换),外耳(声源定位和声音放大)。
掩蔽效应:在一个强信号附近,弱信号将变得不可闻。
被掩蔽掉的不可闻信号的最大声压级称为掩蔽门限或掩蔽阈值。
掩蔽效应:同时掩蔽和短时掩蔽。
同时掩蔽:存在一个弱信号和一个强信号频率接近,强信号会提高弱信号的听阀,当弱信号的听阀被升高到一定程度就会导致这个弱信号弱不可闻。
短时掩蔽:当A声和B声不同时存在时也存在掩蔽作用,称为短时掩蔽。
语音信号生成的数学模型:激励模型(一般分为浊音激励和清音激励),声道模型(一般分为声管模型和共振峰模型,共振峰模型又分为三种:级联,xx,混合型),辐射模型。
浊音激励模拟成是一个以基音周期为周期的斜三角脉冲串。
可以把清音模拟成随机白噪声。
完整的语音信号的数学模型的传输函数H(z) = AU(z)V(z)R(z).一阶高通形式的R(z)=R0(1-z^(-1))把和时序相关的傅里叶分析的显示图形称为语谱图。
语谱图是一种三维频谱,它是表示语音频谱随时间变化的图形。
第三章:语音信号分析1.参数性质不同:时域,频域,倒频域。
分析方法:模型分析法(根据语音信号产生的数学模型来分析和提取表征这些模型的特征参数)和非模型分析法(时域,频域,倒频域)。
1.移动通信网小区制中小区和其他小区可重复使用频率,称为频率复用。
2.中心激励指基地台位于无线小区的中心,并采用全向天线实现无线小区的覆盖。
3.基站收发信台(BTS)(不与BSC并置)与基站控制器(BSC)之间的远端互连方式的通信接口是Abis接口。
4.GSM基站台主要有两个接口,一个是面向移动台的,一个是面向基站控制器的,面向移动台的是UM接口。
5.我国陆地公用蜂窝数字移动通信网GSM通信系统890MHz,采用900MHz频段。
6.GSM900双工间隔45MHz。
7.GSM1800双工间隔为95MHz。
8.GSM900系统载频间隔45MHz。
9.GSM声码器采用编码方式为RPE-LPC。
10.CDMA系统为每个用户分配了各自特定的地址码,它可在一个信道上同时传输多个用户信息。
11.“小区内切换”使通话中切换到同一小区的另一信道称为可能。
12.SDCCH信道的切换与TCH的切换相同。
13.如果在网络信号覆盖范围的某一特定区域,移动电话是由一个或多个基站处理,并且手机在此区域内移动时,并不需要告知网络更新位置,那么此部分区域即为一个位置区。
14.手机更新同期参数若高为“10”,则更新周期为60分钟。
15.位置更新是由MS发起的。
16.同一BSC内切换时,手机调谐到新的频率并在相应时隙上发送切换接入突发脉冲,BTS检测到该切换接入脉冲,将时间提前发送给手机,这个信令信息在信道FACCH上发送。
17.当向一个空闲手机发送短消息时,要用到SDCCH信道。
18.当手机空闲时,会在BCCH信道上收集系统信息,这使得手机能够获得当前服务小区所属位置区的识别码。
19.当手机使用时,通过SACCH信道获得新的位置区识别码。
20.当移动用户作被叫时,主叫用户所拨的号码是MSISDN。
21.移动通信的工作方式可分为单向通信方式和双向通信方式两大类别,而后者又分为单工通信方式、双工通信方式和半双工通信方式三种。
22.移动通信网无线区群的激励方式一般分为中心激励和顶点激励。
CDMA 的工作原理与分析200920722032闫曦CDMA (Code Division Multiple Access )即码多分址,是一种信道复用技术,它允许每个用户在同一时刻同一信道上使用同一频带进行通信。
同时它也是一种以码分多址接入技术为基础的数字蜂窝移动通信系统。
码分多址系统是一扩频技术为基础,所谓扩频是以把信息的频谱扩展到宽带的传输技术,将扩频技术应用于通信系统中,可以加强系统的抗干扰、抗多径、隐藏、保密和多址能力。
适用于码多分址蜂窝通信系统的扩频技术是直接序列扩频(DS )简称直扩。
它的产生包括调制和扩频两个步骤。
比如,先用要传送的对载波进行调制,再用伪随机序列(PN 序列)扩展信号频谱;也可以先用伪随机序列与信息相乘(把信息的频谱扩展),在对载波进行调制,二者是等效的。
在CDMA 系统中,不同用户传送的信息是靠各自不同的编码序列来区分的。
虽然信号在时间域和频率域是重叠的,但用户信号可以依靠各自不同的编码来区分。
IS-95标准的全称是“双规模宽带扩频蜂窝系统的移动台-基站兼容标准”,这说明IS-95标准是一个公共空中接口(CAI )。
它没有完全规定一个系统如何实现,而只是提出了心灵协议和数据结构的特点和限制,不同的制造商可采取不同的技术和工艺制造出符合IS-95标准规定的系统和设备。
与其他蜂窝标准不同的是,根据话音激活和系统网络要求,IS-95的用户数据速率(不是信道码片速率)要实时的改变。
而且,IS-95的上行链路和下行链路采用不同的调制和扩频技术。
在下行链路上,基站通过采用不同的扩频序列同时发送小区内全部用户的用户数据,使得所有移动台在估计信道条件时,可以使用相干载波检测。
在上行链路上,所有移动台以异步方式响应,并且由于基站的功率控制,理想情况下,每个移动台具有相同的信号电平值。
IS-95系统采用的话音编译器是美国高通公司自行研制的9600bps 码激励线性预测声码器(QCELP ),该声码器检测到话音后就被激活,并在静默期间将数据速率降至1200bps ,中间数据速率为2400、4800和9600bps ,当然数据速率也可以自行设定。
GSM语音编码2008年09月03日星期三 15:51一、语音编码由于GSM系统是一种全数字系统,话音和其它信号都要进行数字化处理,因此移动台首先要将语音信号转换成模拟电信号,以及其反变换,移动台再把这模拟电信号转换成13Kbit/s的数字信号,用于无线传输。
下面我们主要讲一下TCH全速率信道的编码过程。
目前GSM采用的编码方案是13 Kbit/s的RPELTP(规则脉冲激励长期预测),其目的是在不增加误码的情况下,以较小的速率优化频谱占用,同时到达与固定电话尽量相接近的语音质量。
它首先将语音分成20ms为单位的语音块,再将每个块用8 KHZ抽样,因而每个块就得到了160个样本。
每个样本在经过A率13比特(μ率14比特)的量化,因为为了处理A率和μ率的压缩率不同,因而将该量化值又分别加上了3个或2个的“0”比特,最后每个样本就得到了16比特的量化值。
因而在数字化之后,进入编码器之前,就得到了128Kbit/s的数据流。
这一数据流的速率太高了以至于无法在无线路径下传播,因而我们需要让它通过编码器的来进行编码压缩。
如果用全速率的译码器的话,每个语音块将被编码为260比特,最后形成了13Kbit/s的源编码速率。
此后将完成信道的编码。
在BTS侧将能够恢复13Kbit/s的源速率,但为了形成16Kbit/s的TRAU帧以便于在ABIS和ATER接口上传送,因而需再增加3Kbit/s的信令,它可用于BTS来控制远端TCU的工作,因而被称为带内信息。
这3Kbit/s将包括同步和控制比特(包括坏帧指示、编码器类型、DTX指示等)。
总之,带内信息将能使TCH,知道信息的种类(全速率语音、半速率语音、数据),以及采用何种适用的方法用于上行和下行的传输。
在TCU侧,通过为了适应PSTN网络64Kbit/s的传输,因而在它其中的码型速率转换板将完成将速率由13Kbit/s转换为64Kbit/s的工作,二、信道编码信道编码用于改善传输质量,克服各种干扰因素对信号产生的不良影响,但它是以增加比特降低信息量为代价的。
语音编码总结一、历史与概念1、模拟的声音信号话音信号:(口语发声的)200Hz~3400Hz调幅广播信号:(无线广播)50Hz到7000Hz调频广播信号:(无线广播)20Hz到16000Hz激光唱机信号(CD):10Hz~20000Hz2、话音编码技术的历史回顾10 20 50 200 3400 7000 1600 20000 Hz话音编码研究的历史表明,这一领域的研究成果直接为通信产业发展提供了源动力。
目前IP电话所用的编码的标准有G.723.1, G.728, G.729。
具有低延迟、低码率、低复杂性、高音质的话音编码算法将是未来IP电话网络的奠基石。
3、若干概念术语(1)数字信号:标称的不连续信号。
它可以用离散的步差从一个状态转变到另一个状态。
(2)采样:按周期T对模拟信号进行测量,称为采样。
采样频率Fs=1/T.在满足奈奎斯特定理时,从采样值可准确的恢复原信号。
(3)量化用数字信号表示话音的过程称为量化。
(4)非均匀量化非均匀量化可以兼顾动态范围和小信号的系统精度。
Reeves提出概念。
即对大信号取较大的量化步长。
对小信号取较小的量化步长。
二、矢量量化将k个样点构成的有序集(信源矢量集合)映射为M个恢复失量构成的有限集A(码书,码本)中的某个矢量Yi(码字,码元)的映射,称为矢量量化,它是对标量量化在K维空间的一个推广。
1、码本设计的LBG方法(1)在矢量空间X中,进行最佳划分,即,把X划分成M个子空间Si i=,1.2….m 使平均失真最小。
(2)对划分后的子空间Si求出其形心作为新的最佳代表矢量Yi,从而构成新的码本。
将上述步骤反复迭代,最终求出最佳码本和量化器。
(3)初始码本的选择:A、随机选取,迭代时间较长B、分裂法(4)LBG方法不是最优化方法,即迭代过程不能保证收敛到全局最小值。
后来有人提出模拟退火法,将LBG方法收敛到局部最小值时,采用某种扰动将迭代过程继续进行下去。
2、空间分布对矢量量化的影响LBG算法把问题简化为:在矢量空间中,样点的分布是均匀的。
amr声码器功能原理AMR采用了多速率码激励线性预测(MR-ACELP)编码技术。
这种方式基于码激励线性预测(CELP)编码模式,用全极点线性滤波器模拟语音特性。
AMR声码器以20ms的语音作为一帧进行处理,每一帧又分为4个5ms的子帧。
AMR声码器可以工作于8种不同的比特速率模式,并且在每帧的边界处可以在8种源速率之间进行切换。
AMR声码器由以下几个部分组成:多速率语音编码器,源速率控制方案(包括语音激励检测器和舒适噪声生成系统),对抗传输错误和丢包带来的影响的差错隐藏机制。
1.语音编码(1) 预处理语音信号在编码之前要经过高通滤波和信号缩减。
信号缩减就是将输入信号除以2,以减小实现定点算法时发生溢出的可能。
高通滤波是为了去除不需要的低频分量,滤波器的截止频率为80Hz。
(2) 线性预测分析和量化12.2 kbit/s模式下,短时预测(线性预测)分析每帧执行两次,得到两组线性预测系数,采用30ms不对称窗计算自相关,没有前向预测。
其余模式下,短时预测分析每帧执行一次,得到一组线性预测系数,也采用30ms不对称窗计算自相关,但要用到40个采样值(5ms)的前向预测。
加窗语音的自相关结果采用Levinson-Durbin算法转换成线性预测(LP)系数,LP系数再变换为线谱对(LSP)以用于量化和插值。
插值后的量化和未量化系数转换回LP 系数,以在每个子帧建立综合和加权滤波器。
(3)自适应码本自适应码本搜索是以子帧为单位进行的,它包括:闭环基音搜索,计算自适应码向量。
其中,计算自适应码向量是求得基音延时后对过去的激励进行插值得到的。
自适应码本参数(基音参数)是基音滤波器的延时和增益。
在实现基音滤波器的自适应码本方式中,激励以小于子帧长度的延时重复。
在搜索阶段,激励由LP余量信号进行扩展而得,以简化闭环搜索。
如果检测到LPC滤波器可能发生谐振,并且未量化的自适应码本增益超过了增益阈限GPth=0.95,就要计算平均自适应码本增益。
全速率规则脉冲激励线性预测声码器(RPE-LPC)
全速率规则脉冲激励线性预测声码器(RPE-LPC)语音编解码器是改良的线性预测编码器(LPC),它将人类声域建模成一系列不同宽度的圆柱体。
通过迫使空气通过这些柱体,即可产生语音。
LPC编码器用一组联立方程来进行建模。
标准LPC编码器不能提供电话系统所需的话音质量(虽能听清语句,但很难或不可能分辨出说话的人)。
GSM系统中采用两种技术来提高LPC编码器的质量,即:长期预测(LTP)与规则脉冲激励(RPE),而全速率编解码器就被称为RPE-LTP线性预测编码器。
输入至RPE-LTP编码器的数据为包括160个采样值的20ms语音,每一个采样值都拥有13位精度。
数据首先通过预加重滤波器来提高信号的高频分量,以获得更好的传输效率。
滤波器一般还消除信号上的任何偏移以简化进一步的计算。
语音产生模型可看成是空气通过一组不同大小的圆柱体。
短期分析级采用自动相关来计算与模型所用的8个圆柱体有关的8个反射系数,同时采用一种称为Schur递归的技术来有效地求解所得到的方程组。
参数被变换成可以更少的位数来进行更佳量化的LAR(log-area ratio)。
这些是传输流的前8个参数。
然后再将编码后的LAR解码成系数,并用来对输入采样值进行滤波。
解码LAR的原因是为了确保编码器使用解码器上的相同信息来进行滤波。
这一级上的其余采样值用于编解码器的LTP级。
160个采样值被分成4个子窗口,每一个子窗口都拥有40个采样值。
长期预测器为每一子窗口产生2个参数:滞后与增益。
滞后由当前帧与后两帧之间的交叉相关峰值确定,而增益则由归一化交叉相关系数决定。
滞后与增益参数被应用到长期滤波器上,同时对现有短期剩余信号进行预测。
RPE级通过十取一及交错将40个剩余采样值转换成13个参数,并用APCM 将所得出的13个值编码,其中最大值用对数编码成6位,然后再将13个参数均表示成3位,总共45位。
最后一级是从计算出的长期剩余及分析信号来更新短期剩余信号,然后再用此数据来计算下一帧。