GSM系统语音编码器综述
- 格式:doc
- 大小:99.50 KB
- 文档页数:6
GSM系统的语音编码采用了规则脉冲激励长期预测编码(RPE-LEP编码器,Regular Pulse Excited Long Term Prediction ),RPE-LEP编码器结合了波形编码和声码器两种技术,编码速率低且话音质量高。
原始语音信号是连续的模拟信号,经抽样、量化、编码等过程数字化之后,再送入RPE-LEP编码器,每20ms取样一次,每次输出260bit,所以语音传输全速率信道的速率为260bit/20ms=13kbit/s。
将每20ms取样输出的260bit的语音信号分成两部分,一部分是对差错敏感的,共182bit,如果这部分比特发生错误将严重影响语音质量;另一部分是对差错不敏感的,共78bit。
然后,再对重要部分的182bit 进行分类:最重要的50bit和次重要的132bit,对最重要的50bit加上3个奇偶校验比特,次重要的132bit 再加上4个尾比特。
然后,对这50+3+132+4=189bit进行R=1/2的卷积编码,此时,速率变为[(50+3+132+4)x2+78]/20ms=22.8kbit/s作为信道编码速率。
时隙的格式(普通突发脉冲序列)(见下图)在GSM的TDMA中,帧被定义为每个载频中所包含的8个连续的时隙,相当于FDMA系统中的一个频道。
在每个时隙中,信号以突发脉冲系列(burst)的形式发送。
TDMA帧号是以3.5小时(2715648个TDMA 帧)为周期循环编号的。
每个TDMA帧含8个时隙,整个帧时长约为4.615ms,每个时隙含156.25bit个突发脉冲码元,时隙时长为0.577ms。
GSM规范定义了两种不同的复帧结构,即含26帧、持续时间为120ms和含51帧、持续时间为235.385ms。
26帧的复帧包括26个TDMA 帧,持续时间为120ms,51个这样的复帧组成一个超帧。
这种复帧用于携带TCH (和SACCH加FACCH),用于语音信道及其随路控制信道,其中24个突发序列用于业务,2个突发序列用于信令。
GSM系统中的语音编码
吴庆翔;夏风
【期刊名称】《电信快报》
【年(卷),期】1996(000)011
【摘要】GSM数字移动通信系统中采用RPE-LTP编码器,该编码器对输入的13比特线性PCM码进行处理,使其在语音质量没有很大下降的情况下,将码速降到13kb/s,本文即对RPE-LTP编码器的工作过程作比较详细的介绍。
【总页数】4页(P9-12)
【作者】吴庆翔;夏风
【作者单位】不详;不详
【正文语种】中文
【中图分类】TN929.5
【相关文献】
1.GSM系统的语音编码技术浅析 [J], 张敏
2.GSM系统中的语音质量增强技术 [J], 陈慧剑
3.语音增强技术在低速语音编码中的应用 [J], 蒋海霞;成立新;陈显治
4.低码率语音编码中过渡帧对合成语音的影响 [J], 肖东;莫福源;陈庚;马力
5.语音相位听觉特性在正弦模型语音编码中的运用 [J], 曹燕;张军;宁更新;韦岗因版权原因,仅展示原文概要,查看原文内容请购买。
GSM数字移动通信系统语音信源编解码技术王红军1,钟子发1,陈润洁2(1电子工程学院,安徽合肥230037;2合肥通用所,安徽合肥230031)摘要:依据GSM协议,介绍了GSM系统所采用的语音信源RPE-LTP(规则码激励长期预测)编码技术,详细阐述了相应的信源解码模型和解码算法,并在工程实现中对算法性能进行了大量的测试,验证了解码模型的可行性和算法的有效性。
关键词:GSM;信源编码;信源解码;RPE-LTP一、引言GSM(Global System for Mobile Communication)数字移动通信系统中的核心问题是有效性、可靠性和安全性。
信源编码解决的是有效性。
由于移动通信属于无线通信,在无线通信中有效性的要求更加突出,这是因为无线信道的频率资源是有限的。
提高移动通信的有效性可以在不同的层次来实现,本文着重讨论在物理层的实现技术。
信源编码是产生信源数据的源头,利用信源的统计特性,解除信源的相关性,去掉信源多余的冗余信息,以达到压缩信源信息率,提高系统有效性的目的。
在GSM移动通信系统中,语音信源编码是为了保障语音通信的有效性。
本文在完成对语音编解码分析的基础上,工程实现了语音解码技术,技术的突破点就在于解码算法的实际工程应用。
二、GSM语音信源编码技术分析[1,2]GSM数字移动通信系统采用13kbit/s RPE-LTP语音编码技术,包括预处理、线性预测编码(LPC)分析、短时分析滤波、长时预测和规则码激励编码等5个主要部分,如图1所示。
1预处理首先用8k H z采样频率对输入的模拟语音信号进行采样得到离散话语音信号S 0(n),滤除S(n)中的直流分量,得到S0f(n);其次采用一阶有限冲激响应(FIR)滤波器进行高频预加重,得到信号S(n),加重的目的是加强语音谱中的高频共振峰,使语音短时谱及线性预测LPC分析中余数谱变得更平坦,从而提高谱参数估值的精确性。
2LPC分析将信号S(n)的每160个样点(20ms)分为一帧,每帧计算出8个LPC反射系数r(i),i=1,2,…,8。
GSM移动通信系统的语音编码技术研究Speech Coding Techniques of GSM Mobile CommunicationSystem目录内容摘要 (I)Abstract............................................................................................................................... I I 第一章引言 .. (1)第二章GSM移动通信系统 (2)§2.1 GSM移动通信系统简介 (2)§2.2 GSM移动通信系统的总体结构 (2)§2.2.1 移动台(Mobile Station) (2)§2.2.2 基站子系统BSS(Base Station Sub-system) (2)§2.2.3 网络子系统NSS(Network Sub-system) (2)§2.2.4 操作支持子系统OSS(Operations Sub-system) (3)第三章GSM系统的语音编码简介 (4)第四章语音编码的发展现状 (5)第五章语音编码质量的评定 (7)§5.1 客观评定方法 (7)§5.2 主观评定方法 (7)§6.1 语音编码技术的分类 (8)§6.1.1 波形编码 (8)§6.1.2 声码器 (9)§6.1.3 混合编码 (10)§6.2 分析GSM系统中的语音编码技术—多脉冲激励LPC (10)§6.2.1 多脉冲激励LPC编码器的组成 (11)§6.2.2 编码过程 (11)§6.2.3 多脉冲激励LPC译码器的组成 (11)第七章语音编码芯片 (12)第八章语音编码技术进展 (13)结束语 (14)参考文献 (15)致谢 (16)内容摘要由于GSM系统的技术成熟、管理灵活、完善的技术规范,在欧洲取得很大的成功之后,在世界上许多国家更是得到广泛的应用,已成为陆地公用移动通信系统的主要系统。
GSM语音编码2008年09月03日星期三 15:51一、语音编码由于GSM系统是一种全数字系统,话音和其它信号都要进行数字化处理,因此移动台首先要将语音信号转换成模拟电信号,以及其反变换,移动台再把这模拟电信号转换成13Kbit/s的数字信号,用于无线传输。
下面我们主要讲一下TCH全速率信道的编码过程。
目前GSM采用的编码方案是13 Kbit/s的RPELTP(规则脉冲激励长期预测),其目的是在不增加误码的情况下,以较小的速率优化频谱占用,同时到达与固定电话尽量相接近的语音质量。
它首先将语音分成20ms为单位的语音块,再将每个块用8 KHZ抽样,因而每个块就得到了160个样本。
每个样本在经过A率13比特(μ率14比特)的量化,因为为了处理A率和μ率的压缩率不同,因而将该量化值又分别加上了3个或2个的“0”比特,最后每个样本就得到了16比特的量化值。
因而在数字化之后,进入编码器之前,就得到了128Kbit/s的数据流。
这一数据流的速率太高了以至于无法在无线路径下传播,因而我们需要让它通过编码器的来进行编码压缩。
如果用全速率的译码器的话,每个语音块将被编码为260比特,最后形成了13Kbit/s的源编码速率。
此后将完成信道的编码。
在BTS侧将能够恢复13Kbit/s的源速率,但为了形成16Kbit/s的TRAU帧以便于在ABIS和ATER接口上传送,因而需再增加3Kbit/s的信令,它可用于BTS来控制远端TCU的工作,因而被称为带内信息。
这3Kbit/s将包括同步和控制比特(包括坏帧指示、编码器类型、DTX指示等)。
总之,带内信息将能使TCH,知道信息的种类(全速率语音、半速率语音、数据),以及采用何种适用的方法用于上行和下行的传输。
在TCU侧,通过为了适应PSTN网络64Kbit/s的传输,因而在它其中的码型速率转换板将完成将速率由13Kbit/s转换为64Kbit/s的工作,二、信道编码信道编码用于改善传输质量,克服各种干扰因素对信号产生的不良影响,但它是以增加比特降低信息量为代价的。
GSM全速率语音编码算法分析及DSP实现
何琴;李小文
【期刊名称】《计算机应用与软件》
【年(卷),期】2008(025)011
【摘要】通过分析GSM全速率语音编码算法(RPE-LTP)的原理和特征,在实际应用中提出优化算法的两种方法.采用ADPCM改进算法的规则脉冲编码部分,使编码速率从13Kbit/s降为9Kbit/s;根据TMS320C55x DSP的特点,通过使用程序级别优化、去除不必要函数调用、优化判断语句等方法进行了代码优化.优化后算法的运算速度是19.63MCPS,需要11.9KW 的程序空间和6.8KW 的数据空间.从实验结果看,经优化后的程序在内存占用和运算复杂度方面都达到了预期目标,语音信号经编码器编码解码之后失真很小.
【总页数】3页(P123-124,175)
【作者】何琴;李小文
【作者单位】重庆邮电大学计算机科学与技术学院,重庆,400065;重庆邮电大学【正文语种】中文
【中图分类】TP3
【相关文献】
1.2.4kbps MELP低速率语音编码算法的DSP实现 [J], 曾芳;赵继勇;刘亚峰
2.2.4kbps MELP低速率语音编码算法的DSP实现 [J], 曹芳;赵继勇;刘亚峰
3.基于DSP的甚低速率语音编码算法及其实现 [J], 赵继勇;曹芳;梁妙元;刘亚峰
4.GSM全速率语音编码中Schur递归算法的FPGA实现 [J], 胡建新;易清明
5.GSM全速率语音编码中Schur递归算法的FPGA实现 [J], 胡建新;易清明因版权原因,仅展示原文概要,查看原文内容请购买。
通信领域中语音编码技术综述语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段,也是人类进行思维的一种依托。
语音业务的传输始终是通信系统中最重要、最基本的核心功能之一,即便是在倡导多媒体业务的第三代甚至第四代数字移动通信系统中,语音业务也仍然是其主导业务。
语音编码是语音信号处理的一个重要方面,它和通信领域联系最为密切。
而语音识别、语音合成、语音增强等方面在理论和方法上与语音编码有很多相通之处。
因此,系统、全面地了解当今语音信号压缩编码的原理和方法,对语音通信领域工作的开展具有重要意义。
语音编码技术大致可以分为三种方式:波形编码、参数编码和混合编码。
1、波形编码波形编码一般分为时域波形编码和变换域波形编码。
1) 时域波形编码时域波形编码不基于声学模型,只针对语音波形进行编码。
这种方法在降低量化每个语音样本比特数的同时又保持了相对良好的语音质量,波形编码主要有脉冲编码调制(PCM)、增量调制 (DM)、自适应增量调制(ADM)、自适应差分脉码调制 (ADPCM)、自适应预测编码(APC)等。
线性PCM是用同等的量化级进行量化,没有利用声音的性质,所以信息没有得到压缩,对数PCM利用了语音信号幅度的统计特性,对幅度按对数变换压缩,将压缩的结果作线性编码,在接收端解码时,按指数进行扩展,这种方法在数字电话通信中得到了广泛的应用,现有的PCM采用编码速率为64kbps的A律、μ律对数压扩方法。
由于对数PCM广泛应用于通信系统中,而线性PCM可以直接进行二进制运算,所以一般速率低于64Kbps的语音编码系统多是先进行对数PCM-线性PCM变换后,再进行语音信号数字处理。
PCM最大缺点是数码率高,在传输时所占频带较宽。
差分脉码调制(DPCM)是根据相邻采样值的差值信号进行编码,ADPCM是在DPCM的基础上发展起来的,其量化器与预测器的参数能根据输入信号的统计特性自适应于最佳或接近于最佳参数状态。
GSM语音编码方案1. 引言GSM(Global System for Mobile Communications,全球移动通信系统)是目前全球主流的第二代数字移动通信标准。
GSM网络提供低功率的无线通信服务,被广泛应用于手机通信、无线数据传输、短信及多媒体信息传递等领域。
在GSM网络中,语音编码方案是非常关键的部分。
本文将介绍GSM语音编码方案的基本原理,主要特点和应用。
2. 基本原理GSM语音编码方案基于线性预测编码(Linear Predictive Coding,简称LPC)和自适应多速率编码(Adaptive Multi-Rate,简称AMR)技术。
LPC是一种基于信号采样的编码技术,通过对语音信号进行分析和压缩,实现对语音信号的传输和存储。
它利用线性预测模型对语音信号进行建模,然后通过削减模型中的冗余信息,降低信号的冗余度,以达到压缩数据的目的。
LPC编码主要分为分帧、预加重、自相关和线性预测系数计算等几个步骤。
AMR则是一种自适应多速率编码技术,它根据通信环境的质量要求自动选择合适的压缩比率。
AMR提供了多个不同比特率的编码模式,从4.75 kbps到12.2 kbps不等。
低比特率提供的音质较差,但传输开销较低,适用于网络带宽较低的环境,而高比特率则提供更好的音质和更高的保真度。
3. 主要特点GSM语音编码方案具有以下几个主要特点:3.1 低比特率GSM语音编码方案的比特率通常在8 kbps左右,远低于CD音质的128 kbps。
这使得GSM网络在有限的频谱资源下能够支持更多的用户同时通信,有效提高了系统的容量。
3.2 低延迟GSM语音编码方案具有较低的编解码延迟,通常在20毫秒左右。
这使得用户在通话中感觉到的延迟较小,提供了良好的实时通话体验。
3.3 压缩效率高GSM语音编码方案通过LPC技术对语音信号进行压缩,实现了较高的压缩效率。
相同比特率下,GSM语音编码方案相比其他编码方案具有更好的音质和保真度。
传输附属设备包括码转换器(TC)、子复用器(SM)和基站接口设备(BIE)。
TC 单元在GSM系统中实现GSM用户和PSTN(公共交换电话网)用户间的通信。
SM 单元主要功能是将4 个16 kbit/s信道复用到一个64 kbit/s信道上,从而节省地面传输链路,大多数情况下,将A接口的90个话音业务信道复用到一个PCN 2Mbit/s传输线上。
当BSC和BTS远距离连接(大于15m)时,使用BIE支持的A 接口。
GSM系统主要接口协议分层为信令层1(L1)、信令层2(L2)和信令层3(L3)。
信令层1也称物理层,为信令传输提供物理链路,为高层协议建立相应的控制逻辑信道。
A 接口的物理层是基于PCM 30/32路2 048Mbit/s A律13折线编码的PCM(脉冲编码调制)一次群通道,有32个时隙,每个时隙传输64kbit/s 的信令或业务信息。
目前GSM采用的编码方案是13 Kbit/s的RPELTP(规则脉冲激励长期预测),其目的是在不增加误码的情况下,以较小的速率优化频谱占用,同时到达与固定电话尽量相接近的语音质量。
它首先将语音分成20ms为单位的语音块,再将每个块用8 KHZ抽样,因而每个块就得到了160个样本。
每个样本在经过A率13比特(μ率14比特)的量化,因为为了处理A率和μ率的压缩率不同,因而将该量化值又分别加上了3个或2个的“0”比特,最后每个样本就得到了16比特的量化值。
因而在数字化之后,进入编码器之前,就得到了128Kbit/s的数据流。
这一数据流的速率太高了以至于无法在无线路径下传播,因而我们需要让它通过编码器的来进行编码压缩。
如果用全速率的译码器的话,每个语音块将被编码为260比特,最后形成了13Kbit/s 的源编码速率。
此后将完成信道的编码。
在BTS侧将能够恢复13Kbit/s的源速率,但为了形成16Kbit/s的TRAU帧以便于在ABIS和ATER接口上传送,因而需再增加3Kbit /s的信令,它可用于BTS来控制远端TCU的工作,因而被称为带内信息。
信号处理内核的发展促进了GSM系统语音编解码器的增强。
目前更为密集的分析加合成方法已用于在常见的EFR 及AMR语音编码器中,以在容量有限且容易出错的空中接口上提供最高质量的语音传输。
以当前对高速分组数据传输的关注程度,人们很容易忘记GSM数字电信系统的最初主要目的是传输语音。
总的感觉是整个系统的复杂性与传输链路的管理有关,但也有很大部分与麦克风捕捉到的音频压缩与解压缩复杂性有关。
为满足这一主要目的的需求,必须以足够高的采样及分辨率来捕获语音,以清楚地再现原始声音,并用一种可在比特率有限及容易出错的无线传输信道上保持音频高保真度的方式来压缩语音。
这一需求很具体,其目的是传输语音,故载荷的频率范围及声音质量均为已知。
人类听觉系统的工作方式允许编码器在手机耳机上产生出类似自然声音的听觉效果。
GSM系统中所使用的语音编码器的主要原理是对人类音域的数学建模,从而产生出一种用于传输语音的有效压缩方法。
术语“声码器”或“语音编码器”专门用来描述这些专门执行语音压缩的系统。
GSM系统对用于传输语音的信道具有一组固定的物理要求。
首先,它具有最大22.8kbps的原始数据速率;其次,帧可以被“偷窃”以及用于信令,且语音编码系统对这种情况必须很稳健,尽管存在对可偷窃语音帧的频率及时序的一定限制。
信道容量与编码GSM物理层是FDMA与TDMA的组合。
无线信道在整个GSM频段被分成相隔200kHz的多个信道,这些FDMA信道又被分成8个时隙。
GSM物理信道被定义为单个“绝对无线频率信道号”(ARFCN)上的单个时隙--故每一频率均可包含有8个独立物理信道。
“猝发”是指GSM系统中的无线传输量,且包含以周期577(s发送的114位原始信息。
由于语音流量信道传输的多帧结构,故每26次猝发最多有24次可包含语音数据(其余2次猝发用于空闲周期或传输信令信息)。
因此合计能给出22.8kbps的原始信道容量。
原始信道容量是完美传输条件下的最大用户数据(编码语音)吞吐量。
在真实世界中,无线传输并不稳健而且需要为数据增加保护。
增加冗余信息后,GSM系统中的全速率语音信道用于编码语音的容量为13kbps。
语音编解码器如果以8 kHz采样率及13位精度来对出自GSM蜂窝手机麦克风的音频数据进行采样,则可得到104kbps的源数据速率。
GSM系统中有四种编解码器,分别执行:全速率、增强型全速率(EFR)、自适应多速率(AMR)及半速率语音压缩。
表1给出了一些声码器的参数比较。
全速率全速率语音编解码器是改良的线性预测编码器(LPC),它将人类声域建模成一系列不同宽度的圆柱体。
通过迫使空气通过这些柱体,即可产生语音。
LPC编码器用一组联立方程来进行建模。
标准LPC编码器不能提供电话系统所需的话音质量(虽能听清语句,但很难或不可能分辨出说话的人)。
GSM系统中采用两种技术来提高LPC编码器的质量,即:长期预测(LTP)与规则脉冲激励(RPE),而全速率编解码器就被称为RPE-LTP线性预测编码器。
输入至RPE-LTP编码器的数据为包括160个采样值的20ms语音,每一个采样值都拥有13位精度。
数据首先通过预加重滤波器来提高信号的高频分量,以获得更好的传输效率。
滤波器一般还消除信号上的任何偏移以简化进一步的计算。
正如前面所提到的,语音产生模型可看成是空气通过一组不同大小的圆柱体。
短期分析级采用自动相关来计算与模型所用的8个圆柱体有关的8个反射系数,同时采用一种称为Schur 递归的技术来有效地求解所得到的方程组。
参数被变换成可以更少的位数来进行更佳量化的LAR(log-area ratio)。
这些是传输流的前8个参数。
然后再将编码后的LAR解码成系数,并用来对输入采样值进行滤波。
解码LAR的原因是为了确保编码器使用解码器上的相同信息来进行滤波。
这一级上的其余采样值用于编解码器的LTP级。
160个采样值被分成4个子窗口,每一个子窗口都拥有40个采样值。
长期预测器为每一子窗口产生2个参数:滞后与增益。
滞后由当前帧与后两帧之间的交叉相关峰值确定,而增益则由归一化交叉相关系数决定。
滞后与增益参数被应用到长期滤波器上,同时对现有短期剩余信号进行预测。
RPE级通过十取一及交错将40个剩余采样值转换成13个参数,并用APCM将所得出的13个值编码,其中最大值用对数编码成6位,然后再将13个参数均表示成3位,总共45位。
最后一级是从计算出的长期剩余及分析信号来更新短期剩余信号,然后再用此数据来计算下一帧。
增强型全速率全速率编解码器是一种用来传输语音并在计算上相当有效的方法,但通过使用更为密集的算法,语音质量还能提高。
全速率编解码器首先在1990年代初的DSP上实现,当时在经济上虽不能采用质量更好的编码器但却是一种更为密集的算法。
至1990年代中,功能更强的DSP内核的可用性已不再是一个问题,因此增强型全速率编解码器开始在手机中出现。
EFR声码器是一种代数码激励线性预测(ACELP)编码器,且不同于采用分析加合成方法的全速率系统。
它计算虽更加密集但能在输出端得到更为精确的结果。
预处理级由80Hz高通滤波器及一些缩减电路组成,以使实现更为容易。
每帧进行两次短期分析,由与两个30mS(1.5个语音帧)、长度集中在不同子帧上的不同非对称窗口自动关联。
所得到的系数被变换成线谱对(line spectral pairs)并被量化成38位,以获得更好的传输效率。
同时执行开环间隔(pitch)分析来计算每帧的间隔滞后估计值,然后再用此估计值启动闭环搜索(以得出更快的结果)。
再将所得到的闭环值应用于合成器及与非量化输入比较后的结果上(即分析加合成),最小的加权误差从自适应编码本(codebook)上得出并被编码成每子帧35位。
然后再用代数(固定) 编码本、并再一次用分析加合成方法来对量化后余下的剩余信号进行建模。
所得到的编码本增益被编码成每子帧5位。
最后,正如全速率声码器中一样,针对下一帧将存储器刷新。
EFR声码器的12.2kbps输出等于每帧244位。
但编码语音是通过拥有260位容量的常规GSM 全速率空中信道来传输,其余16位被填以CRC以及重复一些用于冗余的最重要编解码器参数。
自适应多速率当全部参数均能解码时,全速率及EFR编解码器可实现良好的语音再现。
由于传输信道的冗余(请记住,原始信道容量比数据载荷大10kbps),故许多原始位可以出错且参数仍能恢复。
但当参数丢失或错误时,所接收信号的质量将迅速下降(参见图3中的最右侧黑色曲线)。
这也是AMR编解码器组所试图解决的问题。
通过指定8个全都共享公共数学算法的声码器组,可改变信道的冗余量。
以此种方式,语音传输的质量可能会由于降至更低的编码速率上而稍微有所下降,但覆盖编码参数的信心则得以提高。
结果是在载波干扰增加的情况下可获得感觉更好的语音信号质量(如图3)。
AMR编解码器组由速率从12.2kbps至4.75kbps的ACELP声码器组成,故可提供87%至480%的冗余。
在一种很糟的情况下,即全速率及EFR帧丢失很久后,4.75kbps编解码器数据仍能恢复。
半速率GSM所采用的空中接口允许使用两个完全独立的半速率子信道,故能使蜂窝单元的语音容量加倍。
半速率声码器采用矢量和激励线性预(VSELP)编码器,它以一种类似EFR及AMR 编解码器的分析加合成方式工作,速率为5.7kbps。
半速率声码器的输出帧包含用来指示帧声音内容的2个位。
该声码器工作方式在每种模式下略微有些不同,故可获得最佳的音频数据再现质量。
人们对半速率语音的感觉普遍不佳,所以今天一般不采用此项技术。
但以其自适应模式,AMR声码器的6种较低速率将适合半速率空中信道的可用容量,结果是采用带AMR的半速率信道将在高流量领域变得更为普遍。
非连续传输在典型的谈话过程中,语音仅占总时间的大约40%。
为减少对无线接口的干扰,可采用非连续传输(DTX),即移动电话仅在有语音信号时才进行传输。
此功能要求有如下几项内容,即:语音活动检测(V AD)、用于空中接口的静寂描述符(SID)帧及舒适噪音产生等。
为减少猝发传输的总时间,语音解码器必须能确定什么时候有语音。
由于编码的自然特性,可通过分析中间参数来精确确定是否有语音。
重要的是要保证阈值合适,太灵敏会由于无线传输次数太多而对空中接口不利,而灵敏度不够则会切断语音并使声音质量严重下降。
尽管在理论上V AD是实现DTX所需的全部,但来自接收器的完全静寂降低整体感觉质量。
为解决此问题,接收器采用了“舒适噪音”功能,即利用SID帧参数的逐渐衰减来产生类似发射器背景噪音的声音。
当V AD确定没有语音时,在空中接口上不进行传输(实际情况比这更复杂一些,但其基本原理一样)。
经过一段预定时间间隔后,再发送一个包含一组参数的SID帧,这些参数用于接收器舒适噪音产生功能。
最佳实现语音编码功能可解释为像卷积这样的数学密集型处理,在带有处理这类计算指令(例如乘法-累加指令)的专用DSP上能得到最佳实现。
尽管这可以在通用处理器上实现,但要求有更高数量级的时钟速度来与同样的执行速度相匹配。
不同处理内核中所实现的EFR及全速率声码器执行速度不同。
作为一种与时钟速度有关的比较,DSP全速率实现的速度大约要比奔腾处理器实现的速度快3.5倍,而经彻底优化后的SC140实现的速度要比奔腾处理器实现的速度整整快18倍。
在语音编解码器中采用了许多优化技术。
最初一般将数据偏移以使计算更加容易并能再利用存储器空间。
例如,用剩余滤波器写入输入阵列而不使用新存储器空间。
处理器可采用定制浮点实现来在内核中提供浮点支持。
这些实现不是位精确的,这意味着它们不能得出像定点参考实现一样精确的数学结果。
但通过软硬件中针对这类数学算法的优化,速度可明显提高。
而输出参数,当被送入定点解码器时,将产生感觉上一样的声音帧。
测试位序列为检验依从性,ETSI颁布了一组全面的测试位序列。
它们由输入文件(160个13位采样值)、编码文件(通过解码器的结果)、一些解码文件(用于直接提供给解码器)以及输出文件(代表来自输出的160个采样值)组成。
而像V AD及舒适噪音产生等额外功能,则用各种序列进行隐含测试。
同时也对不同输入压缩扩展方案(A-law和(-law)进行测试。
浮点实现一般不遵循ETSI位序列,但能产生一组感觉上与定点编码器及解码器相兼容的参数。
对语音编码器实现的定性评价,可用Racal仪器公司带VQA的AIME系统来测试。
这种系统允许建立原始流量信道(无需完全的GSM协议实现),且能执行全速率的空中传输双向语音编码。
MEMORY {PAGE 0:RESEVE:org 00h len=0x80PAGE 0:PROGl: org=0x0100 1en=0x1500F'AGE 0:VECT: org=0x0080 len=0x80 PAGE 1:RESEVEI:org 00h len=0x1600 PAGE l:DARAM2: org=0x1600 len=0x400 PAGE 1:DARAMI: org=0xlh00 len=Ox2b00 )SECTIONS{.text:>PROGl PAGE 0.cinit: >PROGl PAGE 0 .switch:>PROGl PAGE 0 .vectors:> VECT PAGE 0 .const:>DARAMI PAGE 1.bss :>DARAMI PAGE 1 .stack: >DARAM2 PAGE 1 .system:>DARAM2 PAGE 1 .data: >DARAM2 PAGE 1}。