基于AMR—WB+的低码率语音编码技术的研究
- 格式:pdf
- 大小:224.75 KB
- 文档页数:4
VoLTE语音质量优化案例1:VoLTE窄带与宽带语音质量对比【问题现象】在3GPPLTE中,VoLTE业务编码有AMR-NB窄带和AMR-WB宽带两种编码,两种编码速率具有不同的话音质量,所以又分别称为VoLTE标清语音(或VoLTE12.2kbps)和VoLTE高清语音(或VoLTE23.85kbps)。
【问题分析】AMR-NB和AMR-WB这2种编码具有如下特点:●每20ms产生一个语音包,包括了RTP/UDP/RLC-Security压缩头;●每160ms生成一个SID语音静默包。
●帧长20ms;AMR-NB编码特点为:● 4.75kbps到12.2kbps共8个码率,分别为:4.75、5.15、5.9、6.7、7.4、7.95、10.2、12.2kbps;●采样率为8kHz。
AMR-WB编码特点为:● 6.6kbps到23.85kbps共8个码率,分别为:6.6、8.85、12.65、14.25、15.85、18.25、19.85、23.05、23.85kbps;●采样率为16kHz。
可见两者显着的差异是采样速率不一样,窄带一个语音帧是160个点,宽带一个语音帧采样320个点。
AMRNB的语音带宽范围:300-3400Hz,8KHz采样。
AMRWB 的语音带宽范围:?50-7000Hz,16KHz采样。
用户可主观感受到话音比以前更加自然、舒适和易于分辨。
AMRWB与AMRNB不同之处在于AMRWB按16kHz采样,分别按频率带50~6400Hz?和6400~7000Hz进行编码。
用来降低复杂度,AMRWB将位算法集中到更重要的频率区。
低频带使用ACELP算法进行编码。
添加几个特征来达到一个高的主观质量。
线性预测(LP)算法是在每隔20ms的帧要进行一次线性预测算法,每5ms搜索一次自适应码本,这个过程是在12.8Kbs速率下进行。
高频带是在解码器端使用低带和随机激励的参数重建的,目的是调整与在声音基础上的低频有关的高频带.高频带的声频通过使用由低带LP过滤器产生的LP滤波器进行重建。
自适应多码率(AMR)宽带语音编码1.AMR-WB的应用需求1.1 AMR-WB需求目前在GSM和WCDMA系统中使用AMR声码器为窄带AMR声码器。
在窄带AMR声码器中,语音信号的带宽最高限制在3.4kHz,采样频率为8kHz。
窄带AMR语音编码器在语音信号质量和抗干扰方面已经取得了较好的性能,并被广泛的商用。
然而窄带语音编解码器由于带宽的限制,在语音的自然度、音乐处理、以及在一些特殊音处理等方面还不尽人意。
宽带AMR语音声码器其音频带宽扩展到7kHz,采样频率扩展到16kHz,由于带宽的扩展,该声码器在语音的自然度、音乐,特别是在免提电话(手机)方面较窄带语音编解码器有较大的改善。
可以预见,由于宽带服务提供了一个比较丰富的话音音质的改善,因此宽带AMR 将在3G网络应用中有广泛的市场。
由于AMR-WB的最高编码速率高达23.85kbps,因此宽带AMR只在较低或中等误码的信道中提供较好的性能(载噪比大于13dB),其信号质量超过G.711PCM有线信号质量。
对于误码或干扰比较严重的信道,需要使用窄带AMR,因为窄带AMR具有较低的编码速率,传输信道能够提供较多的纠错比特用于信道编码。
因此窄带AMR和宽带AMR是两种不同类型的服务选择,适应于不同的用户需求,不能相互取代。
AMR-WB属于WCDMA的语音编解码算法标准之一,目前已经有正式的协议和定点C代码。
1.2 ALC功能预研通信系统中,由于终端、传输线路的变化,话音信号电平可能出现过大或过小的情况,这都影响了人们的正常通话,有调查表明,如果能把话音电平保持在适合的范围,可以延长人们在通信系统中的平均通话时间,最终提高系统运营商的经济效益。
独立的ALC设备应该遵循协议ITU-T G.169的指标要求,功能较全。
嵌入式的ALC可以作为一个TC或EC的附加功能,应该具有较小的计算量,在自动调整话音信号电平的同时不能其它话音失真的副作用。
1.3 SMV算法需求SMV(Selectable mode vocoder)算法属于CDMA2000系统中的语音编解码算法标准之一.3、技术要求3.1 技术需求及预期成果3.1.1 AMR-WB需求及预期成果根据功能来进行划分,要求在以下几个方面进行预研1、对AMR-WB语音编解码功能的研究预期成果:《AMR-WB语音编解码功能分析报告》要求:对AMR-WB语音编解码处理方案进行详细分析,对一些理论上的难点和要点以及实现方法进行详细的说明,对一些公式进行必要的推导。
AMR NB的语音带宽范围:300-3400Hz,8KHz采样AMR WB的语音带宽范围: 50-7000Hz,16KHz采样AMR-WB+的采样速率是在16~48 kHz之间。
这使得它的语音带宽更宽(24 kHz)AMR WB与AMR NB的不同之处在于AMR WB在16k取样率的运作,两个频率带50~6400Hz 和6400~7000Hz 进行编码,用来降低复杂度,将位算法集中到更重要的频率区。
低频带使用ACELP算法进行编码。
添加几个特征来达到一个高的主观质量。
线性预测(LP)算法是在每隔20ms 的帧要进行一次线性预测算法,每5ms搜索一次自适应码本。
这个过程是在12.8Kbs 速率下进行的.高频带是在解码器端使用低带和随机激励的参数重建的, 目的是调整与在声音基础上的低频有关的高频带. 高频带的声频通过使用由低带LP 过滤器产生的LP 滤波器进行重建.下面来看看AMR WB+,AMR WB+不像现有编码器仅采用单一算法,而是对处理语音和音效分别采用ACELP(Algebraic Code Excited Linear Prediction)编码技术和变换码激励(TCX)编码技术,这种混合模式能提供比AMR WB同更好的音频质量。
对于单声道编码, AMR WB+采用混合的ACELP/TCX编码模型。
AMR WB+编解码器能接受单声道或立体声的输入信号,采样频率在16~48 kHz之间。
单声道信号可分解成2个频带:一个是低频信号,采样率低至12.8 kHz,即AMR WB的内部频率;另一个则是高频信号,含有6.4 kHz以上的所有频率。
混合的ACELP/ TCX编码模型应用于低频信号,并利用一种频宽延伸(BWE)法对高频信号进行编码,撷取出能代表频谱封包与增益的参数,信号经过量化后再传送至解码器。
解码器会使用外推法求算出高频信号的结构。
每个子帧都进行增益校正与运算,然后再进行传输,藉此确保低频带与高频带之间6.4 kHz 衔接处的连续性。
基于数字信号处理的低码率语音编码技术数字信号处理的发展,让我们的通信方式得到了很大的改善,而其中很重要的一部分就是低码率语音编码技术。
随着无线通信技术的发展,人们对通信质量的要求也越来越高,这就使低码率语音编码技术的研究变得非常重要。
在这篇文章中,我将对基于数字信号处理的低码率语音编码技术做一个简单的介绍。
一、低码率语音编码技术的意义低码率语音编码技术是一种数字信号处理技术,它的主要应用是在无线通信领域和互联网语音通信领域。
由于需要经过无线信道或者网络传输,因此通信的质量受到了很多因素的影响,并且传输的带宽也很有限。
因此,需要对语音信号进行压缩,从而达到降低数据传输带宽的目的,同时也能够保证通信的质量。
二、低码率语音编码的原理低码率语音编码的主要原理是基于人耳对声音的特性。
人耳对声音的灵敏度是不同的,我们能够清晰地分辨出不同的声音,同时也对声音中的某些成分已经失去了敏感性。
因此,在低码率语音编码中,就是利用这种人耳的特性来进行压缩,把语音中不必要的信息去掉,而只保留对人耳有效的部分。
这里介绍一个常用的低码率语音编码的方法——线性预测编码技术。
在这个方法中,将语音信号分为多个小块,然后对每个小块做线性预测,通过计算预测误差的大小得到一个采样值,再进行压缩可以得到最终的编码结果。
在这个过程中,压缩的关键是对预测误差的处理,因为预测误差包含了很多的信息,需要通过一定的方法进行压缩。
三、低码率语音编码技术的应用由于低码率语音编码技术的高效性和可靠性,现在已经被广泛地应用在通信领域中。
无线通信、互联网语音通信和数字广播等领域都可以使用这种技术来降低传输带宽,并保证通信的质量。
例如,在无线通信中,低码率语音编码技术非常重要。
由于无线信道的传输带宽非常有限,需要进行压缩来使语音信号的传输更加高效。
而一个良好的低码率语音编码软件可以大大提供通讯效率和通讯质量,除此之外,它还可以减轻无线网络的压力,对网络的优化也起着重大作用。
VoLTE语音质量优化案例1:VoLTE窄带与宽带语音质量对比【问题现象】在3GPP LTE中,VoLTE业务编码有AMR-NB窄带和AMR-WB宽带两种编码,两种编码速率具有不同的话音质量,所以又分别称为VoLTE标清语音(或VoLTE 12.2kbps)和VoLTE 高清语音(或VoLTE 23.85kbps)。
【问题分析】AMR-NB和AMR-WB这2种编码具有如下特点:●每20ms产生一个语音包,包括了RTP/UDP/RLC-Security压缩头;●每160ms生成一个SID语音静默包。
●帧长20ms;AMR-NB编码特点为:● 4.75kbps到12.2kbps共8个码率,分别为:4.75、5.15、5.9、6.7、7.4、7.95、10.2、12.2kbps;●采样率为8kHz。
AMR-WB编码特点为:● 6.6kbps到23.85kbps共8个码率,分别为:6.6、8.85、12.65、14.25、15.85、18.25、19.85、23.05、23.85kbps;●采样率为16kHz。
可见两者显著的差异是采样速率不一样,窄带一个语音帧是160个点,宽带一个语音帧采样320个点。
AMR NB的语音带宽范围:300-3400Hz,8KHz采样。
AMR WB的语音带宽范围:50-7000Hz,16KHz采样。
用户可主观感受到话音比以前更加自然、舒适和易于分辨。
AMR WB与AMR NB不同之处在于AMR WB按16kHz采样,分别按频率带50~6400Hz 和6400~7000Hz 进行编码。
用来降低复杂度,AMR WB将位算法集中到更重要的频率区。
低频带使用ACELP算法进行编码。
添加几个特征来达到一个高的主观质量。
线性预测(LP)算法是在每隔20ms 的帧要进行一次线性预测算法,每5ms搜索一次自适应码本,这个过程是在12.8Kbs 速率下进行。
高频带是在解码器端使用低带和随机激励的参数重建的, 目的是调整与在声音基础上的低频有关的高频带. 高频带的声频通过使用由低带LP 过滤器产生的LP 滤波器进行重建。
自适应多码率(AMR)宽带语音编码1.AMR-WB的应用需求1.1 AMR-WB需求目前在GSM和WCDMA系统中使用AMR声码器为窄带AMR声码器。
在窄带AMR声码器中,语音信号的带宽最高限制在3.4kHz,采样频率为8kHz。
窄带AMR语音编码器在语音信号质量和抗干扰方面已经取得了较好的性能,并被广泛的商用。
然而窄带语音编解码器由于带宽的限制,在语音的自然度、音乐处理、以及在一些特殊音处理等方面还不尽人意。
宽带AMR语音声码器其音频带宽扩展到7kHz,采样频率扩展到16kHz,由于带宽的扩展,该声码器在语音的自然度、音乐,特别是在免提电话(手机)方面较窄带语音编解码器有较大的改善。
可以预见,由于宽带服务提供了一个比较丰富的话音音质的改善,因此宽带AMR 将在3G网络应用中有广泛的市场。
由于AMR-WB的最高编码速率高达23.85kbps,因此宽带AMR只在较低或中等误码的信道中提供较好的性能(载噪比大于13dB),其信号质量超过G.711PCM有线信号质量。
对于误码或干扰比较严重的信道,需要使用窄带AMR,因为窄带AMR具有较低的编码速率,传输信道能够提供较多的纠错比特用于信道编码。
因此窄带AMR和宽带AMR是两种不同类型的服务选择,适应于不同的用户需求,不能相互取代。
AMR-WB属于WCDMA的语音编解码算法标准之一,目前已经有正式的协议和定点C代码。
1.2 ALC功能预研通信系统中,由于终端、传输线路的变化,话音信号电平可能出现过大或过小的情况,这都影响了人们的正常通话,有调查表明,如果能把话音电平保持在适合的范围,可以延长人们在通信系统中的平均通话时间,最终提高系统运营商的经济效益。
独立的ALC设备应该遵循协议ITU-T G.169的指标要求,功能较全。
嵌入式的ALC可以作为一个TC或EC的附加功能,应该具有较小的计算量,在自动调整话音信号电平的同时不能其它话音失真的副作用。
1.3 SMV算法需求SMV(Selectable mode vocoder)算法属于CDMA2000系统中的语音编解码算法标准之一.3、技术要求3.1 技术需求及预期成果3.1.1 AMR-WB需求及预期成果根据功能来进行划分,要求在以下几个方面进行预研1、对AMR-WB语音编解码功能的研究预期成果:《AMR-WB语音编解码功能分析报告》要求:对AMR-WB语音编解码处理方案进行详细分析,对一些理论上的难点和要点以及实现方法进行详细的说明,对一些公式进行必要的推导。
高通量卫星应用于4G基站回传的方式研究黄曜明;张哲铭【摘要】随着电信普遍服务深入推进,4G网络将进一步拓展至山区、边疆、海岛等需要卫星通信提供传输的地区.本文分析了传统卫星应用于4G基站回传的不足,提出更应关注在传输能力与传输成本上有新突破的高通量卫星,并对高通量卫星应用于4G基站回传的方式进行了分析研究.【期刊名称】《电信工程技术与标准化》【年(卷),期】2018(031)011【总页数】5页(P22-26)【关键词】高通量卫星;4G回传;卫星通信【作者】黄曜明;张哲铭【作者单位】中国移动通信集团设计院有限公司,北京 100080;中国移动通信集团设计院有限公司,北京 100080【正文语种】中文【中图分类】TN9271 引言为进一步深入推进电信普遍服务工作,国家要求加快偏远和边疆地区4G网络覆盖,目标为至2020年实现全国行政村4G覆盖率超过98%。
为此,在山区、边疆、海岛等地区需新增2万个以上4G覆盖村。
卫星通信的广覆盖优势将有助于目标的达成,同时4G基站回传的特殊性对卫星传输带来新的挑战。
2 4G基站传输要求以及传统卫星的不足4G突出特点就是可以给用户带来高速数据业务体验,从而适配互联网信息通信高速发展的现状,而传统卫星通信难以提供高速率通信。
2.1 普通4G基站传输要求4G基站现网平均单站速率约为下行40 Mbit/s、上行10 Mbit/s,考虑到传输峰值,单站带宽规划一般在80~ 100 Mbit/s。
根据3GPP协议要求,eNode B至S-GW之间的S1接口控制面时延为10 ms,终端从空闲态到连接态的时延应控制在100 ms以内。
承载的业务时延虽然各不相同,总体上仍要求达到100~300 ms之间。
2.2 传统卫星的不足传统通信卫星一般采用C波段和Ku波段对地静止轨道卫星,并采用大波束的覆盖方式,一个波束即可覆盖中国全境。
然而由于C波段和Ku波段相加仅能提供1 GHz带宽,且对地静止轨道全球仅有一个,只能以约2°的轨道经度进行区隔,资源极其宝贵。
AMR音频编码器概述及文件格式分析全称Adaptive Multi-Rate,自适应多速率编码,主要用于移动设备的音频,压缩比比较大,但相对其他的压缩格式质量比较差,由于多用于人声,通话,效果还是很不错的。
AMR-WB应用于EDGE、3G可充分体现其优势。
足够的传输带宽保证AMR-WB可采用从6.6kb/s到23.85kb/s共九种编一、分类1. AMR: 又称为AMR-NB,相对于下面的WB而言,语音带宽范围:300-3400Hz,8KHz抽样2. AMR-WB:AMR Wide Band,语音带宽范围: 50-7000Hz , 16KHz 抽样“AMR-WB”全称为“Adaptive Multi-rate - Wideband”,即“自适应多速率宽带编码”,采样频率为16kHz,是一种同时被国际标准化组织ITU-T和3GPP采用的宽带语音编码标准,也称为G722.2标准。
AMR-WB提供语音带宽范围达到50~7000Hz,用户可主观感受到话音比以前更加自然、舒适和易于分辨。
与之作比较,现在GSM用的EFR(Enhanced Full Rate,增强型全速率编码)采样频率为8kHz,语音带宽为200~3400Hz。
AMR-WB应用于窄带GSM(全速信道16k,GMSK)的优势在于其可采用从6.6kb/s,8.85kb/s和12.65kb/s三种编码,当网络繁忙时C/I恶化,编码器可以自动调整编码模式,从而增强QoS。
在这种应用中,AMR-WB抗扰度优于AMR-NB。
AMR-WB应用于EDGE、3G可充分体现其优势。
足够的传输带宽保证AMR-WB可采用从6.6kb/s到23.85kb/s共九种编码,语音质量超越PSTN固定电话。
二、编码方式1. AMR-NB:10 - - TDMA-EFR SID11 - - PDC-EFR SID12-14 - - For future use15 - - No Data (No transmission/No reception) 2. AMR-WB:Frame Type Index ModeIndicationModeRequestFrame content (AMR-WB mode,comfort noise, or other)0 0 0 AMR-WB 6.60 kbit/s1 1 1 AMR-WB 8.85 kbit/s2 2 2 AMR-WB 12.65 kbit/s3 3 3 AMR-WB 14.25 kbit/s4 4 4 AMR-WB 15.85 kbit/s5 5 5 AMR-WB 18.25 kbit/s6 6 6 AMR-WB 19.85 kbit/s7 7 7 AMR-WB 23.05 kbit/s8 8 8 AMR-WB 23.85 kbit/s9 - - AMR-WB SID (Comfort Noise Frame)10-13 - - For future use14 - - speech lost15 - - No Data (No transmission/Noreception)- -二、AMR 帧格式:AMR 有两种类型的帧格式:AMR IF1 和 AMR IF21. AMR IF1:IF1 的帧格式如下图所示:FrameType, Mode Indication, Mode Request 对应上面两个表格里的数。
低速率语音编码的实现与仿真摘要:近年来,随着通信与计算机网络的飞速发展,低速率语音编码以其低速率且良好的编码质量等特点,在数字通信中越来越受到重视。
低速率语音编码方案主要是基于LPC-10,混合激励线性预测(MELP),多带激励编码(MBE),正弦变换编码(SCI)等。
它们大都能够工作在2.4kbps速率下。
本文对LPC-10进行了研究,以LPC模型为原型,通过联合帧、矢量量化及参数内插等技术,实现了一种低速率语音编码算法。
归一化互相关函数基音检测算法(NCCFPDA)的引入,提高了清浊音判决的准确率;线谱对(LSP)参数的量化特性,降低了误差率,提高了算法的稳健性;固定矢量量化码本(LSPVQ码本)提高了量化精度并降低了传输码率;联合帧的应用,较好的平衡了低码率与语音质量严重恶化的矛盾,而与参数内插技术的结合更加降低了传输码率。
通过该算法获得了比较满意的合成语音,并在MATLAB中得到实现,验证了算法的可行性。
关键词:语音编码,基音检测,LSP,MATLAB目录第一章绪论 (4)1.1引言 (4)1.2低速率语音编码研究现状 (4)1.3常用低速率语音编码算法 (5)1.3本文主要研究内容及章节安排 (6)第二章 LPC-10编码算法 (7)2.1LPC-10编码算法的理论依据 (7)2.1.1 语音信号的产生模型 (7)2.1.2语音信号的线性预测分析[8] (7)2.2LPC-10编解码算法的分析[9] (8)2.2.1 LPC-10编码算法分析 (8)2.2.2 计算声道滤波参数RC (9)2.2.3 计算增益RMS (10)2.2.4 提取基音周期和检测清/浊音 (10)2.2.5 参数编码与解码 (10)2.2.6 LPC-10解码算法分析 (10)2.3LPC-10声码器存在的问题[9] (11)第三章 900BIT/S极低速率编码算法 (12)3.1算法概述 (12)3.2编码原理 (13)3.2.1预处理 (13)3.2.2线性预测分析 (14)3.2.3 NCCFPDA算法[12] (16)3.2.4 矢量量化[9] (19)3.2.5参数编码 (20)3.3解码原理 (20)3.3.1参数解码 (21)3.3.2合成语音 (21)3.4本章小节 (22)第四章低速率语音编解码算法的仿真实现 (23)4.1仿真实验平台 (23)4.2编解码器的工作流程 (23)4.2语音编码仿真结果 (24)第五章结论与展望 (25)5.1结论 (25)5.2展望 (25)参考文献 (26)第一章绪论1.1引言语音通信是一种非常重要且普遍的通信方式。