ILBC编码算法及其在VOIP中的应用
- 格式:doc
- 大小:9.14 KB
- 文档页数:2
音视频编码技术在即时通信中的应用与优化随着互联网的迅猛发展,即时通信已经成为人们日常生活中不可或缺的一部分。
音视频通信作为即时通信的重要组成部分,其编码技术的应用与优化,对于保证通信质量和用户体验至关重要。
本文将探讨音视频编码技术在即时通信中的应用和优化方法。
一、音视频编码技术的基本原理音视频编码技术是将音频和视频信号转换为数字数据的过程,通常包括信号采样、量化、编码和压缩等步骤。
其中最重要的是编码和压缩,它们决定了传输数据量的大小和解码的难易程度。
1. 音频编码技术音频编码技术主要分为无损和有损两种方式。
无损编码常用的有PCM(脉冲编码调制)和FLAC(无损音频编码器)等,其优点是保留了原始音频数据的完整性,但数据传输量较大。
有损编码常用的有MP3、AAC、Opus等,通过去除人耳听不到的音频信号,减小数据量的同时保持较好的音质。
2. 视频编码技术视频编码技术常用的有MPEG-2、H.264、H.265等。
H.264是最常见的视频编码格式,它通过空间和时间上的冗余性去除,实现了较高的压缩比和较好的视频质量。
H.265相对于H.264有更高的压缩比,但编码和解码的计算量也更大。
二、音视频编码技术在即时通信中的应用1. 实时音视频通话音视频编码技术在即时通信中最直接的应用就是实现实时音视频通话。
通过合适的编码算法,将音频和视频信号转换为数字数据,并进行压缩,可以降低传输所需的带宽和延迟,从而实现实时的音视频通话。
2. 视频会议音视频编码技术还广泛应用于视频会议系统中。
多方视频会议需要同时传输多个视频流,而且要求保持高质量的视频和较低的延迟。
因此,优化编码算法和压缩比对于实现稳定流畅的视频会议非常重要。
3. 视频直播随着直播平台的兴起,音视频编码技术在视频直播中的应用越来越广泛。
通过合理选择编码算法和调整压缩比,可以降低直播所需的带宽和服务器资源,并保持较好的视频质量,提升用户体验。
三、音视频编码技术的应用优化为了提高音视频通信的质量和用户体验,需要对音视频编码技术进行相应的优化。
欧美及我国常用的语音编码技术1. 介绍在当今数字化时代,语音编码技术在通信、音频处理、语音识别等领域起着至关重要的作用。
欧美及我国都有各自常用的语音编码技术,本文将就这一主题进行深入探讨。
2. PCM编码PCM(Pulse Code Modulation)是一种最早期的语音编码技术,它将模拟信号转换为数字信号。
PCM编码的优点是精确度高,保真度好,但缺点是需要较大的数据传输速率。
在欧美,PCM编码仍然广泛应用于一些专业音频设备和通信系统中。
3. ADPCM编码ADPCM(Adaptive Differential Pulse Code Modulation)是一种自适应差分脉冲编码调制技术,它在PCM编码的基础上进一步压缩了数据量。
相较于PCM编码,ADPCM编码具有更高的压缩比,适用于一些需要节省带宽的场景。
在欧美,ADPCM编码被广泛应用于语音通信、无线通信等领域。
4. G.711编码G.711是国际电信联盟(ITU-T)制定的一种音频编码标准,它包括了μ-law和A-law两种编码方式。
G.711编码通过对声音进行采样和量化,实现了对语音的高效压缩和传输。
在我国,G.711编码是常用的语音编码技术之一,被广泛应用于各类通信系统和音频处理设备中。
5. G.729编码G.729是一种高压缩比的语音编码标准,它采用了先进的语音处理算法,实现了对语音信号的高效压缩和传输。
在欧美,G.729编码被广泛应用于语音通信和网络通信方式等领域。
6. Opus编码Opus是一种开放式、免专利的音频编码格式,它具有低延迟、高音质和高压缩比的特点。
Opus编码在欧美得到了广泛的应用,尤其是在互联网音频传输、实时语音通信等领域。
7. 总结欧美及我国常用的语音编码技术包括了PCM编码、ADPCM编码、G.711编码、G.729编码和Opus编码等多种标准和格式。
这些编码技术各具特点,适用于不同的场景和需求。
随着科技的不断进步和创新,相信未来还会有更多更先进的语音编码技术出现,为语音通信和音频处理领域带来更多的可能性。
一、引言二、iLBC算法研究一般将编码速率低于 4.6kbps的语音编码器称为低比特率编码器,而把编码速率介于4.6kbps~24kbps的编码器称为中比特率编码器。
按照这个划分标准,iLBC编码器属于中比特率编码器。
iLBC算法基于码本激励线性预测这种参数编码方式,因此本章首先对基于码本激励线性预测算法的中比特率语音编解码器的组成结构及工作原理进行研究和探讨,在此基础上对iLBC算法进行研究,重点介绍其算法原理及特点。
中低速率语音编解码算法研究3)iLBC算法简介[参照ilbc白皮书]自VoIP技术面世以来,业界对现存的低比特率编解码器标准的关注一直不断。
V oIP应用主要在包交换的IP网络上进行传输,无法避免IP网络的丢包、延时、抖动等实时传输问题。
2000年,Global IP Sound(GIPS)公司决定开发一种能够满足VoIP产业需求的编解码器,目标是利用GIPS内部的专业能力开发一款免授权费、专为数据包通信而设计,而且在理想无错情况和丢包情况下都能提供高音质的编解码器,并把它引入不同的标准化机构以符合互操作性的要求。
这就是iLBC(Internet Low Bit Rate Codec)编解码器诞生的缘起。
目前大多数的语音编码都是基于码本激励线性预测(Code Excited Linear Prediction, CELP)编码模型的,例如ITU G.729、G.723.1和3GPP-AMR。
CELP一直都被视为在交换网络中以低比特率电路获得高质量的一种非常成功的方法。
这种编码方法具有高效性,主要是由于它利用了连续语音片段之间的互相依赖性,因此CELP编码的性能主要取决于前面编码的历史。
CELP编码器是基于存储器的,故丢包或延迟所造成的误差会扩散开来,结果是单个丢包会影响到随后多个数据包的质量,这显然是数据包通信的一大缺陷。
iLBC本质上式一种基于帧的线性预测编码方法,是对CELP的一种发展,其独有的动态码本更新技术、语音增强技术和丢包掩蔽技术使其在VOIP中应用时有更好的性能。
voip编码方法摘要:1.引言2.VoIP技术概述3.VoIP编码方法分类4.常用VoIP编码技术的特点及比较5.我国VoIP编码技术的发展6.总结正文:【引言】在当今信息时代,语音通信技术不断发展,VoIP(Voice over Internet Protocol)已成为人们日常生活和工作的重要通信手段。
VoIP技术通过将语音信号编码成数字信号,在互联网上进行传输,再解码为语音信号,实现远程通信。
编码方法是VoIP技术的核心,直接关系到通信质量。
本文将对VoIP编码方法进行分析,以期帮助读者更好地了解和应用这一技术。
【VoIP技术概述】VoIP技术是一种基于互联网的语音通信技术,通过将语音信号转换成数字信号,在网络中进行传输和处理。
在VoIP通信过程中,编码器将语音信号编码成数字信号,解码器将数字信号转换回语音信号。
数字信号在传输过程中可采用多种编码方法,以适应不同的通信环境和需求。
【VoIP编码方法分类】VoIP编码方法主要分为以下几类:1.音频编码方法:根据音频信号的特点,对语音信号进行编码。
常见的音频编码格式有G.711、G.723.1、G.729等。
2.视频编码方法:针对视频信号进行编码,实现视频通话。
常见的视频编码格式有H.264、H.265等。
3.数据压缩方法:通过对通信过程中的数据进行压缩,降低传输速率,提高通信效率。
常见的数据压缩方法有LZW、INLINE等。
【常用VoIP编码技术的特点及比较】1.G.711:适用于窄带语音信号,压缩比较低,但音质较好。
2.G.723.1:适用于窄带和宽带语音信号,压缩比较高,音质较好。
3.G.729:适用于窄带语音信号,压缩比较高,音质较好。
4.H.264:适用于高清视频通话,压缩比高,但解码设备要求较高。
5.H.265:适用于超高清视频通话,压缩比更高,解码设备要求较高。
6.LZW:适用于数据压缩,压缩比较高,但解压缩速度较慢。
7.INLINE:适用于数据压缩,压缩比较高,解压缩速度较快。
一种对丢包具有鲁棒性的语音编码算法—iLBC军事通信技术第 29 卷第 4 期 Vol. 29No. 42008 年 12 月 Dec. 2008Journal ofM ilitary Communications TechnologyΞ一种对丢包具有鲁棒性的语音编码算法 ?iLBC1 2 2 1郑国宏 , 晋军 , 程剑 , 陈亮1. 解放军理工大学通信工程学院电子信息工程系, 江苏南京 210007;2. 解放军理工大学通信工程学院卫星通信系摘要: 文中介绍了一种适用于网络的, 对丢包具有鲁棒性的语音编码算法 ?? 。
在编码时先进iLBC iLBC行LPC 分析, 然后对 LPC 残差信号采用自适应码本编码, 这个自适应码本与传统的 CELP 算法中的自适应码本不同, 没有利用语音帧之间的相关性, 使得算法对丢包具有鲁棒性; 解码时如果有语音包丢失, 则采用丢包隐iLBC藏 PLC 算法。
介绍了 iLBC 编解码算法的基本原理; 重点分析了 iLBC 的自适应码本编码方式以及丢包隐藏算法; 比较了在丢包率相同的情况下, 和 2729 的分, 结果表明, 更适合于有丢包的PLC iLBC ITU T G A MOS iLBC网络。
关键词: 语音编码; 自适应码本; 丢包隐藏中图分类号: 912. 3 文献标识码: 文章编号: 322128920080420060206TN A CNSpeech Coding A lgorithm w ith Robustness to Packet Losses2iLBC1 2 2 1ZH EN G Guo2hong , J IN J un , CH EN G J ian , CH EN L iang1. , , 210007, ;Department of Electronic Information Engineering ICE PLAUST Nanjing China2. Department of Satellite Communication ICE, PLAU ST:Abstract A speech coding algorithm w ith robustness to packet losses and suitable fornetwork named iLBC w as introduced iLBC codec performsLPC analysis first and then codes theLPC residual signal by using a special adaptive codebook. In contrast to traditionalCELP, iLBCapplies an adaptive codebook w ithout introducing data dependency across frame boundarieswhich,results in iLBC codec’ s robustness w ith packet losses If packet losses occurs when decodingpacket loss concealment PLC is used The principle of iLBC coding algorithm w as introducedw ith an emphasis on the adaptive codebook coding and PLC. Finally, the mean opinion score ofiLBC and ITU 2T G. 729A at the same packet loss ratesw ere compared. The results show thatiLBC ismore suitable for the network w ith packet losses.: ; ;Key w ords speech coding adaptive codebook packet loss concealment 码激励线性预测编码技术是一种有效的中低速率语音压缩编CELP Code Excited L inear Prediction码技术, 在 418 kb?s ~ 16 kb?s 速率上取得了很好的编码效果。
ilbc编解码例子
iLBC编解码例子是一种用于实时语音通信的音频编解码器。
iLBC是internet 低比特率编解码器(internet Low Bitrate Codec)的缩写。
它使用在带宽有限的网络环境下,如VoIP(Voice over Internet Protocol)电话通话中,以确保音频数据的高质量传输。
iLBC编解码器具有较低的比特率,可以在带宽较小的网络环境下提供良好的音频质量。
它通过采用20毫秒的帧大小和50位样本间隔来实现。
iLBC编解码器可以在不同传输网络上进行音频通信,如互联网、移动网络等。
以下是一个iLBC编解码的简单例子:
编码:
1. 将输入的PCM音频数据划分为20毫秒一帧的小块。
2. 对每一帧的音频数据进行iLBC编码。
3. iLBC编码器将音频数据转换为iLBC格式,以减少数据的大小。
4. 将编码后的音频数据传输给接收端。
解码:
1. 接收端接收到编码后的音频数据。
2. iLBC解码器将接收到的音频数据解码为原始PCM格式。
3. 解码后的音频数据可以被播放或进一步处理,以还原声音的原始质量。
iLBC编解码器的例子用于在有限的带宽环境下保证音频通信的质量,特别适用于VoIP电话和其他实时语音通信应用。
该编解码器经过了广泛的实践和研究,被认为是一种高效且可靠的音频编解码解决方案。
一种基于SoPC技术的iLBC语音编解码器设计实现
张国印;刘铭;姚爱红
【期刊名称】《小型微型计算机系统》
【年(卷),期】2010(031)005
【摘要】基于VoIP技术的语音通信发展迅速,单芯片VoIP处理器的设计方法成为当前的研究热点.iLBC作为专为窄带通信而设计的VoIP语音编解码器,可以在丢包率和延迟较高的网络环境中保持良好的语音通话质量,具有广泛的应用前景.传统的基于DSP处理器实现方法具有芯片面积大、功耗高等缺点,难以满足VoIP系统集成度高、低功耗和易于升级等需求.本文提出了一种基于SoPC技术的iLBC语音编解码器实现方案,并对自相关计算算法进行了并行计算硬件IP核设计,提高了系统的集成度、计算性能和可扩展性.理论分析和实验结果表明并行自相关计算结构有效减少了访存次数,可以获得接近30的加速比.
【总页数】5页(P1016-1020)
【作者】张国印;刘铭;姚爱红
【作者单位】哈尔滨工程大学,计算机科学与技术学院,黑龙江,哈尔滨,150001;哈尔滨工程大学,计算机科学与技术学院,黑龙江,哈尔滨,150001;哈尔滨工程大学,计算机科学与技术学院,黑龙江,哈尔滨,150001
【正文语种】中文
【中图分类】TP391
【相关文献】
1.iLBC语音编解码器的性能分析及应用 [J], 雷晓荣;朱志祥
2.iLBC语音编解码器核心技术的研究 [J], 雷晓荣;朱志祥
3.基于FPGA的ADPCM语音编解码器设计实现 [J], 陈明义;刘华;刘力
4.一种基于CK嵌入式CPU的G.729A语音编解码器 [J], 裘燕锋;马琪
5.一种基于LMS算法的语音消噪数字设计实现 [J], 徐泽琨;黄明;彭召敏;马栋梁;李国诚
因版权原因,仅展示原文概要,查看原文内容请购买。
iLBCTM语音编解码器的实现与优化
肖博;刘炯鑫;黄永峰
【期刊名称】《计算机研究与发展》
【年(卷),期】2007(044)0z1
【摘要】在VOIP类语音编解码器的实际应用中,语音质量和编解码时间是关键的性能指标.针对最近由GIPS提出的一种新的编码算法--iLBC语音编码算法,分析了它的原理以及其语音质量提高的原因.在PC上实现高性能的语音编码器的基础上提出了算法优化策略,进一步提高实时性.优化的重点是计算复杂度较大的自适应码本搜索和编码等模块.最后对优化前后的代码进行了测试比较,结果显示优化代码比未优化代码的运行时间减少了15%左右.
【总页数】4页(P259-262)
【作者】肖博;刘炯鑫;黄永峰
【作者单位】清华大学电子工程系,北京,100084;清华大学电子工程系,北
京,100084;清华大学电子工程系,北京,100084
【正文语种】中文
【中图分类】TN912;TP391
【相关文献】
1.数字语音电力线载波通信装置语音编解码器的实现 [J], 王水刚
2.VoIP语音编解码器的实现与优化 [J], 金辉;陈后金;孙江波
3.G.718宽带语音编解码器的DSP实现及优化 [J], 申星海;王春柳;陈德宏
4.基于TM1300的G.728语音编解码器实现与优化 [J], 谢兄;胡瑞敏;艾浩军
5.A律语音压缩编解码器的FPGA实现 [J], 贾瑞莲;肖沙里;郭成;刘锋
因版权原因,仅展示原文概要,查看原文内容请购买。
iLBC语音编解码器算法的研究与实现的开题报告题目:iLBC语音编解码器算法的研究与实现一、研究背景语音编解码技术是数字通信领域中比较重要的一项技术,它可以将语音信号数字化处理,并通过网络传输到远程终端进行重构和播放。
随着网络技术的快速发展,语音编解码技术也不断的发展和进步,目前已经出现了多种编解码算法,iLBC语音编解码器是其中一种较为优秀的算法,被广泛应用于VoIP通信系统、网络电信系统等领域。
二、研究意义该论文研究的是iLBC语音编解码器算法,对于现代通信技术研究具有一定的参考作用,具体体现在以下几个方面:1.提高语音通信质量:通过研究iLBC语音编解码器算法,可以提高音频质量,从而提高语音通信质量。
2.提高编解码效率:iLBC语音编解码器算法是一种高效的算法,它可以减少数据传输量,从而提高编解码效率。
3.推广应用:研究iLBC语音编解码器算法,可以为其在VoIP通信系统、网络电信系统等领域的应用提供技术支撑和推广作用。
三、研究内容和方法1.研究iLBC语音编解码器算法原理2.实现iLBC语音编解码器算法3.编写iLBC语音编解码器的demo程序4.对比iLBC语音编解码器与其他算法的通信效果研究方法主要包括文献研究、理论分析、仿真模拟、算法实现等方法。
四、论文结构第一章:绪论主要介绍研究背景、研究意义、研究内容和方法以及论文结构等方面。
第二章:iLBC语音编解码器算法原理主要介绍iLBC语音编解码器算法的模块构成、算法原理、流程等方面。
第三章:iLBC语音编解码器的实现主要介绍iLBC语音编解码器的实现方法和步骤,包括编码和解码的实现。
第四章:iLBC语音编解码器代码的实现主要介绍iLBC语音编解码器代码的实现,包括详细的编码解码流程图、编码解码代码及其注释等方面。
第五章:iLBC语音编解码器的测试主要介绍iLBC语音编解码器实现的测试,包括测试数据、测试环境、测试结果及其分析等方面。
第六章:总结与展望主要总结论文的研究内容和成果,展望iLBC语音编解码器算法应用前景和未来的研究方向。
ILBC编码算法及其在VOIP中的应用
摘要: VOIP正在成为热门的应用领域,语音质量语音质量的提高是其难点之一。
ILBC 算法是一种基于CELP(Code Excited Linear Predictive Coding)的新的低比特率语音编码算法,其优异的语音质量、突出的长时预测方法[1]及丢包掩蔽[2](PLC)技术,很好地解决了互联网上传输语音的问题。
详细探讨了ILBC的实现原理,对其关键技术进行了较深入的分析,给出了实验结论,并对其应用作了一些展望。
关键词: ILBC(Internet Low Bit Vate Codec) VOIP(Voice Over IP) PLC 丢包掩蔽动态码本
随着互联网的迅速发展,人们对通过互联网进行实时语音、视频传输的要求越发强烈,VOIP正是在这一应用背景下诞生的一门新技术,它把数字语音编码技术与分组交换网相结合,提供实时语音及其相关服务,该技术要求占用尽可能小的网络带宽并拥有良好的语音质量。
由于当前网络环境网络环境的特点,丢包现象不可避免,以往的低比特率编码标准虽然可以解决带宽问题,但丢包时语音质量不能保证。
因而,需要新的语音编码算法来满足这一要求。
1 ILBC简介ILBC是由Global IP Sound公司提出的一种专为包交换网络通信设计的编解码编解码,优于目前流行的G.729A、G.723.1,对丢包进行了特殊处理,既使在丢包率相当高的网络环境下,仍可获得非常清晰的语音效果。
ILBC是一种适用于窄带网络的编码算法。
根据网络带宽的不同,ILBC提供两种编码的格式,如表1。
该算法使用了长时的预测技术和帧独立编码方法,使其非常适合在存在丢包的网络环境中传播。
2 ILBC算法的原理2.1 ILBC编码ILBC本质上是一种基于帧的线性预测编码方法,是对CELP(码激励线性预测编码)的一种发展,其独有的动态码本更新技术、语音加强算法和丢包掩蔽技术使其在VOIP中应用时有更好的性能。
对于每一个含有160/240(20ms/30ms) 样点的输入帧,ILBC算法将进行以下主要操作:(1) 把该帧分为4/6 个子帧,每子帧40个样点。
对30ms的帧,进行两组10阶的LPC分析,得到相应的LPC系数;对于20ms的帧,进行一次10阶LPC分析。
(2)每次分析得到的LPC系数将转化为LSF(线谱对)参数,并对LSF系数进行量化,内插以得到各个子帧的LSF系数;随后,由各子帧的LSF系数得到各子帧对应的分析器,对各个子帧进行线性预测,计算各子帧的残差。
(3)从残差中找到两个能量最大的连续子帧,然后把能量值较小的首23/22个样点(30ms/20ms)或尾23/22样点从连续子帧中去除,剩余的57/58个被选定为本次处理的初始状态。
对于浊音语音,这样的选取方式将至少包含一个基音脉冲。
(4)对初始状态进行基于DPCM的标量量化,量化结果将作为编码输出的一部分。
与此同时,初始状态被存入码本存储区,以构成动态码本的初始值,用于对本帧的剩余样点进行矢量量化矢量量化。
(5)对于剩余的残差,矢量量化将按下面顺序进行:(a)包含有初始状态的两个连续子帧中剩余的23/22个样点;(b) 时间轴上处于初始状态之后的各个子帧; (c)时间轴上在初始状态之前的各个子帧。
对于此矢量量化,每次搜索码本的范围是动态码本,其中存储了已经被解码的对象,并随着最新的解码结果,该动态码本被更新。
(6)对编码结果进行封包处理。
ILBC的编码的框图。
2.2 ILBC解码ILBC是一种运用了分析合成方法的编解码算法,解码部分的运算量相对要小一些,使其在功能不强的客户端的实时解码成为可能。
解码的主要过程如下: (1)解包,参数提取。
(2)从得到的LSF参数进行内插,并转化各个子帧的LPC系数,以便进行合成操作。
(3) 对初始状态进行解码,解码结果一方面作为激励信号激励信号暂存,另一方面存入码本存储区,以构成动态码本的初始值。
(4) 对剩余的子帧部分,按照与编码相同的次序进行残差解码,并用解码结果更新动态码本,重复(4)直到所有子帧完成译码。
(5) 对于解码得到的残差信号,进行语音增强的操作。
该语音增强采用了条件限制的增强方法。
(6) 进行语音合成,形成解码后的语音。
(7) 高通滤波,以消除合成后的低频语音。
ILBC解码的流程图。
2.3 ILBC的比特流定义对于20 ms的帧,共使用了304个比特来表示编码后的语音信号,被封装在38个字节中;对于30ms的帧,共使用了400个比特,封装在50个字节中。
在封装的过程中,按照数据对传输误差的敏感程度不同,这些比特被分成三类,第一类代表了最敏感的数据[3]。
表2 列出了ILBC编码的比特流分配情况。
3 ILBC的关键技术与以往的低比特率语音编解码算法相比,ILBC除了采用经典的线性预测分析法、LPC系数到LSF系数相互转换、分裂矢量量化LSF参数和多级形状-增益量化[4]残差外,主要有下面特殊的方法。
(1) 基于初始状态的动态码本的选取和更新。
ILBC 利用了基于初始状态的动态码本的更新方法,把最新的解码结果加入码本,以取代较老的码矢。
通过这种算法,可以较为方便地生成码本,同时也提供了很好的码本预测能力。
(2) 帧间独立的长时预测方法,在此基础上的PLC(丢包掩蔽)技术。
经典的CELP方法是利用以往的激励信号来对自适应码本进行更新的,这样的方法在分组交换网中有下面问题:①如果过去的信号丢失或在传输过程中被污染,解码用的码本就会与编码时不同,将导致解码语音质量变差;②在语音建立阶段,解码端的自适应码本并不能很好地描述基音周期,导致解码语音建立时间加长。
ILBC采用了基于初始状态的解码方法,初始码本是从初始状态中得到的,通常都会包含至少一个基音脉冲,因而建立时间较快;同时,从初始状态出发,既有时间上前向的预测,也有向后的预测,因而体现了长时预测的概念,配合PLC技术,即使出现丢帧,解码语音质量也不会有明显下降。
PLC技术的基本原则是:解码端若收到正确的帧,则计算出的LPC系数和激励码本被存储; 若丢帧,则使用上一个正确帧中的激励信号,利用基音同步重复的方法得到本帧解码信号。
(3) 利用有条件限制的优化算法[3]加强残差语音。
该算法的主要思想是对要加强的残差语音块,寻找其前3个块和后3个块,用这6个块的线性组合逼近当前待加强的块。
计算待加强块和逼近块的均方误差。
若误差足够小,就把逼近块作为加强块;否则,加强块为待加强块和逼近块的线性组合。
4 实验结果与性能评测图3是Dynstat公司在具有丢包情况的网络环境下对ILBC、G729.A、G723.1几种算法进行测试后的MOS(平均意见得分)对比图,可以看出ILBC编码的语音质量整体高于其余两种编码,尤其是当丢包率较高时,MOS得分远高于另外两种编码。
为了对ILBC在丢帧时仍有良好语音质量做出解释,进行了以下实验: (1)在短时间内对有丢包时的解码片断做分析,。
实验得出,仅有一帧丢失时,语音的损坏基本上不会被听者察觉,当出现连续两帧以上丢失时,才会被察觉。
在文献[2]中有ILBC与G.729.A的丢帧对比。
(2)初始状态编码是ILBC中的关键步骤,应用了标量编码的方式。
为使编码更有效,实现时,先用一个全通滤波器将残差的动态范围压缩,解码时再通过逆滤波恢复。
图5是对某一帧语音的残差分析的结果,经过多帧测试发现,该技术使残差的动态范围减小了约1/3。
由于实时传输的需要,算法的时间复杂度成为实际系统实现时重要的考虑因素,在PC机(Celeron 2.7G, 512M内存)上对用ANSI-C实现的ILBC浮点算法[1]进行运算量统计,可以得到表3的结果,可以得到①解码的复杂度较小,是一种非对称的编码方案;②编码部分码本搜索占用了最长的时间,成为算法优化时要考虑的关键部分。
ILBC算法优异的语音质量及良好的丢包掩蔽技术,使其在VOIP中的应用前景非常广阔。
2002年2月,ILBC是IETF 接受的关于语音/音频编解码的第一个标准。
2004年4月在关于多媒体终端适配器和媒体网关分布的CableLabsPacketCable1.1 Audio/Video编解码规范中,被指定为强制的编解码算法。
软件与系统方面, Skype、Hostip、Pandora Networks和Pingtel Instant都对该算法进行支持,DSP及专用集成电路方面,TI 已经推出相应的定点DSP实现方案,AudioCodes已有专用芯片支持。
可以预计,不久的将来, ILBC将在VOIP中得到更加广泛的应用。