一种基于ACELP的4.8kbps语音声码器
- 格式:pdf
- 大小:155.64 KB
- 文档页数:3
各种音频编码方式的对比内容简介:文章介绍了PCM编码、WMA编码、ADPCM编码、LPC编码、MP3编码、AAC编码、CELP编码等,包括优缺点对比和主要应用领域。
PCM编码(原始数字音频信号流)类型:Audio制定者:ITU-T所需频宽:1411.2 Kbps特性:音源信息完整,但冗余度过大优点:音源信息保存完整,音质好缺点:信息量大,体积大,冗余度过大应用领域:voip版税方式:Free备注:在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。
因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。
要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。
一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为44.1K×16×2 =1411.2Kbps。
我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。
WMA(Windows Media Audio)类型:Audio制定者:微软公司所需频宽:320~112kbps(压缩10~12倍)特性:当Bitrate小于128K时,WMA几乎在同级别的所有有损编码格式中表现得最出色,但似乎128k是WMA一个槛,当Bitrate再往上提升时,不会有太多的音质改变。
优点:当Bitrate小于128K时,WMA最为出色且编码后得到的音频文件很小。
缺点:当Bitrate大于128K时,WMA音质损失过大。
WMA标准不开放,由微软掌握。
应用领域:voip版税方式:按个收取备注:WMA的全称是Windows Media Audio,它是微软公司推出的与MP3格式齐名的一种新的音频格式。
TETRA系统中语音编解码算法的实现
谭学治;王蕾;苏闽
【期刊名称】《无线电工程》
【年(卷),期】2003(033)003
【摘要】ACELP(代数码本激励线性预测)是一种速率为4.8kbps适用于数字集群系统的语音编码方案.该算法采用代数码本作为激励,具有合成音质高、算法复杂度低等优点.该文简要分析了ACELP算法的基本原理,并且介绍了该算法应用在数字集群系统中的DSP实现.
【总页数】2页(P64-9-64-11)
【作者】谭学治;王蕾;苏闽
【作者单位】哈尔滨工业大学通信技术研究所;哈尔滨工业大学通信技术研究所;哈尔滨工业大学通信技术研究所
【正文语种】中文
【中图分类】TN91
【相关文献】
1.TETRA数字集群通信系统中Viterbi译码的FPGA设计与实现 [J], 吴菲
2.TETRA语音编解码算法的DSP实现及其优化设计 [J], 代光发;夏细苟;胡亮;陈少平
3.G.729语音编解码算法的DSP系统实现 [J], 阚海鹰;万旺根;王宁
4.一种TETRA数字集群系统中估计信干比的算法 [J], 孙昕;张钦
5.TETRA数字集群系统语音编解码算法研究 [J], 杨曾旭;鲁昆生
因版权原因,仅展示原文概要,查看原文内容请购买。
各种音频编码方式的对比内容简介:文章介绍了PCM编码、WMA编码、ADPCM编码、LPC编码、MP3编码、AAC编码、CELP编码等,包括优缺点对比和主要应用领域。
PCM编码(原始数字音频信号流)类型:Audio制定者:ITU-T所需频宽:1411.2 Kbps特性:音源信息完整,但冗余度过大优点:音源信息保存完整,音质好缺点:信息量大,体积大,冗余度过大应用领域:voip版税方式:Free备注:在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。
因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。
要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。
一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为44.1K×16×2 =1411.2Kbps。
我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。
WMA(Windows Media Audio)类型:Audio制定者:微软公司所需频宽:320~112kbps(压缩10~12倍)特性:当Bitrate小于128K时,WMA几乎在同级别的所有有损编码格式中表现得最出色,但似乎128k是WMA一个槛,当Bitrate再往上提升时,不会有太多的音质改变。
优点:当Bitrate小于128K时,WMA最为出色且编码后得到的音频文件很小。
缺点:当Bitrate大于128K时,WMA音质损失过大。
WMA标准不开放,由微软掌握。
应用领域:voip版税方式:按个收取备注:WMA的全称是Windows Media Audio,它是微软公司推出的与MP3格式齐名的一种新的音频格式。
G. 729 CS-ACELP 语音编码算法的优化及其DSP 实现绪论G.729CS-ACELP语音编码算法就是一种以共轭代数码本激励线性预测为基础, 且编码速率为8kb/s的高质量的语音编码标准.对输入的语音信号采用8kHz采样,16bit线性PCM量化,得到的数据作为编码器的输入。
每80个样点为1个语音帧,每帧10ms。
由于其在线性预测参数量化上,使用分裂式矢量量化;在自适应码本搜索上,采用开环、闭环相结合,分数延时码矢量搜索;固定码本采用具有特殊结构的代数码本;激励序列的增益采用了预测式矢量量化。
在解码端,把接收到比特流恢复成参数编码,解码后得到各个参数,然后利用这些参数通过简单的运算和查表等操作恢复语音数据,并用后置滤波器增强音质。
G.729获得了较高的语音合成质量和较低的语音算法复杂度.G.729语音编码算法由于其具有的算法复杂度低、编码效率高、语音质量好等优点,被数字语音记录设备所广泛采用.算法复杂度越低,实时实现的硬件系统越简单,而8kbit/s的高效率编码使其能够在保证语音质量的前提下,大大减小语音记录所需要的存储空间.1.G.729 CS-ACELP算法的特点G.729编码器将输入信号分为10ms语音帧,对每帧提取CELP模型参数(包括线性预测参数、固定码本和自适应码本码矢量以及对应的增益) ,并将其编码后的比特流(80bit/frame)送信道传输.图1给出了CS-ACELP算法编码器原理框图.图1 CS-ACELP算法编码器图8kbit/s CS-ACELP算法的帧长为10ms,分两个子帧进行处理.采样输入的语音信号首先经过高通滤波器去除直流及低频分量的干扰,然后按每一帧提取10阶LP参数并转化为LSP(线谱对)参数进行量化、编码;用量化后的LSP参数返求得的LP参数分别构成感觉加权滤波器W (z)以及合成滤波器1/A’(z);目标信号是从加权语音中除去感觉加权滤波器的零输入响应而求得的,目标信号经过自适应码本搜索及固定码本搜索后产生激励信号,分别乘以各自的增益,并共同激励合成滤波器,产生本地重建语音信号.由此可看出,CS-ACELP语音编码算法主要包括LP参数的提取、量化及编码、自适应码本搜索、固定码本搜索和增益矢量量化四个部分.1.1 LP参数的量化、编码利用Levinson-Durbin算法每一帧提取10阶LP参数,量化时先将其转化为L SP参数,以利于系统稳定,然后再按均方误差(MSE)最小原则将其量化为18bit进行传输.由于LSP特征矢量的各个分量虽然属于一个整体,但它们对幅度谱的影响只局限于各自的频率区域内,这就使其可以将一维数较高的特征矢量分裂为两个维数较低的特征矢量分别进行矢量量化,即分裂式矢量量化G.729采用两级分裂式矢量量化,首先利用MA(滑动平均)滤波器结合前几帧的LSP系数预测当前帧的LSP码向量,然后根据均方误差最小原则,在码书1中搜索出对应的码矢,将其量化为7bit;第二级量化将第一级量化得到的最小均方误差矢量分为两个子分量,前五个构成一个子矢量,后五个分量构成一个子矢量,分别量化为5bit.采用多级分裂式矢量量化,不但可以大大减少码书的搜索量、存储量,又使整体量化精度得以保持.1.2 自适应码本搜索G.729自适应码本搜索先采用开环的方法,在每个子帧内利用加权语音的相关性计算出开环延迟后,再用闭环方法在延时为开环延迟的一个小范围内搜索出最佳自适应码矢量.闭环分数延迟的搜索过程分两个子帧进行,第一子帧利用开环延迟求得的参考值搜索,使用8bit编码;第二子帧在第一子帧最佳分数延时的基础上搜索出本子帧的最佳基音延时.这是由于语音信号具有短时平稳性,最佳自适应激励码序列前后相差不大,可以采用差分搜索和编码,因此第二子帧可以用差分量化的方法将其量化为5bit,从而减少了码本的量化比特,提高了编码效率.1.3 固定码本的结构及其搜索传统的CELP算法中,用一个自适应码本中的码字来逼近语音的长时周期性(基音)结构,而用一个固定的随机码本中的码字来逼近语音的经过短时、长时预测后的信号,即逼近由自适应预测所得的语音信号与原始语音的误差,从而为合成语音提供更精确的误差补偿,提高语音质量.G.729 的代数码本结构采用插入单脉冲排列(ISPP)设计方案,这种码本的每个码矢都有四个位于不同样点子集的单位脉冲构成,同时又采用解析码本方案,解码器利用传输码流本身的信息就可以重构码矢和码本增益,而不需要象通常的矢量量化方法那样,去搜索一个具体的码本,从而提高了效率.1.4 增益的矢量量化增益量化分为自适应码本和固定码本增益两种,由于自适应码本增益大小与语音信号准周期性强弱密切相关,它在各子帧之间变化较大,可直接进行量化;而固定码本的增益则由于语音信号的短时平稳性而具有较强的帧间相关性,可以通过增益预测来提高增益的量化精度和量化效率.1.5G.729解码器解码器结构如图2所示,首先从接收比特流中提取参数序号,解码这些序号得到10 ms语音帧对应得编码参数。
PDT与Tetra业务能力比较张莹;孙鹏飞【摘要】公安部科技信息化局为了实现全国数字集群一张网的目标,于2013年发布了新一代警用数字集群系列标准( PDT)。
根据PDT和Tetra标准在语音业务和数据业务的承载能力、性能、语音声码器及组网等方面的规定,结合网络覆盖、用户分布等特点,针对语音组呼和卫星定位等主要业务进行了对比分析。
虽然Tetra标准在数据业务上能力上存在一定的优势,但在中国警用广域覆盖和语音通信为主、数据业务为辅的需求前提下,仍可以得出PDT的综合性能更适合中国警用需求的结论。
%In order to build a wide wireless digital trunking communication network in China,the Science and TechnologyInforma⁃tization Bureau of Ministry of Public Security of the People’ s Republic of China released a series of police digital trunkingcommunica⁃tion system standards in 2013.According to the definition of PDT and Tetra standard on bearing capacity of voice and data services, performances,vocoder, networking, etc., the primary services such as voice group call and satellite positioning are analyzed and compared combining with such characteristics as network coverage and user distribution. Under the precondition of requiring wide⁃area coverage and voice communication more than data service for police communication in China, although Tetra standard has some advantages on data service capability,it is concluded that PDT is more suitable for police communication in China.【期刊名称】《无线电工程》【年(卷),期】2015(000)006【总页数】5页(P12-15,91)【关键词】PDT;Tetra;警用集群通信【作者】张莹;孙鹏飞【作者单位】中国电子科技集团公司第五十四研究所,河北石家庄050081;哈尔滨工业大学通信技术研究所,黑龙江哈尔滨150080【正文语种】中文【中图分类】TN929我国现行的数字集群标准包括:SJ/T11228-2000《数字集群移动通信系统体制》、TETRA和PDT3个标准。
图1 GSM编码器框图(1)预处理:去除语音的直流分量,进行预加重;(2)LPC分析:预测滤波器的系数,每帧(20 ms)计算一次滤波器的系数,GSM方案中取滤波器的阶数为8。
(3)短时分析滤波:对信号做短时预测分析,产生短时残差信号。
(4)长时预测:在RPE中用规则脉冲来代替残差信号,因此直接用短时预测的残差信号,未必是最佳效果,此外,C D M A2000中采用的语音编码EVRC(Enhanced Variable Rate Code),它是一种可变速率语音编译码算法,根据噪音情况采用3种不同速率:全速率,半速率和1/8速率,对应9.6 kbit/s,4.8 kbit/s 1.2 kbit/s,平均编码速率为8 kbit/s,其质量与13 kbit/s QCELP算法相当。
WCDMA中优选的语音编码方案是自适应多速率语音编码(AMR),全速率模式下有8种编码速率,半速率模式下有6种编码速率,其目的是优化当前信道下的语音质量。
AMR编码是以自适应码本激励线性预测编码ACELP 技术为基础。
图2 不同系统的语音编码的可造速率从PHS到GSM到IS-95再到3G中的变速率及语音激活技术,正体现了这一发展趋势。
我们可以发现,在3G 系统中编码速率根据不同的环境特点有了更多的选择,以期达到传输效率和语音质量的更好平衡。
从另一个角度来看,由于3G是从不同的2G标准发展而来,考虑平滑过渡,必然导致3G标准各不相同;同时,3G又提供多种多样的服务业务;这两点必然导致一种编码速率无法满足所有标准、无法满足所有业务要求。
3 信道编码无线环境的恶劣性对接收信号的错误率有很大影响,这正是信道编码要解决的问题。
GSM与IS95中的信道编码:主要采用卷积编码,还有FIRE码及卷积和RS的级联码。
卷积编码就是将信息序列以ko个码元分段,通过编从上面的描述中,我们可以看到:卷积编码应用于低速率的话音业务,误码率BER=10-3级;Turbo编码用于传输速率高于32 kbit/s的业务,误码率BER=10-3~10-6级。