最新[工学]5第三讲语音信号数字化及压缩编码教学讲义ppt课件
- 格式:ppt
- 大小:939.00 KB
- 文档页数:98
1第3章数字音频压缩编码⏹3.1 数字音频编码概述⏹3.2 常用数字音频编码技术⏹3.3 MPEG-1音频编码标准⏹3.4 MPEG-2 音频编码标准⏹3.5 MPEG-4 音频编码标准⏹3.6 Enhanced aacPlus编码技术⏹3.7 中国制定的音频编码标准⏹3.8 新一代环绕多声道音频编码格式本章学习目标⏹熟悉数字音频压缩编码的机理。
⏹了解音频编解码器的性能指标和重建音频质量的评价方法。
⏹熟悉数字音频编码的基本方法及分类。
⏹掌握感知音频编码的基本原理,理解子带编码的基本思想。
⏹重点掌握MPEG-1、MPEG-2 AAC的音频编解码原理。
⏹了解AVS音频立体声编解码的原理和DRA多声道数字音频编解码的原理。
⏹了解新一代环绕多声道音频编码格式。
3.1 数字音频编码概述⏹3.1.1 音频信号的分类⏹3.1.2 数字音频压缩编码的机理⏹3.1.3 音频编解码器的性能指标⏹3.1.4 数字音频编码技术的分类⏹3.1.5 数字音频编码标准概述音150Hz ~ 10 000Hz 音200Hz ~ 3 400HzM )50Hz ~ 7 000HzM )20Hz ~ 15 000Hz响10Hz ~ 20 000Hz 音100Hz ~ 9 000Hz 声音的质量与它所占用的频带宽度有关。
3.1.2■数字音频压缩的必要性3.1.2 数字音频压缩编码的机理⏹从信息保持的角度讲,只有当信源本身具有冗余度,才能对其进行压缩。
⏹信号一部分可由另一部分重建或可用另外表达形式简单说明,称为信号有冗余。
⏹音频信号存在着多种形式的冗余。
⏹时域冗余⏹频域冗余⏹听觉冗余⏹去除冗余实现压缩编码。
音频信号的时域冗余⏹幅度分布的非均匀性⏹小幅度样本出现的频率高⏹样值之间的相关性⏹当采样频率为 8kHz 时,相邻样本间的相关系数大于 0.85;⏹周期之间的相关性⏹在特定瞬间,某段声音往往只是总频带 300~3400Hz 的少数几个频率分量在起作用→象某些振荡波一样,在周期与周期之间存在一定的相关性⏹基音之间的相关性⏹男声基音周期为 5~20ms,而典型的浊音持续 100ms⏹静止系数(话音间隙)⏹全双工话路的典型效率约为 40%(静止系数为 0.6)⏹长时自相关性⏹如几十秒内的相关性例: 语音信号的时域冗余‘1’‘2’一个单音 ‘1’基音周期(音调周期)音频信号的频域冗余从频域考察音频信号的功率谱密度:⏹非均匀的长时间功率谱密度⏹长时间功率谱呈现强烈的非平坦性,高频能量较低→时域上相邻样本相关。
《数字通信》第3章语音信号压缩编码(2)复习⏹语音压缩编码研究的基本问题是什么?⏹能够进行语音信号压缩的依据是什么?⏹DPCM的工作原理是什么?⏹与DPCM相比,ADPCM增加了什么辅助措施?⏹子带编码的工作原理是什么?复习⏹语音压缩编码⏹所有码速率低于PCM编码比特率64kbit/s的语音编码技术。
⏹研究的基本问题是如何尽可能降低语音编码所需要的比特率。
⏹能够进行语音信号压缩的依据:⏹语音信号在(1)时域、(2)频域和(3)人类听觉感知域存在多种多样的冗余。
⏹语音编码分类:⏹包括(1)波形编码、(2)参量编码和(3)混合编码。
⏹语音质量评价:⏹一般采用平均意见分MOS复习⏹DPCM⏹对差值序列进行量化编码的方法,传输的编码为样值与预测值之差⏹预测值为历史样值的线性和:⏹ADPCM:⏹为了进一步提高DPCM方式的质量,需要采取一些辅助措施,即自适应处理。
⏹包括两方面:(1)自适应量化;(2)自适应预测。
1()()Nsi s s i S nT W S nT iT ==-∑内容1.同学PPT演示2.参量编码3.混合编码4.低速率语音压缩编码的应用1.同学PPT演示2.参量编码参量编码基本原理:⏹根据对语音形成机理的分析,着眼于构造语音生成模型(对应为具有一定零极点分布的数字滤波器)⏹发送的信息:语音生成模型的参数⏹特点:⏹编码比特率较低⏹语音质量相对较差语音形成机理:⏹音素分为两类:⏹伴有声带振动的音称为浊音⏹声带不振动的音称为清音⏹浊音⏹又称有声音。
语声发声时声带在气流的作用下激励起的准周期声波⏹基音频率范围内:50-250Hz⏹能量集中在基音和基音的多次谐波频率附近⏹清音⏹又称无声音。
声带不振动,而是由气流引起的湍流。
⏹没有周期性⏹能量集中在比浊音更高的频率范围内浊音声压波形和频谱:周期性共振峰频率清音声压波形和频谱:非周期性语音信号产生模型:周期性信号:浊音激励源随机性型号:清音激励源G:增益控制线性预测编码(LPC)基本概念(1):基础:(1)语音信号具有慢变化特征:对大多数语音来说可以认为其激励源和声道的特性在10-20ms内保持不变(2)线性预测分析:用过去若干个语音抽样的线性组合来逼近当前语音抽样(3)系数确定原则:在给定的时间内,使e(n)的平方和最小100()()()()()(), 1ppre i i ppre i i x n a x n i e n x n x n a x n i a ==⎧=--⎪⎪⎨⎪=-=-=⎪⎩∑∑线性预测编码(LPC)基本概念(2):⏹与ADPCM区别:⏹ADPCM传输预测残差,LPC传输预测系数⏹ADPCM关注每个样值的绝对一致性,LPC关注每个短时内的主观一致性⏹ADPCM传输每一个采样值的预测残差,LPC传输整个帧的预测系数参量编码的声码器:⏹线性预测编码声码器:⏹语音分为两大类:浊音和清音⏹浊音模型:准周期脉冲序列⏹清音模型:白色随机噪声激励⏹开环方式⏹传输参数:(共15个参量)(1)清/浊音判决u/v(2)基音周期TP(3)增益G(4)声道模型参数{ a} ---12个i线性预测编码声码器:线性预测编码(LPC)实现方框图⏹通道声码器:⏹带通滤波器组对输入信号进行滤波⏹对每个滤波器,输出1个幅度谱均值,一组数据就反应了信号频谱的包络⏹发送信号:频谱包络数据、清浊音判决和基音周期⏹接收端:通过清浊音判决和基音周期提供声门激励信号,并用频谱包络信号对其进行调制,经带通滤波器输出后叠加在一起就合成为输出语音信号⏹缺点:(1)需要进行基音检测和清浊音判决,而精确求出这两组数据非常困难,且其误差对合成语音质量影响较大(2)通道数有限导致可能多个谐波分量会落入同一个通道,在合成时它们被赋予相同的幅值,结果会导致合成信号的频谱畸变⏹共振峰声码器:⏹共振峰(formant):声音在经过共振腔时,受到腔体的滤波作用,使得频域中不同频率的能量重新分配,一部分因为共振腔的共振作用得到强化,另一部分则受到衰减,得到强化的那些频率在时频分析的语图上表现为浓重的黑色条纹。