第08讲_码本激励线性预测编码.pptx
- 格式:pptx
- 大小:1.70 MB
- 文档页数:95
预测编码的基本原理随着数字化的快速发展,我们已经进入了数字时代。
数字内容广泛应用于各种场景,包括图片、视频、音频等。
当我们需要在不同设备之间传输这些文件时,文件的大小和质量成为非常重要的问题。
这就促使了预测编码技术的出现。
本文将介绍预测编码的基本原理。
1. 数字信号模型:在数字信号模型中,信号在时间或空间维度上是一段离散数据的序列。
例如,当我们在拍摄一段视频时,视频中的每一帧都是由像素点组成的一个离散数据序列。
而这些像素值就组成一个数字信号模型。
2. 基于预测的压缩:基于预测的压缩是一种常见的压缩技术,可以有效地压缩数字信号。
在预测编码过程中,我们需要选取一个预测器来预估下一个值。
这个预测器可以是简单的线性预测器,也可以是更复杂的模型。
3. 线性预测:在应用线性预测的时候,我们首先需要找到一个理想的预测器,使得预测残差的值最小。
在具体实现中,预测器的系数需要通过最小二乘法进行估计。
4. 预测比特:预测编码是基于预测残差的差异进行编码的。
预测残差表示实际值和预测值之间的差异。
对于一个离散的数字信号模型,预测得到的残差一般是一个整数值。
在进行编码的时候,我们需要将残差转换成二进制码流进行传输。
5. 自适应编码:为了更有效地进行编码,我们还需要了解每种编码方式的效率。
这就是自适应编码,它是根据每个符号出现的概率来调整码长的编码方法。
6. 预测编码的应用:预测编码被广泛应用于数字媒体的压缩和传输中。
例如,在视频压缩领域,有很多基于预测编码的压缩标准,比如MPEG-2、H.264等。
本文简单介绍了预测编码的基本原理。
预测编码是数字媒体领域中非常重要的技术,它可以有效地实现数字媒体的压缩和传输。
随着数字媒体技术的不断发展,预测编码将会发挥更加重要的作用。
语⾳压缩编码语⾳编码第⼀章⾳频1.1 ⾳频和语⾳的定义声⾳是携带信息的重要媒体,是通过空⽓传播的⼀种连续的波,叫声波。
对声⾳信号的分析表明,声⾳信号有许多频率不同的信号组成,这类信号称为复合信号。
⽽单⼀频率的信号称为分量信号。
声⾳信号的两个基本参数频率和幅度。
1.1.1声⾳信号的数字化声⾳数字化包括采样和量化。
采样频率由采样定理给出。
1.1.2声⾳质量划分根据声⾳频带,声⾳质量分5个等级,依次为:电话、调幅⼴播、调频⼴播、光盘、数字录⾳带DAT(digital audio tape)的声⾳。
第⼆章语⾳编码技术的发展和分类现有的语⾳编码器⼤体可以分三种类型:波形编码器、⾳源编码器和混合编码器。
⼀般来说,波形编码器的话⾳质量⾼,但数据率也很⾼。
⾳源编码器的数据率很低,产⽣的合成话⾳⾳质有待提⾼。
混合编码器使⽤⾳源编码器和波形编码器技术,数据率和⾳质介于⼆者之间。
语⾳编码性能指标主要有⽐特速率、时延、复杂性和还原质量。
其中语⾳编码的三种最常⽤的技术是脉冲编码调制(PCM)、差分PCM(DPCM)和增量调制(DM)。
通常,公共交换电话⽹中的数字电话都采⽤这三种技术。
第⼆类语⾳数字化⽅法主要与⽤于窄带传输系统或有限容量的数字设备的语⾳编码器有关。
采⽤该数字化技术的设备⼀般被称为声码器,声码器技术现在开始展开应⽤,特别是⽤于帧中继和IP上的语⾳。
在具体的编码实现(如VoIP)中除压缩编码技术外,⼈们还应⽤许多其它节省带宽的技术来减少语⾳所占带宽,优化⽹络资源。
静⾳抑制技术可将连接中的静⾳数据消除。
语⾳活动检测(SAD)技术可以⽤来动态跟踪噪⾳电平,并将噪⾳可听度抑制到最⼩,并确保话路两端的语⾳质量和⾃然声⾳的连接。
回声消除技术监听回声信号,并将它从听话⼈的语⾳信号中清除。
处理话⾳抖动的技术则将能导致通话⾳质下降的信道延时与信道抖动平滑掉。
2.1波形编码波形编解码器的思想是,编码前根据采样定理对模拟语⾳信号进⾏采样,然后进⾏幅度量化与⼆进制编码。
码本激励线性预测(CELP)编码3.2.7码本激励线性预测(CELP)编码码本激励线性预测(Codebook Excited Linear Prediction,cELP)编码简称为码本激励编码。
它是一种用码本(Codebook)作为激励源的编码方法。
把残差信号可能出现的、已经量化了的、按一定规则排列的各种样值事先存储在存储器中,好像一本字典一样。
每一个样值组合都有一地址码,所以这个存储器就称为码本。
收、发方各有一个同样的码本。
在线性预测的过程中,并不传输残差信号的本身,而是先在本方的码本中,榆查出与这信号最接近的样值组合的地址码,然后将这个码本的地址码发送到对方。
对方收到这个地址码,从同样的码本中取出这个地址的残差信号,然后通过滤波器得到重建的话音。
由于不传输残差信号的本身,而传输的是码本上的地址码,所以大大减少了传输的比特数,可得到低速率的编码器。
因此只要码本编得好,只要它有足够的数量而义和实际的残差信号十分接近,那么在低速率的编码下就得到较好的话音质量。
因此编一个好的码本是这种编码的关键。
码本的要求如下:①码本中的信号应与实际信号非常相近,即相差最少。
②在满足第一条的条件下,码本容量最小。
这样地址码数目少,即编码的长度最小。
③检查码本找出最接近信号(即搜索码本)的时问最短。
这样处理时间短,时延小。
码本的编制举例如下。
把话音每20ms为一帧,每帧又分为4个子帧,则每个子帧为5ms,采样率为8 000Hz,这样每个子帧共有40个样点。
40个样点经LPC预测分析后可得到残差信号,也是40个样点。
将这40个样点组合用l0比特的编码来代表,l0比特共可编出l 024种序列。
把这l 024种编码序列存储起来就可代表话音中的各种可能的残差信号,这就是码本,这个码本的容量为1024。
显然,只用1024种编码来代表40个样点的各种可能的情况是不够的。
但如果能够选择最可能的1024种情况,使它在实际运用时,合成话音的主观感觉误差最小,那么这个码本就是可以使用。
用线性预测原理降低编码数码率的信号编码。
它主要用于话音、图像和遥测信号的编码。
信号一般是时间的函数,具有前后相关联的性质(相关性),后面的信号是由前面的信号渐变而来的,知道前面的信号就能对即将到来的信号进行预测。
前后信号相关性越强,这种预测就越准确。
预测编码不是对连续的信号直接采样后编码,而是先根据信号的相关性测算,把测算用的参数以及测算值和真实值的误差进行编码。
在一般情况下它的编码数码率比直接采样后编码的数码率低得多。
线性预测预测之前先把信号离散化(采样)。
设过去的已知采样值序列为s n-1,s n-2,…,则可用下式预测即将到来的(现时)样值x nx n(预测值)=ɑn-1s n-1+ɑn-2s n-2+…+ɑn-p s n-p= ɑn-k s n-k即把过去的p个样值s n-k分别乘上适当的系数ɑn-k,再累加起来即得到现时样值的预测值。
当ɑn-k取实数,则p个样值中任何一个有变化,都使预测值x n成比例地变化。
预测公式是一个线性方程,所以这种预测称为线性预测。
式中p称为预测阶数;ɑn-k称为预测系数;真实值与预测值之差e n=s n-x n,称为预测误差。
预测的目的就是找出一组合适的系数ɑn-k,使误差e n的统计值最小。
实际预测过程一般是先把采样序列按一定的数目组成帧,然后逐帧进行预测,每帧都找出该帧的p 个最佳预测系数ɑn-k。
预测的好坏(精确度)不是以某一个样值的预测结果来衡量,而是要看帧内各样值预测的总效果。
在用线性预测编码通信时,把每帧的p 个预测系数和各样值预测误差e n编码后传输。
收信端则利用这些参数来重建原信号。
话音信号预测话音信号有以下的特性:①浊音是准周期信号,邻近周期具有相似的波形,即前后波形按基音周期相关联;②由口、鼻腔构成的声道在传输声源信号时有能量集中区或共振峰。
声道是惰性腔体,不可能发生突变,因而话音信号具有短时间内的相关性。
根据话音信号的特性,可以取帧长为25毫秒,则每秒有40帧。