语音信号的倒谱分析共62页
- 格式:ppt
- 大小:520.50 KB
- 文档页数:31
实验四 语音信号的mel 频率倒谱参数1 实验目的通过Matlab 编程掌握语音信号的mel 频率倒谱参数的求解方法。
2 实验原理人耳听到声音的高低与声音的频率成对数关系,即:Mel(f)=2595lg(1+f/700),实际频率f 的单位是Hz.根据Zwicker 的工作,临界频率带宽随着频率的变化而变化,并与Mel 频率的增长一致。
类似与临界带的划分,可以将语音频率划分成一系列三角形的滤波器序列,如下图所示.取每个三角形的滤波器频率带宽内所有信号幅度加权和作为某个带通滤波器的输出,然后对所有滤波器输出做对数运算,再进一步做离散余弦变换得到MFCC 。
具体步骤如下:(1)三角滤波器的输出则为此频率带宽内所有信号幅度谱加权和。
()()()()()()()|()||()|()()()()c l h l n n k o l k c l k o l h l k Y l X k X k c l o l h l c l ==--=+--∑∑l = 1,2,....,40(2)对所有滤波器输出作对数运算ln(())Y l l = 1,2,....,40(3)作离散余弦变换(DCT )得到Mel 频率倒谱参数(MFCC)。
2411ln(())cos[()]224i l C Y l i l π==-∑i = 1,2,...,P ,P 为MFCC 参数的阶数,取P =16。
3 实验过程4 实验结果[x,fs,bits]=wavread('c:\WINDOWS\Media\chimes.wav');x=x(:,1);x=x';len=length(x);N=256;M=128;Fn=fix((len-N)/M+1);y=[];for i=1:Fndown=1+(i-1)*M;up=down+N-1;temp=x(down:up);temp=temp.*hamming(N)';y=[y;temp];endL=40;R=16;k=0:N/2;f=fs/N*k;%ÕâÀï²»ÒªÔÙ³ýÒÔ2mel=2595*log(1+f/700);%melm=max(mel)melm=2595*log(1+fs/1400);r=0:L+1;tri=melm/(L+1)*r;s=[];for j=1:Fntemp1=y(j,:);p=abs(fft(temp1));for l=1:Ltri1=[tri(l),tri(l+1),tri(l+2)];low=find((mel>=tri1(1))&(mel<=tri1(2)));high=find((mel>=tri1(2))&(mel<=tri1(3)));w=[(mel(low)-tri1(1))/(tri1(2)-tri1(1)),(tri1(3)-mel(high))/(tri1(3)-tri1(2))];%ÕâÀﶪÁËÀ¨ºÅ£¬²¢ÇÒ±äÁ¿Ãû×Ö¸ã´í%tri3=tri(3)%tri2=tri(2)% w2=(tri(3)-mel(high))/(tri(3)-tri(2))m(l)=sum(w.*p([low,high]),2);endl=1:L;for q=1:Rc(q)=sqrt(2/N)*sum(log(m).*cos((l-0.5)*q*pi/L),2);ends=[s;c];endplot(s')%³ÌÐò±àдʱעÒâ±äÁ¿µÄÃû³Æ¸ãÇå³þ£¬²»ÒªÈ¡Ïà½üµÄÃû×Ö¡£À¨ºÅ²»ÒªÂ©µô¡£。
图
图
图
(2).倒频谱的应用
分离信息通道对信号的影响
图2.26对数功率谱关系图。
在机械状态监测和故障诊断中,所测得的信号,往往是由故障源经系统路径的传输而得到的响应,也就是说它不是原故障点的信号,如欲得到该源信号,必须删除传递通道的影响。
如在噪声测量时,所测得之信号,不仅有源信号而且又有不同方向反射回来的回声信号的混入,要提取源信号,也必须删除回声的干扰信号。
若系统的输入为x(t),输出为y(t),脉冲响应函数是h(t),两者的时域关系为: y(t)=x(t)*h(t)
频域为: Y(f)=X(f)*H(f)或Sy(f)=Sx(f)*|H(f)|2
对上式两边取对数,则有:
(2.11)
式(2.72)关系如图(2.26)所示,源信号为具有明显周期特征的信号,经过系统特性logGk(f)的影响修正,合成而得输出信号logGy(f)。
对于(2.72)式进一步作傅里叶变换,即可得幅值倒频谱:
(2.12)
即:
(2.13)
以上推导可知,信号在时域可以利用x(t)与h(t)的卷积求输出;在频域则变成X(f)与H(f)的乘积关系;而在倒频域则变成Cx(q)和Ch(q)相加的关系,使系统
特特性Ch(q)与信号特性Cx(q)明显区别开来,这对清除传递通道的影响很有用处,而用功率谱处理就很难实现。
图(2.26b)即为相应的倒频谱图。
从图上清楚地表明有两个组成部分:一部分是高倒频率q2,反映源信号特征;另一部分是低倒频率q1,反映系统的特性。
两部分在倒频谱图上占有不同的倒频率范围,根据需要可以将信号与系统的影响分开,可以删除以保留源信号。
实验三 语音信号进行倒谱分析一、 实验目的、要求1. 理解倒谱分析的作用2. 掌握倒谱分析求基音周期的方法3. 了解LPC 倒谱分析方法二、实验原理1.倒谱分析原理同态信号处理也称为同态滤波,实现将卷积关系变换为求和关系的分离处理,即解卷。
如 进行如下3步处理对于语音信号进行解卷,可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基音周期,用于语音编码、合成和识别。
同态信号处理的基本原理(1)第一个子系统D*[](特征系统)完成将卷积信号转化为加性信号的运算。
)(ˆ1n x 和 )(ˆ2n x信号也均是时域序列,但它们所处的离散时域显然不同于x(n)所处的离散时域,故把它称之为复倒频谱域。
)(ˆn x是x(n)的复倒频谱,简称为复倒谱,有时也称为对数复倒谱。
复倒谱具体计算公式其中倒谱计算公式为:2 线性预测原理线性预测分析的基本思想由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值。
通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数,而这组系数就能反映语音信号的特性,可以作为语音信号特征参数来用于语音编码、语音合成和语音识别等应用中去。
线性预测分析的基本原理每个采样值由前面的p 个采样值线性组合所构成。
记为x '(n),有:)(ˆ)(ˆ)(ˆ)](ˆ)(ˆ[)](ˆ[)3()(ˆ)(ˆ)(ˆ)(ln )(ln )(ln )2()()()()]([)1(212111212121n x n x n x z X z X Z z X Z z X z X z Xz X z X z X z X z X z X n x Z =+=+==+=+=⋅==--12()()()x n x n x n =*1ˆ()[ln (())]x n Z Z x n -=[()]()ˆ()ln ()ˆˆ()[()]jw jw jw jw DFT x n X e Xe X e xn IDFT X e ===要提高预测精度,就是要预测系数{k a }的取值使e(n)最小。