语音信号处理实验

格式：pdf
大小：518.47 KB
文档页数：30

下载文档原格式

语音信号处理实验报告.docx

在浊音清音对比中，可以发现，对呈现谐波特征的浊音语音谱来说这个特点很明显，就是在谐波成分处LPC谱匹配信号谱的效果要远比谐波之间好得多。
在实验中，当P值增加到一定程度，预测平方误差的改善就不很明显了，而且会增加计算量，一般取为8~14，这里P取为10。
5.基音周期估计
①自互相关函数法
②短时平均幅度差法
二．实验过程
1. 系统结构
2.仿真结果
（1）时域分析
男声及女声（蓝色为时域信号，红色为每一帧的能量，绿色为每一帧的过零率）
某一帧的自相关函数
3.频域分析
①一帧信号的倒谱分析和FFT及LPC分析
②男声和女声的倒谱分析
③浊音和清音的倒谱分析
④浊音和清音的FFT分析和LPC分析（红色为FFT图像，绿色为LPC图像）
从男声女声的时域信号对比图中可以看出，女音信号在高频率分布得更多，女声信号在高频段的能量分布更多，并且女声有较高的过零率，这是因为语音信号中的高频段有较高的过零率。
2.频域分析
这里对信号进行快速傅里叶变换（FFT），可以发现，当窗口函数不同，傅里叶变换的结果也不相同。根据信号的时宽带宽之积为一常数这一性质，可以知道窗口宽度与主瓣宽度成反比，N越大，主瓣越窄。汉明窗在频谱范围中的分辨率较高，而且旁瓣的衰减大，具有频谱泄露少的有点，所以在实验中采用的是具有较小上下冲的汉明窗。
三．实验结果分析
1.时域分析
实验中采用的是汉明窗，窗的长度对能否由短时能量反应语音信号的变化起着决定性影响。这里窗长合适，En能够反应语音信号幅度变化。同时，从图像可以看出，En可以作为区分浊音和清音的特征参数。
短时过零率表示一帧语音中语音信号波形穿过横轴（零电平）的次数。从图中可以看出，短时能量和过零率可以近似为互补的情况，短时能量大的地方过零率小，短时能量小的地方过零率较大。从浊音和清音的时域分析可以看出，清音过零率高，浊音过零率低。

语音信号处理实验报告实验二

语音信号处理实验报告实验二一、实验目的本次语音信号处理实验的目的是深入了解语音信号的特性，掌握语音信号处理的基本方法和技术，并通过实际操作和数据分析来验证和巩固所学的理论知识。

具体而言，本次实验旨在：1、熟悉语音信号的采集和预处理过程，包括录音设备的使用、音频格式的转换以及噪声去除等操作。

2、掌握语音信号的时域和频域分析方法，能够使用相关工具和算法计算语音信号的短时能量、短时过零率、频谱等特征参数。

3、研究语音信号的编码和解码技术，了解不同编码算法对语音质量和数据压缩率的影响。

4、通过实验，培养我们的动手能力、问题解决能力和团队协作精神，提高我们对语音信号处理领域的兴趣和探索欲望。

二、实验原理（一）语音信号的采集和预处理语音信号的采集通常使用麦克风等设备将声音转换为电信号，然后通过模数转换器（ADC）将模拟信号转换为数字信号。

在采集过程中，可能会引入噪声和干扰，因此需要进行预处理，如滤波、降噪等操作，以提高信号的质量。

（二）语音信号的时域分析时域分析是对语音信号在时间轴上的特征进行分析。

常用的时域参数包括短时能量、短时过零率等。

短时能量反映了语音信号在短时间内的能量分布情况，短时过零率则表示信号在单位时间内穿过零电平的次数，可用于区分清音和浊音。

（三）语音信号的频域分析频域分析是将语音信号从时域转换到频域进行分析。

通过快速傅里叶变换（FFT）可以得到语音信号的频谱，从而了解信号的频率成分和分布情况。

（四）语音信号的编码和解码语音编码的目的是在保证一定语音质量的前提下，尽可能降低编码比特率，以减少存储空间和传输带宽的需求。

常见的编码算法有脉冲编码调制（PCM）、自适应差分脉冲编码调制（ADPCM）等。

三、实验设备和软件1、计算机一台2、音频采集设备（如麦克风）3、音频处理软件（如 Audacity、Matlab 等）四、实验步骤（一）语音信号的采集使用麦克风和音频采集软件录制一段语音，保存为常见的音频格式（如 WAV）。

语音信号处理实验

实验二语音信号的时域分析一、实验目的在理论学习的基础上，进一步理解和掌握语音信号短时能量、短时过零了分析的意义及基于matlab 的实现方法。

二、实验原理语音是一时变的、非平稳的随机过程，但由于一段时间内(10-30ms)人的声带和声道形状的相对稳定性，可认为其特征是不变的，因而语音的短时谱具有相对稳定性。

在语音分析中可以利用短时谱的这种平稳性，将语音信号分帧。

10～30ms 相对平稳，分析帧长一般为20ms 。

语音信号的分帧是通过可移动的有限长度窗口进行加权的方法来实现的。

几种典型的窗函数有：矩形窗、汉明窗、哈宁窗、布莱克曼窗。

语音信号的能量分析是基于语音信号能量随时间有相当大的变化，特别是清音段的能量一般比浊音段的小得多。

定义短时平均能量[][]∑∑+-=∞-∞=-=-=nN n m m n m n w m x m n w m x E 122)()()()( 下图说明了短时能量序列的计算方法，其中窗口采用的是直角窗。

过零就是信号通过零值。

对于连续语音信号，可以考察其时域波形通过时间轴的情况。

而对于离散时间信号，如果相邻的取样值改变符号则称为过零。

由此可以计算过零数，过零数就是样本改变符号的次数。

单位时间内的过零数称为平均过零数。

语音信号x (n )的短时平均过零数定义为()[]()[]()()[]()[]()n w n x n x m n w m x m x Z m n *--=---=∑∞-∞=1sgn sgn 1sgn sgn 式中，[]∙sgn 是符号函数，即()[]()()()()⎩⎨⎧<-≥=0101sgn n x n x n x短时平均过零数可应用于语音信号分析中。

发浊音时，尽管声道有若干个共振峰，但由于声门波引起了谱的高频跌落，所以其语音能量约集中干3kHz 以下。

而发清音时．多数能量出现在较高频率上。

既然高频率意味着高的平均过零数，低频率意味着低的平均过零数，那么可以认为浊音时具有较低的平均过零数，而清音时具有较高的平均过零数。

MATLAB处理语音信号

MATLAB处理语⾳信号⼀、实验项⽬名称语⾳信号的处理⼆、实验⽬的综合运⽤数字信号处理课程的理论知识进⾏频谱分析以及滤波器设计，通过理论推导得出相应结论，并进⾏计算机仿真，从⽽复习巩固了课堂所学的理论知识，提⾼了对所学知识的综合应⽤能⼒。

三、实验内容1. 语⾳信号的采集2. 语⾳信号的频谱分析3. 设计数字滤波器和画出频率响应4. ⽤滤波器对信号进⾏滤波5. ⽐较滤波前后语⾳信号的波形及频谱6. 回放语⾳信号四、实验具体⽅案1.语⾳信号采集录制⼀段语⾳信号并保存为⽂件，长度控制在1秒，并对录制的信号进⾏采样；录制时使⽤Windows⾃带的录⾳机。

采样是将⼀个信号（即时间或空间上的连续函数）转换成⼀个数值序列（即时间或空间上的离散函数）。

采样定理指出，如果信号是带限的，并且采样频率⾼于信号带宽的两倍，那么，原来的连续信号可以从采样样本中完全重建出来。

如果信号带宽不到采样频率的⼀半（即奈奎斯特频率），那么此时这些离散的采样点能够完全表⽰原信号。

⾼于或处于奈奎斯特频率的频率分量会导致混叠现象。

⼤多数应⽤都要求避免混叠，混叠问题的严重程度与这些混叠频率分量的相对强度有关。

⽤Windows⾃带录⾳机录⼊⼀段⾳乐，2秒钟，⽤audioread读取⾳频内容，这⾥不使⽤waveread是因为他要求⾳频⽂件格式为.wav ,并且我进⾏了尝试但没有成功，画出⾳频信号的时域波形图[y1,fs]=audioread('F:\MATLAB\ren.m4a');figure(1);plot( y1 );title('Ô原语⾳信号时域波形图');xlabel('单位');ylabel('幅度');2.语⾳信号频谱分析⾸先画出语⾳信号的时域波形，然后对语⾳信号进⾏频谱分析。

在matlab中利⽤fft对信号进⾏快速傅⾥叶变换，得到信号的频谱特性。

Matlab的信号处理⼯具箱中的函数FFT可⽤于对序列的快速傅⾥叶变换分析，其调⽤格式是y=fft(x,N)，其中，x是序列，y是序列的FFT变换结果，N为整数，代表做N点的FFT，若x为向量且长度⼩于N，则函数将x补零⾄长度N；若向量x长度⼤于N，则截断x使之长度为N。

语音信号处理实验报告

实验一显示语音信号的语谱图一、实验目的综合信号频谱分析和滤波器功能，对语音信号的频谱进行分析，并对信号含进行高通、低通滤波，实现信号特定处理功能。

加深信号处理理论在语音信号中的应用；理解语谱图与时频分辨率的关系。

二、实验原理语谱图分析语音又称语谱分析，语谱图中显示了大量的与语音的语句特性有关的信息，它总额了频谱图和时域波形的优点，明显地显示出语音频谱随时间的变化情况。

语谱图实际上是一种三维频谱，即同时在时间和频率上显示出语音的特性，或者说是一种动态的频谱。

窄带语谱图可以得到较好的频域分辨率，窗长通常为至少两个基音周期的“长窗”；而宽带语谱图可以给出较好的时域分辨率，窗长为小于一个基音周期的“短窗”。

三、实验内容实验数据为工作空间 ex3M2.mat 中数组 we_be10k 是单词“we ”和“be ”的语音波形（采样率为10000 点/秒）。

1、听一下 we_be10k （可用 sound ）2、使用函数 specgram_ex3p19.显示语谱图和语音波形，如图一。

图一、参数窗长 20ms （200 点）、帧间隔 1ms （10 点）0.511.5-2-1012Time (s)SPEECHTime (ms)F r e q u e n c y (H z )SPECTROGRAM00.51 1.5200040002、对比调用参数窗长 20ms （200 点）、帧间隔 1ms （10 点），(如图一）和参数窗长5ms （50点）、帧间隔 1ms （10点）(如图二) ；图二、参数窗长5ms （50点）、帧间隔 1ms （10点）图三、参数窗长30ms （300点）、帧间隔 1ms （10点）0.511.5-2-1012Time (s)SPEECHTime (ms)F r e q u e n c y (H z )SPECTROGRAM00.51 1.5200040000.511.5-2-1012Time (s)SPEECHTime (ms)F r e q u e n c y (H z )SPECTROGRAM00.51 1.520004000图四、参数窗长20ms （200点）、帧间隔 5ms （50点）3、再对比窗长>20ms 或小于5ms ，以及帧间隔>1ms 时的语谱图说明宽带语谱图、窄带语谱图与时频分辨率的关系及如何得到时频折中。

语音信号处理试验教程

语音信号处理试验实验一：语音信号时域分析实验目的：(1)录制两段语音信号，内容是“语音信号处理”，分男女声。

(2)对语音信号进行采样，观察采样后语音信号的时域波形。

实验步骤：1、使用window自带录音工具录制声音片段使用windows自带录音机录制语音文件，进行数字信号的采集。

启动录音机。

录制一段录音，录音停止后，文件存储器的后缀默认为.Wav。

将录制好文件保存，记录保存路径。

男生女生各录一段保存为test1.wav和test2.wav。

图1基于PC机语音信号采集过程。

2、读取语音信号在MATLAB软件平台下，利用wavread函数对语音信号进行采样，记住采样频率和采样点数。

通过使用wavread函数，理解采样、采样频率、采样位数等概念！Wavread函数调用格式：y=wavread（file），读取file所规定的wav文件，返回采样值放在向量y中。

[y，fs，nbits]=wavread（file），采样值放在向量y中，fs表示采样频率（hz），nbits表示采样位数。

y=wavread（file，N），读取前N点的采样值放在向量y中。

y=wavread（file，[N1，N2]）,读取从N1到N2点的采样值放在向量y中。

3、编程获取语音信号的抽样频率和采样位数。

语音信号为test1.wav和test2.wav，内容为“语音信号处理”，两端语音保存到工作空间work文件夹下。

在M文件中分别输入以下程序，可以分两次输入便于观察。

[y1,fs1,nbits1]=wavread('test1.wav')[y2,fs2,nbits2]=wavread('test2.wav')结果如下图所示根据结果可知：两端语音信号的采样频率为44100HZ，采样位数为16。

4、语音信号的时域分析语音信号的时域分析就是分析和提取语音信号的时域参数。

进行语音分析时，最先接触到并且夜市最直观的是它的时域波形。

语音信号处理实验报告

语⾳信号处理实验报告语⾳信号处理实验报告⼀、原理 1．端点检测语⾳信号⼀般可分为⽆声段、清⾳段和浊⾳段。

⽆声段是背景噪声段, 平均能量最低，波形变化缓慢，过零率最低; 浊⾳段为声带振动发出对应的语⾳信号段, 平均能量最⾼; 清⾳段是空⽓在⼝腔中的摩擦、冲击或爆破⽽发出的语⾳信号段, 平均能量居于前两者之间，波形上幅度变化剧烈, 过零率最⼤。

端点检测就是⾸先判断有声还是⽆声, 如果有声,则还要判断是清⾳还是浊⾳。

为正确地实现端点检测, ⼀般综合利⽤短时能量和过零率两个特征,采⽤/双门限检测法。

①语⾳信号x(n)进⾏分帧处理，每⼀帧记为Si （n ），n=1，2，…，N ，n 为离散语⾳信号时间序列，N 为帧长，i 表⽰帧数。

②短时能量：③过零率：2.基⾳检测能量有限的语⾳信号}{()s n 的短时⾃相关函数定义为： 10()[()()][()()]N n m R s n m w m s n m w m ττττ--==++++∑ 其中，τ为移位距离，()w m 是偶对称的窗函数。

短时⾃相关函数有以下重要性质：①如果}{()s n 是周期信号，周期是P ，则()R τ也是周期信号，且周期相同，即()()R R P ττ=+。

②当τ=0时，⾃相关函数具有最⼤值；当0,,2,3P P P τ=+++…处周期信号的⾃相关函数达到极⼤值。

③⾃相关函数是偶函数，即()()R R ττ=-。

短时⾃相关函数法基⾳检测的主要原理是利⽤短时⾃相关函数的第⼆条性质，通过⽐较原始信号和它移位后的信号之间的类似性来确定基⾳周期，如果移位距离等于基⾳周期，那么，两个信号具有最⼤类似性。

在实际采⽤短时⾃相关函数法进⾏基⾳检测时，使⽤⼀个窗函数，窗不动，语⾳信号移动，这是经典的短时⾃相关函数法。

3.⾃相关法解线性预测⽅程组⾃相关⽅法a.Levinson-durbin 递推算法()21N i n Ei s n ==∑()()1sgn sgn 1N i i n Zi s n s n ==--∑pj a a k k R E E k Ep j i p i i n p i i i j ...,3,2,1,1||,)1()0(,)1()(12)()1(2)(==≤-=-=∧=-∏ ki 称为反射系数，也称PARCOR 系数b.E(p)是预测残差能量在起始端，为了预测x(0),需要⽤到x(-1),x(-2),……,x(-p).但是这些值均为0，这样预测会带来误差。

语音信号处理实验一报告

语⾳信号处理实验⼀报告实验⼀语⾳信号的采集及预处理⼀、实验⽬的在理论学习的基础上，进⼀步地理解和掌握语⾳信号预处理及短时加窗的意义及基于matlab的实现⽅法。

⼆、实验原理及内容1、语⾳信号的录⾳、读⼊、放⾳等：练习matlab中⼏个⾳频处理函数，利⽤函数wavread对语⾳信号进⾏采样,记住采样频率和采样点数，给出以下语⾳的波形图（2.wav），wavread的⽤法参见mablab帮助⽂件。

利⽤wavplay或soundview 放⾳。

也可以利⽤wavrecord⾃⼰录制⼀段语⾳，并进⾏以上操作(需要话筒)。

I=wavread('2.wav');Fs=115200;soundview(I,Fs) %波形图如图1所⽰图1 2.wav的波形图利⽤wavplay函数，在佩戴⽿机的情况下可以清晰的听到所要播放于⼼的消息。

2、语⾳信号的分帧：对语⾳信号进⾏分帧，可以利⽤voicebox⼯具箱中的函数enframe。

voicebox⼯具箱是基于GNU协议的⾃由软件，其中包含了很多语⾳信号相关的函数。

voicebox⼯具箱安装⽅法：(1)把⼯具箱拷贝⼊C:\Program Files\MATLAB\R2006b\toolbox⽬录下；(2)菜单file-set path-"Add folder" 导⼊voicebox；图2 Set Path(3)菜单file-Preference-General-"Updata Toolbox Path Cache图3 Preferencesy=enframe(I,256,128);whos y I实验结果为：Name Size Bytes Class AttributesI 9000x1 72000 doubley 69x256 141312 doubleI=wavread('2.wav');t=enframe(I,256,128);plot(t)图4 分帧后的波形图3、语⾳信号的加窗：本步要求利⽤window函数设计窗⼝长度为256(N=256)的矩形窗(rectwin)、汉明窗(hamming)及汉宁窗(hann))，利⽤wvtool函数观察其时域波形图及频谱特性，⽐较得出结论。

语音信号处理实验报告

实验一、语音信号采集与分析一、实验目的：1）了解语音信号处理基本知识：语音信号的生成的数学模型。

2）在理论学习的基础上，进一步地理解和掌握语音信号的读入、回放、波形显示。

语音信号时域和频域分析方法。

二、实验原理一定时宽的语音信号，其能量的大小随时间有明显的变化。

其中清音段（以清音为主要成份的语音段），其能量比浊音段小得多。

短时过零数也可用于语音信号分析中，发浊音时，其语音能量约集中于3kHz以下，而发清音时，多数能量出现在较高频率上，可认为浊音时具有较低的平均过零数，而清音时具有较高的平均过零数，因而，对一短时语音段计算其短时平均能量及短时平均过零数，就可以较好地区分其中的清音段和浊音段，从而可判别句中清、浊音转变时刻，声母韵母的分界以及无声与有声的分界。

这在语音识别中有重要意义。

FFT在数字通信、语音信号处理、图像处理、匹配滤波以及功率谱估计、仿真、系统分析等各个领域都得到了广泛的应用。

本实验通过分析加噪的语音信号频谱，可以作为分离信号和噪声的理论基础。

三、实验内容：Matlab编程实验步骤：1．新建M文件，扩展名为“.m”，编写程序；2．选择File/Save命令，将文件保存在F盘中；3．在Command Window窗中输入文件名，运行程序；程序一、用MATLAB对原始语音信号进行时域分析，分析短时平均能量及短时平均过零数。

程序二、用MATLAB对原始语音信号进行频域分析，画出它的时域波形和频谱给原始的语音信号加上一个高频余弦噪声，频率为5kHz。

画出加噪后的语音信号时域和频谱图。

程序1.a=wavread(' D:\II.wav'); %读取语音信号的数据，赋给变量x1，这里的文件的全路径和文件名由个人设计n=length(a);N=320;subplot(3,1,1),plot(a);h=linspace(1,1,N);%形成一个矩形窗，长度为NEn=conv(h,a.*a);%求卷积得其短时能量函数Ensubplot(3,1,2),plot(En);for i=1:n-1if a(i)>=0b(i)= 1;elseb(i) = -1;endif a(i+1)>=0b(i+1)=1;elseb(i+1)=-1;endw(i)=abs(b(i+1)-b(i));end%求出每相邻两点符号的差值的绝对值k=1;j=0;while (k+N-1)<nZm(k)=0;for i=0:N-1;Zm(k)=Zm(k)+w(k+i);endj=j+1;k=k+160; %每次移动半个窗endfor w=1:jQ(w)=Zm(160*(w-1)+1)/640;%短时平均过零率endsubplot(3,1,3),plot(Q);实验结果打印粘贴到右侧：程序2:fs=22050; %语音信号采样频率为22050x1=wavread('D:\II.wav'); %读取语音信号的数据，赋给变量x1sound(x1,22050); %播放语音信号f=fs*(0:511)/1024;t=0:1/22050:(size(x1)-1)/22050; %将所加噪声信号的点数调整到与原始信号相同Au=0.03;d=[Au*cos(2*pi*5000*t)]'; %噪声为5kHz的余弦信号x2=x1+d;sound(x2,22050); %播放加噪声后的语音信号y2=fft(x2,1024); %对信号做1024点FFT变换figure(1)subplot(2,1,1);plot(x1) %做原始语音信号的时域图形title('原始语音信号');xlabel('time n');ylabel('幅值 n');subplot(2,1,2);plot(t,x2)title('加噪后的信号');xlabel('time n');ylabel('幅值 n');figure(2)subplot(2,1,1);plot(f,abs(x1(1:512)));title('原始语音信号频谱');xlabel('Hz');ylabel('幅值');subplot(2,1,2);plot(f,abs(y2(1:512)));title('加噪后的信号频谱');xlabel('Hz'); ylabel('幅值');实验结果打印粘贴到右侧：050010001500200025003000350040004500原始语音信号time n幅值 n加噪后的信号time n幅值 n020004000600080001000012000原始语音信号频谱Hz幅值加噪后的信号频谱Hz幅值四、实验分析加入噪声后音频文件可辨性下降，波形的平缓，频谱图上看，能量大部分集中在2000HZz到4000Hz之间。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

elseif a(k)<=(-th0); a(k)=a(k)+th0; else a(k)=0; end end m=max(a); for i=1:L; a(i)=a(i)/m; end subplot(2,1,2); plot(a,'k'); axis([0,1711,-1,1]); title('中心削波后语音波形'); xlabel('样点数'); ylabel('幅度');
实验二基音周期估计
基音周期是表征语音信号本质特征的参数，在语音编码、语音合成和语音识别中有重要的作用。语音信号基音周期的估计方法很多，本实验采用两种最基本的方法：基于短时自相关法和基于短时平均幅度差法。
2.1 基于短时自相关法的基音周期估计
自相关函数的性质是：如果是一个周期信号，那这个信号的自相关函数也是同周期的信号，且在信号周期的整数倍处，自相关值有最大值。语音信号的浊音信号具有准周期特性，其自相关函数在基音周期的整数倍处取最大值，计算两相邻最大峰值之间的距离，就可以估计出基音周期。为了减小运算量，突出反映基因周期的信息，压缩无关信息，可以对语音信号进行中心削波处理，再进行自相关计算。
1.3 短时能量语音信号的能量随时间而变化，清音和浊音之间的能量差别相当显著，因此对短时能量进行分析，可以描述语音的这种特征变化的情况。
En
m n ( N 1)

n
[ x(m) w(n m)]2
n 时刻语音信号的短时平均能量，其中 N 为窗长。 [x,sr]=wavread('*.wav'); %读入语音文件 %计算N=50，帧移=50时的语音能量 s=fra(50,50,x); s2=s.^2; %一帧内各样点的能量 energy=sum(s2,2); %求一帧能量 subplot(2,2,1) %定义画图数量和布局 plot(energy); %画N=50时的语音能量图 xlabel('帧数') %横坐标 ylabel('短时能量 E') %纵坐标 legend('N=50') %曲线标识 axis([0,1500,0,2*10^10]) %定义横纵坐标范围 %计算N=100，帧移=100时的语音能量 s=fra(100,100,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,2) plot(energy) %画N=100时的语音能量图 xlabel('帧数') ylabel('短时能量 E') legend('N=100') axis([0,750,0,4*10^10]) %定义横纵坐标范围 %计算N=400，帧移=400时的语音能量 s=fra(400,400,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,3) plot(energy) %画N=400时的语音能量图 xlabel('帧数') ylabel('短时能量 E') legend('N=400') axis([0,190,0,1.5*10^11]) %定义横纵坐标范围 %计算N=800，帧移=800时的语音能量 s=fra(800,800,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,4) plot(energy) %画N=800时的语音能量图
过零率函数：zcro.m function f=zcro(x) f=zeros(size(x,1),1); %生成全零矩阵 for i=1:size(x,1) z=x(i,:); %提取一行数据 for j=1:(length(z)-1); if z(j)*z(j+1)<0; f(i)=f(i)+1; end end end
1.2 预加重（高频提升）对输入的语音信号进行预加重，其目的是提升语音信号的高频部分，去除口唇辐射的影响，增强语音的高频分辨率。
H(Z) = 1 - z-1
[x,sr]=wavread('***.wav'); %读数据 ee=x(200:455); %选取原始文件e的第200到455点的语音,也可选其他样点 r=fft(ee,1024); %对信号ee进行1024点傅立叶变换 r1=abs(r); %对r取绝对值 r1表示频谱的幅度值 pinlv=(0:1:255)*8000/512 %点和频率的对应关系 yuanlai=20*log10(r1) %对幅值取对数 signal(1:256)=yuanlai(1:256);%取256个点，目的是画图的时候，维数一致 [h1,f1]=freqz([1,-0.98],[1],256,4000);%高通滤波器 pha=angle(h1); %高通滤波器的相位 H1=abs(h1); %高通滤波器的幅值 r2(1:256)=r(1:256) u=r2.*h1' % 将信号频域与高通滤波器频域相乘相当于在时域的卷积 u2=abs(u) %取幅度绝对值 u3=20*log10(u2) %对幅值取对数 un=filter([1,-0.98],[1],ee) %un为经过高频提升后的时域信号 figure(1);subplot(211); plot(f1,H1);title('高通滤波器的幅频响应'); xlabel('频率/Hz'); ylabel('幅度'); subplot(212);plot(pha);title('高通滤波器的相位响应'); xlabel('频率/Hz'); ylabel('角度/radians'); figure(2);subplot(211);plot(ee);title('原始语音信号'); xlabel('样点数'); ylabel('幅度'); axis([0 256 -3*10^4 2*10^4]); subplot(212);plot(real(un)); title('经高通滤波后的语音信号'); xlabel('样点数'); ylabel('幅度'); axis([0 256 -1*10^4 1*10^4]); figure(3);subplot(211);plot(pinlv,ee);title('原始语音信号频谱'); xlabel('频率/Hz'); ylabel('幅度/dB'); subplot(212);plot(pinlv,u3);title('经高通滤波后的语音信号频谱'); xlabel('频率/Hz'); ylabel('幅度/dB');
中心削波 [a,count]=wavread('*.wav'); L=length(a); %测定语音的长度 m=max(a); for i=1:L a(i)=a(i)/m; %数据归一化 end %找到归一化以后数据的最大值和最小值 m=max(a); %找到最大的正值 n=min(a); %找到最小的负值 %为保证幅度值与横坐标轴对称，采用计算公式是 n+(m-n)/2,合并为(m+n)/2 ht=(m+n)/2; for i=1:L; %数据中心下移保持和横坐标轴对称 a(i)=a(i)-ht; end figure(1); %画第一幅图 subplot(2,1,1); %第一个子图 plot(a,'k'); axis([0,1711,-1,1]); %确定横、纵坐标的范围 title('中心削波前语音波形'); %图标题 xlabel('样点数'); %横坐标 ylabel('幅度'); %纵坐标 coeff=0.7; %中心削波函数系数取 0.7 th0=max(a)*coeff; %求中心削波函数门限(threshold) for k=1:L ; %中心削波 if a(k)>=th0 a(k)=a(k)-th0;
1.4 短时平均过零率短时平均过零率是指每帧语音信号通过零值电平的次数。在离散域，如果相邻的采样值具有不同符号就称为发生了过零，因此可以计算过零的次数。
Zn
m n ( N 1)

n
sgn[ x(m)] sgn[ x(m 1)] w(n m)
clear all [x1,sr]=wavread('*.wav'); %读入语音文件 x=awgn(x1,15,'measured');%加入15dB的噪声 s=fra(220,110,x);%分帧，帧移110 zcr=zcro(s);%求过零率 figure(1); subplot(2,1,1) plot(x); title('原始信号'); xlabel('样点数'); ylabel('幅度'); axis([0,39760,-2*10^4,2*10^4]); subplot(2,1,2) plot(zcr); xlabel('帧数'); ylabel('过零次数'); title('原始信号的过零率'); axis([0,360,0,200]);
%中心削波函数幅度的归一化
%第二个子图 %确定横、纵坐标的范围 %图标题 %横坐标 %纵坐标
%没有经过中心削波的修正自相关计算 [b,count]=wavread('*.wav')； N=320; %选择的窗长 A=[]; for k=1:320; %选择延迟长度 sum=0; for m=1:N; sum=sum+b(m)*b(m+k-1); %计算自相关 end A(k)=sum; end for k=1:320 B(k)=A(k)/A(1); %自相关归一化 end figure(2); subplot(2,1,1); plot(B,'k'); title('中心削波前修正自相关'); xlabel('延时 k'); ylabel('幅度'); axis([0,320,-1,1]); %画第二幅图 %第一个子图 %图标题 %横坐标 %纵坐标

语音信号处理实验

合集下载

语音信号处理实验报告.docx

语音信号处理实验报告实验二

语音信号处理实验

MATLAB处理语音信号

语音信号处理实验报告

语音信号处理试验教程

语音信号处理实验报告

语音信号处理实验一报告

最新语音信号处理实验报告实验二

语音信号处理实验报告

文档推荐

最新文档

语音信号处理实验

合集下载

语音信号处理实验报告.docx

语音信号处理实验报告实验二

语音信号处理实验

MATLAB处理语音信号

语音信号处理实验报告

语音信号处理试验教程

语音信号处理实验报告

语音信号处理实验一报告

最新语音信号处理实验报告实验二

语音信号处理 实验报告

文档推荐

最新文档

语音信号处理实验报告