当前位置：文档之家› 基于MATLAB语音信号检测分析及处理

基于MATLAB语音信号检测分析及处理

第一章绪论

Matlab是矩阵实验室（Matrix Laboratory）的简称，是美国MathWorks公司出品的商业数学软件，用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境，主要包括Matlab和Simulink两大部分。

1.1 Matlab简介

MATLAB是英文MATrix LABoratory（矩阵实验室）的缩写。早期的MATLAB 是用FORTRAN语言编写的，尽管功能十分简单，但作为免费软件，还是吸引了大批使用者。经过几年的校际流传，在John Little。Cleve Moler和Steve Banger 合作，于1984年成立MathWorks公司，并正式推出MATLAB第一版版。从这时起，MATLAB的核心采用C语言编写，功能越来越强大，除原有的数值计算功能外，还新增了图形处理功能。

MathWorks公司于1992年推出了具有划时代意义的4.0版；1994年推出了

4.2版扩充了4.0版的功能，尤其在图形界面设计方面提供了新方法；1997年春

5.0版问世，5.0版支持了更多的数据结构，使其成为一种更方便、更完善的编程语言；1999年初推出的MATLAB5.3版在很多方面又进一步改进了MATLAB语言的功能，随之推出的全新版本的最优化工具箱和Simulink3.0达到了很高水平；2000年10月，MATLAB

6.0版问世，在操作页面上有了很大改观，为用户的使用提供了很大方便，在计算机性能方面，速度变的更快，性能也更好，在图形界面设计上更趋合理，与C语言接口及转换的兼容性更强，与之配套的Simulink4.0版的新功能也特别引人注目；2001年6月推出的MATLAB6.1版及Simulink4.1版，功能已经十分强大；2002年6月推出的MATLAB6.5版及Simulink5.0版，在计算方法、图形功能、用户界面设计、编程手段和工具等方面都有了重大改进；2004年，MathWorks公司推出了最新的MA TLAB

7.0版，其中集成了最新的MATLAB7编译器、Simumlink6.0仿真软件以及很多工具箱。这一版本增加了很多新的功能和特性，内容相当丰富。

Matlab主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中，为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案，代表了当今国

际科学计算软件的先进水平。

M ATLAB的优势(1) 工作平台编程环境十分友好（2）编程语言简单易用（3）数据的计算处理能力十分强大（4）图像处理能力强大（5）模块集合工具箱应用广泛（6）程序的接口和发布平台很实用（7）可以开发用户界面。

Matlab 语言的特点MATLAB语言被称为第四代计算机语言，其利用丰富的函数资源，使程序员从繁琐的程序代码中解放出来，其最突出的特点就是简洁。MATLAB用更直观的、符合人们思维习惯的代码，代替了C和FORTRAN语言的冗长代码，给用户带来最直观、最简洁的程序开发环境，下面简单介绍一下MATLAB的主要特点。

语言简洁紧凑，使用方便，库函数十分丰富。MATLAB程序书写的形式自由，利用丰富的库函数避开了繁琐的子程序编程任务，由于库函数都是由本领域的专家编写，所以不必担心函数的可靠性。

高效方便的矩阵和数组运算，MATLAB语言不需要定义数组的维数，并给出了矩阵函数、特殊矩阵函数、特殊矩阵专门的库函数，使得在求解信号处理、建模、系统识别、优化和控制等领域的问题时，显得大为简洁、方便、高效，这是其他高级语言所不能的。

MATLAB既具有结构化的控制语句，又具有面向对象编程的特性。

MATLAB语法限制不严格，程序设计自由度大，通过建立M后缀名文件的形式，与用户已经编好的FORTRAN、C语言成语混合编程，方便地调用有关的FORTRAN、C语言的子程序。可移植性很好，基本上不做修改就可以在各种型号的计算机和操作系统上面运行。

MATLAB的图形功能强大。在C和FORTRAN语言里，绘图都很不容易，但在MATLAB里，数据的可视化非常简单。此外，MATLAB还具有较强的编辑图形界面的能力。

MATLAB拥有功能强大的工具箱，主要用来扩充其符号计算功能、图示建模仿真功能、文字处理功能以及与硬件实施交互功能。

源程序的开放性强。除内部函数以外，所有MATLAB的核心文件和工具箱文件都是可读可改变的源文件，用户可通过对源文件的修改以及加入自己的文件构成新的工具箱。

MATLAB软件自1984年推向市场以来，历经十几年的发展和竞争，现已成为国际公认的最优秀的科技应用软件。它功能强大、界面友好、语言自然、开放性强，很快成为应用学科计算机辅助分析、设计、仿真、教学乃至科技文字吹不可缺少的基础软件。

1.2语音概述

1.2.1语音简介

语音，即语言的声音，是语言符号系统的载体。它由人的发音器官发出，负载着一定的语言意义，语言依靠语音实现它的社会功能。语音是人们交流思想和进行社会活动的最基本手段,因此我们要对语音信号进行处理分析，优化人类通信交流。语音信号处理包括语音通信、语音增强、语音合成、语音识别和说话人识别等方面。语音信号的好坏、语音识别率的高低，都取决于语音信号处理的好坏。因此，语音信号处理是一项非常有意义的研究课程，而语音端点检测是语音语音信号处理中非常重要的一步。

语音端点检测是语音分析、合成和识别中的一个重要环节，目的是从包含语音的一段信号中找出语音的起始点及结束点，从而只存储和处理有效语音信号。有效的端点检测不仅可以减少数据的存和处理时间，而且能排除无声段的噪声干扰。端点检测的困难在于无声段或者语音段前后人为呼吸等产生的杂音、语音开始处的弱摩擦音或弱爆破音以及终点处的鼻音，这些使得语音的端点比较模糊，需要综合利用语音的各种信号特征，从而确保定位的精确性，避免包含噪音信号和丢失语音信号。近年来出现了很多种端点检测的方法如短时能量、短时过零率、传统的双门限法、倒谱特征的检测方法、谱熵的检测方法法、分形法等。尽管语音端点检测技术在安静的环境中已经达到了令人鼓舞的准确率，但是在实际应用时由于声的引入和环境的改变通常会使系统性能显著下降。研究表明，即使在安静的环境中，语音识别系统一半以上的识别错误来自端点检测器。因此，作为语音识别系统的第一步，端点检测的关键性不容忽视，尤其是噪声环境下语音的端点检测，实验室的研究结果与复杂的实用环境下的语音端点检测仍存在一定的差距，它的准确性很大程度上直接影响着后续的工作能否有效进行，如何准确地检测出带噪语音的端点至今仍是一个难题。

1.2.2研究背景及意义

语音是语言的声学表现形式，语言是人类特有的功能，声音是人类常用的信息交流工具，通过声音传递信息是人类最重要、最有效、最准确、最方便、最自然的信息交换的方式。语音信号处理是一门涉及面很广的交叉科学，包含计算机科学、语音学、语言学、声学、生理学、心理学和数学等诸多领域的内容。随着现代科学的蓬勃发展，人类社会越来越显示出信息社会的特点，犹如衣、食、住、行对于人类是必要的一样，通信和信息交换也成为了人类社会存在的必要条件，不但在人与人之间，而且在人与机器之间每时每刻都需要进行大量的信息交换。让计算机听懂人类的语言，是人类自计算机诞生以来梦寐以求的想法。

语音技术的应用己经成为一个具有竞争性的高新技术产业，它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理，工业生产部门的语声控制，电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨，并且有望成为下一代操作系统和应用程序的用户界面。语音处理内容涉及到计算机科学、模式识别、信号处理、生理学、语音学、心理学等学科，还涉及到信号和信息处理系统、通信和电子系统等具体应用领域。语音信号处理与信息科学中最活跃的前沿科学密切联系，并且共同发展。例如，神经网络理论、模糊集理论、小波理论是当前热门的研究领域，这些领域的研究常常把语音处理任务作为一个应用实例，而语音处理研究者也从这些领域的研究进展中找到突破口，使语音处理技术研究取得进展。

经过几十年的努力，语音信号处理在语音识别、语音增强、语音编码、说话人识别、说话人情感识别、语音合成等方面取得了巨大的进步，然而，一旦这些技术应用在实际环境中，由于环境噪声、信道等方面的影响，性能急剧下降，因为在实际环境中没有完全纯净的语音信号，一般都会伴有噪声或其它干扰。。语音检测的任务就是判断待处理信号是语音还是非语音，从输入信号中找到语音部分的起止点。语音检测是语音识别、语音增强以及语音编码等中的一个重要环节。有效的语音检测技术不仅能减少系统的处理时间、提高系统的处理实时性，而且能排除无声段的噪声干扰，从而使后续工作的性能得以较大提高。

第二章语音信号处理

2.1 语音信号特点

语音信号是随时间变化的一维信号，由一连串的音组成，各个音的排列有一定的规则。语音具有声学特征的物理性质，声音质量与它的频率范围有关，语音信号的频率一般是在200Hz~3500Hz范围内，随着带宽的增加，信号的自然度将逐步得到改善。语音信号本身的冗余度是较大的，少数辅音清晰度下降并不明显影响语句的可懂度，比如通常的模拟电话带宽只有3KHz~4KHz。

语音信号的特性是随时间变化的，所以是一种典型的非稳态信号。但是，从另一方面来看，由于语音的形成过程与发音器官的运动密切相关，这种物理运动比起声音振动速度来讲要缓慢得多，因此，语音信号常常可假定为短时平稳的。研究表明，在5ms-40ms的范围内，语音信号的频谱特性和一些物理特征参数基本保持不变。这样，我们就可以将平稳过程的处理方法和理论引入到语音信号的短时处理中。因此，“短时分析技术”贯穿于语音分析的全过程。

语音信号的基本组成单位是音素。音素可分成“浊音”和“清音”两大类。如果将不存在语音而只有背景噪声的情况称为“无声”。那么音素可以分成“无声”、“浊音”、“清音”三类。一个音节由元音和辅音构成。元音在音节中占主要部分。所有元音都是浊音。在汉语普通话中，每个音节都是由“辅音一元音”构成的。在信号处理中，语音按其激励形式的不同可分为2 类：（1）浊音当气流通过声门时，如果声带的张力刚好使声带发生张弛振荡式的振荡，产生一股准周期的气流，这一气流激励声道就产生了浊音。这种语音信号是1 种激励信号，它是由规则的全程激励产生的，其时域波形具有准周期性，语音频率集中在比较低的频率范围内，短时能量较高，由于语音信号中的高频成分有高的过零率而低频有低的过零率，因此浊音的过零率低。通常，浊音信号可以由周期激励通过线性滤波器合成。（2）清音当气流通过声门时，如果声带不振动，而在某处收缩，迫使气流高速通过这一收缩部分而产生湍流，就得到清音。清音是由不规则的激励产生的，发清音时声带不振动，其时域波形不具有周期性，自相关函数没有很强的自相关周期峰，其语音频率集中在较高的范围内，短时能量较低，因而过零率较高。通常，清音信号可由白噪声通过线性滤波器合成。

2.1.1 语音信号的“短时谱”

对于非平稳信号，它是非周期的，频谱随时间连续变化，因此由傅里叶变换得到的频谱无法获知其在各个时刻的频谱特性。如果利用加窗的方法从语音流中取出其中一个短段，再进行傅里叶变换，就可以得到该语音的短时谱。

2.1.2 基音周期

浊音信号的周期称为基音周期，它是声带振动频率的倒数，基音周期的估计称为基音检测。基音检测是语音处理中的一项重要技术，它在有调语音辨意、低速率语音编码、说话人识别等方面起着非常关键的作用。但在实现过程中，由于声门激励波形不是一个完全的周期脉冲串，再加上声道影响去除不易、基音周期定位困难、背景噪声影响强烈等一系列因素，基音检测面临着很大的困难。现在已有很多性能优越的基音检测算法，自相关基因检测算法就是一种基于语音时域分析理论较好的算法，在这里基于声音文件比较稳定的基础上，使用观察法获取基音周期。

2.2 语音信号预处理

为了消除因为人类发声器官本身和因一些采集语音信号的设备等所引起的混叠、高次谐波失真现象，在对语音信号进行分析和处理之前，必须对其进行预处理。语音信号的预处理应尽可能地保证处理后得到的信号更均匀、平滑，且能提高语音的质量。

2.2.1预加重

在进行语音信号数字处理时，为了获取一段语音信号的时域波形，首先要将语音信号转换成电信号，再用A/D转换器将其变换为离散的数字化采样信号。己经数字化的语音信号将依次进入一个数据区。由于语音信号的平均功率受声门激励和口鼻辐射影响，高频端大约在800Hz以上按6dB/倍频程跌落，即6dB/oct(2倍频)或20dB/dec(10倍频)，所以求语音信号频谱时，频率越高相应的成分越小，高频部分的频谱比低频部分的难求，为此要在预处理中进行预加重处理。目的是提升高频部分，使信号变得平坦，保持在低频到高频的整个频带中，能用同样的信噪比求频谱，而且预加重零点与辐射零点将抵消声门波的影响，使语音信号中只包含声道部分，以便于频谱分析或声道参数分析。图2.1表明了语音预处理的

过程

图2.1 语音信号的预处理

预加重一般是在语音信号数字化之后，用具有6dB/倍频程的提升高频特性的预加重数字滤波器来实现，它一般是一阶的数字滤波器：

11)(--=z z H μ （2-1）

式中μ的取值接近于1。

有时要恢复原信号，需要从做过预加重的信号频谱来求实际的频谱时，要对测量值进行去加重处理，即加上6dB/倍频程的下降的频率特性来还原成原来的特性。

2.2.2加窗分帧

语音信号检测首先要进行分帧处理，然后依次判断每一帧是否为语音的端点。如果采用较小的窗长，则计算量增加，语音识别的速度会降低。我们可以在语音静音段时，采用较长的窗；在语音和静音的过渡段时采用较小的窗，可以确切判断语音的起始点；一旦确定语音的起点，就改用常规窗长。

在进行了预加重后，接下来就要对语音信号进行加窗分帧处理。将语音信号划分为许多短时的语音段，每个短时的语音段称为一个分析帧。另外，由于不同语音信号的基音周期不同，为了兼顾男声和女声的最高和最低基音频率，且能准确地描述语音能量自身的实际变化规律，通常将窗宽选为10ms~20ms 。

图2.2 帧长和帧移

如图2.2所示分帧一般采用交叠分段的方法，这是为了使帧与帧之间能平滑过渡，保持其连续性。前一帧和后一帧的交叠部分称为帧移，帧移与帧长的比值一般取为0~0.5之间。分帧是用可移动的有限窗口长度进行加权实现的，即用窗函数)(n ω乘以语音信号s(n)，从而形成加窗的语音信号:

)()()(n n S n S ???= （2-2）

由于窗函数一般取为S(n)中间大两头小的光滑函数，这样的冲激响应所对应的滤波器具有低通特性，其带宽和频率取决于窗函数的选取。用得最多的三种窗函数是矩形窗、汉明窗(Hamming)和汉宁窗(Hanning)，它们的定义如下:

矩形窗：

?-≤≤=其他

,010 ,1)(N n n ? （2-3）汉明窗： 0.540.46cos(2/(1)),01()0,n N n N n π?--≤≤-?=??

其他（2-4）汉宁窗：

[]???-≤≤-=其他

,010,)/2cos(15.0)(N n N n n π? （2-5）式中N 为窗长，窗函数)(n ?的选取(形状和长度)对于短时分析参数的特性影响很大，为此应该选择合适的窗口，使其短时参数能更好地反映语音信号的特性变化。以上这些窗函数的幅度频率响应都具有低通特性，它们的主瓣宽度和旁

瓣高度如表1-1所示。

表1-1 1s 长的各种窗的主瓣宽度和旁瓣高度

从表中可知：矩形窗的主瓣宽度最小，但其旁瓣高度最高；汉明窗的主瓣最宽，而旁瓣高度最低。矩形窗的旁瓣太高，会产生严重的泄漏现象。汉明窗旁瓣

最低，可以有效地克服泄漏现象，具有更平滑的低通特性，因此，一般在语音信号预处理中，都选用汉明窗来进行语音分帧处理。

2.3 语音信号分析

语音信号处理包括语音识别、语音合成、语音编码、说话人识别等方面，但是其前提和基础是对语音信号进行分析。只有将语音信号分析成表示其本质特性的参数，才有可能利用这些参数进行高效的语音通信，以及建立用于识别的模板或知识库。而且，语音识别率的高低，语音合成的音质好坏，都取决于对语音信号分析的准确性和精度。

2.3.1短时时域分析

语音信号本身就是时域信号，因此，时域分析方法是应用最为广泛的一种方法，这种方法直接利用语音信号的时域波形。时域分析通常用于最基本的参数分析以及用于语音的分割、预处理等。语音信号的时域参数有短时能量、短时平均幅度、短时过零率、短时自相关函数等，这些是语音信号中一组最基本的短时参数，在各种语音信号数字处理技术中都有重要应用。

进行语音信号分析时，最先接触到且最直观的就是它的时域波形。时域分析通常用于最基本的参数分析，语音的分割、预处理和大分类。这种分析方法的特点是表示语音信号比较直观、物理意义明确；实现起来比较简单、运算量少；可得到语音的一些重要参数；可采用示波器等通用设备进行观测。取样之后要对信号进行量化，而量化过程不可避免地会产生量化误差，即量化后的信号值与原信号之间的差值。

2.3.2频域分析

语音信号频域分析，主要是对一些频域的参数进行分析，常用的一些频域参数有频谱、功率谱、倒谱等等，最常用的频域分析方法有傅立叶变换法、线性预测法等。

1、傅立叶变换法

傅里叶频谱变换是语音信号频域分析中广泛使用的方法，是分析线性系统和

平稳信号稳态特性强有力的手段，对分帧加窗后的语音信号，进行傅里叶变换和逆傅里叶变换，可以相应的得到频谱，功率谱，倒谱距离，嫡等特征。由于语音信号的特性是随着时间缓慢变化，所以采用短时傅里叶变换，相应的求得特征为短时频域特征，这里的窗函数都使用汉明窗。

（1）短时频谱和短时功率谱

设信号)(m x n 经过傅里叶变换后在频域记为)(jw n e X ，则)(jw n e X 与)(m x n 的关系见公式1-6。

jwm N m n jw

n e m x e X --=∑=)()(1

0 （2-6）语音的频谱为)(jw n e X 的幅度，则有

)()(jw n jw n e X e p = （2-7）

语音的短时功率谱的是幅度的平方，所以短时功率谱的计算方法为

)()(jw n jw n e X e G = （2-8）（2）倒谱距离

语音信号的倒谱分析是通过同态处理来实现的。同态信号处理也称为同态滤波，就是将非线性问题转化为线性问题的处理方法。由于语音信号可视为声门激励信号和声道冲击响应的卷积，可以对语音信号进行解卷。倒谱能很好表示语音的特征，在强噪声环境下，可通过倒谱系数求得倒谱距离，使用倒谱距离来作为端点检测的特征。信号的倒谱也可以定义为信号的能量谱密度函数S(叻的对数的傅里叶级数展开式的系数，

jnw n e n c w s -∞-∞=∑=

)()(log （2-9）

n c 即为倒谱系数，通过倒谱系数求得倒谱距离几cep d 为

∑=-+-=p

n cep n c n c n c n c d 12012

01))()((2))()((3429.4 （2-10）（3）熵

熵(用H 表示)是物质的复杂程度的一种反映。熵H 代表X 的信

息量，X 的概率分布越模糊，越难判断，

则X 的熵为 i n

i i p p H l o g 1

∑=-= （2-11）

2、线性预测法

线性预测分析的基本思想是：由于语音样点之间存在相关性，所以可以用过去的样点值来预测现在或未来的样点值，即一个语音的抽样能够用过去若干个语音抽样或它们的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。而这组预测系数就反映了语音信号的特征，可以作为语音信号特征参数用与语音识别、语音合成等。

将线性预测应用与语音信号处理，不仅是因为它的预测功能，而且更重要的是因为它能提供一个非常好的声道模型及模型参数估计方法。线性预测的基本原理和语音信号数字模型密切相关。

第三章语音信号检测

3.1清音浊音检测

3.1.1信号采集

该设计以本人的声音为分析样本。。可得出声音的采样频率为11025Hz，且声音是单通道的。利用sound函数，可清晰地听到读音为：“电子信息”的音频信号。采集数据并画出波形图如下所示，fs 为采样频率，x为采样数据，接下来对采样数据作傅里叶变换y=fft(x)并画出频谱图如图1所示，程序如下：

fs=11025; %抽样频率

x=wavread('yin.wav');

sound(x1,11025); %读取语音信号“电子信息”

figure(1)

subplot(211)

plot(x) %做原始语音信号的时域图形

title('原始语音信号波形');

xlabel('样点数'); %x轴的名字是“样点数”

ylabel('幅值'); %y轴名字是“幅值”

grid on;

N=128;

n=0:N-1;

y=fft(x); %对x进行傅里叶变换

mag=abs(y); %求幅值

f=(0:length(y)-1)'*fs/length(y); %进行对应的频率转换

figure(1)

subplot(212)

plot(f,mag); %做原始语音信号的频谱图

xlabel('频率(Hz)');

ylabel('幅值');

title('原始信号频谱图');

grid on;

图1 原始语音信号波形及频谱图

由频谱图可清楚地看到样本声音主要以低频为主。人的语音信号频率一般集中在200 kHz 到4.5 kHz 之间，从声音频谱的包络来看，样本声音的能量集中在0.1(1102．5Hz)以内，0.4以外的高频部分很少。所以信号宽度近似取为1.1kHz ，由采样定理可得

HZ fo fs 22055.1102*22==>。

3.1.2短时能量和短时平均幅度

能量是语音的一个重要特性，由于语音信号的能量随时间变化，清音和浊音之间的能量差别相当显著，清音的能量较小，浊音的能量较大。因此对语音的短时能量进行分析，可以描述语音的这种特征变化情况。短时能量定义为：

221[()()]

[()()]n n m m n N E x m w n m x m w n m ∞=-∞=-+=

-=-∑∑ （3-1）其中，W （n ）是窗函数，N 是窗长。特殊地，当采用矩形窗时，可简化为：

2()n m E x m ∞=-∞=

∑ （3-2）

由此表明,窗口加权短时平均能量En 相当于将“语音平方”信号通过一个单位函数响应为h( n) 的线性滤波器的输出。

本次语音信号的短时平均能量和短时平均幅度如下图2所示及程序如下： N=240;

Y=wavread('yin.wav');

L=length(Y);

LL=length(Y)/N;

figure(2)

Em=zeros(1,(LL-1)*240);

for ii=1:(LL-1)*240,

temp=Y(ii:ii+240);

Em(ii)=sum(temp.*temp);

end

jj=[1:(LL-1)*240];

subplot(211)

plot(jj, Em,'b'); %绘制短时平均能量曲线xlabel('帧数');

ylabel('短时能量');

title('短时平均能量');

grid on;

%短时平均幅度Mn=sum(abs(Y))/N

Mn=zeros(1,(LL-1)*240);

for ii=1:(LL-1)*240,

temp=Y(ii:ii+240);

Mn(ii)=sum(abs(temp))/N;

end

figure(2)

jj=[1:(LL-1)*240];

subplot(212)

plot(jj, Mn,'b'); %绘制短时平均幅度曲线xlabel('帧数');

ylabel('短时平均幅度');

title('短时平均幅度');

grid on;

图2 短时平均能量和短时平均幅度

由上图发现,语音浊音段的短时平均能量远远大于清音段的短时平均能量。因此,短时平均能量En 的计算给出了区分清音段与浊音段的依据,即En (浊) > En (清)。根据En 由高到低的跳变可定出浊音变为清音语音的时刻, En 由低向高的跳变可定出清音变为浊音语音的时刻，而只有浊音才有基音周期,清音的基音周期为零。故清浊音判断是基音检测的第一步。

该算法中窗口选择汉明窗,选择汉明窗的理由是窗函数的选取原则为窗函数截取后的x ( n) 尽量是中间大两头小的光滑函数,冲激响应对应的滤波器具有低通特性。从汉明窗的构成及频率响应特性上看, 汉明窗具有这种特性, 而矩形窗及汉宁窗则稍逊之。汉明窗虽然主瓣最高(带宽大) ,但旁瓣最低(通带外的衰减大) , 可以有效地克服泄露现象,具有更好的低通特性。故选择汉明窗而不选择别的窗函数,能使短时平均能量En 更能反映语音信号的幅度变化。

短时能量函数的应用:

1）可用于区分清音段与浊音段。En值大对应于浊音段，En值小对应于清音段。

2）可用于区分浊音变为清音或清音变为浊音的时间（根据En值的变化趋势）。

3）对高信噪比的语音信号，也可以用来区分有无语音（语音信号的开始点

或终止点）。无信号（或仅有噪声能量）时，En 值很小，有语音信号时，能量显著增大。

3.1.3 短时过零率

过零率可以反映信号的频谱特性。对于连续语音信号，可以考察其时域波形通过时间轴的情况。对于离散时间信号，如果相邻两个样点的正负号相异时，我们称之为“过零”，即此时信号的时间波形穿过了零电平的横轴。由此可以计算过零数，过零数就是样本改变符号的次数，统计单位时间内样点值改变符号的次数就可以得到平均过零率。短时过零分析通常用在端点检测，特别是用来估计清音的起始位置和结束位置。

短时平均过零率定义为：

sgn[[]sgn[(1)]()n m Z x m x m w n m ∞=-∞=

---∑ （3-3）

在矩形窗条件下，可以简化为 11sgn[()sgn[(1)]2n n m n N Z x m x m N =-+=--∑ （3-4）

短时过零率可以粗略估计语音的频谱特性。由语音的产生模型可知，发浊音时，声带振动，尽管声道有多个共振峰，但由于声门波引起了频谱的高频衰落，因此浊音能量集中于3KZ 以下。而清音由于声带不振动，声道的某些部位阻塞气流产生类白噪声，多数能量集中在较高频率上。高频率对应着高过零率，低频率对应着低过零率，那么过零率与语音的清浊音就存在着对应关系。.

音频为“电子信息”的短时过零率的波形图如下图3所示及程序如下：

Zn=zeros(1,(LL-1)*240);

for ii=2:(LL-1)*240,

temp1=sign(Y(ii:ii+240));

temp=sign(Y(ii-1:ii+240-1));

Zn(ii)=sum(abs(temp1-temp));

end

figure(3)

jj=[1:(LL-1)*240];

plot(jj, Zn,'b'); %绘制短时过零率函数曲线

xlabel('帧数');

ylabel('短时过零率');

title('短时过零率');

grid on;

图3 短时平均过零率

分析可知：清音的短时能量较低，过零率高，浊音的短时能量较高，过零率低。清音的过零率为0.5左右，浊音的过零率为0.1左右，两但者分布之间有相互交叠的区域，所以单纯依赖于平均过零率来准确判断清浊音是不可能的，在实际应用中往往是采用语音的多个特征参数进行综合判决。

短时过零率的应用：

1）区别清音和浊音。清音的过零率高，浊音的过零率低。此外，清音和浊音的两种过零分布都与高斯分布曲线比较吻合。

2）从背景噪声中找出语音信号。语音处理领域中的一个基本问题是，如何将一串连续的语音信号进行适当的分割，以确定每个单词语音的信号，亦即找出每个单词的开始和终止位置。

3）在孤立词的语音识别中，可利用能量和过零作为有话无话的鉴别。

3.2语音信号端点检测

3.2.1基于短时能量和短时过零率的双门限端点检测原理

双门限法是利用短时能量和过零率的乘积进行检测的。在基于短时能量和过零率的双门限端点检测算法中首先为短时能量和过零率分别确定两个门限，一个为较低的门限，对信号的变化比较敏感，另一个是较高的门限。当低门限被超过时，很有可能是由于很小的噪声所引起的，未必是语音的开始，当高门限被超过并且在接下来的时间段内一直超过低门限时，则意味着语音信号的开始。

该算法的原理简述如下：

对上述两种特征作一个统计估计，得到两个门限值，利用短时能量检测浊音，短时过零率检测清音，两者配合从而确定语音的端点。由于采集的声音信号中最初的短时段多为无声或背景噪声，这样就可以利用已知为“静态”的最初几帧(一般取10帧)信号计算其过零率阀值zcr及高、低能量阀值amp2(低能量阀)和amp1 (高能量阀)。过零率公式：

∑-=

+ -

(

)

(

)(

zcr（3-5）

计算amp2和amp1时，首先计算最初10帧信号中每帧的短时平均能量或平均幅度E，最大值记为max，最小值记为min。

本文在计算短时能量之前，先经过一个滤波器，高通滤波器，此为预加重滤波器，目的在于滤除低频干扰，尤其是50Hz或60Hz的工频干扰，将对于语言识别更为有用的高频部分的频率进行提升，在计算短时能量之前应用该滤波器，还可以起到消除直流漂移、抑制随机噪声和提升清音部分能量的效果。其关键代码为amp=sum(abs(enframe(filter([1-0.98],1,x),FrameLen,FrameInc)),2)。文中能量门限调整代码为：

amp1=min(amp1,max(amp)/4);

amp2=min(amp2,max(amp)/8);

根据语音信号的实际情况对门限值进行调整，以便更好的对语音端点进行检测。

其端点检测的流程如下所述：开始进行端点检测之前，首先为短时能量和过过零率分别确定两个门限amp1、amp2、zcr1、zcr2, 其中amp2、zcr2分别为短时能量和过零率比较低的门限，其数值比较小，对信号的变化比较敏感，很容易就会超过。另外amp1、zcr1是比较高的门限，数值比较大，信号必须达到一定的强度，该门限才可能被超过。低们限被超过未必就是语音信号的开始，有可能是时间很短的噪声引起的。高门限被超过则可以基本确信是由于语音信号引起的。

整个语音信号的端点检测可以分为四段：静音、过度段、语音段、结束。程序中使用一个变量status 来表示当前所处的状态。在静音段，如果能量或过零率超越了低门限，就应该开始标记起始点，进入过渡段。在过渡段中，由于参数的数值比较小，不能确信是否处于真正的语音段，因此只要个参数的数值都回落到低门限以下，就可以确信进入语音段落。而如果在过渡段中两个参数中的任一个超过了高门限，就可以确信进入语音段了。

一些突发性的噪声也可以引起短时能量或过零率的数值很高，但是往往不能维持足够的长的时间，如门窗的开关、物体的碰撞等引起的噪声。这些都可以通过设定最短时间门限来判别。当前状态处于语音时，如果两个参数的值下降低到低门限以下，而且总的记时长度小于最短时间门限，则认为这是一段噪音，继续扫描以后的语音数据，否则就标记好结束端点，并返回。

3.2.2 双门限语音端点检测实验分析

1、实验环境及参数设置

双门限语音端点检测是在MATLAB 软件环境下进行仿真实验。文中语音信号样本是在实验室安静环境下采用麦克风进行录音，以wav 格式存储为较纯净的语音样本。实验所加的噪声为伪随机加性高斯白噪声，实验中对较纯净语音样本进行加噪，形成不同SNR 的带噪语音样本，然后分别对较纯净的语音样本和加噪后的语音样本进行语音端点检测，并对它们的检测结果进行比较。在语音端点检测之前首先要对被测的语音信号进行预处理等，包括分帧加窗等。文中加Hmmaing 窗，通过特性为(1-0.941-Z )的滤波器预加重。对其他参数进行设置，如设置语音帧长度，帧移长度，FFT 取512，门限阀值设置等。

2、性能准则

在各种各样的信号处理系统中，噪声信号相对于有用信号而言，所造成的都是干扰和破坏作用，但是噪声却是普遍存在的。噪声信号一般分为加性噪声和非加性噪声加性噪声一般被分为冲激噪声、周期性噪声、宽带噪声、相同声道情况下其他语音信号的干扰噪声等等。

（1）高斯噪声

高斯噪声是指概率密度函数服从高斯分布的一类噪声。高斯分布，也称正态分布，记为N(μ，2σ)，其中μ和2σ为分布的参数，分别为高斯分布的期望和方差特别当μ=0，2σ=1时，X 的分布为标准正态分布。

（2）信噪比

信噪比是指信号的有用成份与噪声功率之比，称为信号噪声比,简称信噪比，常常用分贝数表示。信噪比越高表明它产生的杂音越少。其公式为：

S SNR lg 10?= 其中 S 、N 分别表示原始信号功率与噪声信号功率. 而波形信号计算式为：

))()(l g (102

n e n s SNR ∑∑?= 其中I 为原始语音信号，In 为带噪声信号；p1为原始信号功率，p2为噪声信号功率。

文中采用的端点检测通过在较纯净语音信号中加入加性高斯噪声，然后对其进行语音端点检测，改变信噪比值，观察在高信噪比和低信噪比条件下双门限语音端点检测结果，通过实验仿真图比较和分析噪声对各算法语音端点检测结果的影响。

3、分析

基于短时能量和短时过零率的双门限语音端点检测算法是结合短时能量和过零率各自优点来进行检测，双门限端点检测图中红色竖线用来表示语音起点线，绿色竖线表示语音终点线，其检测的实验仿真图如图3.7所示：

function snr=SNR(I,In)

p1=1/length(I)*norm(I)^2;

p2=1/length(I)*norm(In - I)^2;

snr=10*log(p1/p2);

end

tmp1=enframe(x(l:length(x)-l)，FrameLen ，Framelne);

tmp2=enframe(x(2:length(x))，FrameLen ，Framelne);

signs=(tmp1.*tmp2)<0;

diffs=(tmp1-tmp2)>0.02;

zcr=sum(signs.*diffs ，2);

图4 “端点检测”原始语音信号双门限语音端点检测波形图

语音信号处理实验指导书

语音信号处理实验指导书实验一语音信号采集与简单处理一、实验目的、要求（1）掌握语音信号采集的方法（2）掌握一种语音信号基音周期提取方法（3）掌握短时过零率计算方法（4）了解Matlab 的编程方法二、实验原理基本概念：（a ）短时过零率：短时内，信号跨越横轴的情况，对于连续信号，观察语音时域波形通过横轴的情况；对于离散信号，相邻的采样值具有不同的代数符号，也就是样点改变符号的次数。对于语音信号，是宽带非平稳信号，应考察其短时平均过零率。其中sgn[.]为符号函数 ?? ?? ?<=>=0 x(n)-1sgn(x(n))0 x(n)1sgn(x(n)) 短时平均过零的作用 1.区分清/浊音：浊音平均过零率低，集中在低频端；清音平均过零率高，集中在高频端。 2.从背景噪声中找出是否有语音，以及语音的起点。（b ）基音周期基音是发浊音时声带震动所引起的周期性，而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一，它描述语音激励源的一个重要特征，基音周期信息在多个领域有着广泛的应用，如语音识别、说话人识别、语音分析与综合以及低码率语音编码，发音系统疾病诊断、听觉残障者的语音指导等。因为汉语是一种有调语言，基音的变化模式称为声调，它携带着非常重要的具有辨意作用的信息，有区别意义的功能，所以，基音的提取和估计对汉语更是一个十分重要的问题。 ∑--= -=1 )]1(sgn[)](sgn[21N m n n n m x m x Z

由于人的声道的易变性及其声道持征的因人而异，而基音周期的范围又很宽，而同—个人在不同情态下发音的基音周期也不同，加之基音周期还受到单词发音音调的影响，因而基音周期的精确检测实际上是一件比较困难的事情。基音提取的主要困难反映在：①声门激励信号并不是一个完全周期的序列，在语音的头、尾部并不具有声带振动那样的周期性，有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。②声道共振峰有时会严重影响激励信号的谐波结构，所以，从语音信号中直接取出仅和声带振动有关的激励信号的信息并不容易。③语音信号本身是准周期性的(即音调是有变化的)，而且其波形的峰值点或过零点受共振峰的结构、噪声等的影响。④基音周期变化范围大，从老年男性的50Hz 到儿童和女性的450Hz ，接近三个倍频程，给基音检测带来了一定的困难。由于这些困难，所以迄今为止尚未找到一个完善的方法可以对于各类人群(包括男、女、儿童及不向语种)、各类应用领域和各种环境条件情况下都能获得满意的检测结果。尽管基音检测有许多困难，但因为它的重要性，基音的检测提取一直是一个研究的课题，为此提出了各种各样的基音检测算法，如自相关函数(ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT 、谱图法、小波法等等。三、使用仪器、材料微机（带声卡）、耳机，话筒。四、实验步骤（1）语音信号的采集利用Windows 语音采集工具采集语音信号，将数据保存wav 格式。采集一组浊音信号和一组清音信号，信号的长度大于3s 。（2）采用短时相关函数计算语音信号浊音基音周期，考虑窗长度对基音周期计算的影响。采用倒谱法求语音信号基音周期。（3）计算短时过零率，清音和浊音的短时过零率有何区别。五、实验过程原始记录（数据，图表，计算）短时过零率短时相关函数 P j j n s n s j R N j n n n n ,,1) ()()(1 =-=∑-= ∑--=-=10 )]1(sgn[)](sgn[21N m n n n m x m x Z

语音信号处理与及其MATLAB实现分析

目录摘要 (2) 第一章绪论 (3) 1.1 语音课设的意义 (3) 1.2 语音课设的目的与要求 (3) 1.3 语音课设的基本步骤 (3) 第二章设计方案论证 (5) 2.1 设计理论依据 (5) 2.1.1 采样定理 (5) 2.1.2 采样频率 (5) 2.1.3 采样位数与采样频率 (5) 2.2 语音信号的分析及处理方法 (6) 2.2.1 语音的录入与打开 (6) 2.2.2 时域信号的FFT分析 (6) 2.2.3 数字滤波器设计原理 (7) 2.2.4 数字滤波器的设计步骤 (7) 2.2.5 IIR滤波器与FIR滤波器的性能比较 (7) 第三章图形用户界面设计 (8) 3.1 图形用户界面概念 (8) 3.2 图形用户界面设计 (8) 3.3 图形用户界面模块调试 (9) 3.3.1 语音信号的读入与打开 (9) 3.3.2 语音信号的定点分析 (9) 3.3.3 N阶高通滤波器 (11) 3.3.4 N阶低通滤波器 (12) 3.3.5 2N阶带通滤波器 (13) 3.3.6 2N阶带阻滤波器 (14) 3.4 图形用户界面制作 (15) 第四章总结 (18) 附录 (19) 参考文献 (24)

摘要数字信号处理是将信号以数字方式表示并处理的理论和技术。数字信号处理与模拟信号处理是信号处理的子集。数字信号处理的目的是对真实世界的连续模拟信号进行测量或滤波。因此在进行数字信号处理之前需要将信号从模拟域转换到数字域，这通常通过模数转换器实现。而数字信号处理的输出经常也要变换到模拟域，这是通过数模转换器实现的。数字信号处理的算法需要利用计算机或专用处理设备如数字信号处理器（DSP）和专用集成电路（ASIC）等。数字信号处理技术及设备具有灵活、精确、抗干扰强、设备尺寸小、造价低、速度快等突出优点，这些都是模拟信号处理技术与设备所无法比拟的。数字信号处理的核心算法是离散傅立叶变换(DFT)，是DFT使信号在数字域和频域都实现了离散化，从而可以用通用计算机处理离散信号。而使数字信号处理从理论走向实用的是快速傅立叶变换(FFT)，FFT的出现大大减少了DFT的运算量，使实时的数字信号处理成为可能、极大促进了该学科的发展。 MATLAB是矩阵实验室（Matrix Laboratory）的简称，和Mathematica、Maple 并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等，主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。 MATLAB的基本数据单位是矩阵，它的指令表达式与数学、工程中常用的形式十分相似，故用MATLAB来解算问题要比用C，FORTRAN等语言完相同的事情简捷得多，并且mathwork也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C，FORTRAN，C++ ，JAVA的支持。可以直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用，此外许多的MATLAB爱好者都编写了一些经典的程序，用户可以直接进行下载就可以用。

语音信号处理答案

二、问答题（每题分，共分）、语音信号处理主要研究哪几方面的内容？语音信号处理是研究用数字信号处理技术对语言信号进行处理的一门学科，语音信号处理的理论和研究包括紧密结合的两个方面：一方面，从语言的产生和感知来对其进行研究，这一研究与语言、语言学、认知科学、心理、生理等学科密不可分；另一方面，是将语音作为一种信号来进行处理，包括传统的数字信号处理技术以及一些新的应用于语音信号的处理方法和技术。、语音识别的研究目标和计算机自动语音识别的任务是什么？语音识别技术，也被称为自动语音识别，()，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。计算机自动语音识别的任务就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。、语音合成模型关键技术有哪些？语音合成是实现人机语音通信，建立一个有听和讲能力的口语系统所需的两项关键技术，该系统主要由三部分组成：文本分析模块、韵律生成模块和声学模块。.如何取样以精确地抽取人类发信的主要特征，.寻求什么样的网络特征以综合声道的频率响应，.输出合成声音的质量如何保证。、语音压缩技术有哪些国际标准？二、名词解释（每题分，共分）端点检测：就从包含语音的一段信号中，准确的确定语音的起始点和终止点，区分语音信号和非语音信号。共振峰：当准周期脉冲激励进入声道时会引起共振特性，产生一组共振频率，称为共振峰频率或简称共振峰。语谱图：是一种三维频谱，它是表示语音频谱随时间变化的图形，其纵轴为频率，横轴为时间，任一给定的频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。码本设计：就是从大量信号样本中训练出好的码本，从实际效果出发寻找好的失真测度定义公示，用最少的搜素和计算失真的运算量。语音增强：语音质量的改善和提高，目的去掉语音信号中的噪声和干扰，改善它的质量三、简答题（每题分，共分）、简述如何利用听觉掩蔽效应。一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。人耳的掩蔽效应一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值，或者说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表明，—绝对闻阈值最小，即人耳对它的微弱声音最敏感；而在低频和高频区绝对闻阈值要大得多。在范围内闻阈随频率变化最不显著，即在这个范围内语言可储度最高。在掩蔽情况下，提高被掩蔽弱音的强度，使人耳能够听见时的闻阈称为掩蔽闻阈(或称掩蔽门限)，被掩蔽弱音必须提高的分贝值称为掩蔽量(或称阈移)。、简述时间窗长与频率分辨率的关系。采样周期、窗口长度和频率分辨率△之间存在下列关系：△(*) 可见，采样周期一定时，△随窗口宽度的增加而减少，即频率分辨率相应得到提高，但同时时间分辨率降低；如果窗口取短，频率分辨率下降，而时间分辨率提高，因而二者是矛盾的。、简述时域分析的技术（最少三项）及其在基因检测中的应用。（）

基于Matlab的语音信号处理与分析

系（院）物理与电子工程学院专业电子信息工程题目语音信号的处理与分析学生姓名指导教师班级学号完成日期：2013 年5 月目录 1 绪论.............................................................................................................. 错误!未定义书签。 1.1课题背景及意义................................................................................. 错误!未定义书签。 1.2国内外研究现状................................................................................. 错误!未定义书签。 1.3本课题的研究内容和方法................................................................. 错误!未定义书签。 1.3.1 研究内容................................................................................ 错误!未定义书签。 1.3.2 开发环境................................................................................ 错误!未定义书签。 2 语音信号处理的总体方案............................................................................ 错误!未定义书签。 2.1 系统基本概述.................................................................................... 错误!未定义书签。 2.2 系统基本要求与目的........................................................................ 错误!未定义书签。 2.3 系统框架及实现................................................................................ 错误!未定义书签。 2.3.1 语音信号的采样.................................................................... 错误!未定义书签。 2.3.2 语音信号的频谱分析............................................................ 错误!未定义书签。 2.3.3 音乐信号的抽取.................................................................... 错误!未定义书签。 2.3.4 音乐信号的AM调制.............................................................. 错误!未定义书签。 2.3.5 AM调制音乐信号的同步解调............................................... 错误!未定义书签。 2.4系统设计流程图................................................................................. 错误!未定义书签。 3 语音信号处理基本知识................................................................................ 错误!未定义书签。 3.1语音的录入与打开............................................................................. 错误!未定义书签。 3.2采样位数和采样频率......................................................................... 错误!未定义书签。 3.3时域信号的FFT分析......................................................................... 错误!未定义书签。 3.4切比雪夫滤波器................................................................................. 错误!未定义书签。 3.5数字滤波器设计原理......................................................................... 错误!未定义书签。 4 语音信号实例处理设计................................................................................ 错误!未定义书签。 4.1语音信号的采集................................................................................. 错误!未定义书签。

基于MATLAB的语音信号处理系统设计(程序+仿真图)--毕业设计

语音信号处理系统设计摘要：语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。语音信号处理的目的是得到某些参数以便高效传输或存储,或者是用于某种应用，如人工合成出语音、辨识出讲话者、识别出讲话内容、进行语音增强等。本文简要介绍了语音信号采集与分析以及语音信号的特征、采集与分析方法，并在采集语音信号后，在MATLAB 软件平台上进行频谱分析,并对所采集的语音信号加入干扰噪声，对加入噪声的信号进行频谱分析，设计合适的滤波器滤除噪声，恢复原信号。利用MATLAB来读入（采集）语音信号，将它赋值给某一向量，再将该向量看作一个普通的信号，对其进行FFT变换实现频谱分析，再依据实际情况对它进行滤波，然后我们还可以通过sound命令来对语音信号进行回放，以便在听觉上来感受声音的变化。关键词：Matlab，语音信号，傅里叶变换，滤波器 1课程设计的目的和意义本设计课题主要研究语音信号初步分析的软件实现方法、滤波器的设计及应用。通过完成本课题的设计，拟主要达到以下几个目的： 1.1．了解Matlab软件的特点和使用方法。 1.2．掌握利用Matlab分析信号和系统的时域、频域特性的方法； 1.3．掌握数字滤波器的设计方法及应用。 1.4．了解语音信号的特性及分析方法。 1.5．通过本课题的设计，培养学生运用所学知识分析和解决实际问题的能力。 2 设计任务及技术指标设计一个简单的语音信号分析系统，实现对语音信号时域波形显示、进行频谱分析，

利用滤波器滤除噪声、对语音信号的参数进行提取分析等功能。采用Matlab设计语言信号分析相关程序，并且利用GUI设计图形用户界面。具体任务是： 2.1．采集语音信号。 2.2．对原始语音信号加入干扰噪声，对原始语音信号及带噪语音信号进行时频域分析。 2.3．针对语音信号频谱及噪声频率，设计合适的数字滤波器滤除噪声。 2.4．对噪声滤除前后的语音进行时频域分析。 2.5.对语音信号进行重采样，回放并与原始信号进行比较。 2.6．对语音信号部分时域参数进行提取。 2.7．设计图形用户界面（包含以上功能）。 3 设计方案论证 3.1语音信号的采集使用电脑的声卡设备采集一段语音信号，并将其保存在电脑中。 3.2语音信号的处理语音信号的处理主要包括信号的提取播放、信号的重采样、信号加入噪声、信号的傅里叶变换和滤波等，以及GUI图形用户界面设计。 Ⅰ.语音信号的时域分析语音信号是一种非平稳的时变信号，它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换域等处理方法，其中时域分析是最简单的方法。 Ⅱ.语音信号的频域分析信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说，可以很方便地确定其对正弦或复指数和的响应，所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外，傅立叶表示使信号的某些特性变得更明显，因此，它能更

语音信号处理实验报告

语音信号处理实验班级：学号：姓名：实验一基于MATLAB的语音信号时域特征分析（2学时）

1）短时能量（1）加矩形窗 a=wavread('mike.wav'); a=a(:,1); subplot(6,1,1),plot(a); N=32; for i=2:6 h=linspace(1,1,2.^(i-2)*N);%形成一个矩形窗，长度为2.^(i-2)*N En=conv(h,a.*a);% 求短时能量函数En subplot(6,1,i),plot(En); if(i==2) ,legend('N=32'); elseif(i==3), legend('N=64'); elseif(i==4) ,legend('N=128'); elseif(i==5) ,legend('N=256'); elseif(i==6) ,legend('N=512'); end end

00.51 1.52 2.5 3 x 10 4 -1 1 x 10 4 024 x 10 4 05 x 10 4 0510 x 10 4 01020 x 10 4 02040 （2）加汉明窗 a=wavread('mike.wav'); a=a(:,1); subplot(6,1,1),plot(a); N=32; for i=2:6 h=hanning(2.^(i-2)*N);%形成一个汉明窗，长度为2.^(i-2)*N En=conv(h,a.*a);% 求短时能量函数En subplot(6,1,i),plot(En); if(i==2), legend('N=32'); elseif(i==3), legend('N=64'); elseif(i==4) ,legend('N=128');

语音信号处理 (第2版)赵力编著语音信号处理勾画要点

语音信号处理（第2版）赵力编著重点考点第2章语音信号处理的基础知识 1.语音（Speech）是声音（Acoustic）和语言（Language）的组合体。可以这样定义语音：语音是由一连串的音组成语言的声音。 2.人的说话过程可以分为五个阶段：（1）想说阶段（2）说出阶段（3）传送阶段（4）理解阶段（5）接收阶段。 3.语音是人的发声器官发出的一种声波，它具有一定的音色，音调，音强和音长。其中，音色也叫音质，是一种声音区别于另一种声音的基本特征。音调是指声音的高低，它取决于声波的频率。声音的强弱叫音强，它由声波的振动幅度决定。声音的长短叫音长，它取决于发音时间的长短。 4.说话时一次发出的，具有一个响亮的中心，并被明显感觉到的语音片段叫音节（Syllable）。一个音节可以由一个音素（Phoneme）构成，也可以由几个音素构成。音素是语音发音的最小单位。任何语言都有语音的元音（Vowel）和辅音（Consonant）两种音素。 5.元音的另一个重要声学特性是共振峰（Formant）。共振峰参数是区别不同元音的重要参数，它一般包括共振峰频率（Formant Frequency）的位置和频带宽度（Formant Bandwidth）。 6.区分语音是男声还是女声、是成人声音还是儿童声音，更重要的因素是共振峰频率的高低。 7.浊音的声带振动基本频率称基音周期（或基音频率），F0表示。 8.人的听觉系统有两个重要特性，一个是耳蜗对于声信号的时频分析特性；另一个是人耳听觉掩蔽效应。 9.掩蔽效应分为同时掩蔽和短时掩蔽。 10.激励模型：一般分成浊音激励和清音激励。浊音激励波是一个以基音周期为周期的斜三角脉冲串。 11.声道模型：一是把声道视为由多个等长的不同截面积的管子串联而成的系统。按此观点推导出的叫“声管模型”。另一个是把声道视为一个谐振腔，按此推导出的叫“共振峰模型”。 12.完整的语音信号的数字模型可以用三个子模型：激励模型、声道模型和辐射模型的串联来表示。 13.语谱图：人们致力于研究语音的时频分析特性，把和时序相关的傅立叶分析的显示图形。第三章语音信号分析 1.贯穿于语音分析全过程的是“短时分析技术”。 2.语音信号的数字化一般包括放大及增益控制、反混叠滤波、采样、A/D变换及编码（一般就是PCM码）；预处理一般包括预加重、加窗和分帧等。 3.预滤波的目的有两个：

《语音信号处理》期末考试试题

2011-2012学年第一学期《语音信号处理》期末考试试题（A）适用班级：时量：120分钟闭卷记分：考生班级：姓名：学号：注：答案全部写在答题纸上，写在试卷上无效！一、填空题：（共7小题，每空2分，共20分） 1、矢量量化系统主要由编码器和组成，其中编码器主要是由搜索算法和构成。 2、基于物理声学的共振峰理论，可以建立起三种实用的共振峰模型：级联型、并联型和。 3、语音编码按传统的分类方法可以分为、和混合编码。 4、对语音信号进行压缩编码的基本依据是语音信号的和人的听觉感知机理。 5、汉语音节一般由声母、韵母和三部分组成。 6、人的听觉系统有两个重要特性，一个是耳蜗对于声信号的时频分析特性；另一个是人耳听觉的效应。 7、句法的最小单位是，词法的最小单位是音节，音节可以由构成。二、判断题：（共3小题，每小题2分，共6分）

1、预测编码就是利用对误差信号进行编码来降低量化所需的比特数，从而使编码速率大幅降低。（） 2、以线性预测分析-合成技术为基础的参数编码，一般都是根据语音信号的基音周期和清/浊音标志信息来决定要采用的激励信号源。（） 3、自适应量化PCM就是一种量化器的特性，能自适应地随着输入信号的短时能量的变化而调整的编码方法。（）三、单项选择题：（共3小题，每小题3分，共9分） 1、下列不属于衡量语音编码性能的主要指标是（）。（A）编码质量（B）矢量编码（C）编码速率（D）坚韧性 2、下列不属于编码器的质量评价的是（）（A）MOS （B）DAM（C）DRT（D）ATC 3、限词汇的语音合成技术已经比较成熟了，一般我们是采用（）作为合成基元。（A）词语（B）句子（C）音节（D）因素四、简答题：（共2小题，每小题12分，共24分） 1、画出矢量量化器的基本结构，并说明其各部分的作用。 2、试画出语音信号产生的离散时域模型的原理框图，并说明各部分的作用。五、简答题：（共5小题，前三小题，每题5分，后两小题，每题10分，共35分） 1、线性预测分析的基本思想是什么？

通信中的语音信号处理复习大纲

《通信中的语音信号处理》复习大纲北科大版 1、了解语音信号处理的目的、实质和发展历史；实质：是研究用数字信号处理技术对语音信号进行处理的一门学科目的：通过处理得到一些反映语音信号重要特征的语音参数以便高效地传输或储存语音信号所包含的信息。通过对语音信号进行某种运算以达到某种要求。发展历史：1876年电话的发明，贝尔（Bell）； 1939年声码器的研制成功—声源＋声道； 1947年贝尔实验室发明语谱图仪—语音识别研究的开始； 50年代第一台口授打字机和英语单词语音识别器； 60年代出现了第一台以数字计算机为基础的孤立词语音识别器和有限连续语音识别器； 70年代动态规划技术、隐马尔可夫模型、线性预测技术和矢量量化码书生成方法用于语音编码和识别； 80、90年代语音处理技术产品化—IBM Tangora-5和Tangora-20英语听写机，Dragon Dictate 词汇翻译系统(70000)，汉语听写机。 CMU语音组研制成功SPHINX系统（997，95.8%); 国内，清华大学、中科院声学所和中科院自动化所在汉语听写机研究方面有一定成果。（除了属于这种LPC[线性预测分析法]的方法外，还开发了各种数字语音处理方法。到目前为止，相继实现了语音编码、语音分析、语音合成、语音修正、语音识别、说话者识别等各种具体应用系统。） 2、理解和掌握语音信号的表示和处理方法，常用的语音编码的采样率和相应的数字语音信号的速率； 1.语音表示方法的选择：要保存语音信号中的消息内容；表示形式要便于传输和存储、变换和处理，不至于严重损害消息的内容，有用信息更易于被提取； 2. 语音信号数字表示的优点：数字技术能完成许多很复杂的信号处理工作；语音可以看成是音素的组合，具有离散的性质，特别适合于数字处理；数字系统具有高可靠性、价廉、紧凑、快速等特点，很容易完成实时处理任务；数字语音适于在强干扰信道中传输，易于和数据一起在通信网中传输，也易于进行加密传输。 3. 语音信号的数字表示方法：波形表示—采样和量化，保持波形；参数表示—激励源和模型参数（第二章）语音信号的特点—短时平稳性 4. 处理方法：短时时域处理方法—短时能量、短时平均过零率以及短时自相关函数计算短时频域分析—短时傅立叶分析线性预测技术—本质上属于时域分析方法，但其结果可以是频域参数倒谱和同态分析、矢量量化和隐马尔可夫模型 5. PCM编码：采样率：8000次/second，均匀量化：采样率12bps信号速率96kbps，非均匀量化：采样率8bps信号速率64kbps ADPCM：采样率：8khz速率：32kbps 3、理解语音信号的产生过程、发生机理和语音信号的声学特性；产生过程：语音是说话人和听者之间相互传递的信号，传递的媒介是声波，说话人的发音器官做出发声动作，接着空气振动形成声波，声波传到听者的耳朵里，立刻引起听者的听觉反应发生机理：声学特性：频率：与音高有关；振幅：与响度有关。 4、理解和掌握语音信号浊音的基音频率、共振峰，及共振峰的计算方法；浊音的基音频率(F0)：由声带的尺寸、特性和声带所受张力决定，其值等于声带张开和闭合一次的时间的倒数。人类基音频率的范围在60Hz至450Hz左右。共振峰（formant)：声道是一个谐振腔，当激励的频率达到至声道的固有频率，则声道会以最大的振幅振荡，此时的频率称之为共振峰或共振峰频率。声道具有的一组共振峰，声道的频谱特性主要反映出这些共振峰的不同位置以及各个峰的频带宽度。共振峰及其带宽取决于声道某一瞬间的形状和尺寸，因而不同的语音对应于一组不同的共振峰参数。实际应用中，头三个共振峰最重要。

语音信号处理实验报告

通信与信息工程学院信息处理综合实验报告班级：电子信息工程1502班指导教师：设计时间：2018/10/22-2018/11/23 评语：通信与信息工程学院二〇一八年实验题目：语音信号分析与处理一、实验内容 1. 设计内容利用MATLAB对采集的原始语音信号及加入人为干扰后的信号进行频谱分析，使用窗函数法设计滤波器滤除噪声、并恢复信号。 2．设计任务与要求 1. 基本部分

（1）录制语音信号并对其进行采样；画出采样后语音信号的时域波形和频谱图。（2）对所录制的语音信号加入干扰噪声，并对加入噪声的信号进行频谱分析；画出加噪后信号的时域波形和频谱图。（3）分别利用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman 窗几种函数设计数字滤波器滤除噪声，并画出各种函数所设计的滤波器的频率响应。（4）画出使用几种滤波器滤波后信号时域波形和频谱，对滤波前后的信号、几种滤波器滤波后的信号进行对比，分析信号处理前后及使用不同滤波器的变化；回放语音信号。 2. 提高部分（5）录制一段音乐信号并对其进行采样；画出采样后语音信号的时域波形和频谱图。（6）利用MATLAB产生一个不同于以上频段的信号；画出信号频谱图。（7）将上述两段信号叠加，并加入干扰噪声，尝试多次逐渐加大噪声功率，对加入噪声的信号进行频谱分析；画出加噪后信号的时域波形和频谱图。（8）选用一种合适的窗函数设计数字滤波器，画出滤波后音乐信号时域波形和频谱，对滤波前后的信号进行对比，回放音乐信号。二、实验原理 1.设计原理分析本设计主要是对语音信号的时频进行分析，并对语音信号加噪后设计滤波器对其进行滤波处理，对语音信号加噪声前后的频谱进行比较分析，对合成语音信号滤波前后进行频谱的分析比较。首先用PC机WINDOWS下的录音机录制一段语音信号，并保存入MATLAB软件的根目录下，再运行MATLAB仿真软件把录制好的语音信号用audioread函数加载入MATLAB仿真软件的工作环境中，输入命令对语音信号进行时域，频谱变换。对该段合成的语音信号，分别用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman窗几种函数在MATLAB中设计滤波器对其进行滤波处理，滤波后用命令可以绘制出其频谱图，回放语音信号。对原始语音信号、合成的语音信号和经过滤波器处理的语音信号进行频谱的比较分析。 2.语音信号的时域频域分析在Matlab软件平台下可以利用函数audioread对语音信号进行采样,得到了声音数据变量y,同时把y的采样频率Fs=44100Hz放进了MATALB的工作空间。

语音信号处理matlab实现

短时能量分析matlab源程序： x=wavread('4.wav'); %计算N=50，帧移=50时的语音能量 s=fra(50,50,x);%对输入的语音信号进行分帧，其中帧长50，帧移50 s2=s.^2;%一帧内各种点的能量 energy=sum(s2,2);%求一帧能量 subplot(2,2,1); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=50'); axis([0,500,0,30]) %计算N=100，帧移=100时的语音能量 s=fra(100,100,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,2); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=100'); axis([0,300,0,30]) %计算N=400，帧移=400时的语音能量 s=fra(400,400,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,3); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=400'); axis([0,60,0,100]) %计算N=800，帧移=800时的语音能量 s=fra(800,800,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,4); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=800'); axis([0,30,0,200]) 分帧子函数： function f=fra(len,inc,x) %对读入语音分帧，len为帧长，inc为帧重叠样点数，x为输入语音数据 fh=fix(((size(x,1)-len)/inc)+1);%计算帧数 f=zeros(fh,len);%设一个零矩阵，行为帧数，列为帧长 i=1;n=1; while i<=fh %帧间循环 j=1; while j<=len %帧内循环 f(i,j)=x(n); j=j+1;n=n+1; end n=n-len+inc;%下一帧开始位置 i=i+1; end

(完整)《语音信号处理》期末试题总结,推荐文档

2011-2013学年《语音信号处理》期末考试试题适用班级：时量：120分钟闭卷记分：考生班级：姓名：学号：注：答案全部写在答题纸上，写在试卷上无效！一、填空题：（每空2分） 1、矢量量化系统主要由编码器和译码器组成，其中编码器主要是由搜索算法和码书构成。P101 2、基于物理声学的共振峰理论，可以建立起三种实用的共振峰模型：级联型、并联型和混合型。P18 3、语音编码按传统的分类方法可以分为波形编码、参数编码和混合编码。P137 4、对语音信号进行压缩编码的基本依据是语音信号的冗余度和人的听觉感知机理。 P137-138 5、汉语音节一般由声母、韵母和声调三部分组成。P10 6、人的听觉系统有两个重要特性，一个是耳蜗对于声信号的时频分析特性；另一个是人耳听觉的掩蔽效应。P22 7、句法的最小单位是词，词法的最小单位是音节，音节可以由音素构成。P9 8、复倒谱分析中避免相位卷绕的算法，常用的有微分法和最小相位信号法。P62 9、语音信号处理也可以简称为语音处理，它是利用数字信号处理技术对语音信号进行处理的一门学科，包括语音编码、语音合成、语音识别、说话人识别和语音增强等五大分支。P3 10、语音信号处理也可以简称为语音处理，它是以数字信号处理和语音学为基础而形成的一个综合新的学科，包括发音语音学、声学语音学、听觉语音学和心理学等四大分支。P2，6 11、语音的四大要素：音质、音调、音强和音长。P9 12、人类发音过程有三类不同的激励方式，因而能产生三类不同的声音，即浊音、清音、和爆破音。P8 13、元音的一个重要声学特性是共振峰，它是区别不同元音的重要参数，它一般包括共振峰频率的位置和频带宽度。 14、语音信号的倒谱分析就是求取语音倒谱特征参数的过程，它可以通过同态信号处理来实现。P56 二、判断题：（每小题2分）√× 1、预测编码就是利用对误差信号进行编码来降低量化所需的比特数，从而使编码速率大幅降低。（×）P143 2、以线性预测分析-合成技术为基础的参数编码，一般都是根据语音信号的基音周期和清/浊音标志信息来决定要采用的激励信号源。（×）P181 3、自适应量化PCM就是一种量化器的特性，能自适应地随着输入信号的短时能量的变化而调整的编码方法。（×）P142 4、线性预测法正是基于全极点模型假定，采用时域均方误差最小准则来估计模型参数的。（×）P72 5、波形编码是依赖模型假定的语音编码方法。（×）P137 6、掩蔽效应是使一个声音A能感知的阀值因另一个声音B的出现而提高的现象，这时A叫

语音信号处理复习纲要

Ch1 绪论 §1.1 语音信号处理概述一、语音、语音信号处理的名词解释 1、语音：是语言的声学表现，是声音和意义的结合体，是相互传递信息的重要手段，是人类最重要、最有效、最常用和最方便的交换信息的形式。 2、语音信号处理：是研究用数字信号处理技术对语音信号进行处理的一门学科，它是一门新兴的学科，同时又是综合性的多学科领域和涉及很广的交叉学科。二、语音处理技术的应用领域语音处理技术的应用领域包括：工业、军事、交通、医学、民用等。三、语音信号采用数字处理的原因（数字语音的优点）语音信号均采用数字处理，是因为数字处理与模拟处理相比具有许多优点： 1、数字技术能够完成许多很复杂的信号处理工作； 2、通过语音进行交换的信息本质上具有离散的性质，语音可以看做是音素的组合，适合数字处理； 3、数字系统具有高可靠性、廉价、快速等优点，容易完成实时处理任务； 4、数字语音适合在强干扰信道中传输，也易于加密传输。四、语音学的名词解释语音学：是研究言语过程的一门科学，它包括三个研究内容：发音器官在发音过程中的运动和语音的音位特性；语音的物理特性；以及听觉和语言感知。 §1.2 语音信号处理的发展概况一、语音信号处理的发展史 1、1874年：电话的发明时现代语音通信的开端； 2、1939年：通道声码器技术； 3、40年代后期：语谱仪； 4、50年代初：第一台口授打字机和英语单词语音识别器； 5、60年代：Fant发表《语音产生的声学理论》； 6、70年代初：Flanagan著作《语音分析、合成和感知》； 7、90年代以来：语音识别的研究由实验室走向实用化。二、语音编码、语音合成、语音识别名词解释 1、语音编码：语音编码技术是伴随着语音信号的数字化而产生的，目前主要应用在数字语音通信领域。 2、语音合成：语音合成的目的是使计算机能像人一样说话，它是一种人机语音通信技术，应用领域广泛。 3、语音识别：语音识别是使计算机判断出所说的话得内容，和语音合成一样也是一种人机语音通信技术。为了实现人机语音通信，必须具备语音识别和语音理解两种功能 Ch2 基础知识 §2.2 语音产生的过程一、现代语音学发展的三个分支：发音语音学、声学语音学、听觉语音学。二、语音、清音、浊音的名词解释及语音的产生过程（名词解释、简答，集中备课） 1、语音：声音是一种波，能被人耳听到，振动频率在20Hz-20kHz之间。语音室声音的一种，它是由人的发音器官发出的、具有一定语法和意义的声音。语音的振动频率最高可达15kHz左右。 2、人类生成语音过程的第一阶段包括神经核肌肉的生理学阶段和产生语音波、传递语音波的物理阶段。 3、语音由声带振动或不经声带振动来产生，其中由声带振动产生的音统称为浊音，而不由声带振动产生的音统称为清音。浊音中包括所有的元音和一些辅音，清音包括另一部分辅音。

大学本科语音信号处理实验讲义8学时

语音信号处理实验讲义时间：2011-12

目录实验一语音信号生成模型分析 (3) 实验二语音信号时域特征分析 (7) 实验三语音信号频域特征分析 (12) 实验四语音信号的同态处理和倒谱分析 (16)

实验一语音信号生成模型分析一、实验目的 1、了解语音信号的生成机理，了解由声门产生的激励函数、由声道产生的调制函数和由嘴唇产生的辐射函数。 2、编程实现声门激励波函数波形及频谱，与理论值进行比较。 3、编程实现已知语音信号的语谱图，区分浊音信号和清音信号在语谱图上的差别。二、实验原理语音生成系统包含三部分：由声门产生的激励函数()G z 、由声道产生的调制函数()V z 和由嘴唇产生的辐射函数()R z 。语音生成系统的传递函数由这三个函数级联而成，即 ()()()()H z G z V z R z = 1、激励模型发浊音时，由于声门不断开启和关闭，产生间隙的脉冲。经仪器测试它类似于斜三角波的脉冲。也就是说，这时的激励波是一个以基音周期为周期的斜三角脉冲串。单个斜三角波的频谱表现出一个低通滤波器的特性。可以把它表示成z 变换的全极点形式 12 1()(1) cT G z e z --= -? 这里c 是一个常数，T 是脉冲持续时间。周期的三角波脉冲还得跟单位脉冲串的z 变换相乘： 112 1 ()()()1(1)v cT A U z E z G z z e z ---=?= ?--? 这就是整个激励模型，v A 是一个幅值因子。 2、声道模型当声波通过声道时，受到声腔共振的影响，在某些频率附近形成谐振。反映在信号频谱图上，在谐振频率处其谱线包络产生峰值，把它称为共振峰。一个二阶谐振器的传输函数可以写成 12 ()1i i i i A V z B z C z --= -- 实践表明，用前3个共振峰代表一个元音足够了。对于较复杂的辅音或鼻音共振峰要到5个以上。多个()i V z 叠加可以得到声道的共振峰模型 12 1 11 ()()11R r r M M i r i N k i i i i k k b z A V z V z B z C z a z -=---======---∑∑∑ ∑ 3、辐射模型从声道模型输出的是速度波，而语音信号是声压波。二者倒比称为辐射阻抗，它表征了

基于MATLAB的有噪声语音信号处理毕设

大学本科毕业设计论文基于MATLAB的有噪声语音信号处理

摘要滤波器设计在数字信号处理中占有极其重要的地位,FIR数字滤波器和IＩR 滤波器是滤波器设计的重要组成部分。Matｌａｂ功能强大、简单易学、编程效率高,深受广大科技工作者的欢迎。特别是Matlab还具有信号分析工具箱,不需具备很强的编程能力,就可以很方便地进行信号分析、处理和设计。利用ＭATＬＡＢ信号处理工具箱可以快速有效地设计各种数字滤波器。课题基于MAＴLAB 有噪音语音信号处理的设计与实现，综合运用数字信号处理的理论知识对加噪声语音信号进行时域、频域分析和滤波。通过理论推导得出相应结论,再利用MＡTLAB作为编程工具进行计算机实现。在设计实现的过程中，使用窗函数法来设计FＩR数字滤波器，用巴特沃斯、切比雪夫和双线性变法设计IIＲ数字滤波器，并利用MATLＡB作为辅助工具完成设计中的计算与图形的绘制。通过对对所设计滤波器的仿真和频率特性分析，可知利用ＭＡＴLAB信号处理工具箱可以有效快捷地设计FIR和IIR数字滤波器，过程简单方便，结果的各项性能指标均达到指定要求。关键词?数字滤波器；MATＬＡB；窗函数法；巴特沃斯; 切比雪夫; 双线性变换

Abｓtｒａｃt ?Filｔeｒdesiｇｎin ｄｉgｉtal sｉgnal proｃeｓsiｎｇplａysａn eｘtre ｍeｌｙiｍportａnt rｏle, FIR digital filtｅrs ａｎd IIR filter is an importａn ｔpaｒt of filter design.Matlab is ｐowｅrful,easy to ｌｅaｒn,pｒｏgｒａmming eｆfiｃieｎcｙ，which wａs wｅlcomｅd bｙthｅmajority oｆsc ｉentistｓ. Matlab alsｏhaｓ a particuｌar signaｌaｎalysis tｏolbｏx，it need notｈaｖe stronｇprｏgraｍminｇｓkiｌls can be easily signal anａlyｓiｓ, proｃesｓｉng aｎd design. Usｉng MATＬAB Signal Ｐroｃessing Toolbｏx can ｑｕickly anｄeｆficieｎtly design ａｖariｅtｙof digｉtaｌｆiltｅrs. ＭＡTLAB ｂaseｄon the noｉse issｕｅｓｐeech sｉｇnal processing deｓｉgn and ｉｍｐlｅmｅｎtation of digｉtal sｉgｎaｌprocessｉｎg inｔegrated use of ｔhe thｅoｒｅｔical knｏwlｅdge oｆtｈe ｓｐeecｈsｉｇｎal pｌus noiｓe, tｉme domaiｎ, frequencｙｄoｍaiｎanalysis ａnｄfiltering. Theｃorreｓponｄinｇresｕlts ｏbtａineｄthrougｈtheｏｒeticaｌｄerｉｖatｉon, ａnd thｅn use MATＬAB as a pｒogramｍing tooｌfor compuｔer iｍｐlementation．Iｍpleｍenｔｅd iｎthe desｉgn process，usinｇtｈｅｗindｏw function methoｄｔｏｄesiｇn FIR digiｔal fｉｌteｒs wｉｔh Butｔｅｒwortｈ, Chebyshev anｄbilinear Reｆｏｒm IIR dｉgｉtal filter dｅｓign ａｎd use ｏｆMATLAB ａs ａｓupplemenｔary tｏｏl to cｏｍｐｌete thｅcalculation and graphｉc dｅsiｇn Ｄrａwiｎg. Throughｔｈｅsimulａtion of ｔｈｅdesigned filter aｎd the fｒｅｑuenｃy anａlysis shoｗs thaｔuｓｉｎｇMatｌabＳｉｇnal Processing Toolbox can qｕickly and easily dｅsign digiｔal fｉlters FIR anｄIIR，the ｐroceｓｓis sｉｍple aｎd coｎvenｉent, the reｓuｌts of the perfｏrmaｎce iｎdｉcａtｏrs to ｍｅｅｔｔhe spｅｃｉfieｄrｅqｕirｅｍents. ? Kｅywｏrｄs: diｇiｔａl filｔer; ＭAＴLAB；Chebysｈev；Buttｅrｗｏrth；

文档之家

基于MATLAB语音信号检测分析及处理

语音信号处理实验指导书

语音信号处理与及其MATLAB实现分析

语音信号处理答案

基于Matlab的语音信号处理与分析

基于MATLAB的语音信号处理系统设计(程序+仿真图)--毕业设计

语音信号处理实验报告

语音信号处理 (第2版)赵力 编著 语音信号处理勾画要点

《语音信号处理》期末考试试题

通信中的语音信号处理复习大纲

语音信号处理实验报告

语音信号处理matlab实现

(完整)《语音信号处理》期末试题总结,推荐文档

语音信号处理复习纲要

大学本科语音信号处理实验讲义8学时

基于MATLAB的有噪声语音信号处理毕设

语音信号处理 (第2版)赵力编著语音信号处理勾画要点