当前位置:文档之家› 基于MATLAB语音信号降噪处理-刘芬

基于MATLAB语音信号降噪处理-刘芬

基于MATLAB语音信号降噪处理-刘芬
基于MATLAB语音信号降噪处理-刘芬

目录

插图清单...................................................................................................................................... I I 摘要..........................................................................................................................................III Abstract ........................................................................................................................................... IV 引言....................................................................................................................................... - 1 - 第一章语音信号的采集 ................................................................................................................ - 2 -

1.1 语音信号产生数字模型.................................................................................................... - 2 -

1.2 语音信号的数字化和预处理............................................................................................. - 3 - 第二章语音信号的分析 ................................................................................................................ - 4 -

2.1 语音信号的时域分析和频域分析...................................................................................... - 4 -

2.1.1 语音信号的时域分析.................................................................................................... - 4 -

2.1.2 语音信号的频域分析............................................................................................. - 4 -

2.2 语音信号处理软件介绍.......................................................................... 错误!未定义书签。

2.3 基于MATLAB的语音信号处理 ........................................................................................... - 5 - 第三章 MATLAB滤波器设计............................................................................................................ - 6 -

3.1 模拟滤波器设计 .............................................................................................................. - 6 -

3.2 数字滤波器设计 .............................................................................................................. - 6 - 第四章语音信号降噪处理............................................................................................................. - 8 -

4.1 语音信号处理调用函数介绍............................................................................................. - 8 -

4.2 语音信号降噪程序设计.................................................................................................... - 9 -

4.2.1 原始语音信号的获得............................................................................................. - 9 -

4.2.2 原始语音信号加噪处理 ........................................................................................- 11 -

4.2.3 语音信号滤波处理 ...............................................................................................- 12 -

4.3 改进型语音降噪技术.....................................................................................................- 14 - 结论......................................................................................................................................- 21 - 参考文献......................................................................................................................................- 22 - 致谢............................................................................................................. 错误!未定义书签。

I

插图清单

图1-1 语音信号产生模型 (2)

图1-2语音信号时域波形 (3)

图1-3语音信号频谱图 (4)

图1-4时域波形比较 (5)

图2-1语音信号降噪流程图 (8)

图3-1巴特沃斯滤波器频率响应 (10)

图4-1原始语音信号时域波形 (13)

图4-2原始语音信号频谱图 (13)

图4-3加噪语音信号时域波形 (15)

图4-4加噪语音信号频谱图 (15)

图4-5滤波前后时域波形比较图 (17)

图4-6滤波前后频谱比较图 (17)

图4-7语音激活检测框图 (18)

图4-8纯净语音信号时域波形 (23)

图4-9带噪语音信号时域波形 (23)

图4-10增强后语音信号时域波形 (24)

II

摘要

语音是语言符号系统载体。由人的发音器官发出,带有一定意义的语言意义。语言通过语音实现它的社会功能。语言的声音和语言的意义是紧密联系着的,但语言和语音又是有着本质区别的。人们通过语言进行交流和社会活动,我们要对语音进行处理分析,优化人类通信交流。对于语音信号的处理,有通过语音信号的数字处理技术和相关技术,研究语音信号处理是十分有实际意义的。

本次论文制作,选取的是一段wav格式语音信号,运用 MATLAB软件分析语音信号的时域波形和频域图形。在对语音信号进行滤波处理前,先对原始语音信号进行了加噪处理,此举目的是为了使滤波前和滤波后的信号有明显区别。加噪后的语音通过MATLAB绘制出它的时域波形和频谱。加噪前后的语音信号我们可通过MATLAB软件中sound函数播放,明显感觉到加入噪声的效果。滤波处理后进行了语音回放。滤波处理在本次设计中用到的是巴特沃斯低通滤波器。对于巴特沃斯低通滤波器的设计,在现在已有相当成熟的设计技术可供借鉴。滤波器降噪效果不是十分理想,本文还提供了一种改进型降噪处理方法。

MATLAB软件功能强大,本次语音信号处理所用的都是MATLAB软件中的相关函数。

关键词:语音;噪声;MATLAB;滤波器;信号处理

III

Abstract

The voice is the carrier of language symbol system. Issued by the human vocal organs, with a certain sense of meaning in language. Its social function of language are closely linked ,but the language and voice is different in nature. Through language, communication and social activities, to the voice processing and analysis and optimization of human communication exchange. For speech signal processing,digital voice signal processing technology and related technologies,speech signal processing is of practical significance.

The paper production, the selected perid of wav format voice signal using MATLAB software to analyze the speech signal time-domain waveform and frequence-domain graphics. Filtering the speech signal, the first of the original speech signal plus noise ,the aim was to make before filtering and the filtered signal. V oice plus noise by MATLAB to map out its time-domain wavefrom and spectrum. The voice signal before and after adding noise,we can pay through the sound function in the MA TLAB software, and obviously feel that by adding the effect of noise. V oice playback filtering,filtering used in the design of the Butterworth low-pass filter. Butterworth low-pass filter design are now quite mature design technology for reference.

MATLAB software is powerful, the correlation function of the speech signal processing are used MATLAB software .

Kerwords : voice ; noise; of MA TLAB; filter; signal processing

IV

引言

通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。语音信号是人们构成思想疏通和感情交流的最主要途径。20世纪60年代中期语音信号的采集与分析作为一个重要的研究领域,形成的一系列数字信号处理方法和技术,如快速博里叶变换(FFT)、数字滤波器。随着信息科学技术的飞速发展,语音信号处理在最近20多年中取得了重大进展。在处理方法上,随着电子计算机的飞速发展,以前以硬件为中心的研究逐渐转化为以软件处理为主的研究。然而,在语音识别领域,初期有几种语音打字机的研究很活跃,但后来被全部停了下来,这说明了当时对话音识别难度的认识得到了加深。

20世纪90年代以来,语音信号采集和分析通过科学家的不断努力在实用化方面取得了许多实质性的研究进展。其中,语音信号的识别技术和处理技术逐渐从实验室走到大众的现实生活中,具体体现在移动通信的普。另一方面,为了语音识别实用化的需要,快速搜索识别算法、听觉模型、讲者自适应以及进一步的语言模型的研究等课题倍受关注。

本文基于matlab的基础进行语音信号的分析和降噪处理。

- 1 -

- 2 -

第一章 语音信号的采集

1.1 语音信号产生数字模型

一般的语音信号是模拟信号,模拟信号的存储和传输都比数字语音信号占更大的内存和带宽。所以获得数字语音信号可方便对语音信号的后续处理。

语音信号的数字模型就是利用数字模拟技术模拟连续语音信号,或者说,利用数字信号处理技术来实现发音器官的模拟。发音器官能发出连续的声波,那么数字模型就能产生与此相对应的信号序列。

为了表示取样的语音信号,我们采用的是离散时间模型。虽然已经假定了许多不同的模型,但是目前还没发现一种可以详细描述人类语音中以观察到的全部特征模型。建立模型的基本准则是寻求一种可以表达一定物理状态下的数学关系,要使这种关系不仅具有强大的精确度,而且还要最简单。由于语音信号是一连串的时变过程,具有的是非线性时变特性。然而,作出一些合理的假设,在较短的时间间隔内表示语音信号,可以采用线性时不变模型。图1-1给出经典的语音信号数字模型。这里,语音信号被看成是线性时不变系统在随机噪声或准周期脉冲序列下的输出。

图1-1 语音信号产生模型

冲激序列发生器

随机噪声发生器

声门波模

声道 模型

振幅Au

振幅A v

声道参数

1.2 语音信号的数字化和预处理

语音信号的数字化处理一般包括反混叠滤波、采样、放大以及增益控制、A/D转换及PCM编码。预处理则包括预加重、分帧和加窗。在将语音信号进行数字化前,必须先进行防混叠预滤波,预滤波的目的有两个:

(1)抑制输入信导各频域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰。

(2)抑制50Hz的电源工频干扰。这样预滤波器必须是一个带通滤波器。

语音信号处理中,为将原始模拟语音信号变为数字信号,必须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。采样,是信号在时间上的离散化,即在模拟信号x(t)上按照一定时间间隔t 逐点采取其瞬时值。采样时必须要注意满足奈奎斯特定理,即采样频率fs必须以高于被测信号的最高频率两倍以上的速度进行采样,才能正确地重建原始波形,它是通过采样脉冲和模拟信号相乘来实现的。

根据语音信号时域波形可知,语音信号频率集中于1KHz,而采样频率50KHz远大于1KHz,因此不会发生采样混叠现象。

如果上述语音信号的采样频率变为600Hz时,由于采样频率小,所得采样点少,离散信号偏离原始信号,频谱发生混叠。

一般而言,采样频率越高,采样就越密,所得离散信号就越逼近原始信号。但对于固定长度的信号,过高的采样频率并不可取,会给计算机增加不必要的工作量和存储空间。采样频率过低,采样点间隔过远,则离散信号不足以反映原有信号波形特征,无法使信号复原,造成信号混淆。根据采样定理,当采样频率大于信号的两倍带宽时,采样过程不会丢失信息,利用理想滤波器可从采样信号中不失真地重构原始信号波形。

采样后的信号仍然是模拟信号,需对其进行量化,才可得到数字信号。量化是对幅值进行离散化,即将振动幅值用二进制量化电平来表示。量化电平按级数变化,实际的振动值是连续的物理量。量化一般有均匀量化和非均匀量化。而均匀量化对于小输入信号很不利,为了克服这个缺点,改善小信号时的信号量噪比,通常在实际中用到非均匀量化。非均匀量化间隔是根据信号抽样值的不同而变化的。

语音信号经过预滤波和采样后,由A/D变换器变换为二进制数字码。这种防混叠滤波与模数转换器通常做在一个集成块内,因此到目前来说,语音信号的数字化的质量还是可靠地。

- 3 -

- 4 -

第二章 语音信号的分析

2.1 语音信号的时域分析和频域分析 2.1.1 语音信号的时域分析

语音信号是一种非平稳的时变信号,它携带着各种信息。在语音识别、语音增强、语音编码和语音合成等语音处理中全都需要提取语音中包含的各类信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域变换和频域变换分析方法,其中时域分析是最简单的方法,直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数等。 (1)提取:通过图形用户界面上的菜单功能按键采集电脑设备上的一段音频信号,完成音频信号的频率,幅度等信息的提取,并得到该语音信号的波形图。

(2)调整:在设计的用户图形界面下对输入的音频信号进行各种变化,如变化幅度、改变频率等操作,以实现对语音信号的调整。 2.1.2 语音信号的频域分析

分析语音信号的频域特征称为语音信号的频域分析。语音信号的频域分析包括语音信号的功率谱、频谱、频谱包络倒频谱分析。我在本次设计中选择傅里叶变换的方法对语音信号的频谱进行分析。之所以选择这种方法,是由于在本科学习期间重点学习了傅里叶变换的方法。对于傅里叶变换,它把一些复杂的信号进行分解,分解为许多有一定相互关系的正弦信号的和。再对各个正弦信号进行分析,而得到复杂信号的一些特征。傅里叶变换可用下面公式表示:

x(t)为信号的时域表示,X(f)为信号的频域表示,f 为频率。

信号的傅里叶表示在信号的分析与处理中有着十分重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅里叶分析方法能完善地解决许多信号分析和处理问题。另外,傅里叶表示使信号的某些特性变得更明显。

语音信号是随着时间变化的,但通常认为,语音是一个随机噪声源激励或受准周期脉冲的线性系统的输出,输出频谱是声道系统频率响应与激励源频谱的乘积。然而声道系统的频率响应及激励源都是随时间变化的,一般标准的傅里叶表示虽然适用于周期及平稳随

dt

e t x

f X ft

j ?+∞

∞--=π2)()(

- 5 -

机信号的表示,但不能直接用于语音信号。语音信号我们则可以认为在短时间内,近似不变,因而可以采用短时分析法,减少分析的困难。

2.2 基于MATLAB 的语音信号处理

Matlab 是一个比较常用的语音处理工具箱。基于DSP 和MA TLAB 的语音数据采集和处理系统,该工具包主要应用于语音处理中听觉模型的建立和分析,其中也包含了语音处理的各种基本功能如线性预测、语谱图、识别和合成等语音信号的频域处理。语音虽然是一个非平稳、时变的随机过程,但在短时间内可近似看作是平稳的。如果能从带噪语音的短时谱中估计出“纯净”的语音短时谱,就可达到消除噪声的目的。噪声也是随机过程,所以这种估计只能建立在统计模型基础上。利用人耳感知对语音频谱分量的相位不敏感的特性,这类语音增强算法主要针对短时谱的幅度估计。

用MATLAB 对语音信号进行处理,综合运用数字信号处理的理论知识对加噪语音信号进行时域、频域分析和滤波。滤波所需的滤波器,可以利用MATLAB 工具箱快速有效的设计。本次设计流程,大致包括对原始语音加噪、时域分析和频域分析,绘制出相关波形。加噪语音再通过设计的滤波器,得出处理后的频谱图形。处理的一系列过程,都在MATLAB 环境中进行。流程图如图2-1。

图 2-1 语音信号降噪处理流程图

录制语音信 号

有效语音段截取 语音信号加噪处理

语音信号时域分析和频域分析

语音信号滤波处理

语音回访

第三章MATLAB滤波器设计

3.1 模拟滤波器设计

模拟滤波器的理论和设计方法已相当成熟,设计时可以选用已有的典型模拟滤波器,如巴特沃斯滤波器、契比雪夫滤波器、椭圆滤波器、贝赛尔滤波器等。它们有严格的设计公式和现成的曲线图表可供参考。本次设计中选择巴特沃斯滤波器。巴特沃斯滤波器具有单调下降的幅频特性。该滤波器通带内具有最大平坦的幅频特性,随频率的增大,平滑单调下降。且阶数N越高,响应特性越接近矩形,过度带越窄。

巴特沃斯低通滤波器设计:

MATLAB信号处理工具箱函数buttap,buttord和butter是巴特沃斯滤波器设计函数。Buttord命令的格式是:

[n,wn]=buttord(wp,ws,Rp,Rs)

巴特沃斯低通滤波器系数的计算公式为:

[b,a]=butter(n,Wn)

3.2 数字滤波器设计

数字滤波器按照实现的网络结构或单位抽样响应进行分类,可以分成无限长单位冲激

响应( IIR)数字滤波器和有限长单位冲激响应( FIR)数字滤波器。

数字滤波器的四个重要的通带、阻带参数是:

fp:通带截止频率(Hz)

fs:阻带起始频率(Hz)

Rp:阻带内波动(dB),即通带内允许的最大衰减

Rs:阻带内最小波动(dB)

设采样频率(即奈奎斯特频率)为fN,那么可将以上参数中的频率参数转化为归一化角频率参数:

Wp:通带截止角频率(rad/s),wp=fp/(fN/2)

Ws:通带起始角频率(rad/s),ws=fs/(fN/2)

通过这些参数就可以进行数字滤波器的设计。

在本次设计中用到得是FIR滤波器。FIR滤波器的设计方法有窗函数法、频率取样法、

- 6 -

最佳等波纹法等。FIR滤波器与IIR滤波器相比,在保证幅频满足技术要求的同时,更容易做到严格的线性相位。

在MATLAB设计FIR滤波器的相关文件buttord.m用来确定数字滤波器的阶次,其调用格式为:

[n,wn]=buttord(wp,ws,Rp,Rs)

对于不同类型的滤波器,参数Wp和Ws有一些限制:对于低通滤波器,Wp

[bz,az]=bilinear(b,a,Fs)

式中b,a分别是H(s)的分子、分母多项式的系数向量;bz,az分别是H(z)的分子、分母多项式的系数向量,Fs是抽样频率。

本次设计中用到的巴特沃斯低通滤波器设计程序如下:

Fs=50000;Ts=1/Fs;

wp1=2/Ts*tan(wp/2); %将模拟指标转换成数字指标

ws1=2/Ts*tan(ws/2);

[N,Wn]=buttord(wp1,ws1,Rp,Rs,'s'); %选择滤波器的最小阶数

[Z,P,K]=buttap(N); %创建butterworth模拟滤波器

[Bap,Aap]=zp2tf(Z,P,K);[b,a]=lp2lp(Bap,Aap,Wn);

[bz,az]=bilinear(b,a,Fs); %用双线性变换法实现模拟滤波器到数字滤波器的转换

[H,W]=freqz(bz,az); %绘制频率响应曲线

figure(1);plot(W*Fs/(2*pi)wp=0.25*pi;ws=0.3*pi;Rp=1;Rs=15;

abs(H));grid

xlabel('频率/Hz');ylabel('频率响应幅度');title('Butterworth')

该低通滤波器的频率响应如图3-1:

- 7 -

- 8 -

00.51

1.52

2.5x 10

4

0.2

0.4

0.6

0.8

1

1.2

1.4

频率/Hz

频率响应幅度

Butterworth

图3-1 巴特沃斯滤波器频率响应

第四章 语音信号降噪处理

4.1 语音信号处理调用函数介绍

信号处理中调用函数主要有Wavread ,还有其他相关函数,有fftfilt 函数、sound 函数、filter 函数、randn 函数和FFT 函数。

选取一段语音信号,然后在matlab 软件平台下,利用wavread 函数对语音信号进行采样,记住采样频率和采样点数。通过使用wavread 函数,理解采样频率、采样位数等概念。wavread 函数调用格式:

y=wavread (file )

读取file 所规定的wav 文件,pcm 格式的文件才能被读取。返回采样值放在向量y 中。 [y ,fs,nbits]=wavread(file) 采样值放在向y 中,s f 表示采样频率(Hz

),nbits 表示采样位数。

y=wavread (file ,N )

读取前N 点的采样值放在向量y 中。

y=wavread (file ,[1N ,2N ]) 读取从1N 到2N 点的采样值放在向量y 中。 对语音信号1.wav 进行采样其程序如下:

[y ,fs,nbits]=wavread(…1.wavv?)

其中:

fs =5000;(fs=50000为双声道设置频率,fs=25000为单声道设置频率)

nbits =16;

y=wavread(…1.wav?)

另外相关的函数fftfilt的调用格式为

y=fftfilt(b,x)

该格式是利用FFT的重叠相加法对数据进行滤波的,并且这种频域滤波技术只对FIR滤波器有效。该函数是通过向量b描述的滤波器对x数据进行滤波。

函数sound可以对声音进行回放。其调用格式为:

sound(x,fs,bits)

函数filter的调用格式为

y=filter(b,a,x)

该格式采用数字滤波器对数据进行滤波,既可以用于IIR滤波器,也可以用于FIR滤波器。其中向量b和a分别表示系统函数的分子、分母多项式的系数,若a=1,此时表示FIR滤波器,否则就是IIR滤波器。该函数是利用给出的向量b和a,对x中的数据进行滤波,结果放入向量y中。

rand产生的是[0,1]上的均匀分布的随机序列,randn产生均值为0,方差为1的高斯随机序列,也就是白噪声序列;也就是说,可以直接使用上面两个函数对原始信号添加噪声,调用格式:

y=x+rand(length(x),1)或者y=x+randn(length(x),1)

在MATLAB的信号处理工具箱中函数FFT用于序列快速傅立叶变换。FFT函数的一种调用格式为

)

fft

=

y x

(

其中,x是序列,y是序列的FFT,x可以为一向量或矩阵。

FFT函数的另一种调用格式为

x

fft

=式中,x,y意义同前,N为正整数

y N

(

)

,

4.2 语音信号降噪程序设计

4.2.1 原始语音信号的获得

在原始语音信号的得到可用windows的录音机录制一段自己说的话(语音信号),在本次设计中我直接用了一个wav文件来当作原始语音信号,再画出语音信号的时域波形和频谱图;在MATLAB中使用Wavread函数,可得出声音的采样频率fs为5KHz, 且声音是双声道的。利用sound函数, 可清晰地听到一段音乐语音。设计程序详见附录1:

得到时域波形和频谱图如图4-1和图4-2:

- 9 -

- 10 -

1000

2000

3000

40005000

6000

7000

8000

-0.25

-0.2-0.15-0.1-0.0500.05

0.10.150.20.25原始信号时域波形

time(s)

幅度

图4-1 原始语音信号时域波形

时域波形中的蓝色波形是选用的语音信号原来带有的噪声,说明原始的声音包含在少量噪声。

0.51 1.52

2.53

3.54

4.5

5

x 10

4

050100

150

原始信号频谱波形

Hz

幅度

图4-2原始语音信号频谱图

从频谱图可以看出,语音信号的频谱在[0,2 ]是对称的,主要看[0,2.5KHZ]之间的频谱,可以看出这段语音信号的频谱主要集中在[0,1KHZ]之间,高频部分几乎为0 。

- 11 -

4.2.2 原始语音信号加噪处理

运用MATLAB ,给语音信号加上噪声,绘出加噪后的语音信号时域波形和频谱。应当注意加入的单频噪声的位置应高于原始语音信号的频率,噪声频率越高,滤波器设计的指标就会越宽松,这样可使噪声容易被滤除。

高斯白噪声加噪设计程序见附录2:

加噪声后的语音信号时域波形和频谱图如图4-3和图4-4:

100020003000

4000500060007000

-0.4

-0.3-0.2-0.100.10.20.30.4加噪后的信号时域波形

time(s)

幅度

图4-3 加噪语音信号时域波形

从时域图中可以看出,声音信号的波形基本都被噪声波形覆盖。

- 12 -

500

1000

15002000

2500

3000

5

1015202530

354045加噪后的语音信号频谱

Hz

幅值

图4-4 加噪语音信号频谱图

对比图1-2,可以看出,在高频部分[1KHZ,2.5KHZ]间噪声信号。 4.2.3 语音信号滤波处理

用前面设计的滤波器对语音信号进行滤波,得出滤波后信号的时域波形和频谱图,并对滤波前、后的信号进行对比,画出时域波形差,分析信号的变化。

在MATLAB 中,用巴特沃斯数字低通滤波器,其程序设计详见附录3: 滤波前后语音信号的时域波形和频谱图对比如图4-5和图4-6:

- 13 - 0

5

10

15

20

25

30

35

40

-2-1012滤波前的时域波形

5

10

15

20

25

30

35

40

-1-0.500.51滤波后的时域波形

图4-5 滤波前后时域波形比较图

0200040006000

8000100001200014000

1020

30滤波前的频谱

Hz

幅值

0200040006000

8000100001200014000

1020

30滤波后的频谱

Hz

幅值

图4-6 滤波前后频谱对比图

利用函数sound 函数,进行语音回放,比较下滤波前后的语音效果,会发现滤除了绝大部分噪声,但没完全滤除,这是设计的滤波器不够精细,残留噪声的缘故。

- 14 -

4.3 改进型语音降噪技术

上述语音信号降噪处理方法称为谱减法。谱减法就是从输入信号的幅度谱中减去估计得来的噪声平均的幅度谱,其效果相当于在变换域对带噪信号进行了某种均衡化处理。与其它方法相比较,谱相减法引入的约束条件最少,物理意义最直接,运算量小,但是在实际中语音噪声频率和信号频率很接近,噪声频率很难准确的估计出来。因此传统的谱减法除噪效果并不是十分理想。

传统的谱减法即在频域将带噪语音的功率谱减去噪声的功率谱,得到语音的功率谱估计,开方后就得到语音幅度估计,将其相位恢复后再采用逆傅立叶变换恢复时域信号。所以在谱减法中噪声功率谱的估计至关重要,如果噪声估计偏差较大的话,这必将会影响语音增强质量。传统的噪声估计方法是基于最优平滑和最小统计的噪声估计,还有一种采用改进的算法——基于语音活性检测的噪声估计算法。

语音激活检测指从一段包含语音信号中确定出语音的起始点和终点,又称端点检测。语音端点检测的目的就是从连续记录的带噪语音信号中分离出有用的语音信号。语音激活检测是各种语音处理中必需的一个重要环节,精确地确定输入语音的起点和终点将保证语音处理系统良好的性能。

对于语音激活检测在语音增强中的应用,为了得到更多的关于背景噪声特性,语音端点检测更注重于如何准确的检测出无音段。一般的语音激活检测是根据语音帧来进行的,语音帧的长度在10~30ms 不等。语音端点检测的方法可以综述为:从输入信号中提取一个或一系列的对比特征参数,然后将其和一个或一系列的门限阈值进行比较,如图4-7所示。如果超过门限则表示当前为有音段,否则就表示当前为无音段。

图4-7语音激活检测框图

目前语音端点检测所采取的方法大体可以分为两类:

第一类是噪声环境下基于 HMM 模型的语音信号端点检测的方法,该方法要求背景噪声保持平稳且信噪比较高。

第二类方法是基于信号的短时能量进行检测的算法,它通过对背景噪声能量的统计,定出能量门限,利用能量门限来确定语音信号起始点。

在这里运用语音端点检测采用了第二类方法,即基于信号的短时能量进行检测的算法。

基于信号的短时能量检测具体算法如下: 1)

计算每一帧的语音能量:

)

(1

2m x

E N m n

n ∑-==

(4-1)

加窗分帧

特征提取

与阀值比较

判断有无语音

带噪语音

- 15 - 式中N 为帧长,n 为帧的编号,m 为每一帧中的各点,L n ≤≤1,L 为帧数;然而它有一个缺陷,即它对高电平非常敏感(信号的二次方计算)。为此,定义短时平均幅度函数来表征一帧语音信号的能量大小,定义:

-==

1

)

(N m n n

m x M

(4-2)

2) 计算前20帧平均噪声能量EMN ;

3) 求能量最大值和能量最小值EAX ,EMIN ; 4) 根据式(4-2)确定门限

]4,)(03.0min[EMN EMN EMIN EAX T +-=

(4-3)

应用谱相减法实现语音增强基本原理是通过对带噪语音谱减去噪声谱得到语音谱,因此,语音激活检测这一环节非常重要,准确地确定语音的起始点和终止点对噪声谱估计有着重要的作用。改进型语音降噪处理运用端点检测技术,用MATLAB 仿真,可明显显示出其优越性。用MATLAB 仿真的流程如下:

1)对输入的语音信号进行预滤波; 2)对滤波后的语音信号进行预加重;

3)将语音信号按每帧128个信号点进行分帧,帧移为64; 4)对信号帧加汉明窗(Haming); 5)对加窗后的信号帧进行FFT 变换; 6)对各帧语音信号求功率谱; 7)根据前20帧求取平均噪声功率;

8)利用V AD 进行噪声估计检测寂静段,进而组合递归平滑,更新噪声谱; 9)进行谱减运算,得到估计出的语音信号功率谱; 10)插入相位谱,计算出语音谱; 11)进行IFFT 变换,得到还原的语音帧; 12)根据各个语音帧组合为语音信号;

13)对语音信号进行去加重处理,得到最终信号。 本次仿真选用wav 格式文件2.wav ,仿真程序如下: s=wavread(?2.wav?);

n=randn(length(s),1);

x=s+n;

Wp=[0.025*pi,0.85*pi]; %通带上下截止频率

Ws=[0.010*pi,0.95*pi]; %阻带上下截止频率

Ap=10; %通带内衰减

As=60; %阻带内衰减

N=128; %每帧的信号个数

p=0.0005; %白噪声信号的方差

alpha=0.75; %加重系数

beta=0.90;%去重系数

%产生带通滤波器w

[db,mag,pha,grd,w]=bandpass(Wp,Ws,Ap,As,length(x));

%将带噪语音信号x通过带通滤波器w,得到语音信号x_bap

bap=abs(ifft(w/pi));

x_conv=conv(x,bap);

x_bap=x_conv([1,1:length(x_conv)/2]);

%将语音信号x_bap加重,得到语音信号y

for j=1:length(x_bap)-1

y(j)=x_bap(j)-alpha*x_bap(j+1);

end

y(length(x_bap))=x_bap(length(x_bap));

%将语音信号y按每帧N个信号点进行分帧,帧移为N/2,得到信号帧y_fram for j=1:floor(length(y)/(N/2))-1

for k=1:N

y_fram(j,k)=y((j-1)*(N/2)+k);

%产生汉明窗ham

ham=hamming(N);

%对信号帧y_fram加汉明窗ham,得到信号帧y_ham

for j=1:floor(length(y)/(N/2))-1

for k=1:N

- 16 -

语音信号处理与及其MATLAB实现分析

目录 摘要 (2) 第一章绪论 (3) 1.1 语音课设的意义 (3) 1.2 语音课设的目的与要求 (3) 1.3 语音课设的基本步骤 (3) 第二章设计方案论证 (5) 2.1 设计理论依据 (5) 2.1.1 采样定理 (5) 2.1.2 采样频率 (5) 2.1.3 采样位数与采样频率 (5) 2.2 语音信号的分析及处理方法 (6) 2.2.1 语音的录入与打开 (6) 2.2.2 时域信号的FFT分析 (6) 2.2.3 数字滤波器设计原理 (7) 2.2.4 数字滤波器的设计步骤 (7) 2.2.5 IIR滤波器与FIR滤波器的性能比较 (7) 第三章图形用户界面设计 (8) 3.1 图形用户界面概念 (8) 3.2 图形用户界面设计 (8) 3.3 图形用户界面模块调试 (9) 3.3.1 语音信号的读入与打开 (9) 3.3.2 语音信号的定点分析 (9) 3.3.3 N阶高通滤波器 (11) 3.3.4 N阶低通滤波器 (12) 3.3.5 2N阶带通滤波器 (13) 3.3.6 2N阶带阻滤波器 (14) 3.4 图形用户界面制作 (15) 第四章总结 (18) 附录 (19) 参考文献 (24)

摘要 数字信号处理是将信号以数字方式表示并处理的理论和技术。数字信号处理与模拟信号处理是信号处理的子集。 数字信号处理的目的是对真实世界的连续模拟信号进行测量或滤波。因此在进行数字信号处理之前需要将信号从模拟域转换到数字域,这通常通过模数转换器实现。而数字信号处理的输出经常也要变换到模拟域,这是通过数模转换器实现的。 数字信号处理的算法需要利用计算机或专用处理设备如数字信号处理器(DSP)和专用集成电路(ASIC)等。数字信号处理技术及设备具有灵活、精确、抗干扰强、设备尺寸小、造价低、速度快等突出优点,这些都是模拟信号处理技术与设备所无法比拟的。 数字信号处理的核心算法是离散傅立叶变换(DFT),是DFT使信号在数字域和频域都实现了离散化,从而可以用通用计算机处理离散信号。而使数字信号处理从理论走向实用的是快速傅立叶变换(FFT),FFT的出现大大减少了DFT的运算量,使实时的数字信号处理成为可能、极大促进了该学科的发展。 MATLAB是矩阵实验室(Matrix Laboratory)的简称,和Mathematica、Maple 并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。 MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多,并且mathwork也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++ ,JAVA的支持。可以直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用,此外许多的MATLAB爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。

语音信号处理答案

二、问答题(每题分,共分) 、语音信号处理主要研究哪几方面的内容? 语音信号处理是研究用数字信号处理技术对语言信号进行处理的一门学科,语音信号处理的理论和研究包括紧密结合的两个方面:一方面,从语言的产生和感知来对其进行研究,这一研究与语言、语言学、认知科学、心理、生理等学科密不可分;另一方面,是将语音作为一 种信号来进行处理,包括传统的数字信号处理技术以及一些新的应用于语音信号的处理方法 和技术。 、语音识别的研究目标和计算机自动语音识别的任务是什么? 语音识别技术,也被称为自动语音识别,(),其目标是将人类的语音中的词汇内容转换为 计算机可读的输入,例如按键、二进制编码或者字符序列。 计算机自动语音识别的任务就是让机器通过识别和理解过程把语音信号转变为相应的文本 或命令的高技术。 、语音合成模型关键技术有哪些? 语音合成是实现人机语音通信,建立一个有听和讲能力的口语系统所需的两项关键技术,该系统主要由三部分组成:文本分析模块、韵律生成模块和声学模块。.如何取样以精确地抽取人类发信的主要特征,.寻求什么样的网络特征以综合声道的频率响应,.输出合成声音的质量如何保证。 、语音压缩技术有哪些国际标准? 二、名词解释(每题分,共分) 端点检测:就从包含语音的一段信号中,准确的确定语音的起始点和终止点,区分语音信号和非语音信号。 共振峰:当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。 语谱图:是一种三维频谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定的频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。 码本设计:就是从大量信号样本中训练出好的码本,从实际效果出发寻找好的失真测度定义 公示,用最少的搜素和计算失真的运算量。 语音增强:语音质量的改善和提高,目的去掉语音信号中的噪声和干扰,改善它的质量 三、简答题(每题分,共分) 、简述如何利用听觉掩蔽效应。 一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。人耳的掩蔽效应一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声 音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值,或者 说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表明,—绝对闻阈值最小,即人耳对它的微弱声音最敏感;而在低频和高频区绝对闻阈值要大得多。在范围内闻阈随频率变化最不显著,即在这个范围内语言可储度最高。在掩蔽情况下,提高被掩蔽弱音的强度, 使人耳能够听见时的闻阈称为掩蔽闻阈(或称掩蔽门限),被掩蔽弱音必须提高的分贝值称为 掩蔽量(或称阈移)。 、简述时间窗长与频率分辨率的关系。 采样周期、窗口长度和频率分辨率△之间存在下列关系:△(*) 可见,采样周期一定时,△随窗口宽度的增加而减少,即频率分辨率相应得到提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,而时间分辨率提高,因而二者是矛盾的。 、简述时域分析的技术(最少三项)及其在基因检测中的应用。()

matlab语音信号采集与初步处理要点

《matlab与信号系统》实验报告 学院: 学号: 姓名: 考核实验——语音信号采集与处理初步 一、课题要求 1.语音信号的采集 2.语音信号的频谱分析 3.设计数字滤波器和画出频率响应 4.用滤波器对信号进行滤波 5.比较滤波前后语音信号的波形及频谱 6.回放和存储语音信号 (第5、第6步我放到一起做了) 二、语音信号的采集 本段音频文件为胡夏演唱的“那些年”的前奏(采用Audition音频软件进行剪切,时长17秒)。运行matlab软件,在当前目录中打开原音频文件所在的位置,采用wavread函数对其进行采样,并用sound函数可进行试听,程序运行之后记下采样频率和采样点。 利用函数wavread对语音信号的采集的程序如下: clear; [y,fs,bits]=wavread('music.wav'); %x:语音数据;fs:采样频率;bits:采样点数sound(y,fs,bits); %话音回放 程序运行之后,在工作区间中可以看到采样频率fs=44100Hz,采样点bits=16

三、语音信号的频谱分析 先画出语音信号的时域波形,然后对语音号进行快速傅里叶变换,得到信号的频谱特性。语音信号的FFT频谱分析的完整程序如下: clear; [y,fs,bits]=wavread('music.wav'); %x:语音数据;fs:采样频率;bits:采样点数sound(y,fs,bits); %话音回放 n = length (y) ; %求出语音信号的长度 Y=fft(y,n); %傅里叶变换 subplot(2,1,1); plot(y); title('原始信号波形'); subplot(2,1,2); plot(abs(Y)); title('原始信号频谱'); 程序结果如下图: 四、设计数字滤波器和画出频率响应 根据语音信号的特点给出有关滤波器的性能指标: 1)低通滤波器性能指标,fp=1000Hz,fc=1200 Hz,As=100dB,Ap=1dB; 2)高通滤波器性能指标,fc=4800 Hz,fp=5000 Hz As=100dB,Ap=1dB。

基于Matlab的语音信号处理与分析

系(院)物理与电子工程学院专业电子信息工程题目语音信号的处理与分析 学生姓名 指导教师 班级 学号 完成日期:2013 年5 月 目录 1 绪论.............................................................................................................. 错误!未定义书签。 1.1课题背景及意义................................................................................. 错误!未定义书签。 1.2国内外研究现状................................................................................. 错误!未定义书签。 1.3本课题的研究内容和方法................................................................. 错误!未定义书签。 1.3.1 研究内容................................................................................ 错误!未定义书签。 1.3.2 开发环境................................................................................ 错误!未定义书签。 2 语音信号处理的总体方案............................................................................ 错误!未定义书签。 2.1 系统基本概述.................................................................................... 错误!未定义书签。 2.2 系统基本要求与目的........................................................................ 错误!未定义书签。 2.3 系统框架及实现................................................................................ 错误!未定义书签。 2.3.1 语音信号的采样.................................................................... 错误!未定义书签。 2.3.2 语音信号的频谱分析............................................................ 错误!未定义书签。 2.3.3 音乐信号的抽取.................................................................... 错误!未定义书签。 2.3.4 音乐信号的AM调制.............................................................. 错误!未定义书签。 2.3.5 AM调制音乐信号的同步解调............................................... 错误!未定义书签。 2.4系统设计流程图................................................................................. 错误!未定义书签。 3 语音信号处理基本知识................................................................................ 错误!未定义书签。 3.1语音的录入与打开............................................................................. 错误!未定义书签。 3.2采样位数和采样频率......................................................................... 错误!未定义书签。 3.3时域信号的FFT分析......................................................................... 错误!未定义书签。 3.4切比雪夫滤波器................................................................................. 错误!未定义书签。 3.5数字滤波器设计原理......................................................................... 错误!未定义书签。 4 语音信号实例处理设计................................................................................ 错误!未定义书签。 4.1语音信号的采集................................................................................. 错误!未定义书签。

基于MATLAB的语音信号处理系统设计(程序+仿真图)--毕业设计

语音信号处理系统设计 摘要:语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。语音信号处理的目的是得到某些参数以便高效传输或存储,或者是用于某种应用,如人工合成出语音、辨识出讲话者、识别出讲话内容、进行语音增强等。本文简要介绍了语音信号采集与分析以及语音信号的特征、采集与分析方法,并在采集语音信号后,在MATLAB 软件平台上进行频谱分析,并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。利用MATLAB来读入(采集)语音信号,将它赋值给某一向量,再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波,然后我们还可以通过sound命令来对语音信号进行回放,以便在听觉上来感受声音的变化。 关键词:Matlab,语音信号,傅里叶变换,滤波器 1课程设计的目的和意义 本设计课题主要研究语音信号初步分析的软件实现方法、滤波器的设计及应用。通过完成本课题的设计,拟主要达到以下几个目的: 1.1.了解Matlab软件的特点和使用方法。 1.2.掌握利用Matlab分析信号和系统的时域、频域特性的方法; 1.3.掌握数字滤波器的设计方法及应用。 1.4.了解语音信号的特性及分析方法。 1.5.通过本课题的设计,培养学生运用所学知识分析和解决实际问题的能力。 2 设计任务及技术指标 设计一个简单的语音信号分析系统,实现对语音信号时域波形显示、进行频谱分析,

利用滤波器滤除噪声、对语音信号的参数进行提取分析等功能。采用Matlab设计语言信号分析相关程序,并且利用GUI设计图形用户界面。具体任务是: 2.1.采集语音信号。 2.2.对原始语音信号加入干扰噪声,对原始语音信号及带噪语音信号进行时频域分析。 2.3.针对语音信号频谱及噪声频率,设计合适的数字滤波器滤除噪声。 2.4.对噪声滤除前后的语音进行时频域分析。 2.5.对语音信号进行重采样,回放并与原始信号进行比较。 2.6.对语音信号部分时域参数进行提取。 2.7.设计图形用户界面(包含以上功能)。 3 设计方案论证 3.1语音信号的采集 使用电脑的声卡设备采集一段语音信号,并将其保存在电脑中。 3.2语音信号的处理 语音信号的处理主要包括信号的提取播放、信号的重采样、信号加入噪声、信号的傅里叶变换和滤波等,以及GUI图形用户界面设计。 Ⅰ.语音信号的时域分析 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法。 Ⅱ.语音信号的频域分析 信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更

基于matlab的语音信号的采集与处理

文档从互联网中收集,已重新修正排版,word格式支持编辑,如有帮助欢迎下载支持。 目录 第1章前言 ................................................................................................... 错误!未定义书签。第2章语音信号分析处理的目的和要求 ................................................... 错误!未定义书签。 2.1MATLAB软件功能简介................................................................. 错误!未定义书签。 2.2课程设计意义 .................................................................................. 错误!未定义书签。第3章语音信号的仿真原理..................................................................... 错误!未定义书签。第4章语音信号的具体实现..................................................................... 错误!未定义书签。 4.1语音信号的采集................................................................................ 错误!未定义书签。 4.2语音信号加噪与频谱分析................................................................ 错误!未定义书签。 4.3设计巴特沃斯低通滤波器................................................................ 错误!未定义书签。 4.4用滤波器对加噪语音滤波................................................................ 错误!未定义书签。 4.5比较滤波前后语音信号波形及频谱................................................ 错误!未定义书签。第5章总结................................................................................................... 错误!未定义书签。参考文献......................................................................................................... 错误!未定义书签。附录................................................................................................................. 错误!未定义书签。

语音信号处理 (第2版)赵力 编著 语音信号处理勾画要点

语音信号处理(第2版)赵力编著 重点考点 第2章语音信号处理的基础知识 1.语音(Speech)是声音(Acoustic)和语言(Language)的组合体。可以这样定义语音:语音是由一连串的音组成语言的声音。 2.人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段。 3.语音是人的发声器官发出的一种声波,它具有一定的音色,音调,音强和音长。其中,音色也叫音质,是一种声音区别于另一种声音的基本特征。音调是指声音的高低,它取决于声波的频率。声音的强弱叫音强,它由声波的振动幅度决定。声音的长短叫音长,它取决于发音时间的长短。 4.说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节(Syllable)。一个音节可以由一个音素(Phoneme)构成,也可以由几个音素构成。音素是语音发音的最小单位。任何语言都有语音的元音(Vowel)和辅音(Consonant)两种音素。 5.元音的另一个重要声学特性是共振峰(Formant)。共振峰参数是区别不同元音的重要参数,它一般包括共振峰频率(Formant Frequency)的位置和频带宽度(Formant Bandwidth)。 6.区分语音是男声还是女声、是成人声音还是儿童声音,更重要的因素是共振峰频率的高低。 7.浊音的声带振动基本频率称基音周期(或基音频率),F0表示。 8.人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉掩蔽效应。 9.掩蔽效应分为同时掩蔽和短时掩蔽。 10.激励模型:一般分成浊音激励和清音激励。浊音激励波是一个以基音周期为周期的斜三角脉冲串。 11.声道模型:一是把声道视为由多个等长的不同截面积的管子串联而成的系统。按此观点推导出的叫“声管模型”。另一个是把声道视为一个谐振腔,按此推导出的叫“共振峰模型”。 12.完整的语音信号的数字模型可以用三个子模型:激励模型、声道模型和辐射模型的串联来表示。 13.语谱图:人们致力于研究语音的时频分析特性,把和时序相关的傅立叶分析的显示图形。 第三章语音信号分析 1.贯穿于语音分析全过程的是“短时分析技术”。 2.语音信号的数字化一般包括放大及增益控制、反混叠滤波、采样、A/D变换及编码(一般就是PCM码);预处理一般包括预加重、加窗和分帧等。 3.预滤波的目的有两个:

基于MATLAB的语音信号滤波处理

基于MATLAB的语音信号滤波处理 题目:基于MATLAB的语音信号滤波处理 课程:数字信号处理 学院:电气工程学院 班级: 学生: 指导教师: 二O一三年十二月

目录CONTENTS 摘要 一、引言 二、正文 1.设计要求 2.设计步骤 3.设计内容 4.简易GUI设计 三、结论 四、收获与心得 五、附录

一、引言 随着Matlab仿真技术的推广,我们可以在计算机上对声音信号进行处理,甚至是模拟。通过计算机作图,采样,我们可以更加直观的了解语音信号的性质,通过matlab编程,调用相关的函数,我们可以非常方便的对信号进行运算和处理。 二、正文 2.1 设计要求 在有噪音的环境中录制语音,并设计滤波器去除噪声。 2.2 设计步骤 1.分析原始信号,画出原始信号频谱图及时频图,确定滤波器类型及相关指标; 2.按照类型及指标要求设计出滤波器,画出滤波器幅度和相位响应,分析该滤波器是否符合要求; 3.用所设计的滤波器对原始信号进行滤波处理,画出滤波后信号的频谱图及时频图; 4.对滤波前的信号进行分析比对,评估所设计滤波器性能。 2.3 设计内容 1.原始信号分析

分析信号的谱图可知,噪音在1650HZ和3300HZ附近的能量较高,而人声的能量基本位于1000HZ以下。因此,可以设计低通滤波器对信号进行去噪处理。 2.IIR滤波器设计 用双线性变换法分别设计了巴特沃斯低通滤波器和椭圆低通滤波器和带阻滤波器: ①巴特沃斯滤波器 fp=800;fs=1300;rs=35;rp=0.5; 程序代码如下: fp=800;fs=1300;rs=35;rp=0.5;Fs=44100; wp=2*Fs*tan(2*pi*fp/(2*Fs));ws=2*Fs*tan(2*pi*fs/(2*Fs)); [n,wn]=buttord(wp,ws,rp,rs,'s'); [b,a]=butter(n,wn,'s'); [num,den]=bilinear(b,a,Fs); [h,w]=freqz(num,den,512,Fs);

《语音信号处理》期末考试试题

2011-2012学年第一学期 《语音信号处理》期末考试试题(A) 适用班级:时量:120分钟闭卷记分: 考生班级:姓名:学号: 注:答案全部写在答题纸上,写在试卷上无效! 一、填空题:(共7小题,每空2分,共20分) 1、矢量量化系统主要由编码器和组成,其中编码器主要 是由搜索算法和构成。 2、基于物理声学的共振峰理论,可以建立起三种实用的共振峰 模型:级联型、并联型和。 3、语音编码按传统的分类方法可以分为、和混合 编码。 4、对语音信号进行压缩编码的基本依据是语音信号的和人 的听觉感知机理。 5、汉语音节一般由声母、韵母和三部分组成。 6、人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时 频分析特性;另一个是人耳听觉的效应。 7、句法的最小单位是,词法的最小单位是音节,音节可 以由构成。 二、判断题:(共3小题,每小题2分,共6分)

1、预测编码就是利用对误差信号进行编码来降低量化所需的比 特数,从而使编码速率大幅降低。() 2、以线性预测分析-合成技术为基础的参数编码,一般都是根据 语音信号的基音周期和清/浊音标志信息来决定要采用的激 励信号源。() 3、自适应量化PCM就是一种量化器的特性,能自适应地随着输 入信号的短时能量的变化而调整的编码方法。() 三、单项选择题:(共3小题,每小题3分,共9分) 1、下列不属于衡量语音编码性能的主要指标是()。 (A)编码质量(B)矢量编码(C)编码速率(D)坚韧性 2、下列不属于编码器的质量评价的是() (A)MOS (B)DAM(C)DRT(D)ATC 3、限词汇的语音合成技术已经比较成熟了,一般我们是采用() 作为合成基元。 (A)词语(B)句子(C)音节(D)因素 四、简答题:(共2小题,每小题12分,共24分) 1、画出矢量量化器的基本结构,并说明其各部分的作用。 2、试画出语音信号产生的离散时域模型的原理框图,并说明各 部分的作用。 五、简答题:(共5小题,前三小题,每题5分,后两小题,每题10分,共35分) 1、线性预测分析的基本思想是什么?

通信中的语音信号处理复习大纲

《通信中的语音信号处理》复习大纲 北科大版 1、了解语音信号处理的目的、实质和发展历史; 实质:是研究用数字信号处理技术对语音信号进行处理的一门学科 目的:通过处理得到一些反映语音信号重要特征的语音参数以便高效地传输或储存语音信号所包含的信息。 通过对语音信号进行某种运算以达到某种要求。 发展历史:1876年电话的发明,贝尔(Bell); 1939年声码器的研制成功—声源+声道; 1947年贝尔实验室发明语谱图仪—语音识别研究的开始; 50年代第一台口授打字机和英语单词语音识别器; 60年代出现了第一台以数字计算机为基础的孤立词语音识别器和有限连续语音识别器; 70年代动态规划技术、隐马尔可夫模型、线性预测技术和矢量量化码书生成方法用于语音编码和识别; 80、90年代语音处理技术产品化—IBM Tangora-5和Tangora-20英语听写机,Dragon Dictate 词汇翻译系统(70000),汉语听写机。 CMU语音组研制成功SPHINX系统(997,95.8%); 国内,清华大学、中科院声学所和中科院自动化所在汉语听写机研究方面有一定成果。 (除了属于这种LPC[线性预测分析法]的方法外,还开发了各种数字语音处理方法。到目前为止,相继实现了语音编码、语音分析、语音合成、语音修正、语音识别、说话者识别等各种具体应用系统。) 2、理解和掌握语音信号的表示和处理方法,常用的语音编码的采样率和相应的数字语音信号的速率; 1.语音表示方法的选择:要保存语音信号中的消息内容;表示形式要便于传输和存储、变换和处理,不至于严重损害消息的内容, 有用信息更易于被提取; 2. 语音信号数字表示的优点: 数字技术能完成许多很复杂的信号处理工作; 语音可以看成是音素的组合,具有离散的性质,特别适合于数字处理; 数字系统具有高可靠性、价廉、紧凑、快速等特点,很容易完成实时处理任务; 数字语音适于在强干扰信道中传输,易于和数据一起在通信网中传输,也易于进行加密传输。 3. 语音信号的数字表示方法:波形表示—采样和量化,保持波形;参数表示—激励源和模型参数(第二章) 语音信号的特点—短时平稳性 4. 处理方法:短时时域处理方法—短时能量、短时平均过零率以及短时自相关函数计算 短时频域分析—短时傅立叶分析 线性预测技术—本质上属于时域分析方法,但其结果可以是频域参数 倒谱和同态分析、矢量量化和隐马尔可夫模型 5. PCM编码:采样率:8000次/second,均匀量化:采样率12bps信号速率96kbps,非均匀量化:采样率8bps信号速率64kbps ADPCM:采样率:8khz速率:32kbps 3、理解语音信号的产生过程、发生机理和语音信号的声学特性; 产生过程:语音是说话人和听者之间相互传递的信号,传递的媒介是声波,说话人的发音器官做出发声动作,接着空气振动形成声波,声波传到听者的耳朵里,立刻引起听者的听觉反应 发生机理: 声学特性:频率:与音高有关;振幅:与响度有关。 4、理解和掌握语音信号浊音的基音频率、共振峰,及共振峰的计算方法; 浊音的基音频率(F0):由声带的尺寸、特性和声带所受张力决定,其值等于声带张开和闭合一次的时间的倒数。人类基音频率的范围在60Hz至450Hz左右。 共振峰(formant):声道是一个谐振腔,当激励的频率达到至声道的固有频率,则声道会以最大的振幅振荡,此时的频率称之为共振峰或共振峰频率。声道具有的一组共振峰,声道的频谱特性主要反映出这些共振峰的不同位置以及各个峰的频带宽度。共振峰及其带宽取决于声道某一瞬间的形状和尺寸,因而不同的语音对应于一组不同的共振峰参数。实际应用中,头三个共振峰最重要。

基于matlab的语音信号滤波处理——数字信号处理课程设计

数字信号处理课程设计 题目:基于matlab的语音信号滤波处理学院:物理与电子信息工程 专业:电子信息工程 班级: B07073041 学号: 200932000066 姓名:高珊 指导教师:任先平

摘要: 语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴学科,是目前发展最为迅速的学科之一,通过语音传递信息是人类最重要,最有效,最常用和最方便的交换信息手段,所以对其的研究更显得尤为重要。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换成离散的数据文件,然后用起强大的矩阵运算能力处理数据。这为我们的本次设计提供了强大并良好的环境! 本设计要求自己录制一段自己的语音后,在MATLAB软件中采集语音信号、回放语音信号并画出语音信号的时域波形和频谱图。再在Matlab中分别设计不同形式的FIR数字滤波器。之后对采集的语音信号经过不同的滤波器(低通、高通、带通)后,观察不同的波形,并进行时域和频谱的分析。对比处理前后的时域图和频谱图,分析各种滤波器对于语音信号的影响。最后分别收听进行滤波后的语音信号效果,做到了解在怎么样的情况下该用怎么样的滤波器。

目录 1.设计内容 (4) 2.设计原理 (4) 2.1语音信号的时域分析 (4) 2.2语音信号的频域分析 (5) 3.设计过程 (5) 3.1实验程序源代码 (6) 3.1.1原语音信号时域、频域图 (6) 3.1.2低通滤波器的设计 (6) 3.1.3高通滤波器的设计 (7) 3.1.4带通滤波器的设计 (8) 3.1.5语音信号的回放 (9) 3.2调试结果描述 (10) 3.3所遇问题及结果分析 (15) 3.3.1所遇主要问题 (16) 3.3.2结果分析 (16) 4.体会与收获 (17) 5.参考文献 (17)

语音信号处理matlab实现

短时能量分析matlab源程序: x=wavread('4.wav'); %计算N=50,帧移=50时的语音能量 s=fra(50,50,x);%对输入的语音信号进行分帧,其中帧长50,帧移50 s2=s.^2;%一帧内各种点的能量 energy=sum(s2,2);%求一帧能量 subplot(2,2,1); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=50'); axis([0,500,0,30]) %计算N=100,帧移=100时的语音能量 s=fra(100,100,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,2); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=100'); axis([0,300,0,30]) %计算N=400,帧移=400时的语音能量 s=fra(400,400,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,3); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=400'); axis([0,60,0,100]) %计算N=800,帧移=800时的语音能量 s=fra(800,800,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,4); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=800'); axis([0,30,0,200]) 分帧子函数: function f=fra(len,inc,x) %对读入语音分帧,len为帧长,inc为帧重叠样点数,x为输入语音数据 fh=fix(((size(x,1)-len)/inc)+1);%计算帧数 f=zeros(fh,len);%设一个零矩阵,行为帧数,列为帧长 i=1;n=1; while i<=fh %帧间循环 j=1; while j<=len %帧内循环 f(i,j)=x(n); j=j+1;n=n+1; end n=n-len+inc;%下一帧开始位置 i=i+1; end

(完整)《语音信号处理》期末试题总结,推荐文档

2011-2013学年 《语音信号处理》期末考试试题 适用班级:时量:120分钟闭卷记分: 考生班级:姓名:学号: 注:答案全部写在答题纸上,写在试卷上无效! 一、填空题:(每空2分) 1、矢量量化系统主要由编码器和译码器组成,其中编码器主要是由搜索算法和码书构成。P101 2、基于物理声学的共振峰理论,可以建立起三种实用的共振峰模型:级联型、并联型和混合型。P18 3、语音编码按传统的分类方法可以分为波形编码、参数编码和混合编码。P137 4、对语音信号进行压缩编码的基本依据是语音信号的冗余度和人的听觉感知机理。 P137-138 5、汉语音节一般由声母、韵母和声调三部分组成。P10 6、人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉的掩蔽效应。P22 7、句法的最小单位是词,词法的最小单位是音节,音节可以由音素构成。P9 8、复倒谱分析中避免相位卷绕的算法,常用的有微分法和最小相位信号法。P62 9、语音信号处理也可以简称为语音处理,它是利用数字信号处理技术对语音信号进行处理的一门学科,包括语音编码、语音合成、语音识别、说话人识别和语音增强等五大分支。P3 10、语音信号处理也可以简称为语音处理,它是以数字信号处理和语音学为基础而形成的一个综合新的学科,包括发音语音学、声学语音学、听觉语音学和心理学等四大分支。P2,6 11、语音的四大要素:音质、音调、音强和音长。P9 12、人类发音过程有三类不同的激励方式,因而能产生三类不同的声音,即浊音、清音、和爆破音。P8 13、元音的一个重要声学特性是共振峰,它是区别不同元音的重要参数,它一般包括共振峰频率的位置和频带宽度。 14、语音信号的倒谱分析就是求取语音倒谱特征参数的过程,它可以通过同态信号处理来实现。P56 二、判断题:(每小题2分)√× 1、预测编码就是利用对误差信号进行编码来降低量化所需的比特数,从而使编码速率大幅降低。(×)P143 2、以线性预测分析-合成技术为基础的参数编码,一般都是根据语音信号的基音周期和清/浊音标志信息来决定要采用的激励信号源。(×)P181 3、自适应量化PCM就是一种量化器的特性,能自适应地随着输入信号的短时能量的变化而调整的编码方法。(×)P142 4、线性预测法正是基于全极点模型假定,采用时域均方误差最小准则来估计模型参数的。(×)P72 5、波形编码是依赖模型假定的语音编码方法。(×)P137 6、掩蔽效应是使一个声音A能感知的阀值因另一个声音B的出现而提高的现象,这时A叫

语音信号处理复习纲要

Ch1 绪论 §1.1 语音信号处理概述 一、语音、语音信号处理的名词解释 1、语音:是语言的声学表现,是声音和意义的结合体,是相互传递信息的重要手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。 2、语音信号处理:是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及很广的交叉学科。 二、语音处理技术的应用领域 语音处理技术的应用领域包括:工业、军事、交通、医学、民用等。 三、语音信号采用数字处理的原因(数字语音的优点) 语音信号均采用数字处理,是因为数字处理与模拟处理相比具有许多优点: 1、数字技术能够完成许多很复杂的信号处理工作; 2、通过语音进行交换的信息本质上具有离散的性质,语音可以看做是音素的组合,适合数字处理; 3、数字系统具有高可靠性、廉价、快速等优点,容易完成实时处理任务; 4、数字语音适合在强干扰信道中传输,也易于加密传输。 四、语音学的名词解释 语音学:是研究言语过程的一门科学,它包括三个研究内容:发音器官在发音过程中的运动和语音的音位特性;语音的物理特性;以及听觉和语言感知。 §1.2 语音信号处理的发展概况 一、语音信号处理的发展史 1、1874年:电话的发明时现代语音通信的开端; 2、1939年:通道声码器技术; 3、40年代后期:语谱仪; 4、50年代初:第一台口授打字机和英语单词语音识别器; 5、60年代:Fant发表《语音产生的声学理论》; 6、70年代初:Flanagan著作《语音分析、合成和感知》; 7、90年代以来:语音识别的研究由实验室走向实用化。 二、语音编码、语音合成、语音识别名词解释 1、语音编码:语音编码技术是伴随着语音信号的数字化而产生的,目前主要应用在数字语音通信领域。 2、语音合成:语音合成的目的是使计算机能像人一样说话,它是一种人机语音通信技术,应用领域广泛。 3、语音识别:语音识别是使计算机判断出所说的话得内容,和语音合成一样也是一种人机语音通信技术。 为了实现人机语音通信,必须具备语音识别和语音理解两种功能 Ch2 基础知识 §2.2 语音产生的过程 一、现代语音学发展的三个分支:发音语音学、声学语音学、听觉语音学。 二、语音、清音、浊音的名词解释及语音的产生过程(名词解释、简答,集中备课) 1、语音:声音是一种波,能被人耳听到,振动频率在20Hz-20kHz之间。语音室声音的一种,它是由人的发音器官发出的、具有一定语法和意义的声音。语音的振动频率最高可达15kHz左右。 2、人类生成语音过程的第一阶段包括神经核肌肉的生理学阶段和产生语音波、传递语音波的物理阶段。 3、语音由声带振动或不经声带振动来产生,其中由声带振动产生的音统称为浊音,而不由声带振动产生的音统称为清音。浊音中包括所有的元音和一些辅音,清音包括另一部分辅音。

基于MATLAB的有噪声语音信号处理毕设

大学本科毕业设计论文 基于MATLAB的有噪声语音信号处理

摘要 滤波器设计在数字信号处理中占有极其重要的地位,FIR数字滤波器和IIR 滤波器是滤波器设计的重要组成部分。Matlab功能强大、简单易学、编程效率高,深受广大科技工作者的欢迎。特别是Matlab还具有信号分析工具箱,不需具备很强的编程能力,就可以很方便地进行信号分析、处理和设计。利用MATLAB信号处理工具箱可以快速有效地设计各种数字滤波器。课题基于MATLAB 有噪音语音信号处理的设计与实现,综合运用数字信号处理的理论知识对加噪声语音信号进行时域、频域分析和滤波。通过理论推导得出相应结论,再利用MATLAB作为编程工具进行计算机实现。在设计实现的过程中,使用窗函数法来设计FIR数字滤波器,用巴特沃斯、切比雪夫和双线性变法设计IIR数字滤波器,并利用MATLAB作为辅助工具完成设计中的计算与图形的绘制。通过对对所设计滤波器的仿真和频率特性分析,可知利用MATLAB信号处理工具箱可以有效快捷地设计FIR和IIR数字滤波器,过程简单方便,结果的各项性能指标均达到指定要求。 关键词?数字滤波器;MATLAB;窗函数法;巴特沃斯; 切比雪夫; 双线性变换

Abstract ?Filterdesignin digital signal processingplaysan extre melyimportant role, FIR digital filters and IIR filter is an importan tpart of filter design.Matlab is powerful,easy to learn,programming efficiency,which was welcomed bythemajority ofsc ientists. Matlab alsohas a particular signalanalysis toolbox,it need nothave strongprogrammingskills can be easily signal analysis, processing and design. Using MATLAB Signal Processing Toolbox can quickly andefficiently design avarietyof digitalfilters. MATLAB basedon the noise issuespeech signal processing design and implementation of digital signalprocessing integrated use of the theoretical knowledge ofthe speechsignal plus noise, time domain, frequencydomainanalysis andfiltering. Thecorrespondingresults obtainedthroughtheoreticalderivation, and then use MATLAB as a programming toolfor computer implementation.Implemented inthe design process,usingthewindow function methodtodesign FIR digital filters with Butterworth, Chebyshev andbilinear Reform IIR digital filter design and use ofMATLAB as asupplementary tool to complete thecalculation and graphic design Drawing. Throughthesimulation of thedesigned filter and the frequency analysis shows thatusingMatlabSignal Processing Toolbox can quickly and easily design digital filters FIR andIIR,the processis simple and convenient, the results of the performance indicators to meetthe specifiedrequirements. ? Keywords: digital filter; MATLAB;Chebyshev;Butterworth;

相关主题
文本预览
相关文档 最新文档