基于MATLAB的语音信号时域特性分析_语音信号处理实验报告

  • 格式:doc
  • 大小:308.05 KB
  • 文档页数:11

下载文档原格式

  / 11
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

南京信息工程大学 实验(实习)报告

实验(实习)名称 基于MATLAB 的语音信号时域特性分析 实验(实习)日期 2013.4.18 得分 ___指导教师

院电子与信息工程专业电子信息工程年级 班次 姓名 学号

一、实验目的

语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法,直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数等。

本实验要求掌握时域特征分析原理,并利用已学知识,编写程序求解语音信号的短时过零率、短时能量、短时自相关特征,分析实验结果,并能掌握借助时域分析方法所求得的参数分析语音信号的基音周期及共振峰。

二、实验原理及实验结果

1.窗口的选择

通过对发声机理的认识,语音信号可以认为是短时平稳的。在5~50ms 的范围内,语音频谱特性和一些物理特性参数基本保持不变。我们将每个短时的语音称为一个分析帧。一般帧长取10~30ms 。我们采用一个长度有限的窗函数来截取语音信号形成分析帧。通常会采用矩形窗和汉明窗。图1.1给出了这两种窗函数在帧长N=50时的时域波形。

0.2

0.40.60.811.2

1.41.61.82矩形窗

sample

w (n )

0.1

0.20.30.40.50.6

0.70.80.91hanming 窗

sample

w (n )

图1.1 矩形窗和Hamming 窗的时域波形

矩形窗的定义:一个N 点的矩形窗函数定义为如下

{1,00,()n N

w n ≤<=其他

hamming 窗的定义:一个N 点的hamming 窗函数定义为如下

0.540.46cos(2),010,()n n N

N w n π-≤<-⎧⎨⎩

其他

=

这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现(如图1.2):矩形窗的主瓣宽度小(4*pi/N ),具有较高的频率分辨率,旁瓣峰值大(-13.3dB ),会导致泄漏现象;汉明窗的主瓣宽8*pi/N ,旁瓣峰值低(-42.7dB ),可以有效的克服泄漏现象,具有更平滑的低通特性。因此在语音频谱分析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗。表1.1对比了这两种窗函数的主瓣宽度和旁瓣峰值。

00.10.20.3

0.40.50.6

0.70.80.91

-80

-60-40-20

0矩形窗频率响应

归一化频率(f/fs)幅度/d B

00.10.20.3

0.40.50.60.70.80.91

-100

-50

Hamming 窗频率响应

归一化频率(f/fs)

幅度/d B

图1.2 矩形窗和Hamming 窗的频率响应

表1.1 矩形窗和hamming 窗的主瓣宽度和旁瓣峰值

2.短时能量

由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义短时能量为:

2

2

1

[()()]

[()()]n

n m m n N E x m w n m x m w n m ∞

=-∞

=-+=

-=

-∑∑

,其中N 为窗长

特殊地,当采用矩形窗时,可简化为:

2

()

n m E x

m ∞

=-∞

=

图1.3和图1.4给出了不同矩形窗和hamming 窗长的短时能量函数,我们发现:在用短时能量反映语音信号的幅度变化时,不同的窗函数以及相应窗的长短均有影响。hamming 窗的效果比矩形窗略好。但是,窗的长短影响起决定性作用。窗过大(N 很大),等效于很窄的低通滤波器,不能反映幅度En 的变化;窗过小( N 很小),短时能量随时间急剧变化,不能得到平滑的能量函数。在11.025kHz 左右的采样频率下,N 选为100~200比较合适。

短时能量函数的应用:1)可用于区分清音段与浊音段。En 值大对应于浊音段,En 值小对应于清音段。2)可用于区分浊音变为清音或清音变为浊音的时间(根据En 值的变化趋势)。3)对高信噪比的语音信号,也可以用来区分有无语音(语音信号的开始点或终止点)。无信号(或仅有噪声能量)时,En 值很小,有语音信号时,能量显著增大。

sampl e

采样幅度

sampl e

短时能量

sampl e

短时能量

sampl e

短时能量

sampl e

短时能量

sampl e

短时能量

sample

采样幅度

sample

短时能量

sample

短时能量

sample

短时能量

sample

短时能量

sample

短时能量

图1.3 不同矩形窗长的短时能量函数 图1.4 不同hamming 窗长的短时能量函数

3.短时平均过零率

过零率可以反映信号的频谱特性。当离散时间信号相邻两个样点的正负号相异时,我们称之为“过零”,即此时信号的时间波形穿过了零电平的横轴。统计单位时间内样点值改变符号的次数具可以得到平均过零率。定义短时平均过零率:

相关主题