语音信号处理实验报告11

  • 格式:doc
  • 大小:33.50 KB
  • 文档页数:4

下载文档原格式

  / 4
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验一 语音信号的时域分析

一、 实验目的、要求

(1)掌握语音信号采集的方法

(2)掌握一种语音信号基音周期提取方法

(3)掌握语音信号短时能量和短时过零率计算方法

(4)了解Matlab 的编程方法

二、 实验原理

语音是一时变的、非平稳的随机过程,但由于一段时间内(10-30ms)人的声带和声道形状的相对稳定性,可认为其特征是不变的,因而语音的短时谱具有相对稳定性。在语音分析中可以利用短时谱的这种平稳性,将语音信号分帧。 10~30ms 相对平稳,分析帧长一般为20ms 。

语音信号的分帧是通过可移动的有限长度窗口进行加权的方法来实现的。几种典型的窗函数有:矩形窗、汉明窗、哈宁窗、布莱克曼窗。

语音信号的能量分析是基于语音信号能量随时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多。定义短时平均能量

[][]∑∑+-=∞-∞=-=-=

n

N n m m n m n w m x m n w m x E 122)()()()( 下图说明了短时能量序列的计算方法,其中窗口采用的是直角窗。

过零就是信号通过零值。对于连续语音信号,可以考察其时域波形通过时间轴的情况。而对于离散时间信号,如果相邻的取样值改变符号则称为过零。由此可以计算过零数,过零数就是样本改变符号的次数。单位时间内的过零数称为平

均过零数。

语音信号x (n )的短时平均过零数定义为

()[]()[]()()[]()[]()

n w n x n x m n w m x m x Z m n *--=---=

∑∞

-∞=1sgn sgn 1sgn sgn 式中,[]•sgn 是符号函数,即

()[]()()()()⎩⎨⎧<-≥=01

01sgn n x n x n x

短时平均过零数可应用于语音信号分析中。发浊音时,尽管声道有若干个共振峰,但由于声门波引起了谱的高频跌落,所以其语音能量约集中干3kHz 以下。而发清音时.多数能量出现在较高频率上。既然高频率意味着高的平均过零数,低频率意味着低的平均过零数,那么可以认为浊音时具有较低的平均过零数,而清音时具有较高的平均过零数。然而这种高低仅是相对而言,没有精确的数值关系。

短时平均过零的作用

1.区分清/浊音:

浊音平均过零率低,集中在低频端;

清音平均过零率高,集中在高频端。

2.从背景噪声中找出是否有语音,以及语音的起点。

基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。

由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的

头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。②声道共振峰有时会严重影响激励信号的谐波结构,所以,从语音信号中直接取出仅和声带振动有关的激励信号的信息并不容易。③语音信号本身是准周期性的(即音调是有变化的),而且其波形的峰值点或过零点受共振峰的结构、噪声等的影响。④基音周期变化范围大,从老年男性的50Hz到儿童和女性的450Hz,接近三个倍频程,给基音检测带来了一定的困难。由于这些困难,所以迄今为止尚未找到一个完善的方法可以对于各类人群(包括男、女、儿童及不向语种)、各类应用领域和各种环境条件情况下都能获得满意的检测结果。

尽管基音检测有许多困难,但因为它的重要性,基音的检测提取一直是一个研究的课题,为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT、谱图法、小波法等等。

三、使用仪器、材料

微机(带声卡)、耳机,话筒。

四、实验步骤

1.语音信号的录音、读入、放音等:利用函数wavread对语音信号进行采样,

记住采样频率和采样点数,给出以下语音的波形图(2.wav)。

2.短时能量分析:(1)首先对语音信号预加重;(2)对预加重后的语音信号进行

分帧,帧长取N=256各样值点,帧移取128个样值点;(3)求短时能量。

3.短时过零率分析:求语音信号的短时过零率。

4.编写程序:参考Matlab有关资料,设计并编写出上述程序。利用subplot,

将语音信号的波形、短时能量、短时过零率放在一张图里进行比较,给出结论,注明语音段和所用窗函数及其宽度。

5.换一段语音重复上述步骤。

6.变换帧长观察结果有什么不同。

7.基音周期:采用短时相关函数计算语音信号浊音基音周期,考虑窗长度对基

音周期计算的影响。采用倒谱法求语音信号基音周期。

五、实验过程原始记录(数据,图表,计算)

实验报告要求

报告中要有实验目的、实验原理及步骤、实验程序、实验中得出的图形结果及结论等(清浊音的短时平均能量、短时过零率有什么特点),注明语音段和所用窗函数及其宽度。总结本次上机实验的收获。

六、实验结果,及分析

七、实验总结:

八、思考题

1.短时平均能量、短时过零率的主要用途是什么?

2.窗的宽度(帧长)的改变,对短时能量分析产生怎样的影响?