当前位置:文档之家 > 音周期与清浊音信息的梅尔倒谱参数

音周期与清浊音信息的梅尔倒谱参数

第22卷第2期2007年6月数据采集与处理

Journal of Data Acquisition8L Processing

V01.22No.2

Jun.2007

文章编号:1004—9037(2007)02一0229一05

基于基音周期与清浊音信息的梅尔倒谱参数

郭武王仁华戴礼荣

(中国科技大学电子工程与信息科学系,合肥,23。027)

摘要:提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel—c印strum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模型(Gaussian mixture models,GMM)的情况下,取得了比常用的梅尔刻度式倒频谱参数(Mel—frequency cepstral coefficient,MFCC)更高的识别率,在NIST2002年测试数据库中,512个混合高斯下能够将等错误率(EER)由9.4%降低到8.3%,2048个混合高斯下能够将等错误率由7.8%降低到

6.9%。

关键词:说话人确认;梅尔倒谱参数;基音频率;清浊音信息

中图分类号:TN912.34文献标识码:A

Mel—Cepstrum Integrated with Pitch and Information of Voiced/UnVoiced

G甜D I矿“,阢,盘,zg RP,z^“口,D盘i Li7’D,zg

(Department of Electronic Engineering and Information Science,

University of Science and Technology of China,Hefei,230027,China)

Abstract:An alg。rithm that extracts the Mel—cepstrum using variable frame1ength during voiced speech is proposed.Furthermore,the voiced partⅣ【el—cepstrum is copied twice because more information is held in voiced speech than in unvoiced speech.The information of pitch and voiced/unvoiced is fused into the Mel—cepstrum thr。ugh the above tw。methods.When the Gaussian mixture models(GMM)is adopted in text—independent speaker verification,the sys—tem based on the dynamic Mel—cepstrum(DMCEP)has better performance than the system based on standard Mel—frequency cepstral coefficient(MFCC).Speaker Verification experi—ments are carried on the2002NIST single speaker verification evaluation http://www.doczj.com/doc/1b4ce4ea172ded630b1cb688.html pared with standard MFCC,the equal error rate(EER)is reduced to8.3%from9.4%and to6.9% from7.8%in512GMM and2048GMM with DMCEP.

Key words:speaker verification;Mel—cepstrum;pitch frequency;information of Voiced/un—vojced

在与文本无关说话人确认系统中,基于GMM—

UBM[11的模型是当前的主流技术,而特征参数一般采用基于人的听觉模型的梅尔刻度式倒
频谱参数(Mel—freq uency cepstral coefficient,MFCC)。MFCC参数的核心思想是建立在听觉模型基础之上的,该参数比其他的常用参数具有更高的识别率以及抗噪能力。但是,MFCC的抽取完全是一个静态的过程,没有考虑人发音的过程。一般而言,语音中至少包含浊音、清音、过渡部分,另外还有无声段;无声段不能提供信息,而浊音包含有更多的信息。在MFCC提取的过程中,一般会通过寂静音检测去除部分无音段,但是对于其他所有语音都是同等对待的。.

UBM[11的模型是当前的主流技术,而特征参数一般采用基于人的听觉模型的梅尔刻度式倒频谱参数(Mel—freq uency cepstral coefficient,MFCC)。MFCC参数的核心思想是建立在听觉模型基础之上的,该参数比其他的常用参数具有更高的识别率以及抗噪能力。但是,MFCC的抽取完全是一个静态的过程,没有考虑人发音的过程。一般而言,语音中至少包含浊音、清音、过渡部分,另外还有无声段;无声段不能提供信息,而浊音包含有更多的信息。在MFCC提取的过程中,一般会通过寂静音检测去除部分无音段,但是对于其他所有语音都是同等对待的。.

本文采用梅尔倒谱参数(Mel—cepstrum)[21作为说话人识别系统的前端特征,梅尔倒谱参数也是

基金项目:中国科技大学青年教师基金和国家863(2006AA010104)资助项目。收稿日期:2006一03—23;修订日期:2006—10一20

 万方数据

下载Word文档免费下载:

音周期与清浊音信息的梅尔倒谱参数下载

(共6页)

倒谱计算与分析

地点 项目名称 一、 实验目的:对语音信号进行同态分析可得到语音信号的倒谱参数...倒谱法求浊音清音的音周期 function s=p5_2pitchdetect waveFile='beijing...

常用的基音周期检测的方法有哪些

自相关法、平均幅度差函数法、并行处理法、倒谱法、简化逆滤波法 自相关法的基本原理是浊音信号的自相关函数在基音周期的整数倍位置上出现峰值; 而清音 的自相关...

语音信号处理第6讲

有声带振动那样的周期性,有些清音和浊音的过度帧是...(AMDF)法、 并行处理技术、 倒谱法、 简化逆滤波...

语音信号处理第6讲.

? 基音周期是语音信号最重要的参数之一,它描述了...有声带振动那样的周期性,有些清音和浊音的过度帧是...(AMDF)法、 并行处理技术、 倒谱法、 简化逆滤波...

语音信号采集与简单处理

音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特 征,基音...采用倒谱法求语音信号基音周期。 (3)计算短时过零率,清音和浊音的短时过零...

第九章语音检测分析

倒谱法 ? LPC法语音检测分析主要涉及语音特征参数的提取分析。 1 ...浊音信号的自相关函数在基音周期的整数倍位 置上出现峰值,而清音的自相关函数...

一种基于倒谱法的基音周期检测改进算法

●一t一 “dio n9inee r|n9 语童技术 @6@@ 而i 文献引用格式 : 张景扩 , 彭奠. 一种基于倒谱 法的基音周期检测改进 算法[ J] .电声技术, 2017,...

语音信号处理实验指导书

采集一组浊音信号一组清音信号,信号的长度大于 3s。 (2)采用短时相关函数计算语音信号浊音音周期,考虑窗长度对基音周期计 算的影响。采用倒谱法求语音信号...

两种基音周期检测方法

倒谱法、平均幅度差函数法都属 于非基于事件基音...主要应用于只需要平均基音 周期作为参数的语音编解码...则在浊音段, Fn (τ ) 在τ = + P, +2 P...

语音信号处理实验

语音信号的能量随时间而变化,清音和浊音之间的能量...基音周期估计基音周期是表征语音信号本质特征的参数,...倒谱的低时部分可以分析声道、 声门和辐射信息,而...