当前位置:文档之家 > 音周期与清浊音信息的梅尔倒谱参数

音周期与清浊音信息的梅尔倒谱参数

第22卷第2期2007年6月数据采集与处理

Journal of Data Acquisition8L Processing

V01.22No.2

Jun.2007

文章编号:1004—9037(2007)02一0229一05

基于基音周期与清浊音信息的梅尔倒谱参数

郭武王仁华戴礼荣

(中国科技大学电子工程与信息科学系,合肥,23。027)

摘要:提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel—c印strum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模型(Gaussian mixture models,GMM)的情况下,取得了比常用的梅尔刻度式倒频谱参数(Mel—frequency cepstral coefficient,MFCC)更高的识别率,在NIST2002年测试数据库中,512个混合高斯下能够将等错误率(EER)由9.4%降低到8.3%,2048个混合高斯下能够将等错误率由7.8%降低到

6.9%。

关键词:说话人确认;梅尔倒谱参数;基音频率;清浊音信息

中图分类号:TN912.34文献标识码:A

Mel—Cepstrum Integrated with Pitch and Information of Voiced/UnVoiced

G甜D I矿“,阢,盘,zg RP,z^“口,D盘i Li7’D,zg

(Department of Electronic Engineering and Information Science,

University of Science and Technology of China,Hefei,230027,China)

Abstract:An alg。rithm that extracts the Mel—cepstrum using variable frame1ength during voiced speech is proposed.Furthermore,the voiced partⅣ【el—cepstrum is copied twice because more information is held in voiced speech than in unvoiced speech.The information of pitch and voiced/unvoiced is fused into the Mel—cepstrum thr。ugh the above tw。methods.When the Gaussian mixture models(GMM)is adopted in text—independent speaker verification,the sys—tem based on the dynamic Mel—cepstrum(DMCEP)has better performance than the system based on standard Mel—frequency cepstral coefficient(MFCC).Speaker Verification experi—ments are carried on the2002NIST single speaker verification evaluation http://www.doczj.com/doc/1b4ce4ea172ded630b1cb688.html pared with standard MFCC,the equal error rate(EER)is reduced to8.3%from9.4%and to6.9% from7.8%in512GMM and2048GMM with DMCEP.

Key words:speaker verification;Mel—cepstrum;pitch frequency;information of Voiced/un—vojced

在与文本无关说话人确认系统中,基于GMM—

UBM[11的模型是当前的主流技术,而特征参数一般采用基于人的听觉模型的梅尔刻度式倒
频谱参数(Mel—freq uency cepstral coefficient,MFCC)。MFCC参数的核心思想是建立在听觉模型基础之上的,该参数比其他的常用参数具有更高的识别率以及抗噪能力。但是,MFCC的抽取完全是一个静态的过程,没有考虑人发音的过程。一般而言,语音中至少包含浊音、清音、过渡部分,另外还有无声段;无声段不能提供信息,而浊音包含有更多的信息。在MFCC提取的过程中,一般会通过寂静音检测去除部分无音段,但是对于其他所有语音都是同等对待的。.

UBM[11的模型是当前的主流技术,而特征参数一般采用基于人的听觉模型的梅尔刻度式倒频谱参数(Mel—freq uency cepstral coefficient,MFCC)。MFCC参数的核心思想是建立在听觉模型基础之上的,该参数比其他的常用参数具有更高的识别率以及抗噪能力。但是,MFCC的抽取完全是一个静态的过程,没有考虑人发音的过程。一般而言,语音中至少包含浊音、清音、过渡部分,另外还有无声段;无声段不能提供信息,而浊音包含有更多的信息。在MFCC提取的过程中,一般会通过寂静音检测去除部分无音段,但是对于其他所有语音都是同等对待的。.

本文采用梅尔倒谱参数(Mel—cepstrum)[21作为说话人识别系统的前端特征,梅尔倒谱参数也是

基金项目:中国科技大学青年教师基金和国家863(2006AA010104)资助项目。收稿日期:2006一03—23;修订日期:2006—10一20

 万方数据

下载Word文档免费下载:

音周期与清浊音信息的梅尔倒谱参数下载

(共6页)

倒谱计算与分析

地点 项目名称 一、 实验目的:对语音信号进行同态分析可得到语音信号的倒谱参数...倒谱法求浊音清音的音周期 function s=p5_2pitchdetect waveFile='beijing...

基于自相关法的语音基音周期估计

根据声带是否震动可以将语音信号分为清音跟浊音两种。...的信息,然后求取基音周期,最常用的就 是倒谱法,...先提取信号声道模型参数,然后利用它对信号进行滤波,...

第九章语音检测分析

倒谱法 ? LPC法语音检测分析主要涉及语音特征参数的提取分析。 1 ...浊音信号的自相关函数在基音周期的整数倍位 置上出现峰值,而清音的自相关函数...

一种基于倒谱法的基音周期检测改进算法

●一t一 “dio n9inee r|n9 语童技术 @6@@ 而i 文献引用格式 : 张景扩 , 彭奠. 一种基于倒谱 法的基音周期检测改进 算法[ J] .电声技术, 2017,...

语音信号处理实验

语音信号的能量随时间而变化,清音和浊音之间的能量...基音周期估计基音周期是表征语音信号本质特征的参数,...倒谱的低时部分可以分析声道、 声门和辐射信息,而...

语音信号处理课件 第09章语音检测分析

离散傅里叶变换(DFT) 倒谱法 LPC法语音检测分析主要涉及语音特征参数的提取...浊音信号的自相关函数在基音周期的整数倍位 置上出现峰值,而清音的自相关函数...

一种对混合说话人特征提取的新方法

一种对混合说话人特征提取的新方法 - 本文在使用基音周期和美尔倒谱系数(MFCC)计算特征参数的基础上利用主成分分析(PCA)和线性判别分析(LDA)相结合的方法,构造了...

基音周期估计

电子与信息学院 专业:信息工程 姓名 学号: 提交日期...基音是指法浊音是声带振动所引起的 周期性,而基因...(AMDF)法、并行处理技术、倒谱法、SIFT、 谱图法...

基于MATLAB的自相关函数基音检测的优化

the three-level center clipping 基音是语音信号处理中的一个非常重要的参数 ....自相关法和倒谱分析是基音周期估计比较常用的方法,浊音信号的自相关函数在基音...