当前位置:文档之家 > 音周期与清浊音信息的梅尔倒谱参数

音周期与清浊音信息的梅尔倒谱参数

第22卷第2期2007年6月数据采集与处理

Journal of Data Acquisition8L Processing

V01.22No.2

Jun.2007

文章编号:1004—9037(2007)02一0229一05

基于基音周期与清浊音信息的梅尔倒谱参数

郭武王仁华戴礼荣

(中国科技大学电子工程与信息科学系,合肥,23。027)

摘要:提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel—c印strum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模型(Gaussian mixture models,GMM)的情况下,取得了比常用的梅尔刻度式倒频谱参数(Mel—frequency cepstral coefficient,MFCC)更高的识别率,在NIST2002年测试数据库中,512个混合高斯下能够将等错误率(EER)由9.4%降低到8.3%,2048个混合高斯下能够将等错误率由7.8%降低到

6.9%。

关键词:说话人确认;梅尔倒谱参数;基音频率;清浊音信息

中图分类号:TN912.34文献标识码:A

Mel—Cepstrum Integrated with Pitch and Information of Voiced/UnVoiced

G甜D I矿“,阢,盘,zg RP,z^“口,D盘i Li7’D,zg

(Department of Electronic Engineering and Information Science,

University of Science and Technology of China,Hefei,230027,China)

Abstract:An alg。rithm that extracts the Mel—cepstrum using variable frame1ength during voiced speech is proposed.Furthermore,the voiced partⅣ【el—cepstrum is copied twice because more information is held in voiced speech than in unvoiced speech.The information of pitch and voiced/unvoiced is fused into the Mel—cepstrum thr。ugh the above tw。methods.When the Gaussian mixture models(GMM)is adopted in text—independent speaker verification,the sys—tem based on the dynamic Mel—cepstrum(DMCEP)has better performance than the system based on standard Mel—frequency cepstral coefficient(MFCC).Speaker Verification experi—ments are carried on the2002NIST single speaker verification evaluation http://www.doczj.com/doc/1b4ce4ea172ded630b1cb688.html pared with standard MFCC,the equal error rate(EER)is reduced to8.3%from9.4%and to6.9% from7.8%in512GMM and2048GMM with DMCEP.

Key words:speaker verification;Mel—cepstrum;pitch frequency;information of Voiced/un—vojced

在与文本无关说话人确认系统中,基于GMM—

UBM[11的模型是当前的主流技术,而特征参数一般采用基于人的听觉模型的梅尔刻度式倒
频谱参数(Mel—freq uency cepstral coefficient,MFCC)。MFCC参数的核心思想是建立在听觉模型基础之上的,该参数比其他的常用参数具有更高的识别率以及抗噪能力。但是,MFCC的抽取完全是一个静态的过程,没有考虑人发音的过程。一般而言,语音中至少包含浊音、清音、过渡部分,另外还有无声段;无声段不能提供信息,而浊音包含有更多的信息。在MFCC提取的过程中,一般会通过寂静音检测去除部分无音段,但是对于其他所有语音都是同等对待的。.

UBM[11的模型是当前的主流技术,而特征参数一般采用基于人的听觉模型的梅尔刻度式倒频谱参数(Mel—freq uency cepstral coefficient,MFCC)。MFCC参数的核心思想是建立在听觉模型基础之上的,该参数比其他的常用参数具有更高的识别率以及抗噪能力。但是,MFCC的抽取完全是一个静态的过程,没有考虑人发音的过程。一般而言,语音中至少包含浊音、清音、过渡部分,另外还有无声段;无声段不能提供信息,而浊音包含有更多的信息。在MFCC提取的过程中,一般会通过寂静音检测去除部分无音段,但是对于其他所有语音都是同等对待的。.

本文采用梅尔倒谱参数(Mel—cepstrum)[21作为说话人识别系统的前端特征,梅尔倒谱参数也是

基金项目:中国科技大学青年教师基金和国家863(2006AA010104)资助项目。收稿日期:2006一03—23;修订日期:2006—10一20

 万方数据

下载Word文档免费下载:

音周期与清浊音信息的梅尔倒谱参数下载

(共6页)

音周期与清浊音信息的梅尔倒谱参数

音周期与清浊音信息的梅尔倒谱参数_IT/计算机_专业资料。语音识别相关第22卷第2期2007年6月 采理据集与处JournalofDataAcquisition8LProcessing 数 V01.22No.2 ...

倒谱计算与分析

地点 项目名称 一、 实验目的:对语音信号进行同态分析可得到语音信号的倒谱参数...倒谱法求浊音清音的音周期 function s=p5_2pitchdetect waveFile='beijing...

基于自相关法的语音基音周期估计

根据声带是否震动可以将语音信号分为清音跟浊音两种。...的信息,然后求取基音周期,最常用的就 是倒谱法,...先提取信号声道模型参数,然后利用它对信号进行滤波,...

语音信号处理课件__第09章语音检测分析-精品

离散傅里叶变换(DFT) 倒谱法 LPC法语音检测分析主要涉及语音特征参数的提取...浊音信号的自相关函数在基音周期的整数倍位 置上出现峰值,而清音的自相关函数...

基音周期估计

电子与信息学院 专业:信息工程 姓名 学号: 提交日期...基音是指法浊音是声带振动所引起的 周期性,而基因...(AMDF)法、并行处理技术、倒谱法、SIFT、 谱图法...

语音信号处理实用教程-PPT课件第09章 语音检测分析

离散傅里叶变换(DFT) 倒谱法 LPC法 语音检测分析主要涉及语音特征参数的提取...的周期 性,有些清音和浊音的过渡帧是很难准确地判 断是周期性还是非周期性...

一种基于倒谱法的基音周期检测改进算法

●一t一 “dio n9inee r|n9 语童技术 @6@@ 而i 文献引用格式 : 张景扩 , 彭奠. 一种基于倒谱 法的基音周期检测改进 算法[ J] .电声技术, 2017,...

一种语音更改技术的研究与实现

表征语音特征的参数 根据学者 有很多 , 其中最重要...完成后 , 首先对基音周期序列乘以 1个 和倒谱法...上过程 , 直到将整个语音信号的清浊音在时域上的边...

基于MATLAB的自相关函数基音检测的优化

the three-level center clipping 基音是语音信号处理中的一个非常重要的参数 ....自相关法和倒谱分析是基音周期估计比较常用的方法,浊音信号的自相关函数在基音...

基于Mel频率倒谱系数、动态时间归准的计算机肺音分析系统在健康儿童中的应用要点

?605? .临床研究与实践. 基于Mel频率倒谱系数、动态时间归准的 计算机肺音分析系统在健康儿童中的应用颜卫源 李琳杨运刚 林小亮 吴谨准 【摘要】统,采用Lung 目的...