基于频谱方差的抗噪声语音端点检测算法
- 格式:pdf
- 大小:377.97 KB
- 文档页数:4
噪声背景下语音端点检测方法的研究摘要:在实际环境中,并没有完全纯净的语音信号,一段语音信号往往都伴有噪声信号,所以研究在背景噪声环境中的语音端点检测更为重要。
常用的短时过零率法、短时能量法以及双门限法都存在着一个共同的问题,即对信噪比要求较高。
为了解决这一问题我们提出了一改进算法,即基于谱减法思想的语音端点检测的方法,有效的提高检测的正确率。
关键词:端点检测噪声短时能量短时过零率谱减法1、引言语音端点检测是指用计算机数字处理技术来找出语音信号中的字或词等的起点和终点这俩个端点。
作为语音识别的前端,准确的端点检测可以提高识别的准确率。
语音端点检测的困难在于一段信号中的无声段或者录制一段语音段的前后人为呼吸等产生的杂音、语音开始处的弱摩擦音或弱爆破音以及终点处的鼻音,这些使得语音的端点需要综合利用语音的各种信号特征,从而确保定位的精确性,避免包含噪音信号和丢失语音信号。
常用语音端点检测法有短时过零率法、短时能量法以及双门限法。
但是对于信噪比要求较高,所以本文提出了一种基于谱减法思想的语音端点检测算法,提高语音端点检测的正确率。
2、语音端点检测方法常用方法中的短时能量法,语音和噪声的区别可以体现在它们的能量上,语音段的能量与噪声段能量相比,要大于噪声段的能量,因此可以以此为依据进行检测;短时过零率法,短时过零率可以区别语音是清音还是浊音[1,2],因此它可以从背景噪声中找出语音信号;传统双门限比较法,首先为短时能量和过零率分别确定两个门限,较低的门限对信号的变化比较敏感,较高的门限是用来确定进入语音段。
当低门限被超过时,未必是语音的开始而很有可能是由很小的噪声所引起的波动,但当高门限被超过并且在接下来的时间段内一直超过低门限时,则意味着语音信号的开始[3]。
但是上述三种方法在低信噪比时检测效果就不是很理想了。
因此我们提出了一种改进算法。
3、基于谱减法思想的语音端点检测算法的研究3.1 谱减法概述由于语音生成模型是低速率语音编码的基础,当语音受到噪声干扰时,提取的模型参数将很不准确,重建的语音质量急剧恶化。
第27卷 第9期计 算 机 仿 真2010年9月 文章编号:1006-9348(2010)09-0337-04基于频谱方差的抗噪声语音端点检测算法刘玉珍,连自锋(辽宁工程技术大学电子与信息工程学院,辽宁葫芦岛125105)摘要:在语音识别系统中,对识别的准确性有很重要的作用。
对于纯净语音信号,传统的端点检测算法能够很好地检测语音部分的起止点。
由于在有噪声干扰的情况下,算法的检测准确度往往会急剧下降。
为了改善噪声环境下的端点检测效果,从语音信号和噪声信号频域分布特性的差异出发,用频谱方差数值来区分语音和噪声,提出了基于频谱方差的端点检测算法,并进行了无噪声和噪声环境下的仿真,证明了这种算法在强噪声干扰的情况下也能够取得很好的效果。
同时将新算法和传统的基于LPCC的端点检测算法进行了对比试验,实验结果表明,在噪声环境下,新算法的检测精度有明显提高。
关键词:频谱方差;端点检测;话音活动检测;语音识别中图分类号:TN912.34 文献标识码:AA lgorith m of Anti-noise Endpoi nt D etectionBased on Spectru m VarianceLIU Yu-zhen,L IAN Zi-feng(Coll ege o f E lectron i cs and Info r ma ti on Eng i neer i ng,L i aoni ng T echnica lU niversity,Hu l udao L iaon i ng125105,Ch i na)ABSTRACT:Endpo int detec tion is a cruc i a l techno logy o f preprocessi ng step in speech recogn iti on syste m s.It play sa very i m portant pa rt i n the accuracy o f the recognition results.T o pure speech si gna,l traditi onal endpo i nt detectionm e t hods can a l so achieve fa i r l y good results i n detecti ng the start and endpo i nt.Butw hen i n terfered by no ise,the detection accuracy of such m ethods a l w ays fall s sharply,o r even loses effec tiveness.T here a re differences i n frequencydom ai n bet ween speech and no i se d istri buti on characters.To i m prove the perfor m ance of endpo i nt de tecti on i n no isyenv iron m en t,t h is article takes such d i screpancy as a sta rting po i nt,uses spectru m var i ance to d i sti ngu ish vo i ce andno ise,and proposes a new anti-no isy endpo i nt detecti on me t hod base on spec tru m var i ance.T hen si m ulate t hem e t hod in bo t h pure speech s i gna l and speech w ith wh ite no i se,prove that this ne w m ethod can a l so perfor m we ll under t he c ircu m stances o f ser i ous no ise.A contrast test is also done w ith t he new m e t hod and a trad i tiona l m ethod,based on LPCC.T he outcom e show s t hat the ne w m et hod can ach ieve bette r e ffectiveness.KEY W ORDS:Spectru m va riance;Endpo i nt de tecti on;VAD;Speech recogn iti on1 引言数字语音信号是由语音部分和各种背景噪音混合组成,要在其中将需要处理的语音信号时段与静音时段、噪声时段区分开来,确定出语音信号的起始点,这就是端点检测,也称为话音活动检测(V o i ce A cti v ity De tecti on,VAD)。
一种基于改进的谱减法的语音增强算法高留洋;朱文;桑振夏;米兰【摘要】为改善语音质量,提高语音识别系统的性能,提出了一种新的基于改进的谱减法的语音增强算法.新算法在所有噪声都能转化为加性高斯白噪声的基础上,依据高斯白噪声幅度谱服从瑞利分布的特点,对噪声幅度谱进行精确的估计,并采用频带方差进行端点检测以及时检出语音.仿真分析表明:该方法能够较好地抑制噪声,噪声消除效果较传统算法具有明显的提高.%To improve the speech quality and enhance the performance of noisy speech signals recognition, a new speech enhancement algorithm based on improved spectral subtraction is proposed and analyzed. In contrast to the standard spectral subtraction algorithm, the new algorithm accurately estimates the noise based on the fact that all noise can be changed into Additive White Gaussian Noise ( AWGN) and according to the feature that the amplitude spectral of narrowband white Gaussian noise obeys Rayleigh distribution. This algorithm also adopts a new speech activity detection technology based on frequency band variance to detect speech activity. The simulation analysis results indicate that the algorithm in this paper performs better in noise elimination than standard spectral subtraction.【期刊名称】《现代电子技术》【年(卷),期】2012(035)017【总页数】3页(P60-62)【关键词】语音增强;谱减法;端点检测;加性高斯白噪声;瑞利分布【作者】高留洋;朱文;桑振夏;米兰【作者单位】63898部队,河南济源 454650;63898部队,河南济源 454650;63898部队,河南济源 454650;63898部队,河南济源 454650【正文语种】中文【中图分类】TN912.35-340 引言PSTN网语音通信过程中不可避免地会受到环境噪声的影响,过大的环境噪声将严重影响通信质量,同时将严重影响监管环节中语音处理系统的性能。
基于连续噪声谱估计的谱减法语音增强算法严思伟;屈晓旭;娄景艺【摘要】传统谱减算法简单高效,但是其端点检测不准确,噪声估计仅仅采用"寂静段"的统计平均,会引入起伏较大的"音乐噪声",影响通信效果.针对传统端点检测和噪声估计不准确的问题,提出了一种基于连续噪声谱估计的谱减法语音增强算法,通过对噪声谱进行不间断更新来准确定位语音端点和噪声估计,然后在此基础上进行功率谱过减及半波整流,运用维纳滤波器对语音信号进行平滑处理.结果表明,改进的谱减法能够消除背景噪声,并有效滤除"音乐噪声",得到更好的语音可懂度和清晰度.【期刊名称】《通信技术》【年(卷),期】2018(051)006【总页数】6页(P1296-1301)【关键词】谱过减法;端点检测;连续噪声估计;半波整流;维纳滤波【作者】严思伟;屈晓旭;娄景艺【作者单位】海军工程大学电子工程学院,湖北武汉 430033;海军工程大学电子工程学院,湖北武汉 430033;海军工程大学电子工程学院,湖北武汉 430033【正文语种】中文【中图分类】TN912.350 引言语音是人类交流信息最自然、最有效、最方便的手段。
伴随着通信技术的发展,语音通信已经成为人们日常工作和生活中不可或缺的一部分。
然而,语音通信过程中不可避免地会受到来自环境、设备内部等一系列的噪声。
这些噪声的存在会影响语音处理系统的性能,最终影响接收者接收信号的质量。
为了从被污染的语音信号中提取尽可能纯净的话音信号,语音增强技术应运而生。
目前,语音增强的主要方法有基于短时谱估计的语音增强法[1-2]、基于听觉掩蔽的语音增强法[3]、噪声对消法[4]和小波变换法[5]等。
在基于短时谱估计法中,Boll等人提出的语音功率谱减法以其算法的简单、高效一直被沿用至今。
但是,该算法由于其平稳性假设,同实际含噪声情况不相符,在实际应用中存在较大的音乐噪声。