基于子带能熵比的语音端点检测算法
- 格式:docx
- 大小:37.23 KB
- 文档页数:2
基于多窗谱估计谱减法和能熵比法的语音端点检测算法赵发【摘要】语音端点检测是语音处理中非常关键的一个环节,目前主要的语音端点检测算法都侧重于语音特征参数的提取而忽略了之前的语音增强.论文提出一种基于多窗谱估计谱减法和能熵比的语音端点检测复合算法,该算法利用多窗谱估计谱减法将有噪声环境下的语音信号减噪,提高性噪比,达到语音增强的效果,再结合能熵比法进行端点检测.仿真结果表明,算法在低信噪比情况下,可以提高语音端点检测的正确率.【期刊名称】《巢湖学院学报》【年(卷),期】2016(018)006【总页数】6页(P80-85)【关键词】多窗谱估计;谱减法;能熵比;端点检测【作者】赵发【作者单位】安徽工程大学,安徽芜湖 241000【正文语种】中文【中图分类】TN912.3语音端点检测属于语音信号处理的范畴[1],是语音识别、语音合成等语音应用方面非常关键的一个环节[2];它是指从一个连续的语音流中检测出有效的语音段,包括检测出有效语音的起始点和结束点。
现在的语音端点检测算法很多,但是主要的方法都是基于特征参数的提取,如基于短时能量和短时过零率的双门限法、倒谱法、谱熵法[3-6]等,这些方法在针对实验室高信噪比语音信号端点检测时能取得较好的效果,但是当在更真实自然的带噪声语音环境中,由于信噪比的降低,信号的特征参数提取变得困难,这时端点检测的性能将急剧下降。
针对这种低信噪比的带噪语音信号,目前又提出一些改进检测算法,如基于短时能量和过零率相结合的能零比法,基于频谱方差与谱减法的语音端点检测算法,基于短时能量和谱熵相结合的能熵比法等。
但以上算法都侧重于语音特征参数的提取,而对之前的语音增强工作有所忽视,这对低信噪比下的语音端点检测性能将会产生一定的影响。
本文提出一种基于多窗谱估计谱减法和能熵比法的语音端点检测算法改进算法,本算法通过多窗谱估计谱减法将有噪声环境下的语音信号减噪,提高性噪比,达到语音增强的效果,之后利用能熵比法进行语音端点检测。
基于LMS 自适应的改进端点检测算法刁鸿鹄,毛强,章小兵(安徽工业大学电气与信息工程学院,安徽 马鞍山 243032)摘要:语音识别技术早已不再局限于实验室中,但部分关键技术仍需进一步优化与改进,以适应社会和用户不断增加的需求。
从语音识别的技术理论入手,着重研究端点检测技术,拟在此基础上针对现有算法进行改进,提升其在低信噪比环境下的识别准确率。
提出了一种在对语音进行LMS 自适应降噪后,采用倒谱距离熵比的新型端点检测算法,并在MATLAB 平台上进行相应测试。
结果表明该算法相比于传统方法,检测正确率确有提升。
关键词:语音识别;自适应滤噪;倒谱距离;能熵比中图分类号:TN912.3 文献标志码:A 文章编号:1671-0436(2021)01-0031-10收稿日期:2020-09-28作者简介:刁鸿鹄(1996— ),男,安徽马鞍山人,硕士研究生,*****************,主要研究方向为语音识别与测控技术。
第 34 卷第 1 期2021 年 2 月常州工学院学报Journal of Changzhou Institute of TechnologyV ol. 34 No. 1Feb.2021doi:10.3969/j.issn.1671-0436.2021.01.0080 引言语音端点检测技术是对输入语音进行有话段起止端点的标记。
它是语音识别系统中一个关键环节。
端点检测的成功与否直接影响了语音识别系统的准确率。
现实生活中,因无法保证采集环境处于安静状态,故语音输入信号不可避免地带有各种噪声。
因此,研究在低信噪比环境下具有良好识别率的语音端点检测技术有实际意义,对提升系统在恶劣环境下的工作稳定性大有益处。
Improved Endpoint Detection Algorithm Based on LMS AdaptiveDIAO Honghu ,MAO Qiang ,ZHANG Xiaobing(School of Electrical and Information Engineering, Anhui University of Technology, Maanshan 243032)Abstract: Speech recognition technology is no longer limited to the laboratory. However, some key technologies still need to be further optimized and improved to adapt to the increasing demands of society and users. Starting from the technical theory of speech recognition and focusing on the endpoint detection technology, based on which, it is planned to improve the existing algorithm and enhance its recognition accuracy in a low signal-to-noise ratio environment. A new endpoint detection algorithm using cepstral distance-entropy ratio after LMS adaptive noise reduction is proposed, and the corresponding test is performed on the MATLAB platform. The results show that compared with traditional methods, the detection accuracy of this algorithm is indeed improved.Key words: speech recognition ;adaptive noise filtering ;cepstrum distance ;energy-entropy ratio322021年常州工学院学报1 自适应滤波减噪自适应信号的主要特征是在无预设值的条件下,实时调用运行数据,根据算法不断递归,更新参数,逐步逼近最优结果[1]。
摘要摘要语音端点检测是指从一段语音信号中准确的找出语音信号的起始点和结束点,它的目的是为了使有效的语音信号和无用的噪声信号得以分离,因此在语音识别、语音增强、语音编码、回声抵消等系统中得到广泛应用。
目前端点检测方法大体上可以分成两类,一类是基于阈值的方法,该方法根据语音信号和噪声信号的不同特征,提取每一段语音信号的特征,然后把这些特征值与设定的阈值进行比较,从而达到语音端点检测的目的,该方法原理简单,运算方便,所以被人们广泛使用,本文主要对基于阀值的方法进行研究。
另一类方法是基于模式识别的方法,需要估计语音信号和噪声信号的模型参数来进行检测。
由于基于模式识别的方法自身复杂度高,运算量大,因此很难被人们应用到实时语音信号系统中去。
端点检测在语音信号处理中占有十分重要的地位,直接影响着系统的性能。
本文首先对语音信号进行简单的时域分析,其次利用短时能量和过零率算法、倒谱算法、谱熵算法进行语音端点检测,并对这几种算法进行端点检测,并进行实验分析。
本文首先分别用各算法对原始语音信号进行端点检测,并对各算法检测结果进行分析和比较。
其次再对语音信号加噪,对不同信噪比值进行端点检测,分析比较各算法在不同信噪比下的端点检测结果,实验结果表明谱熵算法语音端点检测结果比其他两种方法好。
关键词语音端点检测;语音信号处理;短时能量和过零率;倒谱;谱熵IAbstractEndpoint detection is a voice signal from the accurate speech signal to the identify start and the end points, the purpose is to enable to separated the effective voice signals and un-useful noise. So, in the speech recognition system, speech enhancement, speech coding, echo cancellation and other systems are widely used.In Current the endpoint detection can be roughly divided into two categories, one is based on the threshold method based on the different characteristics of speech signal and the noise signals, a voice signal for each extracted feature, and then set the values of these thresholds compare with the values to achieve the endpoint detection purposes, This method is simple, it convenient operation, it is widely used, the main in this paper is based on the method of threshold method. Another method is based on the method of pattern recognition , it needs to estimate the speech signal and the noise signal model parameters were detected. Because is based on the method of pattern recognition and high self-complexity, a large amount of computation, so it is difficult to be use in real-time voice signal system for people.The Endpoint detection is take a very important position in the speech recognition, it directly affects the performance of the system. In this article first domain analysis in simple speech signal time, than dual threshold algorithm, cepstrum algorithm, spectral entropy algorithm for endpoint detection, and these types of endpoint detection algorithms, and experimental analysis points. Firstly, the algorithm were used to the original speech signal detection, and the algorithm to analyze and compare results. Secondly, the speech signal and then adding noise, SNR values for different endpoint detection, analysis and comparison of various algorithms under different SNR endpoint detection results, experimental results show that the spectral entropy of speech endpoint detectionIIalgorithm results better than the other two methods.Keywords voice activity detection;Signal processing; Average energy use of short-term and short-time average zero-crossing rat; cepstrum; spectral entropyIII毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。
• 28•语音端点检测是语音信号处理的一个重要环节。
在低信噪比的情况下,传统的能零比端点检测的方法正确率很低。
本文提出了基于EMD 和能零比的语音端点检测算法,它结合语音增强技术,利用EMD 分解特性,求出能零比参数,设置自适应检测阈值,实现了在低信噪比环境下的语音端点检测。
仿真实验结果表明该方法在低信噪比情况下能够提高检测的正确率和稳定性。
语音端点检测是语音信号处理中的一个非常重要的环节。
语音端点检测算法主要分为两大类:模型匹配端点检测和特征参数端点检测。
模型匹配端点检测如基于隐马尔科夫模型等,该类型检测算法过程复杂,运算量大,因此应用与发展受到了限制。
特征参数端点检测主要是根据语音信号的时域特征和频域特征,该算法简单,运算量小,但在低信噪比的情况下检测误判率高。
美籍华人N.E.H u a n g 在1998年提出了经验模态分解方法(Empirical Mode Decomposition ,EMD)。
该算法能够很好的适应于语音这种常见的非线性非平稳信号。
本文提出了基于EMD 和能零比的语音端点检测算法。
研究表明,该方法在低信噪比情况下能够提高语音端点检测的正确率和稳定性。
1 基于EMD和能零比的语音端点检测算法基于EMD 和能零比的语音端点检测算法,首先对含有白噪声的语音数据进行语音增强,这里采用谱减法进行语音增强。
再将增强后的语音进行EMD 分解,由于含白噪声的语音信号的能量主要分布在第2-5层IMF 中,因此重构语音信号选择第2-5个IMF 分量。
对于重构后的语音信号进行分帧,求出每帧的过零率,同时对每帧再次EMD 分解,求出各阶IMF 的Teager 能量,并将各阶能量求和,构成特征参数能零比,最后自适应门限求解、判决。
1.1 语音增强当信噪比下降时,噪声的能量变大,使得语音端点检测正确率下降。
为了能有效检测较低信噪比的语音信号的端点,应用语音增强技术来提高语音的信噪比,改进语音质量。
基于小波能量熵的语音端点检测算法邱文武;蒋建中;郭军利【摘要】首先对语音信号进行小波变换,引入反映信号能量分布特性的小波熵,进行端点检测.并根据浊音的特点,改进了自然加权因子.仿真表明,在低信噪比条件下其检测效果要好于自适应子带谱熵法.%First, the wavelet transformation is used on vocal signals. Then the wavelet entropy reflecting energy distributing characteristics of the signal is introduced for detecting the point. Finally, the natural weighting factor is improved based on the characteristic of sonant sound. Simulation results indicate that the new algorithm outperforms the adaptive band-partitioning spectral entropy-voice activity detection (BSE-VAD) in detection result in condition of low signal-to-noise ratio.【期刊名称】《计算机应用与软件》【年(卷),期】2011(028)002【总页数】3页(P227-228,259)【关键词】端点检测;能量熵;小波能量;小波熵【作者】邱文武;蒋建中;郭军利【作者单位】解放军信息工程大学,河南,郑州,450002;解放军信息工程大学,河南,郑州,450002;解放军信息工程大学,河南,郑州,450002【正文语种】中文0 引言日常生活中,我们说话时都会受到周围环境的噪声干扰。
一种基于谱熵的语音端点检测方法李战明;尚丰【摘要】在低信噪比环境下,为了提高语音端点检测的效果,提出了一种适应于低信噪比环境的语音端点检测方法。
基于子带谱熵法,引入正参数对基本的谱熵法进行算法改进,得到改进后的子带谱熵法,通过增加预判环节选择合适的正参数,加犬语音信号与噪声信号的区分度,进一步改善在低信噪比环境下算法的效果,得到新的语音端点检测算法。
仿真实验表明,新的算法不仅快速高效,具有较强鲁棒性,而且适合在低信噪比环境中较准确的检测出语音端点。
【期刊名称】《电子技术与软件工程》【年(卷),期】2015(000)001【总页数】3页(P200-202)【关键词】语音端点检测;子带谱熵;参数可变鲁棒性【作者】李战明;尚丰【作者单位】兰州理工大学,甘肃省兰州市730050;;【正文语种】中文【中图分类】TN912.31 引言随着语音识别、语音增强等技术的飞速发展,端点检测越来越重要。
端点检测的目的是在复杂环境下识别出噪音信号与语音、噪音混合信号,确定语音信号的开始与结束端点,以便进一步的语音信号处理。
在助听器、手机等硬件环境下,由于实时性与准确性要求较高,计算量即不能过大以免硬件不能满足要求,又要求语音信号处理快速、准确。
准确的端点检测可以大幅度减少计算量,提高系统的语音处理效率。
现阶段运用的端点检测算法有短时能量与短时过零率双门限法、自相关函数法、方差法、谱距离法、能零比与能熵比等。
在噪音环境下这些方法的效果并不是很理想,语音信号的能量并不大,所以单纯用能量参数并不能很好的将语音信号检测出来。
Shen提出了一种基于信息熵的端点检测方法,信息熵只与语音信号的统计学特性有关,与单纯的能量幅值大小无关,所以这种方法能够较好地将语音信号与噪音信号检测出来,并且计算量不大,适用于助听器、手机等硬件环境。
但是对于周期性能量较为集中的噪音而言,误判率较高。
为了消除每帧信号FFT变换后的谱线幅值受噪音影响,把每条谱线的谱熵值改为子带的谱熵,从而改善在周期性噪音环境中端点检测的效果。
机器语音中的语音端点检测算法研究近年来,机器语音技术发展迅猛,已经逐渐渗透到我们日常生活的各个领域中。
例如语音交互、智能家居、语音识别等等领域中,机器语音的应用正在不断增多。
然而在机器语音技术的应用中,一个重要的问题就是语音的端点检测。
本文将围绕机器语音中的语音端点检测算法进行研究,分析其基本原理和现状。
一、语音端点检测的基本原理语音信号是一种时间序列信号,在应用中,我们需要找到有意义的语音部分而忽略掉无意义的部分,从而进行后续的处理。
语音端点检测就是将语音信号分割成有意义的部分和无意义的部分。
在语音信号中,一段连续的语音信号通常由语音信号模板(speech model)和音频背景模板(noise model)混合组成,语音端点检测算法的主要任务就是找到这些分割点。
通常,语音端点检测算法的流程包含以下几个步骤:1、特征提取 - 通过信号处理方法从音频信号中提取有代表性的特征。
特征通常是一些频率特征,用于区分语音信号和非语音信号。
2、特征处理 - 对提取到的特征进行处理,以便更好地区分语音信号和非语音信号。
3、检测算法 - 通过特定算法对特征进行分析和检测,以找出语音信号的起始和终止点。
二、语音端点检测算法的现状语音端点检测算法近年来已经取得了很好的进展,并且应用领域广泛。
在实际应用中,我们经常会面临源自噪音、强唱、机器干扰等各种各样的问题。
为了解决这些问题,研究人员提出了很多不同的语音端点检测算法。
1、基于能量方法的语音端点检测算法最简单的端点检测算法就是能量检测法。
这种检测法通过计算语音信号的平均功率、放大声音强度或计算总体能量等方式来达到分辨语音信号和噪音的效果。
不过,这种算法很容易出现误判。
2、基于短时帧能量的语音端点检测算法为了能够更准确地检测语音端点,研究人员提出了基于短时帧能量的方法。
这种方法分析语音信号中的每一帧并计算每帧的平均功率,根据信号幅值阈值来启动信号检测。
这种方法常用于识别口语较清晰的场景。
基于子带能熵比的语音端点检测算法
张毅;王可佳;席兵;颜博
【期刊名称】《计算机科学》
【年(卷),期】2017(044)005
【摘要】It is an important step of speech recognition process to identify accurately the speech endpoint.Under the environment with low SNR,in order to enhance the discrimination of noise better and improve the accuracy of speech endpoint detection system,this paper proposesd a new type of speech endpoint detection algorithm based on sub-band energy-entropy-ratio.The proposed algorithm takes the ratio of short-time sub-band energy and sub-band spectral entropy as an important parameter of endpoint detection,and sets the threshold to speech endpoint detection.Experiments show that the algorithm is fast and efficient,and it also has strong robustness and can detect the voice endpoint under lower SNR accurately.%准确地识别语音端点是语音识别过程中的一个重要步骤.在低信噪比环境下,为更好地增强语音和噪声的区分度,提高语音端点检测系统的准确率,在分析了常规子带谱熵端点检测算法的基础上结合子带能量,提出了一种基于子带能熵比的语音端点检测算法.该算法将子带能量和子带谱熵的比值作为端点检测的重要参数,以此设定阈值进行语音端点的检测.实验表明,该算法快速高效,具有较高的鲁棒性,在较低的信噪比环境下能准确地进行语音端点检测.
【总页数】5页(P304-307,319)
【作者】张毅;王可佳;席兵;颜博
【作者单位】重庆市信息无障碍与服务机器人工程技术研发中心重庆400065;重庆市信息无障碍与服务机器人工程技术研发中心重庆400065;重庆市信息无障碍与服务机器人工程技术研发中心重庆400065;重庆市信息无障碍与服务机器人工程技术研发中心重庆400065
【正文语种】中文
【中图分类】TP242.6
【相关文献】
1.基于EMD-Teager能量和子带谱熵法的语音端点检测 [J], 陈召全;刘美娟;章小兵;王晨
2.基于子带能量的语音端点检测算法的研究 [J], 朱明明;吴小培;罗雅琴
3.基于自适应子带功率谱熵的语音端点检测算法 [J], 李金宝;屈百达;徐宝国;周小祥
4.基于噪声估计的改进能量熵语音端点检测算法 [J], 蒋学仕
5.基于子带二次谱熵的语音端点检测 [J], 朱建伟;孙水发;但志平;雷帮军
因版权原因,仅展示原文概要,查看原文内容请购买。