一种基于谱减的语音增强算法改进
- 格式:pdf
- 大小:421.02 KB
- 文档页数:2
改进谱减法语音增强研究屈晓旭;李朝辉;娄景艺【摘要】谱减法是语音增强算法中的常用算法.传统的谱减法使用直接判决法(DD)计算先验信噪比,会产生一帧的延时,不能有效滤除噪声,并且会引入"音乐噪声",影响通信效果.为了消除延时和"音乐噪声"带来的不良效果,在谱减法的基础上采用最小均方误差(MMSE)算法计算先验信噪比消除延时,并加汉明窗处理及半波整流,运用维纳滤波对带噪语音进行增强研究.结果表明,此谱减法改进算法消除了一帧的延时,并能有效滤除"音乐噪声",减小背景噪声带来的不良影响,且在主观听觉上增强了语音信号的质量,效果明显优于原始带噪语音信号.%Spectral subtraction is a commonly used algorithm in speech enhancement algorithms. Traditional spectral subtraction employs a direct decision method (DD) to compute the prior signal-to-noise ratio, and this would result in one-frame delay and couldn't filter out the noise effectively, and the introduction of"music noise" would also affect the communication effect. To eliminate the adverse effects brought about by the delay and"music noise", on the basis of spectral subtraction, the minimum mean square error (MMSE) algorithm is used to calculate the prior SNR (Signal-to-Noise Ratio), and with the addition of Hamming window and half-wave rectification, Wiener filtering is used to enhance the noisy speech. The experiment results indicate that the spectral subtraction algorithm could effectively eliminate the one-frame delay, filter out the"music noise", and reduce the adverse effects of background noise. Moreover, the quality of speech signal is enhanced onthe subjective hearing, and the effect is much better than that of original speech signal.【期刊名称】《通信技术》【年(卷),期】2017(050)009【总页数】4页(P1925-1928)【关键词】谱减法;MMSE;先验信噪比;半波整流;频谱修正;语谱图【作者】屈晓旭;李朝辉;娄景艺【作者单位】海军工程大学电子工程学院,湖北武汉 430033;海军工程大学电子工程学院,湖北武汉 430033;海军工程大学电子工程学院,湖北武汉 430033【正文语种】中文【中图分类】TN927Abstract:Spectral subtraction is a commonly used algorithm in speech enhancement algorithms. Traditional spectral subtraction employs a direct decision method (DD) to compute the prior signal-to-noise ratio, and this would result in one-frame delay and couldn’t filte r out the noise effectively, and the introduction of“music noise” would also affect the communication effect. To eliminate the adverse effects brought about by the delay and “music noise”, on the basis of spectral subtraction, the minimum mean square error (MMSE)algorithm is used to calculate the prior SNR (Signal-to-Noise Ratio), and with the addition of Hamming window and half-wave rectification, Wiener filtering is used to enhance thenoisy speech. The experiment results indicate that the spectral subtraction algorithm could effectively eliminate the one-frame delay, filter out the “music noise”, and reduce the adverse effects of background noise. Moreover, the quality of speech signal is enhanced on the subjective hearing, and the effect is much better than that of original speech signal. Key words:spectral subtraction; MMSE; priori SNR; half-wave rectifier; spectral amendment; spectrogram语音是人类交流信息最直接、最便捷、最有效的手段。
声音信号的去噪与增强算法研究声音是我们日常生活中不可或缺的一部分,它承载着信息和情感。
然而,在现实生活中,我们常常会遇到各种噪音干扰,如交通噪音、机器噪音等,这些噪音会降低声音信号的质量,使得我们很难听清其中的内容。
为了解决这一问题,科学家们研究出了声音信号的去噪与增强算法。
声音信号的去噪算法主要有两种方法:基于频域的算法和基于时域的算法。
基于频域的算法是将声音信号转换成频谱图,然后通过滤波器去除噪音频率成分。
这种方法的优点是处理速度快,但是对于非线性噪音的去除效果不佳。
基于时域的算法则是通过分析声音信号的时域特征,如短时能量和短时平均幅度差等,来判断噪音和信号的差异,并进行去噪处理。
这种方法的优点是适用范围广,但是处理速度较慢。
在声音信号的增强算法中,常用的方法有谱减法、频率平滑和时域平滑等。
谱减法是一种通过减去噪音谱来增强信号的方法。
它的原理是通过计算信号和噪音的频谱差异,将差异较大的频率成分减去,从而提高信号的清晰度。
频率平滑是一种通过对信号的频谱进行平滑处理来增强信号的方法。
它的原理是通过对频谱进行平均滤波,减少频率成分的突变,从而提高信号的连续性。
时域平滑是一种通过对信号的时域波形进行平滑处理来增强信号的方法。
它的原理是通过对波形进行平均滤波,减少波形的起伏变化,从而提高信号的稳定性。
除了以上的算法,还有一些新颖的方法被提出来,如深度学习算法。
深度学习是一种模仿人脑神经网络结构的机器学习方法,它通过多层次的神经元网络来学习和提取特征。
在声音信号的去噪与增强领域,深度学习算法可以通过大量的训练数据来学习信号和噪音的特征,从而实现更准确的去噪和增强效果。
然而,深度学习算法需要大量的计算资源和训练时间,因此在实际应用中还需要进一步的研究和改进。
声音信号的去噪与增强算法在很多领域都有广泛的应用,如语音识别、音频处理和通信系统等。
在语音识别中,去噪算法可以提高语音识别的准确率,使得机器能够更好地理解和识别人类的语音指令。
基于GSC与谱减法的麦克风阵列语音增强方法于春和;苏龙【摘要】广义旁瓣抵消器(GSC)算法是目前广泛使用的一种麦克风阵列语音增强方法,但在自适应抵消模块中不可避免地存在语音抵消,且对非相干噪声的消噪能力很弱.针对GSC消噪能力弱,存在残留背景噪声的问题,提出了一种基于改进GSC与谱减法的麦克风语音增强方法.该方法改进了广义旁瓣抵消器结构中的自适应算法,将固定步长值变为可调步长值,避免了固定步长选择过大或过小带来的语音抵消或语音消噪不足的问题.后续与谱减法相结合,去除残留噪声获得更加纯净的语音.实验仿真表明,该方法可有效抑制残留背景噪声的影响,提高语音的性噪比及可懂度.【期刊名称】《沈阳航空航天大学学报》【年(卷),期】2015(032)005【总页数】6页(P80-85)【关键词】麦克风阵列;广义旁瓣抵消器;谱减法;语音增强【作者】于春和;苏龙【作者单位】沈阳航空航天大学电子信息工程学院,沈阳110136;沈阳航空航天大学电子信息工程学院,沈阳110136【正文语种】中文【中图分类】TP912.3在复杂的声学环境中,各种各样的干扰噪声会严重影响期望语音信号的获取,致使获得的语音信号不再是纯净的语音信号。
而如果干扰噪声太大,通过麦克风采集的信号往往模糊不清,影响了语音的可懂度。
采用单麦克风的语音增强系统也难以获得令人满意的增强效果,因此二十世纪八十年代麦克风阵列语音增强技术应运而生。
和单孤立麦克风增强方法相比,麦克风阵列利用了目标信号,噪声和干扰的空间信息,增强了期望方向的信号,抑制了其他方向的信号,所以能提供更好的增强效果[1]。
目前麦克风阵列语音增强方法大体上可以分为三类:固定波束形成算法、自适应波束形成算法和带后置滤波器的固定波束形成算法,当今主流还是以广义旁瓣抵消器的自适应波束形成算法为基础。
但是它存在着语音抵消与对非相干噪声抑制能力弱的问题[2-3],为此,许多学者提出了改进算法。
文献[4]提出了一种鲁棒自适应约束波束形成方法,来尽量减弱GSC自适应波束形成中的语音抵消。
语音信号处理中的降噪与增强技术研究语音信号处理是一个涉及声音、数字信号处理、数学、计算机等多方面知识的学科,其中降噪与增强技术是其中重要的研究领域。
本文将简要介绍语音信号降噪与增强技术的研究现状、常用方法及其在不同应用场景中的应用。
一、研究现状语音信号降噪与增强技术的研究可追溯至上世纪70年代,随着数字信号处理技术的不断发展,这一领域的研究也不断深入。
在降噪方面,常见的方法包括基于子空间的方法、基于谱减的方法、基于小波变换的方法、基于估计-最大化算法的方法等;在增强方面,主要包括基于语音模型的方法、基于信噪比优化的方法、基于深度学习的方法等。
现代语音信号处理技术的发展,促进了降噪与增强技术的广泛应用。
同时,人工智能、机器学习等技术的迅速发展也为语音信号处理领域提供了新的研究方向,使得降噪与增强算法的效果得到极大提升。
二、常用方法1. 基于子空间的方法子空间方法是一种基于正交分解技术的降噪方法,其基本思路是将语音信号和噪声信号表示为不同的子空间,并通过正交分解将噪声信号的影响从语音信号中分离出来。
常见的子空间方法包括PCA、KLT等。
其中,PCA方法通过计算信号的协方差矩阵,从中选取主成分来构造语音信号的子空间,从而实现降噪效果。
2. 基于谱减的方法谱减方法是降噪中最经典的一种方法,其基本思路是通过估计噪声信号的功率谱来得到语音信号和噪声信号的信号频域表现,并通过差集去除噪音成分。
该方法简单易懂,但噪声信号的估计比较困难,往往需要进行多次迭代来达到较好的效果。
3. 基于小波变换的方法小波变换是一种时频分析方法,其基本思路是将语音信号分解为不同的频带,对每个频带内的信号进行小波变换,然后根据其小波系数进行降噪处理。
该方法能够有效种除语音信号中的离散噪声,但对于连续噪声效果不好。
4. 基于估计-最大化算法的方法估计-最大化算法是一种流行的参数估计方法,在降噪中也有重要应用。
其基本思路是假设信号和噪声分别符合高斯分布,通过最大化高斯混合模型的似然函数,估计出信号和噪声的分布参数,进而利用参数推导出降噪结果。
语音增强模型总结语音增强模型总结语音增强是指在有噪声的语音信号中提取出用户所需信号的一种技术。
语音增强在语音识别、通信以及辅助听力方面具有广泛的应用。
而语音增强模型是语音增强技术中非常重要的一部分,本文对常见的语音增强模型进行总结和归纳。
一、基于频域的语音增强模型基于频域的语音增强模型主要是利用FFT、DFT等数学变换方法,将语音信号在频域分解为不同的分量,进而通过滤波的方式去除噪声。
代表模型有:基于谱减法的模型、基于语音分割技术的模型、基于噪声估计的模型等。
这些模型的优点是计算简单,易于实现。
但是,它们也存在一些缺点,如:抑制语音部分较强,难以处理信噪比变化范围很大的情况等。
二、基于时域的语音增强模型基于时域的语音增强模型主要是利用一些时域滤波器对语音信号进行处理。
主要代表模型有:Kalman滤波器、非线性滤波器、序列测量等。
这些模型的优点是对于低信噪比的情况有良好的效果,但是它们的计算量较大,实现难度较高。
三、基于深度学习的语音增强模型基于深度学习的语音增强模型能够自动学习特征,有效提取语音信号中有用的信息。
主要包括卷积神经网络(CNN)、循环神经网络(RNN)、深度自编码网络(DAE)等模型。
这些模型具有良好的性能,可以在不同的环境中提供较好的语音增强效果。
但是,它们需要大量的数据和计算资源,实际应用中的计算效率也存在一定的问题。
总的来说,基于深度学习的语音增强模型具有最佳的性能和应用效果。
但是,由于其需要大量的数据和计算资源,实现难度较大,还需要进一步研究和改进。
相比之下,基于时域的语音增强模型优点在于其对于低信噪比的情况有良好的效果,但缺点在于计算复杂度较高。
而基于频域的语音增强模型计算简单,容易实现,但也有其应用范围受到限制的问题。
综上所述,不同的语音增强模型具有各自的特点和优缺点,在实际应用中需要结合具体情况进行选择和使用。
未来,基于深度学习的语音增强模型将成为主流,但也需要进一步研究和改进。