基于谱减法的语音增强技术研究学士学位论文
- 格式:doc
- 大小:318.00 KB
- 文档页数:28
基于谱减法的语音增强技术研究摘要: 本文主要研究目的是增强语音质量,减少语音失真和提高其可懂度。
首先介绍了语音增强的发展状况及研究意义,详细对比分析了各种语音增强算法的优缺点,着重研究了语音增强的相关基本理论。
在以上研究分析的基础上,本文采用了谱减法进行语音增强,给出谱减法的基本原理和实现过程。
此外,本文采用语音激活检测(V AD)方法进行噪声估计。
整个算法用MATLAB进行模拟仿真,仿真结果表明,所提出的算法在去除背景噪声的同时,保证了较小的语音失真,主观测听效果也比较理想。
关键词:语音增强;谱减法;噪声估计;语音激活检测Study of Speech Enhancement Technology Based on Spectral Subtraction Abstract: The purpose of this paper is to improve speech quality, to reduce speech distortion, and improve speech intelligibility. We first introduce the development and significance of speech enhancement, and give a detailed comparison of various speech enhancement algorithms. Especially, we study the basic theories of speech enhancement. Then, on the analysis above, we use spectral subtraction to improve speech quality, and also introduce basic principle of spectral subtraction. Furthermore, we adopt the noise estimator based on V oice Activity Detection (V AD) to estimate noise. In the experiment of this paper, the speech enhancement algorithm is implemented on computer with MATLAB. The simulation result indicates that the algorithm can eliminate noise very well, ensure the smaller voice distortion and also more pleasant to a human listener.Key words: speech enhancement; spectral subtraction; noise estimation; V AD目录第1章绪论 (1)1.1 课题研究背景 (1)1.2 语音增强的历史和发展现状 (2)1.3 本文主要研究内容 (4)第2章语音增强的理论基础 (6)2.1 人耳感知特性 (6)2.2 语音特性分析 (6)2.3 噪声分类及其特性 (7)2.4 语音信号的短时处理 (8)2.4.1 语音信号预处理 (8)2.4.2 语音信号加窗分帧 (9)2.4.3 语音信号的短时傅立叶变换 (9)2.5 语音增强性能 (10)2.5.1 语音质量的主观评价 (10)2.5.2 语音质量的客观评价 (11)第3章基于谱减法的语音增强技术 (13)3.1 谱减法的基本原理 (13)3.2 谱减法建立的假设 (15)3.3 “音乐噪声”的产生 (16)3.4 语音端点检测技术 (16)3.5 基于谱减法的语音增强算法流程 (18)3.6 实验结果与分析 (19)第4章结论 (22)4.1 致谢 (23)4.2参考文献 (24)第1章绪论1.1 课题研究背景人们在语音通信过程中不可避免地会受到来自周围环境、传输媒介引入的噪声、通信设备内部电噪声乃至其他讲话者的干扰。
一种基于谱减法的语音增强算法研究引言在日常生活中,我们经常会遇到语音信号受到噪声干扰的情形。
语音增强技术可以消除这些噪声,提高语音信号的质量和可听性。
语音增强技术的研究和发展,对于语音通信、语音识别、语音合成等领域都具有重要意义。
目前,基于谱减法的语音增强算法成为研究的热点之一。
本文主要探讨谱减法的基本原理、实现过程及其在语音增强中的应用。
一、谱减法的原理谱减法是一种在频域上处理语音信号的方法,它主要基于以下两个假设:1.噪声信号的能量分布比语音信号的能量分布更广泛,即噪声信号在不同频率上具有不同的能量;2.声音信号的一些部分不依赖于噪声信号,可以在不改变语音信号质量的前提下被减少。
因此,谱减法的基本原理是将语音信号和噪声信号分解为频谱,然后通过频谱相减,再对结果进行逆变换,得到增强后的语音信号。
谱减法的基本步骤如下:1.采集语音信号和噪声信号,并将它们通过FFT 变换转换为频域。
2.对语音信号和噪声信号的频谱进行平滑滤波,获得平滑后的信号谱。
3.求出平滑后语音信号与噪声信号的频谱差值。
4.根据信噪比的大小,确定噪声频谱可以减去的大小,从而减少噪声的影响。
5.对减少了噪声频谱的信号进行IFFT 逆变换,得到增强后的语音信号。
二、谱减法的实现过程1.采集语音信号和噪声信号在采集语音信号和噪声信号时,应尽可能选择质量好的麦克风和录音设备,保证信号的清晰度,避免信号本身存在的噪声干扰。
2.对语音信号和噪声信号的频谱进行平滑滤波平滑滤波的目的是去除语音信号和噪声信号中的高频成分,使其更加平滑。
常用的平滑滤波方法包括:高斯平滑、中位数滤波和均值平滑等。
其中,高斯平滑在实际应用中最为常见。
高斯平滑的过程是:对于每一个频率上的振幅,计算它和周围几个点的平均值,通过利用高斯函数将这些平均值加权,最终得到平滑后的振幅谱。
3.求出平滑后语音信号与噪声信号的频谱差值经过平滑处理后,获得了平滑后的语音信号频谱和噪声信号频谱。
基于谱减法的语音增强及其DSP实现摘要语音总会受到外界噪声不同程度的干扰和影响,噪声不但降低了语音质量和可懂度,而且还将导致语音处理系统性能的急剧恶化。
语音增强技术可以用来抑制噪声,提高抗噪声能力和输入信号的信噪比,改善语音质量、可懂度和系统的性能,并作为预处理或前端处理模块存在于语音处理系统中。
本论文首先从语音特性、噪声特性、人耳的感知特性以及语音信号分析得方法入手,重点研究了基于谱减法的增强算法并在MATLAB环境下对其进行了仿真,验证了谱减法在语音增强方面的有效性和可行性。
DSP(数字信号处理器)作为专用的数字信号处理芯片,具有在单机器周期内完成乘加运算、单机器周期内多次访问存储器以及丰富的片上外设等特点。
采用DSP进行语音信号处理代表未来语音信号处理的发展方向,在这种情况下,本文在研究谱减法的基础上,对算法进行了分析和实现,实现了基于DSP的语音信号采集与处理系统。
关键词:语音信号处理,语音增强,谱减法,DSPSPEECH ENHANCEMENT ALGORITHMS ANDIMPLEMENTATION ON DSPABSTRACTSpeech is inevitably interfered by noise. The noise not only degrades the quality and the intelligibility of speech, but also worsens the capability of the system. As speech enhancement technology can be used to reduce the noise, Improve anti-noise ability and the signal-to-noise ratio of the input signal , the input Signal-to-Noise Ratio of the speech processing system and improving the quality and intelligibility of speech, speech enhancement technology is usually used as the pre-processing module in the speech processing system.This paper first from speech characteristics, noise characteristics, the perception of the human ear characteristics and method of speech signal analysis, Focus on the based on the spectral subtraction enhancement algorithm and in the MATLAB environment of the simulation,Verify the spectral subtraction speech enhancement in the effectiveness and feasibility.DSP as special digital signal processor, has some unique features, such as Single-cycle multiply and accumulate (MAC),multiple accessing memories in single cycle,a wide variety of on-chip peripherals. These features lead DSP applied widely in digital speech processing field. This paper studies the traditional Spectral Subtraction and improves it to reduce “music noise”. Then based on these theories, a practical speech enhancement processing system on DSP is designed and implemented.KEY WORDS:Speech processing,Speech enhancement,Spectral Subtraction,DSP基于谱减法的语音增强及其DSP实现 (I)摘要 (I)ABSTRACT (II)第一章绪论 (1) (1) (2) (3)第二章语音增强的基础知识 (4) (4)人的听觉特性 (4)语音信号产生的数字模型 (5) (5) (5) (5) (6)、采样、A/D变换 (6) (6) (7) (7) (8) (8) (9) (9) (10)第三章谱减法的原理、算法及分析 (11) (11)谱减法的实现与仿真 (14) (16)第四章DSP介绍及基于DSP实时语音处理系统的设计 (17)DSP概述 (17)DSP芯片的基本结构 (17)DSP的运算速度 (19)DSP应用系统 (20) (21) (21) (21) (23)第五章基于谱减法的语音增强在DSP环境下的实现 (25) (25) (25)CCS (Code Composer Studio) DSP集成开发环境 (27) (27) (27) (29) (32) (32) (35)第六章结论与展望 (37) (37) (37)致谢 (38)参考文献 (39)附录外文文献 (39)第一章绪论当今世界正处在信息时代。
基于TEO能量谱减法的语音增强技术的研究崔兆国;周萍【摘要】Spectral subtraction is an efficient way to reduce noise interference and improve speech quality at present.In order to improve the de-noising performance of spectral subtraction,an improved spectral subtraction based on TEO (Teager energy operator)energy is pro-posed.It uses TEO energy to detect the voice activity in noisy speech in order to distinguish the noise segment and the voice segment and car-ries out spectral subtraction processing on them separately.In this way,the speech quality is guaranteed and the noise is removed as much as possible.The performance of the algorithm is tested in F16 fighter noise environment.Experiments show that this method can improve the out-put SNR and suppress the musical noise,it has a better speech enhancement effect as well.%谱减法是目前减少噪声干扰、提高语音质量的一种有效方法。
基于谱减法的语音增强技术研究摘要: 本文主要研究目的是增强语音质量,减少语音失真和提高其可懂度。
首先介绍了语音增强的发展状况及研究意义,详细对比分析了各种语音增强算法的优缺点,着重研究了语音增强的相关基本理论。
在以上研究分析的基础上,本文采用了谱减法进行语音增强,给出谱减法的基本原理和实现过程。
此外,本文采用语音激活检测(V AD)方法进行噪声估计。
整个算法用MATLAB进行模拟仿真,仿真结果表明,所提出的算法在去除背景噪声的同时,保证了较小的语音失真,主观测听效果也比较理想。
关键词:语音增强;谱减法;噪声估计;语音激活检测Study of Speech Enhancement Technology Based on Spectral Subtraction Abstract: The purpose of this paper is to improve speech quality, to reduce speech distortion, and improve speech intelligibility. We first introduce the development and significance of speech enhancement, and give a detailed comparison of various speech enhancement algorithms. Especially, we study the basic theories of speech enhancement. Then, on the analysis above, we use spectral subtraction to improve speech quality, and also introduce basic principle of spectral subtraction. Furthermore, we adopt the noise estimator based on V oice Activity Detection (V AD) to estimate noise. In the experiment of this paper, the speech enhancement algorithm is implemented on computer with MATLAB. The simulation result indicates that the algorithm can eliminate noise very well, ensure the smaller voice distortion and also more pleasant to a human listener.Key words: speech enhancement; spectral subtraction; noise estimation; V AD目录第1章绪论 (1)1.1 课题研究背景 (1)1.2 语音增强的历史和发展现状 (2)1.3 本文主要研究内容 (4)第2章语音增强的理论基础 (6)2.1 人耳感知特性 (6)2.2 语音特性分析 (6)2.3 噪声分类及其特性 (7)2.4 语音信号的短时处理 (8)2.4.1 语音信号预处理 (8)2.4.2 语音信号加窗分帧 (9)2.4.3 语音信号的短时傅立叶变换 (9)2.5 语音增强性能 (10)2.5.1 语音质量的主观评价 (10)2.5.2 语音质量的客观评价 (11)第3章基于谱减法的语音增强技术 (13)3.1 谱减法的基本原理 (13)3.2 谱减法建立的假设 (15)3.3 “音乐噪声”的产生 (16)3.4 语音端点检测技术 (16)3.5 基于谱减法的语音增强算法流程 (18)3.6 实验结果与分析 (19)第4章结论 (22)4.1 致谢 (23)4.2参考文献 (24)第1章绪论1.1 课题研究背景人们在语音通信过程中不可避免地会受到来自周围环境、传输媒介引入的噪声、通信设备内部电噪声乃至其他讲话者的干扰。
这些干扰最终将使接收者接收到的语音已非纯净的原始语音信号,而是受噪声污染的带噪语音信号[1]。
例如,安装在汽车、飞机或舰船上的电话,街道、机场的公用电话,常受到很强背景噪声的干扰,严重影响通话质量。
又如,室内会议电话的交混回响随同语音广播到每个会议地点,影响收听效果。
再如深海潜水员在氦-氧面罩内讲话引起的失真,语言障碍残疾人的语音失真,有历史价值的旧唱片、旧录音带的噪声和失真等,都是带噪语音信号的例子。
环境噪声污染使许多语音处理系统的性能急剧恶化。
例如,语音识别[2]己取得重大进展,正在步入实用阶段。
但目前的识别系统大都是在安静环境中工作的,在噪声环境中尤其是强噪声环境,语音识别系统的识别率将受到严重影响。
低速率语音编码,特别是参数编码,也遇到类似问题。
由于语音生成模型是低速率参数编码的基础,当模型参数的提取受到混杂在语音中背景噪声严重干扰时,重建语音的质量将急剧恶化,甚至变得完全不可懂。
在上述情况下,语音增强作为一种预处理手段,不失为解决噪声污染的一种有效途径。
在实际需求的推动下,早在上个世纪60年代语音增强这个研究课题就引起人们的注意,此后40多年人们一直锲而不舍地进行这方面的研究。
随着数字信号处理理论的成熟,70年代曾形成一个理论研究高潮,取得了一些基础性成果,并使语音增强发展成为语音信号处理的一个重要分支。
进入80年代后,DSP(数字信号处理)技术的发展和成熟为语音增强的实时实现提供了可能。
语音增强不但与语音信号数字处理理论有关,而目涉及到人的听觉感知和语音学范畴。
再者,噪声的来源众多,随应用场合而异,它们的特性也各不相同。
即使在实验室仿真条件下,也难以找到一种通用的语音增强算法能适用于各种噪声环境,所以必须针对不同噪声,采用不同的语音增强对策。
目前,某些语音增强算法在实际应用中己经证明是有效的,它们大体上可分为四类[2]:噪声对消法、谐波增强法、基于参数估计的语音再合成法和基于语音短时谱估计的增强算法。
语音增强的一个主要目标是从带噪语音信号中提取尽可能纯净的原始语音。
然而,由于干扰通常都是随机的,从带噪语音中提取完全纯净的语音几乎不可能。
在这种情况下,语音增强的目的主要有两个:一是改进语音质量,消除背景噪音,使听者乐于接受,不感觉疲劳,这是一种主观度量;二是提高语音可懂度,这是一种客观度量。
这两个目的往往不能兼得。
目前有一些对低信噪比带噪语音进行语音增强的方法,可以显著地降低背景噪声,改进语音质量,但并不能提高语音的可懂度,甚至略有下降。
语音增强是语音信号处理的一个重要分支,该技术已广泛应用于无线电话、电话会议、场景录音和军事窃听等领域。
语音增强技术无论在日常生活中,还是在军事领域,或者在语音信号处理技术中都很有应用价值。
因此研究语音增强算法有很重要的实用价值。
1.2 语音增强的历史和发展现状语音增强方法的研究始于20世纪70年代中期,随着数字信号处理理论的成熟,语音增强发展成为语音信号处理领域的一个重要分支。
1978年,Lim和Oppenheim提出了语音增强的维纳滤波方法。
1979年,Boll提出了谱减方法来抑制噪声。
1980年,Maulay和Malpss提出了软判决噪声抑制方法。
1984年,Ephraim和Malah提出基于MMSE短时谱幅度估计的语音增强方法。
在近30年的研究中,各种语音增强方法不断被提出,奠定了语音增强理论的基础,并使之逐渐走向成熟。
近些年来,随着VLSI技术的发展和高速DSP 芯片的出现,使语音增强的实时实现成为可能。
语音增强方法逐步走向实用,同时新的语音增强方法又相继涌现,如基于小波变换的方法,基于人耳掩蔽效应的方法[3]等。
目前常用的语音增强算法分为如下几类[4]:基于谱减法的语音增强算法、基于小波分析的语音增强算法、基于卡尔曼滤波的语音增强算法、基于信号子空间的增强方法、基于听觉掩蔽效应的语音增强方法、基于独立分量分析的语音增强方法、基于神经网络的语音增强方法。
语音增强算法可从信号输入的通道数上分为单通道的语音增强算法与多通道的语音增强算法。
单通道语音系统在实际应用中较为常见,如电话,手机等。
这种情况下语音与噪声同时存在一个通道中,语音信息与噪声信息必须从同一个信号中得出。
一般这种语音系统要求噪声要比较平稳,以便在非语音段对噪声进行估计,再依据估计出来的噪声对带噪声的语音段进行处理。
如果语音系统是一个多通道的语音系统,各个通道之间存在着某些相关的特性,这些相关特性对语音增强的处理十分有利。
如在自适应噪声对消法的语音增强方法中,采用了两个话筒作为输入,一个采集带噪的语音信号,另一个用来采集噪声。
从噪声通道所采集的噪声直接当作带噪语音的噪声,并将它从带噪声语音信号中减去就可得到纯净的语音。
另一种多通道的语音增强算法是采用阵列信号,这种方法采用多个以一定方式排列的采集设备接收信号。
由于不同独立的信号源与各个采集设备之间的距离不同,最后在各个接收设备中的合成信号也会不同,再根据这些信号将各个独立信号分离出来。
有关多通道谱减法以及其他消除噪音方法不是本文重点,故不再提及,下面就只简单介绍一下单通道输入的语音增强算法。
1)谐波增强算法由于语音中的浊音具有明显的周期性,这种周期性反映到频域中则为一系列分别对应基频(基音)及其谐波的一个个峰值分量,这些频率分量占据了语音的大部分能量,我们自然可以利用这种周期性来进行语音增强。
这时可采用自适应梳状滤波器来提取基音及其谐波分量,抑制其他周期性噪声和非周期的宽带噪声。
由于语音是时变的,语音的基音周期也是不断变化的,能否准确地估计出基音周期以及能否及时跟踪基音变化,是这种基于谐波增强法的关键。
2) 基于短时谱估计的语音增强算法基于语音短时谱估计的增强方法种类繁多,如谱减法、维纳滤波法、最小均方误差法等。
这种方法力图获得语音信号频谱幅度的最优估计,是从观测序列中以最小均方误差准则估计语音信号正交展开系数的模值。
该类方法具有适应信噪比范围大、方法简单、易于实时处理等优点。
尽管该方法研究比较早,但仍具有很强的生命力,成为应用最广泛的语音增强方法。
3) 基于语音生成模型的增强算法语音的发声过程可以建模为一个线性时变滤波器,对于不同类型的语音采用不同的激励源,如对于浊音,激励源为周期与基音相同的周期性脉冲串;而对于清音,激励源为高斯白噪声。
在语音的生成模型中,应用最广泛的是全极点模型。
基于语音生成模型可以得到一系列语音增强方法,比如时变参数维纳滤波及卡尔曼滤波方法。