基于感知掩蔽的重构非负矩阵分解单通道语音增强算法
- 格式:pdf
- 大小:1007.32 KB
- 文档页数:5
语音增强算法的分类现实环境中的噪声多种多样,特性各异,很难找到一种通用的语音增强算法适用于各种噪声的消除;同时语音增强算法与语音信号数字处理理论、人的听觉系统和语音学等学科紧密相关,这也促使人们必须根据不同的噪声源来选择不同的对策。
以上原因使语音增强技术研究呈现百花齐放的局面。
几十年来,许许多多的学者在这方面进行了不懈的努力,总结出了许多有效的方法。
根据信号输入的通道数,可将这些方法分为单通道的语音增强算法与多通道的语音增强算法。
单通道的语音系统在现实生活中较常见,手机、耳麦等都属于单通道语音系统。
这种情况下,语音与噪声同时存在于一个通道中,语音信号与噪声信号必须从同一个带噪语音中获得。
这种系统一般要求信号中的噪声比较平稳,以便在无声段对噪声进行估计,再依据估计得到的噪声参数对有声段进行处理,得到增强语音。
而多通道的语音系统中语音增强的一种算法是,利用各个通道的语音信号之间存在的某些相关性,对带噪语音信号进行处理,得到增强的语音。
比如,在自适应噪声抵消法中采用了两个话筒作为输入,其中一个采集带噪的语音信号,另外一个采集噪声,从噪声通道所采集的噪声直接当作带噪语音中的噪声,并将它从带噪语音中减去即可。
另一种多通道的语音增强算法是采用阵列信号,这种方法采用多个以一定方式排列的采集设备接收信号。
由于不同的独立信号源与各个采集设备之间的距离不同,最后在各个接收设备中的合成信号也不同,再根据这些信号将各个独立信号分离出来。
按照所依据原理的不同,我们可以将语音增强分为以下几类:(1)参数方法此类方法主要依赖于语音生成模型(例如AR模型)的使用,需要提取模型参数(如基音周期、LPC系数等),经常使用迭代方法。
这种方法的最大缺点就是如果实际噪声或语音与模型有较大的差别,或者由于某些原因使得提取语音参数较困难,则这方法较容易失败。
这类方法常用到一些滤波器,如梳状滤波器、维纳滤波器、卡尔曼滤波器等。
(2)非参数方法非参数方法不需要从带噪语音信号中估计语音模型参数,这就使得此类方法相对于参数方法而言应用较广。
盲源分离的若干算法及应用研究盲源分离的若干算法及应用研究导言盲源分离(Blind Source Separation,简称BSS)指的是在没有任何先验信息的情况下,对于被混合的源信号进行分离和恢复的技术。
随着数字信号处理和机器学习的发展,盲源分离已经在语音信号处理、图像处理和时间序列分析等领域得到广泛应用。
本文将介绍盲源分离的若干算法及其在不同领域的应用研究。
一、独立成分分析(Independent Component Analysis,简称ICA)独立成分分析是盲源分离中广泛使用的一种方法。
它基于统计原理,通过寻找源信号之间的独立性,将混合信号分离成多个独立的成分。
ICA可以用于语音信号去混叠、生物医学图像处理等领域,并且在脑机接口、医学诊断等方面也有重要应用。
二、非负矩阵分解(Nonnegative Matrix Factorization,简称NMF)非负矩阵分解是一种常用的盲源分离方法,适用于信号的非负性特点。
NMF将一个非负矩阵分解为两个非负矩阵的乘积,其中一个矩阵表示源信号,另一个矩阵表示混合系数。
NMF在图像处理、音频处理和社交网络分析等领域有广泛应用,如图像的特征提取、音频的降噪和信号的压缩表示等。
三、小波变换(Wavelet Transform)小波变换是一种时间-频率分析方法,在盲源分离中也被广泛应用。
小波变换通过在时间和频率上的变化来分析信号,从而实现对源信号的分离。
小波变换在信号处理领域具有广泛的应用,如图像压缩、音频压缩和图像去噪等。
四、神经网络方法神经网络方法是近年来兴起的一种盲源分离方法,利用神经网络的强大学习能力对混合信号进行分离。
神经网络方法可以通过训练来自动学习源信号的分布,并实现对混合信号的分离。
这种方法不依赖于任何先验信息,适用于多源信号分离、语音增强和图像去噪等领域。
应用研究1. 语音信号处理盲源分离在语音信号处理中有着广泛的应用。
通过对麦克风获取的混合信号进行盲源分离,我们可以实现对多种语音信号的分离和识别。
非负矩阵分解语音信号
非负矩阵分解(Non-negative matrix factorization, NMF)是一种常用的矩阵分解方法。
在语音信号处理领域,NMF被广泛用于语音信号的降维和压缩表示。
具体而言,NMF将语音信号表示为非负的基向量和系数矩阵的乘积形式,即将语音信号分解为若干个基向量的线性组合。
这种表示方法可以有效地降低语音信号的复杂度,提高信号的可压缩性和可维护性。
NMF方法在语音信号处理领域的应用有很多,例如语音信号的分类、识别、分解、去除等。
其中,语音信号的分解是NMF应用最为广泛的领域之一。
在语音信号分解中,NMF可以将语音信号的谱表示分解为若干个基向量的线性组合,其中每个基向量代表一个语音信号的特征或者语音信号的子带。
这种分解方法可以有效地提取语音信号的特征,减少冗余信息,从而实现对语音信号的分析和重构。
在语音信号处理领域,NMF的应用还包括语音信号的压缩表示、语音信号的降噪、语音信号的增强、语音信号的合成等。
中文文献中对NMF在语音信号处理中的应用研究也很多,在日常生活和工业生产中具有较广泛的应用价值。
基于非平滑非负矩阵分解语音增强王波;于凤芹;陈莹【摘要】针对非负矩阵分解稀疏性不够,通过引入平滑矩阵调节字典矩阵和系数矩阵的稀疏性,提出基于非平滑非负矩阵分解语音增强算法.算法通过语音和噪声的先验字典学习构造联合字典矩阵;然后通过非平滑非负矩阵分解更新带噪语音在联合字典矩阵下的投影系数实现语音增强;同时通过滑动窗口法实时更新先验噪声字典.仿真结果表明,该算法相对非负矩阵分解语音增强算法和MMSE算法具有更好的抑制噪声能力.%In order to overcome the problem that nonnegative matrix sparse decomposition is not enough, this paper puts forward a speech enhancement algorithm, which based on the nonsmooth nonnegative matrix factorization, by introducing smoothing matrix adjustment dictionaries matrix and coefficient matrix sparsity. Firstly it constructs combined dictionary matrix through speech and noise prior dictionary learning, and then the speech is enhanced by the use of nonsmooth non-negative matrix decomposition to update the combined dictionary matrix projection coefficient of the noisy speech , and update the prior noise dictionary by sliding window. Simulation results show that the proposed algorithm has better ability to suppress the noise than the nonnegative matrix factorization speech enhancement algorithm and MMSE algorithm.【期刊名称】《计算机工程与应用》【年(卷),期】2017(053)007【总页数】5页(P160-164)【关键词】非平滑非负矩阵分解;稀疏性;语音增强【作者】王波;于凤芹;陈莹【作者单位】江南大学物联网工程学院,江苏无锡 214122;江南大学物联网工程学院,江苏无锡 214122;江南大学物联网工程学院,江苏无锡 214122【正文语种】中文【中图分类】TN911.73语音增强的主要目的是从各种不同的带噪语音信号中尽可能地提取纯净的原始信号,它是语音编码[1]、语音传输和语音识别[2]的基础。
ADMM稀疏非负矩阵分解语音增强算法胡永刚;张雄伟;邹霞;闵刚;张立伟;王健【摘要】提出一种基于交替方向乘子法的(Alternating Direction Method of Multipliers,ADMM)稀疏非负矩阵分解语音增强算法,该算法既能克服经典非负矩阵分解(Nonnegative Matrix Factorization,NMF)语音增强算法存在收敛速度慢、易陷入局部最优等问题,也能发挥ADMM分解矩阵具有的强稀疏性.算法分为训练和增强两个阶段:训练时,采用基于ADMM非负矩阵分解算法对噪声频谱进行训练,提取噪声字典,保存其作为增强阶段的先验信息;增强时,通过稀疏非负矩阵分解算法,从带噪语音频谱中对语音字典和语音编码进行估计,重构原始干净的语音,实现语音增强.实验表明,该算法速度更快,增强后语音的失真更小,尤其在瞬时噪声环境下效果显著.%This paper proposes a speech enhancement algorithm putting the theory of Alternating Direction Method of Multipliers(ADMM)into the algorithm of sparse nonnegative matrix factorization, which can solve the problems such as slow convergence and poor local optima in the traditional speech enhancement based Nonnegative Matrix Factoriza-tion(NMF). It mainly consists of a training stage and an enhancement stage. During the training stage, the dictionaries of the noise are constructed as the prior information by using the ADMM based nonnegative matrix factorization. In the enhancement stage, the spectrum of noisy speech is analyzed by the sparse nonnegative matrix factorization algorithm. After that, the noise dictionary is combined with iterative formulation to evaluate the speech dictionary and the coding matrix of speech. The clean part of the speech is finally reconstructed from the noisy speech.Compared with the traditional speech enhancement methods of NMF, extensive experiments indicate that this algorithm not only has faster speed but also gets better noise suppression performance especially under instantaneous noise environment.【期刊名称】《计算机工程与应用》【年(卷),期】2016(052)003【总页数】5页(P108-112)【关键词】语音增强;稀疏非负矩阵分解;交替方向乘子法【作者】胡永刚;张雄伟;邹霞;闵刚;张立伟;王健【作者单位】解放军理工大学指挥信息系统学院,南京 210007;解放军理工大学指挥信息系统学院,南京 210007;解放军理工大学指挥信息系统学院,南京 210007;解放军理工大学指挥信息系统学院,南京 210007;西安通信学院,西安 710106;解放军理工大学指挥信息系统学院,南京 210007;解放军九三七三厂【正文语种】中文【中图分类】TN912.3语音增强是指从被污染的语音中提取相对纯净的原始语音[1]。
基于压缩感知的自适应谱减法语音增强算法
于志文;朱琦
【期刊名称】《南京邮电大学学报(自然科学版)》
【年(卷),期】2015(035)002
【摘要】针对在压缩感知框架下,噪声的影响会被扩大这个问题,提出了一种新的基于压缩感知的语音增强算法.该方案利用压缩感知下的行阶梯观测矩阵能够保留大部分语音特性的特点,对观测序列进行谱减法消噪,再对得到的观测序列进行基于输入信噪比的自适应重构,最后通过低通滤波器对重构语音进行平滑滤波,除去高频成分.实验结果表明:提出的语音增强方法具有较强的抗噪能力,重构速度快,输出的信噪比高,鲁棒性能好.
【总页数】7页(P51-57)
【作者】于志文;朱琦
【作者单位】南京邮电大学通信与信息工程学院,江苏南京210003;南京邮电大学宽带无线通信与传感网技术教育部重点实验室,江苏南京210003
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.基于连续噪声谱估计的谱减法语音增强算法 [J], 严思伟;屈晓旭;娄景艺
2.基于小波分析与Boll改进谱减法的普米语语音增强算法 [J], 解雪琴;张天军;潘文林;王璐;和丽华;杨建香
3.基于多频带谱减法的老年人语音增强算法的研究 [J], 祁晓;赵连玉
4.一种基于谱减法的语音增强算法研究 [J], 刘雅琴;甘文丽
5.基于自适应滤波法与谱减法的语音增强的研究 [J], 王小标;王错;刘君
因版权原因,仅展示原文概要,查看原文内容请购买。
基于非因果先验信噪比估计的语音增强改进算法杨波;王新房【摘要】为提高MMSE-LSA语音增强算法在低信噪比下的语音增强效果,提出一种改进的MMSE-LSA算法.该算法采用非因果先验信噪比估计法来估计先验信噪比,并引入无语音概率的思想,对增益函数进行改进.实验结果表明,相比传统MMSE-LSA算法,改进算法能更好地抑制残留噪声,提高语音的信噪比,增强效果更好.%To improve the effect of MMSE-LSA speech enhancement algorithm at low signal-to-noise ratio(SNR), thisrnpaper proposes an improved MMSE-LSA algorithm, which uses noncausal estimation for a priori SNR, and introduces arnknowledge of speech absence probability so as to modify gain function from MMSE-LSA. Experimental results showrnthat the proposed algorithm is better than traditional MMSE-LSA algorithm in residual noise suppression and SNRrnimprovement.【期刊名称】《计算机系统应用》【年(卷),期】2012(021)007【总页数】4页(P200-202,176)【关键词】语音增强;非因果先验信噪比估计;无语音概率;增益函数【作者】杨波;王新房【作者单位】西安理工大学自动化与信息工程学院,西安710048;西安理工大学自动化与信息工程学院,西安710048【正文语种】中文语音信号在通信过程中不可避免地要受到环境以及传输信道的影响,导致音质恶化。