基于独立成分分析的双麦克阵列语音增强算法
- 格式:pdf
- 大小:632.56 KB
- 文档页数:5
1㊀文献参考格式:王义圆ꎬ张曦文ꎬ周贻能ꎬ等.基于麦克风阵列的语音增强与干扰抑制算法[J].电声技术ꎬ2018ꎬ42(2):1-5.WANGYYꎬZHANGXWꎬZHOUYNꎬetal.Speechenhancementandinterferencesuppressionalgorithmbasedonmicrophonearrays[J].Audioengineeringꎬ2018ꎬ42(2):1-5.中图分类号:TN912.35㊀㊀㊀㊀㊀文献标志码:A㊀㊀㊀㊀㊀DOI:10.16311/j.audioe.2018.02.001基于麦克风阵列的语音增强与干扰抑制算法王义圆ꎬ张曦文ꎬ周贻能ꎬ黄际彦(电子科技大学信息与通信工程学院ꎬ四川成都611731)摘要:麦克风阵列在语音信号处理领域有着非常广泛的应用ꎬ该文提出了一种基于麦克风阵列的语音增强与干扰抑制算法ꎬ即空频联合处理算法ꎮ首先利用延迟-求和波束形成技术分别对麦克风阵列接收信号中的语音信号和干扰信号进行波束形成ꎮ然后将时域上的两个波束形成输出转换到频域ꎬ在频域上构造加权系数ꎬ利用加权系数乘以频域上的语音信号ꎬ从而进一步实现滤除干扰信号以增强语音信号的目的ꎮ仿真结果表明ꎬ该文提出的算法可以有效地对语音信号进行增强并且抑制干扰信号ꎮ相对于纯空域方法ꎬ该文提出的空频联合处理方法可以更有效地增强语音信号和抑制干扰ꎮ关键词:波束形成ꎻ麦克风阵列ꎻ语音增强ꎻ空频联合ꎻ系数加权SpeechEnhancementandInterferenceSuppressionAlgorithmBasedonMicrophoneArraysWANGYiyuanꎬZHANGXiwenꎬZHOUYinengꎬHUANGJiyan(SchoolofInformationandCommunicationEngineeringꎬUniversityofElectronicScienceandTechnologyꎬChengdu611731ꎬChina)Abstract:Microphonearrayshaswideapplicationsintheareaofspeechsignalprocessing.Aspeechenhancementandin ̄terferencesuppressionalgorithmbasedonmicrophonearraysisproposed.Thatisspaceandfrequencyprocessingalgorithm.Firstlyꎬthespeechsignalandinterferencesignalinthereceivedsignalofmicrophonearraysarebeamformedbyusingthede ̄lay-sumbeamformingmethod.Thenꎬthetwobeamformingoutputsaretransformedfromthetimedomaintothefrequencydomain.Inthefrequencydomainꎬaweightingfunctionisconstructedwiththetwobeamformingoutputs.Finallyꎬinordertofiltertheinterferencesignalandenhancethespeechsignalꎬthespeechsignalismultipliedbyweightingfunctioninthefrequencydomain.Thesimulationresultsdemonstratethatꎬthealgorithmproposedinthispapercanenhancethespeechsig ̄nalandsuppresstheinterferencesignaleffectively.Comparingwithprocessingonlyinthespacedomainꎬthealgorithmpro ̄posedinthispapercanenhancespeechsignalmoreefficiently.Keywords:beamformingꎻmicrophonearraysꎻspeechenhancementꎻspaceandfrequencyprocessingꎻweightedcoefficient1㊀引言随着社会的快速发展ꎬ语音通信作为最直接㊁最有效的通信手段受到人们地广泛关注ꎬ人们对语音通信质量的要求也逐渐提高ꎮ在实际的语音通信环境中存在着各种各样的噪声干扰ꎬ这些干扰严重影响了语音通信的质量[1]ꎮ因此ꎬ为了提高语音通信的质量ꎬ语音增强技术一直是语音信号处理领域中的热点问题ꎮ语音增强是指从噪声背景中提取有用信号ꎬ抑制㊁降低噪声干扰的技术ꎬ即从带噪语音中提取尽可能纯净的原始语音信号[2]ꎮ麦克风阵列信号处理技术能够充分利用语音信号的空时信息ꎬ已经成为研究语音增强的热点所在[3-5]ꎮ目前常用的经典麦克风阵列语音增强方法2㊀包括固定波束形成㊁自适应波束形成㊁盲信号分离以及后置滤波等[6]ꎮ其中ꎬ固定波束形成算法最早由Flanagan[7]提出ꎬ是最经典的空域处理方法ꎬ也是其他方法的基础ꎬ该算法通过对各麦克风阵元接收到的信号进行时延补偿ꎬ使得各通道输出信号在某一方向上保持同步ꎬ并且在该方向的入射信号获得最大增益[8]ꎮ该方法相对简单并且易于实现ꎬ但对于干扰信号的屏蔽效果不是很好ꎮ如果只做波束形成ꎬ增强后的声源信号中仍然有干扰信号的存在ꎮ此外ꎬ当前的研究主要是基于纯空域处理技术ꎬ未利用到时频信息ꎬ性能受限ꎮ本文在固定波束形成技术的基础上做了改进ꎬ在频域上构造新的加权函数ꎬ提出了空域波束形成-频域加权的空频联合处理算法ꎬ从而进一步对干扰信号进行抑制ꎮ由于利用到频率信息ꎬ所提出的算法能够更有效的抑制干扰ꎮ2㊀传统的固定波束形成算法传统的波束形成可以描述为作用于传感器阵列输出的空间滤波器ꎬ构造特定的波束方向图ꎮ这种空间滤波过程可以分为两步:时间对齐和加权求和ꎮ以简单的延迟-相加波束形成为例ꎬ第一步首先根据每个麦克风阵元与参考点之间的到达时间差ꎬ对每个阵元信号进行相应的时移ꎮ第二步是将时移后的信号相加[9]ꎮ假设语音信号为xt()ꎬ其由M个窄带信号叠加而成ꎬ表达式可记为:xt()=ðMm=1xfmt()(1)式中:xfm=ut()cos2πfmt+v(t)[](2)式中ꎬxfm是以fm为中心频率的窄带信号ꎬut()为慢变化的幅度调制函数ꎬvt()为慢变化的相位调制函数ꎮ理想情况下ꎬ第i个麦克风ꎬ在时刻k的阵列输出可表示为:Xik()=αixk-t-τi()+nik()(3)式中ꎬxt()为源信号ꎬi=1ꎬ2ꎬ ꎬMꎬτi㊁αi㊁nik()分别为从声源到第i个麦克风的延迟㊁幅度衰减和干扰信号ꎮ对其进行采样ꎬ采样频率为fsꎬ采样点数为Nꎬ第n个采样点时刻的输出为:Xin()=αixnTs-t-τi()+ninTs()(4)式中ꎬTs=1/fsꎬn=1ꎬ2 Nꎮ假定阵元i的位置向量为:Ri=rxiꎬryiꎬrzi()(5)式中ꎬrxi=risinφicosθiꎬryi=risinφisinθiꎬrzi=ricosφiꎬi=1ꎬ2ꎬ ꎬMꎬφiꎬθi分别为阵元位置的俯仰角和水平角ꎮri=rxi2+ryi2+rzi2是阵元i和原点之间的几何距离ꎮ平面波从-r方向入射到阵列:r=sinφcosθꎬsinφsinθꎬcosφ()(6)式中ꎬφꎬθ为信号源的俯仰角和水平角ꎮ以原点为参考点ꎬ设该点接收信号为xt()ꎬ则阵元i接收到的信号相对于原点的时间延迟[10]为:τi=-rˑRi/c=-rxisinφcosθ+ryisinφsinθ+rzicosφ()c(7)式中ꎬc=340m/sꎮ根据以上求得的时间延迟对信号进行时移:Xaꎬin()=Xi(n+τi)(8)式中ꎬ下标 a 表示时间对齐后的阵元信号ꎮ将时移后的信号加权求和ꎬ得到波束形成的输出为:ZXn()=1MðMi=1Xaꎬin()(9)式中ꎬi=1ꎬ2ꎬ ꎬMꎮ㊀3㊀改进的空频联合处理算法在传统纯空域波束形成的基础上ꎬ本文提出了空频联合处理方法ꎮ空频联合处理算法框图如图1所示ꎬ即增加了频域上的加权处理ꎬ通过空频联合处理更加有效地对语音信号进行增强ꎮ本算法假设麦克风阵列位于声源的远场ꎬ如此可近似地认为收到的信号为平面波ꎮ声源信号和干扰信号的方向可以通过DOA[11-13]估计或其他测向方式获得ꎬ已知信号方向ꎮ3㊀图1㊀空频联合处理算法框图3.1㊀算法结构1)空域:延时-求和波束形成与上一部分介绍的传统固定波束形成相同ꎬ首先根据每一个麦克风与参考点之间的时延ꎬ对麦克风接收信号进行时移ꎬ使各路输出信号在某一方向上对齐ꎮ然后将时移后的信号相加ꎬ针对声源信号与干扰信号分别形成两个波束形成输出ꎮ2)频域:系数加权将两个波束形成后的输出从时域转换到频域并构造加权系数ꎬ利用加权系数乘以频域上的声源信号ꎬ进一步地消除干扰信号以增强声源信号ꎮ3.2㊀加权系数的构造空域上ꎬ利用延迟-相加波束形成算法ꎬ分别得到指向声源信号st()以及干扰信号It()的两个波束形成输出Zsn()㊁ZIn():Zsn()=1MðMi=1Saꎬin()(10)ZIn()=1MðMi=1Iaꎬin()(11)式中ꎬn=1ꎬ2 Nꎬ为时域采样点序号ꎮ对波束形成后的输出进行加窗分帧[14]:Zsꎬnm()=W(m)ZS(n+m)(12)ZIꎬnm()=W(m)ZI(n+m)(13)式中ꎬW(m)为窗函数ꎬn是帧序号ꎬm是帧同步的时间序号ꎬm=1ꎬ2 NꎬN为帧长ꎮ接着对分帧后的离散数据做短时傅里叶变换ꎬ定义角频率ω=2πkNꎬ1ɤkɤNꎬ则离散的短时傅里叶变换为:Ysꎬnej2πkN()=ðNm=1Zsꎬn(m)e-j2πkNm(14)YIꎬnej2πkN()=ðNm=1ZIꎬn(m)e-j2πkNm(15)构造系数Wn:Wn=Snej2πkN()Snej2πkN()+Inej2πkN()(16)式中ꎬn是帧序号ꎬSnej2πkN()㊁Inej2πkN()分别为声源信号和干扰信号一帧内的短时功率谱:Snej2πkN()=YSꎬnej2πkN() Y∗Sꎬnej2πkN()=YSꎬnej2πkN()2(17)Inej2πkN()=YIꎬnej2πkN() Y∗Iꎬnej2πkN()=YIꎬnej2πkN()2(18)由此ꎬ我们便构造出加权系数Wnꎬ从式(16)可以看出:频域上ꎬ对声源信号波束形成输出进行系数加权时ꎬ如果某一频率上声源信号中存在的干扰信号较大ꎬ权值系数Wn便会减小ꎬ从而该频率的声源信号在一定程度上被削减ꎻ干扰信号小的频点上的声源信号被保留ꎮ通过这种方法ꎬ频域上系数加权可以有效地抑制干扰信号ꎮ频域上系数加权后第n帧声源信号为:ZSꎬn(f)=wnˑYsꎬnej2πkN()(19)再将频域信号转换到时域ꎬ得到第n帧系数加权后的声源信号:ZSꎬn(m)=1NðNm=1ZS(f)ej2πkNm(20)式中ꎬm是帧同步的时间序号ꎬm=1ꎬ2ꎬ ꎬNꎬN为帧长ꎮ最后合成所有帧信号得到系数加权后的输出信号ꎮ4㊀麦克风阵列语音增强的评价标准采用以下两种标准来衡量算法性能ꎮ4.1㊀分段信噪比信噪比是衡量语音增强算法效果的常规方法ꎬ定义为信号和噪声能量比值的对数值ꎬ信噪比越大ꎬ表示语音质量越好ꎮ不过ꎬ由于整段语音信号是时变的ꎬ而噪声能量是均匀分布的ꎬ传统信噪比计算公式只能得到大致的信噪比ꎮ因此ꎬ为了了解语音信号的信噪比情况ꎬ定义了不同时段下的分段信噪比[15-16]为:SNR=1MðM-1m=010log10ðL-1l=0s2(l)s(l)-s(l)[]2éëêêùûúú(21)式(21)中ꎬL为帧长ꎬM为帧数ꎬ对于每帧算出的信噪比设置高低门限ꎬ分别为35dB和-10dBꎮ4㊀4.2㊀噪声抑制噪声抑制[17](NoiseReductionꎬNR)表征了算法对于噪声的抑制作用ꎬ定义为:NR=10log10ðN-1n=0vin(n)2ðN-1n=0vout(n)2æèçççöø÷÷÷(22)式中ꎬvin(n)ꎬvout(n)分别为输入和输出中的噪声信号ꎮNR越大ꎬ说明噪声抑制效果越好ꎮ5㊀仿真与分析仿真实验分别以长度为22s的语音信号sig ̄nal1.wav和signal2.wav作为声源ꎬ声源信号为sig ̄nal2.wavꎬsignal1.wav为干扰信号ꎮ仿真条件如下:麦克分阵列为4阵元均匀线阵ꎬ阵元间距为10cmꎬ声源信号与干扰信号位置分别为(-1.7ꎬ0.62ꎬ2.16)ꎬ(2.11ꎬ-0.77ꎬ2.68)ꎮ仿真结果如下ꎮ5.1㊀语谱图各形式下的语音语谱图如图2~图5所示ꎮ图2㊀纯净语音信号的频谱图图3㊀单麦克风接收信号的语谱图图4㊀波束形成后的语谱图图5㊀加权后的语谱图从图4可以看出ꎬ相比于图3所示的单麦克风信号语谱图ꎬ经过传统的固定波束形成方法后ꎬ信号的语谱图在很大程度上滤除了干扰信号ꎬ但仍有残存ꎻ对比图4和图5ꎬ经过本文方法频域上系数加权后ꎬ图5显示的语音信号的语谱图更干净㊁更接近图2所示的纯净语音信号ꎬ干扰信号被进一步抑制ꎮ5.2㊀分段信噪比不同情形下分段信噪比对比见表1ꎮ表1㊀不同情形下信噪比对比5㊀㊀㊀由上表可以看出ꎬ波束形成后的语音信号信噪比提高了5.19dBꎬ系数加权后的语音信号信噪比提高了6.97dBꎮ系数加权后相比于仅作波束形成信噪比提高了1.78dBꎮ由此可以看出ꎬ波束形成可以对语音进行增强ꎬ提高信噪比ꎮ而系数加权可以进一步地对干扰噪声进行滤波ꎬ从而提高信噪比ꎮ5.3㊀噪声抑制计算了仅做波束形成后信号的噪声抑制比为6.10dBꎬ而进一步系数加权后的噪声抑制比为7.72dBꎬ噪声抑制比提高了1.62dBꎮ由此可以看出ꎬ系数加权在波束形成的基础上更加有效地抑制了干扰噪声ꎮ6㊀结束语本文分析并提出了一种基于麦克风阵列的语音增强与干扰抑制算法ꎬ在波束形成之后增加了系数加权进一步滤除干扰信号ꎬ利用空频联合处理进行语音增强ꎮ仿真结果从语谱图上可以看出ꎬ波束形成后的输出信号一定程度上滤除了干扰信号ꎬ系数加权可以更加有效地提高信噪比ꎮ听音结果也显示系数加权后的语音质量相比较仅做波束形成有所提高ꎮ当然ꎬ分段信噪比的计算结果也表明系数加权对于信噪比的提高优于仅做波束形成ꎮ系数加权后对于干扰的抑制更加明显㊁有效ꎮ参考文献:[1]沈锁金ꎬ刘伟ꎬ高颖.语音增强算法的研究与实现[J].电声技术ꎬ2016ꎬ40(12):40-42.[2]张金虎.基于麦克风阵列的语音增强算法研究[D].兰州:兰州交通大学ꎬ2014.[3]于春和ꎬ苏龙.基于GSC与谱减法的麦克风阵列语音增强方法[J].沈阳航空航天大学学报ꎬ2015ꎬ32(05):80-85.[4]陈磊ꎬ江伟华ꎬ童峰ꎬ等.一种可跟踪移动声源方向的麦克风阵列语音增强算法[J].厦门大学学报:自然科学版ꎬ2015ꎬ54(04):551-555.[5]戴红霞ꎬ赵力.基于麦克风阵列的数字助听器语音增强技术[J].电子器件ꎬ2015ꎬ38(03):606-610.[6]武素芳.基于延迟-求和的麦克风阵列语音增强算法研究[D].西安电子科技大学ꎬ2010.[7]JLFLANAGAN.Computer-steeredmicrophonearraysforsoundtransductioninlargerooms[J].JournalofAcousticalSocietyofAmerican.1985ꎬ78(5):1508-1518.[8]丁猛.基于麦克风阵列的语音增强算法概述[J].大众科技ꎬ2011(03):29-30.[9]JACOBBꎬCHENJDꎬHUANGYT.麦克风阵列信号处理[M].邹霞ꎬ周彬ꎬ译.北京:国防工业出版社ꎬ2016:33-34.[10]白梅.宽带恒定束宽波束形成方法研究[D].电子科技大学ꎬ2008.[11]叶中付ꎬ罗大为ꎬ韦进强ꎬ等.相干信号波达方向估计技术综述[J].数据采集与处理ꎬ2017ꎬ32(02):258-265.[12]李声飞.一种改进MUSIC算法DOA估计的研究与FPGA实现[J].信息技术与信息化ꎬ2017(06):83-85.[13]田野ꎬ练秋生ꎬ徐鹤.基于稀疏信号重构的DOA和极化角度估计算法[J].电子学报ꎬ2016ꎬ44(07):1548-1554.[14]梁瑞宁ꎬ赵力ꎬ魏昕ꎬ等.语音信号处理[M].北京:机械工业出版社ꎬ2016:65-66.[15]王文杰.麦克风阵列语音增强技术研究[D].河北工业大学ꎬ2010.[16]徐宇卓ꎬ马建芬ꎬ张雪英.基于语音起始段检测语音可懂度客观评价方法[J].电子技术应用ꎬ2015ꎬ41(06):150-153.[17]郑家超.宽带波束形成麦克风阵列语音增强方法的研究[D].辽宁工业大学ꎬ2011.作者简介:㊀㊀王义圆(1993-)ꎬ女ꎬ硕士研究生ꎬ主要研究领域为雷达系统及信号处理ꎻ张曦文(1993-)ꎬ女ꎬ硕士研究生ꎬ主要研究领域为非合作目标无线定位ꎻ周贻能(1991-)ꎬ男ꎬ硕士研究生ꎬ主要研究领域为连续波雷达多目标信号处理ꎻ黄际彦(1981-)ꎬ男ꎬ硕士研究生导师ꎬ主要研究领域为阵列信号处理ꎮ责任编辑:徐弘涛收稿日期:2018-01-25。
语音信号处理中的麦克风阵列设计与信号增强算法研究第一章:介绍随着科技的进步和应用场景的不断拓展,语音信号处理在语音识别、语音合成、自然语言处理、语音通讯等方面的应用也越来越广泛。
麦克风阵列作为一种重要的语音采集设备,具备广泛的应用前景。
对麦克风阵列进行优化设计和信号增强算法的研究,对于提高语音识别和通讯质量具有重要意义。
本文就麦克风阵列的设计以及信号增强算法的研究进行探讨。
第二章:麦克风阵列设计2.1 麦克风阵列的原理和类型麦克风阵列是由多个麦克风按照一定的规律布置形成的,在语音信号采集时可达到降噪、抑制回声等效果。
麦克风阵列按照几何形状可以分为线性阵列、圆形阵列、矩形阵列等多种类型。
2.2 麦克风阵列的参数设计麦克风阵列的参数设计包括麦克风数目、麦克风的位置和间距等方面。
例如,麦克风距离的确定、错误安置麦克风可能导致降噪和定位错误等问题。
2.3 麦克风阵列的信号处理麦克风阵列采集来的信号需要进行信号处理,在这个过程中,需要考虑到语音增强、人声检测、信号分离、降噪、回声抑制等多方面问题。
第三章:信号增强算法研究3.1 基于卷积神经网络的语音增强算法研究卷积神经网络作为深度神经网络的一种,已经被广泛应用于音频和语音信号的处理。
基于卷积神经网络的语音增强算法,可以有效地处理语音信号的噪声,提高语音信号的识别准确率和可理解性。
3.2 基于小波变换的人声检测算法研究人声检测是基于语音增强的重要步骤,也是语音信号处理的难点之一。
基于小波变换的人声检测算法,通过消除语音信号的非人声成分,从而提取出更加纯净和准确的人声信号,进一步提高语音识别的准确率和可理解性。
3.3 基于矩阵分解的信号分离算法研究信号分离是语音增强的重要技术之一,也是语音信号处理的难题。
基于矩阵分解的信号分离算法,可以从多声源混合的语音信号中分离出单一语音信号,进一步提高语音信号识别和理解的准确率和可靠性。
3.4 基于小波变换和快速傅里叶变换的降噪算法研究噪声是语音信号处理中的重大问题,如何减少噪声对语音信号的干扰是语音增强的重要技术之一。
《基于麦克风阵列的语音增强研究》篇一一、引言随着智能设备的广泛应用,语音交互技术在日常生活与工作场景中逐渐成为关键的信息交互手段。
基于麦克风阵列的语音增强技术是语音处理领域中的一项重要技术,它能有效地改善声音质量、识别语音并抵抗外界噪音。
本文主要就基于麦克风阵列的语音增强技术进行深入的研究与探讨。
二、麦克风阵列的基本原理麦克风阵列是由多个麦克风组成的系统,通过捕捉声音在空间中的传播特性,对声音信号进行空间滤波和定位。
每个麦克风都能捕捉到声音信号,通过阵列处理算法,可以确定声音的来源方向和距离,从而对声音进行增强或抑制。
三、语音增强的需求与挑战随着语音交互技术的普及,语音增强的需求日益增长。
然而,实际环境中的声音信号常常被各种噪声干扰,影响了语音识别的准确度。
基于麦克风阵列的语音增强技术可以有效减少背景噪声的影响,提高语音质量。
但是,在实际应用中仍面临着诸多挑战,如多路径效应、反射干扰、噪音与语音的频谱重叠等。
四、基于麦克风阵列的语音增强技术研究针对上述挑战,研究者们已经开展了一系列关于基于麦克风阵列的语音增强技术研究。
这些研究主要围绕以下几个方面:1. 阵列信号处理算法:通过优化阵列信号处理算法,如波束形成、噪声抑制等,提高对声音信号的捕捉和识别能力。
2. 声源定位与追踪:利用麦克风阵列捕捉到的声音信号,结合声源定位算法,实现声源的实时定位与追踪。
3. 噪音抑制与回声消除:针对环境中的各种噪音和回声干扰,研究有效的抑制和消除方法,提高语音的清晰度。
4. 深度学习在语音增强中的应用:利用深度学习技术,如卷积神经网络、循环神经网络等,对麦克风阵列捕捉到的声音信号进行深度分析和处理,进一步提高语音增强的效果。
五、实验与结果分析为验证基于麦克风阵列的语音增强技术的效果,研究者们进行了大量的实验。
实验结果表明,通过优化阵列信号处理算法、声源定位与追踪、噪音抑制与回声消除等技术手段,可以有效提高语音识别的准确度。
基于双微阵列的语音增强算法毛维;曾庆宁;龙超【摘要】针对由两个微型麦克风阵列组成的双微阵列,提出一种改进GSC结构的双微阵列语音增强算法,通过在广义旁瓣抵消器的前端加一个基于迭代噪声功率谱估计的谱修正滤波器,在广义旁瓣抵消器的输出端使用调制域谱减法,对仍有噪声残留的含噪语音进行增强处理.实验结果表明,该算法在抑制背景噪声方面优于现有广义旁瓣抵消器算法,在语音质量方面得到了一定提升,为双微阵列语音增强算法更好应用于手机、助听器及人工耳蜗等方面提供了途径.【期刊名称】《计算机工程与设计》【年(卷),期】2018(039)008【总页数】5页(P2490-2494)【关键词】双微阵列;广义旁瓣抵消器;谱修正滤波器;调制域谱减法;语音质量【作者】毛维;曾庆宁;龙超【作者单位】桂林电子科技大学信息与通信学院,广西桂林541004;桂林电子科技大学信息与通信学院,广西桂林541004;桂林电子科技大学信息与通信学院,广西桂林541004【正文语种】中文【中图分类】TN912.350 引言在手机和助听器等设备中,由于受到周围各类复杂噪声的影响,导致语音质量的性能急剧恶化。
而语音增强算法是一种有效处理环境噪声并且获得较好语音质量的方式。
传统的单通道语音增强算法有:谱减[1]、维纳滤波[2,3]、最小均方误差估计[4]等,但是其在真实环境有一定的限制同时会带来音乐噪声和语音失真,而基于麦克风阵列的语音增强算法可以利用阵列信号的时空域信息来有效消除噪声信息。
常用的多通道语音增强方法有:波束形成技术和广义旁瓣抵消。
广义旁瓣抵消器[5](generalized sidelobe canceller,GSC)由Griffiths等提出,因其具有高性能和较低的计算量,在助听器和移动设备中得到了广泛的应用。
为了克服传统麦克风小阵列语音增强算法噪声抑制能力有限的问题,杨立春等[6]提出了一种基于相干性滤波器的广义旁瓣抵消器语音增强算法。
二维麦克风阵列语音增强算法研究的开题报告一、选题背景随着语音应用的广泛应用,语音增强技术的需求越来越大。
但是传统的单麦克风采集模式容易受到环境噪声的干扰和声源方向的限制,其在实际应用中的可靠性和效果存在局限性。
因此,基于麦克风阵列的语音增强技术成为了当前研究的热点方向之一。
二、选题意义二维麦克风阵列 (2D microphone array) 能够通过收集多个麦克风的信号来获得更准确的语音信息,具有很大的潜力。
然而,如何有效地利用麦克风阵列的信号,去除环境噪声和信号混叠等问题,仍然是当前的研究热点和难点。
因此,本文旨在研究二维麦克风阵列语音增强算法,探索如何更有效地利用多通道信号进行语音增强,提高语音信号的质量和可靠性。
三、研究内容本文研究的主要内容包括以下方面:1.二维麦克风阵列的构建和信号处理技术:介绍二维麦克风阵列的构成、基本原理以及信号处理技术,为后续的声源定位和语音增强打下基础。
2.声源定位算法:基于二维麦克风阵列的多通道信号,设计一种可靠的声源定位算法,确定语音信号的来源方向。
3.语音信号增强算法:基于多通道语音信号,设计一种有效的语音增强算法,去除环境噪声和信号混叠,提高语音信号质量。
4.实验验证:通过实际场景的采集和模拟数据的模拟,对所提出的算法进行验证和评估,验证其在不同情况下的可行性和有效性。
四、研究方法本文将采用以下研究方法:1.文献综述法:对二维麦克风阵列语音增强技术的发展历程、现状和研究方向进行全面分析,梳理出当前的研究热点和难点,并为后续研究提供参考。
2.实验法:通过实际场景的采集和模拟数据的模拟,对所提出的算法进行验证和评估,验证其在不同情况下的可行性和有效性。
3.算法设计法:根据二维麦克风阵列的信号处理技术,设计声源定位算法和语音增强算法,应用于语音增强任务。
五、预期成果本文的预期成果包括:1.设计并实现一种基于二维麦克风阵列的语音增强算法,能够去除环境噪声和信号混叠,提高语音信号质量。
一种微型双麦克风语音增强算法
曾庆宁;王红丽;龙超
【期刊名称】《现代电子技术》
【年(卷),期】2022(45)6
【摘要】语音增强的目的是尽可能地从带噪语音中提取纯净的原始语音。
传统的单麦克风语音增强算法在非平稳噪声、低信噪比等复杂情况下性能显著降低;而双麦克风因其可以抑制方向性噪声,整体降噪性能更好而得到广泛应用。
针对微型双麦克风,文中提出一种有效的语音增强算法。
该算法首先通过对两通道含噪语音信号进行差分运算来抑制方向噪声,然后采用基于语音活动检测的改进自适应噪声抵消算法进一步消除剩余噪声,再对畸变的语音信号进行恢复运算,最后使用对数最小均方误差算法进一步消除残留噪声。
在对畸变的语音信号进行恢复运算的过程中,提出一种时域恢复算法,得到比已有频域恢复算法更小的运算量和时延。
实验结果表明,文中所提算法能有效地抑制噪声,改善语音质量,其降噪效果良好而且易于实时实现。
【总页数】7页(P58-64)
【作者】曾庆宁;王红丽;龙超
【作者单位】桂林电子科技大学信息与通信学院
【正文语种】中文
【中图分类】TN912.3-34;TP912.35
【相关文献】
1.子带MCRASC-MGSC微型麦克风阵语音增强算法
2.一种新的语音和噪声活动检测算法及其在手机双麦克风消噪系统中的应用
3.一种可跟踪移动声源方向的麦克风阵列语音增强算法
4.一种基于麦克风阵列的宽带语音增强算法研究
5.双麦克风语音增强算法研究与实现
因版权原因,仅展示原文概要,查看原文内容请购买。
基于麦克风阵列的语音增强与干扰抑制算法王义圆;张曦文;周贻能;黄际彦【摘要】麦克风阵列在语音信号处理领域有着非常广泛的应用,该文提出了一种基于麦克风阵列的语音增强与干扰抑制算法,即空频联合处理算法.首先利用延迟-求和波束形成技术分别对麦克风阵列接收信号中的语音信号和干扰信号进行波束形成.然后将时域上的两个波束形成输出转换到频域,在频域上构造加权系数,利用加权系数乘以频域上的语音信号,从而进一步实现滤除干扰信号以增强语音信号的目的.仿真结果表明,该文提出的算法可以有效地对语音信号进行增强并且抑制干扰信号.相对于纯空域方法,该文提出的空频联合处理方法可以更有效地增强语音信号和抑制干扰.【期刊名称】《电声技术》【年(卷),期】2018(042)002【总页数】5页(P1-5)【关键词】波束形成;麦克风阵列;语音增强;空频联合;系数加权【作者】王义圆;张曦文;周贻能;黄际彦【作者单位】电子科技大学信息与通信工程学院,四川成都 611731;电子科技大学信息与通信工程学院,四川成都 611731;电子科技大学信息与通信工程学院,四川成都 611731;电子科技大学信息与通信工程学院,四川成都 611731【正文语种】中文【中图分类】TN912.351 引言随着社会的快速发展,语音通信作为最直接、最有效的通信手段受到人们地广泛关注,人们对语音通信质量的要求也逐渐提高。
在实际的语音通信环境中存在着各种各样的噪声干扰,这些干扰严重影响了语音通信的质量[1]。
因此,为了提高语音通信的质量,语音增强技术一直是语音信号处理领域中的热点问题。
语音增强是指从噪声背景中提取有用信号,抑制、降低噪声干扰的技术,即从带噪语音中提取尽可能纯净的原始语音信号[2]。
麦克风阵列信号处理技术能够充分利用语音信号的空时信息,已经成为研究语音增强的热点所在[3-5]。
目前常用的经典麦克风阵列语音增强方法包括固定波束形成、自适应波束形成、盲信号分离以及后置滤波等[6]。
多通道语音增强方法简介【摘要】由于多麦克风越来越多地部署到同一个设备上,基于双麦克风和麦克风阵列的多通道语音增强研究有了较大的应用价值。
介绍了自适应噪声对消法、FDM等双通道语音增强方法和波束形成、独立分量分析等麦克风阵列语音增强方法,对各个方法的原理、发展和优缺点进行了详细分析和总结,对多通道语音增强深入研究有一定帮助。
【关键词】语音增强;双通道;麦克风阵列;波束形成1.引言语音是人们通讯交流的主要方式之一。
我们生活的环境中不可避免地存在着噪声,混入噪声的语音会使人的听觉感受变得糟糕,甚至影响人对语音的理解。
在语音编码、语音识别、说话人识别等系统中,噪声也会严重影响应用的效果。
语音增强成为研究的一个问题,其模型如图1所示。
图1 语音增强模型按照采集信号的麦克风数量分类,语音增强方法可被分为单通道(single channel)、双通道(dual-channel)、麦克风阵列(microphone array)三种类型。
一般来说,麦克风越多,去噪的效果越好。
早期,大部分通信/录音终端都只配有一个麦克风,因此单通道语音增强吸引了大量研究者的目光,方法较为成熟。
但单通道方法的缺点是缺少参考信号,噪声估计难度大,增强效果受到限制。
近年来随着麦克风设备的小型化和成本的降低,双麦克风和麦克风阵列越来越多地被部署。
研究者的注意力也在从单通道语音增强向双通道和麦克风阵列语音增强转移,这里对已有的多通道语音增强算法作以简单介绍。
2.双通道语音增强方法在语音增强中,一个关键的问题就是获得噪声。
在单通道语音增强中,噪声是通过从带噪语音信号中估计得到的,估计算法较为复杂且估计噪声总是与真实噪声存在差异,这就限制了增强效果的提高。
为了获得真实噪声,简单的做法就是增加一个麦克风来采集噪声。
从带噪语音信号中减去采集噪声来得到语音信号,这种方法叫做自适应噪声对消法(ANC,adaptive noise canceling),是最原始的最简单的双通道语音增强算法。