麦克风阵列语音增强的研究(1)
- 格式:pdf
- 大小:386.38 KB
- 文档页数:5
1㊀文献参考格式:王义圆ꎬ张曦文ꎬ周贻能ꎬ等.基于麦克风阵列的语音增强与干扰抑制算法[J].电声技术ꎬ2018ꎬ42(2):1-5.WANGYYꎬZHANGXWꎬZHOUYNꎬetal.Speechenhancementandinterferencesuppressionalgorithmbasedonmicrophonearrays[J].Audioengineeringꎬ2018ꎬ42(2):1-5.中图分类号:TN912.35㊀㊀㊀㊀㊀文献标志码:A㊀㊀㊀㊀㊀DOI:10.16311/j.audioe.2018.02.001基于麦克风阵列的语音增强与干扰抑制算法王义圆ꎬ张曦文ꎬ周贻能ꎬ黄际彦(电子科技大学信息与通信工程学院ꎬ四川成都611731)摘要:麦克风阵列在语音信号处理领域有着非常广泛的应用ꎬ该文提出了一种基于麦克风阵列的语音增强与干扰抑制算法ꎬ即空频联合处理算法ꎮ首先利用延迟-求和波束形成技术分别对麦克风阵列接收信号中的语音信号和干扰信号进行波束形成ꎮ然后将时域上的两个波束形成输出转换到频域ꎬ在频域上构造加权系数ꎬ利用加权系数乘以频域上的语音信号ꎬ从而进一步实现滤除干扰信号以增强语音信号的目的ꎮ仿真结果表明ꎬ该文提出的算法可以有效地对语音信号进行增强并且抑制干扰信号ꎮ相对于纯空域方法ꎬ该文提出的空频联合处理方法可以更有效地增强语音信号和抑制干扰ꎮ关键词:波束形成ꎻ麦克风阵列ꎻ语音增强ꎻ空频联合ꎻ系数加权SpeechEnhancementandInterferenceSuppressionAlgorithmBasedonMicrophoneArraysWANGYiyuanꎬZHANGXiwenꎬZHOUYinengꎬHUANGJiyan(SchoolofInformationandCommunicationEngineeringꎬUniversityofElectronicScienceandTechnologyꎬChengdu611731ꎬChina)Abstract:Microphonearrayshaswideapplicationsintheareaofspeechsignalprocessing.Aspeechenhancementandin ̄terferencesuppressionalgorithmbasedonmicrophonearraysisproposed.Thatisspaceandfrequencyprocessingalgorithm.Firstlyꎬthespeechsignalandinterferencesignalinthereceivedsignalofmicrophonearraysarebeamformedbyusingthede ̄lay-sumbeamformingmethod.Thenꎬthetwobeamformingoutputsaretransformedfromthetimedomaintothefrequencydomain.Inthefrequencydomainꎬaweightingfunctionisconstructedwiththetwobeamformingoutputs.Finallyꎬinordertofiltertheinterferencesignalandenhancethespeechsignalꎬthespeechsignalismultipliedbyweightingfunctioninthefrequencydomain.Thesimulationresultsdemonstratethatꎬthealgorithmproposedinthispapercanenhancethespeechsig ̄nalandsuppresstheinterferencesignaleffectively.Comparingwithprocessingonlyinthespacedomainꎬthealgorithmpro ̄posedinthispapercanenhancespeechsignalmoreefficiently.Keywords:beamformingꎻmicrophonearraysꎻspeechenhancementꎻspaceandfrequencyprocessingꎻweightedcoefficient1㊀引言随着社会的快速发展ꎬ语音通信作为最直接㊁最有效的通信手段受到人们地广泛关注ꎬ人们对语音通信质量的要求也逐渐提高ꎮ在实际的语音通信环境中存在着各种各样的噪声干扰ꎬ这些干扰严重影响了语音通信的质量[1]ꎮ因此ꎬ为了提高语音通信的质量ꎬ语音增强技术一直是语音信号处理领域中的热点问题ꎮ语音增强是指从噪声背景中提取有用信号ꎬ抑制㊁降低噪声干扰的技术ꎬ即从带噪语音中提取尽可能纯净的原始语音信号[2]ꎮ麦克风阵列信号处理技术能够充分利用语音信号的空时信息ꎬ已经成为研究语音增强的热点所在[3-5]ꎮ目前常用的经典麦克风阵列语音增强方法2㊀包括固定波束形成㊁自适应波束形成㊁盲信号分离以及后置滤波等[6]ꎮ其中ꎬ固定波束形成算法最早由Flanagan[7]提出ꎬ是最经典的空域处理方法ꎬ也是其他方法的基础ꎬ该算法通过对各麦克风阵元接收到的信号进行时延补偿ꎬ使得各通道输出信号在某一方向上保持同步ꎬ并且在该方向的入射信号获得最大增益[8]ꎮ该方法相对简单并且易于实现ꎬ但对于干扰信号的屏蔽效果不是很好ꎮ如果只做波束形成ꎬ增强后的声源信号中仍然有干扰信号的存在ꎮ此外ꎬ当前的研究主要是基于纯空域处理技术ꎬ未利用到时频信息ꎬ性能受限ꎮ本文在固定波束形成技术的基础上做了改进ꎬ在频域上构造新的加权函数ꎬ提出了空域波束形成-频域加权的空频联合处理算法ꎬ从而进一步对干扰信号进行抑制ꎮ由于利用到频率信息ꎬ所提出的算法能够更有效的抑制干扰ꎮ2㊀传统的固定波束形成算法传统的波束形成可以描述为作用于传感器阵列输出的空间滤波器ꎬ构造特定的波束方向图ꎮ这种空间滤波过程可以分为两步:时间对齐和加权求和ꎮ以简单的延迟-相加波束形成为例ꎬ第一步首先根据每个麦克风阵元与参考点之间的到达时间差ꎬ对每个阵元信号进行相应的时移ꎮ第二步是将时移后的信号相加[9]ꎮ假设语音信号为xt()ꎬ其由M个窄带信号叠加而成ꎬ表达式可记为:xt()=ðMm=1xfmt()(1)式中:xfm=ut()cos2πfmt+v(t)[](2)式中ꎬxfm是以fm为中心频率的窄带信号ꎬut()为慢变化的幅度调制函数ꎬvt()为慢变化的相位调制函数ꎮ理想情况下ꎬ第i个麦克风ꎬ在时刻k的阵列输出可表示为:Xik()=αixk-t-τi()+nik()(3)式中ꎬxt()为源信号ꎬi=1ꎬ2ꎬ ꎬMꎬτi㊁αi㊁nik()分别为从声源到第i个麦克风的延迟㊁幅度衰减和干扰信号ꎮ对其进行采样ꎬ采样频率为fsꎬ采样点数为Nꎬ第n个采样点时刻的输出为:Xin()=αixnTs-t-τi()+ninTs()(4)式中ꎬTs=1/fsꎬn=1ꎬ2 Nꎮ假定阵元i的位置向量为:Ri=rxiꎬryiꎬrzi()(5)式中ꎬrxi=risinφicosθiꎬryi=risinφisinθiꎬrzi=ricosφiꎬi=1ꎬ2ꎬ ꎬMꎬφiꎬθi分别为阵元位置的俯仰角和水平角ꎮri=rxi2+ryi2+rzi2是阵元i和原点之间的几何距离ꎮ平面波从-r方向入射到阵列:r=sinφcosθꎬsinφsinθꎬcosφ()(6)式中ꎬφꎬθ为信号源的俯仰角和水平角ꎮ以原点为参考点ꎬ设该点接收信号为xt()ꎬ则阵元i接收到的信号相对于原点的时间延迟[10]为:τi=-rˑRi/c=-rxisinφcosθ+ryisinφsinθ+rzicosφ()c(7)式中ꎬc=340m/sꎮ根据以上求得的时间延迟对信号进行时移:Xaꎬin()=Xi(n+τi)(8)式中ꎬ下标 a 表示时间对齐后的阵元信号ꎮ将时移后的信号加权求和ꎬ得到波束形成的输出为:ZXn()=1MðMi=1Xaꎬin()(9)式中ꎬi=1ꎬ2ꎬ ꎬMꎮ㊀3㊀改进的空频联合处理算法在传统纯空域波束形成的基础上ꎬ本文提出了空频联合处理方法ꎮ空频联合处理算法框图如图1所示ꎬ即增加了频域上的加权处理ꎬ通过空频联合处理更加有效地对语音信号进行增强ꎮ本算法假设麦克风阵列位于声源的远场ꎬ如此可近似地认为收到的信号为平面波ꎮ声源信号和干扰信号的方向可以通过DOA[11-13]估计或其他测向方式获得ꎬ已知信号方向ꎮ3㊀图1㊀空频联合处理算法框图3.1㊀算法结构1)空域:延时-求和波束形成与上一部分介绍的传统固定波束形成相同ꎬ首先根据每一个麦克风与参考点之间的时延ꎬ对麦克风接收信号进行时移ꎬ使各路输出信号在某一方向上对齐ꎮ然后将时移后的信号相加ꎬ针对声源信号与干扰信号分别形成两个波束形成输出ꎮ2)频域:系数加权将两个波束形成后的输出从时域转换到频域并构造加权系数ꎬ利用加权系数乘以频域上的声源信号ꎬ进一步地消除干扰信号以增强声源信号ꎮ3.2㊀加权系数的构造空域上ꎬ利用延迟-相加波束形成算法ꎬ分别得到指向声源信号st()以及干扰信号It()的两个波束形成输出Zsn()㊁ZIn():Zsn()=1MðMi=1Saꎬin()(10)ZIn()=1MðMi=1Iaꎬin()(11)式中ꎬn=1ꎬ2 Nꎬ为时域采样点序号ꎮ对波束形成后的输出进行加窗分帧[14]:Zsꎬnm()=W(m)ZS(n+m)(12)ZIꎬnm()=W(m)ZI(n+m)(13)式中ꎬW(m)为窗函数ꎬn是帧序号ꎬm是帧同步的时间序号ꎬm=1ꎬ2 NꎬN为帧长ꎮ接着对分帧后的离散数据做短时傅里叶变换ꎬ定义角频率ω=2πkNꎬ1ɤkɤNꎬ则离散的短时傅里叶变换为:Ysꎬnej2πkN()=ðNm=1Zsꎬn(m)e-j2πkNm(14)YIꎬnej2πkN()=ðNm=1ZIꎬn(m)e-j2πkNm(15)构造系数Wn:Wn=Snej2πkN()Snej2πkN()+Inej2πkN()(16)式中ꎬn是帧序号ꎬSnej2πkN()㊁Inej2πkN()分别为声源信号和干扰信号一帧内的短时功率谱:Snej2πkN()=YSꎬnej2πkN() Y∗Sꎬnej2πkN()=YSꎬnej2πkN()2(17)Inej2πkN()=YIꎬnej2πkN() Y∗Iꎬnej2πkN()=YIꎬnej2πkN()2(18)由此ꎬ我们便构造出加权系数Wnꎬ从式(16)可以看出:频域上ꎬ对声源信号波束形成输出进行系数加权时ꎬ如果某一频率上声源信号中存在的干扰信号较大ꎬ权值系数Wn便会减小ꎬ从而该频率的声源信号在一定程度上被削减ꎻ干扰信号小的频点上的声源信号被保留ꎮ通过这种方法ꎬ频域上系数加权可以有效地抑制干扰信号ꎮ频域上系数加权后第n帧声源信号为:ZSꎬn(f)=wnˑYsꎬnej2πkN()(19)再将频域信号转换到时域ꎬ得到第n帧系数加权后的声源信号:ZSꎬn(m)=1NðNm=1ZS(f)ej2πkNm(20)式中ꎬm是帧同步的时间序号ꎬm=1ꎬ2ꎬ ꎬNꎬN为帧长ꎮ最后合成所有帧信号得到系数加权后的输出信号ꎮ4㊀麦克风阵列语音增强的评价标准采用以下两种标准来衡量算法性能ꎮ4.1㊀分段信噪比信噪比是衡量语音增强算法效果的常规方法ꎬ定义为信号和噪声能量比值的对数值ꎬ信噪比越大ꎬ表示语音质量越好ꎮ不过ꎬ由于整段语音信号是时变的ꎬ而噪声能量是均匀分布的ꎬ传统信噪比计算公式只能得到大致的信噪比ꎮ因此ꎬ为了了解语音信号的信噪比情况ꎬ定义了不同时段下的分段信噪比[15-16]为:SNR=1MðM-1m=010log10ðL-1l=0s2(l)s(l)-s(l)[]2éëêêùûúú(21)式(21)中ꎬL为帧长ꎬM为帧数ꎬ对于每帧算出的信噪比设置高低门限ꎬ分别为35dB和-10dBꎮ4㊀4.2㊀噪声抑制噪声抑制[17](NoiseReductionꎬNR)表征了算法对于噪声的抑制作用ꎬ定义为:NR=10log10ðN-1n=0vin(n)2ðN-1n=0vout(n)2æèçççöø÷÷÷(22)式中ꎬvin(n)ꎬvout(n)分别为输入和输出中的噪声信号ꎮNR越大ꎬ说明噪声抑制效果越好ꎮ5㊀仿真与分析仿真实验分别以长度为22s的语音信号sig ̄nal1.wav和signal2.wav作为声源ꎬ声源信号为sig ̄nal2.wavꎬsignal1.wav为干扰信号ꎮ仿真条件如下:麦克分阵列为4阵元均匀线阵ꎬ阵元间距为10cmꎬ声源信号与干扰信号位置分别为(-1.7ꎬ0.62ꎬ2.16)ꎬ(2.11ꎬ-0.77ꎬ2.68)ꎮ仿真结果如下ꎮ5.1㊀语谱图各形式下的语音语谱图如图2~图5所示ꎮ图2㊀纯净语音信号的频谱图图3㊀单麦克风接收信号的语谱图图4㊀波束形成后的语谱图图5㊀加权后的语谱图从图4可以看出ꎬ相比于图3所示的单麦克风信号语谱图ꎬ经过传统的固定波束形成方法后ꎬ信号的语谱图在很大程度上滤除了干扰信号ꎬ但仍有残存ꎻ对比图4和图5ꎬ经过本文方法频域上系数加权后ꎬ图5显示的语音信号的语谱图更干净㊁更接近图2所示的纯净语音信号ꎬ干扰信号被进一步抑制ꎮ5.2㊀分段信噪比不同情形下分段信噪比对比见表1ꎮ表1㊀不同情形下信噪比对比5㊀㊀㊀由上表可以看出ꎬ波束形成后的语音信号信噪比提高了5.19dBꎬ系数加权后的语音信号信噪比提高了6.97dBꎮ系数加权后相比于仅作波束形成信噪比提高了1.78dBꎮ由此可以看出ꎬ波束形成可以对语音进行增强ꎬ提高信噪比ꎮ而系数加权可以进一步地对干扰噪声进行滤波ꎬ从而提高信噪比ꎮ5.3㊀噪声抑制计算了仅做波束形成后信号的噪声抑制比为6.10dBꎬ而进一步系数加权后的噪声抑制比为7.72dBꎬ噪声抑制比提高了1.62dBꎮ由此可以看出ꎬ系数加权在波束形成的基础上更加有效地抑制了干扰噪声ꎮ6㊀结束语本文分析并提出了一种基于麦克风阵列的语音增强与干扰抑制算法ꎬ在波束形成之后增加了系数加权进一步滤除干扰信号ꎬ利用空频联合处理进行语音增强ꎮ仿真结果从语谱图上可以看出ꎬ波束形成后的输出信号一定程度上滤除了干扰信号ꎬ系数加权可以更加有效地提高信噪比ꎮ听音结果也显示系数加权后的语音质量相比较仅做波束形成有所提高ꎮ当然ꎬ分段信噪比的计算结果也表明系数加权对于信噪比的提高优于仅做波束形成ꎮ系数加权后对于干扰的抑制更加明显㊁有效ꎮ参考文献:[1]沈锁金ꎬ刘伟ꎬ高颖.语音增强算法的研究与实现[J].电声技术ꎬ2016ꎬ40(12):40-42.[2]张金虎.基于麦克风阵列的语音增强算法研究[D].兰州:兰州交通大学ꎬ2014.[3]于春和ꎬ苏龙.基于GSC与谱减法的麦克风阵列语音增强方法[J].沈阳航空航天大学学报ꎬ2015ꎬ32(05):80-85.[4]陈磊ꎬ江伟华ꎬ童峰ꎬ等.一种可跟踪移动声源方向的麦克风阵列语音增强算法[J].厦门大学学报:自然科学版ꎬ2015ꎬ54(04):551-555.[5]戴红霞ꎬ赵力.基于麦克风阵列的数字助听器语音增强技术[J].电子器件ꎬ2015ꎬ38(03):606-610.[6]武素芳.基于延迟-求和的麦克风阵列语音增强算法研究[D].西安电子科技大学ꎬ2010.[7]JLFLANAGAN.Computer-steeredmicrophonearraysforsoundtransductioninlargerooms[J].JournalofAcousticalSocietyofAmerican.1985ꎬ78(5):1508-1518.[8]丁猛.基于麦克风阵列的语音增强算法概述[J].大众科技ꎬ2011(03):29-30.[9]JACOBBꎬCHENJDꎬHUANGYT.麦克风阵列信号处理[M].邹霞ꎬ周彬ꎬ译.北京:国防工业出版社ꎬ2016:33-34.[10]白梅.宽带恒定束宽波束形成方法研究[D].电子科技大学ꎬ2008.[11]叶中付ꎬ罗大为ꎬ韦进强ꎬ等.相干信号波达方向估计技术综述[J].数据采集与处理ꎬ2017ꎬ32(02):258-265.[12]李声飞.一种改进MUSIC算法DOA估计的研究与FPGA实现[J].信息技术与信息化ꎬ2017(06):83-85.[13]田野ꎬ练秋生ꎬ徐鹤.基于稀疏信号重构的DOA和极化角度估计算法[J].电子学报ꎬ2016ꎬ44(07):1548-1554.[14]梁瑞宁ꎬ赵力ꎬ魏昕ꎬ等.语音信号处理[M].北京:机械工业出版社ꎬ2016:65-66.[15]王文杰.麦克风阵列语音增强技术研究[D].河北工业大学ꎬ2010.[16]徐宇卓ꎬ马建芬ꎬ张雪英.基于语音起始段检测语音可懂度客观评价方法[J].电子技术应用ꎬ2015ꎬ41(06):150-153.[17]郑家超.宽带波束形成麦克风阵列语音增强方法的研究[D].辽宁工业大学ꎬ2011.作者简介:㊀㊀王义圆(1993-)ꎬ女ꎬ硕士研究生ꎬ主要研究领域为雷达系统及信号处理ꎻ张曦文(1993-)ꎬ女ꎬ硕士研究生ꎬ主要研究领域为非合作目标无线定位ꎻ周贻能(1991-)ꎬ男ꎬ硕士研究生ꎬ主要研究领域为连续波雷达多目标信号处理ꎻ黄际彦(1981-)ꎬ男ꎬ硕士研究生导师ꎬ主要研究领域为阵列信号处理ꎮ责任编辑:徐弘涛收稿日期:2018-01-25。
基于语音传感器网络的语音增强的研究作者:刘力来源:《中小企业管理与科技·上中下旬刊》 2015年第10期刘力东北电力大学理学院吉林吉林132000摘要:对于传统单个麦克风阵列,一般来讲声源离麦克风阵列很远,造成采集到的信号信噪比很低,同时对整个空间的采样也是局部的。
进一步来讲由于一些便携设备如手机、平板电脑等设备物理尺寸大小有限,所以对单个麦克风阵列来讲,不可能安置很多麦克风来提高算法性能。
随着无线网络和嵌入式技术的发展,出现了无线语音传感器网络。
无线语音传感器网络是由一些单独的阵列节点,通过无线通信,任意组网而成。
由于使用无线通信技术,单个麦克风阵列大小的限制也就消失了。
位置没有意义,麦克风配置更加宽松。
因此能够对很大的区域进行观测和采样。
增加了更多的空间信息。
关键词:无线语音传感器网络;语音增强;无线1 语音传感器网络的研究现状基于语音传感器网络信号处理最早可以追溯到2001 年,Aarabi采用语音传感器网络基于时延进行了声源定位。
荷兰代尔夫特理工大学Richard C. Hendriks 教授在分布式麦克风阵列下,对语音可懂度的提高展开研究。
德国埃朗根国际语音研究实验中心的EmanuelA. P.Habets 教授使用相对早期语音传递函数在多个麦克风阵列存在的情况下,进行语音去噪展开研究。
国内的各大高校及科研院所也开展了相关的研究工作,并取得了一定的进展。
2 无线传感器网络的研究挑战无线传感器网络是一种分布式传感网络,它广泛应用于军事、智能交通、环境监控、医疗卫生等多个领域,涉及很多核心技术。
我们针对数据融合和数据管理技术在语音方面展开研究。
但是这里涉及很多研究问题,如麦克风阵列的时间起点不一样,涉及同步的问题。
阵列的方向矢量估计可能存在误差,因此有校正的问题。
麦克风本身电子电路,由于电子电路随着时间的使用,电子电路放大的倍数都不一样,产生不同的增益。
因此,需要考虑麦克风的配准问题。
面向语音识别的自适应麦克风阵列技术研究自适应麦克风阵列技术是一种用于语音信号处理的技术,它通过调整麦克风阵列的方向和信号增益,来削减来自非目标方向的噪声,在复杂噪声环境下提高语音信号的识别准确率。
目前,自适应麦克风阵列技术已经广泛应用于语音识别、智能手机等领域。
本文旨在介绍面向语音识别的自适应麦克风阵列技术的研究进展和未来发展趋势。
一、麦克风阵列技术原理麦克风阵列技术是基于声学特性的研究,通过麦克风阵列对声场进行采集,从而获取到目标信号和干扰噪声。
麦克风阵列是由多个麦克风组成的,按照一定的几何形状排列。
根据波束形成原理,当目标声源和干扰声源位于不同方向时,各个麦克风的相位和幅度不同,通过对各个麦克风的信号进行加权和相位调整,可以使目标声源的信号增强,干扰噪声信号减弱,从而提高声音的清晰度和辨识度。
在麦克风阵列技术中,主要有两种波束形成算法:波束形成和自适应波束形成。
波束形成算法是一种基于固定权系数矩阵的波束形成方法,它把各个麦克风信号进行加权平均,形成一个固定的波束方向。
这种方法简单可行,但缺点也比较明显,由于固定的权系数不适用于噪声情况的变化,因此会使得目标信号的增益被过多压缩,同时不能对噪声进行有效消除。
自适应波束形成算法是目前应用较多的一种波束形成方法,它可以根据实时的声学环境来自动地调整阵列麦克风的权值,从而使目标信号被增强,噪声被抑制。
自适应波束形成算法的核心是根据算法目标和误差方差,通过自适应的控制算法,不断调整权值。
二、自适应麦克风阵列技术在语音识别中的应用自适应麦克风阵列技术在语音识别领域具有重要作用。
语音识别系统的核心是对声音的模式识别,然而在复杂的环境中,各种噪声会干扰到语音信号的识别,因此精度就会受到极大的影响。
通过应用自适应麦克风阵列技术,能够有效地削减来自非目标方向的噪声,提高了语音信号的识别准确率和鲁棒性。
一个经典的示例是语音助手,比如苹果公司的Siri和亚马逊的Alexa,它们需要在嘈杂的环境下准确地识别用户语音指令,因此需要有效的阵列处理技术。
麦克风阵列信号处理技术研究麦克风是我们日常生活中经常接触到的设备之一,它们在电视、手机、电脑等产品中都有广泛的应用。
随着科技的不断发展,麦克风也在不断的升级和改进。
在这些改进中,麦克风阵列信号处理技术成为了研究的热点之一。
麦克风阵列信号处理技术,是指利用多个麦克风组成一个阵列,通过信号处理算法来分析获取到的声音信号,从而实现降噪、增强语音信号、改善声音方向等效果的技术。
这一技术被广泛应用在会议系统、声源定位、语音识别等领域。
麦克风阵列信号处理技术的优势在于,相比于单个麦克风,它可以获取到更多的声音信息。
同时,多个麦克风的信号可以通过信号处理算法进行协同处理,实现对语音信号的识别和提取。
此外,麦克风阵列技术还可以改善环境噪声,提高语音信号的清晰度。
对于麦克风阵列信号处理技术的研究,主要有以下几方面:一、阵列构建阵列构建是麦克风阵列信号处理技术的基础。
麦克风阵列的构建形式通常有线性、圆形、矩形等。
在构建阵列时,需要考虑麦克风数量、布局、间距以及方向等因素。
此外,不同的阵列构建形式会影响麦克风信号的唯象,因此需要在实验室环境下进行实验,找出最优的构建形式。
二、麦克风信号处理算法麦克风阵列信号处理技术的优秀在于信号处理算法。
不同的算法对信号处理的效果也不同。
在信号处理算法中,常用的有波束形成算法、最小方差无失真响应算法以及最大信噪比算法等。
其中,波束形成算法是阵列信号处理中最基础的处理算法,也是目前最热门的处理方式之一。
通过波束形成,可以实现从多个麦克风中提取出目标信号,使得语音信号更加清晰。
三、降噪和声源定位降噪和声源定位是麦克风阵列信号处理技术中最为关键的部分。
降噪的目标是把环境噪声从语音信号中去除,从而提高语音信号的信噪比。
最常用的环境噪声消除算法是最小均方误差法,目前市场上的很多语音识别设备都采用了这一技术。
声源定位是指通过麦克风阵列获取信号,在不需要人工操作的条件下,自动确定声源的位置。
声源定位需要进行时间延迟估计、数据融合、模型匹配等处理步骤。
二维麦克风阵列语音增强算法研究的开题报告一、选题背景随着语音应用的广泛应用,语音增强技术的需求越来越大。
但是传统的单麦克风采集模式容易受到环境噪声的干扰和声源方向的限制,其在实际应用中的可靠性和效果存在局限性。
因此,基于麦克风阵列的语音增强技术成为了当前研究的热点方向之一。
二、选题意义二维麦克风阵列 (2D microphone array) 能够通过收集多个麦克风的信号来获得更准确的语音信息,具有很大的潜力。
然而,如何有效地利用麦克风阵列的信号,去除环境噪声和信号混叠等问题,仍然是当前的研究热点和难点。
因此,本文旨在研究二维麦克风阵列语音增强算法,探索如何更有效地利用多通道信号进行语音增强,提高语音信号的质量和可靠性。
三、研究内容本文研究的主要内容包括以下方面:1.二维麦克风阵列的构建和信号处理技术:介绍二维麦克风阵列的构成、基本原理以及信号处理技术,为后续的声源定位和语音增强打下基础。
2.声源定位算法:基于二维麦克风阵列的多通道信号,设计一种可靠的声源定位算法,确定语音信号的来源方向。
3.语音信号增强算法:基于多通道语音信号,设计一种有效的语音增强算法,去除环境噪声和信号混叠,提高语音信号质量。
4.实验验证:通过实际场景的采集和模拟数据的模拟,对所提出的算法进行验证和评估,验证其在不同情况下的可行性和有效性。
四、研究方法本文将采用以下研究方法:1.文献综述法:对二维麦克风阵列语音增强技术的发展历程、现状和研究方向进行全面分析,梳理出当前的研究热点和难点,并为后续研究提供参考。
2.实验法:通过实际场景的采集和模拟数据的模拟,对所提出的算法进行验证和评估,验证其在不同情况下的可行性和有效性。
3.算法设计法:根据二维麦克风阵列的信号处理技术,设计声源定位算法和语音增强算法,应用于语音增强任务。
五、预期成果本文的预期成果包括:1.设计并实现一种基于二维麦克风阵列的语音增强算法,能够去除环境噪声和信号混叠,提高语音信号质量。
基于麦克风阵列的语音增强方法概述:在日常生活和工作中,语音通信是人与人之间互相传递信息沟通不可缺少的方式。
在语音通信中,语音信号不可避免地会受到来自周围环境和传输媒介的外部噪声、通信设备的内部噪声及其他讲话者的干扰。
这些干扰共同作用,最终使听者获得的是被噪声污染过的带噪声语音,严重影响了双方之间的交流。
应用阵列信号处理技术的麦克风阵列能够充分利用语音信号的空时信息,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,逐渐成为强噪声环境中语音增强的研究热点。
本文将介绍各种麦克风阵列语音增强方法,并总结各个方法的优劣。
最终得出更好的、能够去噪的基于麦克风阵列的语音增强方法。
1麦克风阵列麦克风阵列是将两个麦克风的信号耦合为一个信号。
在频率响应中也可以根据时域中波束形成与空间滤波器相仿的应用,分析出接收到语音信号音源的方向以及其变化。
采用该技术,能利用两个麦克风接收到声波的相位之间的差异对声波进行过滤,能最大限度将环境背景声音滤掉,只剩下需要的声波。
对于在嘈杂的环境下使用采用了这种配置的设备,在嘈杂的环境下能使听者听起来很清晰,没杂音。
2基于麦克风阵列的语音增强方法2.1基于自适应波束形成器的麦克风阵列语音增强自适应波束形成是现在广泛使用的一类麦克风阵列语音增强方法。
最早出现的自适应波束形成算法,其基本思想是在某方向有用信号的增益一定的前提下,使阵列输出信号的功率最小。
在线性约束最小方差自适应波束形成器的基础上,1982 年Griffiths 和Jim 提出了广义旁瓣消除器成为了许多算法的基本框架。
广义旁瓣消除器(GSC)的工作原理是带噪声的语音信号同时通过自适应通道和非自适应通道,自适应通道中的阻塞矩阵将有用信号滤除后产生仅包含多通道噪声参考信号,自适应滤波器根据这个参考信号得到噪声估计,最后由这个被估计的噪声抵消非自适应通道中的噪声分量,从而得到有用的纯净语音信号。
麦克风阵列的自适应算法通过迭代运算获取波束形成的最优权矢量时,噪声模型的估计是一个非常关键的因素。
2020年4月计算机工程与设计Apr.2020第41卷第4期COMPUTER ENGINEERING AND DESIGN Vol.41No.4基于麦克风阵列的语音增强算法闵新宇,王清理,冉云飞(中国航天科工集团第二研究院706所,北京100854)摘要:为解决现有语音增强算法需要麦克风数量较多和受估计误差影响较大的问题!提出一种改进的声源定位和波束形成方法。
在现有声源定位算法利用时间延迟的基础上!引入能量衰减参数!实现利用双麦克风进行声源定位的目标;在波束形成算法中引入加载系数,在出现协方差矩阵统计失配时仍可对期望方向聚焦!提高波束形成算法的鲁棒性。
仿真结果表明!改进后的算法与传统算法相比具有更强的鲁棒性。
关键词:语音增强;麦克风阵列;声源定位;波束形成;时延估计中图法分类号:TN912.35文献标识号:A文章编号:1000-7024(2020)04-1074-06doi:10.16208/j.issnl000-7024.2020.04.029Speech enhancement algorithm based on microphone arrayMIN Xin-yu,WANG Qing-li?RAN Yun-fei(Institute706,Second Academy of China Aerospace Science and Industry Corporation,Beijing100854,China) Abstract:To solve the problem that the existing speech enhancement algorithms need a large number of microphones and they aregreatlya f ectedbytheestimationerror,animprovedsoundsourcelocalizationandbeamformingmethodwasproposed\Based ontimedelay,energya t enuationparameterwasintroducedtorealizethetargetofsoundsourcelocalizationusingdoublemicro-phones.Loading coefficient was introduced to beamforming algorithm&which focused on the desired direction when the cova-riancematrixstatisticmismatchoccurred,e f ectivelyimprovingtherobustnessofbeamformingalgorithm\Thesimulationresults showthattheimprovedalgorithmismorerobustthanthetraditionalalgorithm\Key words:speech enhancement;microphone array;sound localization;beamforming#time delay estimation2引言为提高生产生活质量和效率,人们期望通过语音来发送指令和控制设备,但在实际使用环境中存在着各种各样的干扰,因此需要使用语音增强方法来滤除噪音,增强有效语音。
麦克风阵列论文:基于麦克风阵列的语音增强系统设计【中文摘要】语音增强的是去除语音信息中的噪声成分,它是语音信号处理领域中主要的研究内容之一。
然而,由于声源环境往往较为复杂,一般单一麦克风很难清晰的从环境中获取期望语音信号并进行增强处理。
因此,需要进行有效的噪声抑制,以增强语音信号的质量。
本文对基于麦克风阵列的语音增强算法进行研究,重点分析了时延估计和波束形成两种技术。
在时延估计方面,研究了相位变换加权的广义互相关时延估计算法性能,介绍了将广义互相关算法由双麦克风扩展应用至多麦克风的优化方法,给出了算法在0dB~10dB的信噪比下的性能分析。
在波束形成方面,研究了固定波束形成和自适应波束形成的算法性能,给出了不同麦克风阵列参数条件下的波束模式性能分析;并分析了在MVDR自适应波束形成算法中进行前置卡尔曼滤波的可行性,对卡尔曼滤波进行了仿真测试。
最后本文给出了完整的麦克风阵列系统设计,并对该系统的硬件和软件设计进行了论述,基于麦克风阵列的硬件电路具有功耗低、扩展性强等特点,可以较好的为麦克风阵列语音增强算法提供多通道语音信号。
【英文摘要】The main aim of speech enhancement is to pick up speechinformation from the speech signals with noise, in order to obtain highquality speech. But due to the existence of the noise diversity andenvironment reverberation, thespeech quality received by microphone isnot so good, which affects the speech intelligibility and the speechprocessing performance. So the effective noise suppression is necessaryto improve the speech signials quality.The work in this paper focuses on two key techniques based onmicrophone array: time delay estimation and beamforming. In the aspectof time delay estimation, the performance of phase transform weightedgeneralized cross correlation method is analyzed. Generalized crosscorrelation algorithm by dual microphones extended up to the multimicrophones is analysed. The performance analysis is given under0dB~10dB SNR. In the aspect of beamforming, an optimization method basedonKalman-filtering and MVDR adaptive beamforming isanalysed.Simulation shows the validity of this method. Finally, this paper presentsa viable microphone array speech enhancement system design. Theimplementation of the software and hardware of the system is dealt with in detail. Microphone array hardware circuit has low power consumptionand expansibility, which can provide multichannel speech signals.【关键词】麦克风阵列语音增强时延估计波束形成数字信号处理器【英文关键词】Microphone Array Speech Enhancement Timedelay estimation Beamforming DSP【目录】基于麦克风阵列的语音增强系统设计摘要4-5ABSTRACT5-6目录7-10Contents10-13第一章绪论13-17 1.1课题背景与研究意义13-14 1.2 麦克风阵列语音增强算法的发展和研究现状14-15 1.3 论文的研究内容和结构安排15-17第二章麦克风阵列时延估计技术研究17-29 2.1 引言17 2.2 麦克风阵列拓扑结构17-18 2.3 近场和远场声源模型18-20 2.4 广义互相关时延估计20-23 2.4.1 广义互相关算法基本原理20-21 2.4.2 PHAT 相位变换加权21-22 2.4.3 广义互相关算法扩展22-23 2.5 时延估计仿真分析23-27 2.6小结27-29第三章麦克风阵列波束形成技术研究29-49 3.1 引言29 3.2 传统波束形成技术29-33 3.2.1 固定波束形成29-30 3.2.2 自适应波束形成30-32 3.2.3 后置滤波波束形成32-33 3.3 前置卡尔曼滤波的 MVDR 波束形成33-37 3.3.1 整体原理框图说明33-34 3.3.2 卡尔曼滤波基本原理34-35 3.3.3 基于卡尔曼滤波的语音增强35-37 3.3.4 前置卡尔曼滤波的MVDR 波束形成算法性能分析37 3.4 波束形成仿真分析37-48 3.4.1 模型参数对固定波束形成的影响分析37-42 3.4.2 MVDR 波束形成性能分析42-44 3.4.3 卡尔曼滤波在波束形成前置处理的性能分析44-48 3.5 小结48-49第四章语音增强系统硬件设计49-59 4.1 引言49-50 4.2 硬件电路组成与性能指标50-51 4.3 硬件详细设计51-54 4.3.1 数字信号处理器选择51 4.3.2 多通道语音信号采集51-52 4.3.3 模拟放大电路设计52-53 4.3.4 AD73360 与 DSP 的传输时序设计53 4.3.5 工作电压选择与电源设计53-54 4.3.6 电路频率响应54 4.4 硬件电路主要构成器件54 4.5AD73360 与 DSP 的连接54-56 4.5.1 McBSP 数据传输方式54-55 4.5.2 SPI 模式下的电路连接55-56 4.6 DSP 接口设计与硬件方案56-58 4.6.1 系统时钟设计56-57 4.6.2 DSP 接口分配57 4.6.3 DSP 进行数据读取和数据处理的方案57-58 4.7 小结58-59第五章语音增强系统软件设计59-73 5.1 引言59-60 5.2 系统初始化60-65 5.2.1 C5509A 初始化60-61 5.2.2 McBSP 的 SPI 模式配置61-62 5.2.3 AD73360 配置62-64 5.2.4 USB 功能设计64-65 5.3 语音编码压缩原理与设计65-72 5.3.1 ADPCM 原理65-66 5.3.2 ADPCM 仿真分析66-71 5.3.3 ADPCM 在硬件上的设计71-72 5.4 小结72-73第六章结论与展望73-75 6.1 结论73 6.2 下一步研究工作73-75参考文献75-77致谢77-78研究成果及发表的学术论文78-79作者与导师简介79-80硕士研究生学位论文答辩委员会决议书80-81。
《基于麦克风阵列的声源定位技术研究》一、引言随着科技的不断发展,声源定位技术在众多领域中扮演着越来越重要的角色。
麦克风阵列技术作为声源定位的核心手段,通过多麦克风组合和信号处理,能够实现精准的声源定位。
本文旨在探讨基于麦克风阵列的声源定位技术的研究现状、方法以及未来发展趋势。
二、麦克风阵列技术概述麦克风阵列是由多个麦克风按照一定几何布局组成的系统,用于收集声波信号并进行分析处理。
通过合理布置麦克风,阵列可以有效地提高声源定位的精度和稳定性。
麦克风阵列技术主要分为波束形成、到达时间差(TDOA)估计、到达方向(DOA)估计等方法。
三、声源定位技术研究现状1. 波束形成技术:波束形成是麦克风阵列中常用的一种声源定位方法。
它通过加权求和的方式将多个麦克风的信号进行空间滤波,从而形成指向特定方向的声波束。
波束形成技术具有较高的定位精度和鲁棒性,广泛应用于语音识别、语音增强等领域。
2. TDOA估计:TDOA估计是通过测量声波在不同麦克风间的传播时间差来估计声源位置的方法。
该方法具有较高的空间分辨率和较低的信号处理复杂度,适用于多种声源定位场景。
3. DOA估计:DOA估计是利用信号的到达方向信息来估计声源位置的方法。
它通过对信号进行频域分析,提取出信号的频率特征,进而确定声源的方位。
DOA估计方法具有较高的定位精度和实时性,适用于动态声源定位。
四、声源定位技术研究方法1. 传统算法:传统算法主要包括基于模型的方法和非模型的方法。
基于模型的方法通常依赖于预先设定的阵列响应模型,通过对接收信号进行分析,提取出声源位置信息。
非模型的方法则更多地依赖于信号的统计特性,如互相关函数等。
2. 深度学习算法:近年来,深度学习在声源定位领域得到了广泛应用。
通过构建神经网络模型,可以实现对声源位置的端到端预测。
深度学习算法具有较高的定位精度和鲁棒性,尤其适用于复杂环境下的声源定位任务。
五、未来发展趋势1. 多模态融合:将麦克风阵列技术与视觉、音频等其他传感器进行融合,实现多模态的声源定位和识别。
麦克风阵列信号处理算法研究麦克风阵列是指由多个麦克风组成的阵列,通过对阵列中麦克风信号的处理,可以实现信号的方向性增强、空间滤波和噪声抑制等效果。
因此,在语音识别、语音增强、远场语音采集等领域都有广泛的应用。
麦克风阵列可以形成的微弱信号从而提高语音识别的准确性。
与单一麦克风相比,麦克风阵列能够对方向性声源进行有效的捕捉,并且可以对噪声进行滤波抑制,对听觉信号进行增强处理。
然而,麦克风阵列系统的性能受多种因素影响,包括麦克风位置、信号处理算法等。
在麦克风阵列信号处理算法中,主要包括波束形成和方向估计两个方面。
波束形成是指对接收到的麦克风信号进行加权和相位校准,从而形成一个指向目标信号的波束;方向估计是指对目标信号的方向进行估计。
波束形成算法是麦克风阵列信号处理算法中的核心内容。
常见的波束形成算法包括广义旁瓣消除(Generalized Sidelobe Canceller,GSC)、最小均方(Minimum Mean Square Error,MMSE)和最大信噪比(Maximum Signal-to-Noise Ratio,MSNR)等。
广义旁瓣消除算法是一种基于自适应滤波的波束形成算法,其主要思想是通过在线更新权重系数,抑制麦克风阵列接收到的信号中的旁瓣干扰。
最小均方算法和最大信噪比算法则是一种基于统计建模的波束形成算法,通过对麦克风阵列中接收到的信号进行统计建模,进而实现信号的增强和噪声的滤波。
除了波束形成算法外,方向估计算法也是麦克风阵列信号处理算法中的重要内容。
常见的方向估计算法包括时延和相位差(Time Delay and Phase Difference,TDPD)算法、最大似然(Maximum Likelihood,ML)算法等。
时延和相位差算法是一种基于时间差信号处理的方向估计算法,可以通过对阵列中麦克风的时间差和相位差进行计算,从而估计目标信号的方向。
最大似然算法则是一种基于概率统计的方向估计算法,通过对阵列中接收到的信号进行统计建模,进而实现目标信号方向的估计。
音频信号处理中麦克风阵列算法的优化在当前的生产环节和个人娱乐中,音频信号处理的重要性越来越高。
麦克风阵列技术也在这个领域中得到了广泛的应用。
尽管麦克风阵列算法可以改善对语音的采集和平稳性,但是这个技术仍然有一定的局限性和不足之处。
针对这个问题,我们在本文中将探究音频信号处理中麦克风阵列算法的优化。
1.麦克风阵列技术的简介麦克风阵列技术是用于将多个麦克风组合起来,通过算法将多路信号合并为一个声音,主要用于语音识别和说话人识别。
它可以通过处理聚集的声音来提高对传输噪音的识别能力。
麦克风阵列通常包括线性阵列和环型阵列两种形式,它们的差别仅在于麦克风布局的形式不同。
每个麦克风都有不同的延迟时间,这取决于麦克风的位置,其他的因素也会对阵列的效果产生影响。
因此,为了有效使用多个麦克风,必须使用麦克风阵列算法来提高其性能。
2.麦克风阵列算法的常见问题多路信号的合并很有挑战性,因为它可能存在很多问题。
麦克风阵列算法的一个问题是声音来源的方向和实际传播路径之间的偏差。
这是因为声音可以反射或穿透障碍物,导致信号到达的顺序不同。
另一个问题是麦克风传输的信号强度不同,造成干扰。
此外,阵列算法也可能会遭受到噪声、混响和回声等问题,从而影响其性能。
3.优化麦克风阵列算法的途径麦克风阵列算法的性能可以通过以下方式优化:(1)声源定位声源定位是确定声源方向的过程。
声源方向的确定可以通过三角测量或拟合模型等方法实现。
一旦确定了声源的位置,就可以为其他阵列算法提供有关声源的重要信息。
(2)信号滤波器信号滤波器用于滤除频率响应差异和信号噪音等因素。
信号滤波器可以通过这个方法解决多路信号合并时的挑战,并提高麦克风阵列的效果。
(3)语音增强语音增强用于识别语音信号中的重要内容,这可以使麦克风阵列的识别更加准确和稳定。
对于噪声、混响和回声等问题,语音增强可以通过噪声抑制、自适应滤波和立体声互相关等技术解决。
4.麦克风阵列算法的局限性麦克风阵列算法的效果取决于麦克风的位置和布局。