麦克风阵列语音增强的研究(1)

基于麦克风阵列的语音增强与干扰抑制算法

１㊀文献参考格式:王义圆ꎬ张曦文ꎬ周贻能ꎬ等.基于麦克风阵列的语音增强与干扰抑制算法[Ｊ].电声技术ꎬ２０１８ꎬ４２(２):１－５.ＷＡＮＧＹＹꎬＺＨＡＮＧＸＷꎬＺＨＯＵＹＮꎬｅｔａｌ.Ｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔａｎｄｉｎｔｅｒｆｅｒｅｎｃｅｓｕｐｐｒｅｓｓｉｏｎａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓ[Ｊ].Ａｕｄｉｏｅｎｇｉｎｅｅｒｉｎｇꎬ２０１８ꎬ４２(２):１－５.中图分类号:ＴＮ９１２.３５㊀㊀㊀㊀㊀文献标志码:Ａ㊀㊀㊀㊀㊀ＤＯＩ:１０.１６３１１/ｊ.ａｕｄｉｏｅ.２０１８.０２.００１基于麦克风阵列的语音增强与干扰抑制算法王义圆ꎬ张曦文ꎬ周贻能ꎬ黄际彦(电子科技大学信息与通信工程学院ꎬ四川成都６１１７３１)摘要:麦克风阵列在语音信号处理领域有着非常广泛的应用ꎬ该文提出了一种基于麦克风阵列的语音增强与干扰抑制算法ꎬ即空频联合处理算法ꎮ首先利用延迟－求和波束形成技术分别对麦克风阵列接收信号中的语音信号和干扰信号进行波束形成ꎮ然后将时域上的两个波束形成输出转换到频域ꎬ在频域上构造加权系数ꎬ利用加权系数乘以频域上的语音信号ꎬ从而进一步实现滤除干扰信号以增强语音信号的目的ꎮ仿真结果表明ꎬ该文提出的算法可以有效地对语音信号进行增强并且抑制干扰信号ꎮ相对于纯空域方法ꎬ该文提出的空频联合处理方法可以更有效地增强语音信号和抑制干扰ꎮ关键词:波束形成ꎻ麦克风阵列ꎻ语音增强ꎻ空频联合ꎻ系数加权ＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔａｎｄＩｎｔｅｒｆｅｒｅｎｃｅＳｕｐｐｒｅｓｓｉｏｎＡｌｇｏｒｉｔｈｍＢａｓｅｄｏｎＭｉｃｒｏｐｈｏｎｅＡｒｒａｙｓＷＡＮＧＹｉｙｕａｎꎬＺＨＡＮＧＸｉｗｅｎꎬＺＨＯＵＹｉｎｅｎｇꎬＨＵＡＮＧＪｉｙａｎ(ＳｃｈｏｏｌｏｆＩｎｆｏｒｍａｔｉｏｎａｎｄＣｏｍｍｕｎｉｃａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇꎬＵｎｉｖｅｒｓｉｔｙｏｆＥｌｅｃｔｒｏｎｉｃＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙꎬＣｈｅｎｇｄｕ６１１７３１ꎬＣｈｉｎａ)Ａｂｓｔｒａｃｔ:Ｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓｈａｓｗｉｄｅａｐｐｌｉｃａｔｉｏｎｓｉｎｔｈｅａｒｅａｏｆｓｐｅｅｃｈｓｉｇｎａｌｐｒｏｃｅｓｓｉｎｇ.Ａｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔａｎｄｉｎ￣ｔｅｒｆｅｒｅｎｃｅｓｕｐｐｒｅｓｓｉｏｎａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓｉｓｐｒｏｐｏｓｅｄ.Ｔｈａｔｉｓｓｐａｃｅａｎｄｆｒｅｑｕｅｎｃｙｐｒｏｃｅｓｓｉｎｇａｌｇｏｒｉｔｈｍ.Ｆｉｒｓｔｌｙꎬｔｈｅｓｐｅｅｃｈｓｉｇｎａｌａｎｄｉｎｔｅｒｆｅｒｅｎｃｅｓｉｇｎａｌｉｎｔｈｅｒｅｃｅｉｖｅｄｓｉｇｎａｌｏｆｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓａｒｅｂｅａｍｆｏｒｍｅｄｂｙｕｓｉｎｇｔｈｅｄｅ￣ｌａｙ－ｓｕｍｂｅａｍｆｏｒｍｉｎｇｍｅｔｈｏｄ.Ｔｈｅｎꎬｔｈｅｔｗｏｂｅａｍｆｏｒｍｉｎｇｏｕｔｐｕｔｓａｒｅｔｒａｎｓｆｏｒｍｅｄｆｒｏｍｔｈｅｔｉｍｅｄｏｍａｉｎｔｏｔｈｅｆｒｅｑｕｅｎｃｙｄｏｍａｉｎ.Ｉｎｔｈｅｆｒｅｑｕｅｎｃｙｄｏｍａｉｎꎬａｗｅｉｇｈｔｉｎｇｆｕｎｃｔｉｏｎｉｓｃｏｎｓｔｒｕｃｔｅｄｗｉｔｈｔｈｅｔｗｏｂｅａｍｆｏｒｍｉｎｇｏｕｔｐｕｔｓ.Ｆｉｎａｌｌｙꎬｉｎｏｒｄｅｒｔｏｆｉｌｔｅｒｔｈｅｉｎｔｅｒｆｅｒｅｎｃｅｓｉｇｎａｌａｎｄｅｎｈａｎｃｅｔｈｅｓｐｅｅｃｈｓｉｇｎａｌꎬｔｈｅｓｐｅｅｃｈｓｉｇｎａｌｉｓｍｕｌｔｉｐｌｉｅｄｂｙｗｅｉｇｈｔｉｎｇｆｕｎｃｔｉｏｎｉｎｔｈｅｆｒｅｑｕｅｎｃｙｄｏｍａｉｎ.Ｔｈｅｓｉｍｕｌａｔｉｏｎｒｅｓｕｌｔｓｄｅｍｏｎｓｔｒａｔｅｔｈａｔꎬｔｈｅａｌｇｏｒｉｔｈｍｐｒｏｐｏｓｅｄｉｎｔｈｉｓｐａｐｅｒｃａｎｅｎｈａｎｃｅｔｈｅｓｐｅｅｃｈｓｉｇ￣ｎａｌａｎｄｓｕｐｐｒｅｓｓｔｈｅｉｎｔｅｒｆｅｒｅｎｃｅｓｉｇｎａｌｅｆｆｅｃｔｉｖｅｌｙ.Ｃｏｍｐａｒｉｎｇｗｉｔｈｐｒｏｃｅｓｓｉｎｇｏｎｌｙｉｎｔｈｅｓｐａｃｅｄｏｍａｉｎꎬｔｈｅａｌｇｏｒｉｔｈｍｐｒｏ￣ｐｏｓｅｄｉｎｔｈｉｓｐａｐｅｒｃａｎｅｎｈａｎｃｅｓｐｅｅｃｈｓｉｇｎａｌｍｏｒｅｅｆｆｉｃｉｅｎｔｌｙ.Ｋｅｙｗｏｒｄｓ:ｂｅａｍｆｏｒｍｉｎｇꎻｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓꎻｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔꎻｓｐａｃｅａｎｄｆｒｅｑｕｅｎｃｙｐｒｏｃｅｓｓｉｎｇꎻｗｅｉｇｈｔｅｄｃｏｅｆｆｉｃｉｅｎｔ１㊀引言随着社会的快速发展ꎬ语音通信作为最直接㊁最有效的通信手段受到人们地广泛关注ꎬ人们对语音通信质量的要求也逐渐提高ꎮ在实际的语音通信环境中存在着各种各样的噪声干扰ꎬ这些干扰严重影响了语音通信的质量[１]ꎮ因此ꎬ为了提高语音通信的质量ꎬ语音增强技术一直是语音信号处理领域中的热点问题ꎮ语音增强是指从噪声背景中提取有用信号ꎬ抑制㊁降低噪声干扰的技术ꎬ即从带噪语音中提取尽可能纯净的原始语音信号[２]ꎮ麦克风阵列信号处理技术能够充分利用语音信号的空时信息ꎬ已经成为研究语音增强的热点所在[３－５]ꎮ目前常用的经典麦克风阵列语音增强方法２㊀包括固定波束形成㊁自适应波束形成㊁盲信号分离以及后置滤波等[６]ꎮ其中ꎬ固定波束形成算法最早由Ｆｌａｎａｇａｎ[７]提出ꎬ是最经典的空域处理方法ꎬ也是其他方法的基础ꎬ该算法通过对各麦克风阵元接收到的信号进行时延补偿ꎬ使得各通道输出信号在某一方向上保持同步ꎬ并且在该方向的入射信号获得最大增益[８]ꎮ该方法相对简单并且易于实现ꎬ但对于干扰信号的屏蔽效果不是很好ꎮ如果只做波束形成ꎬ增强后的声源信号中仍然有干扰信号的存在ꎮ此外ꎬ当前的研究主要是基于纯空域处理技术ꎬ未利用到时频信息ꎬ性能受限ꎮ本文在固定波束形成技术的基础上做了改进ꎬ在频域上构造新的加权函数ꎬ提出了空域波束形成－频域加权的空频联合处理算法ꎬ从而进一步对干扰信号进行抑制ꎮ由于利用到频率信息ꎬ所提出的算法能够更有效的抑制干扰ꎮ２㊀传统的固定波束形成算法传统的波束形成可以描述为作用于传感器阵列输出的空间滤波器ꎬ构造特定的波束方向图ꎮ这种空间滤波过程可以分为两步:时间对齐和加权求和ꎮ以简单的延迟－相加波束形成为例ꎬ第一步首先根据每个麦克风阵元与参考点之间的到达时间差ꎬ对每个阵元信号进行相应的时移ꎮ第二步是将时移后的信号相加[９]ꎮ假设语音信号为ｘｔ()ꎬ其由Ｍ个窄带信号叠加而成ꎬ表达式可记为:ｘｔ()＝ðＭｍ＝１ｘｆｍｔ()(１)式中:ｘｆｍ＝ｕｔ()ｃｏｓ２πｆｍｔ＋ｖ(ｔ)[](２)式中ꎬｘｆｍ是以ｆｍ为中心频率的窄带信号ꎬｕｔ()为慢变化的幅度调制函数ꎬｖｔ()为慢变化的相位调制函数ꎮ理想情况下ꎬ第ｉ个麦克风ꎬ在时刻ｋ的阵列输出可表示为:Ｘｉｋ()＝αｉｘｋ－ｔ－τｉ()＋ｎｉｋ()(３)式中ꎬｘｔ()为源信号ꎬｉ＝１ꎬ２ꎬ ꎬＭꎬτｉ㊁αｉ㊁ｎｉｋ()分别为从声源到第ｉ个麦克风的延迟㊁幅度衰减和干扰信号ꎮ对其进行采样ꎬ采样频率为ｆｓꎬ采样点数为Ｎꎬ第ｎ个采样点时刻的输出为:Ｘｉｎ()＝αｉｘｎＴｓ－ｔ－τｉ()＋ｎｉｎＴｓ()(４)式中ꎬＴｓ＝１/ｆｓꎬｎ＝１ꎬ２Ｎꎮ假定阵元ｉ的位置向量为:Ｒｉ＝ｒｘｉꎬｒｙｉꎬｒｚｉ()(５)式中ꎬｒｘｉ＝ｒｉｓｉｎφｉｃｏｓθｉꎬｒｙｉ＝ｒｉｓｉｎφｉｓｉｎθｉꎬｒｚｉ＝ｒｉｃｏｓφｉꎬｉ＝１ꎬ２ꎬ ꎬＭꎬφｉꎬθｉ分别为阵元位置的俯仰角和水平角ꎮｒｉ＝ｒｘｉ２＋ｒｙｉ２＋ｒｚｉ２是阵元ｉ和原点之间的几何距离ꎮ平面波从－ｒ方向入射到阵列:ｒ＝ｓｉｎφｃｏｓθꎬｓｉｎφｓｉｎθꎬｃｏｓφ()(６)式中ꎬφꎬθ为信号源的俯仰角和水平角ꎮ以原点为参考点ꎬ设该点接收信号为ｘｔ()ꎬ则阵元ｉ接收到的信号相对于原点的时间延迟[１０]为:τｉ＝－ｒˑＲｉ/ｃ＝－ｒｘｉｓｉｎφｃｏｓθ＋ｒｙｉｓｉｎφｓｉｎθ＋ｒｚｉｃｏｓφ()ｃ(７)式中ꎬｃ＝３４０ｍ/ｓꎮ根据以上求得的时间延迟对信号进行时移:Ｘａꎬｉｎ()＝Ｘｉ(ｎ＋τｉ)(８)式中ꎬ下标ａ表示时间对齐后的阵元信号ꎮ将时移后的信号加权求和ꎬ得到波束形成的输出为:ＺＸｎ()＝１ＭðＭｉ＝１Ｘａꎬｉｎ()(９)式中ꎬｉ＝１ꎬ２ꎬ ꎬＭꎮ㊀３㊀改进的空频联合处理算法在传统纯空域波束形成的基础上ꎬ本文提出了空频联合处理方法ꎮ空频联合处理算法框图如图１所示ꎬ即增加了频域上的加权处理ꎬ通过空频联合处理更加有效地对语音信号进行增强ꎮ本算法假设麦克风阵列位于声源的远场ꎬ如此可近似地认为收到的信号为平面波ꎮ声源信号和干扰信号的方向可以通过ＤＯＡ[１１－１３]估计或其他测向方式获得ꎬ已知信号方向ꎮ３㊀图１㊀空频联合处理算法框图３.１㊀算法结构１)空域:延时－求和波束形成与上一部分介绍的传统固定波束形成相同ꎬ首先根据每一个麦克风与参考点之间的时延ꎬ对麦克风接收信号进行时移ꎬ使各路输出信号在某一方向上对齐ꎮ然后将时移后的信号相加ꎬ针对声源信号与干扰信号分别形成两个波束形成输出ꎮ２)频域:系数加权将两个波束形成后的输出从时域转换到频域并构造加权系数ꎬ利用加权系数乘以频域上的声源信号ꎬ进一步地消除干扰信号以增强声源信号ꎮ３.２㊀加权系数的构造空域上ꎬ利用延迟－相加波束形成算法ꎬ分别得到指向声源信号ｓｔ()以及干扰信号Ｉｔ()的两个波束形成输出Ｚｓｎ()㊁ＺＩｎ():Ｚｓｎ()＝１ＭðＭｉ＝１Ｓａꎬｉｎ()(１０)ＺＩｎ()＝１ＭðＭｉ＝１Ｉａꎬｉｎ()(１１)式中ꎬｎ＝１ꎬ２Ｎꎬ为时域采样点序号ꎮ对波束形成后的输出进行加窗分帧[１４]:Ｚｓꎬｎｍ()＝Ｗ(ｍ)ＺＳ(ｎ＋ｍ)(１２)ＺＩꎬｎｍ()＝Ｗ(ｍ)ＺＩ(ｎ＋ｍ)(１３)式中ꎬＷ(ｍ)为窗函数ꎬｎ是帧序号ꎬｍ是帧同步的时间序号ꎬｍ＝１ꎬ２ＮꎬＮ为帧长ꎮ接着对分帧后的离散数据做短时傅里叶变换ꎬ定义角频率ω＝２πｋＮꎬ１ɤｋɤＮꎬ则离散的短时傅里叶变换为:Ｙｓꎬｎｅｊ２πｋＮ()＝ðＮｍ＝１Ｚｓꎬｎ(ｍ)ｅ－ｊ２πｋＮｍ(１４)ＹＩꎬｎｅｊ２πｋＮ()＝ðＮｍ＝１ＺＩꎬｎ(ｍ)ｅ－ｊ２πｋＮｍ(１５)构造系数Ｗｎ:Ｗｎ＝Ｓｎｅｊ２πｋＮ()Ｓｎｅｊ２πｋＮ()＋Ｉｎｅｊ２πｋＮ()(１６)式中ꎬｎ是帧序号ꎬＳｎｅｊ２πｋＮ()㊁Ｉｎｅｊ２πｋＮ()分别为声源信号和干扰信号一帧内的短时功率谱:Ｓｎｅｊ２πｋＮ()＝ＹＳꎬｎｅｊ２πｋＮ() Ｙ∗Ｓꎬｎｅｊ２πｋＮ()＝ＹＳꎬｎｅｊ２πｋＮ()２(１７)Ｉｎｅｊ２πｋＮ()＝ＹＩꎬｎｅｊ２πｋＮ() Ｙ∗Ｉꎬｎｅｊ２πｋＮ()＝ＹＩꎬｎｅｊ２πｋＮ()２(１８)由此ꎬ我们便构造出加权系数Ｗｎꎬ从式(１６)可以看出:频域上ꎬ对声源信号波束形成输出进行系数加权时ꎬ如果某一频率上声源信号中存在的干扰信号较大ꎬ权值系数Ｗｎ便会减小ꎬ从而该频率的声源信号在一定程度上被削减ꎻ干扰信号小的频点上的声源信号被保留ꎮ通过这种方法ꎬ频域上系数加权可以有效地抑制干扰信号ꎮ频域上系数加权后第ｎ帧声源信号为:ＺＳꎬｎ(ｆ)＝ｗｎˑＹｓꎬｎｅｊ２πｋＮ()(１９)再将频域信号转换到时域ꎬ得到第ｎ帧系数加权后的声源信号:ＺＳꎬｎ(ｍ)＝１ＮðＮｍ＝１ＺＳ(ｆ)ｅｊ２πｋＮｍ(２０)式中ꎬｍ是帧同步的时间序号ꎬｍ＝１ꎬ２ꎬ ꎬＮꎬＮ为帧长ꎮ最后合成所有帧信号得到系数加权后的输出信号ꎮ４㊀麦克风阵列语音增强的评价标准采用以下两种标准来衡量算法性能ꎮ４.１㊀分段信噪比信噪比是衡量语音增强算法效果的常规方法ꎬ定义为信号和噪声能量比值的对数值ꎬ信噪比越大ꎬ表示语音质量越好ꎮ不过ꎬ由于整段语音信号是时变的ꎬ而噪声能量是均匀分布的ꎬ传统信噪比计算公式只能得到大致的信噪比ꎮ因此ꎬ为了了解语音信号的信噪比情况ꎬ定义了不同时段下的分段信噪比[１５－１６]为:ＳＮＲ＝１ＭðＭ－１ｍ＝０１０ｌｏｇ１０ðＬ－１ｌ＝０ｓ２(ｌ)ｓ(ｌ)－ｓ(ｌ)[]２éëêêùûúú(２１)式(２１)中ꎬＬ为帧长ꎬＭ为帧数ꎬ对于每帧算出的信噪比设置高低门限ꎬ分别为３５ｄＢ和－１０ｄＢꎮ４㊀４.２㊀噪声抑制噪声抑制[１７](ＮｏｉｓｅＲｅｄｕｃｔｉｏｎꎬＮＲ)表征了算法对于噪声的抑制作用ꎬ定义为:ＮＲ＝１０ｌｏｇ１０ðＮ－１ｎ＝０ｖｉｎ(ｎ)２ðＮ－１ｎ＝０ｖｏｕｔ(ｎ)２æèçççöø÷÷÷(２２)式中ꎬｖｉｎ(ｎ)ꎬｖｏｕｔ(ｎ)分别为输入和输出中的噪声信号ꎮＮＲ越大ꎬ说明噪声抑制效果越好ꎮ５㊀仿真与分析仿真实验分别以长度为２２ｓ的语音信号ｓｉｇ￣ｎａｌ１.ｗａｖ和ｓｉｇｎａｌ２.ｗａｖ作为声源ꎬ声源信号为ｓｉｇ￣ｎａｌ２.ｗａｖꎬｓｉｇｎａｌ１.ｗａｖ为干扰信号ꎮ仿真条件如下:麦克分阵列为４阵元均匀线阵ꎬ阵元间距为１０ｃｍꎬ声源信号与干扰信号位置分别为(－１.７ꎬ０.６２ꎬ２.１６)ꎬ(２.１１ꎬ－０.７７ꎬ２.６８)ꎮ仿真结果如下ꎮ５.１㊀语谱图各形式下的语音语谱图如图２~图５所示ꎮ图２㊀纯净语音信号的频谱图图３㊀单麦克风接收信号的语谱图图４㊀波束形成后的语谱图图５㊀加权后的语谱图从图４可以看出ꎬ相比于图３所示的单麦克风信号语谱图ꎬ经过传统的固定波束形成方法后ꎬ信号的语谱图在很大程度上滤除了干扰信号ꎬ但仍有残存ꎻ对比图４和图５ꎬ经过本文方法频域上系数加权后ꎬ图５显示的语音信号的语谱图更干净㊁更接近图２所示的纯净语音信号ꎬ干扰信号被进一步抑制ꎮ５.２㊀分段信噪比不同情形下分段信噪比对比见表１ꎮ表１㊀不同情形下信噪比对比５㊀㊀㊀由上表可以看出ꎬ波束形成后的语音信号信噪比提高了５.１９ｄＢꎬ系数加权后的语音信号信噪比提高了６.９７ｄＢꎮ系数加权后相比于仅作波束形成信噪比提高了１.７８ｄＢꎮ由此可以看出ꎬ波束形成可以对语音进行增强ꎬ提高信噪比ꎮ而系数加权可以进一步地对干扰噪声进行滤波ꎬ从而提高信噪比ꎮ５.３㊀噪声抑制计算了仅做波束形成后信号的噪声抑制比为６.１０ｄＢꎬ而进一步系数加权后的噪声抑制比为７.７２ｄＢꎬ噪声抑制比提高了１.６２ｄＢꎮ由此可以看出ꎬ系数加权在波束形成的基础上更加有效地抑制了干扰噪声ꎮ６㊀结束语本文分析并提出了一种基于麦克风阵列的语音增强与干扰抑制算法ꎬ在波束形成之后增加了系数加权进一步滤除干扰信号ꎬ利用空频联合处理进行语音增强ꎮ仿真结果从语谱图上可以看出ꎬ波束形成后的输出信号一定程度上滤除了干扰信号ꎬ系数加权可以更加有效地提高信噪比ꎮ听音结果也显示系数加权后的语音质量相比较仅做波束形成有所提高ꎮ当然ꎬ分段信噪比的计算结果也表明系数加权对于信噪比的提高优于仅做波束形成ꎮ系数加权后对于干扰的抑制更加明显㊁有效ꎮ参考文献:[１]沈锁金ꎬ刘伟ꎬ高颖.语音增强算法的研究与实现[Ｊ].电声技术ꎬ２０１６ꎬ４０(１２):４０－４２.[２]张金虎.基于麦克风阵列的语音增强算法研究[Ｄ].兰州:兰州交通大学ꎬ２０１４.[３]于春和ꎬ苏龙.基于ＧＳＣ与谱减法的麦克风阵列语音增强方法[Ｊ].沈阳航空航天大学学报ꎬ２０１５ꎬ３２(０５):８０－８５.[４]陈磊ꎬ江伟华ꎬ童峰ꎬ等.一种可跟踪移动声源方向的麦克风阵列语音增强算法[Ｊ].厦门大学学报:自然科学版ꎬ２０１５ꎬ５４(０４):５５１－５５５.[５]戴红霞ꎬ赵力.基于麦克风阵列的数字助听器语音增强技术[Ｊ].电子器件ꎬ２０１５ꎬ３８(０３):６０６－６１０.[６]武素芳.基于延迟－求和的麦克风阵列语音增强算法研究[Ｄ].西安电子科技大学ꎬ２０１０.[７]ＪＬＦＬＡＮＡＧＡＮ.Ｃｏｍｐｕｔｅｒ－ｓｔｅｅｒｅｄｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓｆｏｒｓｏｕｎｄｔｒａｎｓｄｕｃｔｉｏｎｉｎｌａｒｇｅｒｏｏｍｓ[Ｊ].ＪｏｕｒｎａｌｏｆＡｃｏｕｓｔｉｃａｌＳｏｃｉｅｔｙｏｆＡｍｅｒｉｃａｎ.１９８５ꎬ７８(５):１５０８－１５１８.[８]丁猛.基于麦克风阵列的语音增强算法概述[Ｊ].大众科技ꎬ２０１１(０３):２９－３０.[９]ＪＡＣＯＢＢꎬＣＨＥＮＪＤꎬＨＵＡＮＧＹＴ.麦克风阵列信号处理[Ｍ].邹霞ꎬ周彬ꎬ译.北京:国防工业出版社ꎬ２０１６:３３－３４.[１０]白梅.宽带恒定束宽波束形成方法研究[Ｄ].电子科技大学ꎬ２００８.[１１]叶中付ꎬ罗大为ꎬ韦进强ꎬ等.相干信号波达方向估计技术综述[Ｊ].数据采集与处理ꎬ２０１７ꎬ３２(０２):２５８－２６５.[１２]李声飞.一种改进ＭＵＳＩＣ算法ＤＯＡ估计的研究与ＦＰＧＡ实现[Ｊ].信息技术与信息化ꎬ２０１７(０６):８３－８５.[１３]田野ꎬ练秋生ꎬ徐鹤.基于稀疏信号重构的ＤＯＡ和极化角度估计算法[Ｊ].电子学报ꎬ２０１６ꎬ４４(０７):１５４８－１５５４.[１４]梁瑞宁ꎬ赵力ꎬ魏昕ꎬ等.语音信号处理[Ｍ].北京:机械工业出版社ꎬ２０１６:６５－６６.[１５]王文杰.麦克风阵列语音增强技术研究[Ｄ].河北工业大学ꎬ２０１０.[１６]徐宇卓ꎬ马建芬ꎬ张雪英.基于语音起始段检测语音可懂度客观评价方法[Ｊ].电子技术应用ꎬ２０１５ꎬ４１(０６):１５０－１５３.[１７]郑家超.宽带波束形成麦克风阵列语音增强方法的研究[Ｄ].辽宁工业大学ꎬ２０１１.作者简介:㊀㊀王义圆(１９９３－)ꎬ女ꎬ硕士研究生ꎬ主要研究领域为雷达系统及信号处理ꎻ张曦文(１９９３－)ꎬ女ꎬ硕士研究生ꎬ主要研究领域为非合作目标无线定位ꎻ周贻能(１９９１－)ꎬ男ꎬ硕士研究生ꎬ主要研究领域为连续波雷达多目标信号处理ꎻ黄际彦(１９８１－)ꎬ男ꎬ硕士研究生导师ꎬ主要研究领域为阵列信号处理ꎮ责任编辑:徐弘涛收稿日期:２０１８－０１－２５。

基于语音传感器网络的语音增强的研究

基于语音传感器网络的语音增强的研究作者：刘力来源：《中小企业管理与科技·上中下旬刊》 2015年第10期刘力东北电力大学理学院吉林吉林132000摘要：对于传统单个麦克风阵列，一般来讲声源离麦克风阵列很远，造成采集到的信号信噪比很低，同时对整个空间的采样也是局部的。

进一步来讲由于一些便携设备如手机、平板电脑等设备物理尺寸大小有限，所以对单个麦克风阵列来讲，不可能安置很多麦克风来提高算法性能。

随着无线网络和嵌入式技术的发展，出现了无线语音传感器网络。

无线语音传感器网络是由一些单独的阵列节点，通过无线通信，任意组网而成。

由于使用无线通信技术，单个麦克风阵列大小的限制也就消失了。

位置没有意义，麦克风配置更加宽松。

因此能够对很大的区域进行观测和采样。

增加了更多的空间信息。

关键词：无线语音传感器网络；语音增强；无线1 语音传感器网络的研究现状基于语音传感器网络信号处理最早可以追溯到2001 年，Aarabi采用语音传感器网络基于时延进行了声源定位。

荷兰代尔夫特理工大学Richard C. Hendriks 教授在分布式麦克风阵列下，对语音可懂度的提高展开研究。

德国埃朗根国际语音研究实验中心的EmanuelA. P.Habets 教授使用相对早期语音传递函数在多个麦克风阵列存在的情况下，进行语音去噪展开研究。

国内的各大高校及科研院所也开展了相关的研究工作，并取得了一定的进展。

2 无线传感器网络的研究挑战无线传感器网络是一种分布式传感网络，它广泛应用于军事、智能交通、环境监控、医疗卫生等多个领域，涉及很多核心技术。

我们针对数据融合和数据管理技术在语音方面展开研究。

但是这里涉及很多研究问题，如麦克风阵列的时间起点不一样，涉及同步的问题。

阵列的方向矢量估计可能存在误差，因此有校正的问题。

麦克风本身电子电路，由于电子电路随着时间的使用，电子电路放大的倍数都不一样，产生不同的增益。

因此，需要考虑麦克风的配准问题。

面向语音识别的自适应麦克风阵列技术研究

面向语音识别的自适应麦克风阵列技术研究自适应麦克风阵列技术是一种用于语音信号处理的技术，它通过调整麦克风阵列的方向和信号增益，来削减来自非目标方向的噪声，在复杂噪声环境下提高语音信号的识别准确率。

目前，自适应麦克风阵列技术已经广泛应用于语音识别、智能手机等领域。

本文旨在介绍面向语音识别的自适应麦克风阵列技术的研究进展和未来发展趋势。

一、麦克风阵列技术原理麦克风阵列技术是基于声学特性的研究，通过麦克风阵列对声场进行采集，从而获取到目标信号和干扰噪声。

麦克风阵列是由多个麦克风组成的，按照一定的几何形状排列。

根据波束形成原理，当目标声源和干扰声源位于不同方向时，各个麦克风的相位和幅度不同，通过对各个麦克风的信号进行加权和相位调整，可以使目标声源的信号增强，干扰噪声信号减弱，从而提高声音的清晰度和辨识度。

在麦克风阵列技术中，主要有两种波束形成算法：波束形成和自适应波束形成。

波束形成算法是一种基于固定权系数矩阵的波束形成方法，它把各个麦克风信号进行加权平均，形成一个固定的波束方向。

这种方法简单可行，但缺点也比较明显，由于固定的权系数不适用于噪声情况的变化，因此会使得目标信号的增益被过多压缩，同时不能对噪声进行有效消除。

自适应波束形成算法是目前应用较多的一种波束形成方法，它可以根据实时的声学环境来自动地调整阵列麦克风的权值，从而使目标信号被增强，噪声被抑制。

自适应波束形成算法的核心是根据算法目标和误差方差，通过自适应的控制算法，不断调整权值。

二、自适应麦克风阵列技术在语音识别中的应用自适应麦克风阵列技术在语音识别领域具有重要作用。

语音识别系统的核心是对声音的模式识别，然而在复杂的环境中，各种噪声会干扰到语音信号的识别，因此精度就会受到极大的影响。

通过应用自适应麦克风阵列技术，能够有效地削减来自非目标方向的噪声，提高了语音信号的识别准确率和鲁棒性。

一个经典的示例是语音助手，比如苹果公司的Siri和亚马逊的Alexa，它们需要在嘈杂的环境下准确地识别用户语音指令，因此需要有效的阵列处理技术。

麦克风阵列信号处理技术研究

麦克风阵列信号处理技术研究麦克风是我们日常生活中经常接触到的设备之一，它们在电视、手机、电脑等产品中都有广泛的应用。

随着科技的不断发展，麦克风也在不断的升级和改进。

在这些改进中，麦克风阵列信号处理技术成为了研究的热点之一。

麦克风阵列信号处理技术，是指利用多个麦克风组成一个阵列，通过信号处理算法来分析获取到的声音信号，从而实现降噪、增强语音信号、改善声音方向等效果的技术。

这一技术被广泛应用在会议系统、声源定位、语音识别等领域。

麦克风阵列信号处理技术的优势在于，相比于单个麦克风，它可以获取到更多的声音信息。

同时，多个麦克风的信号可以通过信号处理算法进行协同处理，实现对语音信号的识别和提取。

此外，麦克风阵列技术还可以改善环境噪声，提高语音信号的清晰度。

对于麦克风阵列信号处理技术的研究，主要有以下几方面：一、阵列构建阵列构建是麦克风阵列信号处理技术的基础。

麦克风阵列的构建形式通常有线性、圆形、矩形等。

在构建阵列时，需要考虑麦克风数量、布局、间距以及方向等因素。

此外，不同的阵列构建形式会影响麦克风信号的唯象，因此需要在实验室环境下进行实验，找出最优的构建形式。

二、麦克风信号处理算法麦克风阵列信号处理技术的优秀在于信号处理算法。

不同的算法对信号处理的效果也不同。

在信号处理算法中，常用的有波束形成算法、最小方差无失真响应算法以及最大信噪比算法等。

其中，波束形成算法是阵列信号处理中最基础的处理算法，也是目前最热门的处理方式之一。

通过波束形成，可以实现从多个麦克风中提取出目标信号，使得语音信号更加清晰。

三、降噪和声源定位降噪和声源定位是麦克风阵列信号处理技术中最为关键的部分。

降噪的目标是把环境噪声从语音信号中去除，从而提高语音信号的信噪比。

最常用的环境噪声消除算法是最小均方误差法，目前市场上的很多语音识别设备都采用了这一技术。

声源定位是指通过麦克风阵列获取信号，在不需要人工操作的条件下，自动确定声源的位置。

声源定位需要进行时间延迟估计、数据融合、模型匹配等处理步骤。

二维麦克风阵列语音增强算法研究的开题报告

二维麦克风阵列语音增强算法研究的开题报告一、选题背景随着语音应用的广泛应用，语音增强技术的需求越来越大。

但是传统的单麦克风采集模式容易受到环境噪声的干扰和声源方向的限制，其在实际应用中的可靠性和效果存在局限性。

因此，基于麦克风阵列的语音增强技术成为了当前研究的热点方向之一。

二、选题意义二维麦克风阵列 (2D microphone array) 能够通过收集多个麦克风的信号来获得更准确的语音信息，具有很大的潜力。

然而，如何有效地利用麦克风阵列的信号，去除环境噪声和信号混叠等问题，仍然是当前的研究热点和难点。

因此，本文旨在研究二维麦克风阵列语音增强算法，探索如何更有效地利用多通道信号进行语音增强，提高语音信号的质量和可靠性。

三、研究内容本文研究的主要内容包括以下方面：1.二维麦克风阵列的构建和信号处理技术：介绍二维麦克风阵列的构成、基本原理以及信号处理技术，为后续的声源定位和语音增强打下基础。

2.声源定位算法：基于二维麦克风阵列的多通道信号，设计一种可靠的声源定位算法，确定语音信号的来源方向。

3.语音信号增强算法：基于多通道语音信号，设计一种有效的语音增强算法，去除环境噪声和信号混叠，提高语音信号质量。

4.实验验证：通过实际场景的采集和模拟数据的模拟，对所提出的算法进行验证和评估，验证其在不同情况下的可行性和有效性。

四、研究方法本文将采用以下研究方法：1.文献综述法：对二维麦克风阵列语音增强技术的发展历程、现状和研究方向进行全面分析，梳理出当前的研究热点和难点，并为后续研究提供参考。

2.实验法：通过实际场景的采集和模拟数据的模拟，对所提出的算法进行验证和评估，验证其在不同情况下的可行性和有效性。

3.算法设计法：根据二维麦克风阵列的信号处理技术，设计声源定位算法和语音增强算法，应用于语音增强任务。

五、预期成果本文的预期成果包括：1.设计并实现一种基于二维麦克风阵列的语音增强算法，能够去除环境噪声和信号混叠，提高语音信号质量。

基于近场波束形成的麦克风阵列语音增强方法

本文的具体结构安排如下：在所选声学模型的基础上，给出基于近场波束形成的麦克风阵列语音增强方法的整体框图；接着从理论上对该方法进行推导；然后给出在仿真环境下，该方法语音增强的效果及与其他方法的噪声性能比较；最后给出结论。
68
电子与信息学报
第 29 卷
2 位于阵列近场的声波传播模型
如图 1 所示，设 r 为声源与参考麦克风的距离，θ 与 ϕ 分
摘要: 当麦克风阵列用于封闭环境中非手持式语音拾取时，必须面对的一个问题是声场为阵列近场的问题。该
文在子带自适应波束形成方法的基础上，引进了一种基于近场波束形成的麦克风阵列语音增强方法。该方法充分
利用了近场球面波的波前弯曲率，有效地衰减了混响和噪声对期望信号的影响。仿真实验结果表明，在小房间混
响条件下，基于近场波束形成的麦克风阵列语音增强方法取得了较好的噪声抑制效果。
平面内， xw = (rw, θw ) 为声源位置， xi = (ri, θi ) 为麦克风位
置， riw 为声源与第 i 只麦克风之间的距离，即
riw = rw2 + ri2 − 2rwri cos(θi − θw )
(5)
这是信号的空间表示形式。考虑到语音信号是宽带信号，则
阵列信号的延迟矢量为
αt (rw, ω) = αt = ⎡⎢⎣1, ", e−jk(L−1)cT ⎤⎥⎦H
1 r2
∂ ∂r
⎛⎜⎜⎜⎝r 2
∂s ∂r
⎞⎠⎟⎟⎟
=
1 c2
∂2s ∂t 2
(2)
于是，得到波动方程的解为
s(r, ω,t) = A exp{j(ωt − kr)}
(3)
r
式中 k = ω c 为声波波数，其中 ω 为声波角频率。当 r → ∞

基于麦克风阵列的语音增强研究

Ｏ引言
语音增强是指当语音信号被各种各样的噪声干扰，甚至淹没后，从噪声背景中提取有用的语音信号，抑制、降低噪声干扰的技术 …。在各种电子设备高度智能化的今天，语音增强与声源定位技术成为语音通
奏的残余噪声；统计方法需要大量的数据进行训练
ｈａｔａ —ｑａｅ（ＭＳｄｐｖｐｅｈｅｈｎｅｎｇｒｈ－ｎｒｏｅａｍｅｄｕｉｎｍｃｔｌｕｓｖｒｔｅｌｓｍｅｎｓｕｒＬ）ａａｔｅｓｅｃｎａｃｍｅｔｌｏｉｍｓａｄｐｐｓｔｏｓｇａｍｉｉｎｒｌｄｒｃｒｉｅａｅ－ｅ — ｉａｔｏｈｎａｏｏｅｅｖａｉｇＭＣＡ）ｏｅｔｔｅｎｉｌｓｎｔｅｄｆｃｆｅｂｏｋｎｔｘＴｉｍｅｏｐｌｅｍｆｒｎ．ｎｓｇｇｎ【Ｒｔｓｍａｔｏｓｉａｕｉｔｅｔｏｌｃｉｇｍｒ．ｈｓｔｄｉａｐｉｔｂａｏｍｉｇａｄｕｉｉｅｈｅｎｌｏｏｈｅｓｔｈａｉｈｓｄｅｏ的阈小
值获取困难，运算量大。实际应用中常常根据具体的环境噪声和语音特性将不同方法结合起来应用，中文采用非参数方法、适应噪声抵消法，自同时在噪声估
信领域中两种不可缺少的技术。在视频会议、智能机
Ｍａａｏｗａｉｌｔ．ｉｌｔｏｅｕｔｈｗａ。Ｓ— ＣＲＡｄｐｖａｏｕｔｓｅｃｎｎｃｍｅｔｎｂｓｆｒｔｓｍｕａＳｍｕａｎｒｓｌｓｏｔｔＬＭｔｅｏｅｉｓｈＭａａｔｅｈｓｒｂｓｐｅｈｅｈａｅｎ．ｉＫｅｒｓｍｉｒｐｏｅａｒｙ；ｐｅｈｅｈａｃｍｅｔａａｔｅｌａｔｍｅｎｓｕｒｇｒｔｍ；ｙｗｏｄ：ｃｏｈｎｒａｓｅｃｎｎｅｎ；ｄｐｉｅｓａｑａｅａｏｉｈＭＣＲＡｖｌ

基于麦克风阵列的语音增强方法

基于麦克风阵列的语音增强方法概述：在日常生活和工作中，语音通信是人与人之间互相传递信息沟通不可缺少的方式。

在语音通信中，语音信号不可避免地会受到来自周围环境和传输媒介的外部噪声、通信设备的内部噪声及其他讲话者的干扰。

这些干扰共同作用，最终使听者获得的是被噪声污染过的带噪声语音，严重影响了双方之间的交流。

应用阵列信号处理技术的麦克风阵列能够充分利用语音信号的空时信息，具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点，逐渐成为强噪声环境中语音增强的研究热点。

本文将介绍各种麦克风阵列语音增强方法，并总结各个方法的优劣。

最终得出更好的、能够去噪的基于麦克风阵列的语音增强方法。

1麦克风阵列麦克风阵列是将两个麦克风的信号耦合为一个信号。

在频率响应中也可以根据时域中波束形成与空间滤波器相仿的应用，分析出接收到语音信号音源的方向以及其变化。

采用该技术，能利用两个麦克风接收到声波的相位之间的差异对声波进行过滤，能最大限度将环境背景声音滤掉，只剩下需要的声波。

对于在嘈杂的环境下使用采用了这种配置的设备，在嘈杂的环境下能使听者听起来很清晰，没杂音。

2基于麦克风阵列的语音增强方法2.1基于自适应波束形成器的麦克风阵列语音增强自适应波束形成是现在广泛使用的一类麦克风阵列语音增强方法。

最早出现的自适应波束形成算法，其基本思想是在某方向有用信号的增益一定的前提下，使阵列输出信号的功率最小。

在线性约束最小方差自适应波束形成器的基础上，1982 年Griffiths 和Jim 提出了广义旁瓣消除器成为了许多算法的基本框架。

广义旁瓣消除器（GSC）的工作原理是带噪声的语音信号同时通过自适应通道和非自适应通道，自适应通道中的阻塞矩阵将有用信号滤除后产生仅包含多通道噪声参考信号，自适应滤波器根据这个参考信号得到噪声估计，最后由这个被估计的噪声抵消非自适应通道中的噪声分量，从而得到有用的纯净语音信号。

麦克风阵列的自适应算法通过迭代运算获取波束形成的最优权矢量时，噪声模型的估计是一个非常关键的因素。

基于RLS的自适应阵列抗交叉串扰语音增强研究

目的在于从含噪语音中提取尽可能纯净的原始语
音。自２世纪７年代以来，语音增强一直是人们研００
究的热点；然而，由于噪声来源众多，特性各异，
很难开发一种适用于各种噪声环境下的语音增强算法。总结国内外的研究成果，容易发现自适应噪声抵消法（ａｔｅＮｏｓａｃｌｔｎＡｄｐｉｉＣｎｅａｉ，简称ＡＮＣｖｅｌｏ１
（）＝
（一）（１／（一１，１＋一）（）ｚ）ｚ￡
至经常发散。献【】讨了基于麦克风阵列两级滤文５探
波处理系统。本文将自适应ＲＳ型一梯算法引入Ｌ格阶麦克风阵列滤波系统中，以提高算法收敛性能性能，并采用了麦克风之间抗交叉串扰方法，去除噪声的同时减少语音信号的损伤。
Ｅ（＝Ｅ（１ｌ（ｆ１）ｇｍ－＋ｌ）（）Ｉ）ｅ／一
（＝（１Ｊ（｝，１，：ｚ），／ｚ）２），＋ｚ（一）一
（＝（）Ｆ１，一／ｚ）４（一）
ｋ（）（）Ｅｆ，，＝一２ｎ／ｍ（）ｚ
（）０＝＞００＝Ｅｂ）（，￡（）０＝０，
・阶数初始化
（），０＝０
（）０＝０
（）０＝Ｘ（）０＝，＝ｂ）ｆｚ，（）（）（，（ —１＝１）
・格型部分：ｍ＝，，１Ｏ１ …，

随机麦克风阵列校正及语音增强研究

专业学位类别
工程硕士
电子与通信工程 2015.4.20
论文答辩日期
2015.6.1 2015 年 6 月 27 日
学位授予单位和日期答辩委员会主席评阅人
电子科技大学
注 1：注明《国际十进分类法 UDC》的类号。
ARBITRARY MICROPHONE ARRAY CALIBRATION AND SPEECH ENHANCEMENT
II
ABSTRACT
Finally, as the main emphasis, the basic algorithm about speech enhancement are studied in detail with their advantages and disadvantages. The thesis mainly studied the adaptive beamforming algorithm, time delay estimation method and the performance of different time delay estimation. Analysing the Generalized Sidelobe Canceller (GSC) beamforming algorithm and its performance on eliminate noises. Then based on the theory before, the thesis proposes a new GSC algorithm combined band decompose and rear filter algorithm. The algorithm is suitable for the coherent and incoherent noise field at the same time, extends the scope of application, improves the Signal-to-Noise Ratio (SNR), and reduces the amount of calculation. Also analyzing a blind beamforming algorithm which based on higher order accumulation. Compared with the traditional beamforming, the algorithm has a higher output SNR under the condition of array error. Keywords: microphone array, self-calibration, speech enhancement, adaptive beamforming, blind beamforming

基于麦克风阵列的语音增强算法

2020年4月计算机工程与设计Apr.2020第41卷第4期COMPUTER ENGINEERING AND DESIGN Vol.41No.4基于麦克风阵列的语音增强算法闵新宇，王清理，冉云飞（中国航天科工集团第二研究院706所，北京100854）摘要：为解决现有语音增强算法需要麦克风数量较多和受估计误差影响较大的问题！提出一种改进的声源定位和波束形成方法。

在现有声源定位算法利用时间延迟的基础上！引入能量衰减参数！实现利用双麦克风进行声源定位的目标；在波束形成算法中引入加载系数，在出现协方差矩阵统计失配时仍可对期望方向聚焦！提高波束形成算法的鲁棒性。

仿真结果表明！改进后的算法与传统算法相比具有更强的鲁棒性。

关键词：语音增强；麦克风阵列；声源定位；波束形成；时延估计中图法分类号：TN912.35文献标识号：A文章编号：1000-7024（2020）04-1074-06doi：10.16208/j.issnl000-7024.2020.04.029Speech enhancement algorithm based on microphone arrayMIN Xin-yu,WANG Qing-li?RAN Yun-fei(Institute706,Second Academy of China Aerospace Science and Industry Corporation,Beijing100854,China) Abstract：To solve the problem that the existing speech enhancement algorithms need a large number of microphones and they aregreatlya f ectedbytheestimationerror,animprovedsoundsourcelocalizationandbeamformingmethodwasproposed\Based ontimedelay,energya t enuationparameterwasintroducedtorealizethetargetofsoundsourcelocalizationusingdoublemicro-phones.Loading coefficient was introduced to beamforming algorithm&which focused on the desired direction when the cova-riancematrixstatisticmismatchoccurred,e f ectivelyimprovingtherobustnessofbeamformingalgorithm\Thesimulationresults showthattheimprovedalgorithmismorerobustthanthetraditionalalgorithm\Key words：speech enhancement；microphone array；sound localization；beamforming#time delay estimation2引言为提高生产生活质量和效率，人们期望通过语音来发送指令和控制设备，但在实际使用环境中存在着各种各样的干扰，因此需要使用语音增强方法来滤除噪音，增强有效语音。

麦克风阵列论文：基于麦克风阵列的语音增强系统设计

麦克风阵列论文：基于麦克风阵列的语音增强系统设计【中文摘要】语音增强的是去除语音信息中的噪声成分，它是语音信号处理领域中主要的研究内容之一。

然而，由于声源环境往往较为复杂，一般单一麦克风很难清晰的从环境中获取期望语音信号并进行增强处理。

因此，需要进行有效的噪声抑制，以增强语音信号的质量。

本文对基于麦克风阵列的语音增强算法进行研究，重点分析了时延估计和波束形成两种技术。

在时延估计方面，研究了相位变换加权的广义互相关时延估计算法性能，介绍了将广义互相关算法由双麦克风扩展应用至多麦克风的优化方法，给出了算法在0dB~10dB的信噪比下的性能分析。

在波束形成方面，研究了固定波束形成和自适应波束形成的算法性能，给出了不同麦克风阵列参数条件下的波束模式性能分析；并分析了在MVDR自适应波束形成算法中进行前置卡尔曼滤波的可行性，对卡尔曼滤波进行了仿真测试。

最后本文给出了完整的麦克风阵列系统设计，并对该系统的硬件和软件设计进行了论述，基于麦克风阵列的硬件电路具有功耗低、扩展性强等特点，可以较好的为麦克风阵列语音增强算法提供多通道语音信号。

【英文摘要】The main aim of speech enhancement is to pick up speechinformation from the speech signals with noise, in order to obtain highquality speech. But due to the existence of the noise diversity andenvironment reverberation, thespeech quality received by microphone isnot so good, which affects the speech intelligibility and the speechprocessing performance. So the effective noise suppression is necessaryto improve the speech signials quality.The work in this paper focuses on two key techniques based onmicrophone array: time delay estimation and beamforming. In the aspectof time delay estimation, the performance of phase transform weightedgeneralized cross correlation method is analyzed. Generalized crosscorrelation algorithm by dual microphones extended up to the multimicrophones is analysed. The performance analysis is given under0dB~10dB SNR. In the aspect of beamforming, an optimization method basedonKalman-filtering and MVDR adaptive beamforming isanalysed.Simulation shows the validity of this method. Finally, this paper presentsa viable microphone array speech enhancement system design. Theimplementation of the software and hardware of the system is dealt with in detail. Microphone array hardware circuit has low power consumptionand expansibility, which can provide multichannel speech signals.【关键词】麦克风阵列语音增强时延估计波束形成数字信号处理器【英文关键词】Microphone Array Speech Enhancement Timedelay estimation Beamforming DSP【目录】基于麦克风阵列的语音增强系统设计摘要4-5ABSTRACT5-6目录7-10Contents10-13第一章绪论13-17 1.1课题背景与研究意义13-14 1.2 麦克风阵列语音增强算法的发展和研究现状14-15 1.3 论文的研究内容和结构安排15-17第二章麦克风阵列时延估计技术研究17-29 2.1 引言17 2.2 麦克风阵列拓扑结构17-18 2.3 近场和远场声源模型18-20 2.4 广义互相关时延估计20-23 2.4.1 广义互相关算法基本原理20-21 2.4.2 PHAT 相位变换加权21-22 2.4.3 广义互相关算法扩展22-23 2.5 时延估计仿真分析23-27 2.6小结27-29第三章麦克风阵列波束形成技术研究29-49 3.1 引言29 3.2 传统波束形成技术29-33 3.2.1 固定波束形成29-30 3.2.2 自适应波束形成30-32 3.2.3 后置滤波波束形成32-33 3.3 前置卡尔曼滤波的 MVDR 波束形成33-37 3.3.1 整体原理框图说明33-34 3.3.2 卡尔曼滤波基本原理34-35 3.3.3 基于卡尔曼滤波的语音增强35-37 3.3.4 前置卡尔曼滤波的MVDR 波束形成算法性能分析37 3.4 波束形成仿真分析37-48 3.4.1 模型参数对固定波束形成的影响分析37-42 3.4.2 MVDR 波束形成性能分析42-44 3.4.3 卡尔曼滤波在波束形成前置处理的性能分析44-48 3.5 小结48-49第四章语音增强系统硬件设计49-59 4.1 引言49-50 4.2 硬件电路组成与性能指标50-51 4.3 硬件详细设计51-54 4.3.1 数字信号处理器选择51 4.3.2 多通道语音信号采集51-52 4.3.3 模拟放大电路设计52-53 4.3.4 AD73360 与 DSP 的传输时序设计53 4.3.5 工作电压选择与电源设计53-54 4.3.6 电路频率响应54 4.4 硬件电路主要构成器件54 4.5AD73360 与 DSP 的连接54-56 4.5.1 McBSP 数据传输方式54-55 4.5.2 SPI 模式下的电路连接55-56 4.6 DSP 接口设计与硬件方案56-58 4.6.1 系统时钟设计56-57 4.6.2 DSP 接口分配57 4.6.3 DSP 进行数据读取和数据处理的方案57-58 4.7 小结58-59第五章语音增强系统软件设计59-73 5.1 引言59-60 5.2 系统初始化60-65 5.2.1 C5509A 初始化60-61 5.2.2 McBSP 的 SPI 模式配置61-62 5.2.3 AD73360 配置62-64 5.2.4 USB 功能设计64-65 5.3 语音编码压缩原理与设计65-72 5.3.1 ADPCM 原理65-66 5.3.2 ADPCM 仿真分析66-71 5.3.3 ADPCM 在硬件上的设计71-72 5.4 小结72-73第六章结论与展望73-75 6.1 结论73 6.2 下一步研究工作73-75参考文献75-77致谢77-78研究成果及发表的学术论文78-79作者与导师简介79-80硕士研究生学位论文答辩委员会决议书80-81。

《基于麦克风阵列的声源定位技术研究》

《基于麦克风阵列的声源定位技术研究》一、引言随着科技的不断发展，声源定位技术在众多领域中扮演着越来越重要的角色。

麦克风阵列技术作为声源定位的核心手段，通过多麦克风组合和信号处理，能够实现精准的声源定位。

本文旨在探讨基于麦克风阵列的声源定位技术的研究现状、方法以及未来发展趋势。

二、麦克风阵列技术概述麦克风阵列是由多个麦克风按照一定几何布局组成的系统，用于收集声波信号并进行分析处理。

通过合理布置麦克风，阵列可以有效地提高声源定位的精度和稳定性。

麦克风阵列技术主要分为波束形成、到达时间差（TDOA）估计、到达方向（DOA）估计等方法。

三、声源定位技术研究现状1. 波束形成技术：波束形成是麦克风阵列中常用的一种声源定位方法。

它通过加权求和的方式将多个麦克风的信号进行空间滤波，从而形成指向特定方向的声波束。

波束形成技术具有较高的定位精度和鲁棒性，广泛应用于语音识别、语音增强等领域。

2. TDOA估计：TDOA估计是通过测量声波在不同麦克风间的传播时间差来估计声源位置的方法。

该方法具有较高的空间分辨率和较低的信号处理复杂度，适用于多种声源定位场景。

3. DOA估计：DOA估计是利用信号的到达方向信息来估计声源位置的方法。

它通过对信号进行频域分析，提取出信号的频率特征，进而确定声源的方位。

DOA估计方法具有较高的定位精度和实时性，适用于动态声源定位。

四、声源定位技术研究方法1. 传统算法：传统算法主要包括基于模型的方法和非模型的方法。

基于模型的方法通常依赖于预先设定的阵列响应模型，通过对接收信号进行分析，提取出声源位置信息。

非模型的方法则更多地依赖于信号的统计特性，如互相关函数等。

2. 深度学习算法：近年来，深度学习在声源定位领域得到了广泛应用。

通过构建神经网络模型，可以实现对声源位置的端到端预测。

深度学习算法具有较高的定位精度和鲁棒性，尤其适用于复杂环境下的声源定位任务。

五、未来发展趋势1. 多模态融合：将麦克风阵列技术与视觉、音频等其他传感器进行融合，实现多模态的声源定位和识别。

麦克风阵列信号处理算法研究

麦克风阵列信号处理算法研究麦克风阵列是指由多个麦克风组成的阵列，通过对阵列中麦克风信号的处理，可以实现信号的方向性增强、空间滤波和噪声抑制等效果。

因此，在语音识别、语音增强、远场语音采集等领域都有广泛的应用。

麦克风阵列可以形成的微弱信号从而提高语音识别的准确性。

与单一麦克风相比，麦克风阵列能够对方向性声源进行有效的捕捉，并且可以对噪声进行滤波抑制，对听觉信号进行增强处理。

然而，麦克风阵列系统的性能受多种因素影响，包括麦克风位置、信号处理算法等。

在麦克风阵列信号处理算法中，主要包括波束形成和方向估计两个方面。

波束形成是指对接收到的麦克风信号进行加权和相位校准，从而形成一个指向目标信号的波束；方向估计是指对目标信号的方向进行估计。

波束形成算法是麦克风阵列信号处理算法中的核心内容。

常见的波束形成算法包括广义旁瓣消除（Generalized Sidelobe Canceller，GSC）、最小均方（Minimum Mean Square Error，MMSE）和最大信噪比（Maximum Signal-to-Noise Ratio，MSNR）等。

广义旁瓣消除算法是一种基于自适应滤波的波束形成算法，其主要思想是通过在线更新权重系数，抑制麦克风阵列接收到的信号中的旁瓣干扰。

最小均方算法和最大信噪比算法则是一种基于统计建模的波束形成算法，通过对麦克风阵列中接收到的信号进行统计建模，进而实现信号的增强和噪声的滤波。

除了波束形成算法外，方向估计算法也是麦克风阵列信号处理算法中的重要内容。

常见的方向估计算法包括时延和相位差（Time Delay and Phase Difference，TDPD）算法、最大似然（Maximum Likelihood，ML）算法等。

时延和相位差算法是一种基于时间差信号处理的方向估计算法，可以通过对阵列中麦克风的时间差和相位差进行计算，从而估计目标信号的方向。

最大似然算法则是一种基于概率统计的方向估计算法，通过对阵列中接收到的信号进行统计建模，进而实现目标信号方向的估计。

一种基于麦克风阵列的宽带语音增强算法研究

【摘要】文章介绍了一种常见的固定波束形成技术——Ｄｓ波束形成器，针对语音信号特点，结合多通道自适应滤波技术，
利用归一化最小均方（ＭＳＮＬ）自适应算法，构造一个麦克风阵列宽带语音信号自适应降噪模型。通过采集真实环境下含噪语音，经过软件仿真验证了算法。试验表明，新模型的算法实现只在时域中进行，计算复杂度小，自适应部分收敛速度快，消噪
参见图２。）（）… （），ｘ（，，：为各通道麦克风延迟对齐
后在时刻月的信号序列。（，（一）＂月１）
，… 一
Ｌ１＋）１．，Ｍ为２．
第ｆ＋ＮＮ￣ＮＮ，横向滤波器的权值序列，ｆ为进入Ｍ个＿ｚｎ１
ｓｎ（）
（）ｎ
Ｄｓ波束形成器，结构简单，计算量小，易于实现，可以
同时削减环境中的相关噪声和不相关噪声。它不需要知道信号的模型及统计特性，也不会在语音信号中引入非线性失真。
（）多通道自适应滤波器三
，
假设系统期望信号为ｘｎ）（，有：
ａｎ＝（）（）２ｎ
Ｍ
只… ，ｄ是相邻麦克风之间的距离，是波前与阵列所
在直线所称的夹角，Ｃ是声速（室温时。３０）：４／。则延迟
时间Ｔ
．
Ｐ）ｎ一（＝（一（＝（ｎ ∑ （ｗ一＋））））ｋ１）
联合处理。因此，它可以弥补单个孤的麦克风在噪声处理、声源定位跟踪、语音提取分离等方而存在的不足，能够广泛序列，有：

音频信号处理中麦克风阵列算法的优化

音频信号处理中麦克风阵列算法的优化在当前的生产环节和个人娱乐中，音频信号处理的重要性越来越高。

麦克风阵列技术也在这个领域中得到了广泛的应用。

尽管麦克风阵列算法可以改善对语音的采集和平稳性，但是这个技术仍然有一定的局限性和不足之处。

针对这个问题，我们在本文中将探究音频信号处理中麦克风阵列算法的优化。

1.麦克风阵列技术的简介麦克风阵列技术是用于将多个麦克风组合起来，通过算法将多路信号合并为一个声音，主要用于语音识别和说话人识别。

它可以通过处理聚集的声音来提高对传输噪音的识别能力。

麦克风阵列通常包括线性阵列和环型阵列两种形式，它们的差别仅在于麦克风布局的形式不同。

每个麦克风都有不同的延迟时间，这取决于麦克风的位置，其他的因素也会对阵列的效果产生影响。

因此，为了有效使用多个麦克风，必须使用麦克风阵列算法来提高其性能。

2.麦克风阵列算法的常见问题多路信号的合并很有挑战性，因为它可能存在很多问题。

麦克风阵列算法的一个问题是声音来源的方向和实际传播路径之间的偏差。

这是因为声音可以反射或穿透障碍物，导致信号到达的顺序不同。

另一个问题是麦克风传输的信号强度不同，造成干扰。

此外，阵列算法也可能会遭受到噪声、混响和回声等问题，从而影响其性能。

3.优化麦克风阵列算法的途径麦克风阵列算法的性能可以通过以下方式优化：（1）声源定位声源定位是确定声源方向的过程。

声源方向的确定可以通过三角测量或拟合模型等方法实现。

一旦确定了声源的位置，就可以为其他阵列算法提供有关声源的重要信息。

（2）信号滤波器信号滤波器用于滤除频率响应差异和信号噪音等因素。

信号滤波器可以通过这个方法解决多路信号合并时的挑战，并提高麦克风阵列的效果。

（3）语音增强语音增强用于识别语音信号中的重要内容，这可以使麦克风阵列的识别更加准确和稳定。

对于噪声、混响和回声等问题，语音增强可以通过噪声抑制、自适应滤波和立体声互相关等技术解决。

4.麦克风阵列算法的局限性麦克风阵列算法的效果取决于麦克风的位置和布局。