正四面体麦克风阵列声源定位模型研究
- 格式:pdf
- 大小:336.07 KB
- 文档页数:5
《基于麦克风阵列的声源定向系统的研究与实现》篇一一、引言随着人工智能技术的飞速发展,声源定向系统在众多领域中扮演着越来越重要的角色。
麦克风阵列技术作为一种有效的声源定位手段,已广泛应用于安防监控、智能家居、机器人等领域。
本文旨在研究和实现基于麦克风阵列的声源定向系统,以提高声源定位的准确性和实时性。
二、麦克风阵列技术概述麦克风阵列是指将多个麦克风按照一定的几何布局排列,通过分析麦克风接收到的声波信号的时差、相位差和振幅差等信息,实现声源定位的技术。
根据阵列中麦克风的数量、排列方式和信号处理方法的不同,麦克风阵列技术可分为多种类型。
本文将采用常见的均匀线阵列技术进行研究和实现。
三、声源定向系统设计(一)系统架构设计基于麦克风阵列的声源定向系统主要包括信号采集、信号预处理、声源定位和结果输出四个部分。
其中,信号采集部分负责获取多个麦克风的音频信号;信号预处理部分对音频信号进行滤波、增强等处理;声源定位部分根据处理后的信号计算声源位置;结果输出部分将声源位置信息以可视化方式呈现。
(二)麦克风阵列布局与选型麦克风阵列的布局和选型对声源定位的准确性具有重要影响。
本文采用均匀线阵列布局,将多个同型号的高灵敏度麦克风按照一定间隔排列。
同时,为了降低环境噪声的干扰,选用具有较好抗噪性能的麦克风。
(三)信号处理方法针对麦克风阵列接收到的音频信号,本文采用时延估计和到达角度估计两种方法进行声源定位。
时延估计是通过对不同麦克风接收到的信号进行时间差分析,从而确定声源的方向;到达角度估计则是根据信号的相位差或振幅差计算声源的到达角度。
此外,为了进一步提高定位精度,本文还采用了多普勒效应等高级算法进行优化。
四、系统实现与实验分析(一)系统实现根据上述设计,我们开发了基于麦克风阵列的声源定向系统。
系统采用C++编程语言实现,并利用OpenCV等开源库进行图像处理和可视化展示。
同时,为了方便用户使用,我们还开发了友好的图形界面。
基于麦克风阵列的声源定位研究X邵怀宗,林静然,彭启琮,居太亮,徐异凌(电子科技大学通信学院,四川成都 610054)摘 要 基于麦克风阵列的声源定位是有效声源提取的前提和基础,其技术在多媒体通信中得到了广泛的应用.讨论了基于麦克风均匀线阵和均匀圆阵的声源定位方法,并进行了仿真,其结果表明这两种模型均能有效地提取出声源的位置.并给出了算法的硬件实现的原理框图.关键词:麦克风阵列;声源定位;原理图=中图分类号>T P37 =文献标识码>A =文章编号>1672)8513(2004)04-0256-30 引言基于麦克风阵列的声源定位广泛应用于具有嘈杂背景的语音通信环境,如会场、多媒体教室、车载电话等,以提高通信质量.麦克风阵列语音的定位和分离处理与传统的阵列信号处理主要有以下几种不同:(1)传统的阵列信号处理处理的信号一般是有一个调制载波的窄带信号,如通信信号和雷达信号等,而阵列麦克风处理的语音信号没有载波,其频率分布大部分集中在300~3000H z 之间,是一个多频宽带信号;(2)传统的阵列处理技术一般处理的信号为平稳或准平稳信号,而麦克风阵列处理的信号通常为非平稳语音信号;(3)传统的阵列处理一般采用远场模型,而麦克风阵列处理要根据不同的情况选择远场模型还是使用近场模型;(4)在传统的阵列处理中,噪声一般为高斯噪声(包括白、色噪声),与信源无关.在麦克风阵列处理中噪声既有高斯噪声,也有非高斯噪声(如室内的空调风机的噪声,打字机发出的干扰噪声,碎纸机的声音,突然出现的电话铃声等),这些噪声可能和信源无关,也有可能相关.基于上述阵列处理不同和区别,因此给麦克风阵列信号处理带来了极大的挑战,实际中的声源多位于麦克风阵列的近场[1]范围内,因此用于远场定位的算法和模型必须进行改进后才能使用.本文针对这种情况研究并讨论了两种基于麦克风阵列的近场模型声源定位方法,并给出了仿真结果和基于DSP 的硬件实现框图.1 阵列信号处理模型在这里,我们只讨论近场情况下的麦克风阵列语音定位方法.图1是一个简单基于均匀线阵近场模型,声波在传播过程中要发生幅度衰减,衰减因子与传播距离成正比.近场模型和远场模型最主要的区别在于是否考虑麦克风阵列各阵元接收信号的幅度差别.在图1中,q 为麦克风阵元的个数,r 为声源到阵列中心(参考点)的距离,A 为声源与阵元连线之间的夹角,r n 为声源到阵元n 的距离,d n 为阵元n 到参考点的距离,$d 为相邻阵元间距.图2为均匀圆阵的近场模型.多个麦克风均匀地排列在一个圆周上,图1均匀线阵近场模型图2 均匀圆阵近场模型X收稿日期:2004-05-08作者简介:邵怀宗(1970~),男,四川人,副教授,博士,主要从事通信中的信号处理、语音阵列信号处理的研究.第13卷第4期2004年10月云南民族大学学报(自然科学版)Journal of Yunnan Nationalities U niversity(N atural Sciences Edition)V ol.13,N o.4O ct.2004就构成了一个麦克风均匀圆阵列(Uniform Cir -cular Array,以下简称U CA).UCA 任意两个相邻麦克风对应的圆周角为2P /M ,M 为麦克风的个数.如图3所示.图3 均匀圆周麦克风阵列当信源离麦克风阵列较近时,人们熟知的基于平面波前的远场模型不再适用,必须采用更为精确也更为复杂的基于球面波前的近场模型.声波在传播过程中要发生幅度衰减,其幅度衰减因子与传播距离成正比.信源到麦克风阵列各阵元的距离是不同的,因此声波波前到达各阵元时,幅度也是不同的.近场模型和远场模型最主要的区别在于是否考虑麦克风阵列各阵元因接收信号幅度衰减的不同所带来的影响.对于远场模型,信源到各阵元的距离差与整个传播距离相比非常小,可忽略不计;对于近场模型,信源到各阵元的距离差与整个传播距离相比较大,必须考虑各阵元接收信号的幅度差.下面讨论近场模型的具体形式.U CA 的近场模型如图2所示,以UCA 中心(圆心O)作为参考点,d 0表示信源S 与阵列中心的距离;A 为信源到U CA 平面的垂足,以OA 连线所在的半径为参考线;1号麦克风所在半径与OA 夹角为$U ,H 表示信号到达方向(SO 与参考线的夹角),d i (i =1,2,,,M )表示信源到第个麦克风的距离.2 算法在这里主要采用改进的Music 算法对近场声源进行定位,既考虑到麦克风阵列各阵元接收信号的相位差,又考虑到各阵元接收信号的幅度差,从而实现对声源的二维(或三维)定位.根据声源的方位信息,可以使用波束形成技术获得形成一个或多个波束指向感兴趣的声源,从而更好地去噪,完成对该声源信号的提取和分离.由于可以利用的方位信息是二维的,因此,相应的波束具有二维特性.即除了对某一方向的信号有增强作用外,还能对同一方向、不同距离的信号有选择作用,这对于背景噪声和回声消除是非常有用的.3 仿真结果311 单个信源仿真条件为:均匀线阵麦克风阵列,信源个数为1,且信源为2个频率的多频信号,其方位坐标为(A 1,r 1)=(60b ,120cm),信号表达式为s =2sin(2P @1000n Fs )+sin(2P @2000@n Fs),信噪比为10dB.通过改进的M usic 算法估计信源数目和方位,结果如图4所示.图4 信源数目和方位估计信源数目:1信源1:A 1=60b ,r 1=120cm由仿真结果可知,信源个数为1时,通过改进的Music 算法可以准确估计出信源数目和方位,根据此参数,使用波束形成技术可准确分离出信号.312 多个信源仿真条件为:均匀线阵麦克风阵列,信源个数为2,其方位坐标分别为(A 1,r 1)=(30b 70cm)和(A 1,r 2)=(100b ,100cm),即两信源位于距参考点不同距离的圆周上,到达方向也不同.信噪比为10dB.通过改进的Music 算法估计信源数目和方位,结果如图5所示.同样说明改进的Music 算法正确地估计出了信源的数目和方位.313 均匀圆阵的初步仿真结果仿真条件是,信源1位于(112m,120b ),信源2位于(015m,60b ),其SNR=5dB.仿真结果如图6所示.257第4期 邵怀宗,等:基于麦克风阵列的声源定位研究图5 信源数目和方位估计(信源数目:2)信源1:A 1=30b ,r 1=70cm; 信源2:A 2=100b ,r 1=100cm图6 基于均匀圆阵的声源定位A 1=120b ,H 1=112m; A 2=60b ,H 2=015m图7 系统设计图仿真结果表明,基于圆阵列的模型同样可以有效的给声源定位,这为后续的波束形成和语音提取提供了有效依据.4 系统软硬件实现方案实现上述算法需要一个多通道的信号处理硬件平台,但目前国内没有类似的产品.因此,我们自主开发了一款基于TM SC3206711的阵列语音信号处理通用平台,它能满足大多数情况下阵列语音实时处理的要求.图7为系统设计方案.通过多通道AD 前端,系统能够同时采样多达12路的语音信号;采样信号通过T I DSP 特有的M cBSP 串口送入TM S320C6711中进行处理;处理完的信号通过DA 还原语音;CPLD 完成整个系统的逻辑控制,以便更好的解放DSP 进行数据处理;通过EM IF 接口外扩的SDRAM 是为了满足大数据量的需要.5 结论前面的仿真结果表明,该文提出的算法达到了如下的性能指标:定位距离:半径2米;受限于麦克风阵列的灵敏度,目前的定位距离不是系统的上限;定位精度:角度的定位精度为?10b ,距离的定位精度为?10cm ;刷新率:2次/s,即每秒钟更新2次.定位正确率:角度的定位正确率在90%以上,距离的定位正确率在70%以上;即对角度的定位误差有90%以上的概率落在以内,对距离的定位误差有70%以上的概率落在以内.(该项研究获得/2003~2004年度T I-DSP 大奖赛0中国赛区算法组第二名).参考文献:[1] KEN NEDY R.Broadband nearfield beamforming using a radial beampattern transfo rmation[J].IEEE T r ans on Signal Pr ocess,1998,46(8):2147-2156.[2] ASA NO F,A SOH H,M AT SU I T.Sound Source L ocalization and Separ atio n in N ear Field[J].I EI CE T rans on Fundamental,2000,E83-A(11):2286-2294.[3] SA LT ZM AN H,ST AV IS G.A dual beam planar antenna for Janus type Doppler navigation systems[R].IRE International Con -vention Record,1958(6):240-247.[4] HA RM AN CI K.Relat ionships between adaptive minimum variance beamforming and optimal source lo calization[J].IEEET rans on Sig nal Pr ocess,2000,48(1):56-59.(下转第267页)258云南民族大学学报(自然科学版) 第13卷参考文献:[1] 赵凯华,陈熙谋.电磁学[M]1第2版.北京:高等教育出版社,1991.188.[2] M O ON P,SPEN CER D E 1Field T heory Handboo k,I ncluding Coordinate Systems,Differential Equat ions,and T heir Solutions2nd[M ]1N ew Yor k:Springer-Verlag ,1988.40-44.[3] 白洪波1两带电半椭球壳之间的相互作用[J].大学物理,1999,11(18):22-24.[4] 王竹溪,郭敦仁1特殊函数论[M ]1北京:北京大学出版社,2001.565-5681[5] 郭硕宏.电动力学[M ].第2版.北京:高等教育出版社,1999.57-60.Rescarch on the direction of the polarization field strength in the Dielectric ellipsoid base on the ellipsoidal coordinatesKANG Dong(College of Applied Nuclear Technology and Automation Engineering,Cheng du U niversity of Technology ,Cheng du 610059,China)Abstract :Calculated the included angle value of polarization vector with the external field vector in the dielec -tric ellipsoid,hold that the directions of them are not always strict antiparallel 1Key words :dielectric ellipsoid;ellipsoidal coordinates;polarization field strength(责任编辑:杨多立)(上接第258页)Study on localization for speech based on microphone arraySHAO H ua-i zong,LIN Jing -ran,PENG Q-i cong,JU Ta-i liang ,XU Y-i ling(School of Communication,U niversity of Electronic Science and Technology,Chengdu 610054,China )Abstract :Speech sources localization based on m icrophone array is the basic for extraction of the interesting speech source,w hich is applied broadly in multimedia communication.In this paper,the methods for speech sources localization based on uniform linear array and on uniform circular array are discussed,and their dig ital simulation have been taken.The simulation results show that they can effectively extract the localization of speech source.The hardw are scheme to implement these algorithms have been given in this paper.Key words :m icrophone array;speech sources localization;hardw are scheme(责任编辑:高 飞)267第4期 康 东:电介质椭球内极化场强方向的研究。
《基于麦克风阵列的声源定向系统的研究与实现》篇一一、引言声源定向技术是一种用于确定声波传播方向的技术。
随着现代科技的发展,麦克风阵列技术逐渐成为声源定向系统的重要手段。
本文将详细介绍基于麦克风阵列的声源定向系统的研究背景、目的及意义,并探讨其实现方法和应用前景。
二、麦克风阵列技术概述麦克风阵列是指将多个麦克风按照一定规则排列,通过分析声波在传播过程中到达不同麦克风的相位差和强度差,实现声源定向的技术。
麦克风阵列技术具有较高的定位精度和抗干扰能力,广泛应用于语音识别、机器人听觉、安全监控等领域。
三、声源定向系统研究(一)系统架构设计基于麦克风阵列的声源定向系统主要包括信号采集、预处理、特征提取、定位算法和输出五个部分。
信号采集阶段,麦克风阵列捕捉来自各个方向的声波信号;预处理阶段,对采集到的信号进行滤波、增益控制等处理;特征提取阶段,从预处理后的信号中提取出有用的信息,如时延、强度等;定位算法阶段,根据提取的特征信息,运用合适的算法进行声源定位;最后,输出阶段将定位结果以可视化的方式呈现出来。
(二)定位算法研究定位算法是声源定向系统的核心部分。
常见的定位算法包括基于时延估计的算法、基于到达角度的算法和基于声音强度比的算法等。
本文将重点研究基于时延估计的算法,通过分析声波在不同麦克风间的传播时延,实现声源定位。
同时,针对不同场景和需求,探讨其他定位算法的适用性和优化方法。
四、系统实现(一)硬件实现硬件部分主要包括麦克风阵列、信号处理器和显示器等。
麦克风阵列采用多个高灵敏度的麦克风,按照一定规则排列,以捕捉来自各个方向的声波信号。
信号处理器对采集到的信号进行预处理和特征提取,然后将处理后的数据传输至定位算法模块。
显示器用于呈现定位结果,方便用户观察和分析。
(二)软件实现软件部分主要包括信号处理、特征提取和定位算法等模块。
信号处理模块对采集到的声波信号进行滤波、增益控制等预处理操作。
特征提取模块从预处理后的信号中提取出有用的信息,如时延、强度等。
麦克风阵列原理 The document was finally revised on 20211 麦克风阵列麦克风阵列,是一组位于空间不同位置的全向麦克风按一定的形状规则布置形成的阵列,是对空间传播声音信号进行空间采样的一种装置,采集到的信号包含了其空间位置信息。
根据声源和麦克风阵列之间距离的远近,可将阵列分为近场模型和远场模型。
根据麦克风阵列的拓扑结构,则可分为线性阵列、平面阵列、体阵列等。
(1) 近场模型和远场模型声波是纵波,即媒质中质点沿传播方向运动的波。
声波是一种振动波,声源发声振动后,声源四周的媒质跟着振动,声波随着媒质向四周扩散,所以是球面波。
根据声源和麦克风阵列距离的远近,可将声场模型分为两种:近场模型和远场模型。
近场模型将声波看成球面波,它考虑麦克风阵元接收信号间的幅度差;远场模型则将声波看成平面波,它忽略各阵元接收信号间的幅度差,近似认为各接收信号之间是简单的时延关系。
显然远场模型是对实际模型的简化,极大地简化了处理难度。
一般语音增强方法就是基于远场模型。
近场模型和远场模型的划分没有绝对的标准,一般认为声源离麦克风阵列中心参考点的距离远大于信号波长时为远场;反之,则为近场。
设均匀线性阵列相邻阵元之间的距离(又称阵列孔径)为d,声源最高频率语音的波长(即声源的最小波长)为λmin,如果声源到阵列中心的距离大于2d2/λmin,则为远场模型,否则为近场模型,如图1所示。
图1近场模型和远场模型(2) 麦克风阵列拓扑结构按麦克风阵列的维数,可分为一维、二维和三维麦克风阵列。
这里只讨论有一定形状规则的麦克风阵列。
一维麦克风阵列,即线性麦克风阵列,其阵元中心位于同一条直线上。
根据相邻阵元间距是否相同,又可分为均匀线性阵列(Uniform Linear Array,ULA)和嵌套线性阵列,如图2所示。
均匀线性阵列是最简单的阵列拓扑结构,其阵元之间距离相等、相位及灵敏度一直。
嵌套线性阵列则可看成几组均匀线性阵列的叠加,是一类特殊的非均匀阵。
麦克风声源定位原理_⼀种利⽤麦克风阵列进⾏声源定位的⽅法与流程本发明涉及计算机信号处理领域,具体涉及⼀种⽤麦克风阵列时延估计定位声源的⽅法。
背景技术:20世纪80年代以来,麦克风阵列信号处理技术得到迅猛的发展,并在雷达、声纳及通信中得到⼴泛的应⽤。
这种阵列信号处理的思想后来应⽤到语⾳信号处理中。
在国际上将麦克风阵列系统⽤于语⾳信号处理的研究源于1970年。
1976年,Gabfid将雷达和声纳中的⾃适应波束形成技术直接应⽤于简单的声⾳获取问题。
1985年,美国AT&T/Bell实验室的Flanagan采⽤21个麦克风组成现⾏阵列,⾸次⽤电⼦控制的⽅式实现了声源信号的获取,该系统采⽤简单的波束形成⽅法,通过计算预先设定位置的能量,找到具有最⼤能量的⽅向。
同年,Flanagan等⼈⼜将⼆维麦克风阵列应⽤于⼤型房间内的声⾳拾取,以抑制混响和噪声对声源信号的影响。
由于当时技术的制约,使得该算法还不能够借助于数字信号处理技术以数字的⽅式实现,⽽主要采⽤了模拟器件实现,1991年,Kellermann借助于数字信号处理技术,⽤全数字的⽅式实现了这⼀算法,进⼀步改善了算法的性能,降低了硬件成本,提⾼了系统的灵活性。
随后,麦克风阵列系统已经应⽤于许多场合,包括视频会议、语⾳识别、说话⼈识别、汽车环境语⾳获取、混响环境声⾳拾取、声源定位和助听装置等。
⽬前,基于麦克风阵列的语⾳处理技术正成为⼀个新的研究热点,但相关应⽤技术还不成熟。
技术实现要素:鉴于麦克风阵列的声源定位⽅法具有⼴泛的应⽤前景和潜在的经济效益,本发明旨在提供⼀种利⽤麦克风阵列进⾏声源定位的⽅法,以期应⽤在包括语⾳识别、强噪声环境下的语⾳获取、⼤型场所的会议记录、声⾳检测和助听装置等领域。
为实现上述⽬的,本发明采⽤以下技术⽅案:⼀种利⽤麦克风阵列进⾏声源定位的⽅法,包括时延估计和声源定位,其特征在于:⾸先,通过算法估计声源信号到达阵列中麦克风阵元的相对时间差;第⼆步则利⽤估计时间差来计算出声源到达各阵元的距离差,然后结合阵列拓扑结构⽤⼏何算法或搜索确定声源位置。
《基于麦克风阵列的声源定向系统的研究与实现》篇一一、引言随着人工智能技术的飞速发展,声源定向系统在众多领域中扮演着越来越重要的角色。
基于麦克风阵列的声源定向系统,通过多麦克风的协同工作,能够实现对声源的精准定位和追踪。
本文将详细介绍基于麦克风阵列的声源定向系统的研究背景、意义、方法及实现过程。
二、研究背景与意义声源定向技术广泛应用于安防监控、智能家居、语音交互等领域。
传统的单麦克风系统在复杂环境下的声源定位能力有限,而基于麦克风阵列的声源定向系统能够通过多个麦克风的协同工作,提高声源定位的准确性和稳定性。
因此,研究基于麦克风阵列的声源定向系统具有重要的理论价值和应用意义。
三、相关技术综述1. 麦克风阵列技术:麦克风阵列是由多个麦克风按照一定几何排列组成的系统,能够通过对声音信号的空间分布进行分析,实现对声源的定位和追踪。
2. 声源定位算法:声源定位算法是声源定向系统的核心,主要包括基于时差法、基于到达角度法等。
这些算法通过分析声音信号在传播过程中的时间差、相位差等信息,实现对声源的定位。
四、系统设计与实现1. 系统架构设计:本系统采用分布式架构,包括数据采集层、信号处理层和应用层。
数据采集层负责收集多个麦克风的音频数据,信号处理层对音频数据进行处理和分析,应用层则根据定位结果进行相应的操作。
2. 麦克风阵列布置:根据实际需求和场景,选择合适的麦克风阵列布置方式,如线形阵列、平面阵列等。
布置时需考虑阵列元素间的距离、角度等因素,以优化声源定位效果。
3. 声源定位算法实现:本系统采用基于时差法的声源定位算法。
首先对多个麦克风的音频数据进行预处理,包括降噪、滤波等操作;然后通过计算声音信号在传播过程中的时间差,实现对声源的定位。
4. 系统测试与优化:对系统进行实际测试,分析定位结果的准确性和稳定性。
根据测试结果对系统进行优化,包括调整麦克风阵列布置、改进声源定位算法等。
五、实验结果与分析1. 实验设置:在室内和室外环境下进行实验,分别测试系统在不同噪声条件下的性能。
基于麦克风阵列的声源定位与语音增强方法研究共3篇基于麦克风阵列的声源定位与语音增强方法研究1随着数字通信技术的发展,声音信号处理已经成为了一个十分紧迫的问题。
由于现实环境中的各种干扰,音频信号可能会失真、弱化或干扰。
因此,对于一些需要精确处理声音的领域,比如语音识别、人机交互、视频会议等,如何有效的增强和定位声源就成为了一个十分重要的技术问题。
本文将从基于麦克风阵列的声源定位和语音增强两个方向分别进行研究并提供当前的一些方法及趋势。
一、声源定位声源定位是指通过分析进入麦克风阵列的声波,根据信号到达不同麦克风时差,来估计声源位置的过程。
其基本过程通常可以分为几个部分。
1、麦克风位置校准为了进行精确的声源定位,需要首先确定麦克风阵列的摆放位置。
通常的方法是通过一些定位仪器或自主机器人,将麦克风阵列在空间中的坐标位置进行测量并校准。
2、声波同步为了进行声源的到达时间分析,需要在各个麦克风间建立同步时钟。
通过将麦克风的信号进行时间同步,我们就能够进一步分析声源的到达时间差。
3、时差计算在排好位置并将麦克风信号同步后,使用时差估计算法计算麦克风之间信号到达的时间差。
对于小间距的麦克风阵列,我们可以采用信号交叉相关函数法(time delay estimation method);而对于大间距阵列,我们则可以采取声波到达角度的算法(angle of arrival estimation method)。
4、声源定位麦克风到达时间差后,声源定位应该是一个比较简单的问题。
基于规则的几何算法以及最小二乘法都是当前普遍使用的方法之一。
其中,最小二乘法因其具有较高的求解精度和易于实现的特点而受到了广泛的关注。
二、语音增强语音增强是指在复杂的背景噪声环境下,对语音信号进行降噪、去回声、声音增益等一系列信号处理操作的过程,以实现语音信号的最佳信噪比增益。
一些常用的方法包括:1、基于小波分解的语音增强基于小波分解的语音增强利用小波分析方法分离语音信号中的噪声和有用信号。
一种基于麦克风阵列的声源定位算法研究一种基于麦克风阵列的声源定位算法研究引言基于麦克风阵列的http://LWlm声源定位是声学信号处理领域中的一个重要问题。
麦克风阵列声源定位技术是指利用空间分布的多路麦克风拾取声音信号,通过对麦克风的多路输出信号进行分析和处理,得到一个或多个声源的位置信息。
尽管可将用于声纳和雷达系统的波束形成技术引入麦克风阵列,但由于语音信号为宽带信号,具有短时平稳特性,且所处环境还具有高混响,噪声大等特点,这些算法针对语音信号的定位精度非常低,需要对算法进行改进。
一般来说,常用的声源定位算法划分为三类[4]:一是基于波束成型的方法;二是基于高分辨率谱估计的方法;三是基于波达时延差(TDOA)的方法。
其中基于波束成形方法通过对麦克风阵列接收信号进行滤波、加权求和,直接控制麦克风阵列指向使波束具有最大输出功率的方向,可在目标源多于一个的条件下对多声源进行定位[5],但存在对初值敏感的问题。
另外还需要知道声源和噪声的先验知识,该方法存在计算量大,不利于实时处理等缺点。
基于高分辨率谱估计的方法在理论上可以对声源的方向进行有效估计,但由于该算法是针对窄带信号,因此若要获得较理想的精度,就要付出很大的计算量代价。
此外这些算法无法处理高度相关的信号,因此混响会给算法的定位精度带来较大影响[6]。
基于时延估计的方法是利用广义互相关等时延估计算法求出信号到阵列不同麦克风的相对时延,并利用时延信息与麦克风阵列的空间位置关系估计声源位置。
该方法计算量小,易于实时实现,近年来得到了高度重视。
本文主要采用基于时延估计的方法进行声源定位。
1 基于TODA方法的基本原理利用TDOA进行声源定位可分为两个部分:首先,通过采用广义互相关方法(GCC)[7]等,并利用平滑相干变换(Smoothed Coherence Transform,SCOT)、相位变换(Phase Transform,PHAT)或最大似然(Maximum Likelihood,ML)进行加权,得出声源到两两麦克风之间的时延差。
麦克风阵列的语音定位和跟踪方法研究的开题报告
一、研究背景
近年来,随着语音识别技术的快速发展,语音定位和跟踪技术也愈加成熟,受到了广泛关注。
麦克风阵列是一种集成了多个麦克风的声音接收装置,可用于实现语音信号的定位和跟踪。
因此,在本研究中,我们将探讨麦克风阵列的语音定位和跟踪方法,以实现更加精准的语音信号处理。
二、研究目的
本文旨在研究麦克风阵列的语音定位和跟踪方法,提高语音信号的处理精度,为语音识别技术的研究提供基础。
三、研究内容
本文将对麦克风阵列的语音定位和跟踪方法进行研究,主要包括以下几个方面:
1、麦克风阵列的原理及结构介绍;
2、语音信号的定位和跟踪技术综述;
3、麦克风阵列的语音定位方法研究;
4、麦克风阵列的语音跟踪方法研究;
5、实验分析和结果分析。
四、研究意义
本研究旨在提高麦克风阵列的语音定位和跟踪技术水平,为语音信号处理提供更加准确的数据支持。
同时,本研究的成果可为人机交互、智能语音识别等领域提供技术支持。
五、研究方法
本研究采用文献分析、实验验证等方法进行研究,通过实验验证的
方式对所提出的方法进行检验和改进。
六、预期成果
经过研究,本文预计可以得出较为准确的麦克风阵列语音定位和跟
踪方法,并在实验中进行验证。
最终达成提高语音信号处理精度的目标。
科技成果——麦克风阵列声源识别、定向和定位技术成果简介
利用麦克风阵列技术准确定向声源,采用模式识别技术辨别并区分话音和其它声响,采用时延和几何方法确定声源方位,实时处理,算法稳定,抗噪能力强。
应用于监控摄像头辅助系统(引导摄像头转向异常方向,标定录像带中的异常时刻,异常情况时报警等),室内防盗系统(识别破门破窗等异常声响并录音或报警),办公室夜间防盗系统(识别并定向或定位夜间出现的各类异常声响并录音或报警),交通监控系统,保护区监控系统(如偷猎者方位,非法车辆识别、定位和报警等),视像会议系统中的话者定向,机械异常声响识别和定位,基于麦克风阵列的语音获取系统的话者定向或定位,灾场搜寻系统(机器人载,无人机载,营救人员穿戴)。
项目水平国内领先
成熟程度样机
合作方式
合作开发、专利许可、技术转让、技术入股。
《基于麦克风阵列的声源定位技术研究》一、引言声源定位技术在现代音频处理、智能监控和人机交互等领域有着广泛的应用。
其中,基于麦克风阵列的声源定位技术,由于能够有效地进行空间定位,因此在军事、安全监控、语音交互等方面备受关注。
本文将重点介绍基于麦克风阵列的声源定位技术的研究现状、原理及方法,并探讨其未来的发展趋势。
二、声源定位技术的研究现状目前,声源定位技术主要分为两大类:基于传声器阵列的声源定位技术和基于声音传播特性的声源定位技术。
其中,基于麦克风阵列的声源定位技术以其高精度、高效率的特点在众多领域得到了广泛应用。
该技术通过多个麦克风组成的阵列,利用声音到达不同麦克风的时延差异,实现声源的定位。
三、麦克风阵列声源定位原理及方法1. 原理麦克风阵列声源定位技术主要依据声音传播的时延差异和阵列信号处理技术实现。
当声音传播到麦克风阵列时,由于不同麦克风之间的距离不同,导致声音到达各麦克风的时延存在差异。
通过测量这些时延差异,并结合阵列信号处理技术,即可实现对声源的定位。
2. 方法(1)基于时延估计的声源定位方法:该方法通过估计声音到达不同麦克风的时延,结合麦克风阵列的几何关系,计算出声源的位置。
(2)基于模式识别的声源定位方法:该方法利用机器学习、深度学习等技术,对声音信号进行特征提取和模式识别,从而实现对声源的定位。
(3)基于多传感器融合的声源定位方法:该方法将麦克风阵列与其他传感器(如摄像头、雷达等)进行融合,综合利用多种传感器的信息实现声源的精准定位。
四、声源定位技术的应用基于麦克风阵列的声源定位技术在众多领域有着广泛的应用。
在军事领域,可用于目标探测、战场监控等;在安全监控领域,可用于视频监控系统的音频辅助定位;在人机交互领域,可用于语音识别、智能音响等。
此外,该技术还可应用于医疗、娱乐等领域。
五、未来发展趋势随着人工智能、物联网等技术的不断发展,基于麦克风阵列的声源定位技术将迎来更广阔的应用前景。
《基于麦克风阵列的声源定位技术研究》一、引言随着科技的不断发展,声源定位技术在众多领域中扮演着越来越重要的角色。
麦克风阵列技术作为声源定位的核心手段,通过多麦克风组合和信号处理,能够实现精准的声源定位。
本文旨在探讨基于麦克风阵列的声源定位技术的研究现状、方法以及未来发展趋势。
二、麦克风阵列技术概述麦克风阵列是由多个麦克风按照一定几何布局组成的系统,用于收集声波信号并进行分析处理。
通过合理布置麦克风,阵列可以有效地提高声源定位的精度和稳定性。
麦克风阵列技术主要分为波束形成、到达时间差(TDOA)估计、到达方向(DOA)估计等方法。
三、声源定位技术研究现状1. 波束形成技术:波束形成是麦克风阵列中常用的一种声源定位方法。
它通过加权求和的方式将多个麦克风的信号进行空间滤波,从而形成指向特定方向的声波束。
波束形成技术具有较高的定位精度和鲁棒性,广泛应用于语音识别、语音增强等领域。
2. TDOA估计:TDOA估计是通过测量声波在不同麦克风间的传播时间差来估计声源位置的方法。
该方法具有较高的空间分辨率和较低的信号处理复杂度,适用于多种声源定位场景。
3. DOA估计:DOA估计是利用信号的到达方向信息来估计声源位置的方法。
它通过对信号进行频域分析,提取出信号的频率特征,进而确定声源的方位。
DOA估计方法具有较高的定位精度和实时性,适用于动态声源定位。
四、声源定位技术研究方法1. 传统算法:传统算法主要包括基于模型的方法和非模型的方法。
基于模型的方法通常依赖于预先设定的阵列响应模型,通过对接收信号进行分析,提取出声源位置信息。
非模型的方法则更多地依赖于信号的统计特性,如互相关函数等。
2. 深度学习算法:近年来,深度学习在声源定位领域得到了广泛应用。
通过构建神经网络模型,可以实现对声源位置的端到端预测。
深度学习算法具有较高的定位精度和鲁棒性,尤其适用于复杂环境下的声源定位任务。
五、未来发展趋势1. 多模态融合:将麦克风阵列技术与视觉、音频等其他传感器进行融合,实现多模态的声源定位和识别。
基于麦克风阵列的声源定位技术摘要声源定位技术是利用麦克风拾取语音信号,并用数字信号处理技术对其进行分析和处理,继而确定和跟踪声源的空间位置。
声源定位技术在视频会议、语音识别和说话人识别、目标定位和助听装置等领域有着重要的应用。
传统的单个麦克风的拾音范围很有限,拾取信号的质量不高,继而提出了用麦克风阵列进行语音处理的方法,它可以以电子瞄准的方式对准声源而不需要人为的移动麦克风,弥补单个麦克风在噪声处理和声源定位等方面的不足,麦克风阵列还具有去噪、声源定位和跟踪等功能,从而大大提高语音信号处理质量。
本文主要对基于多麦克风阵列的声源定位技术领域屮的基于时延的定位理论进行了研究,在此基础上研究了四元阵列、五元阵列以及多元阵列的定位算法,并且分别对其定位精度进行了分析,推导出了影响四元、五元阵列目标方位角、俯仰角及目标距离的定位精度的一些因素及相关定位方程,并通过matbb仿真软件对其定位精度进行了仿真;最后在四元、五元阵列的基础上,采用最小二乘法对多元阵列定位进行了计算;通过目标计算值和设定值对比,对多元阵列的定位精度进行了分析,并得出了多元阵列的目标定位的均方根误差。
关键词:麦克风阵列,声源定位,时延,定位精度,均方根误差Based on Microphone Array for Sound Source Localization ResearchAbstractSound source positioning technology is to use the microphone to pick up voice signals, and digital signal processing technology used for their analysis and processing , Then identify and track the spatial location of sound source ・ Acoustic source localization techniques have a variety of important uses in videoconferencing, speech recognition and speaker identification, targets' direction finding, and biomedical devices for the hearing impaired・ The pick up range of traditional single microphone is limited, the signal quality picked up is not high, t hen a voice processing met hods with the microphone array has been proposed . It may be electronically aimed to provide a high-quality signal from desired source localization and does not require physical movement to alter these microphones' direction of reception. Microphone array has the functions of de-noising, sound source localization and tracking functions, which greatly improved the quality of voice signal processing.The article discusses some issues of sound source localization based on microphone array, Ont he basis , it stu dies a four element array, five element array and an multipie array positioning algorithm, t hen the positioning precision is analyzed. Derived some factors of the azimuth and elevation angle targets the target range of the estimation precision affected and positioning equation. And through MATLAB simulation software for its positioningaccuracy of Simulation. finally , based on four yuan, five yuan of array, using the least square met hod , the multiple array localiza tion were calcula ted. Through the cont ras t of the t arge t value and set value, multi pie array positioning accuracy is analyzed, and the of diverse array target positioning・Keywords: Microphone Array, Sound Source Localization, Time Delay, Positioning precision , root mean square error1 引言 (1)1.1研究背景和意义 (1)1.2声源定位技术的研究现状及发展 (2)研究历史和现状 (1)发展趋势 (3)1.3麦克风声源定位技术 (5)1.4本文所要研究的内容 (6)2声学理论基础知识 (7)2.1空气的物理特性 (7)2.2声波的物理特性 (8)2.3声波在空气中的传播特性 (12)2.4声源定位原理 (13)2.5 本章小结 (14)3基于时延估计的声源定位算法及其精度分析 (15)3.1时延估计算法概述 (15)3.2基于时延估计的声源定位的研究分析 (16)四元阵列定位算法 (17)五元阵列定位算法 (20)3.3四元阵列的定位精度分析及其仿真 (21)方位角精度分析及仿真 (23)俯仰角精度分析及仿真 (25)距离估计精度分析及仿真 (27)3.4五元阵列的定位精度分析及其仿真 (29)方位角精度分析及仿真 (29)俯仰角精度分析及仿真 (32)距离估计精度分析及仿真 (34)3.5 本章小结 (36)4多元麦克风阵列声源定位分析 (37)4.1多元麦克风阵列定位方程 (37)4.2最小二乘法求声源位置 (30)4.3定位精度分析 (40)4.4结果及计算分析 (41)4.4 本章小结 (33)5 总结与展望 (43)5.1全文总结 (43)5.2本文的不足之处及后续工作展望 (44)参考文献 (46)致谢 (49)1引言1.1研究背景和意义在各种电子设备高度智能化的今天,语音增强与声源定位技术成为语音通信领域中两种不可缺少的技术。
《室内环境下麦克风阵列声源定位研究》篇一一、引言随着人工智能的飞速发展,声音识别技术日益受到研究者的关注。
在众多的声音识别技术中,声源定位技术凭借其重要的应用价值,正逐渐成为研究的热点。
特别是在室内环境下,麦克风阵列声源定位技术以其高精度、高效率的特点,在智能语音交互、安防监控、会议系统等领域有着广泛的应用前景。
本文将重点研究室内环境下麦克风阵列声源定位的相关技术及方法。
二、麦克风阵列声源定位技术概述麦克风阵列声源定位技术是指利用多个麦克风的组合,通过信号处理和分析,实现对声源位置进行精确估计的技术。
其基本原理是利用不同麦克风接收到的声音信号的相位差、时间差等信息,结合阵列几何结构,通过算法处理,实现对声源位置的估计。
三、室内环境下麦克风阵列声源定位的挑战尽管麦克风阵列声源定位技术在许多方面取得了显著的进展,但在室内环境下仍面临一些挑战。
首先,室内环境复杂多变,存在多径效应、混响等现象,这会导致声音信号在传播过程中发生畸变,从而影响声源定位的准确性。
其次,室内环境中可能存在多个声源,这会增加声源定位的难度。
此外,麦克风的性能、阵列结构等因素也会对声源定位的效果产生影响。
四、室内环境下麦克风阵列声源定位的关键技术针对室内环境下的声源定位挑战,研究者们提出了许多关键技术。
首先,高精度的信号处理技术是关键。
这包括对声音信号的预处理、特征提取、信号分离等技术,以获取更准确的声源信息。
其次,阵列几何结构的优化也是提高声源定位精度的关键因素。
合理的阵列结构可以更好地接收和利用声音信号的相位差、时间差等信息。
此外,多声源识别与分离技术也是重要的研究方向。
通过分析不同声源的声音信号特征,实现多声源的识别与分离,从而提高声源定位的准确性。
五、研究方法与实验结果针对室内环境下的麦克风阵列声源定位问题,本文提出了一种基于深度学习的声源定位方法。
该方法利用深度神经网络对声音信号进行特征提取和分类,结合麦克风阵列的几何结构,实现对声源位置的精确估计。
基于TDOA的声源定位模型中阵列位姿与定位误差之间关系的研究孙昊;仲维灿;刘贺洋;祖丽楠【摘要】基于声达时间差(TDOA)和正四面体麦克风阵列的声源定位模型中,影响定位的精度的因素除了阵元安装的位置误差、时间延迟和环境噪声之外,还受到阵列自身位姿的影响,麦克风阵列位姿的不确定,其直接导致声达时间差的不确定,进而影响定位结果.以全范围内声源目标定位为应用背景,利用基于RBF神经网络声源定位模型研究麦克风阵列位姿的不确定对声源定位误差产生的影响.【期刊名称】《河北工业大学学报》【年(卷),期】2014(043)005【总页数】7页(P8-14)【关键词】声达时间差;声源定位模型;阵列位姿;RBF神经网络【作者】孙昊;仲维灿;刘贺洋;祖丽楠【作者单位】河北工业大学控制科学与工程学院,天津300130;河北工业大学控制科学与工程学院,天津300130;河北工业大学控制科学与工程学院,天津300130;河北工业大学控制科学与工程学院,天津300130【正文语种】中文【中图分类】TP242.6基于麦克风阵列的语音信号处理技术早已成为研究的热点,具有广泛的实际意义和应用前景[1].运用麦克风阵列进行声源定位是语音信号处理领域的重要内容,麦克风阵列是指由若干个麦克风按照一定的几何结构排列而形成的阵列,该阵列可以接收空间声源信号,并对接收到的声源信号进行空时处理.基于麦克风阵列的声源定位技术早已在军事侦察,雷达和机器人听觉定位等方面得到了广泛的应用[2].基于声达时间差的麦克风阵列声源定位技术分为两个步骤进行,首先估计阵列中阵元间声达时间差(TDOA);然后利用已获取的 TDOA,结合阵元的空间坐标求出声源的位置[3].然而,根据麦克风阵列的模型和声源传播模型构建的声源定位模型是一组复杂的非线性方程,一般的方法是通过求解方程组得到时延和声源坐标的数值关系.但是在解方程组的过程中进行简化运算,从而约减得到近似的结果.但是当声源位于近场时,即当阵列中麦克风之间的距离相对于声源到阵列的距离不能忽略时,此时假设和约减就不能成立了,这样也减少了声源定位模型的适用范围.然而人工神经网络不仅提供了解决复杂的非线性问题的方法并且可以按照给定的精度逼近复杂的非线性系统[4].因此,可以应用神经网络表达这种复杂的非线性方程,实验表明该算法运算速度快、声源定位精度高、鲁棒性好.本文采用正四面体麦克风阵列,利用基于 RBF 神经网络声源定位模型,研究全范围内(即目标声源在近场及远场的环境下)麦克风阵列位姿的不确定对定位的方位角和俯仰角的误差产生的影响.正四面体阵列具有结构简单,性能优良的特点,相对于平面阵列此阵列对于二维和三维空间内的目标声源具有良好的定位性能[5].假设目标声源目标 S ,空间坐标为 x,y,z ,阵列由 4 个全向型麦克风组成正四面体结构,其中每个麦克风之间的距离即正四面体的棱长 a=0.24m.图1 表示正四面体麦克风阵列模型.声源 S 在平面上的投影为 S',是 OS'与 x 正方向的夹角,为声源的方位角是与轴正方向的夹角,为声源的俯仰角.则4个麦克风在三维空间中坐标分别为M1(3a/3,0,6 a/12),M2(3 a/6,a/2,6 a/12),M3(3 a/6,a/2,6 a/12),M4(0,0,6a/4).假设目标声源 S到原点的距离为r,水平距离为 L.以麦克风 M4为参考点,d10为声源 S 到麦克风 M1的声程,d21,d31,d41表示声源 S 到麦克风 M1与到麦克风 M2, M3,M4的距离差.c表示声音传播速度,则有 di1=SMiSM1=c × ti1,ti1表示目标声源到达麦克风 Mi和 M1的时间差,其中(i=2,3,4).2.1 RBF 神经网络的结构径向基RBF(RadialBasisFunction)神经网络作为一种特殊类型的单隐层前馈神经网络,它采用局部接受域来执行整函数映射的功能[6].RBF 神经网络结构简单、训练时间短、学习和收敛速度快、具有最佳的逼近性质,目前广泛应用于模式识别领域,目标预测和工程插值计算[7].RBF神经网络结构上包括输入层、隐含层和输出层.输入层的作用是把信号传递到隐含层,隐含层作为RBF 神经网络中关键的一层,其选取非负非线性函数作为神经元传递函数[8],隐含层根据网络需要解决的实际问题来确定其单元数[9].基于 RBF 神经网络的定位模型中输入层的 3 个数据是声源到达麦克风 M1和 Mi的声达时间差 ti1(i=2,3,4),网络的输出是声源的位置,即方位角,俯仰角和距离.声源定位模型中采用 RBF 神经网络,主要利用了 RBF 神经网络的高度非线性映射的特性,它可以映射出时延值作为网络的输入、声源位置作为网络输出两者之间的关系[10].网络的隐含层非线性激活函数选用高斯函数,实现输入层和隐含层之间的非线性变换,输出层对应为声源的坐标位置,选择适当的学习算法进行训练,获取相应的网络参数[11].2.2 RBF 神经网络的训练数据选择与归一化处理图1 所示的麦克风阵列是正四面体结构,阵元 M1,M2,M3,M4位于以为球心,以o 为半径的正四面体外接球的球面上.实验中,选取神经网络训练的输出数据即声源的位置位于以 o 为球心,半径为 4.3m 的球的上半球球面上,声源在 xoy 平面上投影以 o 为圆心,半径 0.3m 到 4.3m 间隔为 0.4m 的 10 个同心圆圆周上,在同一个圆周上相邻两个声源投影的间隔为 20,总 180 组位置坐标.取声速为340m/s,根据定位模型和声源位置的几何关系,计算时间差,得到 1 800 组的输入及输出数据作为神经网络训练数据.测试数据的选择:在训练数据声源位置取值的上半球内,以半径 0.3m 到 1.5m 的同心球环内的点为近场声源位置,1.5 m 到4.3m 的同心球环内的点为远场声源位置;在近场和远场所属的四个象限内每个象限分别随机生成的 25组位置坐标,并计算时间差,近场和远场分别选取 100 组作为神经网络的测试数据,用来检测神经网络定位模型的性能.训练和测试数据采用最大最小法进行归一化处理.数据的归一化处理是利用神经网络进行预测前必须完成的,其目的是为了避免由于数据的维数不同和数量级的差异而引起神经网络预测产生较大的误差[12].3.1 MATLAB 仿真及分析声源定位采用基于RBF神经网络以实现对目标声源的跟踪为目的,预测出方位角和俯仰角,确定目标声源的空间方向从而实现对声源的跟踪.为了验证设计的网络在远场和近场对声源的定向情况,分别选取远场和近场测试样本各 100 组数据,用已训练好的RBF网络进行预测,实验结果如图2、图3 和图4 所示.图2 为远场声源 100 组预测数据的方位角和俯仰角的预测误差,其中方位角的误差范围为± 0.6 °之间,俯仰角的误差范围为± 0.6 °之间.图3 近场声源为 100组预测数据的方位角和俯仰角的预测误差,其中方位角的误差范围为± 2°之间,俯仰角的误差范围为± 2°之间.对比图2和图3可知,相比于近场声源,定位模型对于远场声源的定向精度较高,这是由于声源在近场环境中,阵列中阵元间的时延值之间的差值相对较小,神经网络的拟合与预测能力也有限.图4 为远场声源 100 组数据的距离预测误差,由图2和图4可知,即使声源位于远场、方位角误差很小的情况下,RBF神经网络定位模型对声源距离的预测误差也很大.这是因为实验中,麦克风阵列属于小型阵列,阵元间的距离仅为0.24 m,远小于阵列与声源之间的距离,因此,基于RBF神经网络的定位模型无法对声源距离参数做出准确的预测,故文中只对方位角和俯仰角误差做出分析.上述 MATLAB 仿真实验证明了基于 RBF 神经网络的声源定位模型,在输入相应的时延数据的条件下,无论目标声源是处于远场还是近场的环境下,都可以比较精确的预测其方位角和俯仰角,从而,说明了该定位模型的适用性强、定位精度高.利用基于RBF神经网络的声源定位模型研究麦克风阵列位姿的不确定对声源目标定位精度产生的影响是下一步进行的工作.首先研究声源在近场情况下,麦克风阵列位姿的不确定对声源定位的方位角和俯仰角误差的影响,取声源与阵列的水平距离 L=0.5m,实验结果分别如图5 和 6 所示.图5 和图6 表示俯仰角为时,方位角误差曲线,由图5 可知:声源在近场的环境下,阵列位姿的不确定对方位角误差的影响比较大,并且误差呈现出规律性的变化;当阵列与声源之间的夹角的为时,此时声源的方位角误差最小;当声源与阵列的夹角即方位角不变时,随着俯仰角的增大,方位角的误差也逐渐增大.由图6可知:当声源在近场的环境下,阵列位姿的不确定对俯仰角误差的影响比较大;当俯仰角一定时,误差呈现出规律性的变化;在俯仰角小于90°时,随着俯仰角的增大,俯仰角误差的变化范围也在增大.为了进一步验证声源在近场情况下,研究麦克风阵列位姿的不确定对定位的方位角和俯仰角误差的影响,取声源与阵列的水平距离 L=1m,实验结果分别如图7和8所示.图7 和图8 表示俯仰角为时,方位角误差曲线,由图7 对比图5 可知:当声源在近场的环境下,阵列位姿的不确定对方位角误差的影响也比较大;随着俯仰角的增大,方位角的误差也逐渐增大,但是随着声源和阵列之间距离的增大,影响的程度在逐渐的减小.由图8对比图6可知:当声源在近场的环境下,阵列位姿的不确定对俯仰角误差的影响比较大;随着声源和阵列之间距离的增大,影响的程度在逐渐的减小.为了研究声源在远场情况下,麦克风阵列位姿的不确定对定位的方位角和俯仰角误差的影响,取L=2m,实验结果分别如图9和 10所示.由图9可知:相比较于声源在近场时,当声源位于远场的情况下,方位角误差也呈现出规律性的变化,但是麦克风阵列位姿的不确定对方位角误差的影响比较小;当阵列与声源之间的夹角的为0°、± 60°、± 120 °、± 180 °时,此时声源的方位角误差最小;在方位角一定时,随着俯仰角的增大,方位角的误差只是略有增大.由图10可知,相比较于声源在近场时,当声源位于远场的情况下,俯仰角一定时,误差也呈现出规律性的变化,但是麦克风阵列位姿的不确定对俯仰角误差的影响比较小.3.2 仿真结果分析由图5~图10可知:在全范围声源目标定位中,当声源位于近场的情况下,麦克风阵列的位姿的不确定对方位角和俯仰角的定位误差的影响比较大,随着阵列和声源的距离的增大,影响的程度而逐渐的减小;当声源位于远场时,阵列位姿的不确定对方位角和俯仰角的定位误差的影响都比较小.3.3 定位模型的性能评价为了验证上述根据理论值仿真所得出阵列位姿的不确定对定位精度产生影响的结论,采用实验室环境作为实验数据采集环境,采集声达时间差,利用实测值进行仿真.实验室房间大小为8m×6m×3m,数据采集平台包括:正四面体麦克风阵列、数据采集卡、激光测距仪、卷尺、音箱等,声源音频内容为发令枪声.测试声源在 xoy 平面上投影以 o 为圆心,半径 0.5m和 1.2m 的 2 个同心圆圆周上,在同 1 个圆周上相邻两个声源投影的间隔为4 °,音箱固定在支架上,声源相对高度约为 0.07m,2 个同心圆周上声源的俯仰角分别为82.3 °和86.8 °,每个圆周取样 90 组数据,测试数据共 180 组,激光测距仪的测量精度为±1.5mm.数据记录表格如表1和表2所示.采用已建立的基于RBF神经网络的声源定位模型验证上文阐述的麦克风阵列位姿的不确定对声源目标定位精度产生影响的结论,实验结果分别如图11 和12 所示.由图11 可知,声源位于半径 0.5m 圆周上,俯仰角为82.3 °时,根据实测数据可得出:阵列位姿的不确定对方位角误差的影响比较大,误差范围为4°~4°,并且误差也呈现出规律性的变化;俯仰角误差范围4°~2°;对比图5和图6中俯仰角为90°时的仿真曲线可以看出利用理论值和实测值仿真所得的结论是相似的.由图12可知,声源位于半径 1 m 圆周上,俯仰角为86.8 °时,根据实测数据可得出:此时方位角的误差范围为2°~2°,并且误差也呈现出规律性的变化;俯仰角误差范围1.5 °~0 °;对比图7 和图8 中俯仰角为90 °时的仿真曲线也可以看出利用理论值和实测值仿真所得的结论是相似的.本文首先设计了一种基于 RBF 神经网络声源定位模型,利用 MATLAB 仿真实验证明了其适应性强和精确度高.然后,利用该模型研究了麦克风阵列位姿的不确定对声源定位中方位角和俯仰角误差的影响,最后利用实验平台测得数据进行了验证,从而说明了结论的可靠性.但是由于单次定位的局限性以及神经网络拟合能力有限,该模型并不能很好地预测声源的空间距离.因此,如何实现对空间距离的准确预测及阵列位姿的不确定对定距产生的影响是下一步要做的工作.【相关文献】[1] 金光明,谢植,张传义.基于麦克风阵列多声源定位的新方法[J].东北大学学报:自然科学版,2012,33(6):769-773.[2] 李晓飞,刘宏.机器人听觉声源定位研究综述 [J].智能系统学报,2012,7(1):9-20.[3] 王震.基于互功率谱相位时延估计的声源定位系统研究 [D].天津:天津大学,2010.[4] 国蓉,何镇安.基于多级神经网络的被动声定位算法研究倡 [J].计算机应用研究,2011,28(6).[5] 陆灏铭,陈玮,刘寿宝.基于麦克风阵列的声源定位系统设计 [J].传感器与微系统,2012,31(4):79-81.[6] 彭显刚,胡松峰,吕大勇.基于 RBF 神经网络的短期负荷预测方法综述 [J].电力系统保护与控制,2011,39(17):144-148.[7] 乔俊飞,韩红桂.RBF 神经网络的结构动态优化设计 [J].自动化学报,2010,36(6):865-872.[8] 张雨浓,李克讷,谭宁.中心-方差及权值直接确定的 RBF 神经网络分类器 [J].计算技术与自动化,2009,28(3):5-9.[9] 雷升锴,刘红阳,何嘉,等.动态 K-均值聚类算法在 RBF 神经网络中心选取中的应用 [J].信息系统工程,2011 (6):83-85.[10]Arslan G,Sakarya F A.A unified neural-network-based speaker localization technique[J].IEEE Transactionson Neural Networks,2000,11(4):997-1002.[11]Arslan G,Sakarya F A,Evans B L.Speaker localization for far field and near field wideband sources using neural networks[J].Proc IEEE EURASIPWorkshop on Nonlinear Signal and Image Processing,1999,2:569-573.[12] 杨鹏,邢钰姣,孙昊,等.基于 BP 神经网络的正四面体阵列声源定向研究 [J].传感器与微系统,2012,31(5):8-9.。