基于正四棱锥结构的机器人声源定位系统研究

格式：pdf
大小：1.26 MB
文档页数：5

下载文档原格式

基于正四面体传声器阵列的机器人声源定位方法

05
实验与分析
实验环境与准备
实验场地
传声器阵列
选择一个相对封闭、无回声、无噪音的实验室或房间进行实验，确保实验结果的准确性和可靠性。
实验设备
使用四个高灵敏度的传声器组成正四面体阵列，每个传声器之间的距离相等，以确保能够准确捕捉到声音信号。
实验人员
准备好计算机、数据采集器、信号发生器等实验设备，用于产生和采集声音信号。
声源定位与机器人运动控制
声源定位
利用正四面体传声器阵列对声源进行定位，通过计算出声源相对于麦克风阵列的相位差和时间差等信息来确定其位置。
路径规划
根据声源位置信息和机器人当前位置，规划出一条从机器人当前位置到声源的最短路径或最优路径。
运动控制
根据路径规划结果，调整机器人的运动参数（如速度、方向等），使其能够准确到达目标位置并接近声源。
发展
随着深度学习技术的不断发展，基于深度学习的声源定位方法逐渐成为研究热点。该方法可以通过对大量数据进行学习，提高定位精度和稳定性，同时可以适应不同环境下的声音传播特性。
研究目标与内容
• 目标：本研究旨在研究一种基于正四面体传声器阵列的机器人声源定位方法，提高机器人在复杂环境中对声源位置的感知能力，实现快速、准确地确定声源位置。
至少需要两名实验人员参与实验，一名负责操作实验设备，另一名负责记录实验数据和分析结果。
实验结果展示与分析
声音信号采集
通过信号发生器产生不同的声音信号，如人说话、乐器演奏等，并使用传声器阵列实时采
集这些声音信号。
数据处理与分析
将采集到的声音信号进行处理和分析，提取出与声音来源相关的特征信息，如时间差、强
机器人平台选型与搭建

基于机器人听觉的声源定位策略

环境下测试，验结果证明在混响环境下机器人可以实现空间声源定位，方法具有实时实现的有效性和应用性。实该
关键词：机器人听觉；声源定位；传声器阵列；时延
中图分类号：Ｐ４Ｔ２文献标识码：Ａ文章编号：０４— ６９２１）４— ５８— ４１０１９（００００１０
征的危险作业移动机器人的需求日益凸现 ¨ 。如何实现移动机器人对可疑声源的准确判断，特殊在
环境中获取目标声源方向为打击武器进行自动瞄准
其传声器数量太多，结构复杂，用在机器人的头部既
不实际也没必要；又如，．ＮｋｄｉＫａａａ等人提出的一种
Ａｂｓｒｔｔａｃ：Ａｖｃｏｈｎｒａｅｖｎｓｒｂｔｅｒｓｐｏｏｅｏｏｏｕｉｏｙｌｃｌａｉｎ．Ｓｕｄｓｕｃｉｆｅｍｉｒｐｏｅａｒｙｓｒｉｇａｏｏａｓｉｒｐｓｄｆｒｒｂｔａｄｔｒｏａｉｔｚｏｏｎｏｒｅｐｓｔｏｎｓａｅｉａｃｌｔｄｂｈｌｎｒａａｆｆｕｃｏｏｅ，ａｏｈｅｃｏｈｎｓｕｅｓａｕｉａｏｉｎｉｐｃｓｃｌｕａｅｙｔｅｐａａｒｙｏｏｒｍｉｒｐｈｎｓｎｔｒｍｉｒｐｏｅｉｓｄａｎａｘｌｒｉｉｙ
随着各国对国家安全、会治安等公共事业的社

基于正四棱锥形六元声阵列被动定位的研究

ｌｏｃａｔｅａｃｏｕｓｔｉｃｔａｒｇｅｔｓ．Ｉｔｐｒｏｐｏｓｅｓａｒｅｃｔａｎｇｕｌａｒｐｙｒａｍｉｄａｒａｙｗｉｔｈｓｉｘｓｅｎｓｏｒｓ．ＴｈｅｐａｐｅｒｄｅｄｕｃｅｓｔｈｅｆｏｒｍｕｌａｓｏｆｔｈｅｔａｒｇｅｔｓｐａｔｉａｌｏｒｉｅｎｔａｔｉｏｎａｎｄｕｓｅｓＧｅｎｅｒａｌｉｚｅｄＣｒｏｓｓ－Ｃｏｒｅｌａｔｉｏｎａｌｇｏｒｉｔｈｍｔｏａｃｈｉｅｖｅｔｉｍｅｄｅｌａｙｅｓｔｉｍａｔｉｏｎ．Ｔｈｅｐａｐｅｒａｎａｌｙｚｅｓｔｈｅｍｏｄｅｌｅｒｒｏｒ．Ｆｉｎａｌｌｙ，ｔｈｒｏｕｇｈｔｈｅｓｉｍｕｌａｔｉｏｎｅｘｐｅｒｉｍｅｎｔ，ｔｈｅｔａｒｇｅｔｃａｎｂｅｅｆｆｅｃｔｉｖｅｌｙｐｏｓｉｔｉｏｎｉｎｇ
第２７卷第２期２０１４年２月
传感技术学报
ＣＨＩＮＥＳＥＪＯＵＲＮＡＬＯＦＳＥＮＳＯＲＳＡＮＤＡＣＴＵＡＴＯＲＳ
Ｖｏ１．２７Ｎｏ．２Ｆｅｂ．２０１４
ＲｅｓｅａｒｃｈｏｆＰａｓｓｉｖｅＡｃｏｕｓｔｉｃＬｏｃａｔｉｏｎＢａｓｅｄｏｎＲｅｃｔａｎｇｕｌａｒ

机器人声源定位系统实验设计与实现

机器人声源定位系统实验设计与实现宋亚男;陈海辉;徐荣华;宋子寅【摘要】Based on the embedded system,the design of the robot acoustic source positioning system is completed,and the microphone array and acquisition circuit are designed.On the basis of the robot acoustic source position method of the cross correlation function estimation time delay method,the robot acoustic source positioning is realized.The demonstration experiment for the robot acoustic source positioning and semi-open experiment for the robot acoustic source positioning are designed and realized.The experimental results reach the goal of the expected experimental design.%基于嵌入式系统完成了机器人声源定位系统的设计,设计了麦克风阵列和采集电路,并基于互相关函数估计时延法的机器人声源定位算法,实现了机器人声源定位;设计并实现了机器人声源定位演示实验和机器人声源定位半开放实验,实验效果达到预期实验设计的目标.【期刊名称】《实验技术与管理》【年(卷),期】2018(035)003【总页数】4页(P47-49,54)【关键词】声源定位系统;机器人;实验设计【作者】宋亚男;陈海辉;徐荣华;宋子寅【作者单位】广东工业大学自动化学院,广东广州 510006;广东工业大学自动化学院,广东广州 510006;广东工业大学自动化学院,广东广州 510006;广东工业大学实验教学部,广东广州 510006【正文语种】中文【中图分类】TP242;G642.423在进行本科教育过程中,参与课外科研和毕业设计环节的学生以课题形式参与实验室建设,初见成效。

机器人的声源定位——基于NAO机器人

AbstractOne of the main purposes of having a humanoid robot is to have it interact with people. This is undoubtedly a tough task that implies a fair amount of features. Being able to understand what is being said and to answer accordingly is certainly critical but in many situations, these tasks will require that the robot is first in the appropriate position to make the most out of its sensors and to let the considered person know that the robot is actually listening/talking to him by orienting the head in the relevant direction. The “Sound Localization” feature addresses this issue by identifying the direction of any “loud enough” sound heard by NAO.Related workSound source localization has long been investigated and a large number of approaches have been proposed. These methods are based on the same basic principles but perform differently and require varying CPU loads. To produce robust and useful outputs while meeting the CPU and memory requirements of our robot, the NAO’s sound source localization feature is based on an approach known as “Time Difference of Arrival”.PrinciplesThe sound wave emitted by a source close to NAO is received at slightly different times on each of its four microphones. For example, if someone talks to the robot on his left side, the corresponding signal will first hit the left microphones, few milli-seconds later the front and the rear ones and finally the signal will be sensed on the right microphone (FIGURE 1).These differences, known as ITD standing for “interaural time differences”, can then be mathematically related to the current location of the emitting source. By solving this equation every time a noise is heard the robot is eventually able to retrieve the direction of the emitting source (azimutal and elevation angles) from ITDs measuredon the 4 microphones.FIGURE 1Schematic view of the dependency between the position of the sound source (a human in this example) and the different distances that the sound wave need to travel to reach the four NAO’s micro-phones. These different distances induce times differences of arrival that are measured and used to compute the current position of the source.KEY FEATURE SOUND SOURCE LOCALIZATIONPerformancesThe angles provided by the NAO’s sound source localization engine match the real position of the source with an average accuracy of 20 degrees, which is satisfactoryin many practical situations. Note that the maximum theoretical accuracy dependson the microphones’ spatial configuration and on the sample rate of the measured signal, and is about 10 degrees on NAO.The distance separating NAO and a sound source successfully located can reachseveral meters depending on the situation (reverberation, background noise, etc…).Once launched, this feature uses 10% of the CPU constantly and up to 20% for few milliseconds when the location of a sound is being computed.LimitationsThe performance of NAO’s sound source localization is limited by how clearly thesound source can be heard with respect to background noise. Noisy environments naturally tend to decrease the reliability of the module outputs.It will also detect and locate any “loud sounds” without being able by itself to filterout sound source that are not humans.Finally, only one sound source can be located at a time. The module can behave in aless reliable manner if NAO faces several loud noises at the same time. He will likelyonly output the direction of the loudest source.How does it work?This feature is available as a NaoQi module named “ALAudioSourceLocalization”which provides a C++ and Python API (application programming interface) thatallows precise interactions from a python script or a NaoQi module.Two boxes in Choregraphe are also available that allow an easy use of the featureinside a behavior:● The box “Sound Loc.” provides the output (angles and level of confidence) of thesound localization module without taking any further actions.● The box “Sound Tracker” uses these outputs to make NAO’s head turn in the appropriate direction.FIGURE 2An example of a behavior usingthe «Sound Tracker» box toorientate NAO’s head so thatthe «Face Recognition» box canactually perform its recognition.How are people using it?Here are some possible applications (from the simplest to the more ambitious ones) that can be built from NAO’s ability to locate sound sources.- Using the “Sound Source Localization” to have a person enter the camera field of view (as shown in the above example). This allows subsequent vision based features to work on relevant images (images showing a person for example). This is consequently of interest for these specific tasks:● Human Detection, Tracking and Recognition● Noisy Objects Detection, Tracking and Recognition- “Sound Source Localization” can be used to strengthen the Signal/Noise ratio in a specific direction - this is known as Audio Source Separation – and can critically enhance subsequent audio based algorithms such as:● Speech Recognition in a specific direction● Speaker Recognition in a specific direction- Theses possible applications can also be mixed together making NAO’s sound source localization the basic block for sophisticated applications such as:● Remote Monitoring / Security applications (NAO’s could track noises in an empty flat, take pictures and record sounds in relevant directions, etc…)● Entertainment applications (by knowing who speaks and understanding what is being said, NAO could easily take part in a great variety of games with humans.)。

基于BP神经网络的正四面体阵列声源定向研究

０引言
的目标声源定向。１正四面体麦克风阵列模型
近年来，运用麦克风阵列进行声源定位研究已经成为信号处理领域的一个研究热点。一组麦克风按照一定的几何结构摆放组成麦克风阵列，拾取来自各个方向的声音信号，并进行空时处理，从而精确定位目标声源。该技术可在雷达、军事侦察与跟踪、机器人听觉定位、电视会议等领
Ｒｅｅｒｈｏｏｄｓｕｃｒｅｔｔｏｉｇｒｇｌｒｓａｃｎｓｕｎｏｒｅｏｉｎａｉｎｕｓｎｅｕａ
ｔｔａｅｒｎｍｉｒｐｏｅａｒｙｂａｅｎＢＰｅｒｌｎｔｒｅｒｈｄｏｃｏｈｎｒａｓｄｏｎｕａｅｗｏｋ
真实验，证明可以实现远场和近场的声源定向，而进行声源跟踪，进有较高的实用性。
关键词：ＢＰ神经网络；声源定向；四面体阵列；ｔｂ仿真正Ｍａａｌ
中图分类号：Ｔ９２３Ｐ１．文献标识码：Ａ文章编号：１０－７７２１）５００－２００９８（０２０－０８０
８
传感器与微系统（ｒｓｕｅｎｃｏｙｔｒＴｃｎｌｉｓ『ａｄｃｒｄＭｉｓｓｎｅｈｏｏｅ）ｒｎａｒｅｇ
２１０２年第３１卷第５期
基于ＢＰ神经网络的正四面体阵列声源定向研究
杨鹏，邢钰姣，孙昊祖丽楠，
ＡｂｔａｔＩｒｅｏｔｃｏｎｏｒｅｔｒｅｙｔｅａｆｍｉｒｐｏｅａｒｙ，ｏｎｏｒｅｏｉｎａｉｎｓｒｃ：ｎｏｄｒｔｒｋｓｕｄｓｕｃａｇｔｂｉａｍｅｄｌｙｏｃｏｈｎｒａａｓｕｄｓｕｃｒｔｔｅｏｍｅｈｄｂｓｄｏｅｒｌｎｔｒｓｐｏｏｅ．ｈｓｏｉｎａｉｎｓｓｅＵｅｅｕａｅｒｈｄｏｃｏｈｎｔｏａｅｎＢＰｎｕａｅｗｏｋｉｒｐｓｄＴｉｒｔｔｙｔｍＳＳｒｇｌｒｔｔａｅｒｎｍｉｒｐｏｅｅｏａｒｙＡＰｅｒｌｅｗｏｋｗｈｃａｗ — ｉｄｎｌｙｒｉｅｉｎｄｎｉｌｔｄｂＭａｌｂｔｏｂｘＴｅｒａ．Ｂｎｕａｎｔｒｉｈｈｓｔｏｈｄｅａｅｓｄｓｇｅａｄｓｍｕａｅｙｔｏｌｏ．ｈａ

高精度声源定位技术的研究进展

高精度声源定位技术的研究进展声源定位技术是一项关键的技术，广泛应用于各个领域，如音频处理、通信系统、无人机导航等。

近年来，随着科技的不断进步，高精度声源定位技术也得到了长足的发展。

本文将介绍该技术的研究进展，并探讨其在实际应用中的潜力。

首先，高精度声源定位技术的研究主要集中在两个方面：传感器阵列设计和信号处理算法。

传感器阵列是实现声源定位的关键组成部分，其设计直接影响到定位精度。

目前，常见的传感器阵列包括线性阵列、圆形阵列和球形阵列等。

研究人员通过对传感器阵列的优化设计，提高了定位的准确性和稳定性。

其次，信号处理算法也是高精度声源定位技术中不可或缺的一环。

传统的声源定位算法主要基于波束形成原理，通过对接收到的声波信号进行处理，确定声源的位置。

然而，由于环境噪声和多路径效应的存在，传统算法在复杂环境下的定位精度有限。

因此，研究人员提出了一系列新的信号处理算法，如基于卷积神经网络的声源定位算法、基于深度学习的声源定位算法等。

这些算法通过对大量数据的学习和分析，提高了定位的准确性和鲁棒性。

除了传感器阵列设计和信号处理算法，高精度声源定位技术的研究还涉及到其他方面的内容。

例如，研究人员通过引入多模态信息，如视频、惯性传感器等，提高了声源定位的精度。

此外，他们还研究了声源定位与其他相关技术的结合，如目标跟踪、声纹识别等，进一步拓展了该技术的应用范围。

高精度声源定位技术在实际应用中具有广阔的前景。

首先，它可以应用于智能音频处理领域。

通过准确地定位声源，可以实现自适应降噪、声源增强等功能，提高音频质量和用户体验。

其次，该技术可以应用于通信系统中。

通过定位对方的声源，可以实现声纹识别、定向通信等功能，提高通信的安全性和效率。

此外，高精度声源定位技术还可以应用于无人机导航、智能家居等领域，为人们的生活带来更多便利。

尽管高精度声源定位技术已经取得了一定的研究进展，但仍存在一些挑战和问题。

首先，复杂环境下的定位精度仍然有待提高。

基于移动机器人的声源定位系统

基于移动机器人的声源定位系统
刘红宁;李志尊
【期刊名称】《四川兵工学报》
【年(卷),期】2009(30)4
【摘要】介绍了一种协助移动机器人平台搜寻目标方向的声源定位系统.这种听觉系统的最终目标是服务于移动机器人,它所提供的听觉信息再匹配视觉信息,将指导机器人的运动路径.此系统基于时延估计算法,在这种算法中,首先通过能量探测声音起点,然后通过广义互相关法计算时延以确定声源的方向和位置.但是,如果听觉系统麦克风阵列的安装位置离机器人很近,由于采集声源时被马达噪音干扰,将会导致计算结果产生误差.为了克服以上问题,作者改进了广义互相关法.实验表明,本文中提出的声源定位系统可有效应用于移动机器人平台.
【总页数】3页(P77-79)
【作者】刘红宁;李志尊
【作者单位】军械工程学院,基础部机械设计教研室,石家庄,050003;军械工程学院,基础部机械设计教研室,石家庄,050003
【正文语种】中文
【中图分类】TJ0;TP242.6+3
【相关文献】
1.基于主动探测的移动机器人声源目标距离测定方法
2.移动机器人基于改进粒子滤波的声源目标跟踪研究
3.基于六元空间阵列的声源定位系统实现
4.一种基于互相关算法的二维声源定位系统
5.基于麦克风阵列的声源定位系统研究
因版权原因，仅展示原文概要，查看原文内容请购买。

基于传声器阵列的机器人声源定位系统

基于传声器阵列的机器人声源定位系统宫玉琳;大化【期刊名称】《长春理工大学学报（自然科学版）》【年(卷),期】2016(039)003【摘要】With the development of computer technology and signal processing technology,all kinds of robots with spe-cial functions are applied to the production and life of people. The auditory system can make up for the deficiency ex-isting in the robot vision system,the robot in the dark or obstructions of environment,using sound information percep-tion environment in the presence of the target,and the positioning,robot assisted work,especially in the field of disas-ter rescue,military and other fields,sound source localization system has a unique advantage. The sound source local-ization robot system for research,design based on microphone array sound source localization robot system by four ele-ment planar microphone array, using the generalized cross correlation algorithm, to achieve the sound source localiza-tion. Experimental results show that the system has high positioning accuracy,with a high practical value.%随着计算机技术和信号处理技术的发展，各种具有特殊功能的机器人应用到人们的生产生活中。

一种简单的三维空间声源定位方法

一种简单的三维空间声源定位方法
龚惠哲
【期刊名称】《华南理工大学学报：自然科学版》
【年(卷),期】2007(035)B10
【摘要】为了简化使用话筒阵列对空间声源的定位，文中提出了一种简单的三维空间声源定位方法．该方法在直角坐标轴上放置4个麦克风，声源到达麦克风对之间的时间差可以由测量接收信号的互相关函数得到．由到达时间差和一个近似的锥模型可以很容易得到声源相对于3个坐标轴的方位角，从而转换成极坐标系中的方位角和仰角．相比较已有方法：该方法具有简单易行、计算量小的显著优点．【总页数】3页(P70-72)
【作者】龚惠哲
【作者单位】华南理工大学亚热带建筑科学国家重点实验室,广东广州510640【正文语种】中文
【中图分类】TU112
【相关文献】
1.一种简单的三维空间声源定位方法 [J], 龚惠哲
2.一种无线传感器网络环境下多机器人协作式声源定位方法 [J], 陈妮;何华光;叶进
3.一种用于分布式阵列的球谐波域声源定位方法 [J], 韩欣宇; 吴鸣; 杨军; 张喆
4.一种基于相位平均的旋转声源高分辨率定位方法 [J], 初宁;黄乾;余亮;宁岳;徐建锋;吴大转
5.一种适用浅海声源的多阵列直接定位方法 [J], 王冠群;张春华;李宇;张扬帆
因版权原因，仅展示原文概要，查看原文内容请购买。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

１．２时间延迟估计
设ｘ１（ｔ）和ｘ２（ｔ）分别为位置不同的两个麦克风接收到的
同一声源的信号模型，则信号的互相关函数的峰值点而得到声源到达两个麦克风的时延值［１５，１６］。其互相关函数可
以表示为
∫ Ｒｘ１ｘ２（τ）＝２１π
＋∞
－∞ φｘ１ｘ２（ω）Ｇｘ１ｘ２（ω）ｅｊωτｄω
（１）
φｘ１ｘ２（ω）＝１｜Ｇｘ１ｘ２（ω）｜
（２）
其中：φｘ１ｘ２为加权函数；Ｇｘ１ｘ２（ω）为两麦克风获取信号ｘ１（ｔ）和
ｘ２（ｔ）的互相关功率谱函数；Ｒｘ１ｘ２（τ）峰值所对应的横坐标即为
时延值。
１．２．１峰值的快速搜索策略
当信号的采样频率较高、数据量较大时，能缩小互相关函
数的峰值搜索区间，快速准确地找出峰值点，也是提高算法性
Ａｂｓｔｒａｃｔ：Ｔｈｉｓｐａｐｅｒｐｒｏｐｏｓｅｄａｌｏｃａｌｉｚａｔｉｏｎｍｏｄｅｌｂａｓｅｄｏｎｔｈｅｍｕｌｔｉｍｉｃｒｏｐｈｏｎｅｗｉｔｈｔｈｅｒｅｃｔａｎｇｕｌａｒｐｙｒａｍｉｄｓｔｒｕｃｔｕｒｅ．Ｆｉｒｓｔｌｙ，ｔｈｅｓｙｓｔｅｍｅｍｐｌｏｙｅｄｔｈｅｔｉｍｅｄｅｌａｙｅｓｔｉｍａｔｉｏｎ（ＴＤＥ）ｍｅｔｈｏｄｂａｓｅｄｏｎｔｈｅｃｒｏｓｓｐｏｗｅｒｓｐｅｃｔｒａｌｐｈａｓｅａｌｇｏｒｉｔｈｍａｎｄａｆａｓｔｓｅａｒｃｈｓｔｒａｔｅｇｙｏｆｐｅａｋｖａｌｕｅｔｏｅｓｔｉｍａｔｅｔｈｅｔｉｍｅｄｅｌａｙｄｉｆｆｅｒｅｎｃｅｓ．Ａｎｄｔｈｅｎ，ｉｔｅｓｔａｂｌｉｓｈｅｄｔｈｅｇｅｏｍｅｔｒｉｃｅｑｕａｔｉｏｎｂａｓｅｄｏｎｔｈｅｔｉｍｅｓｐａｃｅｍａｐｐｉｎｇｒｅｌａｔｉｏｎｓｈｉｐｔｏｃａｌｃｕｌａｔｅｔｈｅｐｏｓｉｔｉｏｎｏｆｔｈｅｓｏｕｎｄｓｏｕｒｃｅ．Ｆｏｒｆａｓｔｓｏｌｖｉｎｇｔｈｅｅｑｕａｔｉｏｎｓ，ｉｔｄｉｖｉｄｅｄｔｈｅｍｕｌｔｉｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓｐａｃｅｉｎｔｏｓｅｖｅｒａｌｓｕｂｓｐａｃｅｓｔｏｎａｒｒｏｗｔｈｅｓｏｌｕｔｉｏｎｒａｎｇｅａｃｃｏｒｄｉｎｇｔｏｔｈｅｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆｒｅｃｔａｎｇｕｌａｒｐｙｒａｍｉｄｓｔｒｕｃｔｕｒｅａｎｄｔｈｅｒｅｄｕｎｄａｎｔｔｉｍｅｄｉｆｆｅｒｅｎｃｅｓ，ａｎｄｉｎｔｒｏｄｕｃｅｄＮｅｗｔｏｎｉｔｅｒａｔｉｖｅａｌｇｏｒｉｔｈｍｔｏｓｏｌｖｅｔｈｅｅｑｕａｔｉｏｎｓ，ｗｈｉｃｈｅｌｉｍｉｎａｔｅｄｉｔｓｓｏｌｕｔｉｏｎｗｉｔｈａｌａｒｇｅｅｒｒｏｒｂｙｔｈｅｄｏｕｂｌｅｓｃｒｅｅｎｉｎｇｍｅｃｈａｎｉｓｍ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｅｍｏｄｅｌａｎｄｔｈｅａｌｇｏｒｉｔｈｍａｒｅｅｆｆｅｃｔｉｖｅｉｎｉｍｐｒｏｖｉｎｇｔｈｅｌｏｃａｌｉｚａｔｉｏｎａｃｃｕｒａｃｙａｎｄｒｅａｌｔｉｍｅｐｅｒｆｏｒｍａｎｃｅ，ｗｈｉｃｈｃａｎｍｅｅｔｔｈｅｄｅｍａｎｄｏｆｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｉｎｒｏｂｏｔａｐｐｌｉｃａｔｉｏｎ．Ｋｅｙｗｏｒｄｓ：ｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｔｉｏｎ（ＳＳＬ）；ｒｅｃｔａｎｇｕｌａｒｐｙｒａｍｉｄｍｉｃｒｏｐｈｏｎｅａｒｒａｙ；ｆａｓｔｓｅａｒｃｈｓｔｒａｔｅｇｙ；ｉｔｅｒａｔｉｖｅａｌｇｏｒｉｔｈｍ；ｔｉｍｅｄｅｌａｙｅｓｔｉｍａｔｉｏｎ
第３６卷第４期２０１９年４月
计算机应用研究ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓ
Ｖｏｌ３６Ｎｏ４Ａｐｒ．２０１９
基于正四棱锥结构的机器人声源定位系统研究
陈国良，徐扬，黄晓琴
（武汉理工大学机电工程学院，武汉４３００７０）
摘要：针对当前声源定位精度不理想、实时性不佳等问题，提出了一种正四棱锥麦克风阵列声源定位结构。采用时间延迟估计的声源定位方法，并提出时延值的快速搜索策略；推导了该结构的基于信号时延的时空映射关系，建立了声源目标位置的几何计算模型，并依据正四棱锥结构特点及冗余的时延值对值域划分，缩小求解范围，运用迭代算法得到声源的位置坐标，并通过双重筛选机制剔除错误的定位结果。实验结果证明了该结构及定位算法在提高系统定位精度和实时性能方面的有效性，能满足机器人应用中对声源定位的需求。关键词：声源定位；四棱锥麦克风阵列；快速搜索策略；迭代算法；时延估计中图分类号：ＴＰ３９１．４２文献标志码：Ａ文章编号：１００１３６９５（２０１９）０４０２９１０８８０５ｄｏｉ：１０．１９７３４／ｊ．ｉｓｓｎ．１００１３６９５．２０１７．１１．０７８０
目前，常用的声源定位方法有三种，即基于最大输出功率的可控波束形成方法［５，６］、高分辨率谱估计方法和［７，８］基于时延估计方法［９，１０］。其中，基于时间延迟的定位方法由于其计算量相对较小，易于实现而成为最普遍使用的方法［１１］。文
献［１２］在机器人球形头部搭建仿双耳声源定位系统，为了降低基于信号相关的时延估计算法中信号采样率对定位分辨率的影响，利用最大似然方法找出最大化互功率之和的声源轴向角，另外考虑机器人头部带来的多径效应，降低外界干扰，利用基于ｆｒｏｎｔｂａｃｋ的多径补偿因子来修正时延估计。文献［１３］设计了四麦克风的十字平面阵列，并提出一种基于时间差特征的空间栅格匹配算法，找到与待定位声源的时间差特征最匹配的栅格作为声源位置。该方法可以有效地避免几何定位方法的非线性方程组求解问题，复杂度较低，并且合理的麦克风阵列拓扑可以避免几何定位方法可能陷入局部最优点的问题，但阵列尺寸较大，限制了与机器人的结合。当前，优化麦克风阵列结构以提高与机器人的融合度；探索鲁棒的、定位精度高、对各种噪声广泛适用的抗噪声技术以适应人机交互中复杂的声学环境成为机器人听觉系统实用化过程中的研究热点。
能和实时性的一种表现。
对于单个声源和两个麦克风而言，它们在同一平面上可存
在两种几何关系。图２所示，一种是线性关系，即直线ｓ２ｍ１ｍ２和直线ｓ３ｍ２ｍ１，另一种是三角关系，即三角形ｓ１ｍ１ｍ２。
１．２．２时延值筛选
当所估计的时延值出现误差，且误差较大时，将导致最终
定位的数值性错误，而且若在区域的分界线附近出现时延误差
Ｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｓｙｓｔｅｍｆｏｒｒｏｂｏｔｂａｓｅｄｏｎｒｅｃｔａｎｇｕｌａｒｐｙｒａｍｉｄｓｔｒｕｃｔｕｒｅ
ＣｈｅｎＧｕｏｌｉａｎｇ，ＸｕＹａｎｇ，ＨｕａｎｇＸｉａｏｑｉｎ
（ＩｎｓｔｉｔｕｔｅｏｆＥｌｅｃｔｒｉｃａｌ＆ＭｅｃｈａｎｉｃａｌＥｎｇｉｎｅｅｒｉｎｇ，ＷｕｈａｎＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ，Ｗｕｈａｎ４３００７０，Ｃｈｉｎａ）
可能处于完全相等的状态，它们之间有一个误差的存在。
ｂ）针对ａ）中所提到的误差设定一个合理的阈值 ε，其中 ε
值可根据系统定位精度的需求来设定，并进行下面不等式的判断：
τｉｊ－（τｉｋ＋τｋｊ） ≤ε
（４）
ｃ）当不满足该不等式时，说明时延估计的偏差较大，则摈
弃该组时延值；当满足条件时，则该组时延通过筛选，进而进行
陈国良，等：基于正四棱锥结构的机器人声源定位系统研究
·１０８９ ·
１正四棱锥声源定位原理
１．１声源定位原理
同一声源传播到空间位置不同的两个麦克风ｍ１和ｍ２会
产生时间差 τ２１，τ２１由声源到达ｍ２的时间减去声源到达ｍ１的时间所得（同理，可以定义 τ１２），这里设 τ２１＞０，即声源接近于ｍ１，根据时间差可以得到声程差。由双曲线的性质可知，双曲线上任意一点到两个焦点距离差的绝对值为常数，即实轴长。据此可知，声源将在以这两个传声器的位置为焦点，声程差为实轴长的双曲线并且靠近ｍ１的分支线上。当有多个传声器的时候就可以得到多个双曲线，则多个双曲线的交点即为声源的位置［１４］。如图１所示，Ｓ为声源。
本文基于声达时间差设计一种正四棱锥麦克风阵列定位系统。采用互功率谱相位算法获取时延，并提出峰值快速搜索策略；根据正四棱锥的结构特点和冗余的时延值对求解区域进行划分，缩小值域范围，最后采用牛顿迭代算法求得声源的最优化位置解，实验证明该模型和定位算法有效地提高了计算的速度和定位的精度。
收稿日期：２０１７１１１７；修回日期：２０１８０１２２基金项目：国家自然科学基金资助项目（６１３７３１１０，６１６７２３９６）；武汉理工大学自主创新研究基金资助项目（１７５２０４００４）
传播速度为ｖｓｏｕｎｄ，声源点Ｇ到各个麦克风的距离分别为ｓｉ（ｉ＝０，１，２，３，４）；则目标声源到达其他麦克风的距离与到达ｍ０的距离之差为
ｄｉ０＝ｓｉ－ｓ０＝ｖｓｏｕｎｄτｉ０ｉ＝１，２，３，４
其中：τｉ０为声源到达ｍｉ与到达ｍ０的时间差。
（５）
图１基于时延的双曲线
听觉定位技术在机器人领域具有广阔的应用前景［４］。一方面从机器人服务于人的角度，该技术可使机器人定位说话，并跟踪声源轨迹，提高人机交互的智能性和友好性；另一方面从机器人识别环境的角度，机器人可以监听所在环境下的异常声音，并定位出声音源，找出声音事件发生的位置，便于机器人报警或者自行处理该异常事件。此外，还有护理机器人、智能雷达系统等重要行业领域的应用都表明了机器人听觉的积极作用，对人类的生产和生活有着较为深远的影响。
作者简介：陈国良（１９７２），男，湖南娄底人，副教授，博士，主要研究方向为机器人技术（ｇｌｃｈｅｎ＠ｗｈｕｔ．ｅｄｕ．ｃｎ）；徐扬（１９９１），男，河南驻马店人，硕士研究生，主要研究方向为机器人听觉技术；黄晓琴（１９９４），女，湖北宜昌人，硕士研究生，主要研究方向为机器人听觉技术．
第４期
采样点数区间为［－ｌ×ｆ／ｖ，ｌ×ｆ／ｖ］。如图３所示，虚线１和２