数字麦克风及阵列拾音技术的应用
- 格式:pdf
- 大小:446.34 KB
- 文档页数:7
一文带你全面熟悉智能语音之麦克风阵列技术的原理麦克风阵列技术是智能语音领域的关键技术之一,其原理主要涉及麦克风的排列方式、信号处理算法和声源定位技术。
麦克风阵列技术的应用广泛,包括语音识别、语音指令控制、语音唤醒等领域。
首先,麦克风阵列技术中麦克风的排列方式非常重要。
麦克风阵列一般采用线性阵列或圆形阵列的方式,麦克风之间的间距要适当,以便在获取声音信号时保持一定的角度分辨率。
常见的线性阵列包括线性辐射阵列和线性非辐射阵列,前者可实现波束形成,后者可消除噪声对波束形成的影响。
而圆形阵列则可以提供全方位的感知能力,适用于多声源定位和追踪。
其次,麦克风阵列技术中的信号处理算法是实现语音增强和噪声削减的关键。
常见的信号处理算法包括自适应波束形成、空间滤波、噪声估计和消除等。
自适应波束形成算法通过调整麦克风阵列的权重来强化目标信号,抑制背景噪声。
空间滤波算法可以根据麦克风阵列的几何形状和声源位置,对声音进行滤波和增强。
噪声估计和消除算法可以检测到现场的噪声状况,并进行实时消除,提高语音信号的清晰度和可听性。
最后,麦克风阵列技术中的声源定位技术是实现多声源分离和定位的关键。
常见的声源定位技术包括基于时延差的定位、基于空间谱的定位和基于声学特征的定位等。
基于时延差的定位技术通过计算麦克风阵列上各个麦克风上的声音到达时间差,推断声源的位置。
基于空间谱的定位技术通过分析麦克风阵列接收到的声音的空间谱信息,推断声源的方向。
基于声学特征的定位技术则通过分析声音的特征参数,如声音的频率、幅度、谐波等特征,推断声源的位置。
总的来说,麦克风阵列技术通过合理的麦克风排列方式、信号处理算法和声源定位技术,实现了对语音信号的增强和噪声削减,提高了语音识别和语音控制的准确性和可靠性。
麦克风阵列技术的广泛应用将进一步推动智能语音技术的发展。
音频阵列信号处理技术的应用案例和声源定位方法音频阵列信号处理技术是一种利用多个麦克风进行信号采集和处理的技术。
通过对多个麦克风采集的音频信号进行合理的处理和分析,可以实现各种应用场景下的声源定位、环境识别、噪声抑制等功能。
本文将介绍几个音频阵列信号处理技术的典型应用案例和声源定位方法。
一、室内会议语音对话录音与识别在室内会议场景中,利用音频阵列信号处理技术可以实现对多个与会者的语音信号的准确采集和识别。
首先,需要使用多个麦克风布置成一定的阵列形式,以便于对不同方向的声源进行准确的采集。
然后,对采集到的多路麦克风信号进行阵列信号处理,通过波束形成算法对感兴趣的声源进行增强,抑制其它噪声干扰。
最后,将处理后的音频信号输入到语音识别系统进行语音识别。
通过音频阵列信号处理技术的应用,可以大大提高会议语音对话录音的质量和语音识别的准确率。
二、智能家居语音助手音频信号处理智能家居语音助手已经成为越来越多家庭的重要组成部分,而音频阵列信号处理技术可以提升智能家居语音助手的声源定位和语音交互能力。
通过在智能家居设备中部署音频阵列麦克风,并利用波束形成算法对用户发出的语音信号进行增强,可以有效降低噪声干扰,提升语音助手对用户指令的识别准确率。
此外,通过采集多个方向的声音信号,还可以实现智能语音助手的声源定位功能,使其能够定位用户的位置并将声音指向相应的方向,提供更便捷的语音交互体验。
三、远场语音识别技术的应用远场语音识别是指在远离麦克风的情况下,利用音频阵列信号处理技术实现对用户语音命令的准确识别。
音频阵列麦克风可以采集到用户远离麦克风的语音信号,并利用波束形成等技术对远声源进行增强,抑制其他噪声干扰。
此外,还可以使用混音技术将远场语音信号与近场语音信号相结合,提高识别准确率。
远场语音识别技术的广泛应用包括智能音箱、车载语音控制系统等。
四、音频会议噪声抑制技术音频会议中,各个与会者通常分处不同位置,由于远距离传输和环境噪声等因素的影响,会导致音频信号质量下降。
《基于麦克风阵列的语音增强研究》篇一一、引言随着人们对音频质量要求的不断提高,语音增强技术逐渐成为音频处理领域的研究热点。
麦克风阵列技术作为一种有效的语音增强手段,通过多个麦克风的协同作用,可以实现对声源的定位、语音信号的分离以及语音增强的功能。
本文旨在研究基于麦克风阵列的语音增强技术,以期在复杂环境中实现高保真的语音识别与通讯。
二、麦克风阵列基本原理麦克风阵列是由多个麦克风按照一定规则排列而成的阵列系统。
其基本原理是通过不同麦克风接收到的信号之间的相位差和幅度差,结合阵列几何结构,实现对声源的定位和信号的分离。
麦克风阵列技术广泛应用于语音识别、语音增强、声源定位等领域。
三、基于麦克风阵列的语音增强方法基于麦克风阵列的语音增强方法主要包括声源定位、信号分离和后处理三个步骤。
1. 声源定位:通过多个麦克风的信号到达时间差和幅度差等信息,估计出声源的方向和距离。
声源定位是后续信号分离的基础。
2. 信号分离:在确定了声源位置后,采用适当的信号处理算法,如盲源分离、基于高阶统计的分离方法等,从混合信号中提取出目标语音信号。
这一步骤中,针对噪声环境和不同背景下的分离效果尤为关键。
3. 后处理:通过语音增益调整、噪声抑制等后处理技术,进一步提高语音信号的质量。
后处理环节可以有效消除背景噪声、回声等干扰因素,使语音信号更加清晰。
四、研究现状与挑战目前,基于麦克风阵列的语音增强技术在理论研究和实际应用方面都取得了显著的成果。
然而,在实际应用中仍面临诸多挑战。
如:如何提高声源定位的准确性、如何有效分离混合信号中的目标语音、如何处理不同环境下的噪声干扰等。
此外,随着人工智能和深度学习技术的发展,如何将先进的算法应用于麦克风阵列技术,提高语音增强的效果和效率,也是当前研究的重点。
五、研究方法与实验结果为了解决上述问题,本文采用深度学习算法与麦克风阵列技术相结合的方法进行语音增强研究。
首先,通过构建神经网络模型,实现对声源的精准定位和混合信号的有效分离;其次,利用深度学习算法对后处理环节进行优化,进一步提高语音质量;最后,通过实验验证了该方法的可行性和有效性。
麦克风阵列技术在语音识别中的应用研究一、绪论语音识别技术的发展已经越来越受到人们的关注与重视。
作为其中的重要组成部分之一,麦克风阵列技术也越来越受到人们的青睐。
麦克风阵列技术是一种可以通过组合多个麦克风进行信号增强的技术。
在语音识别技术中,麦克风阵列技术可以提高原始语音信号的质量,从而提高语音识别的准确率。
本文将介绍麦克风阵列技术的概念、原理、分类以及在语音识别中的应用研究。
二、麦克风阵列技术的概念与原理麦克风阵列技术是一种可以通过组合多个麦克风进行信号增强的技术。
其基本思想是将多个麦克风分别采集到的信号进行混合处理,以得到更稳定、更准确的信号。
麦克风阵列技术可以通过两种方式实现信号的增强:一是基于时间信号处理技术,即利用多个麦克风之间的时延差异来进行信号增强;二是基于空间信号处理技术,即利用多个麦克风之间的空间位置差异来进行信号增强。
在基于时间信号处理技术的麦克风阵列中,每个麦克风可以采集到的声波信号是略有差异的,这种差异表现为采集信号之间的时延。
通过对这些信号进行时移和加权平均,可以得到一个更准确、更稳定的声音信号。
在基于空间信号处理技术的麦克风阵列中,麦克风的位置和方向决定了采集到的信号。
这意味着如果一个麦克风采集到的信号在其他麦克风中可以被拾取到,那么这个信号被采集的概率就会相对较高。
因此,通过在一个空间范围内分布多个麦克风,可以有效地提高信号的质量。
三、麦克风阵列技术的分类麦克风阵列技术可以根据不同的特征分为不同的类型。
根据不同的麦克风布局方式可以分为线性阵列、圆形阵列等;根据不同的交叉观察方式可以分为平面阵列、立体阵列等;根据不同的处理方式可以分为数字阵列、模拟阵列等。
四、麦克风阵列技术在语音识别中的应用研究在语音识别技术中,麦克风阵列技术可以提高原始语音信号的质量,从而提高语音识别的准确率。
识别误差率的一个主要原因是语音信号的可变性,比如说说话的人、说话的环境、语速、语音轮廓、噪声等因素的影响,在进行识别过程中,需要更加准确的原始语音信号进行支持。
人工智能麦克风阵列的实验结论人工智能麦克风阵列的实验结论引言:人工智能(AI)麦克风阵列是一种使用人工智能技术来处理声音信号的系统。
它由多个麦克风组成,可以实现声音的定位、降噪和增强等功能。
在进行实验研究时,我们通过对不同情境下的声音信号进行采集和分析,得出了一些关于人工智能麦克风阵列的实验结论。
一、声音定位功能:通过实验研究发现,人工智能麦克风阵列可以准确地定位声源的位置。
在实验中,我们设置了不同位置的声源,并使用AI算法对采集到的声音信号进行处理。
结果显示,无论是单一声源还是多个同时存在的声源,该系统都能够精确地确定其位置。
二、降噪效果:人工智能麦克风阵列在降噪方面表现出色。
在实验中,我们模拟了各种噪声环境,并将其与目标语音信号混合在一起。
通过应用AI算法对采集到的混合信号进行处理,我们观察到噪声被有效地抑制,目标语音信号得到了明显的增强。
三、语音增强功能:实验结果表明,人工智能麦克风阵列能够有效地增强语音信号的质量。
在实验中,我们使用了一些低质量的录音样本,并将其输入到该系统中进行处理。
通过AI算法对这些样本进行去噪和修复,我们观察到语音信号的清晰度和可懂度得到了显著提高。
四、多麦克风协同处理:通过实验研究发现,人工智能麦克风阵列中的多个麦克风之间可以进行协同处理,以提高系统性能。
在实验中,我们将多个麦克风放置在不同位置,并使用AI算法对采集到的声音信号进行处理。
结果显示,在多麦克风协同处理的情况下,系统在定位、降噪和语音增强等方面表现更加出色。
五、适应性与稳定性:人工智能麦克风阵列在不同环境下都表现出良好的适应性和稳定性。
无论是室内还是室外环境,无论是静态还是动态环境,该系统都能够保持较高的性能水平。
这得益于其AI算法的智能调节和学习能力,使系统能够根据不同情境进行自适应处理。
结论:通过实验研究,我们得出以下结论:人工智能麦克风阵列具有精准的声音定位功能、出色的降噪效果、有效的语音增强功能、多麦克风协同处理的优势以及良好的适应性和稳定性。
麦克风阵列信号处理技术研究麦克风是我们日常生活中经常接触到的设备之一,它们在电视、手机、电脑等产品中都有广泛的应用。
随着科技的不断发展,麦克风也在不断的升级和改进。
在这些改进中,麦克风阵列信号处理技术成为了研究的热点之一。
麦克风阵列信号处理技术,是指利用多个麦克风组成一个阵列,通过信号处理算法来分析获取到的声音信号,从而实现降噪、增强语音信号、改善声音方向等效果的技术。
这一技术被广泛应用在会议系统、声源定位、语音识别等领域。
麦克风阵列信号处理技术的优势在于,相比于单个麦克风,它可以获取到更多的声音信息。
同时,多个麦克风的信号可以通过信号处理算法进行协同处理,实现对语音信号的识别和提取。
此外,麦克风阵列技术还可以改善环境噪声,提高语音信号的清晰度。
对于麦克风阵列信号处理技术的研究,主要有以下几方面:一、阵列构建阵列构建是麦克风阵列信号处理技术的基础。
麦克风阵列的构建形式通常有线性、圆形、矩形等。
在构建阵列时,需要考虑麦克风数量、布局、间距以及方向等因素。
此外,不同的阵列构建形式会影响麦克风信号的唯象,因此需要在实验室环境下进行实验,找出最优的构建形式。
二、麦克风信号处理算法麦克风阵列信号处理技术的优秀在于信号处理算法。
不同的算法对信号处理的效果也不同。
在信号处理算法中,常用的有波束形成算法、最小方差无失真响应算法以及最大信噪比算法等。
其中,波束形成算法是阵列信号处理中最基础的处理算法,也是目前最热门的处理方式之一。
通过波束形成,可以实现从多个麦克风中提取出目标信号,使得语音信号更加清晰。
三、降噪和声源定位降噪和声源定位是麦克风阵列信号处理技术中最为关键的部分。
降噪的目标是把环境噪声从语音信号中去除,从而提高语音信号的信噪比。
最常用的环境噪声消除算法是最小均方误差法,目前市场上的很多语音识别设备都采用了这一技术。
声源定位是指通过麦克风阵列获取信号,在不需要人工操作的条件下,自动确定声源的位置。
声源定位需要进行时间延迟估计、数据融合、模型匹配等处理步骤。
一文带你全面熟悉智能语音之麦克风阵列技术的原理麦克风阵列技术是一种智能语音技术,通过组合多个麦克风来实现声音定位、降噪和增强等功能。
本文将详细介绍麦克风阵列技术的原理。
麦克风阵列由多个麦克风组成,常见的有2个、4个、8个、16个或更多个麦克风,通过特定的排列方式,并通过算法处理产生立体声效果。
麦克风阵列的主要目的是捕捉来自特定方向的声音,并尽可能减少与其他方向的声音干扰。
其次,麦克风阵列需要进行降噪处理。
在实际环境中,可能存在各种干扰声音,如背景噪音、回声等。
麦克风阵列可以利用多个麦克风之间的距离差异来减少干扰声音。
通过计算不同麦克风接收到的声音波之间的相位差异,可以将干扰声音的分量减小或消除。
最后,麦克风阵列需要进行声音增强。
在声音传播过程中,声音会随着距离的增加而衰减。
为了增强远离麦克风阵列的声音,可以利用多个麦克风接收到声音波的强度差异。
通过计算不同麦克风接收到的声音波的强度差异,可以调整声音的增益,增加声音的清晰度和可听性。
麦克风阵列技术的原理基于对声音波的探测和分析,通过合理的排列和处理方式,可以实现声音的定位、降噪和增强等功能。
麦克风阵列技术在语音识别、智能音箱、视频会议等领域有着广泛的应用前景,可以提高语音交互的效果和用户体验。
麦克风阵列在语音识别中的应用
随着人工智能技术的不断发展,语音识别技术逐渐走进人们的生活。
而在语音识别技术中,麦克风阵列的应用起到了重要的作用。
本文将介绍麦克风阵列在语音识别中的应用,并从多个方面阐述其重要性。
一、麦克风阵列介绍
麦克风阵列是由多个麦克风组成的一种变体形式,它可以将多个麦克风的输入信号进行数字信号处理和分析,并从中提取出任意方向的声音信号。
麦克风阵列通常由四个或更多麦克风组成,这些麦克风通常围绕着一个中心点布置,以形成一个可控制的虚拟听取器。
二、麦克风阵列在语音识别中的应用
1. 声纹识别
麦克风阵列可以用于声纹识别中,通过对人声信号进行分析和处理,从而实现语音识别。
在声纹识别中,麦克风阵列可以提高识别准确性和抗干扰能力,从而更好地识别人的声音特征。
2. 环境噪声抑制
麦克风阵列可以有效地抑制周围环境中的噪声,比如电视声、交通噪声等,从而提高语音识别的精确性和准确性。
麦克风阵列能够精确分析和抑制噪声,使得语音信号更加清晰,使得语音识别更准确。
3. 清晰度提升
麦克风阵列可以通过将多个麦克风的输入信号组合起来,从而使得语音信号更加清晰,更容易被识别。
麦克风阵列可以通过深度学习等技术,将多个麦克风的输入信号进行分析和处理,从而提升语音识别的清晰度和准确性。
三、总结
麦克风阵列在语音识别技术中发挥着重要作用,能够提高识别准确性和抗干扰能力,从而更好地识别人的声音特征。
麦克风阵列还能有效地抑制环境噪声,提高语音识别的精确性和准确性,从而使得语音识别更加优秀。
随着人工智能技术的发展,麦克风阵列技术将会在语音识别中扮演更加重要的作用。
《基于麦克风阵列的语音增强研究》篇一一、引言随着智能设备的广泛应用,语音交互技术在日常生活与工作场景中逐渐成为关键的信息交互手段。
基于麦克风阵列的语音增强技术是语音处理领域中的一项重要技术,它能有效地改善声音质量、识别语音并抵抗外界噪音。
本文主要就基于麦克风阵列的语音增强技术进行深入的研究与探讨。
二、麦克风阵列的基本原理麦克风阵列是由多个麦克风组成的系统,通过捕捉声音在空间中的传播特性,对声音信号进行空间滤波和定位。
每个麦克风都能捕捉到声音信号,通过阵列处理算法,可以确定声音的来源方向和距离,从而对声音进行增强或抑制。
三、语音增强的需求与挑战随着语音交互技术的普及,语音增强的需求日益增长。
然而,实际环境中的声音信号常常被各种噪声干扰,影响了语音识别的准确度。
基于麦克风阵列的语音增强技术可以有效减少背景噪声的影响,提高语音质量。
但是,在实际应用中仍面临着诸多挑战,如多路径效应、反射干扰、噪音与语音的频谱重叠等。
四、基于麦克风阵列的语音增强技术研究针对上述挑战,研究者们已经开展了一系列关于基于麦克风阵列的语音增强技术研究。
这些研究主要围绕以下几个方面:1. 阵列信号处理算法:通过优化阵列信号处理算法,如波束形成、噪声抑制等,提高对声音信号的捕捉和识别能力。
2. 声源定位与追踪:利用麦克风阵列捕捉到的声音信号,结合声源定位算法,实现声源的实时定位与追踪。
3. 噪音抑制与回声消除:针对环境中的各种噪音和回声干扰,研究有效的抑制和消除方法,提高语音的清晰度。
4. 深度学习在语音增强中的应用:利用深度学习技术,如卷积神经网络、循环神经网络等,对麦克风阵列捕捉到的声音信号进行深度分析和处理,进一步提高语音增强的效果。
五、实验与结果分析为验证基于麦克风阵列的语音增强技术的效果,研究者们进行了大量的实验。
实验结果表明,通过优化阵列信号处理算法、声源定位与追踪、噪音抑制与回声消除等技术手段,可以有效提高语音识别的准确度。
麦克风阵列技术在声学中的应用随着技术的不断进步,人们对于声音的需求也在不断提高。
因此,在音频领域中,麦克风阵列技术也成为了一个不可忽视的重要技术手段。
麦克风阵列技术可以通过合理的安放多个麦克风,在保证清晰捕捉声音同时降低噪音,提高对声音的分析和理解。
本篇文章将介绍麦克风阵列技术在声学中的应用和优势。
一、麦克风阵列技术的优势麦克风阵列可以将多个麦克风的信号进行合并,提高对声音的采集和识别能力,并在保证捕捉声音清晰的同时,消除环境中的噪声。
具体有以下优势:1、高质量声音麦克风阵列技术可以优化声音质量,使得声音更为清晰,减少噪声和杂音的影响,最终提高对声音的认识和分析能力。
2、大幅降低回声回声是在许多情况下降低音频质量的主要因素之一。
通过使用麦克风阵列的技术,可以有效减少回声,使得声音更为真实和自然。
3、增强方向性麦克风阵列技术还可以提高对声音的方向性,使得录音更加准确,同时降低来自周围环境的噪声,使得录音过程更加精确和方便。
二、麦克风阵列技术在语音识别中的应用麦克风阵列技术在语音识别中应用十分广泛。
由于麦克风阵列可以从不同的角度覆盖到声音的不同部位,从而准确判断声音在空间中的方向和距离,并最终提高语音识别的准确性。
比较常用的语音识别包括:语音助手、计算机自动语音录入、语音控制电子产品等,这些功能都依赖于麦克风阵列技术。
三、麦克风阵列技术在音乐领域的应用麦克风阵列技术也被广泛应用于音乐领域。
由于音乐表现需要高质量的现场效果,渐进方向性和低噪音技术可以保证音乐现场效果的高质量较低的降噪才能保证人的声音和乐器的声音保持纯净。
因此,麦克风阵列技术可以使得音乐现场表演具有更高的准确度,感觉更为强烈。
四、麦克风阵列技术在视频会议中的应用麦克风阵列技术在视频会议中同样具有不可低估的作用。
通过使用多麦克风阵列技术,可以同时识别和过滤多人的声音,在保证声音清晰的同时,避免不同位置和距离的人音频混叠给会议进行带来诸多不便。
麦克风阵列解决方案
《麦克风阵列解决方案》
在如今的科技发展中,麦克风阵列正成为解决多种音频采集和处理问题的热门选择。
麦克风阵列是一种成组的麦克风系统,能够同时采集多个声音信号,并通过信号处理技术将它们合成为单一的音频信号。
它在语音识别、会议录音、音频增强等领域有着广泛的应用。
对于无线耳机和智能音箱,麦克风阵列的应用尤为广泛。
通过利用麦克风阵列的方向性,可以实现更准确的语音识别和识别目标方向。
这种技术不仅可以提高设备的用户体验,还可以为语音交互和人机交互的发展提供有力的支持。
此外,对于大型会议室和演讲场所,麦克风阵列系统也发挥着不可或缺的作用。
传统的单颗麦克风往往无法有效捕捉到远处的声音,而麦克风阵列可以通过多颗麦克风的联合工作,实现全方位声音的捕捉和清晰传输。
这对于重要会议和演讲活动来说,是非常重要的。
总的来说,麦克风阵列解决方案为音频采集和处理带来了新的技术突破和解决方案。
它在多个领域的应用都取得了积极的成果,同时也为音频技术的发展带来了新的动力和方向。
相信随着技术的不断进步,麦克风阵列将会在更多的领域中得到广泛应用,为人们的生活带来更多便利和乐趣。
阵列信号处理的应用与原理简介阵列信号处理是指利用多个传感器或接收器对信号进行处理的一种技术。
通过将多个传感器或接收器布置成一定的阵列,并利用阵列特性来实现信号的增强、滤波、波束形成、颤振和目标检测等功能。
本文将介绍阵列信号处理的应用和原理,并列举了一些常见的应用场景。
应用场景无线通信阵列信号处理在无线通信领域有广泛的应用。
通过使用阵列天线接收器,可以实现信号增强和干扰抑制。
阵列天线接收器可以有效地接收目标信号,而且可以通过改变阵列的形状和方向性来调整接收波束,减少信号的干扰和噪声。
雷达系统阵列信号处理在雷达系统中也被广泛应用。
通过使用阵列天线接收器,可以实现目标检测和波束形成。
阵列天线接收器可以根据目标的位置和角度来调整接收波束,从而准确定位目标位置和判断目标特征。
声音处理阵列信号处理在声音处理领域也有很多应用。
通过使用麦克风阵列,可以实现声音增强和噪声抑制。
麦克风阵列可以根据声源的位置和方向性来调整接收波束,提高声音的清晰度和品质。
物体定位阵列信号处理在物体定位领域也有重要的应用。
通过使用多个传感器或接收器,可以实现物体的定位和追踪。
例如,通过使用GPS阵列接收器,可以准确测量目标的位置和速度。
工作原理阵列信号处理的工作原理基于波的干涉和差别。
当信号到达不同的传感器或接收器时,由于传播路径的不同,信号的相位和幅度会发生变化。
通过对不同传感器或接收器接收到的信号进行处理和比较,可以得到信号的方向、位置和特征。
阵列信号处理的关键概念包括波束形成、相移、干涉和降噪等。
波束形成波束形成是指通过阵列的干涉原理,调整传感器或接收器的相对相位和幅度,从而使得接收到的信号在特定方向上产生指向性增强。
波束形成可以通过手动设定相位和幅度,也可以通过自动化算法实现。
相移相移是指通过改变传感器或接收器的工作相位,使信号在阵列中达到相位同步。
相位同步可以提高接收性能和减少相位差引起的波束旁瓣。
干涉干涉是指多个传感器或接收器接收到的信号通过叠加产生增强或抑制效应的现象。
《基于麦克风阵列的语音增强研究》篇一一、引言随着智能设备的广泛应用,语音交互技术在人机交互中占据了越来越重要的地位。
其中,麦克风阵列技术的应用,使得语音识别系统的性能得到了显著提升。
基于麦克风阵列的语音增强技术,可以有效地提高语音信号的信噪比,从而改善语音识别的准确率。
本文将针对基于麦克风阵列的语音增强技术进行深入研究,并探讨其在实际应用中的效果。
二、麦克风阵列技术概述麦克风阵列是指将多个麦克风按照一定的几何结构排列在一起,通过信号处理技术对多个麦克风的信号进行融合,以实现空间滤波、语音定位和语音增强等功能的技术。
其基本原理是利用不同位置麦克风的信号差异,通过算法处理,实现噪声抑制、回声消除等效果。
三、基于麦克风阵列的语音增强方法(一)波束形成波束形成是麦克风阵列中常用的一种语音增强方法。
其基本思想是通过加权求和的方式,将指向目标方向的信号加强,同时抑制来自其他方向的干扰噪声。
波束形成的算法包括相位变换法、最小方差法等。
(二)盲源分离盲源分离是一种利用多个麦克风的信号对音频信号进行源分离的技术。
其基本思想是将不同位置的麦克风信号进行时间-空间变换,通过多通道线性系统来分离出各个音频源的信号。
盲源分离方法可以有效地去除非目标方向的干扰噪声,提高语音识别的准确率。
(三)噪声抑制噪声抑制是麦克风阵列中常用的另一种语音增强方法。
其基本思想是通过估计和消除噪声信号来提高语音信号的信噪比。
常用的噪声抑制方法包括基于频谱减法、基于子空间方法的噪声抑制等。
四、实际应用效果分析在实际应用中,基于麦克风阵列的语音增强技术能够有效地提高语音信号的信噪比和识别率。
通过使用波束形成算法,能够明显抑制非目标方向的噪声和干扰信号,提高目标方向上的语音清晰度。
同时,通过盲源分离和噪声抑制等算法的应用,可以进一步提高语音识别的准确率。
此外,基于麦克风阵列的语音增强技术还可以应用于多语种、多环境下的语音识别系统中,以适应不同的应用场景和需求。
FM31系列数字语音处理芯片在双向降噪手机中的应用-设计应用随着数字信号处理技术的发展,数字语音处理技术越来越成为发展的潮流。
一方面,移动设备向轻薄小型化发展;另一方面,设备包含的功能单元越来越多,如GSM和TD-SCDMA双模制式,蓝牙和WiFi,设备对抗扰的要求越来越高。
数字麦克风拾音技术可以消除系统各种射频干扰对语音通信产生的噪声。
在各种应用场合,手机用户期望在嘈杂的环境内,能使本方的语音清晰地传送给对方,同时可以听清楚对方的声音。
双向噪声抑制技术和清晰语音引擎可以实现清晰语音通信。
影响语音通话质量的噪声干扰,通常包含近端本地的外在环境噪声干扰和远端无线传输夹杂在语音中的噪声干扰。
外在环境噪声影响包含两个方面:由于声音的遮蔽效应,周围环境噪声会影响本地听者,当噪声足够大时,甚至无法听清对方的声音;环境噪声混杂在语音中,经过无线传输到对方的听筒中,使对方难以听懂。
针对这些干扰,需要相应的技术来抑制噪声,增强语音,实现清晰语音通信。
富迪科技(Fortemedia)公司推出的FM31系列芯片是专门针对手机市场推出的基于公司阵列麦克风(SAM)技术,全数字接口和数字处理的清晰语音处理芯片。
数字阵列麦克风技术采用空间滤波、DSP处理技术,实现心形的试音区域,定向、定距拾取本地声音信号,抑制了周围环境噪声,消除声学回声,提升上行通话质,使对方获得清晰的语音。
清晰语音引擎(BVE)技术,可以根据环境噪声大小,频谱特性,自动调节听筒中的下行语音的音量和频谱能量,使本地用户能够听清楚。
同时,对于对方送过来的语音进行消噪,减小本地噪声。
FM31系列芯片主要功能及特点专门针对手持设备设计,采用130nm优化设计技术,超低功耗,数字和核工作电压1.2V,输入输出电源1.8V,输入/输出引脚可以承受3.3V;典型功耗25mW,采用24个引脚的QFN封装,引脚间距0.5mm,外形尺寸4mm×4mm;内建锁相环(PLL),支持多种时钟输入。
基于麦克风阵列的声源定位技术摘要声源定位技术是利用麦克风拾取语音信号,并用数字信号处理技术对其进行分析和处理,继而确定和跟踪声源的空间位置。
声源定位技术在视频会议、语音识别和说话人识别、目标定位和助听装置等领域有着重要的应用。
传统的单个麦克风的拾音范围很有限,拾取信号的质量不高,继而提出了用麦克风阵列进行语音处理的方法,它可以以电子瞄准的方式对准声源而不需要人为的移动麦克风,弥补单个麦克风在噪声处理和声源定位等方面的不足,麦克风阵列还具有去噪、声源定位和跟踪等功能,从而大大提高语音信号处理质量。
本文主要对基于多麦克风阵列的声源定位技术领域屮的基于时延的定位理论进行了研究,在此基础上研究了四元阵列、五元阵列以及多元阵列的定位算法,并且分别对其定位精度进行了分析,推导出了影响四元、五元阵列目标方位角、俯仰角及目标距离的定位精度的一些因素及相关定位方程,并通过matbb仿真软件对其定位精度进行了仿真;最后在四元、五元阵列的基础上,采用最小二乘法对多元阵列定位进行了计算;通过目标计算值和设定值对比,对多元阵列的定位精度进行了分析,并得出了多元阵列的目标定位的均方根误差。
关键词:麦克风阵列,声源定位,时延,定位精度,均方根误差Based on Microphone Array for Sound Source Localization ResearchAbstractSound source positioning technology is to use the microphone to pick up voice signals, and digital signal processing technology used for their analysis and processing , Then identify and track the spatial location of sound source ・ Acoustic source localization techniques have a variety of important uses in videoconferencing, speech recognition and speaker identification, targets' direction finding, and biomedical devices for the hearing impaired・ The pick up range of traditional single microphone is limited, the signal quality picked up is not high, t hen a voice processing met hods with the microphone array has been proposed . It may be electronically aimed to provide a high-quality signal from desired source localization and does not require physical movement to alter these microphones' direction of reception. Microphone array has the functions of de-noising, sound source localization and tracking functions, which greatly improved the quality of voice signal processing.The article discusses some issues of sound source localization based on microphone array, Ont he basis , it stu dies a four element array, five element array and an multipie array positioning algorithm, t hen the positioning precision is analyzed. Derived some factors of the azimuth and elevation angle targets the target range of the estimation precision affected and positioning equation. And through MATLAB simulation software for its positioningaccuracy of Simulation. finally , based on four yuan, five yuan of array, using the least square met hod , the multiple array localiza tion were calcula ted. Through the cont ras t of the t arge t value and set value, multi pie array positioning accuracy is analyzed, and the of diverse array target positioning・Keywords: Microphone Array, Sound Source Localization, Time Delay, Positioning precision , root mean square error1 引言 (1)1.1研究背景和意义 (1)1.2声源定位技术的研究现状及发展 (2)研究历史和现状 (1)发展趋势 (3)1.3麦克风声源定位技术 (5)1.4本文所要研究的内容 (6)2声学理论基础知识 (7)2.1空气的物理特性 (7)2.2声波的物理特性 (8)2.3声波在空气中的传播特性 (12)2.4声源定位原理 (13)2.5 本章小结 (14)3基于时延估计的声源定位算法及其精度分析 (15)3.1时延估计算法概述 (15)3.2基于时延估计的声源定位的研究分析 (16)四元阵列定位算法 (17)五元阵列定位算法 (20)3.3四元阵列的定位精度分析及其仿真 (21)方位角精度分析及仿真 (23)俯仰角精度分析及仿真 (25)距离估计精度分析及仿真 (27)3.4五元阵列的定位精度分析及其仿真 (29)方位角精度分析及仿真 (29)俯仰角精度分析及仿真 (32)距离估计精度分析及仿真 (34)3.5 本章小结 (36)4多元麦克风阵列声源定位分析 (37)4.1多元麦克风阵列定位方程 (37)4.2最小二乘法求声源位置 (30)4.3定位精度分析 (40)4.4结果及计算分析 (41)4.4 本章小结 (33)5 总结与展望 (43)5.1全文总结 (43)5.2本文的不足之处及后续工作展望 (44)参考文献 (46)致谢 (49)1引言1.1研究背景和意义在各种电子设备高度智能化的今天,语音增强与声源定位技术成为语音通信领域中两种不可缺少的技术。
麦克风阵列信号处理的研究现状与应用麦克风阵列信号处理的研究现状与应用罗金玉等:麦克风阵列信号处理的研究现状与应用麦克风阵列信号处理的研究现状与应用(1.武警工程学院研究生大队,陕西西安710086;2.武警工程学院通信工程系,陕西西安710086)摘要:在回顾麦克风阵列信号处理研究历程的基础上,对麦克风阵列信号处理的特点进行分析,总结了目前的研究热点问题及现有算法并对各算法的优缺点进行比较,重点阐述了使用最为广泛的声源定位算法,最后介绍几个有价值的应用领域,为进一步研究麦克风阵列信号处理奠定基础.关键词:麦克风阵列信号处理;声源定位;TD0A;应用,中图分类号:TN911-34文献标识码:A文章编号:1004—373X(2010)23—0080—05 StudyStatusandApplicationofMicrophoneArraySignalProcessing LUOJin-yu,LIUJian-ping,ZHANGYi—wen(1.Post—graduateManagingBrigade,EngineeringCollegeofArmedPoliceFo rce,Xi'an710086,Chi na;2.DepartmentofC0mmunlcationEngineering,EngineeringColl egeofArmedPoliceForce, Xi'art710086.China)Abstract:Theeharacteristicofthemicrophonearraysignalproce ssingisanalyzedbasedonth ereviewfortheprogressofmicrophonearraysignalprocessing.Thehotissuebeingstudied recentlyandtheexistingalgo rithmscorrespondingtoitare summerized.Themeritsanddemeritsofthealgorithmsarecomp ared.Thewidely-usedsoun dsourcelocalizationalgerithmis elaboratedemphatically.Somevaluableapplicationfieldsareint roduced.Keywords:microphonearraysignalprocessing;soundsourceloc alization;TDOA;application0弓l言阵列信号处理的发展源于2O世纪40年代的自适应天线组合技术,它使用锁相环进行天线跟踪.1967年Widrow提出最小均方(LMS)自适应算法,标志着阵列信号处理取得了显着进展.1969年Capon提出恒定增益指向最小方差波束形成器,通过增加已知信息的利用程度提高了对目标的分辨能力.1979年Schmidt提出多重信号分类(MUSIC)方法,开创了子空间类阵列信号处理算法研究的先河,是阵列信号处理发展史上的一个重要里程碑.1986年Roy等人提出的基于旋转不变技术的信号参数估计方法(ESPRIT),相对MUSIC算法大大降低了计算量同时降低了算法对硬件的要求,为阵列信号处理的发展谱写了新的篇章. 麦克风阵列信号处理是阵列信号处理的一个新兴分支,继承和发展了阵列信号处理理论算法,最早于8O年代初期用于大型会议室的会议系统uj,证明了其在语音信号处理方面的独特优势.近年来它已成为现代信号处理的的重要研究热点之一,很多国际着名的公司和研究机构,如IBM,BEIL等,都致力于麦克风阵列收稿日期:2010—06—18基金项目:国家自然科学基金资助项目(6094000)8O的研究和产品开发.麦克风阵列正成为越来越流行的高质量语音拾取工具,预计在不久的将来将取代传统的桌面或头戴式麦克风].并且由于其在语音信号处理上具有其他信号处理方法无法比拟的优势,被广泛应用于军事国防,智能空间,新型人机交互,机器人导航等众多领域,并且随着研究的不断深化,其研究应用的前景也不断扩大.1麦克风阵列信号处理的特点麦克风阵列信号处理是阵列信号处理的一个新兴分支.在很长的一段时间里,它的许多算法都是直接借用或简单修改成熟的传统阵列信号处理算法.这在研究初期大大推动了麦克风阵列信号处理的发展,但深入的研究表明,这些算法往往无法应用于实际系统或是算法性能不理想,这主要是因为麦克风阵列信号处理具备以下区别于传统阵列信号的特点E~-73:语音信号是宽带信号麦克风接收的语音信号没有经过调制,阵元间时延和相位差与信号源的频率密切相关.且不同类型的语音信号频谱差异很大,传统的窄带信号处理算法不再适用.语音信号是短时平稳信号麦克风接收信号为短时平稳的语音信号,分析处理必须建立在短时的基础《现代电子技术}2010年第23期总第334期通信与信息技术q 上,特别是当声源移动时,分析处理的难度变大.应用环境存在高混响在一些非手持式智能语音通信系统中,麦克风与说话人距离较远,特别是应用于室内环境时,麦克风接收到的信号除语音直达外,还包括大量经多次反射后形成的反射波,造成高混响,大大降低了语音信号的质量.而且造成混响的原因很多,混响模型很复杂,去混响难度大.应用环境的噪声大且复杂在麦克风阵列应用中,背景噪声很复杂且不同应用环境的噪声源也不同,如室内外的噪声源差异就很大.因此提高信号信噪比难度大.2麦克风阵列信号处理的研究内容2.1声源定位麦克风阵列声源定位技术利用空间分布的多路麦克风拾取声音信号,通过对麦克风阵列的各路输出信号进行分析和处理,得到一个或者多个声源的位置信息. 目前存在的声源定位算法主要包括基于波束形成的方法,基于高分辨率谱估计方法和基于到达时延差估计方法,它们分别将声源和阵列结构之间的关系转变为空间波束,空间谱函数或者多个到达时间差信息,然后通过估计这些信息进行声源定位.2.1.1基于波束形成的定位方法基于波束形成的定位算法是出现较早的定位方法,通过对麦克风阵列接收到的语音信号进行滤波,加权求和,然后直接控制麦克风指向使波束有最大输出功率的方向...NLbea(q)一『xi(+矗)]dt(1)Jo一式中:L表示波束输出;()表示各麦克风的接收信号.式(1)就是一个典型的波束形成估计方程,通过调整各麦克风接收信号的时延值r使输出信号达到最大,进而确定声源位置.因为解上述方程确定通常是一个非线性的优化问题,无法直接计算得到,通常采用Newton—Raphson算法或最陡下降算法来确定最大值,而在声源定位系统中,最大值对应的t不是惟一的,取决于信号的初始值,许多研究人员提出采用峰值搜索的方法来解决这种问题_8].但目标函数和峰值搜索的计算量往往很大,这也成为基于波束形成定位方法最大的弊端.2.1.2基于高分辨率谱估计的定位方法基于高分辨率谱估计的定位方法通过求解阵列接收信号的协方差矩阵获得空间谱函数,再由此信息进行声源定位,包括自回归模型,最小方差频谱估计, MUSIC,ESPRIT,子空问拟合等.其中的很多方法只能适用于远场模型,即要求麦克风阵列与声源的距离较远,远远大于麦克风阵元间距,并且麦克风是布置成线形.将其用于近场时,性能会下降很多.同时这种方法也要进行峰值搜索,但它的峰值通常都比较尖锐].2.1.3基于到达时延差(TDOA)的定位方法基于到达时延差的定位方法是利用时延估计算法求出信号到达阵列不同麦克风的相对时延,再利用这些时延信息和麦克风阵列的空间位置关系估计声源位置, 是麦克风阵列声源定位方法中应用最为广泛的方法. 基于到达时延差的定位方法已经成功地应用于雷达,声纳系统中,但是它们处理的信号是窄带信号,信噪比高. 应用于宽带,高混响的麦克风阵列定位系统时,需要添加一些特殊滤波器并进行预处理.基于到达时延差定位法的第一步是准确计算时延差.广义互相关函数(GeneralizedCrossCorrelation, GCC)是出现最早的方法,可以在时频两个领域进行计算时延差:z(£)一口5(£一)+72(£)(2)r+..(rlj)一lz(4-r0)()dt(3)式中:-z()是麦克风的接收信号;()是声源信号是衰减因子是延迟量;()是噪声;Y是两阵元的相关函数.相关函数.y最大值对应的r就是所要求的阵元i和阵元J之间的时延差.为减少计算量,还可以对信号进行FFT变换,在频域做相关然后搜索峰值:r+..n,,(£)一IX(厂)x(厂)edf(4)式中:R(£)是两阵元频域的相关函数;x(_厂)是麦克风接收信号z()的傅里叶变换.为提高抗噪,抗混响性能,提高时延估计精度,还可以通过加权函数来改进GCC,例如相位变换法(Phase Transform,PHAT),平滑变换法(SmoothedCoherence Transform,SCoT)等[.r+..R.(£)一}gt(f)x(-厂)x(厂)edf(5)式中:xF(f)为加权函数,PHAT中的(厂)为:厂最小均方(LeastMeanSquare,LMS)自适应滤波和自适应特征值分解(AdaptiveEigenvalueDecompo—sitionAlgorithm,AEDA)等时延估计算法都在声源定位中也到了广泛应用_1].但自适应方法依赖于实验8】罗金玉等:麦克风阵列信号处理的研究现状与应用的初始值并且计算时会产生较大的时延,无法适用于实时应用.文献[17-203等分别使用广义互相关函数,基于语音信号模型或产生语音的激励源特征,最小平方和极大似然估计的方法给出了TDOA的估计或实现声源定位.TDOA定位法的第二步是通过计算出的时延差来确定声源位置.理论上,三个麦克风组成的阵列已经能确定声源位置,而增加麦克风的数量,即增加TDOA数据可以减小估计误差.通过TDOA 来定位声源的方法有很多:例如极大似然法,最小方差法等.极大似然法认定误差服从高斯分布,试图寻找误差最小点.而最小方差法是试图找到一个点使期望的TDOA值与实测的TDOA值的方差和最小.基于到达时延差TDOA的两步定位法,延时小,适用于实时的声源定位与目标追踪.但存在的问题是第一步从原始的麦克风接收数据中提取了时延差这一中间信息后,丢弃了其他的有用信息,只将TDOA用于第二步计算,造成信息损失.一种更好的方法是将原始数据中所有的中间信息保留,并都用于最后一步声源位置的确定.2.2噪声抑制噪声抑制是要去除观测信号中的噪声,获得高质量的期望信号.由于通信过程中噪声的产生无法避免,并且严重影响语音信号的质量,因此噪声抑制一直是通信学研究的热点问题,也出现了许多基于单一接收阵元的噪声抑制方法.然而这些方法存在的最大问题是在抑制噪声的同时,往往也影响了期望信号,付出信号可懂度下降的代价ll2.利用麦克风阵列独特的空间滤波特性,可以很好地解决这一问题,可以达到抑制噪声的同时不对期望信号产生任何干扰.目前,基于麦克风阵列实现噪声抑制的方法主要有自适应噪声对消和基于空间信息抑制噪声这两类方法, 其中,基于空间信息的方法又可分为两大类:基于波束形成原理的方法和基于盲信号分离的方法.而波束形成方法又可以分为固定波束形成方法和自适应的波束形成方法,其基本原理是利用阵列的空间信息对目标声源形成过滤波束避免来自其他方向的噪声干扰.自适应噪声对消,是实时地在信号静默期获取噪声的参考信号,来消弱噪声信号.2.3去混响混响是室内声源停止发声后,由于房间边界面或其中障碍物使声波多次反射或散射而产生声音延续的现象,是对语音质量影响最大的因素之一,会严重降低语音信息的可懂度,因此,去混响是语音通信研究的一个重点问题.82目前去混响的方法主要分为三类:基于信源声学模型去混响,通过同形转化分离混响和基于信道反转均衡去混响,其中,基于信道反转均衡去混响又分为直接反转,最小均方误差和多信道反转理论的方法引.文献[23]应用倒谱预滤波技术来抑制房间混响,文献[24]通过选取多个峰值进行线性交叉来削弱混响的影响.但由于这两种方法采用了理想房间模型,因此时延估计的抗混响性能较差.文献[25-J的自适应特征值分解算法直接从房间混响模型出发,通过自适应方法逼近房间冲激响应,进而估计时延,因而该方法在混响较强的条件下仍有良好的估计性能.但该方法需要估计矩阵运算,计算量大,难以在实际系统中应用. 2.4声源盲分离声源盲分离是要通过分析麦克风阵列的接收信号来区分同一时刻来自不同方向的信号,由于无法获知信道的具体性能参数和声源信号,称为盲分离.充分利用信源信号独立性的独立成分分析法(IndependentCorn—ponentAnalysis,ICA)是声源盲分离使用较广的方法.但是在高混响的环境下,基于ICA的算法性能下降很快,有待改进.2.5鸡尾酒会效应众所周知,即使在嘈杂的背景环境下,人也能集中精神去听其中的某一种声音,这种有趣的心理声学现象被称为鸡尾酒效应.大量研究实验表明人的这种能力得益于人有两只耳朵.人的大脑只需要根据两只耳朵听到的声音强度就能有效地跟踪声源,这在麦克风阵列的应用上具有极大的指导意义,由此引发了一波研究鸡尾酒效应的热潮.3麦克风阵列信号处理的应用麦克风阵列信号处理具有十分广阔的应用前景,在军事国防,智能化,远程控制,人机交互,电脑游戏,视频会议,语音监测等许多领域都有重要的科研价值和潜在的实用价值,已经引起了许多国家学术界,工业界和军界的高度重视.下面简要介绍麦克风阵列信号处理的一些应用.3.1国防领域应用麦克风阵列信号处理因其出色的语音信号处理能力,被广泛应用于军事国防.国外在智能雷弹系统和战场侦查系统研究中,广泛使用基于麦克风阵列的被动声探测,近几年还将麦克风阵列声源定位技术应用于飞机探测,直升机报警,炮位侦查,单兵声测系统,枪声定位等.AAI公司的PDCue系统将麦克风安装在车辆的四角,可以提供低轮廓,360.的态势感知能力.在任何环境下,PDCue系统都可以根据单发,多发和点射枪声《现代电子技术)2olo年第23期总第334期通信与信息迅速定位并跟踪枪声来源.国内近几年也在麦克风阵列信号处理方面进行了大量研究,受到国防科技重点实验室基金和国家自然科学基金的支持,并已取得了一定的成果.其中炮用立靶声定位系统列入国家军用标准,弹头落点定位系统和敞开型胸环靶系统也已通过鉴定并列入国家军用标准. 3.2智能化领域应用麦克风阵列信号处理可以自动高效地从接收的语音信号中提取有用信息,适用于智能化领域.2003年意大利里雅斯特大学和帕多瓦大学联合研制了智能声视联合多代理监视跟踪系统,对脚步声之类的声源进行轨迹跟踪,能实现对博物馆等公共场所的人流进行记录,或监测在某作品前人们停留的时间长短l2引. 2007年加拿大魁北克的珊不勒凯大学机电学院开发研制了避障机器人.机器人具有鲁棒的定位性能和通过使用波束成形和粒子滤波能同时跟踪几个声源.4结语麦克风阵列信号处理是数字信号处理的一个新领域,具备许多传统阵列信号处理无法比拟的优势,是目前国内外的研究热点.很多国际着名的公司和研究机构,如IBM,BELL等,正致力于麦克风阵列的研究和产品开发.相信随着研究的不断深入,麦克风阵列信号处理也必定会具备越来越广阔的应用前景.[I]参考文献FLANAGANJ,J0HNSTONJ,ZAHNR,eta1. Computersteeredmicrophonearraysforsoundtransduc—tioninlargerooms[J].Acoust.Soc.Amer.,1985,78(5):1508—1518.[23FLANAGANJL,SURENDRANA,JANE.Spatially selectivesoundcaptureforspeechandaudioprocessing[J]. SpeechCommunication,1993,13(1/2):207—222.[3]GRENIERY.Amicrophonearrayforcarenviroment[c]//IEEEProceedingsofICASSP一92.SanFrancisco, CA,USA:ICASSP,1992,1:305—308.[4]KELLERMANW.Aself-steeringdigitalmicrophonearray[c]//IEEEProceedingsofICASSP一91.Toronto,Ont, Canada:ICASSP,1991,5:3581—3584.[5]HERBORDTW,KELLERMANNWIAdaptivebeamforming foraudiosignalacquisition[c]//AdaptiveSignalProcessing: [6] ApplicationstoReal—worldProblems.Berlin,Germany: Springer—Verlag,2003:321-325.COMPERNOLLEDV.Switchingadaptivefiltersforen—hancingnoisyandreverberantspeechfrommicrophonearray recordings[c]//Proc.IEEEICASSP,1990.Albuquerque,NM:ICASSP,1990:833—836.[7]DIBIASEJ.Ahigh—accuracy,low-latencytechniquefor talkerlocalizationinreverberantenvironmentsrD].Providence,USA:BrownUniversity,2000.[83DIBIASEJ,sILVERMANH,BRANDsTEINM.Robust localizationinreverberantrooms[M]//BRANDsTEINMs,WARDDB(eds.).MicrophoneArrays:Signal ProcessingTechniquesandApplications[s.I.]:Springer, 2001:208-360.[9]KROLIKJ.Focusedwide—bandarrayprocessingforspatial spectralestimation[M].Beijing:PrenticeHall,1991.El0]KNAPPcH,cARTERGc.Thegeneralizedcorrelation methodforestimationoftimedelay[J].IEEETrans.onAcoust.,Speech,SignalProcessing,1976,ASSP一24:32O一327.[11]RuIY,FLORENCIOD.Timedelayestimationinthe presenceofcorrelatednoiseandreverberationEc]//Pro—ceedingsofIEEEInternationalConferenceonAeoustics, Speech,andSignalProcessing(ICASSP04).Redmond,WA,USA:MicrosoftRes.,2004:133—136.[12]RuIY,FLORENCIODinei.NewdirectapproaChesto robustsoundsource1ocalizationrC]//Proc.ofIEEEICME2003.Baltimore,MD:ICME,2003:6-9.r13]CARTERGC,NUTTALLAH,CABLEPG.The smoothedcoherencetransform[J].IEEESignal ProcessingLetters,1973,61:1497—1498.r14]HUANGY.Real—timeacousticsource1ocalizationwith passivemicrophonearrays[D].Atlanta,GA:Georgia InstituteofTechnology,2001.[15]HuANGYi—teng,BENEsTYJ,ELK0Gw.Aneffient linear—correctionleast—sq0aresapproachtosource1ocaliza一{ion[c]//2001IEEEWorkshopontheApplicationsofSigna1ProcessingtoAudioandAcoustics.NY,USA: LucentTechno1.,2001:67—7O.[16]HuANGY,BENESTYJ,ELKOGW.Adaptiveeigen—valuedecompositionalgorithmforreal—timeacousticsource localizationsystem[C]//1999IEEEInternational ConferenceonAcoustics,SpeechandSignalProcessing. Phoenix,AZ,USA:ICASSP,1999,2:937—940.rl7]BECHLERDirk,KROSCHELKristian.Reliability criteriaevaluationforTD0Aestimatesinavarietyofre—alenvironments[C]//20051EEEInt.Conf.onAcous—tics,SpeechandSignalProcessing(ICASSP).Philadel—phia,USA:ICASSP,2005:985—988.[18]YEGNANARAYANAB,PRASANNASRM,RAOKS.Speechenhancementusingexcitationsourceinforma—tion[C]//Proc.ofIEEEInt.Conf.onAcoustics, SpeechandSignalProcessing(ICASSP).Orlando,FL:ICASSP,2002:541-544.[19]cHENJc,YA0K,HUDSONRE.Sourcelocalization83等:麦夏阵歹IJ{言号处理的研究现状与应用andbeamformingⅢJ].IEEESignalProcessingMagazine,2002,19(2):3O一39.[2o]CHENJC,HUDSONRE,YAOK.Maximum—likelihood [21] sourcelocalizationandunknownsensorlocationestimation forwidebandsignalsinthenear—field[J].IEEETrans.on SignalProcessing,2002,50(8):1843—1854.CHENJ,BENESTYJ,HUANGY,eta1.Newinsights intothenoisereductionWienerfilter[J].IEEETrans.onAudio,Speech,LanguageProcessing,2006,14:]2]8一】234.[22]HUANGY,BENESTYJ,CHENJ.Dereverberation[M]//BENESTYJ,SONDHIMM,HUANGYi—teng. HandbookofSpeechProcessing.Berlin,Germany:Springer,2007:145-282.[23]CHAMPAGNEB,BEDARDS,STEPHENNEA.Per formanceoftimedelayestimationinthepresenceofroom reverberation[J].IEEETransactiononSpeechandAudio Processing,1996,4(2):148—152.[24]PARISIR,cIRILLOA,PANELLAM,eta1.Source localizationinreverberantenvironmentsbyconsistentpeak selection[c]//IEEEInternationalConferenceonAcous—tics,SpeechandSignalProcessing.Hawaii:IEEE,2007,1:137-14O.[25]BENESTYJ.Adaptiveeigenvaluedecompositionalgo—rithmforpassiveacousticsourcelocalization[J].JournalofAcousticSocietyofAmeriea,2000,107(1):384—391.[26]MUMOLOE,NOLICHM,MENEGATTIE,eta1.A multi——agentsystemforaudio——videotrackingofawalkingpersonin8structuredenvironment[c]//Proceedingsof WorkshoponMulti——agentRoboticSystemsTrendsandIn—- dustrialApplications.Padova,Italy:MRSTIA,2003:323—326.L27]V ALINjM,MICHAUDF,ROUATJ.Robustlocaliza—tionandtrackingofsimultaneousmovingsoundsources usingbeamformingandparticlefilteringJ-j].Roboticsand AutonomousSystemsJourna1,2007,55(3):216-228.作者简介罗金玉女,1986年出生,湖南人,硕士研究生.主要研究方向包括现场声音信号感知,数字信号处理等.刘建平男,1967年出生,陕西人,教授,博士.一直从事军事通信学,语音信号处理和医学信号处理等领域的研究.张一闻男,1978年出生,内蒙古人,讲师,博士.主要研究方向为阵列信号处理,自适应信道跟踪及多速率通信.(上接第79页)参考文献[1]范红,冯登国,吴亚非.信息安全风险评估方法与应用[M].北京:清华大学出版社,2006.[2]傅鹂,刘嘉伟,周贤林.基于业务的信息资产识别方法[J].通信技术,2007,40(1o):238—240.[3]范建华,薛岩龙.基于层面划分法的信息资产识别方法[J].标准科学,2009(9):64—68.[4],沙超,陈云芳.一种基于TCP/IP协议栈的操作系统识别技术[J].计算机技术与发展,2006,16(10):125127.[5]QUINLANJR.Inductionofdecisiontree[J].MachineLearning,1986(1):81—106.r6]BREIMANL,FRIEDMANJ.H,OLSHENR.A.Classifi—cationandregressiontrees[M].Belmont,CA:Wadsworth InternationalGroup,1984.[7]MEHTAM,AGRAWALR,RISSANENJ.SLIQ:Afastandscalableclassifierfordatamining[M].US:IBMAlmadenResearchCenter,1996.[8]QUINLANROSSJ.C4.5:Programsformachinelearning[M].SanMate,CA:MorganKaufmannPublishers,1993.[9]国君,段立娟,王实,等.数据挖掘原理与算法[M],北京:清华大学出版社,2005.[1o]杨学兵,张俊.决策树算法及其核心技术EJ].计算机技术与发展,2007,17(1):43—45.[11]黄爱辉.决策树C4.5算法的改进及应用[J].科学技术与工程,2009,9(1):34—36.[12]裴昌幸.现代通信系统与网络测量[M].北京:人民邮电出版社,2008.作者简介:杨艳女,1986年出生,陕西西安人,硕士研究生.主要研究方向为信息安全.刘建华男,1963年出生,河北易县人,高级工程师.主要研究方向为信息安全.田东平男,1955年出生,安徽泗县人,博士后,教授.主要研完方向为量子通信.。
数字麦克风及阵列拾音技术的应用
随着数字信号处理技术的发展,使用数字音频技术的电子产品越来越多。
数字音频接口成为发展的潮流,采用脉冲密度调制(PDM)接口的ECM和MEMS数字麦克风也孕育而生。
目前,ECM和MEMS数字麦克风已经成为便携式笔记本电脑拾音设备的主流。
数字ECM或MEMS麦克风和传统的ECM麦克风相比,有着不可取代的优势。
首先,移动设备向小型化数字化发展,急需数字拾音器件和技术;第二,设备包含的功能单元越来越多,如笔记本电脑,集成了蓝牙和WiFi无线功能,麦克风距离这些干扰源很近,设备对抗扰要求越来越高;第三,三网合一的发展,需要上网,视频和语音通信可以同时进行,这在移动设备中通常会遇到环境噪声和回声的影响;
第四,从提高生产效率角度,希望对麦克风采用SMT焊接。
数字麦克风适合SMT 焊接,可以解决系统各种射频干扰对语音通信产生的噪声,富迪科技的数字阵列麦克风拾音技术可以抑制和消除通话时的回声和环境噪声,数字接口方便同数字系统的连接。
模拟麦克风和数字麦克风
麦克风结构:ECM模拟麦克风通常是由振膜,背极板,结型场效应管(JFET)和屏蔽外壳组成。
振膜是涂有金属的薄膜。
背极板由驻极体材料做成,经过高压极化以后带有电荷,两者形成平板电容。
当声音引起振膜振动,使两者距离产生变化,从而引起电压的变化,完成声电转换。
利用结型场效应管用来阻抗变换和放大信号,有些高灵敏度麦克风采用运放来提高麦克风灵敏度(见图1a)。
ECM数字麦克风通常是由振膜,背极板,数字麦克风芯片和屏蔽外壳组成,数字麦克风芯片主要由缓冲级,放大级,低通滤波器,抗模数转换组成。
缓冲级完成阻抗变换,放大级放大信号,低通滤波滤除高频信号,防止模数转换时产生混叠,模数转换将放大的模拟信号转换成脉冲密度调制(PDM)信号,通常采用过采样的1位∆-Σ模数转换(见图1b)。
MEMS模拟麦克风主要由MEMS传感器,充电泵,缓冲放大器,屏蔽外壳组成。
参照图1c, MEMS传感器由半导体工艺制成的振膜,背极板和支架构成,通过充电泵给背极板加上适当的极化偏压。
缓冲放大器完成阻抗变换,放大信号。
MEMS数字麦克风主要由MEMS传感器,充电泵,数字麦克风芯片和屏蔽外壳组成,参照图1d。
为了提高麦克风抗干扰能力,麦克风内部电源和地之间都增加了小的滤波电容,通常是10pF和33pF并联。
图1a ECM模拟麦克风
1b ECM数字麦克风
图1c MEMS模拟麦克风
图1d MEMS数字麦克风
麦克风偏置电路:通过手机中麦克风电路的典型应用,比较一下ECM模拟麦克风,MEMS模拟麦克风和数字麦克风的差异。
图2a为ECM模拟麦克风的偏置电路。
为了减小干扰,手机中的麦克风电路采用差分输出。
麦克风电源经过R5电阻C9电容滤波以后,通过R6供给麦克风内部的场效应管,由R6、R9差分组成差分输出电路。
C15和R6、R9以及麦克风的输出阻抗组成低通滤波器,用来滤除超过语音频段的高频信号,防止后级电路模数装换时产生混叠。
C13、C17隔离直流偏置,R7、R8用来防止电容对芯片输入端的放电冲击。
其余的33pF电容用来滤除射频干扰。
麦克风输出到基带芯片的模拟输入端采用差分布线,减少噪声和射频干扰(见图2b)。
MEMS麦克风的偏置电路。
麦克风电源经过R1电阻C2电容滤波以后,供给MEMS麦克风内置的缓冲放大器和充电泵电路。
MEMS拾取的声音信号转换成模拟电信号,经过缓冲放大后输出,经过C5、R2、C6组成的π型滤波器滤波,伪差分电路布线到基带芯片。
图2c为数字麦克风的偏置电路。
麦克风电源经过简单滤波以后供给麦克风。
声音转换成模拟电信号经过内部缓冲放大,在时钟信号(SCL)的驱动,下最后模数转换成1位的PDM音频数据,从数据引脚(DATA)输出。
图2a ECM模拟麦克风电路
图2b MEMS模拟麦克风电路
图2c ECM/MEMES数字麦克风电路
各种类型麦克风比较:表1归结出ECM模拟麦克风,ECM数字麦克风,MEMS 模拟麦克风和MEMS数字麦克风的性能指标和各自的优缺点。
脉冲密度调制(PDM)信号和数字麦克风接口:
模拟信号转换成PCM信号,根据奈奎斯特准则,通常必须用大于2倍的固定采样频率对模拟信号采样。
模数装换,每个采样点可以用多位比特的数据表示。
比特数越多,采样精度越高,失真越小,但是电路会复杂,成本很高,不适合低成本数字麦克风应用。
如图3b,数字麦克风通常是采用1位δ-Σ模数转换器,对模拟信号进行过采样(只能用于带宽有限的信号,不适合宽频信号,例如视频信号),采样
率由外部时钟提供。
过采样可使量化噪声远离被采样的音频信号。
离信号主频fs越近,噪声幅度越小。
同时对抗混叠滤波器的要求大大降低,可以到达很高的精度。
图3 PDM信号
数字麦克风通常由5个引脚,分别是电源(VDD),地(GND),时钟(CLK),数据(DAT)和通道选择(L/R)。
数字麦克风接口芯片需要提供麦克风电源(需要和系统电平匹配)和外部时钟信号(1.024~3.074MHz),数字麦克风在获取时钟信号后,从省电状态转到正常工作状态。
拾取声音信号过采样转换成脉冲密度调制(PDM)的数据流(信号幅度变化越剧烈,脉冲密度越密)送给处理芯片,芯片内部的抽取滤波器(Decimator)下采样(Down sample)并低通滤波,将高频低位流的信号转换成低频高位流的PCM信号,同时滤除量化噪声。
PDM接口可以挂接两个数字麦克,共享时钟和数据线,通过通道选择(L/R)选择时钟高和低时是哪个通道的麦克风。
图4为数字麦克风的输出信号。
在时钟为高时,L/R=0的麦克风(M IC0)数据线保持高阻状态,传输L/R=1的麦克风(MIC1)的数据;在时钟为低时,L/R=1的麦克风(MIC1)数据线保持高阻状态,传输L/R=0的麦克风(MIC0)的数据。
图4 数字麦克风的输出信号
数字麦克风阵列在手机平台的应用
2个数字麦克风使用同一组电源,电源电压同语音处理芯片FM34-395(见图5)。
数字麦克风阵列通过L/R引脚配置成成主麦克风(L/R接地)和参考麦克风(L/R 接电源),拾取的近端信号经过数字麦克风放大并转换成PDM信号连接到语音处理
芯片FM34-395芯片。
两路麦克风信号经过下采样装换成16位的PCM信号,放大滤波以后进行相关处理。
图5 数字麦克风阵列在MTK手机平台典型应用
手持模式下,根据数字麦克风阵列拾取的近端信号差异,对近端语音做稳态和非稳态噪声抑制和线性回声消除处理,处理完成的信号经过PCM引脚(TxDp)送到基带芯片(PCM IN引脚)作为上行信号,送并产生侧音送到受话器(Receiver)。
下行信号通过基带芯片(PCM OUT引脚)送到FM34-395的输入引脚(RxDc),经过噪声抑制,并根据数字麦克风阵列提供的噪声信息判断是否启动清晰语音引擎来亮化受话器(Receiver)的声音,使用户在噪声环境下依然可以听得清,同时作为回声消除的参考信号。
免提模式下,根据麦克风阵列拾取的回声信号差异,对夹杂声学回声的近端语音进行消除处理,处理完的语音做稳态噪声抑制处理,输出信号经过PCM引脚(TxDp)送到基带芯片(PCM IN引脚)作为上行信号。
下行信号通过基带芯片(PCM OUT引脚)送到FM34-395的输入引脚(RxDc),经过噪声抑制,并根据数字麦克风阵列提供的噪声信息判断是否启动清晰语音引擎来亮化受话器(Receiver)的声音,使用户在噪声环境下依然可以听得清,同时作为回声消除的参考信号。
数字麦克风阵列的摆放:主麦克风摆在手机正面下方或下侧面,就是尽量靠近使用者嘴部,参考麦克风摆在手机背面上方或上侧面,即是靠近使用者的耳朵,这样在手持模式下近端语音数字麦克风阵列的两个麦克风拾取的信号有足够的差别,而较远的噪声没有差别,利用数字语音处理器FM34-395处理,就可以实现定向定距离拾音,抑制各种环境噪声。
数字麦克风阵列在笔记本电脑中的应用
图6为数字麦克风阵列在笔记本电脑的典型应用。
通常数字麦克风阵列和摄像头模组一起,安装在笔记本电脑显示屏上方中央,这样使用者在视频聊天或通话时,声源位于数字麦克风阵列拾音束内,可以传送出去,而两旁的噪声位于拾音束外被抑制,实现清晰语音通信。
阵列中的数字麦克风,可以按10.5mm摆放作为小型数
字麦克风阵列,也可以采用距离70~210mm的宽阵列,根据麦克风摆放配置相应的软件
图6 数字麦克风阵列在笔记本电脑的典型应用
数字麦克风拾取转换成PDM格式的信号通过线缆连接到笔记本电脑的高清音频编解码器(HD Audio Codec)声卡的数字麦克风接口,下采样转换成两路音频信号,送到位于高清音频编解码器驱动层的小型麦克风阵列处理软件(SAMSoft)处理,实现噪声抑制(Noise Suppression),回声消除(Acoustic Echo
Can cellation),远距离拾音(Far Field Pick Up)敲击键盘噪声抑制等功能。