回音消除技术
- 格式:doc
- 大小:189.50 KB
- 文档页数:8
声场分区技术
声场分区技术是指通过合理的声学设计,将音频输出区域划分为不同的分区,以达到更好的音频分布效果。
声场分区技术主要包括以下几个方面:
1. 声音定位:通过调整扬声器和音频设备的位置,使得声音可以准确地定位,并将不同声音源的声音分配到适当的位置。
2. 声音扩散:为了使得声音能够覆盖更广的区域,可以采用声音扩散技术,例如使用多个扬声器进行声音扩散,或使用特殊的声学材料和设备实现声音的扩散效果。
3. 声音均衡:通过调整不同分区的音量和音频参数,使得不同分区的声音均衡,避免某些区域声音过强或过弱。
4. 声场优化:通过使用数字信号处理技术和声音回音消除技术,优化声音的传输和分布效果,提高声场的音质和音效效果。
声场分区技术广泛应用于大型音频场馆、演播厅、剧院、电影院等场所,以提供更好的音频体验。
耳机产品中的声学回声问题与处理方法声学回声是指声音在空间中反射多次形成回声,影响声音的清晰度和可听性。
在耳机产品中,声学回声问题是一个常见的挑战,因为耳机戴在耳朵上,声音的直接传输路径会受到周围环境的干扰,导致回声的产生。
本文将探讨耳机产品中的声学回声问题,并介绍一些处理方法。
1. 声学回声问题的原因声学回声问题主要有以下几个原因:1.1. 耳机与耳朵之间的空隙:耳机没有完全贴合耳朵表面,存在微小的空隙,导致声音在耳朵和耳机之间来回反射,产生回声。
1.2. 耳机外壳材质:耳机外壳材质可能会导致声音的回音和反射,增加回声的产生。
1.3. 周围环境音:外界环境的噪音,如风声、人声等,也会通过耳机进入耳朵,与耳机中的声音产生干扰。
2. 处理方法为了解决耳机产品中的声学回声问题,可以采取以下方法:2.1. 合理设计耳机形状:优化耳机的设计,确保耳机与耳朵之间的贴合度,减少空隙,减少回声的产生。
可以通过使用更柔软的材质或者采用可调节的耳机形状来实现。
2.2. 降低外壳材质的回音效应:选择适当的外壳材质,减少回音效应,降低回声的干扰。
一些耳机制造商会采用吸音材料来减少声音的反射。
2.3. 降噪技术的应用:采用主动降噪技术,通过内置的麦克风和信号处理器,检测并抵消外界环境的噪音,从而减少外界噪音对耳机声音的干扰,提升听音体验。
2.4. 耳机隔音设计:耳机制造商可以设计隔音结构,减少外界环境声音的进入,降低回音问题。
2.5. 使用数字信号处理技术:通过数字信号处理,对声音进行滤波和均衡处理,优化声音质量,减少回声的存在。
3. 应对声学回声问题的挑战尽管存在多种处理方法,但仍面临一些挑战:3.1. 影响设计和舒适度:某些处理方法可能会影响耳机的设计和佩戴舒适度。
在处理声学回声问题时,需要权衡设计和使用的平衡。
3.2. 处理成本:应对声学回声问题需要耳机制造商投入更多的技术和成本,这可能会增加耳机的价格,影响市场竞争力。
减少噪声的方法有哪些
减少噪声的方法有以下几种:
1. 声音隔离:通过建造隔音墙、使用隔音窗、安装隔音门等方法来减少来自外界的噪声。
2. 声音吸收:使用吸音材料或设备,如吸音墙板、吸音隔板、吸音地毯等来吸收并减少声音反射,达到减少噪声的效果。
3. 声音消除:使用主动降噪技术,例如使用降噪耳机、降噪麦克风等设备,利用反向声波来消除环境噪声。
4. 声音控制:通过合理的规划和布置,减少室内声音的传播和回音效应。
例如使用隔音材料对墙壁、天花板等进行覆盖,安装地毯等。
5. 声音屏蔽:使用噪音屏蔽器,如噪音屏蔽耳塞、噪音屏蔽耳机等,通过发出其他声音来掩盖环境的噪音。
6. 声音限制:通过合理控制音量和使用限制噪音源的时间和地点,例如在公共场所设立噪音限制规定,限制咨询的时间和噪音源的位置。
7. 防护设备:个人可以佩戴耳塞或耳罩来减少环境噪声对耳膜的刺激,有效保
护听力。
8. 生活和环境调整:尽量选择安静的居住和工作环境,避免噪音源的接近,如选择远离交通繁忙的地点居住,远离工业区等。
9. 环境管理:管理者可以采取措施,如加强设备的维护,减少机器和设备的噪音产生,推广低噪音技术和设备等。
需要根据具体情况选择合适的方法进行噪音控制和减少。
礼堂消音处理方案礼堂是一种多功能场地,可以举行各种活动,如音乐会、演讲、会议等。
但是礼堂在使用过程中,由于有孔洞、硬面、大面积的墙壁,会因其特殊的声学性质而带来回音、共鸣、噪声等问题。
这些问题严重影响了听众的听感和主讲人的讲话效果,因此需要采取消音处理的策略来解决。
消音处理的原理消音处理是指通过一系列的技术手段,将声音能量分散、吸收、反射来达到消音效果的一种方法。
在礼堂中,主要采用以下消音处理方式:吸声处理吸声处理是通过某些材料的表面形成多个微小反射面,使声波主动与被动碰撞,进而被吸收和消散。
常用的吸声材料有聚酯纤维棉、泡沫塑料、玻璃纤维等。
在礼堂中,可以采用吸声材料进行吸声处理,如在墙面、天花板等部位上附加吸声板、吸声毡等材料来实现声音的吸收和消散。
隔声处理是采用各种材料来阻止声音传播的一种处理方式,通常采用隔声墙体、隔板、隔音窗等隔音材料,既可以阻隔音量,又可以减少声能穿透过去。
在礼堂中,采用隔音玻璃、隔音墙等材料进行隔声处理可以有效减少外界噪音和共鸣。
降噪处理降噪处理是通过消除礼堂环境中的噪声源,在一定范围内减少噪音的存在。
常用的降噪处理方法有主动降噪和被动降噪。
主动降噪通过检测礼堂内噪声状态,发现存在噪声源并反向生成消噪音波的方式使噪声消失。
被动降噪则是通过对噪声进行掩蔽、吸收和反射等方式实现降噪效果。
礼堂消音方案的实现礼堂消音的方案实现主要有以下技术手段:声学测量声学测量是进行消音前准备工作,是实现消音方案的前提。
根据实际礼堂大小、声源位置、周围环境等因素出发,选择适当的吸声材料和隔音材料。
在吸声处理方面,可以采用吸声板、隔音毡、吸声天花板等方式进行处理。
吸声板可安装空中挂板,安装方便,避免对墙壁带来较大的损坏。
隔声处理为了避免堂内噪声外传,可以采用隔音玻璃等材料进行处理。
隔音玻璃不仅可以隔音,还可以美观实用,为礼堂环境提供更多保障。
隔音墙也是隔声处理的一种方式,通过墙体与声波之间的物理障碍来实现隔音效果。
产品介绍POLY CCX 700在话机进行视频, 让一切大不相同。
您可以看到他人的反应, 这是您始终无法通过耳听得来的效果。
Poly CCX 700 采用 7 英寸屏幕, 特别适合经理和高管, 以及任何在工作方面需要游刃有余的人。
Poly HD Voice 高清语音和 Poly Acoustic Clarity 技术能够提供卓越的音频质量。
Poly Acoustic Fence 拾音魔墙技术可消除干扰性背景噪音。
全双工扬声电话操作、 世界一流的回音消除技术和 NoiseBlockAI 人工智能噪声屏蔽技术, 保持通话畅通无阻。
界面简单且直观, 使用户可立即开始工作。
同时, 设计采用功能强大的最新芯片组, 使电话能够快速响应。
应用专用按钮, 通过在彩色 LCD 显示屏上显示联系人及会议, 可提高工作效率。
强大的配置和管理功能可实现高效电话部署和支持。
而且, 可轻松在任何地方进行安装 — 包括 WiFi 功能。
现在,让我们了解下搭配选项。
您可以选择带听筒或不带听筒。
Poly CCX 700 高效工作从这里开始。
• 直接通过集成了 400 万像素摄像头(提供隐私保护)的电话发起视频通话。
• 配有 7 英寸多点触控 LCD 显示屏, 可进行彩色触摸屏操作。
• P oly HD Voice 高清语音和 Poly Acoustic Clarity 技术让您能够听清每一个细节。
• 使用 Poly Acoustic Fence 拾音魔墙技术消除干扰性背景噪音。
• 具备世界一流的回音消除技术和 Poly NoiseBlockAI 人工智能噪声屏蔽技术, 可实现全双工扬声电话操作。
• 强大的芯片组能够支持新一代功能。
• 集成 Wi-Fi 可在任何位置轻松安装。
• 提供多种耳机选项, 可以适应任何工作方式(蓝牙®、 USB 、 RJ9)。
简洁、 直观 内置视频功能产品特性• 视频通话提供自动对焦和自动曝光功能,完美呈现您的画面, 还可以根据需要使用隐私保护。
电路中的滤波与去噪技术在电子设备和通信系统中,滤波与去噪技术是至关重要的。
它们帮助我们提高信号质量,减少噪音干扰,使得我们能够获得更清晰、更可靠的信号。
一、滤波技术滤波技术是通过电路来选择特定频率范围内的信号,并将其他频率范围的信号抑制掉。
滤波器是实现滤波的重要元件。
常见的滤波器有低通滤波器、高通滤波器、带通滤波器和带阻滤波器。
1. 低通滤波器低通滤波器是指只允许低于某一特定频率的信号通过,而抑制高于该频率的信号。
低通滤波器常用于音频设备中,将高频噪音滤除,使得音乐更加纯净。
2. 高通滤波器高通滤波器是指只允许高于某一特定频率的信号通过,而抑制低于该频率的信号。
高通滤波器常用于通信设备中,滤除低频背景噪音,保留高频信号的传输。
3. 带通滤波器带通滤波器是指只允许某一特定频率范围内的信号通过,而抑制其他频率范围内的信号。
带通滤波器常用于无线电调谐电路中,只接收特定频率范围的广播信号。
4. 带阻滤波器带阻滤波器是指只允许某一特定频率范围外的信号通过,而抑制该频率范围内的信号。
常见的例子是使用在语音通信中的降噪设备,阻挡背景噪音以提升通话质量。
二、去噪技术去噪技术是指通过各种信号处理方法来消除噪音干扰,提取出原始信号。
在电信号处理、音频处理等领域,去噪技术起到了重要的作用。
1. 降低噪音通过对信号进行滤波、降采样等处理,可以减少噪音的影响。
例如,使用数字信号处理技术,可以通过选择合适的滤波器将噪音滤除。
2. 去除回音在通话中常常会出现回音干扰,使得通话质量下降。
去除回音的技术可以通过使用降噪算法来实现。
这些算法通过分析音频信号的特征,识别出回音信号并将其从原始信号中消除。
3. 语音增强语音增强技术可以提高语音信号的可听性。
通过分析信号的频谱特征,可以对语音信号进行增益调整,使得语音更加清晰、减少噪音干扰。
4. 图像去噪除了音频信号的去噪,图像信号的去噪也是很重要的。
在图像处理中,去噪技术能够提高图像细节的清晰度,减少图像中的噪点和伪影。
电脑音频技术了解音频编码与声音处理音频编码是将声音信号转换为数字形式的过程,以便在计算机系统中存储、传输和处理。
声音处理则是对音频信号进行增强、去噪等处理的技术。
本文将介绍电脑音频技术中的音频编码和声音处理两个方面的基本知识。
一、音频编码音频编码是将模拟声音信号转换为数字形式的过程。
它的主要目的是压缩音频数据,以节省存储空间和传输带宽。
以下是几种常见的音频编码格式:1. PCM(Pulse Code Modulation,脉冲编码调制)PCM是一种最基本的音频编码格式。
它将声音信号分为不同的采样点,并用数字表示每个采样点的幅度。
PCM编码无损,但数据量较大。
2. ADPCM(Adaptive Differential Pulse Code Modulation,自适应差分脉冲编码调制)ADPCM是一种有损压缩的音频编码格式。
它通过根据连续采样点之间的差异来减少数据量。
尽管有些质量损失,但相对于PCM,它可以显著减小数据量。
3. MP3(MPEG Audio Layer-3)MP3是一种流行的音频编码格式,广泛应用于音乐压缩和传输领域。
MP3利用了人耳听觉特性,通过去除音频信号中的听觉冗余来实现高压缩率。
尽管MP3是有损压缩格式,但其音质在适当的比特率下仍能保持较高的品质。
4. AAC(Advanced Audio Coding,高级音频编码)AAC是一种用于音频压缩的格式,常用于数字音乐、互联网广播和移动通信等领域。
与MP3相比,AAC在相同比特率下提供更好的音质。
它还支持多通道编码和低延迟编码,适应了不同的应用需求。
二、声音处理声音处理是对音频信号进行一系列算法和技术加工,以实现去噪、降低噪音、声音增强等效果的过程。
以下是几种常用的声音处理技术:1. 噪音抑制噪音是影响音频质量的一个重要因素,因此,在音频处理中噪音抑制是一个关键技术。
常见的噪音抑制算法有谱减法、子带迭代抑制、计算感知阈值等。
2. 回声消除在通话或录音中,由于话筒和扬声器的采样和放音,通常会产生回声。
erl回声回波损耗Erl回声回波损耗回声回波损耗(Echo Return Loss,简称ERL)是用于衡量回声抑制性能的一个重要指标,它描述了信号在传输过程中由于回声引起的能量损失程度。
在通信系统中,回声是由于传输信号经过传输介质中的非线性元件或者信号的反射引起的。
回声回波损耗的大小直接影响着通信系统的质量和稳定性。
在传统的电话通信中,回声是一个常见的问题。
当通话者说话时,声音会通过电话线路传输到对方的电话,但由于一些原因(如线路长度、线路质量等),部分声音会反射回来,形成回声。
这会导致对方听到自己的声音延迟和混响,影响通话质量。
为了解决这个问题,人们研究出了回音抵消技术,其中回声回波损耗是衡量抵消效果的重要指标。
回声回波损耗的计算公式是:ERL = 10 * log10(发送信号功率/回声信号功率)。
其中,发送信号功率是指发送者发出的声音信号的功率,回声信号功率是指回声信号的功率。
回声回波损耗的单位是分贝(dB),数值越大表示回声抑制效果越好。
回声回波损耗的提高可以通过多种方式实现。
首先,可以通过改进传输介质的质量来减少回声的产生。
例如,在电话通信中,使用优质的电话线路或者光纤线路可以显著降低回声的发生率。
其次,可以通过增加信号的抑制能力来降低回声的影响。
这可以通过增加回声抵消器的性能来实现。
回声抵消器是一种专门用于抵消回声的设备,它能够检测回声信号并将其与原始信号进行比较,然后生成一个反相信号以抵消回声。
最后,回声回波损耗的提高还可以通过优化通信系统的设计来实现。
例如,在网络通信中,可以使用更高级的协议和算法来减少回声的发生。
除了电话通信外,回声回波损耗也在其他领域有着广泛的应用。
在音频处理中,回声抵消技术可以用于消除音频中的回声,提高音质。
在声纳系统中,回声回波损耗可以用于评估声纳传感器的抗回声性能。
在无线通信中,回声抵消技术可以用于提高无线信号的传输质量。
回声回波损耗是衡量回声抵消效果的重要指标,它能够反映出通信系统在抑制回声方面的性能。
网络语音通话运用了哪些技术?当我们使用像Skype、QQ这样的工具和朋友流畅地进行语音视频聊天时,我们可曾想过其背后有哪些强大的技术在支撑?本文将对网络语音通话所使用到的技术做一些简单的介绍,算是管中窥豹吧。
一、概念模型网络语音通话通常是双向的,就模型层面来说,这个双向是对称的。
为了简单起见,我们讨论一个方向的通道就可以了。
一方说话,另一方则听到声音。
看似简单而迅捷,但是其背后的流程却是相当复杂的。
我们将其经过的各个主要环节简化成下图所示的概念模型:这是一个最基础的模型,由五个重要的环节构成:采集、编码、传送、解码、播放。
1. 语音采集语音采集指的是从麦克风采集音频数据,即声音样本转换成数字信号。
其涉及到几个重要的参数:采样频率、采样位数、声道数。
简单的来说:采样频率,就是在1秒内进行采集动作的次数;采样位数,就是每次采集动作得到的数据长度。
而一个音频帧的大小就等于:(采样频率×采样位数×声道数×时间)/8。
通常一个采样帧的时长为10ms,即每10ms的数据构成一个音频帧。
假设:采样率16k、采样位数16bit、声道数1,那么一个10ms的音频帧的大小为:(16000*16*1*0.01)/8 = 320 字节。
计算式中的0.01为秒,即10ms。
附:可以参考了解语音视频采集组件MCapture相关介绍及 Demo源码与SDK下载。
2. 编码假设我们将采集到的音频帧不经过编码,而直接发送,那么我们可以计算其所需要的带宽要求,仍以上例:320*100 =32KBytes/s,如果换算为bits/s,则为256kb/s。
这是个很大的带宽占用。
而通过网络流量监控工具,我们可以发现采用类似QQ等IM软件进行语音通话时,流量为3-5KB/s,这比原始流量小了一个数量级。
而这主要得益于音频编码技术。
数字信号处理技术在车载音频系统中的应用
随着汽车市场的不断扩大和消费者对音频效果的要求日益提高,车载音响系统变得越来越重要。
数字信号处理技术(DSP)已经成为了车载音频系统中必不可少的一部分,可以大大提升音质和用户体验。
数字信号处理技术基础
数字信号处理技术是将连续信号转换为数字信号,并对数字信号进行处理算法的一种技术。
其中,模拟信号采样、定标、量化和编码为数字信号,再经过数字信号处理算法作用后输出结果。
1. 优化车载音箱的效果
数字信号处理技术可以对音箱进行动态均衡和虚拟环绕等处理,优化音箱的声音效果。
这些处理算法可以自动调整不同频段的音量、相位和延迟,使声音更加清晰、平衡和有力度。
2. 降噪和消除回音
车辆行驶过程中产生的噪音和回音对音质和用户体验产生了负面影响。
数字信号处理技术可以过滤杂音和回音,从而提高用户听音效果。
3. 实现多声道处理
数字信号处理技术可以实现多声道音响系统的处理。
通过音频解码器、数字信号处理器和多个功率放大器,可以实现多声道音频信号的处理和分配,达到虚拟环绕的效果。
4. 蓝牙车载音箱
数字信号处理技术也在蓝牙车载音箱中得到了广泛应用,通过数字信号处理芯片将蓝牙音频信号进行处理,提升音质和用户体验。
结语
随着科技的发展,数字信号处理技术在车载音频系统中得到了大量应用,不仅
提高了音质,而且提高了用户的听音体验。
数字信号处理技术的优化仍在不断发展,为车载音频系统的未来发展提供了更多的空间。
声卡上的消音是什么原理声卡上的消音是一种技术,旨在消除或减弱噪音、杂音和干扰音,从而提高音频质量和清晰度。
声卡上的消音原理包括以下几个方面:滤波、降噪和信噪比改善。
首先,滤波是声卡上实现消音的一个重要技术。
滤波通过设置滤波器来选择性地过滤特定频率范围的信号。
常见的滤波器包括高通滤波器、低通滤波器、带通滤波器和带阻滤波器等。
高通滤波器可以通过去除低频噪音和杂音来改善音频的质量。
低通滤波器可以消除高频噪音和杂音,使音频更加清晰。
带通滤波器和带阻滤波器则可以在某个特定的频率范围内增强或减弱信号。
其次,降噪是消音的另一个核心原理。
降噪是通过检测和抑制噪音信号来减少噪音的影响。
降噪技术通常分为主动降噪和无源降噪两种方式。
主动降噪通过使用一个麦克风和一个反相噪音发生器来检测噪音,并实时产生一个与噪音相位相反的噪音信号,以消除或减弱噪音。
无源降噪则主要依靠算法和数字信号处理。
这种方式下,声卡通过分析音频信号,并根据噪音的特征,实时生成与噪音相反的波形信号来抵消噪音。
最后,声卡上的消音还可以通过改善信噪比来提高音频质量。
信噪比是指音频信号与噪音信号之间的比例关系。
当噪音信号较大时,信噪比较低,可能导致音频信号的失真和干扰。
声卡上的消音技术可以通过减少噪音信号的影响来改善信噪比。
一种常见的方法是使用功率谱估计技术来识别和衰减噪音。
这种技术可以测量音频信号的功率谱密度,并过滤掉低于某个阈值的噪音信号。
除了上述的原理外,声卡上的消音还可以使用其他一些技术来提高音频质量。
例如,声卡可以使用声学回音消除技术来消除由音频设备和扬声器引起的回音。
此外,声卡还可以使用声音平衡技术来调整不同频率范围内的音量,以达到更好的音频效果。
还有一些附加的技术,如动态范围压缩和立体声增强,也可以应用于声卡上的消音,以提高音频的清晰度和逼真度。
总结起来,声卡上的消音是通过滤波、降噪和信噪比改善等原理来提高音频质量和清晰度的一种技术。
这些原理可以单独或同时应用于声卡上,使得用户可以获得更好的音频体验。
回音消除技术在过去三十年中,回音消除(Echo cancellation)已演变发展出属于它自己的专业领域。
一般人将它视为是一个难以理解的技术领域,想要了解它并取得可接受的实务性成果,往往必须具备深厚的理论基础和特殊的专业知识才能做到。
回音消除最早被用于长距离语音通道的传输中,但对于回音消除的需求已延伸到透过封包或无线网路传输的每一条语音通道中,其应用包括VoIP(Voice over IP)、Voice over DSL或第三代行动网路(3G)等等。
由于有愈来愈多的语音是透过封包网路来传送,而封包式语音的本质上即存在着延迟的议题,因此迴音消除就成了主要的设计考量之一,也是在语音解决方案的整体成本中相当重要的一部分。
显然地,回音消除的成本将成为电信设备中的一部分,而这部分的成本与元件的尺寸及功耗息息相关。
成本固然重要,但更重要的考量还是品质的达成。
对于行动网路用户来说,语音品质一直是他们最关切的议题;对电信业者来说,语音也仍是他们最能获利的服务项目,因此语音的品质是不容妥协的。
传统的回音消除技术是从七十年代的早期作法发展而来,这类技术的采用相当昂贵。
为了满足今日与未来的网路需求,回音消除技术的挑战正在于如何有效地降低成本并持续改善语音品质。
经过三十年的发展,回音消除技术的效益确实有所提升,但在演算法的建置上,基本上并没有太大的改变。
透过今日高密度晶片所发展出的新技术,除了能揭露回音消除技术的神祕性外,还能够大幅地降低成本,并且以可量测的方式来提升解决方案的品质与效能。
自适应滤波器在所有回音消除器的核心部分是自适应滤波器(Adaptive Filter, AF)。
自适应滤波器会建立起回音路径的数学表示法或脉冲响应(impulse response)。
这个表示法一旦被建立后,它会被储存在一般所知的H暂存器(H register)中。
当自适应滤波器使用H暂存器来处理某个信号(Rin)时,输出值是一个近似于预期中Rin迴音的新信号值。
此一新信号可以从传回的信号(Sin)中被减去,以移除或消除回音现象。
图一回音消除器运作架构由于自适应滤波器只能估算回音的近似值,因此它并不能将回音完全消除,也就是说,仍然有些残余的迴音留在信号当中。
在任何时刻中,H暂存器中的准确性正是决定残余回音音量的关键所在。
如果残余的回音量大到听得见的音量,这时就得靠非线性处理器(no n linear processor, NLP)来加以移除,NLP是每个迴音消除器组成架构中的一部分。
自适应滤波器的范围很广,可以有各种的解决方案。
所有的自适应滤波器解决方案都有相同的目标,也就是找到一套最佳化的数学模型,让此模型和系统实际响应之间的误差能达到最小──这个过程被称为收敛(convergence)。
自适应滤波器演算法在技术作法上的竞争发展,可以上溯到19世纪早期,当时高斯(Carl Friedrich Gauss)和拉普拉斯(Pierre -Simon Laplace)两位数学大师分别对此问题提出了不同的解决途径,也引起了极大的争议。
高斯的最小平方(Least Squares, LS)法将误差的平方做了最小化处理;拉普拉斯的解决方法则是对实际的误差进行最小化处理。
针对特定的应用以及当时可行的技术,基于这两项途径又衍生出许多的解决方案,它们都试着要改善将模型与实际响应之间的误差达到最小的能力。
不过,多数人都同意最小平方法较适用于在回音消除环境的系统中。
基于建置 LS 的成本考量,多数的回音消除器采用最小均方(Least Means Squares)法来实现 LS 解决方案。
语音的回音消除设备对自适应滤波器演算法有两个主要的要求:快速性(sprint)和持久性(marathon)。
快速性的要求是在通话一开始时即能快速的收敛,但回音路径改变时,也能快速地重新收敛。
由于在一开始时还不知道回音路为何,初始收敛必须要能很快的完成。
在快速的收敛后,还需要有一个自适应滤波器演算法来继续改善收敛状况,此演算法不管回音中所夹杂的任何回传噪音。
这种持久性在整段通话中都会持续进行,包括不说话和同时说话(double talk)的含混语音状况。
在整个过程中,回音路径的收敛是不能中断的。
简单地说,自适应滤波器的设计具有两个互相矛盾的特性,也就是快速收敛和高度的稳定性,如何同时实现这两项特性,正是设计上的主要挑战。
线上滤波器 vs. 离线滤波器最简化的自适应滤波器型式会持续地对输入信号进行处理。
自适应滤波器会根据每个新的采样数据来更新H暂存器。
这个新的采样数据会被分配到一个权重(weight),此权重会决定它与H暂存器中既存的数据何者较为重要。
此权重通常被称为自适应增益(adapt ation gain)、步长大小(step size)或遗忘因子(forgetting factor)。
在通话一开始时或回音路径改变后,此增益值应该会较大,其目的是要让H暂存器快速地逼近当下的回音路径。
当double talk时,必须分配一个很小的自适应增益值(有时此增益是 0)给新采样数据,其目的是要避免原本有效的H暂存器遭到不良的影响。
在所有其他的状况中,一个低的增益值是用来让收敛速度放慢,而以较大量的取样数据来进行平均,此举能在H暂存器中产生更逼近的迴音路径。
有一套用来决定自适应增益的逻辑,它控制了自适应滤波器的稳定性和响应特性,此逻辑正是一个自适应滤波器中最重要的技巧所在。
在上述演算法中的最大问题之一,就是如何区分出近端通话(包括double talk和背景噪音)和回音路径改变。
如果近端通话被误认为回音路径改变,新采样数据就会因获得较大的自适应增益值,进而对原先收敛地很好的H暂存器造成破坏。
不过,如果一个迴音路径的改变被误认为是近端通话,新取样数据所得到的低增益将让H暂存器无法在合理的时间内估算出新脉冲响应的真实特性。
为了解决这个问题,回音消除器演算法可以在完整地保有当前线上H暂存器的条件下,同时采用第二个自适应滤波器(称为离线滤波器)。
此一离线滤波器会尝试对最新的取样数据进行收敛,以建置另一快速收敛的离线H暂存器。
当这个离线H暂存器对迴音路径的匹配度达到比线上滤波器建置的H暂存器更佳的状态时,它就会取代原先的H暂存器。
为线上应用选择正确的H暂存器,正是建立快速且稳定的离线滤波系统的关键所在。
比较这两个H暂存器的选择过程,通常称为离线滤波器选择(offline filter selection)。
此演算法採用一个H误差暂存器来建立每个滤波器的收敛特性,进而能进行正确的比较。
要实现稳定、不受double talk干扰和快速收敛的自适应滤波器特性,此一误差的计量与标准统计方法的整合正是其中的关键。
简化回音消除器范例我们将使用一个简化的回音消除范例来清楚地说明离线滤波器选择的决定过程。
此一回音消除器包含一个延迟为 0 的单阶(single tap)H暂存器,这表示此一回音消除器只能量测衰减,但不能检查延迟。
每隔1024个取样(128ms),此设备会针对这些取样计算出一个离线暂存器。
当这些取样数据被用来计算出离线H暂存器后,它可能会取代线上暂存器(如果确信它是更佳的回音路径模型),也可能被捨弃。
此一回音消除器会使用最小平方演算法,来计算它的H暂存器,如下图所示:图二的范例显示一个延续了3072个取样的测试通话。
为了满足此范例的目的,此一回音路径是一个起始样本为2048个、幅度为0.5的单阶脉冲(impulse)。
后1024个取样包含一个不同的回音路径,它的幅度是0.2,也就是说,在第2048个取样时会出现回音路径的一次改变。
图二回音消除测试范例从图二可以很容易地看出,在第一个收敛时段(P0)中,其H暂存器中包含的误差应该是最小的,因为在Sin信号中存在最少的噪音量。
由于相似的理由,在中间收敛时段(P1)中,其H暂存器包含的误差应该是最大的,因为它存在最大的噪音量。
最后一个时段(P 2)的误差应该是介于两者之间。
显然地,一个好的自适应滤波器应该选择由时段P0所产生的H暂存器,只要它完成了(在第1024个取样后)就立即用于线上处理;由P1时段产生的H暂存器则应该被捨弃,因为在P1时段中因噪音而形成很大的误差;最后,由P 2时段产生的H暂存器,其幅度与自P0时段后即被採用的线上H暂存器有很大的差异,因此它应该取代线上H暂存器以反应出迴音路径的改变。
此一操作的细节将在下文中更具体的说明。
找出回音估算中的误差出妥协。
在此一离线滤波演算法中必须针对稳定性做出妥协,这是在设计上必需知道的重要概念。
在上述的回音消除范例中,每经过1024次取样会做一次决定(也就是每次会有一个新的H暂存器可用)。
如果决策过程採用 4σ(四倍标准偏差)误差因子,平均每15800个决策中将有一个是错误的(即0.0063%的错误率)。
若使用8KHz的取样率,那每33分钟的操作中平均会出现一次错误的决策。
如果改采 6σ误差因子,每二年的操作才会出现一次错误的决策。
选择正确的过滤器现在可以将这些资讯用于离线滤波器的选择过程。
每取样1024次,就能计算出一个新的H暂存器值。
采用下列的步骤来与线上H暂存器数值进行比较,就能确定回音路径是否有改变。
首先会进行一项一致性的测试,也就是计算出两个H暂存器之间的差异。
如果两个暂存器之间的差异值大到无法解释它们的误差状况,新的H暂存器会自动成为新的线上H暂存器,并将基于旧迴音路模式所收集到的所有资讯都删除掉。
这是一次回音路径的改变。
如果两个H暂存器的比较结果是一致的(它们通过先前的测试),具有最小误差的H暂存器会被保留来做为新的线上暂存器。
在P0时段之后,一个新的H暂存器被计算出,为了确定将它放在线上使用是否安全,它所代表的必须是非零的回音路径。
换句话说,此一H暂存器的数值必须大于H误差暂存器与误差因子的乘积,此一回音路径才是有意义的。
在我们的范例中使用 4σ误差因子,结果能满足上述的条件[ 0.54 > (0.02 X 4) ],因此这个新的H暂存器可以被在线上使用。
进行此一验证是很重要的,因为在经过一段double talk时段所计算出来的H暂存器,通常会包含很大的误差,此误差会放大返回的回音,採用此H暂存器的结果比什么都不做来得更糟。
在收敛时段P1之后,新的H暂存器会与线上H暂存器互相比较,以确定它们之间的一致性。
线上暂存器和离线暂存器之间的差异必须大于两者的误差,才可做出回音路径发生改变的判断。
在此范例中採用 4σ误差,可以发现并不能满足阈值条件[(0.54 – 0.4) > ((0.02 + 0.13) X 4)],因此,这两个H暂存器是一致。
第二个测试是要检查那一个H暂存器具有最小的H误差暂存器,一般来说,这表示此一H暂存器是迴音路径的最佳模型。