语音信号采集与回放
- 格式:doc
- 大小:936.50 KB
- 文档页数:19
音频信号采集回放系统设计与算法优化一、概述音频信号采集回放系统是一种应用广泛的系统,可以用于音乐制作、录音棚、会议室等领域。
本文就音频信号采集回放系统的设计和算法优化进行详细探讨。
二、音频信号采集系统设计音频信号的采集可以通过麦克风、话筒等方式实现。
在设计音频信号采集系统时,需要考虑以下几个方面。
1. 麦克风选择麦克风种类繁多,选择适合自己的麦克风至关重要。
一般可以分为指向性麦克风、全向麦克风、卡夫麦克风等几类。
根据不同的采集环境和需求,选择不同类型的麦克风。
2. 音频接口选择常见的音频接口有USB、Firewire、Thunderbolt等。
需要选择适合的音频接口,并保证音频接口与麦克风的相互兼容性。
3. 驱动程序选择音频设备需要安装相应的驱动程序,以实现采集功能。
驱动程序的稳定性和兼容性非常重要。
4. 采样率和位数选择采样率和位数是影响音频质量的两个重要参数。
在选择时需要根据采集的需求和环境选择。
5. 采集软件选择音频信号采集软件有很多种,需要选择稳定、易用、功能强大的软件,以满足不同的采集需求。
三、音频信号回放系统设计音频信号的回放可以通过扬声器、耳机等方式实现。
在设计音频信号回放系统时,需要考虑以下几个方面。
1. 扬声器选择扬声器种类繁多,选择适合自己的扬声器至关重要。
一般可以分为立体声扬声器和环绕声扬声器等几类。
根据不同的回放环境和需求,选择不同类型的扬声器。
2. 音频接口选择常见的音频接口有USB、Firewire、Thunderbolt等。
需要选择适合的音频接口,并保证音频接口与扬声器的相互兼容性。
3. 驱动程序选择音频设备需要安装相应的驱动程序,以实现回放功能。
驱动程序的稳定性和兼容性非常重要。
4. 回放软件选择音频信号回放软件有很多种,需要选择稳定、易用、功能强大的软件,以满足不同的回放需求。
4. 环境控制音频信号的回放环境也非常重要。
需要保证回放环境安静、不受干扰,以确保音频信号的质量。
语音采集与回放系统设计l 竞赛真题 l 总体方案选择 l 具体方案设计 l 设计阶段划分一、竞赛真题1999 年第四届 E 题 数字化语音存储与回放系统 一、题目:数字化语音存储与回放系统 二、任务 设计并制作一个数字化语音存储与回放系统,其示意图如下:三、要求 1.基本要求 (1)放大器 1 的增益为 46dB,放大器 2 的增益为 40dB,增益均可调; (2)带通滤波器:通带为 300Hz~3.4kHz ; (3)ADC:采样频率 fs= 8kHz,字长= 8 位; (4)语音存储时间≥10 秒; (5)DAC:变换频率 fc= 8kHz,字长= 8 位; (6)回放语音质量良好。
2.发挥部分 在保证语音质量的前提下: (1)减少系统噪声电平,增加自动音量控制功能; (2)语音存储时间增加至 20 秒以上; (3)提高存储器的利用率(在原有存储容量不变的前提下,提高语音存储时间) ;(4)其它(例如: 四、评分意见校正等) 。
项目满 分 50 50 15 5 15 15基 设计与总结报告: 方案设计与论证, 理论分析与计算, 电路图, 本 测试方法与数据,对测试结果的分析 要 实际制作完成情况 求 完成第一项 发 挥 完成第二项 部 完成第三项 分 完成第四项 五、说明 不能使用单片语音专用芯片实现本系统。
训练侧重点 l 题目中给出一些提示性设计参数,设计中应予以重点理解1. 放大器 1 的增益,放大器 1 的增益为 46dB 2. 带通滤波器的频率范围通带为 300Hz~3.4kHz(方便测试) 3. AD 采样的字长和采样频率(保证公平竞争)l题目中部分非技术性指标在培训中可以适当简化1. 语音存储与回放时间≥10 秒 2. 语音存储时间增加至 20 秒以上;二、总体方案选择1. 控制平台选择 2. 前级放大模块 3. 带通滤波器 4. 模数、数模转换部分 5. 存储器 6. 编码方案1. 控制平台选择供选平台: A. B. 单片机平台 FPGA 开发平台选择依据:速度、存储器、接口 速度要求: A. B. C. D. 8K 采样速率 8K 回访速率 显示刷新速率 按键响应时间要求在 125us 的时间内完成 AD 转换控制或者是 DA 转换控制,数据的压缩或者 是解压,显示刷新,按键响应。
语音采集与回放系统摘要:本系统基本实现了语音信号的采集与回放。
其主要结构由语音前级处理通道、MSP430F449单片机控制兼数据处理模块、D/A转换模块、键盘模块和后级处理通道组成,实现了语音的采集与回放功能。
关键词:MSP430F449 D/A LM386目录一、方案设计与选择 (3)(一)语音采集 (3)1.信号放大 (3)2.前级滤波 (3)3.数据采入 (3)4.数据压缩编码方式 (3)(二)语音回放 (3)1.输出已压缩语音 (3)2.后级滤波 (4)3.音频功放 (4)二、系统各模块具体设计 (4)(一)整体框图 (4)(二)各模块具体分析 (4)1.前级通道 (4)(1)麦克风电路 (4)(2)射极跟随器 (5)(3)前级放大器 (5)(4)前级滤波器 (6)(5)加法器 (6)2.中央处理模块 (6)(1)A/D采样 (6)(2)D/A转换 (6)(3)单片机控制兼数据处理模块 (6)3.后级通道 (7)(1)后级滤波器 (7)(2)后级放大器 (7)三、系统调试 (7)一、方案设计与选择语音采集与回放系统应具有两个最基本的功能:完整的采集原音信号和回放语音。
采集信号主要由前级通道和MSP430 片内A/D实现:前级通道将语音信号放大,滤波,然后送给A/D 采样;继而CPU写入数据并压缩储存;语音回放主要是将前级采集的信号解压缩,并通过D/A转换和后级通道处理还原语音信号。
(一)语音采集1.信号放大因为话筒采集的声音信号极为弱小,麦克风的输出信号的峰-峰值在100mV左右,所以在A/D采集之前要对小信号进行放大。
在麦克风与放大器之间接入一个由HA17741构成的射极跟随器,以实现阻抗的变换与隔离。
放大器采用两级反向放大器,前级粗调,后级细调。
2.前级滤波由于人声的频率范围大概是300Hz~3.4kHz,为了尽可能减少输出时的杂音,使系统经存储后回放出来的声音尽量地清晰并且不失真,需要对采集进来的信号进行滤波。
数字化语音存储与回放系统 实验指导一、 数字语音处理1、 语音信号的采样(1)采样频率人耳可听到20Hz ~20KHz 的声音,但实际上人说话的声音带宽主要集中在300Hz ~3400Hz ,如电话线的带宽一般约为3KHz 。
根据采样定理,语音信号的采样频率应为语音带宽的2倍以上,对于300Hz ~3400Hz 的语音带宽,取采样频率为fs=8KHz 。
(2)平顶采样实际系统中的语音采样脉冲有一定的持续时间,即属于平顶采样。
如下图:(Ts 为采样间隔,τ为采样保持时间)平顶采样可以看成是理想采样后,再经过一个冲激响应是矩形的网络来形成的:stx(t)δ(t)不难进行下述推导: xs(t)= x(t)δ(t)= x(t)∑∞−∞=−n nTs t )(δ xsf(t)= xs(t)*h(t)==τττd t h xs )()(−∫∞∞−∑∞−∞=−n nTs t h nTs x )()(xsf(t)的频谱为: Xsf(ω)= Xs(ω)H(ω)=∑∞−∞=−n Ts H s n X /)()(ωωω 矩形脉冲的H(ω)= A τ2/)2/sin(ωτωτXsf(ω)= TsA τ∑∞−∞=−n s n X 2/)2/sin()(ωτωτωω由此可以看出,平顶采样时,加权项2/)2/sin(ωτωτ使信号频谱发生了变化,造成语音信号高频分量有部分损失,语音回放时失真。
实际PCM 系统中,均采用采样保持电路来提高输出信号的强度,为得到最大输出信号,通常取τ=Ts 。
Xsf(ω)= A∑∞−∞=−n Ts Ts s n X 2/)2/sin()(ωωωω加权项为:fsf fs f /)/sin(ππ分析该加权项:对fs=8KHzf=0时 ~ 0dB ; f=300Hz 时 ~ -0.02dB ; f=3400Hz 时 ~ -2.75dB 为了抵消平顶采样所产生的这种孔径失真,语音回放端需采用响应为)/sin()/(fs f fs f ππ的滤波网络进行频谱补偿。
第8卷 第4期 2008年2月167121819(2008)421056203 科 学 技 术 与 工 程Science Technol ogy and Engineering Vol .8 No .4 Feb .2008Ζ 2008 Sci .Tech .Engng .语音信号采集与回放系统的设计王高华 孙鹏勇(辽宁工程技术大学电子与信息工程学院,葫芦岛125105)摘 要 随着现代集成电路与可编程芯片的不断发展,语音信号的数字化处理应用越来越广泛。
提出了一种由并行模数转换器ADC0809、复杂可编程逻辑器件XC9536与并行数模转换芯片AD558等构成数字化语音信号的采集与回放系统。
关键词 模数转换器 数模转换器 复杂可编程逻辑器件中图法分类号 T N912.12; 文献标志码 A2007年9月25日收到第一作者简介:王高华(1983—),男,河南人,辽宁工程技术大学通信与信息系统专业硕士研究生,研究方向:移动通信理论及实现。
在现实世界中,人们所面临的主要是各种各样的模拟信号,数字化的信号处理已经在实际中显示出巨大的优越性,而在对语音信号处理完成后,为了方便人们的收听,必须将数字信号还原成模拟信号。
本文就是使语音信号通过模/数转换电路、CP LD 以及数/模转换电路,完成语音信号的采集与回放。
语音处理系统的组成框图如图1所示。
由于在实际中语音输入电路与语音输出电路均已集成,所以关键在于设计A /D 转换电路,D /A 转换电路以及CP LD 的编程。
图1 语音信号处理系统组成框图1 语音基础知识声音的三个要素是:音调、音强、音色。
人耳对25—22000Hz 的声音有反应。
人们谈话大部分有用的和可理解的信息的能量是300Hz 到3400Hz 。
根据NY QU I ST 准则,A /D 转换采样速率至少是信号最高频率的两倍,因此最小的采样频率应该是6800Hz,实际中采用的频率略高一点,达到8kHz 。
前置放大器设计:前置放大器采用双拾音器差分输入,可有效地降低背景噪声。
电路图如下:
带通滤波器设计:两阶高通和两阶低通构成
电路图如下:
自动增益控制电路——AGC:利用放大器和场效应管(结型场效应管)共同组成的电路实现自动增益控制
该电路是为了实现发挥部分的要求而加入的。
AGC电路是利用场效应管工作在可变电阻区,漏极电阻受到栅极电压控制的特性来实现的,整个电路由包括场效应管在内的压控增益放大器,整流滤波电路,直流放大器组成,实现增益的闭环控制。
信号自输入端进入到电路中,运放A1构成压随器,作为输入级。
由运放A2构成反向放大器,其增益由场效应管的源极和漏极之间的电阻决定。
输出电压经过整流电路和滤波电路形成压控电压,加到场效应管的栅极,当压控电压发生变化时,源极和漏极之间的电阻亦发生变化,因此放大器的放大倍数也发生变化,因此当音频信号强时自动减小放大器的倍数,信号弱时自动增大放大器的倍数,从而实现音量的自动调节,达到自动增益控制的目的。
电路图如下:
带通滤波器2的设计:增益为1 电路图如下:
幅频校正电路设计:
电路图如下:
功率放大器设计:电路图如下:。
目录1、前言 (1)1.1 背景 (1)1.2语音信号实时采集与处理 (1)1.3 FIR滤波器 (2)1.4 FIR滤波器的DSP实现 (2)2、总体方案设计 (3)2.1 目的与要求 (3)2.2方案设计 (3)3、单元模块设计 (6)3.1各单元模块功能介绍及电路设计 (6)3.2器件介绍 (9)3.3 器件参数介绍 (11)3.4 软件设计结构图 (14)4、系统调试 (15)5、总结与致谢 (16)6、参考文献 (17)附:基于TMS30Cs42的电路设计图 (18)1、前言1.1 背景20世纪50年代以来,随着数字信号处理各项技术的发展,语音信号处理技术得到不断提高,语音合成、语音识别、语音记录与语音控制等技术已开始逐步成熟并得到应用。
在语音信号处理过程中,要实现语音信号处理技术的精确性、实时性目的,语音信号采集和无误差存储成为语音信号处理中的前提。
自1982年美国德州仪器(TI)公司推出第一个定点数字信号处理(DSP)芯片以来,数字信号处理技术得到了快速发展。
DSP是一种适合于实时数字信号处理的微处理器,主要用于实时、快速实现各种数字信号的处理算法,被广泛应用于语音信号处理、数字图像处理、通信等领域。
语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段。
随着社会文化的进步和科学技术的发展,人类开始进入了信息化时代,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储、和获取语音信息,这对于促进社会的发展具有十分重要的意义,因此,语音信号处理正越来越受到人们的关注和广泛的研究。
语音信号处理是一门比较实用的电子工程的专业课程,语音是人类获取信息的重要来源和利用信息的重要手段。
通过语言相互传递信息是人类最重要的基本功能之一。
语言是人类特有的功能,它是创造和记载几千年人类文明史的根本手段,没有语言就没有今天的人类文明。
语音是语言的声学表现,是相互传递信息的最重要的手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。
语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。
1.2语音信号实时采集与处理语音处理是数字信号处理最活跃的研究方向之一,在IP电话和多媒体通信中得到广泛应用.一个完备的语音信号处理系统不但要具有语音信号的采集和回放功能,还要能够进行复杂的语音信号分析和处理.通常这些信号处理算法的运算量很大,而且又要满足实时的快速高效处理要求,随着DSP技术的发展,以DSP为内核的设备越来越多,为语音信号的处理提供了优质可靠的平台.软件编程的灵活性给很多设备增加不同的功能提供了方便,利用软件在已有的硬件平台上实现不同的功能已成为一种趋势.本文设计了一个语音处理系统,采用定点DSP芯片TM$320Cs402作为CPU,完成对语音信号的采集和滤波处理.1.3 FIR滤波器有限长单位冲激响应滤波器,是数字信号处理系统中最基本的元件,它可以在保证任意幅频特性的同时具有严格的线性相频特性,同时其单位抽样响应是有限长的,因而滤波器是稳定的系统。
因此,FIR滤波器在通信、图像处理、模式识别等领域都有着广泛的应用。
另一种是使用DSP芯片。
DSP芯片有专用的数字信号处理函数可调用,实现FIR滤波器相对简单,但是由于程序顺序执行,速度受到限制。
而且,就是同一公司的不同系统的DSP芯片,其编程指令也会有所不同,开发周期较长。
1.4 FIR滤波器的DSP实现先用MATLAB的相关滤波器函数设计一个FIR滤波器,将产生的滤波器系数作为DSP芯片实现该FIR滤波器的系数。
然后用MATLAB的SIMULINK功能信号源模块产生滤波器的输入数据,并仿真出滤波器的滤波过程,使用Scope模块得到滤波器对所输入的数据产生的滤波结果。
2、总体方案设计2.1 目的与要求本次设计要求完成基于DSP 的语音采集与处理系统,系统对声音信号进行采集,然后作数字处理如FIR 数字滤波,也可通过PC 总线由计算机完成声音信号的压缩编解码处理。
另外对系统的要求如下(1)采样速率达到41MHz(2)对1dB 的输入信号,在整个Nyquist 频带上的典型五失真动态范围为80dB(3)低功耗,单极性+5V 电源的功耗仅为595m W2.2方案设计本次实验方案通过满足目的与要求来设计,需要三大核心模块:数据处理模块,语音采集模块与编解码模块。
2.2.1 方案比较通过查阅资料发现有三种方案可以实现对宽带语音信号实时采集及处理方案一如图2.1:图2.1系统采用1片TMS320VC5402芯片和JTAG 与STAM 连接电路实现语音信号采集功能,其接口电路电路中的DSP 工作在被动接收数据模式下,ADC 工作在主动模式下。
电路连接中处理器实现与SRAM 之间的数据传输,多通道缓冲串口的接收数据硬中断激活中断服务程序来完成数据的接收。
方案二如图2.2:图2.2采用定点DSP芯片TM$320Cs402作为CPU,完成对语音信号的采集和滤波处理,数模转换采用AD9042芯片,缓冲剂采用AD9613芯片方案三如图2.3:图2.3本设计选用TLC320AD50(以下简称AD50)完成语音信号的A/D转换和D/A转换.AD50是TI公司生产的一款集成有A/D和D/A的音频芯片,DSP与音频AD50连接后,可使用一个缓冲串行口来同时实现语音信号的采集和输出,从而可以节省DSP 的硬件开销.AD50使用过采样技术提供从数字信号到模拟信号和模拟信号到数字信号的高分辨率低速信号转换.该器件包括2个串行的同步转换通道,分别用于各自的数据传输.语音信号直接从AD50的模拟信号输入端输入,AD50对其进行采样,并将采样后的数据传送至DSP.DSP应用相应的算法对数据进行处理,并将处理后的数据传送到AD50的D/A输入端.ADS0再对DSP处理后的数据进行数模转换,变为语音信号后输出到音响设备.2.2.2方案论证A/D转换器之前的驱动放大器完成信号和A/D转换隔离,提供A/D转换器所需要的增益和电平移动,为满足宽带采样的要求,放大器选择要有足够的带宽,通带内幅频特性要比较坦,放大器失真尽量小。
2.2.2方案选择综上考虑,需要AD9631,所以本次设计采用定点DSP芯片TM$320Cs402作为CPU,完成对语音信号的采集和滤波处理.语音采集与处理系统主要包括3个主要部分:以TMS30Cs402为核心的数据处理模块;以AD9042为核心的语音采集与编解码,选择方案二。
3、单元模块设计3.1各单元模块功能介绍及电路设计3.1.1运算放大器AD963电压反馈式运放由AD公司XFCB(超高速互补双极性)工艺制造.以低价格提供了非常突出的性能.单位增益时稳定(G≧±1),胜任电压增益幅值≧+2V/V或-1V/V的应用场合。
图3.13.1.2 AD9042AST转换器AD9042AST是美国AD公司推出的高速、高性能、低功耗的12位模数转换器。
片内带有跟踪/保持放大器和基准电源以提供完整的模数转换方案,AD9042AST仅需1个单极性的+5V电源技能正常工作,并以41MHz的速度提供与CMOS兼容的逻辑数据输出。
图3.23.1.3 AD9613AD9613是一款双通道、12位、采样速率最高达250 MSPS的模数转换器(ADC),旨在为低成本、小尺寸、宽带宽、多功能通信应用提供解决方案。
这款双通道ADC采用多级、差分流水线架构,并集成了输出纠错逻辑。
每个ADC均具有宽带宽输入,支持用户可选的各种输入范围。
集成基准电压源可简化设计。
占空比稳定器可用来补偿ADC时钟占空比的波动,使转换器保持出色的性能。
ADC输出数据直接路由至两个外部12位LVDS输出端口,格式化为交错式或通道复用式。
需要时,灵活的关断选项可以明显降低功耗。
设置与控制编程利用三线式SPI兼容型串行接口来完成。
AD9613采用64引脚LFCSP封装,额定温度范围为−40°C至+85°C工业温度范围图3.33.1.4 TM$320Cs402TMS320C5402有2个McBSP多通道缓存串行口.McBSP提供了全双工的通信机制,以及双缓存的发送寄存器和三缓存的接收寄存器,允许连续的数据流传输,数据长度可以为8、12、16、20、24、32;同时还提供了A律和肚律压扩.数据信号经DR和DX引脚与外设通讯,控制信号则由CLKX、CLKR、FSX、FSR等4个引脚来实现H].CPU 和DMA控制器可以读取DRR[1,2]的数据实现接收,并且可以对DXR[1,2]写入数据实现发送.串行口控制寄存器SPCR[1,2]和引脚控制寄存器PCR用来配置串行口;接收控制寄存器RCREl,2]和发送控制寄存器XCR[1,2]用来设置接收通道和发送通道的参数;采样率发生器寄存器SRGR[1,2]用来设置采样率.TMS320C5402芯片串口控制寄存器功能强大,用户通过编程不但可以设置时钟信号的极性及输人输出方向,还可以设置同步信号的极性及输入输出方向.TMS320C5402图3.43.1.5 FIR滤波器FIR滤波器结构FIR数字滤波器的设计方法主要有窗函数法和评论抽样设计法,其中窗函数法是基本而有效的设计方法,其滤波结构图如下:图3.53.2器件介绍3.2.1 AD9042ASTAD9042的输入级是一反相放大的运算放大器,由于AD9042是单5V电源工作的,因此对模拟信号应偏置在2.4V,这可以用49.9Ω的电阻将VOFFSET 端与片内的2.4V 参数源连接实现。
图3.63.2.2 FIR滤波器的DSP实现先用MATLAB的相关滤波器函数设计一个FIR滤波器,将产生的滤波器系数作为DSP芯片实现该FIR滤波器的系数。
然后用MATLAB的SIMULINK功能信号源模块产生滤波器的输入数据,并仿真出滤波器的滤波过程,使用Scope模块得到滤波器对所输入的数据产生的滤波结果。
再通过DSP的集成开发环境CCS把SIMULINK所产生的滤波器数据存储在DSP芯片的数据空间中。
最后使用汇编语言或者C语言设计C54x的FIR滤波程序,将MATLAB函数产生的滤波器系数和用C语言产生的输入数据进行运算。
输入数据和通过DSP芯片产生的滤波结果可以通过CCS显示出来,这样就可以验证该滤波器的实现。
借助C54系列DSK开发板实时运行所设计的FIR数字滤波器,该DSK开发板上的DSP芯片为TMS320C5402。
具体实现过程如下:①装载程序;②待处理的模拟信号加入A/D输入端;③查看D/A输出端结果,验证滤波器性能。
图3.73.3 器件参数介绍3.3.1 AD9042AST内部结构及参数AD9042AST功能引脚概述图3.7.1图3.83.3.3 FIR滤波器的软件设计#include <math.h>#define UINT unsigned int#define MAX_POINT 128#define PI 3.1415926#define MAX_ORDER 8float x[MAX_POINT];float y[MAX_POINT];float coff[]={-0.0061 , -0.0136 , 0.0512 , 0.2657 , 0.4057 , 0.2657 ,0.0512 , -0.0136 , -0.0061};void initWave(void);void fir(float * lpcoff,int order);void main(void){initWave();fir(coff,MAX_ORDER);while(1);}void initWave(void){int i;for ( i = 0 ;i < MAX_POINT ; i ++){x[i] = sin(4.0 * PI * (float)i/(float)MAX_POINT);x[i]+= sin(84.0 * PI * (float)i/(float)MAX_POINT);x[i]*=500.0;}}void fir(float * lpcoff,int order){int i,j;float t;for ( i = 0 ; i < MAX_POINT -MAX_ORDER ; i ++){t = 0;for ( j = 0 ; j < order ; j ++ ){t+=lpcoff[j]*x[i-j];}y[i] = t;}}3.4 软件设计结构图3.4.1系统软件设计主程序流程图如图图4.1主程序流程图4、系统调试(1)启动CCS,在Project选项中打开fir.pjt。