基于IDE硬盘的超长时间语音录放系统
- 格式:doc
- 大小:24.50 KB
- 文档页数:4
基于IDE硬盘的超长时间语音录放系统摘要:选择单片机+ide硬盘的方案,权衡处理器性能和编解码算法复杂度之后选择了adpcm压缩算法,利用winbond w78e52单片机的最小开发板实现基于ide硬盘的大容量语音记录仪,极具性价比。
关键词:单片机;adpcm;超长时间语音录放系统0引言基于ide硬盘的大容量语音记录仪可将拾音器获得的语音信号转换为数字信息,编码压缩后以语音文件形式存储于硬盘上,并可检索查询,将选定的语音文件实现高质量的回放。
目前,各行业对语音进行录音保存变得越来越普遍,各行业使用的语音记录设备主要包括磁带式语音记录设备、基于pc机的语音记录设备和基于flash 芯片的语音记录设备。
这些语音记录设备由于体积过大或记录时间较短等缺点在实际应用时满足不了某些用户的特殊需求,因此亟需一种大容量、体积小巧的语音记录设备。
1系统硬件与软件资源分配如图1所示:图1系统硬件结构框架系统软件的核心包括两个任务流:录音和放音。
录音部分包括读adc转换值、编码、写硬盘;放音部分包括读硬盘、解码、送dac 输出模拟音频信号,如图2所示。
2系统设计与分析adpcm是在自适应脉冲编码调制(adaptive pulse code modulation,apcm)和差分脉冲编码调制(differential pulse code modulation,dpcm)的基础上发展起来的。
adpcm综合了apcm的自适应特性和dpcm系统的差分特性,是一种性能比较好的波形编码。
它的核心算法是:①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step size)去编码小的差值,使用大的量化阶去编码大的差值;②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。
图2系统软件资源分配及系统软件结构流程在数字语音处理中,sub adpcm算法的关键是进行子带的分割,即实现数字带通滤波。
凌阳的音频压缩算法sacm a2000即是采用这种算法,在winbond w78e52的集成开发环境中集成并提供了sacm a2000的api函数供调用,经实验发现,调用sacm a2000进行录音压缩占用了较多的ram资源,需要花费较多的cpu时钟,如果加入硬盘读写程序,winbond w78e52的cpu时钟频率和2k字的ram将无法满足系统要求。
语音存储回放——系统软件设计班级:电科0801 姓名:学号:语音存储回放系统软件的基本功能是通过按键控制系统实现录音与放音。
录音(语音的存储)时,采集语音信号并将采集的数据存入M25P16中;放音(语音的回放)时,从M25P16中读取数据送DAC。
一、设计题目设计并制作一个数字化语音存储与回放系统,设计要求:①前置放大器增益可调,功率放大器输出功率≥0.5W。
②带通滤波器:通带为300Hz~3.4kHz。
③ADC:采样频率fs=8kHz,字长8位。
④语音录放时间≥60s。
⑤DAC:变换频率fc=8kHz,字长8位。
⑥回放语音质量良好。
⑦采用语音压缩算法,增加录放时间。
在建立系统软件的框架时,应考虑以下几个问题。
⑴人机接口的功能设计语音存储与回放系统的人机接口功能比较简单,按照功能要求要求只需要3个功能键:“擦除”键、“录音”键、“放音”键。
“擦除”键有效时,单片机调用擦除子程序将M25P16中数据整片擦除,以便进行录音操作。
“录音”键有效时,单片机以8kHz的频率采集语音信号,并将数据写入M25P16中。
当“放音”键有效时,单片机通过读数据子程序从M25P16中取出数据送入DAC输出语音信号。
语音存储与回放系统在工作时需要提示一些简单的信息,入显示三种工作状态:录音状态、放音状态、擦出状态,另外,需要显示录音和放音的时间。
根据设计方案,语音存储与回放系统的单片机子系统采用并行总线单片机最小系统,人机接口采用LCD模块和矩阵式键盘。
根据键盘的工作原理,当键有效时,单片机通过执行INT0中断服务程序读取键值。
单片机根据读取的键值,执行相应的键处理程序。
这里需要考虑的是,键处理程序放在INT0中断服务程序中还是放在主程序中。
如果将键处理程序放在INT0中断服务程序中,则单片机在执行键处理程序时,无法响应同级别的中断,影响程序的效率和实时性。
因此,将键处理程序放在主程序中,INT0中断服务程序只需要读取键值并设置一个键有效标志。
LD-4000B固定式同步录音录像指挥管理系统解决方案目录1.概述 (4)2.产品设计原则 (6)2.1规范性 (6)2.2先进性 (6)2.3可靠性 (6)2.4安全性 (7)2.5专业性 (7)2.6扩展性 (7)2.7网络化 (7)2.8集成化 (8)3.总体方案 (8)3.1方案拓扑图 (8)3.2总体方案说明 (8)3.3院内指挥 (9)3.3.1办案区 (9)3.3.2中心控制室 (10)3.3.3指挥中心 (10)3.3.4领导办公室 (10)4.方案详细说明 (11)4.1审讯(谈话)室配置 (11)4.2控制室配置 (12)4.3指挥中心配置 (14)4.4领导办公室 (15)5.LD-4000B产品功能和参数 (16)5.1产品参数 (16)5.2产品特点 (17)5.3产品技术 (18)5.4产品功能列表 (19)6.配套软件说明 (23)6.1权限管理服务器 (23)6.1.1软件的功能和启动 (23)6.1.2软件操作 (23)6.2前端办案讯问软件 (25)6.2.1软件登录 (25)6.2.2软件操作 (27)1)直播 (27)2)添加时间点 (28)3)笔录 (28)4)指挥 (28)5)手写签字 (30)6.3监视、点播、指挥三合一软件 (31)6.3.1软件登录 (31)6.3.2软件操作 (31)1)视频点播 (31)2)指挥 (33)3)手写指挥 (33)4)文字指挥 (33)5)语音指挥 (34)6.4远程集中管理软件 (35)6.4.1软件登录 (35)6.4.2软件操作 (36)1)刻录 (36)2)视频点播 (38)3)对话 (39)4)添加删除办案部门、案由 (39)5)添加删除办案人员 (40)6)添加删除录制人员 (41)7)添加删除翻译人员 (41)8)校准本计算机的系统时间 (42)9)修改远程机器基本配置 (42)10)用户管理 (43)11)设置画中画参数 (44)12)刻录服务器关机重启控制 (45)6.5视频下载工具 (46)6.5.1软件登录 (46)6.5.2软件操作 (46)1.概述LD-4000B固定式同步录音录像服务器是一款针对司法关讯问音视频资料同步记录需求量身定制的专业产品。
B S P-60型长时间语音录放开发板使用说明书上海奔流电子有限公司地址:上海市宝山区真陈路1398弄16号邮编:200444开户行:工行宝山工业园区之行帐号:1001 1509 0900 680 2162 一:产品概述:BSP-60型长时间语音录放开发板是一款具有创新意义的语音新产品,拥有众多优点:1、采用先进的MCU+DSP语音处理技术,具长时间、高音质、低价格等特点。
2、外围元件简单,大量采用贴片工艺,因此可靠性高、体积小。
3、采用FLASH存贮技术,语音数据掉电后不会丢失。
其中BSP-60型采用一片8M存贮芯片,在8KHZ/16BIT采样高音质录放的前提下可录音约60分钟。
奔流公司会继续推出支持30分钟、240分钟等高音质录音板等后续系列产品。
4、支持MIC、LINE IN两种录音方式,并支持将语音文件直接通过USB接口下载。
5、本开发板自带液晶显示屏,可以显示录放段数,录、放音符号和循环标志等。
6、自带4 ×5键盘,具有多种回放模式,一般应用不须改动任何程序。
7、自带标准串行接口控制功能和录/放音指示信号,可非常方便的由外部单片机、PC机控制录音、放音、删除等操作。
8、板上自带双3W功放电路;自带稳压电路,支持直流6-12V宽电压输入。
9、具有电子音量调节和电位器调节两种音量调节方式。
二:接口说明:BSP-60型录放开发板由主板、键盘显示板和USB通讯板三部分组成,主板可脱离键盘显示板和USB板独立工作。
主板的布局见图一所示;键盘显示板见图二。
图一图二串行接口说明:依图所示,从左到右依次为1—5号脚,其中:1号脚为串行接收端(RXD);2脚为录/放音指示信号(P/R-LED灯信号);3脚为地线(GND);4脚为串行信号发送端(TXD);5脚为线性录音的停止端(LINE IN_STOP),低有效。
模式选择拨码开关说明:依图所示,右上角红色拨码开关可以选择模式,1、2脚选择声音回放模式:3脚——线性录音选择端,该脚处于OFF位置时,默认为MIC录音状态;当该脚处于ON位置时,选择为线性录音状态。
基于ADPCM的数字语音存储与回放系统作者:李涛曾攀肖功海来源:《现代电子技术》2013年第13期摘要:系统以单片机和FPGA为控制核心,实现了语音存储与回放系统。
能够采集模拟语音信号以及耳机立体声信号,以ADPCM(自适应差分编码)的方式提高了存储器的利用率,语音存储时间可达2 min;基于短时傅里叶变换原理,实现了语音信号的频谱分析与实时显示。
同时,利用立体声音频功放播放语音,每声道音量可调并具有静噪功能。
此外,系统还采用预加重、去加重、抗混叠滤波等措施,有效地提高了信噪比。
语音回放质量良好,存储时间较长。
关键词:语音存储与回放; ADPCM;短时傅里叶变换; FPGA控制中图分类号: TN911.7⁃34 文献标识码: A 文章编号: 1004⁃373X(2013)13⁃0049⁃04 Digital voice storage and replay system based on ADPCMLI Tao1,2, ZENG Pan1,2, XIAO Gong⁃hai1(1. Shanghai Institute of Technical Physics, Chinese Academy of Sciences, Shanghai 200083, China;2. University of Chinese Academy of Sciences, Beijing 100039, China)Abstract : With singlechip and FPGA as the cybernetics core, the system realizes voice storage and reply system. It can collect and simulate voice signals and stereo signals from earphone and lift utilization rate of memory by the use of ADPCM, which means the voice can be stored for more than 2 minutes. Based on the short⁃time Fourier transform principle, it can also achieve spectral analysis of voice signals and real⁃time display. Through using the stereo audio amplifier,each sound track can be adjusted and muted. Furthermore, some measures as pre⁃emphasis,de⁃emphasis and anti⁃aliasing filtering are used in this system to increase SNR efficiently and get good quality of the recorded voice for a longer time.Keywords: voice storage and replay; ADPCM; short⁃time Fourier transform; FPGA control0 引言由单片机与FPGA共同完成语音的录制与回放,可以拥有丰富的接口资源和运算能力,鉴于PCM的存储冗余值过大和DPCM的量化噪声问题,ADPCM成为了不错的压缩算法[1⁃2]。
基于IDE硬盘的超长时间语音录放系统
摘要:选择单片机+IDE硬盘的方案,权衡处理器性能和编解码算法复杂度之后选择了ADPCM压缩算法,利用WINBOND W78E52单片机的最小开发板实现基于IDE硬盘的大容量语音记录仪,极具性价比。
关键词:单片机;ADPCM;超长时间语音录放系统
0引言
基于IDE硬盘的大容量语音记录仪可将拾音器获得的语音信号转换为数字信息,编码压缩后以语音文件形式存储于硬盘上,并可检索查询,将选定的语音文件实现高质量的回放。
目前,各行业对语音进行录音保存变得越来越普遍,各行业使用的语音记录设备主要包括磁带式语音记录设备、基于PC机的语音记录设备和基于FLASH芯片的语音记录设备。
这些语音记录设备由于体积过大或记录时间较短等缺点在实际应用时满足不了某些用户的特殊需求,因此亟需一种大容量、体积小巧的语音记录设备。
1系统硬件与软件资源分配
如图1所示:
图1系统硬件结构框架
系统软件的核心包括两个任务流:录音和放音。
录音部分包括读ADC转换值、编码、写硬盘;放音部分包括读硬盘、解码、送DAC输出模拟音频信号,如图2所示。
2系统设计与分析
ADPCM是在自适应脉冲编码调制(adaptive pulse code modulation,APCM)和差分脉冲编码调制(differential pulse code modulation,DPCM)的基础上发展起来的。
ADPCM综合了APCM 的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。
它的核心算法是:①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step size)去编码小的差值,使用大的量化阶去编码大的差值;②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。
图2系统软件资源分配及系统软件结构流程
在数字语音处理中,Sub ADPCM算法的关键是进行子带的分割,即实现数字带通滤波。
凌阳的音频压缩算法SACM A2000即是采用这种算法,在WINBOND W78E52的集成开发环境中集成并提供了SACM A2000的API函数供调用,经实验发现,调用SACM A2000进行录音压缩占用了较多的RAM资源,需要花费较多的CPU时钟,如果加入硬盘读写程序,WINBOND W78E52的CPU时钟频率和2K字的RAM将无法满足系统要求。
在本系统中,合理的方案是采用ADPCM压缩算法。
3ADPCM压缩算法在WINBOND W78E52单片机上的改进及实现3.1针对WINBOND W78E52的10位ADC对ADPCM进行改进G.721和IMA ADPCM的输入都是有符号数,最高位为符号位,如果将16位有符号数当成无符号数处理,即相当于在原来的数据上加
上0x7FFF。
WINBOND W78E52的ADC输出范围是0x0000~0xFFC0,理论上静音时ADC的输出是0x7FC0,即硬件上将双极性的语音输入信号调理成了0~2V的单极性信号,引起ADC的输出数据加上了0x7FC0,这一点和将IMA ADPCM输入信号的16位有符号数当成无符号数处理吻合。
如果能将IMA ADPCM算法的实现改成无符号数运算,那将可以省去将WINBOND W78E52的ADC 输出值处理成有符号数。
IMA ADPCM算法在实现的时候,约定初始预测值和index步长调节因子均为0,但是经过上一节介绍的方法改进后,相应地,初始预测值应改为0x7FC0,因为上述的改进方法只是在原数据上加上一个固定的值,将其“抬高”为无符号数,对ADPCM编码过程的差值并不产生影响,因此初试index步长调节因子不需改变,仍为0。
编解码过程中的溢出判决相应的也要改为下限为0,上限为0xFFC0。
3.2利用Matlab模拟WINBOND W78E52的硬件条件进行仿真Matlab提供了丰富的数据类型和位运算指令,这为利用Matlab模拟WINBOND W78E52的硬件条件进行仿真提供了条件。
首先,将语音信号样本处理为16位的无符号整型数据,然后定义uint16类型变量使得与WINBOND W78E52的数据位宽一致。
在运算过程中,Matlab 自动对数据类型进行检查,因此不需要进行误差补偿。
语音信号s(n)的取值范围为-1~+1,在这个范围内,可近似地认为s(n)服从正态分布,从而可知其SNR将显著的提高。
3.3编解码程序流程图
编解码程序流程图如图3、图4所示。
图3解码程序流程
图4编码程序流程
4系统测试
4.1编解码程序测试
在集成开发环境中对编解码程序进行时延测试。
反映的也是处理器和编解码程序的综合效率。
考虑到8KHz中断间隔125us,因此系统采用的编码帧长为16字,解码帧长为4字。
帧长度越长,编解码效率越高,这主要是因为每次进入和退出编解码程序都需要对指针等变量进行存取,需要一定的时钟周期。
4.2系统功能实现
经过调试,系统实现了全部目标功能。
包括:录音、放音;4倍压缩率实时编码压缩;分段按文件存储;按段选择文件播放;解码播放音质MOS分在4.0左右;状态显示等。