语音采集与放送(千一)
- 格式:doc
- 大小:183.50 KB
- 文档页数:4
【毕业设计】语音信号的采集与分析河南农业大学本科生毕业论文(设计)任务书论文(设计)题目语音信号的采集与分析学院专业班级学号姓名2009年月日语音信号的采集与分析作者:123 指导老师:456摘要语音信号的采集与分析技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。
其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。
本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,并通过PC机录制自己的一段声音,运用Matlab进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化。
关键词:语音信号,采集与分析,MatlabAudio signal acquisition and analysisAuthor:zhuyousong Teacher guidance:lifuqiangAbstractSpeech signal acquisition and analysis techniques are a wide range of cross-scientific,Its application and development of voice study, sound measurement study, electronic measuring technology, and digital signal processing disciplines, such as close contact。
Collection and analysis of voice one of the small-scale equipment, intelligence, digital and multi-functional development of more and more quickly, faster than the previous analysis has been substantially high。
南昌工程学院《语音信号的采集与分析》课程设计题目语音信号的采集与分析课程名称语音信号处理系院信息工程学院专业通信工程班级 10通信工程2班学生姓名刘敏学号 2010103362设计地点电子信息楼指导教师邹宝娟设计起止时间:2013年12月9日至2013年12月20日目录一、需求分析 (4)1.1选题背景及意义 (4)1.2设计要求 (4)二、系统总体设计 (4)2.1 系统设计思路 (4)2.2 功能结构图及功能说明 (4)2.3 工作原理 (6)三、系统详细设计 (6)3.1 语音信号的matlab仿真的数据分析 (6)3.2 程序代码分析 (12)四、调试与维护 (14)4.1 调试过程的问题与维护 (14)五、结束语 (15)六、参考文献 (16)七、指导教师评阅(手写) (17)一、需求分析1.1选题背景及意义该设计主要是介绍语音信号的采集与分析方法,通过PC机录制自己的一段声音,运用Matlab提供的函数进行仿真分析,并画出采样后语音信号的时域波形和频谱图,对所采集的语音信号加入干扰随机高斯噪声,对加入噪声的信号进行播放,并进行时域和频谱分析;对比加噪前后的时域图和频谱图,分析讨论采用什么样的滤波器进行滤除噪声。
1.2设计要求(1)通过PC机录制自己的一段声音“南昌工程学院刘敏”;(2)运用MATLAB中信号处理相关的函数对语音信号进行时域、频域上的分析,如短时能量,短时平均过零率,语谱图等;(3)运用MATLAB对语音信号进行综合与分析,包括语音信号的调制,叠加,和滤波等。
二、系统总体设计2.1 系统设计思路系统的整体设计思路包括语音信号的录制,语音信号的采集,语音信号的分析,其中语音信号的分析又包括了语音信号的时域分析和频域分析,语音信号的加噪处理和滤噪设计分析。
2.2 功能结构图及功能说明实际工作中,我们可以利用windows自带的录音机录制语音文件,声卡可以完成语音波形的A/D转换,获得WAVE文件,为后续的处理储备原材料。
语音播报器说明书V1.0(型号:LX04)(低电平版)秦皇岛千目电子有限公司电话:************传真:************/1.产品特性 (2)2.产品图片、接口介绍 (2)2.1产品外形和接口图片 (2)2.2接口介绍 (3)3.音频信息下载 (3)3.1准备音频文件 (3)3.1.1软件合成音频文件 (3)3.1.2音频文件转换MP3格式 (3)3.2下载语音 (4)3.2.1USB口连接PC (4)3.2.2产生U盘 (4)3.2.3格式化U盘 (5)3.2.4复制文件夹 (5)3.2.5下载完成 (5)4.控制方式 (5)5.参数设置 (6)6.高低电平转换 (6)7.技术支持及联系方式 (6)语音播报器说明书(型号:LX04)LX04语音播报器千目电子推出的一款新型语音产品。
具有价格低、稳定可靠、可更换语音等特点。
可广泛应用于工业控制、安防报警、语音提示等场合。
1.产品特性●MP3格式语音存储,可播放提示语音和音乐,音质更好。
●板载FLASH存储器,成本低、可靠性更好。
●USB口直接下载语音信息,操作方便。
●4路光耦隔离输入控制信号,可以控制4路语音播放。
●性能参数工作电源电压:直流12-24V工作温度:-20~85℃喇叭参数:8欧10W2.产品图片、接口介绍2.1产品外形和接口图片图1播放器整体图2.2接口介绍◆电源接口V+、G:接12-24V直流电源。
G接电源负极、V+接电源正极。
◆Vo+、Vo-:外接报警灯。
Vo+外接报警灯正极、Vo-外接报警灯负极。
◆输入1-4:为4路输入信号。
与G短接就可以触发对应的语音播放。
◆USB:USB接口,下载MP3格式的音频文件到模块。
◆指示灯:绿色电源指示灯,上电常亮;红色状态指示灯,有语音播放常亮。
◆音量:调节模块输出音量大小。
◆控制4、5:二进制组合选择播放控制方式(队列播放、抢先播放和播放不采样)。
◆信号方式1-3:通过二进制组合选择模块的信号输入方式(见第4节控制方式)。
语音控制器说明书V1.1(型号:DG08)(高电平版)秦皇岛千目电子有限公司电话:************传真:************/1.产品特性 (2)2.产品图片、接口介绍 (2)2.1产品外形和接口图片 (2)2.2接口介绍 (3)3.音频信息下载 (3)3.1准备音频文件 (3)3.1.1软件合成音频文件 (3)3.1.2音频文件转换MP3格式 (3)3.2下载语音 (4)4.控制方式 (4)5.参数设置 (5)6.技术支持及联系方式 (5)语音控制器说明书(型号:DG08)DG08语音控制器千目电子推出的一款新型语音产品。
具有价格低、稳定可靠、可重复录音等特点。
可广泛应用于工业控制、安防报警、语音提示等场合。
1.产品特性●MP3格式语音存储,可播放提示语音和音乐,音质更好。
●板载8M Flash存储器,成本低、可靠性更好。
●USB口直接下载语音信息,操作方便。
●音频1:3.5音频接口,可以接音箱音柱等。
●8路光耦隔离输入控制信号,可以控制8段语音播放。
●性能参数工作电源电压:直流12-24V工作温度:-20~85℃外接喇叭参数:8欧3-5W2.产品图片、接口介绍2.1产品外形和接口图片图1播放器整体图2.2接口介绍◆电源接口11、12:直流12-24V供电。
G接直流负极、V+接直流正极。
◆COM口9、10:触发信号公共端。
◆端子1-8:为8路输入信号。
与COM短接就可以触发对应的语言播放。
◆电源灯:模块供电正常电源灯会常亮。
◆状态灯:有语音播放会常亮。
◆USB接口:下载音频文件到模块。
◆音频1:3.5音频接口,可以接音箱音柱等。
◆音量:可以调节模块声音大小。
◆音频2:声音输出接口,直接接无源喇叭。
◆信号方式1-3:通过二进制组合方式选择模块的信号输入方式(见第4节控制方式)。
◆控制4、5:通过二进制组合方式选择选择播放控制方式(队列播放、抢先播放和播放不采样)。
◆控制6:断开立即停止设置口(开关拨下(ON)是1,模块设置成断开立即停止)。
人工智能应用模拟题与答案一、单选题(共40题,每题1分,共40分)1、什么是知识表示( )。
A、是数据结构设计B、是数据格式处理C、用易于计算机处理的方式来描述人脑的知识D、是编程语言正确答案:C2、以下哪种神经网络技术可以用于语音识别的处理A、循环神经网络B、深层神经网络C、卷积神经网络D、浅层神经网络正确答案:A3、作为驱动本轮人工智能浪潮全面兴起的三大基础要素之一,A、互联网B、信息C、数据D、人才正确答案:C4、对于线性不可分的数据,支持向量机的解决方式是A、软间隔B、核函数C、以上选项均不正确D、硬间隔正确答案:B5、在人脸检测算法中,不属于该算法难点的是A、人脸角度变化大B、需要检测分辨率很小的人脸C、需要检测不同性别的人脸D、出现人脸遮挡正确答案:C6、基于统计的分词方法为()A、条件随机场B、最少切分C、逆向最大匹配法D、正向最大匹配法正确答案:A7、语音理解是指利用( )等人工智能技术进行语句自动识别和语意理解。
A、合成和分析B、声乐和心理C、字典和算法D、知识表达和组织正确答案:D8、高速上的ETC属于下列那种技术()。
A、CVB、CSC、NLPD、RS正确答案:A9、下面哪个领域没有应用数据挖掘技术()A、教育B、金融C、农业D、以上全部应用正确答案:D10、我们可以利用以下哪种方法实现反向传播?A、计算图B、代价函数C、链式法则D、高阶微分正确答案:C11、人脸识别系统是容易受到外部攻击的,因而需要增加类似活体检测的技术,但还是不能解决A、视频回放攻击B、黑客网络攻击C、照片攻击D、照片面具攻击正确答案:B12、以下四个人工智能的应用领域中,与其他三个不同的是()。
A、医学影像分析B、语音识别C、图像识别与分类D、人脸识别与情感计算正确答案:B13、以下哪个选项是目前利用大数据分析技术无法进行有效支持的?A、天气情况预测B、个人消费习惯分析及预测C、新型病毒的分析判断D、精确预测股票价格正确答案:D14、人工智能平台应支持资源横向扩展和系统平滑升级,资源扩展和系统升级过程应不影响现有训练任务和()服务。
语音控制器说明书V1.2(型号:DL04)(低电平版)秦皇岛千目电子有限公司电话:************传真:************/1.产品特性 (2)2.产品图片、接口介绍 (2)2.1产品外形和接口图片 (2)2.2接口介绍 (3)3.音频信息下载 (3)3.1准备音频文件 (3)3.1.1软件合成音频文件 (3)3.1.2音频文件转换MP3格式 (3)3.2下载语音 (3)3.2.1USB口连接PC (4)3.2.2产生U盘 (4)3.2.3格式化U盘 (4)3.2.4复制文件夹 (4)3.2.5下载完成 (4)4.控制方式 (5)5.参数设置 (5)6.技术支持及联系方式 (6)语音控制器说明书(型号:DL04)DL04语音控制器千目电子推出的一款新型语音产品。
具有价格低、稳定可靠、可更换语音等特点。
可广泛应用于工业控制、安防报警、语音提示等场合。
1.产品特性●MP3格式语音存储,可播放提示语音和音乐,音质更好。
●板载FLASH存储器,成本低、可靠性更好。
●USB口直接下载语音信息,操作方便。
●4路光耦隔离输入控制信号,可以控制4路语音播放。
●性能参数工作电源电压:直流12-24V工作温度:-20~85℃外接喇叭参数:8欧10W2.产品图片、接口介绍2.1产品外形和接口图片图1播放器整体图2.2接口介绍◆电源接口V+、G:接12-24V直流电源。
G接电源负极、V+接电源正极。
◆输入1-4:为4路输入信号。
与G短接就可以触发对应的语音播放。
◆USB:USB接口,下载MP3格式的音频文件到模块。
◆指示灯:绿色电源指示灯,上电常亮;红色状态指示灯,有语音播放常亮。
◆音频:功放输出接口,可以接音箱、音柱等。
◆音量:调节模块输出音量大小。
◆SPK:无源喇叭输出接口,接8欧10瓦的无源喇叭。
◆控制4、5:二进制组合选择播放控制方式(队列播放、抢先播放和播放不采样)。
◆信号方式1-3:通过二进制组合选择模块的信号输入方式(见第4节控制方式)。
语音播报系统说明书秦皇岛千目电子有限公司电话:************传真:************/1.产品特性 (2)2.产品图片 (2)3.接口介绍 (2)4.按键介绍 (3)5.下载语音 (3)5.1软件合成音频文件 (3)5.2音频文件转换MP3格式 (3)6.技术支持及联系方式 (4)语音播报系统说明书具有价格低、稳定可靠、语音可更换、宽电源电压、便于扩展矩阵键盘等特点。
主要控制方式:6×5矩阵键盘方式.主要应用范围:键盘式语音播放设备、手持播放设备。
1.产品特性●MP3格式音频文件,可播放提示语音和音乐,音质好。
●采用Micro SD卡存储语音信息,机器自带128M存储卡,最大支持16G存储。
●板载Mini USB接口,语音信息下载方便,音频文件直接复制到SD卡即可。
●标准3.5MM音频孔,可外接音箱、音柱等功放设备。
●可通过键盘调节输出的音量大小。
●6×5矩阵键盘控制,默认功能可通过键盘播放100段语音信息。
●播放过程中,可以暂停,使用更方便。
●可根据用户需要扩展键盘功能。
●性能参数工作电源电压:直流12~24V工作温度:-20~85℃喇叭参数:8欧3W2.产品图片车载点烟器接口电源接口3.接口介绍◆电源接口:适应宽电压范围12V-24V直流电源。
有车载点烟器接口和电源接口两种。
◆USB接口:USB下载音频文件到存储卡。
◆音频1:标准3.5MM音频孔,可外接功放系统,增大音量。
4.按键介绍音量+/-:按下按键增加/减小音量。
模式:实现模式1到模式5的循环切换,每个模式可以播放25个文件。
在模式1:按键6-30,对应存储卡内第6段----第30段语音信息。
在模式2:按键6-30,对应存储卡内第31段---第55段语音信息。
在模式3:按键6-30,对应存储卡内第56段----第80段语音信息。
在模式4:按键6-30,对应存储卡内第81段----第105段语音信息。
普通话语音与播音发声习题集答案上篇普通话语音答案第一单元语音概说一、1、语音是人类说话时由发音器官发出来的表达一定意义的声音。
语音是语言的物质外壳,是语言的交际职能得以实现的物质手段,语言必须凭借语音才能表达出来。
2、语音同自然界的其他声音一样,产生于物体的振动,是一种物理现象具有物理属性。
语音是人类说话时由发音器官发出来的,又是一种生理现象。
语音同自然界的其他声音的根本区别,是它具有社会属性。
语音要表达一定意义。
用什么语音形式表达什么样的意义,必须是使用该语言的全体成员约定俗成的。
二、1、音高、音强、音长、音色是声音的四要素。
语音既然是一种声音,那么这四要素也会在语音中表现出来。
2、音高是指声音的高低;音强是指声音的强弱;音长是指声音的长短;音色是指声音的本质和特色。
三、声母由辅音充当,但有的辅音不做声母,只做韵尾;有的辅音如n,既可以作声母又可作韵母。
有的音节开头没有辅音,原因前头部分是零,叫做零声母。
韵母和元音也不相等。
韵母有的由单元音、复元音构成;有的由元音带辅音构成。
第二单元声母一、1.k :舌尖后、送气、清、塞音2.ch :舌尖后、送气、清、塞擦音3.n :舌尖中、浊、鼻音4.x :舌面前、清、擦音5.z :舌尖前、不送气、清、塞擦音二、1.双唇送气清塞音是p2.舌尖后清擦音是sh3.舌尖中浊边音是l4.舌尖后浊擦音是r5.舌面前不送气清塞擦音是j三、这两组声母中的zh、ch、sh和z、c、s都是清塞擦音,其中zh、z不送气,ch、c送气;sh、s都是清擦音。
有些汉语方言区的人对zh、ch、sh和z、c、s的发音感到难以分辨,主要是分不清前一组是舌尖后音声母,后一组是舌尖前音声母。
发舌尖后音时,舌尖要翘起来,对准硬腭前部;发舌尖前音时,舌尖不翘,要对准上齿背。
第三单元韵母一、1、按韵母开头的元音发音口型分,韵母可分为开口呼、齐齿呼、合口呼、撮口呼四类,简称四呼。
2、按韵尾分,韵母可分为无韵尾韵母;元音韵尾韵母;鼻音韵尾韵母。
广州大学学生实验报告
开课学院及实验室:物理与电子工程学院 2015年4月26日
班级光信121 姓名学号指导老师
实验课程名称数字信号处理实验Ⅰ成绩
实验项目名称语音采集和放送
一、实验目的
二、实验原理
三、使用仪器、材料
四、实验步骤
五、实验过程原始记录(数据、图案、计算等)
六、实验结果及分析
一.实验目的
1.了解ICETEK-VC5509-A 板上语音codec 芯片TLV320AIC23 的设计和程序控制原理。
2.了解数字回声产生原理、编程及其参数选择、控制。
3.熟悉VC5509DSP 扩展存储器的编程使用方法。
二、实验原理
1、初始化配置:DSP 通过C I
总线将配置命令发送到AIC23,配置完成后AIC23 开始工作。
-语音信号的输入:AIC23 通过其中的AD 转换采集输入的语音信号,每采集完一个信号后,将数据发送到DSP 的McBSP 接口上,DSP 可以读取到语音数据,每个数据为16 位无符号整数,左右通道各有一个数值。
-语音信号的输出:DSP 可以将语音数据通过McBSP 接口发送给AIC23,AIC23 的DA 器件将他们变成模拟信号输出。
2、数字回声原理:
在实际生活中,当声源遇到物体时,会发生反射,反射的声波和声源声波一起传输,听者会发现反射声波部分比声源声波慢一些,类似人们面对山体高声呼喊后可以在过一会儿听到回声的现象。
声音遇到较远的物体产生的反射会比遇到较近的物体的反射波晚些到达声
源位置,所以回声和原声的延迟随反射物体的距离大小改变。
同时,反射声音的物体对声波的反射能力,决定了听到的回声的强弱和质量。
另外,生活中的回声的成分比较复杂,有反射、漫反射、折射,还有回声的多次反、折射效果。
当已知一个数字音源后,可以利用计算机的处理能力,用数字的方式通过计算模拟回声效应。
简单地讲,可以在原声音流中叠加延迟一段时间后的声流,实现回声效果。
当然通过复杂运算,可以计算各种效应的混响效果。
如此产生的回声,我们称之为数字回声。
3.程序流程图:
三、使用仪器和材料
计算机,ICETEK-VC5509-EDU 实验箱(或ICETEK 仿真器+ICETEK-VC5509-A 系统板+相关连线及电源),耳机,麦克风。
四、实验步骤
1.实验准备:
⑴连接实验设备:请参看本书第三部分、第一章、二。
⑵准备音频输入、输出设备。
①将耳机上麦克风插头插到ICETEK-VC5509-A 板的J5 插座,即上图中“麦克风输入”。
②将耳机上音频输入插头插到ICETEK-VC5509-A 板的J7 插座,即上图中“耳机输出”。
④调节耳机上音量旋钮到适中位置。
2.设置Code Composer Studio 2.21 在硬件仿真(Emulator)方式下运行:
请参看本书第三部分、第一章、四、2。
3.启动Code Composer Studio 2.21:
请参看本书第三部分、第一章、五、2。
选择菜单Debug→Reset CPU。
4.打开工程文件:
工程目录为:C:\ICETEK-VC5509-EDULab\Lab0701-Echo\audio.pjt。
5.编译、下载程序,选择菜单Debug->Go Main,使程序运行到main 函数入口位置。
6.设置观察窗口:
打开源程序aic23.c,将变量bEcho、uDelay 和uEffect 加入观察窗口。
7.运行程序观察结果:
-按“F5”键运行,注意观察窗口中的bEcho=0,表示数字回声功能没有激活。
-这时从耳机中能听到麦克风中的输入语音放送。
-将观察窗口中bEcho 的取值改成非0 值。
-这时可从耳机中听到带数字回声道语音放送。
-试着分别调整uDelay 和uEffect 的取值,使他们保持在0-1023 范围内,同时听听耳机中的输出有何变化。
8.退出CCS
五、实验过程原始记录
产生二次回音的程序
修改程序如下:
while (!ReadMask(pMCBSP0 -> spcr2, SPCR2_XRDY)); // 等待McBSP0准备好
nWork=Read(pMCBSP0->ddr2); // 读取左右声道的数据
nWork=Read(pMCBSP0->ddr1); // 因为耳机输入左右声道相同,所以读两次即可
far_poke(lpWork++,nWork); // 保存到缓冲区
if ( bEcho ) // 需要制作数字回声否?
{
uEffect1%=1024; // 保证输入在0-1023之间
uDelay1%=1024; // 保证输入在0-1023之间
fWork=uEffect1/1024.0;
luWork1=100;
luWork1*=uDelay1;
luWork1=luWork-luWork1;
if ( luWork1<0 ) luWork1+=0x48000;
lpWork1=lpAudio;
lpWork1+=luWork1; // 根据uDelay参数计算
nWork1=far_peek(lpWork1); // 取得保存的音频数据
fWork1=nWork1;
fWork1/=256.0;
fWork1*=uEffect;
fWork1+=nWork;
fWork+=1.0;
fWork1/=fWork;
nWork=fWork1; // 与当前声音混响
}
Write(pMCBSP0->dxr2,nWork); // 送数据到McBSP0
Write(pMCBSP0->dxr1,nWork); // 声音输出由AIC23完成
luWork++; // 循环使用缓冲区
六、实验数据分析
当把实验程序输入,按run之后,当麦克风有声音输入的时候,会产生一次回音。
当麦克风有声音输入的时候,要使产生A-a-a的两次回音而且回音声量越来越小,则可以修改程序。
上面的程序和源程序的部分程序是相似的,我修改的了将产生回音的程序复制在下面,让之产生两次回音。
通过修改uEffect1、uDelay1的数值,控制音量,从而实现了产生二次回音的功能。