语音信号处理 第2版 赵力 语音信号处理第7章新
- 格式:ppt
- 大小:3.80 MB
- 文档页数:69
《语音数字信号处理》课程简介课程编号:06044008课程名称:语音数字信号处理/ Speech Digital Signal Processing学分:2学时:32 (实验:0 上机:0 课外实践:0 )适用专业:电子信息工程建议修读学期:7开课单位:电气与信息工程学院电子信息与通信工程系先修课程:《数字信号处理》、《MATLAB及应用》、《随机信号处理》考核方式与成绩评定标准:作业、考试(闭卷)教材与主要参考书目:主要教材:《语音信号处理》主编:赵力机械工业出版社2011-6T参考书目:《离散时间语音信号处理》主编:夸特尔瑞电子工业出版社2004-87内容概述:《语音数字信号处理》是电子信息工程专业本科生的专业必修课程。
它系统地介绍了语音信号处理涉及的主要内容和方法,讲述语音信号的应用前景、语音信号处理流程及流程中涉及到的相关知识点,每个知识点通过案例仿真讲述其应用的结果。
主要内容分四部分:(1)基础部分:语音信号基础知识、人的发音原理、人的听觉原理、语音的数学模型;(2)语音信号分析方法:时域分析、频域分析、同态处理和线性预测分析;(3)语音信号涉及的新技术:矢量量化和隐马尔可夫模型;(4)语音的四个方面应用:语音编码、语音识别、语音合成和语音增强;通过《语音数字信号处理》学习,使学生掌握语音信号发音和听觉原理、语音信号的数字模型; 语音的时域、频域、倒谱、线性预测的分析方法;矢量量化;隐马尔可夫模型;语音波形编码、参数编码、混合编码;语音的合成;语音识别和语音增强的原理和技术,为学生毕业后从事语音处理工作和进一步研究相关课题打下一定的基础。
《嵌入式系统及应用》教学大纲课程编号:06044008课程名称:语音数字信号处理/ Speech Digital Signal Processing学分:2学时:32 (实验:0 上机:0 课外实践:0 )适用专业:电子信息工程建议修读学期:7开课单位:电气与信息工程学院电子信息与通信工程系先修课程:《数字信号处理》、《MATLAB及应用》、《随机信号处理》一、课程性质、目的与任务《语音数字信号处理》是电子信息工程专业本科生的专业必修课程。
语音信号处理(第2版)赵力编著语音信号处理勾画要点语音信号处理(第2版)赵力编著重点考点第2章语音信号处理的基础知识1.语音(Speech)是声音(Acoustic)和语言(Language)的组合体。
可以这样定义语音:语音是由一连串的音组成语言的声音。
2.人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段。
3.语音是人的发声器官发出的一种声波,它具有一定的音色,音调,音强和音长。
其中,音色也叫音质,是一种声音区别于另一种声音的基本特征。
音调是指声音的高低,它取决于声波的频率。
声音的强弱叫音强,它由声波的振动幅度决定。
声音的长短叫音长,它取决于发音时间的长短。
4.说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节(Syllable)。
一个音节可以由一个音素(Phoneme)构成,也可以由几个音素构成。
音素是语音发音的最小单位。
任何语言都有语音的元音(Vowel)和辅音(Consonant)两种音素。
5.元音的另一个重要声学特性是共振峰(Formant)。
共振峰参数是区别不同元音的重要参数,它一般包括共振峰频率(Formant Frequency)的位置和频带宽度(Formant Bandwidth)。
6.区分语音是男声还是女声、是成人声音还是儿童声音,更重要的因素是共振峰频率的高低。
7.浊音的声带振动基本频率称基音周期(或基音频率),F0表示。
8.人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉掩蔽效应。
9.掩蔽效应分为同时掩蔽和短时掩蔽。
10.激励模型:一般分成浊音激励和清音激励。
浊音激励波是一个以基音周期为周期的斜三角脉冲串。
11.声道模型:一是把声道视为由多个等长的不同截面积的管子串联而成的系统。
按此观点推导出的叫“声管模型”。
另一个是把声道视为一个谐振腔,按此推导出的叫“共振峰模型”。
12.完整的语音信号的数字模型可以用三个子模型:激励模型、声道模型和辐射模型的串联来表示。
数字信号处理语音信号处理一、任务要求选择一个语音信号作为分析的对象,或录制一段各人自己的语音信号,对其进行频谱分析;利用MATLAB中的随机函数产生噪声加入到语音信号中,模仿语音信号被污染,并对其进行频谱分析;设计FIR和IIR数字滤波器,并对被噪声污染的语音信号进行滤波,分析滤波后信号的时域和频域特征,回放语音信号。
二、语音信号处理总流程信号的采集语音信号分析含噪信号合成数字滤波器设计滤波结果显示分析图1 语音信号处理总流程三、原始信号采集及频谱分析1语音信号的读入与打开在MATLAB中,[y,fs,bits]=wavread(' E:\dwje.wav ');用于读取语音,采样值放在向量y中,fs表示采样频率(Hz),bits表示采样位数。
可以使用sound(y,fs,bits),用于对声音的回放。
向量y则就代表了一个信号,也即一个复杂的“函数表达式”,也可以说像处理一个信号的表达式一样处理这个声音信号。
2语音信号的频频分析利用fft对语音信号进行快速傅里叶变换,就可以得到信号的频谱特性。
图2 原始信号时域和频域分析对语音信号进行FFT变换就是为了得到它的频域的图形,便于从图中观察出信号的幅度等特性,从图中可以看出语音信号的截止频率为5000Hz。
四、语音信号加噪与频谱分析在Matlab中人为设计一个固定频率6000Hz的余弦序列噪声干扰信号d=[0.05*cos(2*pi*6000*t)]'。
然后将噪声与原始语音信号叠加Y=y+d,叠加两信号的维数必须相同,否则无法叠加。
对噪音信号进行频谱变换得到其频谱图,从图中可以看出干扰信号,在6000Hz频点处有一高峰,其中5500Hz 正是本设计所要利用的。
图3 叠加后信号时域和频域分析五、 设计IIR 滤波器对加噪语音滤波1 利用模拟滤波器设计IIR 数字低通滤波器的设计流程如图4所示:图4 IIR 滤波器设计流程2 滤波器参数选取由图3观察可得,通带截止频率Wp=5000Hz ,阻带截止频率Ws=5500Hz ,确定技术指标技术指标转换:数字到模拟 双线性变换法:W=2/T *tan(w/2)实现模拟滤波器设计将模拟滤波器转换为数字滤波器一般情况下通带最大衰减Rp=0.1,阻带最小衰减Rs=40。
语音信号处理课程综述课程名称语音信号处理任课教师班级姓名学号日期前言语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。
它是一门交叉学科,正逐步成为信息技术中人机接口的关键技术。
语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。
语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
本书(《语音信号处理》(第二版))介绍了语音信号处理的基础、原理、方法和应用,以及该学科领域近年来取得的一些新的研究成果和技术。
全书共分十二章,内容包括:绪论、语音信号处理的基础知识、语音信号的分析技术、语音信号的矢量量化、隐马尔可夫模型技术、神经网络在语音信号处理中的应用、语音编码、语音合成、语音识别、说话人识别和语种辨识技术、语音信号的情感信息处理技术、语音增强技术。
它是在多门学科基础上发展起来的综合性技术,涉及到语音学、语言学、生理学及认知科学、数字信号处理、模式识别和人工智能等许多学科领域。
同时语音信号处理也是目前发展最为迅速的信息科学技术之一,其研究涉及一系列前沿课题。
因此本书的宗旨是在介绍语音信号处理的基础、原理、方法和应用的同时,向学生介绍该学科领域近年来取得的一些新成果、新进展及新技术,例如,语音信号中的情感信息处理、语种辨识技术、实环境下语音信号处理技术等。
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。
语音识别是一门交叉学科。
近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。
人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。
语音识别是一门交叉学科。
语音信号处理复习第二章语音信号处理基础知识1,定义:(1)语音是指人们讲话时发出的话语,它是一种声音,具有声学特征的物理特性。
而它又是一种特殊的声音,是人们进行信息交流的声音,是组成语言的声音。
因此语音是语言和声音的组合体。
(2)语音是由人的发声器官发出的一种声波,它具有音色、音调、音强和音长。
①音色:是一种声音区别于另一种声音的基本特征②音调:指声音的高低,取决于声波的频率③音强:指声音的强弱,取决于声波的振幅④音长:指声音的长短,取决于发音时间的长短(3)任何语言都有语言的元音和辅音两种音素:元音:当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出去时,这些声腔完全开放,气流顺利通过。
一个重要的声学特性是共振峰。
辅音:由于通路的某一部分封闭起来或者受到阻碍,气流被阻不能畅通。
包括清音和浊音。
①浊音:声带振动②清音:声带不振动(4)人的听觉系统有两个重要的特性:①时频分析特性:人的耳蜗就像一个频谱分析仪,将复杂的信号分解成各种频率分量。
②听觉掩蔽效应:心理声学中的听觉掩蔽效应指在一个强信号附近,弱信号将变得不可闻,被掩蔽掉了。
掩蔽效应分为同时掩蔽和短时掩蔽。
2,语言信号生成的数学模型:①激励模型:在声门(声带)以下,称为“声门子系统”,它负责产生激励振动,是激励系统②声道模型:从声门到嘴唇的呼气通道是声道,是声道系统③辐射模型:语音从嘴唇辐射出去,则嘴唇以外是辐射系统3,语音信号的特性分析:(1)语音信号的时域波形和频谱特性:①时域波形:周期性,周期对应声带振动的频率,即基音频率。
②频谱特性:共振峰特性。
元音频谱有明显的几个凸起点,它们出现的频率就是共振峰频率。
清辅音频谱峰点之间的间隔是随机的,没有周期分量。
(2)语谱图:语谱图是一种三维图谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。
语谱图中显示了大量的与语音的语句特性相关的信息,它综合了频谱图和时域波形的特点,明显地显示出语音频谱随时间的变化情况,或者说是一种动态的频谱。
《语音信号处理》课程教学大纲年制订,年修订课程名称:语音信号处理/Speech Signals Processing课程类别:专业选修课开课单位:物理与电子信息工程系开课对象:电子信息科学与技术专业三年级课时:48学时选定教材:《语音信号处理》,赵力编著,机械工业出版社,2003年。
参考书:《数字语音处理》,姚天任编著,华中理工大学出版社,1992年4月。
课程概述:本课程是通信工程专业、电子信息类专业、电气工程及其自动化等专业的任选课。
它是基于信号处理基础之上理论性和应用性较强的专业课程,其任务是:通过本课程的学习,学生掌握语音信号处理的基本原理;通过试验加深学生对语音信号处理方法的认识。
同时向学生介绍该学科领域近年取得的新成果、新发展及新技术,同时培养学生的独立研究和思考的能力教学目的:通过教学使学生: 1.了解语音信号处理基本知识:语音信号的生成的数学模型。
2.掌握语音信号分析的常用方法:语音信号预处理、语音信号时域分析、频域分析、倒谱分析、线形预测分析、基音周期估计、共振峰估计方法。
3.了解隐马尔可夫模型(HMM)、矢量量化基本原理和方法。
4.掌握语音编码的原理、常用方法。
5.了解语音合成、语音识别、语音增强的基本原理与常用方法。
学时分配:各章教学要求及教学要点第一章教学目的:1.了解本课程的性质和任务,理解掌握语音、语音信号处理的基本概念,了解语音信号的发展概况及其应用。
2.理解语音信号处理的基本过程,了解语音信号的特性和语音信号产生的数字模型,了解语音感知的概念;掌握语音信号产生的数字模型,了解人类的听觉系统的特性。
教学内容:一、语音信号处理的发展二、语音信号处理的过程的总体结构三、语音的发声机理和听觉机理四、语音的感知和信号模型第二章教学目的:1.了解语音信号的时域分析的基本概念,理解并掌握语音信号的数字化和预处理过程。
2.理解短时能量分析,短时过零分析和短时相关分析的基本概念,掌握语音信号的能量、过零、相关各种时域分析方法。
“语音信号处理”课程教学改革探索“语音信号处理”是南通大学(以下简称“我校”)电气信息类各专业四年级学生选修的一门专业课程,是研究用数字信号处理技术对语音信号进行处理的一门学科。
原教学计划中该课程总学时数为28(理论教学)+4(实验教学),教材选用机械工业出版社出版,赵力编著的《语音信号处理》(第2版)。
[1]该教材内容主要涉及三部分内容:语音信号处理的一些基础知识、语音信号的各种分析.方法和处理技术以及语音信号处理的各种应用等。
要求学生重点掌握时频域分析.、倒谱分析.、线性预测分析.、矢量量化技术和隐马尔可夫模型等分析.方法,为今后的科研工作和开发工作打下良好基础。
本课程具有很强的理论性和实践性,课程内容多,与前修课关系密切而且要求有比较好的数学基础。
又因为在教学计划中是大四的课程,加上学生对选修课程重视不够且讲授学时较少,大部分学生学习起来比较困难。
[2-5]为了能够在有限的学时内使学生了解和掌握语音信号的各种分析.和处理方法,笔者在授课学时调整、理论教学设计、实验教学环节、科研联系教学等多方面深化教学改革并实施教学实践。
一、改革的思路和内容1.授课学时调整“语音信号处理”这门课在教学计划中是安排在大四的第一学期(前8周完成),之后学生就要开始其毕业设计工作。
毕业设计是学生学习能力和实践能力的综合体现,故在“语音信号处理”课程教学改革中可考虑增加实验学时(占总学时的三分之一左右),让学生有足够的实验机会去实践课程的重要知识点,使其初步掌握应用所学知识来分析.、解决实际问题的能力,从而培养学生的创新精神和实践能力。
2.理论教学设计由于受理论教学课时的限制(占总学时的三分之二左右),“语音信号处理”课程主要讲授教材的前两部分内容。
其中第一部分简要介绍语音信号处理的基础知识,重点讲解基音周期和共振峰的定义以及语音信号数字模型的构成;第二部分重点讲授语音信号的各种分析.和处理技术,包括:时域分析.、频域分析.、倒谱分析.、线性预测分析.、矢量量化技术和隐马尔可夫模型等。