语音信号处理教学大纲

  • 格式:pdf
  • 大小:204.34 KB
  • 文档页数:6

下载文档原格式

  / 6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(三)基本理论
在您所授课程中学生必须掌握的基本理论至少包括: 信号的正交变换理论 优秀学生还应该掌握的基本理论包括: 信号投影算子及最佳正交变换理论 学生至少应该掌握哪些基本理论的推导和证明: 线性预测分析中的Durbin算法 子带编码中最佳子带比特数分配算法 优秀学生还应该掌握哪些基本理论的推导和证明: 变换域编码中最佳正交基的选择算法
四.课程教学基本要求
(一)基本概念
您所授课程中学生必须掌握的基本概念至少包括: 第一章:语音信号的时域及频域特征
辅音、元音(声母与、韵母)语音信号的特点;基音与汉 语四声的关系。语音的过零率,短时能量,自相关函数特 征;语音的共振峰特征及语谱图特征
第二章:语音信号的产生模型—声管模型 声管模型的构成;波动方程的推导;声管传输函数的推 导;声管模型的特点
人耳听觉的“发放率-位置表达”学说和“时间--位置 表达”学说;人耳的听觉特性 第六章:语音信号的波形编码
语音波形的线性量化编码和非线性量化编码;自适应量 化编码;ADPCM编码;子带编码 第七章:语音信号的参数编码 LPC声码器 第八章:语音识别技术
语音识别特征的选择;语音识别模型;DTW语音识别算 法;HMM语音识别模型;
优秀学生还应该掌握的概念包括: 第六章:语音信号的波形编码
最优非线性压扩曲线的求解;正交镜像滤波器组与子带 编码;MPEG-I Layer II音频编码技术;∑-△调制编码技 术 第七章:语音信号的参数编码 多脉冲激励及规则脉冲激励声码器 第八章:语音识别技术
MFCC语音识别特征,HMM模型训练和识别算法
优秀学生还应该进一步掌握的基本理论论证方法包括: 短时付利叶分析理论,小波分析理论,非平稳信号分析方法
您所授课程中注重锻炼学生的哪些基本技能? 理论联系实际,重点在应用理论解释、解决问题。
L.R.Rabiner,
”Fundamentals of
Speech
Recognition”
Prentic-Hall,Inc.
(影印版,清华大学
出版社,1999,8)
J.D. Markel and Jr
A.H.Gray,”Linear
Prediction
of
Speech”,Springer-
Verlag,1976
听课人数:41 □公共基础课
■专业课
教学方式
■讲授为主 专题wenku.baidu.com论为主 □案例教学为主 其它
□实验/实践为主 □
□自学为主

■中文 □ 中文+英课文件(:英■语中授文课 □英文
授课与课件语
>50%)
□中文+英文

□英文 □其他外语
考核方式及 成绩评定标 准
作业成绩40%,期末考试60%
教材及主要参 考书
先修课为:《数字信号处理》,适用于信息学 院等信号与信息处理专业学生
二、课程内容简介(200-400字,双语教学课程须同时提供中 英文内容简介)
本课程对语音信号在时域和频域上的基本特征进行了描 述,介绍了过零率、短时能量、共振峰等概念和非平稳语音信
号分析方法。针对语音的产生模型,本课程对语音的声管模型 进行了较为详细的数学分析,为线性预测技术在语音信号处理 中的应用架起了沟通的桥梁。信号解卷分析是数字信号处理中 非常重要的技术,围绕着参数解卷和非参数解决这两个问题, 本课程重点论述了线性预测技术和同态信号处理技术,并对它 们在语音编码和语音识别中的应用进行了介绍。在语音编码方 面,本课程介绍了波形编码技术中的非线性量化编码技术、自 适应编码技术、子带编码技术、变换域编码技术和以多脉冲激 励线性预测编码技术为代表的参数编码技术。在语音识别技术 方面,课程中介绍了语音识别中常用的识别特征和模板匹配方 法,重点介绍了DTW模板匹配算法和HMM语音识别模型。通过本 课程的学习,学生可以对语音信号处理技术有个较为全面的了 解并掌握其基本技术。
(四)实践环节
您所授课程中学生必须参与的实验环节包括: 课程试验作业 您所授课程中学生必须掌握的数据分析方法包括: 有约束条件下的函数极值求解
优秀学生可以进一步参与和熟悉的实验与数据处理方法包括: 最小均方误差分析、有约束条件下的泛函极值求解
您所授课程中学生必须掌握的理论建模方法包括: 声管模型
优秀学生还应该掌握的理论建模方法包括: HMM模型 您所授课程中学生必须掌握的基本理论论证方法包括: 付利叶分析理论
第三章:语音信号的同态处理技术 同态信号处理的方法;倒谱及复倒谱的特点;求倒谱及复 倒谱的算法;语音信号的倒谱及复倒谱的特点及其应用
第四章:语音信号的线性预测编码技术 LPC分析的基本的概念;LPC正则方程组的自关解法和自
协方差解法;LPC正则方程组的Durbin递推算法;Durbin递 推算法的稳定性证明;LPC分析在语音信号分析中的应用 第五章:人耳的听觉系统
(根据您的经验)历年学生在听课中最不容易理解或很容易搞错 的概念包括:
傅利叶分析技术在非平稳信号分析中的局限性,短时分析技术, 窗函数选择对时频分析的影响和作用,小波分析概念。
(二)基本规律
在您所授课程中学生必须了解掌握的基本规律至少包括: 线性时不变系统的性质 优秀学生还应该掌握的基本规律包括: 线性时不变系统的特征函数及其性质
语音信号处理
一、课程基本情况
课程编 40230132 号
开课单位
电子工程系
课程名 称
中文名称 语音信号处理 英文名称 Speech Signals Processing
课程负责人 教师姓名:肖熙
职称:副研究员
学时学分
讲课学时:32 实验学 学分: 2 时:
课程类型
总学时: 32 □文化素质课
□学科基础课 □专业基础课 □其它
先修要求、适 用院系及专业
中文
外文
教材
杨行峻, 迟惠生 等,《语 音信号数 字处 理》 , 电子工业 出版社, 1995年
Thomas F. Quatieri 著,赵胜辉等译,离 散时间语音信号处 理-原理与应用,电子 工业出版社,2004, 8
主要参考书
姚天 任,“数 字语音处 理”,华 中理工大 学出版 社, 1992,4
三、课程教学大纲(可列多级标题,如设有实验,还须注明各 实验名称、实验目的及主要实验内容)
第一章:语音信号的时域及频域特征(2学时) 第二章:语音信号的产生模型—声管模型(2学时) 第三章:语音信号的同态处理技术(3学时) 第四章:语音信号的线性预测编码技术(4学时) 第五章:人耳的听觉系统(2学时) 第六章:语音信号的波形编码(4学时) 第七章:语音信号的参数编码(4学时) 第八章:语音识别技术(8学时) 第九章:总结(3学时)