语言发声研究及相关领域1
- 格式:doc
- 大小:65.50 KB
- 文档页数:9
《普通话语音与发声》大课教案第一章语音概说【教学目标】:使学生了解语音的性质,准确理解和掌握语音单位的内容【主要教学内容】:1、语音的性质2、语音单位【知识点】:语音的性质及相关概念,音素、音节、元音、辅音、音位等语音单位的概念,汉语拼音方案【重点】:语音单位的内容、基本概念、音节的结构、普通话声韵拼合规律和音节的拼合规律【难点】:音素、音位、音节结构【教学方法】:教师讲授为主【课时】:一、语音1、定义:语音是语言的物质材料,是人的发音器官发出的代表一定意义的声音。
首先,语音是一种声音,如同自然界的其他声音一样,因此它具有物理性质。
其次,语音不是一般的声音,有别于风声、雨声、铃声、琴声等,它是人的发音器官发出的声音,因此它还具有生理性质。
最后,语音不仅是人的发音器官发出的声音,还因是有一定意义的声音,这个“一定意义”是使用该语言的全体社会成员约定俗成的,因此语音还具有社会性质。
语音的社会属性是使语音从根本上与一般声音区别开来的本质属性。
2、语音的性质1)语音的物理性质大凡声音均具有音高、音强、音长和音色四个要素,语音是声音的一种,当然也不例外。
A.音高音高指的是声音的高低,它决定于发音体振动的快慢。
小的、细的、薄的、短的、紧的物体振动快,声音高,而大的、粗的、厚的、长的、松的物体振动慢,声音就低。
这就是为什么女人的声音高而男人的声音低的缘由,前者声带短而薄,后者声带长而厚。
音高是汉语形成声调的基础。
B.音强音强指的是声音的强弱,它决定于发音体振动幅度的大小,而振动的大小有取决于发音时用力的大小。
用力大,振幅大,声音就强;用力小,振幅小,声音就弱。
音强是汉语形成轻声的基础。
C.音长音长指的是声音的长短,它决定于发音体振动时间的久暂。
振动时间持续久,声音就长,振动时间持续短,声音就短。
音长是形成英语中长音、短音的基础,如eat(吃)就读作[i:t],it(它)就读作[it],前者为长音,后者为短音。
绪论单元测试1.普通话以()为基础方言。
A:中原方言B:南方方言C:西南方言D:北方方言答案:D2.朱自清的散文(),因为文字比较口语化,成了喜爱朗诵的人挑选的篇目A:背影B:骆驼祥子C:荷塘月色D:春答案:D3.普通话是北京话。
()A:错B:对答案:A第一章测试1.汉语是世界上最发达的语言之一,是世界上使用人数最多的语言,也是联合国的工作语言之一。
()A:错B:对答案:B2.声调只有四类,四类声调中低音成分多,高音成分少。
()A:对B:错答案:B3.发声是播音员主持人的一项基本功,对节目质量有直接的影响。
声音要凌驾于内容之上。
()A:错B:对答案:A4.普通话中有()个音素。
A:32B:31C:33D:34答案:A5.语言过程即()的过程。
A:编码——传输——发送——接收——解码B:解码——传输——发送——接收C:编码——发送——传输——接收——解码D:解码——发送——传输——接收答案:C6.语音的最小单位是()。
A:音素B:音位C:音节D:音系答案:A7.改革开放后,传播进入新时代,播音员的吐字声产生了新的变化。
我们可以从三个方面来分析这些变化产生的原因()A:播音员主持人和受众的关系变化了B:科学技术的进步,传输设备的革命,接收器材的更新换代,拉近了人与人之间的关系,改变了交际的语言状态。
C:播音员主持人角色定位不同了D:政治因素答案:ACD第二章测试1.“舌面不送气清塞擦音”声母是()A:qB:chC:zhD:j答案:D2.声母音中,只有一个唇齿阻,它是()A:fB:zC:bD:j答案:A3.“唇齿清擦音”声母是( )A:shB:sC:f答案:C4.下列各项中,声母完全相同的有()。
A:藏族B:理论C:梗概D:知己E:辨别答案:ABCE5.下列各项中,两个都是擦音的是()。
A:sh rB:x sC:f cD:q jE:h t答案:AB6.uenɡ只能自成音节,不能前拼声母。
()A:错B:对答案:B7.声母一般是由辅音充当的,因此可以说,声母和辅音基本上是一回事。
发声亮剑发言稿(一)引言概述在这个充满竞争与挑战的时代,发声亮剑成为了我们主持正义、维护权益的重要手段之一。
本发言稿旨在探讨并阐述如何通过发声亮剑来提高自身影响力,塑造正面形象,并有效地传递信息。
正文一、明确目标与定位1. 确定发声亮剑的主要目标,是为了表达观点、争取支持还是激发动力。
2. 根据发声亮剑的目标,明确自身的定位和角色,如专家、倡导者或意见领袖等。
二、准备充分的素材和知识1. 收集并准备足够的素材,包括权威数据、案例分析和相关研究成果等,以支持自己的观点。
2. 深入研究相关领域的知识,提高自身的专业水平,并打下坚实的基础。
三、提高演讲与表达能力1. 注重语言表达的准确性和流畅度,通过读书、学习词汇和语法规则等方式提升自己的语言能力。
2. 注重演讲技巧的培养,如肢体语言、声音控制和节奏感等,以提高演讲的影响力和吸引力。
四、有效利用媒体渠道和社交平台1. 运用媒体渠道,如电视、报纸和广播等,提高发声亮剑的曝光度和影响力。
2. 利用社交媒体平台,如微博、微信和新浪等,与更多的人群交流和互动,扩大自身的影响范围。
五、建立个人品牌和口碑1. 建立和维护个人品牌形象,保持一致的形象和价值观。
2. 通过提供有价值的观点和建设性的批评,树立良好的口碑和声誉。
总结发声亮剑是一项重要的能力和手段,通过明确目标与定位、准备素材与知识、提高表达能力、利用媒体和社交平台以及建立个人品牌和口碑等,我们能够有效地利用发声亮剑来提高自身的影响力,塑造正面形象,并传递信息。
仅当我们不断努力并善加利用发声亮剑的技巧,我们才能够在竞争激烈的社会中脱颖而出,实现自己的目标。
小学的名词解释语言学概论小学的名词解释:语言学概论语言学是一门研究语言的学科,探究语言的结构、语音、语法、词汇和语义等方面的规律。
它是一门综合性的学科,在各个学科领域都有涉及,包括心理学、哲学、文学等。
在小学阶段,语言学概论主要着重于培养学生对于语言的理解和运用能力,以及引导学生探索语言背后的规律和现象。
I. 语言的定义及特点在语言学概论中,首先需要明确语言的定义及其特点。
语言是人类沟通交流的工具,通过声音、文字、手势等方式表达思想、感情和意图。
语言具有以下特点:1. 语言是符号系统:每个语言都有特定的符号组合,用来表示特定的意义。
这些符号包括音素和文字,通过组合形成单词和句子。
2. 语言是人类特有的:虽然动物也可以发出声音来进行交流,但只有人类具备产生和理解复杂语言的能力。
3. 语言具有多样性:世界上存在着众多的语言,每一种语言都有其独特的词汇和语法结构。
4. 语言是动态的:语言不断发展变化,旧词汇的意义可能会改变,新词汇也会不断产生。
II. 语音与音素语言学概论还涉及到语音学,该领域研究语音的产生、传播和感知。
语音由音素组成,音素是语音的最小单位,可以通过音素的组合来构成单词和句子。
1. 声音的产生:人类通过发声器官,如声带、口腔、鼻腔等,产生声音。
声音的特点包括音调、音量、音质等。
2. 音素的分类:音素可以分为元音和辅音,元音由开放的声道产生,如/a/、/e/、/i/等;辅音需要声道有一定的阻塞,如/p/、/k/、/s/等。
III. 词汇与语法词汇和语法是语言学研究的两个重要方面,它们决定着句子的构成和语言的表达能力。
1. 词汇:词汇是构成句子的基本单位,它由单词组成。
单词是一种符号,用来表示特定概念或意义。
2. 语法:语法指的是组织词汇构成合乎语言规则的句子。
语法规则包括词序、时态、语态等。
了解语法规则有助于学生正确运用语言,并避免产生歧义。
IV. 语义与意义语义是语言学的一个重要分支,研究词汇和句子的意义。
下篇播音发声第一单元播音发声概说一、学习播音发声的意义与方法意义:①掌握科学的发声方法,能够使声音对于表情达意具有更强的适应性②学好语言发声艺术,能够增加语言发声的清晰度和感染力③运用语言发声艺术手段,能够有效地改善音质和美化音色④学习语言发声的知识,能够使人懂得嗓音保健的方法方法:明确专用概念,把握整体状态。
主动听音分辨,学会自我判断。
运用感觉记忆,进行反复练习。
积极调动意念,细心体会气感。
找到准确位置,强化发声力点。
二、播音对声音的基本要求播音工作对吐字的要求可以归纳成这么几个内容:“准确、清晰、圆润、集中、流畅、(富于变化)”。
准确,指的是字音准确、规范,也就是字正,这是我们必须做到的。
清晰,指的是字音清晰,这也是播音发音的一大特点。
圆润,说的是要有比较丰富的伴音共鸣、悦耳动听,也就是我们所说的“腔圆”了,这是对吐字的审美要求,是我们播音员节目主持人在播音发声当中所追求的境界。
集中,指的是声音集中。
流畅,流畅是说我们发出的每一个字音、每一个音节都是融汇在语流当中的,听众观众听的不是一个一个单独的音节,而是通过语流来获取信息受到感染,所以要求我们吐字规音必须灵活自如、轻快流畅。
三、发声基础1、发声的生理基础①动力系统——由肺、气管、胸廓以及隔肌、腹肌等器官和相关肌肉组成。
②声源系统——主要指喉和声带。
③成音系统——即共鸣系统,声道在喉以上主要有喉腔、咽腔、口腔与鼻腔;喉以下有胸腔。
2、发声的物理基础①音高:指声音的高低,决定于声波的频率。
②音强:指声音的强弱,是由声波的振动幅度大小决定的。
③音长:指声音的长短,他取决于发声体振动的持续时间。
④音色:指声音的特色和本质。
音色决定于声波的含量。
不同音色产生的因素主要有:①发音体的不同②发音方法不同③共鸣器形状不同3、发声的心理基础播音发声不同于一般的言语发声过程,它涉及到听觉机制产生的一系列信息在神经、大脑中的反应和感知,这是发声的心理基础四、播音发声的特点播音发声的特点是,以实声为主的虚实结合,声音清晰圆润;声音变化幅度不大,但层次丰富,表情达意准确;接近口语用声,状态自如,声音流畅。
语言发声研究及相关领域1孔江平中国社会科学院民族研究所摘要本文从语音学嗓音发声类型研究的角度,介绍了语言发声类型的一些基本概念,并在此基础上讨论了语言发声类型基础研究的各个方面和相关的领域.嗓音研究的信号有语音声学信号,声门阻抗信号和高速数字图像信号.研究的方法包括语音学研究,多维嗓音研究,声门阻抗信号研究,嗓音的小波变换研究,声门高速成像的研究和语音合成研究等.在学科上涉及语音学,言语声学,嗓音生理学和言语工程等.文章包括以下十一个方面:1)嗓音发声类型的语音学研究;2)多维嗓音分析;3)声门阻抗信号与声带振动;4)信号类型与基频提取;5)基于高速数字成像动态声门研究;6)基于高速数字成像的动态声门模型;7)基于高速数字成像的嗓音病理研究;8)基于小波变换的嗓音研究;9)嗓音的变换;10)语音合成研究;11)其它.这些基础研究对语音学,言语声学,嗓音医学,言语工程以及声纹鉴定和声乐等研究都具有十分重要的意义.1 嗓音发声类型的语音学研究言语的产生大致可以分为两部分,一部分是"声源",语音学称为"发声",另一部分是"共鸣",语音学称为"调音".语言发声类型是指声带以不同的振动方式所产生的具有不同性质的声源.对于不同的学科嗓音发声类型的定义也不完全相同,语音学定义的原则是看其是否具有语言学意义,言语声学主要是根据声学特性的差异,而嗓音医学主要是根据感知的评价结果,但无论哪个学科大家都一致认为声学参数是最终量化语言嗓音发声类型的基本依据.常见的发声类型有:1)正常嗓音;2)高音调嗓音;3)低音调嗓音;4)假声;5)气泡音;6)气嗓音;7)吸气音;8)紧嗓音;9)双周期嗓音;10)耳语等.现有语音学理论对元音的定义基本上是从调音上来定义的,如舌位最高点的位置,开口度的大小和圆展唇等,并没有涉及到嗓音发声类型.然而,不同的发声类型在我国的许多民族语言中相当普遍,如果仅用现有元音的定义远远不能满足我国民族语言的现实,根据我们对嗓音发声类型的研究,元音有两种不同的音色(quality),一种是由调音产生的音色称为"调音音色" (articulation quality),另一种是由发声产生的音色称为"发声音色" (phonation quality).如,景颇语/ka31/和/ka31/两音节的共振峰没有本质的差别,从调音的角度看,其音色是相同的,但发声音色却不相同.在对我国不同民族语言发声类型的研究中,可以发现有三种不同的元音音色:1)调音音色不同发声音色相同.2)发声音色不同调音音色相同.3)调音音色和发声音色都不同.从我国不同语言嗓音的声学分析和研究可以看出,许多发声类型具有超音段的性质,具体地讲是"音节性".目前对声调的定义仅限于音调的高低和音调不同的模式,音调的高低在生理上对应于声带振动的快慢,在声学上对应于基频的大小.因此,可以明确地看出,声调应该属于发声的研究范畴.如,景颇语/tom31/和/tom31/两音节中的声调,其基频曲线没有本质的差异,由于发声类型具有音节性,因此,我们也可以将其定义为调质的不同,从而引出"调质"(tone quality)的概念.根据调质的概念,可以进一步将声调分解成"调时" 与"调声",调时是指肌肉对声带振动快慢的调制,而调声是指肌肉对声带振动方式的调制.前者在声学上对应于嗓音发声类型的时域特征,而后者对应于嗓音发声类型的频率域特1 限于版面,参考文献在文中引用不再标明.2征.对于调时大家都比较熟悉,也就是我们常说的基频的高低和由基频曲线组成的模式.对于调声一般人们不太了解,怎样用一个比较直观又准确的方法来表征声调调声的模式是很值得研究的课题.在以往的研究中,我们通常采用开商(open quotient)和速度商(speed quotient)来反映声调调质的变化情况.在言语声学和言语工程中,可以用其它的模型来表征调质的变化,如方特的 LF-模型(Fant, 1985)等.从嗓音发声类型研究的角度来看声调, 我们不难发现现有声调的定义很不准确也很不完全.不同的民族在发音器官上没有太大的差别,但由于语言不同,他们使用发音器官的部位有很大的不同.在调音方面,每种语言的音位系统都不相同,发声也是如此,嗓音的使用也不尽相同.怎样表征不同语言的发声也是语言学和言语声学研究的一项基本内容.如,藏语和彝语的开商男女之间都有较大的差别,但蒙古语的开商男女之间完全没有差别.2 多维嗓音分析多维嗓音分析是从语音信号,EGG 信号或其它语言信号中提取多项参数,然后对这些参数进行综合分析.多维嗓音分析主要用于嗓音病变的研究.在语音学上,可以用来量化不同的发声类型,但样本要足够长的持续元音.在言语工程上,目前用的还不多,它可以用来量化不同人的嗓音,其中有些参数对建立模型十分有用.常用的多维嗓音分析参数有六类 33 项2.基音类:1)平均基频;2)平均音调周期;3)最高基频;4)最低基频;5)F0 标准偏差;6)半调发声 F0 范围.频率抖动类:7)F0 抖动频率;8)振帽抖动频率;9)分析样本时长;l0)绝对频率抖动;11)频率抖动百分比;12)相对平均扰动;13)音调扰动商;14)平滑音调扰动商;15)基频变化率.振幅抖动类:16)振幅抖动;17)振幅抖动百分比;18)振幅扰动商;19)平滑振幅扰动商;20)峰振幅变化率.嗓音指数类:21)清浊率;22)嗓音骚动;23)软发声指数;24)F0 抖动强指数;25)振幅抖动强度指数.嗓音清化类:26)嗓音破裂级;27)次和谐级;28)清声级;29)嗓音破裂数;30)次和谐音段数;31)非浊音段数.基本类:32)计算音段数;33)总测定音调周期.在多维嗓音分析中,对得到的参数通常采用统计的分析方法,这是因为多维嗓音分析的参数主要是平均数据.利用多维嗓音分析不仅可以用来研究语言的嗓音特性,而且在许多工程技术和医学领域都有广泛的实用价值.从算法上看,多维嗓音分析对语音质量的要求很高.它包括两个方面:1)采样频率要达到 50k/秒;2)信噪比要在 70dB 以上.满足了这两条才会有较好的结果.从国际上发表的论文看,多维嗓音分析主要用于病变嗓音的研究.从参数的定义可以看出,提取多维嗓音参数要用持续元音才能得到较稳定的参数,如果分析样本是自然语流,就需要很大的量才能得到稳定的参数.虽然多维嗓音分析在研究嗓音特性时有很大的难度,但通过一些具体的研究,我们认为还是可以用来研究正常的嗓音发声特性及其多维嗓音各参数之间的关系.例如,研究发现, 随着基频的提高,频率抖动慢慢降低.另外,随着基频的提高,振幅抖动体现出较为复杂的情况.研究表明,多维嗓音参数之间,有的关系比较简单,而有的关系却很复杂,因此,多维嗓音分析还需要进行大量的样本分析和参数提取算法的研究.3 声门阻抗信号与声带振动声门阻抗信号和声门面积函数是两种不同的信号,但都可以从不同的方面反映声带的发声方式,通过对这两种信号的对比,可以看出它们各自的特点.下面例举了正常嗓音,高音调嗓音和低音调嗓音三种情况来研究它们的不同.正常嗓音是语言使用的主要嗓音,它的发声方式主要体现为音调不是很高也不是很低,开商在 50 左右,声门的开合比较清楚.通过比较从高速数字图像得到的声门面积函数和通过喉头仪得到的声门阻抗信号可以看出,声门阻抗信号和声门面积函数都能较好地反映声带的开点和声带的关闭点.声门的关闭点可以用来标记语音声学信号的声门周期.另外,这两2 见KAY公司的多维嗓音分析选件使用手册.3种信号一个可以反映开相声门面积的变化,另一个可以反映声带接触面积的变化.高音调嗓音也会出现在语言中,但往往在一些特殊的情况下,如惊呼,高声叫喊等.另外,在声乐中也常常用到高音调嗓音.女声的高音调嗓音的声带在振动过程中,从来没有完全关闭过,声门面积函数接近于正弦波.从声门阻抗信号看,其形状也象正弦波,只是位置与声门面积函数不同.从声带的接触点基本上可以标记语音声学信号的周期,但它们显然不能标记声门的关闭点和打开点,因为从来没有真正关闭过.低音调嗓音是语言交际中常用的发声类型,特别是在声调语言的低调部分.比较典型的低音调嗓音是气泡音,如成年男声在汉语普通话的上声中的最低部分,往往是气泡音.从声门阻抗信号算出的声带接触点和声带打开点,可以比较准确地反映声门的开合,也能比较准确地标记语音声学信号的周期.以上三个例子是嗓音发声类型中最普通的情况,在我们的研究和观测中发现声门阻抗信号在许多情况下不能完全准确地反映声门和语音声学信号的周期.4 信号类型与基频提取基频是语言信号处理中经常涉及的一个重要声学参数,也有很多提取的方法,但大家知道基频仍然是一个很难准确提取的参数,这里讨论一下不同信号在反映声带振动周期时的不同情况.从声带振动的高速图像研究中,我们知道声门面积函数反映出来的声门脉冲有许多不同的类型,这些类型主要有:1)单脉冲;2)双脉冲;3)三脉冲等.反映在周期上也可以有不同的类型:1)单脉冲无关闭段周期;2)单脉冲周期;3)双脉冲周期;4)三脉冲周期等.由于声门面积脉冲类型的不同,同一段信号,计算的方法不同得出的基频会相差很大. 具体地说基频是按每个脉冲来计算还是按脉冲类型的周期计算.由于声门面积函数能够比较精确地反映声带振动的情况,因此,声门面积函数的脉冲类型可以较好地反映出来.对比声门阻抗信号和语音声学信号可以看出,这三种信号在反映声带振动方面有一定的差距.总的来说,声门面积函数反映声带的周期最为准确,其次是声门阻抗信号,最后是语音声学信号.在不同的发声类型中,由于前后的影响,声带的一次开合,不一定能反映在语音声学信号上,因此,从信号类型上可以分为:1)声门面积函数的基频;2)声门阻抗信号的基频和 3)语音声学信号的基频,对于同一个发音它们并不完全相同.由于不同发声类型声带振动的复杂性和不同信号在反映声带振动时的差异,计算基频时也应采用不同的算法和定义,这就是为什么采用一种算法很难满足所有语音信号基频的提取.在我们还没有完全认识各种嗓音发声类型的特性之前和在我们还没有给基频一个明确的定义之前,很难给出一种能适应所有语音基频提取的算法.5 基于高速数字成像的动态声门研究由于技术的发展,利用高速数字成像已经可以拍下声带振动的全过程,这为我们研究声带的振动成为可能,目前一些发达国家已经开始了这方面的研究.利用高速数字成像研究发声,首先是拍下声带振动的过程,然后进行图像处理提取出参数,最后对参数进行研究或建立模型.本文涉及的高速数字图像的采样频率为 4500 帧/秒,256×256 像素.提取的普通参数有24个,统计参数有10个.基本参数:1)最大声门面积位置;2)绝对声门长度;3)绝对声门宽度;4)最大声门面积中心行坐标;5)最大声门面积中心列坐标;6)声门形状比.声门面积参数:7)声门面积;8)左声门面积;9)右声门面积;10)前声门面积;11)后声门面积.声门长宽参数:12)声门面积长度;13)声门面积宽度;14)前声门面积长度;15)后声门面积长度;16)左声门面积可宽度;17)右声门面积宽度.声门面积函数参数:18)声门面积函数周期;19)声门面积函数基频;20)声门面积函数开相;21)声门面积函数闭相;22)声门面积函数开商;23)声门面积函数速度商;24)支流分量.统计参数:1)平均基频;2)平均开商;3)平均速度商;4)平均直流分量;5)平均声门形状比;6)动态声门对称指数;47)声门面积左右平衡指数;8)声门面积前后平衡指数;9)声门左右摆动指数;10)声门前后摆动指数.本节简单讨论以下不同嗓音的性质:1)正常嗓音是人们在进行语言交际是最常用的嗓音,其基频在人们的嗓音范围内居中,对于对于说普通话的人来说,其基频大约为 228Hz, 开商大约为 55,速度商为 244.随着音调的降低开商也降低,而速度商逐渐提高.随着音调的提高开商增大,而速度商降低.随着音调的提高还会出现漏气的情况.2)气嗓音最主要的特征就是声带在振动过程中,靠近勺状软骨地方声带无法完全闭合,出现漏气现象.在声学上声带漏气会造成很大的支流分量,声带的关闭段也会延长,在声源脉冲上,延长了从断点到关闭点的距离,这会使声源在频率域形成一个低通,从而加强了低频的分量,特别是第一谐波的能量.3)气泡音的主要特征是基频特别低,因此开商很小,接触商很大,速度商也很大.气泡音的另一个特点是在时域上有三种情况:一是有规则变化,二是基频不规则变化,三是声门脉冲多样化,如,气泡音会出现单脉冲,双脉冲和三脉冲.4)假声的特点是基频特别的高,声带振动时不能完全关闭,因此有很大的支流分量.假声只有开相没有闭相,速度商在 100 左右,假声的声门脉冲形状接近于正弦波,因而低频分量很大,高频能量衰减的很快.在声带振动时高速气流会使左右声带出现局部不对称形成噪音.5)吸气音的特点是声带振动时勺状软骨向两边裂开,只有声带前端振动,因此其声学特征表现为很大的支流分量,只有开相没有闭相,声源中有噪音,高频能量很低,低频能量很大,其声门脉冲形状接近于正弦波.6)紧嗓音的特征是开商较小,接触商较大,声带只有一部分参加振动,紧嗓音的速度商很大,因而高频能量很高,第二谐波的能量大于第一谐波.声带很紧时基频会出现不规则现象和产生噪音.7)在耳语时声带大部分是关闭的,只有一部分是打开,当气流通过时产生噪音声源,其频谱特性会随着开口度的大小变化.虽然我们很难听到基频,但实际上在讲耳语时有时声带的边缘还会有周期性的振动,只不过它的能量较弱很难感知出来.8)双周期嗓音可以认为是一种较典型的非正常嗓音,其生理特征表现为声带振动中出现不对称振动,声带在振动时也不接触.在声学上基频出现大周期和小周期,同时伴有噪音.9)人造喉是在喉头切除后用于发声的装置,这种装置可以产生声源,在听感上可以感知到基频,但总的来说其物理特性和自然声带的声源相比相差甚远.首先声源的噪音很大,其次声源的脉冲象单脉冲,高频能量很强,而低频的能量很弱.10)生理上男女声带的差别是男声的声带厚长,也比较宽大.女声的声带薄短,也比较窄.反映在声学上,语言不同声学性质差别是很大的,这使因为语言不同所用的发声方式也不同,它说明语言发声类型的民族性很强.首先是男声的基频较低,女声的基频较高,基频的这一特性对所有的语言是共有的.开商和速度商在不同语言中差别很大,要根据语种来定,对于汉语普通话来说,男声的开商和速度商都大于女声.因而在声学上男声的高频能量高于女声,女声声源的高频衰减的较快.另外,由于女声的声带在振动是大多漏气,所以带有噪声.6 基于高速数字成像的动态声门模型基于高速数字图像可以得到许多有关动态声门的参数,它们反映了声带振动的过程和许多细节,可用于研究不同发声类型的生理机制以及和声波之间的关系,最终这些研究可以用来建立一个动态声门的生理模型,利用这个生理模型可以模拟各种不同发声类型声带振动的机制以及动态声门和言语声学信号之间的关系.生理模型有三种模式:1)正常声门模式;2)漏气声门模式;3)敞开声门模式.下面以正常声门模式为例简单进行一些介绍.模拟静态声门的参数有左右声门宽度和前后声门长度 4 个参数,声门面积由 4 个 1/4 椭圆来定义.动态声门由 4 个控制函数来控制,每个控制函数由两个基本函数产生.4 个控制参数根据需要可以任意设定,每个周期的 4 个函数都可以不同,而且 4 左右声门的周期也可以不同,因此不仅可以模拟各种不同的发声类型,也可以模拟病变的嗓音.采用 LPC 的方法,可将合成的嗓音进一步合成为语音.具体做法是:1)选一段语音信号提取出 LPC 系数;2)进行逆滤波提取出嗓音声源信号;3)根据嗓音声源信号合成出新的嗓音声源信号;4)利用合成的声源信号和LPC系数合成出语音.57 基于高速数字成像的嗓音病理研究从前面的介绍可以看出,利用高速数字成像技术可以用来研究声带振动和其它信号之间的关系,如,语音信号,喉头仪信号,声压信号,气流信号等,从而使我们能从这些信号上判断出声带振动的方式,这对声带病变的诊断十分重要.利用高速数字成像技术可以提取出声门面积函数,左右声门面积函数,前后声门面积函数等一系列参数,这些参数基本可以反映声带振动的方式,通过这些参数和其它参数的比较可以看出声带振动和其它参数之间的关系,在此使用了声门阻抗信号和声源信号做对比.研究表明嗓音的不正常是由声带振动的左右不对称造成的,这种不对称造成的直接结果是语音信号产生小周期和大周期,我们将其定义为"声门周期(glottal period)"和"超周期(supra-glottal period)".在了解了声带振动和语音信号之间的关系后,就有可能从语音等信号计算出声带振动的方式并进行量化. 嗓音的不对称可用根据以下定义来粗略计算,既短声带振动周期等于超周期除以长声带振动周期加一.利用这种方法可将左右声带振动的情况分解出来.8 基于小波变换的嗓音研究利用小波变换可以分析和提取嗓音的许多特征,本文采用二阶小波变换(dyadicwavelet transformation),本系统主要有以下功能:1)小波变换;2)检测小波系数的局部最大值;3)编辑修改小波系数;4)由局部最大值循环预测小波系数;5)由小波系数合成语音.利用小波变换可以提取基频,具体过程是:1)进行小波变换,一般需要 4-5 层的变换.2)测出局部最大值.3)通过计算每一层小波系数局部最大值振幅和位置的相关来确定基频.其优点在于:1)能较准确地检测不规则和变化较快的基频.2)能较好地测定声门关闭的位置.另外,在小波域可以根据需要对频率域的特征进行修改,从而达到改变频率域特征的目的.具体的步骤是:1)进行小波变换.2)检测出小波系数的局部最大值.3)检测出周期.4)对每一层,每个周期内的小波系数进行修改.5)有小波系数的局部最大值预测出连续的小波系数.6)最终合成语音.在小波域也可以根据需要对时域的特征进行修改,从而达到改变时域特征的目的.具体的步骤基本同上,不同的是在第四步修改小波系数时不是改变局部最大值的能量,而是改变周期的长度,小波系数局部最大值的相对位置并不改变,如果改变了小波系数局部最大值的位置,共振峰结构就会发生变化.目前直接从一段语音的小波系数上测出声源还有一定的困难,但可以用一种妥协的办法,既先提取出线性预测系数和进行逆滤波得到残差,在残差上利用小波变换的方法,去掉剩余的共鸣特征,最终提取出声源信号.研究表明,残差的小波系数中具有残留的共鸣特征和声源特征,而低通信号中保留着大部分的声源特性,根据需要对小波系数和低通进行调整,可以达到改变声源特性的目的.9 嗓音的变换在第五节讨论了嗓音发声类型的性质,在了解了各种嗓音的特性后,可以对不同的语音进行嗓音的变换.不同嗓音的变换在言语工程上有其重要的意义.这里以耳语变换正常嗓音为例简单介绍以下嗓音的变换.耳语有时存在基频,但感知不到其存在,而在语流中往往较难测出规则的基频,因此变换固有的基频使之能被感知出来比较困难,另外,即使测出和增强固有基频,其开商和速度商也和正常嗓音相差很远.这里采用了线性预测的方法来进行变换.具体做法是首先算出线性预测系数,然后将耳语的声源删除换上一个正常嗓音的声源,从而达到变换嗓音的目的.显然利用这种方法将耳语变换为正常嗓音的难点在于是否有一个好的嗓音模型.另外,对于汉语这样的声调语言,怎样从耳语中测出正确的声调也需要进一步的研究.但耳语到正常嗓音的变换会在移动电话上有广泛的用途.610 语音合成与声源在当今信息高速发展的社会,语音合成技术作为一种语言信息的再现方式正逐渐被应用在社会的各个方面,因此语音合成技术的研究具有十分重要的意义.目前合成技术主要有两个方面:一是共振峰参数合成;二是语音波形拼接.前者数据量小灵活,但目前合成的自然度还不够高.后者数据量大不够灵活,但自然度较好.然而从嗓音研究的角度看,这两种合成方式的嗓音都有改进的余地.共振峰语音合成的自然度可以从两个方面来提高:一是共振峰参数的提取;二是嗓音模型的改进.前者可以通过人工修改共振峰的频率和带宽,然后进行逆滤波和频谱分析,最终确定共振峰的合成参数.另一种方式是通过自适应的 LPC 方式提取最终用于合成的共振峰参数.对于后者主要是要改进嗓音模型的自然度,如频率抖动和振幅抖动.现有的以波形拼接方式进行合成的系统已能合成出较自然的语音,对合成出来的语音进行嗓音变化可以改变说话人的语音特征.从以上的研究可知,嗓音特征分为时域特征和频率域特征,时域特征称为"调时",频率域特征称为"调声".调时的方法较多,计算起来也较简单,如,用线性预测和基音同步迭加法,可方便地改变抖动和合成不规则的基频.在语音上进行调声相对困难一些.如果只是改变频率域不同频段的能量可以在小波域很容易地实现,然而这种改变并不能改变嗓音的开商和速度商,如果能从小波系数中将共振峰和声源分开,在波形上改变语音特征就会变的简单了,这方面还需要做进一步的研究.11 其它嗓音发声类型的基础研究涉及到语音学,言语声学和生理学等学科,其研究结果能应用到和言语信息有关的不同领域,除了本文所介绍的内容,还可以应用在其它的领域,如,语言教学研究,声纹鉴定的研究,不同声乐唱法的嗓音研究等,因此可以认为嗓音发声类型的基础研究对言语信息的研究和应用有十分重要的意义.参考文献[1]方特.G,高奋.J,(1994),言语科学与言语技术,商务印书馆,北京.[2]孔江平(1997),"凉山彝语松紧元音的声学研究",《彝缅语研究》,四川人民出版社,1997年六月.[3]孔江平(1993),"苗语浊送气的声学研究",《民族语文》,1993年,第1期.[4]孔江平(1996),"哈尼语发声类型声学研究及音质概念的",《民族语文》,1993年, 第1期 .[5]孔江平:"汉语普通话嗓音抖动及波动的声学研究",《信号处理的理论与应用(第八届全国语音,图像,通讯信号处理学会议文选)》",(SICS'97),1997年10月,郑州.[6]孔江平:"汉语普通话嗓音特征相关分析",《中国声学学会 1995 年青年学术会议论文集》,1995 年 10月,西北工业大学出版社.[7]孔江平:"汉语普通话嗓音抖动及波动的声学研究",《信号处理的理论与应用(第八届全国语音,图像,通讯信号处理学会议文选)》",(SICS'97),1997年10月,郑州.[8]William J. Hardcastle, 1999. The Handbook of Phonetic Sciences, edited by William。