汉语普通话双音子和三音子结构系统以及相关语料库的设计
- 格式:doc
- 大小:41.00 KB
- 文档页数:5
中国结构语言学一、音系学研究音系学是研究语言中音的系统及其结构的学科。
在中国结构语言学中,音系学研究主要关注语言的发音、音素、音节、声调等方面的研究。
通过对汉语的音节和声调进行分析,可以揭示汉语语音的特性和规律,进一步理解汉语的语音结构和演变。
二、句法学研究句法学是研究语言的句子结构和语法规则的学科。
在中国结构语言学中,句法学研究主要关注语言的词法、句法、时态、语态等方面的研究。
通过对汉语的句子结构进行分析,可以揭示汉语的语法特性和规律,进一步理解汉语的语法结构和演变。
三、语义学研究语义学是研究语言的意义和理解的学科。
在中国结构语言学中,语义学研究主要关注语言的词汇意义、语境意义、比喻意义等方面的研究。
通过对汉语的词汇和句子意义进行分析,可以揭示汉语语义的特性和规律,进一步理解汉语的意义表达和演变。
四、语用学研究语用学是研究语言的使用和理解与语境关系的学科。
在中国结构语言学中,语用学研究主要关注语言的交际功能、话语分析、语言与文化等方面的研究。
通过对汉语的使用场景和语境进行分析,可以揭示汉语语用的特性和规律,进一步理解汉语的使用方式和演变。
五、社会语言学研究社会语言学是研究语言与社会关系的学科。
在中国结构语言学中,社会语言学研究主要关注语言的社区差异、方言、语言与身份等方面的研究。
通过对汉语在不同社区和方言中的使用进行分析,可以揭示汉语社会语言的特性和规律,进一步理解汉语的社会属性和演变。
六、历史语言学研究历史语言学是研究语言的历史发展和演变的学科。
在中国结构语言学中,历史语言学研究主要关注汉语的历史语音、语法、词汇等方面的研究。
通过对汉语的历史演变进行分析,可以揭示汉语历史语言的特性和规律,进一步理解汉语的历史属性和演变。
七、方言学研究方言学是研究方言的形成、分类、特征和变化的学科。
在中国结构语言学中,方言学研究主要关注汉语的各种方言的语音、词汇、语法等方面的研究。
通过对汉语的不同方言进行分析,可以揭示汉语方言的特性和规律,进一步理解汉语方言的特点和演变。
汉语拼音《z c s》优秀教学设计+教学反思设计说明根据一年级学生的认知规律和学习需要,汉语拼音教学要尽可能有趣味,教学宜以活动和游戏为主,以唤起学生学习拼音的兴趣。
所以本课教学设计意在为学生创设一个生活化的课堂,通过情境感染、游戏活动、创编儿歌、多种形式朗读等教学方式引导学生在语言实践中轻松愉快地学习拼音。
将学拼音与识字、读文有机结合起来,从而提高学生的综合能力,最终使学生达到学会声母z、c、s,会读整体认读音节zi、ci、si,以及读儿歌、学生字的目的。
课前准备1.关于本课的多媒体课件、以前学过的声母和韵母的卡片、zcs的拼音卡片、整体认读音节zi、ci、si的卡片。
(教师)2.萝卜形状的带调整体认读音节卡片。
(教师)3.生字和词语卡片。
(学生)课时安排2课时。
教学过程第一课时一、创设情境,导入新课1.教师逐个出示字母卡片,引导学生复习学过的声母和韵母。
(教师根据学生的回答出示相应的字母卡片。
)2.创设情境,引出新课:今天,是拼音宝宝小i的生日,我们一起为小i唱《生日歌》好吗?(课件出示:卡通的韵母i,面前放着一个点燃蜡烛的蛋糕。
)小i有一个愿望,它希望大家帮它邀请三位新的拼音朋友来参加它的生日会,大家愿意帮忙吗?3.出示z、c、s的拼音卡片,揭示教学内容:这就是我们今天要邀请的三位拼音宝宝,在邀请它们之前我们先来认识一下它们。
设计意图:创设学生喜欢的过生日的情境,吸引学生的注意力,让学生在为小i找三位新朋友,并邀请新朋友来参加生日会的过程中快乐轻松地学习,激发了学生的学习兴趣。
同时,使学生明确了本节课的学习任务,带着任务去学习。
二、图文结合,学习声母及整体认读音节(一)学习声母z和整体认读音节zi。
1.过渡:现在,我们就出发,去结识我们的新朋友吧!2.学习声母z。
(1)课件出示文中的插图。
引导学生观察,这是什么地方?谁在做什么?(2)教师出示z的卡片,引导学生发现z就是今天要邀请的第一个声母宝宝。
2011秋双语汉语言本科《汉语普通话语音教程》课程教学一体化设计一、课程总体说明1.课程性质及特点《汉语普通话语音教程》是一门集理论与实践教学为一体的综合课。
本教材作为新疆地区汉语教师语音教学培训的基础教材,系统、简要地介绍了汉语语音作为第二语言教学的理论与基础知识以及一些教学方法。
为了配合汉语教师和学员联练习标准普通话的发音和语调,本教材专门编写了大量实践练习题。
2、本教材的特点(一)它是一本适应不同程度、不同学习时间、不同要求的开放式教材。
既可以供汉语教师培训使用,也可以作为新疆地区大专院校汉语教师备课、学员自主学习使用。
(二)本教材主要通过对新疆维吾尔族和哈族学生学习汉语语音中出现的问题进行分析,有针对性地指出了纠音正调的方法。
(三)本教材包括五个部分内容和四个附录。
3、学时学分课内面授学时为72学时,本课程4学分。
开设一学期。
4、课程教学及要求语音教学是汉语作为第二语言教学的基础,是掌握汉语听、说、读、写技能和交际能力的前提。
《汉语普通话语音教程》要求从一开始就给学生打下扎实的语音基础。
第一、应该掌握汉语拼音方案。
为打好语音基础,认识和读准汉语拼音,要从系统的普通话语音训练出发,把普通话的发音教学内容(声母、韵母、声调、轻声、儿化韵等)及语调教学内容(词、句重音、音长、节拍、句调等)有计划、有目的、有序地贯穿在练习之中,使学生受到系统的基本功训练。
第二,为发准一个音、一个声调,用标准语调说好一句话,还需要一定机械练习,而且从不同角度进行大量的重复练习。
第三,要在教师的指导下通过课内外大量的模仿、练习和纠音正调,日积月累,不断实践,掌握汉语话的标准发音。
第四,语言教学还必须贯穿汉语教学的始终。
5、教学手段及方式①文字教材。
使用北京语言大学副刘广徽教授编著的《汉语普通话语音教程》新疆版一书。
②直播课堂。
组织学员收看新疆电大制作的电视直播课。
③指导学生进行网上学习。
要求学员根据情况及时上网寻找有关该课程的课件。
数量结构合音词“俩”、“仨”的几个问题——兼评赵元任
先生的“失音”说
冯春田
【期刊名称】《语言研究》
【年(卷),期】2002()2
【摘要】本文讨论的问题是:数量结构合音词“俩”、“仨”早期的用法及其词音和字形问题;“俩”、“仨”分别是先由“两个”、“三个”发生连说音变,尔后形成合音式;赵元任先生关于“数+个”结构连说音变的分析现在看来仍有其合理性,但他对于“数+个”结构中“个”的连说变音形式以及“俩”、“仨”形成的意见,都值得重加检讨。
【总页数】7页(P38-44)
【关键词】“俩”;“仨”;用法形成
【作者】冯春田
【作者单位】山东大学
【正文语种】中文
【中图分类】H146
【相关文献】
1.赵元任:教我如何不想他——兼访赵元任先生故里常州青果巷 [J], 石湾
2.也谈北京话的“俩”、“仨”——为纪念恩师孟非先生逝世五周年而作 [J], 马
克章;
3.也谈北京话的“俩”、“仨”——为纪念恩师孟非先生逝世五周年而作 [J], 马克章
4.河北辛集话的合音现象与合音词——兼谈普通话合音词“俩”“仨”“别”的来源 [J], 孔祥卿;
5.中原官话的人称代词类合音词——兼论"您""俺"非合音词 [J], 孙瑞隆
因版权原因,仅展示原文概要,查看原文内容请购买。
谈汉语词汇的双音节化和对外汉语教学作者:虞佳来源:《语文学刊》 2014年第5期○ 虞佳(湖南师范大学文学院,湖南长沙410000)[摘要]汉语词汇从古到今发展的趋势是双音化。
从西周开始就有了双音节词的出现,之后随着社会的发展,多音节词汇开始增多,而且占了总词汇的大多数。
元明清时期,双音节词汇已成为汉语词汇的主流。
本文先对汉语词汇双音化的原因做以阐述,然后指出汉语词汇双音化的研究对对外汉语词汇教学的重要作用。
[关键词]对外汉语教学;词汇;双音节词;双音化[中图分类号]H193[文献标识码]A[文章编号]1672-8610(2014)05-0102-02汉语词汇从古到今数量巨大,从西周开始就有双音节词,但那时还是以单音节词为主。
在西周时期的一些著作中,如《尚书·周书》、《诗经》里的《周颂》、《大雅》、《小雅》中都有双音节词的出现。
之后随着社会的发展,多音节词汇开始增多,其中双音节词占大多数。
为什么在奴隶社会人们的词汇会以单音节为主,而后来多音节词汇越来越多了?这与社会的发展是紧密联系的。
在古老的奴隶社会,社会生产力落后,人们所见的东西不多,单音节词足够他们用了,而且在那时一个单音节词有很多的意思。
如“发”这个词,在古代汉语中就有将近16种含义,可以是名词也可以是动词,这样意思就复杂了,于是需要各种词语的组合,使这些意思不混淆,反而更加清晰、明确。
随着社会生产力的发展,人们觉得原来的那些单音节已不足以表达他们的思想、生活,于是将有的单音节词结合,或者另造多音节词,这样就出现了大量的多音节词,在这些多音节词中双音节词居多。
到元明清时,双音节词大量增加。
据统计,《水浒传》中的多音词占70%,而单音节词占30%;《西游记》中共有80多万字,其中双音节词就有10 991个,多音节词(不包括双音节词)有1 182个。
可见,那时的复音词(绝大部分为双音节)数量已远远超过单音节词。
至此,双音节词已成为汉语词汇的主流。
语言的层级体系
语言中的各种单位相互间紧密联系,彼此依存,组成一个系统。
语言的底层是音位,上层是音义结合的符号与符号的序列。
上层又分为三级,第一级是语素,第二级是词,第三级是句子。
语言结构就是由音位层和音义结合的符号序列层构成的装置,我们称之为语言结构的二层性(定义-核心-展开)。
无论是底层还是上层,我们都能看到,语言结构二层性的核心实际上是以少驭多,以较少的单位组成上一层较多的单位,如语言结构上层的三级在数量上就是增量翻番,由下一级组成上一级,数量成倍扩大。
例如汉语,音位层只有30来个,它们可以组成数千个语素,语素又可以组成数十万条词,词又组成无穷无尽的句子。
语言就是各个单位在不同的层和级上构成的一个层级装置。
在这个层级装置中,各个层级呈现出这样的特点,那就是层次的单位数量逐层增多,从有限到无穷。
最底层的音位系统,一般只有几十个,它们为语言符号准备了形式的部分,音位组合与意义联系构成数千个语素,语素组合构成数万个词,数万个词再组成无数的句子。
在这些组合中,从音位到语素是最关键的,因为音位还只是形式,结合成语素后与意义联系起来,从而产生了质的飞跃。
第1篇一、引言汉语语音系统是汉语语言学研究的重要领域之一,它涉及到汉语的声母、韵母、声调等语音要素。
语音系统的组合关系和聚合关系是语音系统中的两个基本概念,对于理解汉语语音的结构和功能具有重要意义。
本文将从汉语语音系统的组合关系和聚合关系两个方面进行探讨。
二、汉语语音系统的组合关系1. 组合关系的定义组合关系是指语音系统中各个语音要素之间按照一定的规则组合在一起,形成新的语音结构。
在汉语语音系统中,组合关系主要体现在声母与韵母、声母与声调、韵母与声调之间的组合。
2. 声母与韵母的组合汉语声母共有21个,韵母共有39个。
声母与韵母的组合规则如下:(1)声母与单韵母的组合:声母与单韵母的组合可以形成双声母音节,如“bā”(把)、“pá”(爬)等。
(2)声母与复韵母的组合:声母与复韵母的组合可以形成三声母音节,如“guā”(瓜)、“zhǎng”(长)等。
3. 声母与声调的组合汉语声调共有四个:阴平、阳平、上声、去声。
声母与声调的组合规则如下:(1)声母与单声调的组合:声母与单声调的组合可以形成单声调音节,如“bā”(把)、“pá”(爬)等。
(2)声母与复声调的组合:声母与复声调的组合可以形成复声调音节,如“gāo”(高)、“dǎo”(到)等。
4. 韵母与声调的组合韵母与声调的组合规则如下:(1)韵母与单声调的组合:韵母与单声调的组合可以形成单声调音节,如“guā”(瓜)、“dǎo”(到)等。
(2)韵母与复声调的组合:韵母与复声调的组合可以形成复声调音节,如“gāo”(高)、“dǎo”(到)等。
三、汉语语音系统的聚合关系1. 聚合关系的定义聚合关系是指语音系统中具有相同语音特征的音素按照一定的规则组合在一起,形成具有相似语音特征的语音群。
在汉语语音系统中,聚合关系主要体现在声母、韵母、声调等语音要素之间的聚合。
2. 声母的聚合汉语声母共有21个,按照发音部位和发音方法可以分为以下几类:(1)塞音:b、p、d、t、g、k(2)擦音:f、h、x、sh、zh、ch、z、c(3)塞擦音:j、q、zh、ch、z、c(4)鼻音:m、n(5)边音:l这些声母按照发音部位和发音方法进行聚合,形成具有相似语音特征的声母群。
儿童汉语口语语料库文本设计
王亚
【期刊名称】《汉江师范学院学报》
【年(卷),期】2023(43)1
【摘要】儿童汉语口语语料库分为自然口语语料库和声学语料库两个部分,自然口语语料库设计包括基本信息调查表设计和口语库设计,基本信息调查表的设计包括发音儿童本人的基本信息和社会语言背景信息;口语库设计主要通过个人表述、小羊肖恩故事叙述、互动对话三方面了解被试词汇量的掌握情况;声学语料库主要包括双音节、句子和语篇三个部分,涵盖了音段、声调、调联三音子和停顿、焦点和语调等语音现象,以上内容主要选自人教版小学语文课本。
该语料库可为课堂教学提供一定文本资源,为儿童汉语的研究提供原始的口语资料和各种参数。
【总页数】7页(P43-49)
【作者】王亚
【作者单位】阿坝师范学院;泰国格乐大学
【正文语种】中文
【中图分类】G625.1;G353.1
【相关文献】
1.语料库辅助对外汉语口语教学的应用设计
2.北语HSK动态作文语料库的汉语作文口语化程度检测--基于《现代汉语词典》口语词统计
3.汉语为第二语言的多媒体口语语料库:语料库的建立及二语者趋向补语的习得分析
4.汉语中介语口语语料库
在汉语教学中的应用研究——以来华留学生第一次社会采访教学为例5.汉语中介语口语语料库在汉语教学中的应用研究
——以来华留学生第一次社会采访教学为例
因版权原因,仅展示原文概要,查看原文内容请购买。
国家语委现代汉语通⽤平衡语料库国家语委现代汉语通⽤平衡语料库标注语料库数据及使⽤说明1. 国家语委现代汉语通⽤平衡语料库1.1 语料库全库国家语委现代汉语通⽤平衡语料库全库约为1亿字符,其中1997年以前的语料约7000万字符,均为⼿⼯录⼊印刷版语料;1997之后的语料约为3000万字符,⼿⼯录⼊和取⾃电⼦⽂本各半。
语料库的通⽤性和平衡性通过语料样本的⼴泛分布和⽐例控制实现。
语料库类别分布如下所⽰:1.2 标注语料库标注语料库为国家语委现代汉语通⽤平衡语料库全库的⼦集,约5000万字符。
标注是指分词和词类标注,已经经过3次⼈⼯校对,准确率⼤于>98%。
语料库全库按照预先设计的选材原则进⾏平衡抽样,以期达到更好的代表性。
标注语料库在样本分布⽅⾯近似于全库,不破坏语料选材的平衡原则。
标注语料库类别分布如下所⽰:标注语料库与全库的样本分布⽐较如下所⽰:(蓝⾊曲线为语料库全库;红⾊曲线为标注语料库)2. 国家语委现代汉语通⽤平衡语料库语料选材与样本分布2.1 选材原则依据材料内容,选材⼤体作如下分类:(下⽂字数为建库时数据)2.1.1 教材⼤中⼩学教材单作⼀类,约2000万字。
2.1.2 ⼈⽂与社会科学的语⾔材料约占全库的60%,共3000万字,包括:·政法(含哲学、政治、宗教、法律等);·历史(含民族等)·社会(含社会学、⼼理、语⾔、教育、⽂艺理论、新闻学、民俗学等);·经济;·艺术(含⾳乐、美术、舞蹈、戏剧等);·⽂学(含⼝语);·军体;·⽣活(含⾐⾷住⾏等⽅⾯的普及读物)。
2.1.3 ⾃然科学(含农业、医学、⼯程与技术)的语⾔材料,应涉及其发展的各个领域。
拟从⼤、中、⼩学教材和科普读物中选取。
其中,科普读物约占6%,共300万字。
教材字数另计。
2.1.4 报刊。
以1949年以后正式出版的由国家、省、市及各个部委主办的报纸和综合性刊物为主,兼顾1949年以前的报纸和综合性刊物。
本科生毕业论文题目:自动标注汉语多音词Automatic Tagging of Chinese Polyphony Word and Related Research姓名:何辉辉学号:00748250院系:信息科学技术学院专业:计算机科学与技术指导教师:段慧明二〇二二年三月二十三日摘要汉语中存在着一字多音现象,很多高频字都具有两种或更多的读音,而这些多音字的读音并没有统一的规则可循。
汉语多音词的自动标注,即将汉字序列转换成相应的拼音序列,是语音合成(TTS)系统的关键步骤。
由于汉语文化的多义性和上下文相关性等原因,目前的汉语注音系统很难达到100%的正确率。
本文研究了多音词的读音规律,总结了中文分词和词性标记的相关技术;设计了汉语多音词的注音系统,重点研究词性标记串的注音问题;本系统由Java 语言和MySQL数据库设计,采用统计与规则相结合的注音方法,通过不断完善总词表,尽可能提高注音准确率。
从测试结果来看,系统对于封闭测试的正确率达到95.2%,基本满足现有要求,具有良好的实用性;随着数据库的逐渐完善,正确率还将不断提高。
关键词:汉语多音词;词性标记;自动注音;统计与规则。
Automatic Tagging of Chinese Polyphony Word and Related ResearchAbstractIn Chinese, there are many frequently used characters, which have more than one pronunciation, and how to automatically tag those characters correctly is a key step in TTS system. However, because the pronunciation of a certain character is related to its context and may have ambiguity, it's very hard to find a universal rule. As a result, current systems can hardly achieve a 100% precision.This thesis researched the law on Chinese polyphone words’ pronunciation, and summarized the related techniques on Chinese segmentation and POS tagging. In our work, we designed a pinyin tagging system, which was designed by Java and MySQL database, to focus on the problem after POS tagging. We proposed an algorithm that combined the traditional statistical method and heuristic rules to achieve a better result. Moreover, we also conducted extensive experiments, and the result showed that it can achieve accuracy of 95.2%; with the improvement of word database, its accuracy will continually increase.Key words:Chinese Polyphony Word; POS Tagging;Automatic Tagging; Statistics and Rules.目录摘要 (2)Abstract (3)第一章绪论 (5)1.1问题背景和研究意义 (5)1.2 发展现状 (5)1.3 本文组织结构 (6)第二章汉字读音 (6)2.1 多音字与多音词 (6)2.2 汉语读音分类 (7)2.3 汉语读音规律 (7)第三章分词与词性标注 (9)3.1 分词定义 (9)3.2 现有分词技术 (9)3.3 N元模型 (11)3.4 词性标注定义 (11)3.5 词性标注技术 (11)3.6 隐马尔可夫模型 (13)第四章汉语拼音标注 (15)4.1 标音定义 (15)4.2 现有拼音标注技术 (15)4.3规则与统计相结合的注音方法 (16)第五章多音词注音系统的实现 (17)5.1 注音系统简介 (17)5.2 开发环境 (17)5.3数据库表结构 (17)5.4 注音流程 (19)5.5 功能测试 (20)第六章总结与展望 (21)参考文献 (22)致谢 (23)第一章绪论1.1问题背景和研究意义随着计算机和Internet网络技术在全球范围内的飞速发展,计算机应用日益渗透到人们日常生活的各个方面;而语言的高效交流,是社会正常运作的基础。
汉语普通话双音子和三音子结构系统以及相关语料库的设计摘要自然语音处理最感头疼的问题, 就是难以对付连续话语中复杂的语音变化. •语音学界和言语工程学界经过长期的探索发现, 双音子和三音子是比较理想的、•能够较好地覆盖各崐种语音变化现象的处理单元. 所以, 在语音合成和语音识别中, •特别是在波形拼接合成方崐面已经得到广泛的应用. 但是, 在国内, 人们尚不十分熟悉它们.•本文将扼要地介绍这些概崐念, 并概括描写汉语普通话的双音子和三音子结构系统及相关语料库的设计.1.0 综述当前, 言语的合成和识别都已进入连续话语的阶段, •而影响合成音质和识别率提高的拦路虎就是语音的多变性问题. •因为自然话语并不是各种语音单位诸如音素或音节的简单机械的串列, 而是按照一定语音结合和变化规则构成的有机体系. 在这个体系里,各相邻语音单元之间由于协同发音(coarticulation)作用而彼此渗透, •在空间和时间域里形成了相互套叠(telescope or overlap)的局面(Zsiga, 1994; Wood, 1991), 其中相互叠接的部分叫做音联(juncture)(许毅, 1989), 它通常都是对应于一个声学上极其易变的区域. 不同语音单元之间的音联既是它们相互连接和分界的表现, 又是体现它们随环境而变化的实体. 正是这个部分给自然言语处理带来了极大的困难. 所以, 无论是合成还是识别方面, 都迫切希望能够定量地获得这种音联的规律及相关的模式. 然而, 无论从哪个角度看, 目前尚未达到能够控制对应于这种语音变化的所有参量的水准. 在这种情况下, 基于语料库的统计研究方法被广泛采用, 语料库的价值已经获得广泛的认可. 而且, 国际上还创立了语料库建设的协调组织(COCOSDA). 那么, 就合成和识别而言, 语料库究竟怎样选取言语样本才能够全面覆盖上述音联现象呢? •我们认为, 这同合成和识别的单元选择密切相关.长期以来, 人们在合成和识别的单元选择方面下了不少功夫. 起初, •音位或音素被认为是最合适的处理单元. 因为在任何语言里, 音位的数目总是相当有限的, •以它们作单元最为经济. 但是, 实践证明, 假如采用音位作为拼接合成的单元, 合成言语的音质低劣, •就是加上音位变体也还是不行. •一个主要的原因就在于无法含盖音位边界上那个声学上易变区域的特性. 同样, 音位也不适宜用作连续话语识别的单元. 因为在连续话语里, 音位之间相互叠接, 彼此的界限不分明, 这样的单元在信号处理上是很难定位、很难进行自动切分的. 为了解决这个问题, 有的系统就采用较大的言语单位如音节或词作为处理单元.尽管同音位相比, 音节和词是相对稳定的语音单位, 但是, •类似于音位方面的问题在这里依然存在. 因为至少在音节或词的边界上, 仍然存在相邻音位之间的音联问题, •因而每个音节或词在语流中也是随环境而变的. 如果要用它们来生成连续话语或者以它们作为识别单元的话, 那么, 所需的语料库就必须存储每个音节和词的所有可能的环境变体. 显然, •这在实际上是很难做到的, 更不用说怎样满足无限词汇的话语生成和大词汇量、非特定人、•连续话语识别的需要了. 即使在有限词汇的小型系统中可以采用这种方法建库的话, •其中也必然包含大量不必要的存储消耗, 因为各个环境变体无法共享语料. 于是, •言语工程方面又转向某些低于词(subword)的、甚至次音位(subphoneme)的探索. 终于发现, 半音节或双音子和三音子大小的单元是能够覆盖言语中音联现象、便于建立协同发音模型的、比较理想的语音处理单元(Lee, 1990). 引进随环境而定的音子的概念开创了一个建立低于词的模型的新方法.所谓音子(phone), 是语音之间在声学上连贯的、粘着的部分, 它对应于声学上的音段(Keller, 1995). 它跟音位或音素不同. 音位是区别性的语音, 对应于听觉上的音段. •通常, 声学上的音段多于听觉上的音段. 例如, 汉语的音节"八"在听感上是由/b/和/a/•两个区别性的音段构成的; 然而, 在声学上, 则除了/b/和/a/以外, 在它们之间还存在着音联, 即那个由于协同发音而产生的过渡音段, 这些在声学上就叫作音子. •它们虽然不是区别性的语音,•但却是自然言语中普遍存在的、•语音处理上难于回避的语音现象. •双音子(diphone) 通常是由一个语音单元的末尾部分跟下一个单元的开头部分构成的, 它可以当做相邻语音音段之间的过渡音来用(Klatt, 1987; Olive & Spickenagel, 1976). 三音子(triphone)是另一种理想的声学音段, •它考虑了一个音位或音素左右两方面的语音环境(Lee, 1990), 通常包括这个音素与它的左邻音素之间的过渡段、这个音素本身以及它跟右邻音素之间的过渡段.作为一种声学音段, 双音子已经在合成和识别中、尤其是在拼接式•(concatinative) 合成系统中得到广泛运用(Bhaskararao et al, 1991; Levre,1986), 因为这种音段能够捕获语音的所有瞬间状态及过渡信息, 能够有效地提高合成语音的音质和对连续话语的识别率. 所以,在汉语识别方面,人们也已经开始尝试运用这种方法,而且取得了较好的效果。
2.0 汉语双音子和三音子结构系统2.1 汉语语音的结构特点与语音处理单元的选择人们常说, 汉语是个音节语言. 一个汉字对应于一个音节, 清清楚楚, 在言语处理上采用音节作单元应该是最理想的. 而且, 汉语的音节数目有限, 相应的语料库最多存储一千多个音节就行了. 然而, 语音毕竟不同于文字, 言语毕竟不同于文本. •文本包含数目有限的分列符号, 而言语却包含着无数连续变化的语音信号. •汉语音节的语音同样也是随环境而变的, 语流中音节的边界上同样也存在着复杂的音联现象. 所以, 就汉语连续话语而言, 以音节作为合成单元或者在音节平面上建立识别模型都行不通. 在这种情况下, 人们只好另辟蹊径. 半音节的方法就是其中之一, 它首先是在拼接合成中应用的, 现在已开始被自动识别方面采用. 以半音节为单元跟以声母和韵母为单元很相似, 但又不完全相同. 以半音节为单元可以较好地解决音节内声母韵母的平滑连接问题, 不过, 仍然不能很好地解决音节之间的音联问题. 双音子和三音子就能弥补这个缺陷. 而且, 已经有试验表明,•在连续话语识别中采用双音子和三音子可以明显地提高识别率(祖漪清, 1995). •还有人主张在识别中采用半音节跟三音子相结合的办法(Lee, 1990), 这应该是一条更好的出路. 因此, 搞清楚汉语的双音子和三音子结构系统, 对于汉语语音处理显然是具有现实意义的.2.2 汉语的双音子结构汉语普通话共有1000多个音节, 即使不计声调区别, 也有400多个, 它们是由38个韵母跟22个声母结合而成的. 一般说来, 多数音节内部都包含着2-3个双音子结构. 不过, 多数双音子是可以为不同音节共享的. 例如,•音节"•金"/jin/•里的第一个双音子可以跟"京" /jing/里的第一个(这里用j'i表示)共享. 所以, 音节内部的双音子总数只有100多个.汉语音节之间的双音子结构就比较复杂一些, •因为每一个音节都有可能跟包括它自身在内的音节毗邻. 例如, 音节"介"/jie/与"绍"/shao/相连, •就会产生一个音节间的双音子(这里用e-sh表示); 相反, 如果是"绍"与"介" 邻接, 它们之间又会产生另一个双音子o-j. 但是, 这种音节间的双音子大多数也是能共享的, 因而可以大幅度地归纳合并. •根据普通话的语音结构规则, 音节间双音子的总数可以归纳为300余个.2.3 汉语的三音子结构三音子涉及一个音素左右两方面的语音环境, 所以, •这种结构的数目要比双音子的多得多. 特别是音节间的三音子, 不但数目多, 而且结构复杂. 根据初步研究结果, •普通话里有270多个音节内三音子和3700余个音节间三音子,它们在结构上可以分为两类.2.3.1 1+2式: 这类三音子是由一个单音子(monophone)和一个双音子构成, 它以后音节的起首音为核心,可以用前一个音节末尾的音素跟后一个音节起首的两个音素来代表,所以叫做1+2式。
例如, "这" 与"•类" •两个音节间的三音子就可用e-l'e来代表, 通常写作l(e,e), 它表示这两个音节边界上的/l/在左右两个/e/的环境中生成的声学音段. 由此可见,这类三音子实际上是由前音节的尾音跟后音节的起首双音子结合而成的。
在普通话里,所有的尾音可以归纳为11个,所有音节的起首双音子可以归纳为110个。
因此,由它们结合而成的音节间三音子共有1200多个。
2.3.2 2+1式: 这类三音子是以前音节的尾音为核心,它可以用前一个音节末尾的两个音素跟后一个音节起始的音素来代表,所以叫做2+1式. 例如, "这" 与"类" 之间的另一个三音子就是zh'e-l,•它表示边界上的/e/ 在左右环境分别为/zh/ 和/l/时产生的声学音段. 这类三音子实际上是由前音节的收尾双音子和后音节的起首音结合而成的。
在普通话里,所有音节的收尾双音子可以归纳为93个,所有音节的起首音可以归纳为28个,因而这样构成的音节间三音子共有2500多个。
根据上述分析,汉语普通话里双、三音子结构从绝对数目来看似乎相当大, 但是, •若从它们的实际应用价值来看还是相当典型精练的. 这是因为:第一, 从结构上看, 上述音节间三音子实际上不但包括了音节间的双音子,而且还涵盖了所有的基本音节的音韵结构,因而也就包含了所有的音节内双音子和三音子。
因此,汉语里双音子和三音子结构的总数实际上只有3700多个。
第二, 这个系统的归纳是建立在相对穷尽的原则基础上的. 就是说, •它是根据普通话语音结构规律, 给出了所有可能出现的双、三音子, 能够全面覆盖普通话里的音联现象, 满足连续话语合成和识别的需要. 从这个角度看, 3000多个结构应该是非常有限的了;第三, 这个系统所包含的是理论上可能存在的最多的数目, 在实际语言里, •有许多语音环境是非常相似的, 比如,在某一语音环境里,相同发音部位的一组辅音具有相似的声学过渡,因而可以共享一组音子. 这样, 经过合理的归并, •就可以获得本质上较少的、随环境而定的、概括的音子结构。