汉语普通话双音子和三音子结构系统以及相关语料库的设计
- 格式:doc
- 大小:41.00 KB
- 文档页数:5
中国结构语言学一、音系学研究音系学是研究语言中音的系统及其结构的学科。
在中国结构语言学中,音系学研究主要关注语言的发音、音素、音节、声调等方面的研究。
通过对汉语的音节和声调进行分析,可以揭示汉语语音的特性和规律,进一步理解汉语的语音结构和演变。
二、句法学研究句法学是研究语言的句子结构和语法规则的学科。
在中国结构语言学中,句法学研究主要关注语言的词法、句法、时态、语态等方面的研究。
通过对汉语的句子结构进行分析,可以揭示汉语的语法特性和规律,进一步理解汉语的语法结构和演变。
三、语义学研究语义学是研究语言的意义和理解的学科。
在中国结构语言学中,语义学研究主要关注语言的词汇意义、语境意义、比喻意义等方面的研究。
通过对汉语的词汇和句子意义进行分析,可以揭示汉语语义的特性和规律,进一步理解汉语的意义表达和演变。
四、语用学研究语用学是研究语言的使用和理解与语境关系的学科。
在中国结构语言学中,语用学研究主要关注语言的交际功能、话语分析、语言与文化等方面的研究。
通过对汉语的使用场景和语境进行分析,可以揭示汉语语用的特性和规律,进一步理解汉语的使用方式和演变。
五、社会语言学研究社会语言学是研究语言与社会关系的学科。
在中国结构语言学中,社会语言学研究主要关注语言的社区差异、方言、语言与身份等方面的研究。
通过对汉语在不同社区和方言中的使用进行分析,可以揭示汉语社会语言的特性和规律,进一步理解汉语的社会属性和演变。
六、历史语言学研究历史语言学是研究语言的历史发展和演变的学科。
在中国结构语言学中,历史语言学研究主要关注汉语的历史语音、语法、词汇等方面的研究。
通过对汉语的历史演变进行分析,可以揭示汉语历史语言的特性和规律,进一步理解汉语的历史属性和演变。
七、方言学研究方言学是研究方言的形成、分类、特征和变化的学科。
在中国结构语言学中,方言学研究主要关注汉语的各种方言的语音、词汇、语法等方面的研究。
通过对汉语的不同方言进行分析,可以揭示汉语方言的特性和规律,进一步理解汉语方言的特点和演变。
汉语拼音《z c s》优秀教学设计+教学反思设计说明根据一年级学生的认知规律和学习需要,汉语拼音教学要尽可能有趣味,教学宜以活动和游戏为主,以唤起学生学习拼音的兴趣。
所以本课教学设计意在为学生创设一个生活化的课堂,通过情境感染、游戏活动、创编儿歌、多种形式朗读等教学方式引导学生在语言实践中轻松愉快地学习拼音。
将学拼音与识字、读文有机结合起来,从而提高学生的综合能力,最终使学生达到学会声母z、c、s,会读整体认读音节zi、ci、si,以及读儿歌、学生字的目的。
课前准备1.关于本课的多媒体课件、以前学过的声母和韵母的卡片、zcs的拼音卡片、整体认读音节zi、ci、si的卡片。
(教师)2.萝卜形状的带调整体认读音节卡片。
(教师)3.生字和词语卡片。
(学生)课时安排2课时。
教学过程第一课时一、创设情境,导入新课1.教师逐个出示字母卡片,引导学生复习学过的声母和韵母。
(教师根据学生的回答出示相应的字母卡片。
)2.创设情境,引出新课:今天,是拼音宝宝小i的生日,我们一起为小i唱《生日歌》好吗?(课件出示:卡通的韵母i,面前放着一个点燃蜡烛的蛋糕。
)小i有一个愿望,它希望大家帮它邀请三位新的拼音朋友来参加它的生日会,大家愿意帮忙吗?3.出示z、c、s的拼音卡片,揭示教学内容:这就是我们今天要邀请的三位拼音宝宝,在邀请它们之前我们先来认识一下它们。
设计意图:创设学生喜欢的过生日的情境,吸引学生的注意力,让学生在为小i找三位新朋友,并邀请新朋友来参加生日会的过程中快乐轻松地学习,激发了学生的学习兴趣。
同时,使学生明确了本节课的学习任务,带着任务去学习。
二、图文结合,学习声母及整体认读音节(一)学习声母z和整体认读音节zi。
1.过渡:现在,我们就出发,去结识我们的新朋友吧!2.学习声母z。
(1)课件出示文中的插图。
引导学生观察,这是什么地方?谁在做什么?(2)教师出示z的卡片,引导学生发现z就是今天要邀请的第一个声母宝宝。
2011秋双语汉语言本科《汉语普通话语音教程》课程教学一体化设计一、课程总体说明1.课程性质及特点《汉语普通话语音教程》是一门集理论与实践教学为一体的综合课。
本教材作为新疆地区汉语教师语音教学培训的基础教材,系统、简要地介绍了汉语语音作为第二语言教学的理论与基础知识以及一些教学方法。
为了配合汉语教师和学员联练习标准普通话的发音和语调,本教材专门编写了大量实践练习题。
2、本教材的特点(一)它是一本适应不同程度、不同学习时间、不同要求的开放式教材。
既可以供汉语教师培训使用,也可以作为新疆地区大专院校汉语教师备课、学员自主学习使用。
(二)本教材主要通过对新疆维吾尔族和哈族学生学习汉语语音中出现的问题进行分析,有针对性地指出了纠音正调的方法。
(三)本教材包括五个部分内容和四个附录。
3、学时学分课内面授学时为72学时,本课程4学分。
开设一学期。
4、课程教学及要求语音教学是汉语作为第二语言教学的基础,是掌握汉语听、说、读、写技能和交际能力的前提。
《汉语普通话语音教程》要求从一开始就给学生打下扎实的语音基础。
第一、应该掌握汉语拼音方案。
为打好语音基础,认识和读准汉语拼音,要从系统的普通话语音训练出发,把普通话的发音教学内容(声母、韵母、声调、轻声、儿化韵等)及语调教学内容(词、句重音、音长、节拍、句调等)有计划、有目的、有序地贯穿在练习之中,使学生受到系统的基本功训练。
第二,为发准一个音、一个声调,用标准语调说好一句话,还需要一定机械练习,而且从不同角度进行大量的重复练习。
第三,要在教师的指导下通过课内外大量的模仿、练习和纠音正调,日积月累,不断实践,掌握汉语话的标准发音。
第四,语言教学还必须贯穿汉语教学的始终。
5、教学手段及方式①文字教材。
使用北京语言大学副刘广徽教授编著的《汉语普通话语音教程》新疆版一书。
②直播课堂。
组织学员收看新疆电大制作的电视直播课。
③指导学生进行网上学习。
要求学员根据情况及时上网寻找有关该课程的课件。
数量结构合音词“俩”、“仨”的几个问题——兼评赵元任
先生的“失音”说
冯春田
【期刊名称】《语言研究》
【年(卷),期】2002()2
【摘要】本文讨论的问题是:数量结构合音词“俩”、“仨”早期的用法及其词音和字形问题;“俩”、“仨”分别是先由“两个”、“三个”发生连说音变,尔后形成合音式;赵元任先生关于“数+个”结构连说音变的分析现在看来仍有其合理性,但他对于“数+个”结构中“个”的连说变音形式以及“俩”、“仨”形成的意见,都值得重加检讨。
【总页数】7页(P38-44)
【关键词】“俩”;“仨”;用法形成
【作者】冯春田
【作者单位】山东大学
【正文语种】中文
【中图分类】H146
【相关文献】
1.赵元任:教我如何不想他——兼访赵元任先生故里常州青果巷 [J], 石湾
2.也谈北京话的“俩”、“仨”——为纪念恩师孟非先生逝世五周年而作 [J], 马
克章;
3.也谈北京话的“俩”、“仨”——为纪念恩师孟非先生逝世五周年而作 [J], 马克章
4.河北辛集话的合音现象与合音词——兼谈普通话合音词“俩”“仨”“别”的来源 [J], 孔祥卿;
5.中原官话的人称代词类合音词——兼论"您""俺"非合音词 [J], 孙瑞隆
因版权原因,仅展示原文概要,查看原文内容请购买。
谈汉语词汇的双音节化和对外汉语教学作者:虞佳来源:《语文学刊》 2014年第5期○ 虞佳(湖南师范大学文学院,湖南长沙410000)[摘要]汉语词汇从古到今发展的趋势是双音化。
从西周开始就有了双音节词的出现,之后随着社会的发展,多音节词汇开始增多,而且占了总词汇的大多数。
元明清时期,双音节词汇已成为汉语词汇的主流。
本文先对汉语词汇双音化的原因做以阐述,然后指出汉语词汇双音化的研究对对外汉语词汇教学的重要作用。
[关键词]对外汉语教学;词汇;双音节词;双音化[中图分类号]H193[文献标识码]A[文章编号]1672-8610(2014)05-0102-02汉语词汇从古到今数量巨大,从西周开始就有双音节词,但那时还是以单音节词为主。
在西周时期的一些著作中,如《尚书·周书》、《诗经》里的《周颂》、《大雅》、《小雅》中都有双音节词的出现。
之后随着社会的发展,多音节词汇开始增多,其中双音节词占大多数。
为什么在奴隶社会人们的词汇会以单音节为主,而后来多音节词汇越来越多了?这与社会的发展是紧密联系的。
在古老的奴隶社会,社会生产力落后,人们所见的东西不多,单音节词足够他们用了,而且在那时一个单音节词有很多的意思。
如“发”这个词,在古代汉语中就有将近16种含义,可以是名词也可以是动词,这样意思就复杂了,于是需要各种词语的组合,使这些意思不混淆,反而更加清晰、明确。
随着社会生产力的发展,人们觉得原来的那些单音节已不足以表达他们的思想、生活,于是将有的单音节词结合,或者另造多音节词,这样就出现了大量的多音节词,在这些多音节词中双音节词居多。
到元明清时,双音节词大量增加。
据统计,《水浒传》中的多音词占70%,而单音节词占30%;《西游记》中共有80多万字,其中双音节词就有10 991个,多音节词(不包括双音节词)有1 182个。
可见,那时的复音词(绝大部分为双音节)数量已远远超过单音节词。
至此,双音节词已成为汉语词汇的主流。
语言的层级体系
语言中的各种单位相互间紧密联系,彼此依存,组成一个系统。
语言的底层是音位,上层是音义结合的符号与符号的序列。
上层又分为三级,第一级是语素,第二级是词,第三级是句子。
语言结构就是由音位层和音义结合的符号序列层构成的装置,我们称之为语言结构的二层性(定义-核心-展开)。
无论是底层还是上层,我们都能看到,语言结构二层性的核心实际上是以少驭多,以较少的单位组成上一层较多的单位,如语言结构上层的三级在数量上就是增量翻番,由下一级组成上一级,数量成倍扩大。
例如汉语,音位层只有30来个,它们可以组成数千个语素,语素又可以组成数十万条词,词又组成无穷无尽的句子。
语言就是各个单位在不同的层和级上构成的一个层级装置。
在这个层级装置中,各个层级呈现出这样的特点,那就是层次的单位数量逐层增多,从有限到无穷。
最底层的音位系统,一般只有几十个,它们为语言符号准备了形式的部分,音位组合与意义联系构成数千个语素,语素组合构成数万个词,数万个词再组成无数的句子。
在这些组合中,从音位到语素是最关键的,因为音位还只是形式,结合成语素后与意义联系起来,从而产生了质的飞跃。
汉语普通话双音子和三音子结构系统以及相关语料库的设计摘要自然语音处理最感头疼的问题, 就是难以对付连续话语中复杂的语音变化. •语音学界和言语工程学界经过长期的探索发现, 双音子和三音子是比较理想的、•能够较好地覆盖各崐种语音变化现象的处理单元. 所以, 在语音合成和语音识别中, •特别是在波形拼接合成方崐面已经得到广泛的应用. 但是, 在国内, 人们尚不十分熟悉它们.•本文将扼要地介绍这些概崐念, 并概括描写汉语普通话的双音子和三音子结构系统及相关语料库的设计.1.0 综述当前, 言语的合成和识别都已进入连续话语的阶段, •而影响合成音质和识别率提高的拦路虎就是语音的多变性问题. •因为自然话语并不是各种语音单位诸如音素或音节的简单机械的串列, 而是按照一定语音结合和变化规则构成的有机体系. 在这个体系里,各相邻语音单元之间由于协同发音(coarticulation)作用而彼此渗透, •在空间和时间域里形成了相互套叠(telescope or overlap)的局面(Zsiga, 1994; Wood, 1991), 其中相互叠接的部分叫做音联(juncture)(许毅, 1989), 它通常都是对应于一个声学上极其易变的区域. 不同语音单元之间的音联既是它们相互连接和分界的表现, 又是体现它们随环境而变化的实体. 正是这个部分给自然言语处理带来了极大的困难. 所以, 无论是合成还是识别方面, 都迫切希望能够定量地获得这种音联的规律及相关的模式. 然而, 无论从哪个角度看, 目前尚未达到能够控制对应于这种语音变化的所有参量的水准. 在这种情况下, 基于语料库的统计研究方法被广泛采用, 语料库的价值已经获得广泛的认可. 而且, 国际上还创立了语料库建设的协调组织(COCOSDA). 那么, 就合成和识别而言, 语料库究竟怎样选取言语样本才能够全面覆盖上述音联现象呢? •我们认为, 这同合成和识别的单元选择密切相关.长期以来, 人们在合成和识别的单元选择方面下了不少功夫. 起初, •音位或音素被认为是最合适的处理单元. 因为在任何语言里, 音位的数目总是相当有限的, •以它们作单元最为经济. 但是, 实践证明, 假如采用音位作为拼接合成的单元, 合成言语的音质低劣, •就是加上音位变体也还是不行. •一个主要的原因就在于无法含盖音位边界上那个声学上易变区域的特性. 同样, 音位也不适宜用作连续话语识别的单元. 因为在连续话语里, 音位之间相互叠接, 彼此的界限不分明, 这样的单元在信号处理上是很难定位、很难进行自动切分的. 为了解决这个问题, 有的系统就采用较大的言语单位如音节或词作为处理单元.尽管同音位相比, 音节和词是相对稳定的语音单位, 但是, •类似于音位方面的问题在这里依然存在. 因为至少在音节或词的边界上, 仍然存在相邻音位之间的音联问题, •因而每个音节或词在语流中也是随环境而变的. 如果要用它们来生成连续话语或者以它们作为识别单元的话, 那么, 所需的语料库就必须存储每个音节和词的所有可能的环境变体. 显然, •这在实际上是很难做到的, 更不用说怎样满足无限词汇的话语生成和大词汇量、非特定人、•连续话语识别的需要了. 即使在有限词汇的小型系统中可以采用这种方法建库的话, •其中也必然包含大量不必要的存储消耗, 因为各个环境变体无法共享语料. 于是, •言语工程方面又转向某些低于词(subword)的、甚至次音位(subphoneme)的探索. 终于发现, 半音节或双音子和三音子大小的单元是能够覆盖言语中音联现象、便于建立协同发音模型的、比较理想的语音处理单元(Lee, 1990). 引进随环境而定的音子的概念开创了一个建立低于词的模型的新方法.所谓音子(phone), 是语音之间在声学上连贯的、粘着的部分, 它对应于声学上的音段(Keller, 1995). 它跟音位或音素不同. 音位是区别性的语音, 对应于听觉上的音段. •通常, 声学上的音段多于听觉上的音段. 例如, 汉语的音节"八"在听感上是由/b/和/a/•两个区别性的音段构成的; 然而, 在声学上, 则除了/b/和/a/以外, 在它们之间还存在着音联, 即那个由于协同发音而产生的过渡音段, 这些在声学上就叫作音子. •它们虽然不是区别性的语音,•但却是自然言语中普遍存在的、•语音处理上难于回避的语音现象. •双音子(diphone) 通常是由一个语音单元的末尾部分跟下一个单元的开头部分构成的, 它可以当做相邻语音音段之间的过渡音来用(Klatt, 1987; Olive & Spickenagel, 1976). 三音子(triphone)是另一种理想的声学音段, •它考虑了一个音位或音素左右两方面的语音环境(Lee, 1990), 通常包括这个音素与它的左邻音素之间的过渡段、这个音素本身以及它跟右邻音素之间的过渡段.作为一种声学音段, 双音子已经在合成和识别中、尤其是在拼接式•(concatinative) 合成系统中得到广泛运用(Bhaskararao et al, 1991; Levre,1986), 因为这种音段能够捕获语音的所有瞬间状态及过渡信息, 能够有效地提高合成语音的音质和对连续话语的识别率. 所以,在汉语识别方面,人们也已经开始尝试运用这种方法,而且取得了较好的效果。
2.0 汉语双音子和三音子结构系统2.1 汉语语音的结构特点与语音处理单元的选择人们常说, 汉语是个音节语言. 一个汉字对应于一个音节, 清清楚楚, 在言语处理上采用音节作单元应该是最理想的. 而且, 汉语的音节数目有限, 相应的语料库最多存储一千多个音节就行了. 然而, 语音毕竟不同于文字, 言语毕竟不同于文本. •文本包含数目有限的分列符号, 而言语却包含着无数连续变化的语音信号. •汉语音节的语音同样也是随环境而变的, 语流中音节的边界上同样也存在着复杂的音联现象. 所以, 就汉语连续话语而言, 以音节作为合成单元或者在音节平面上建立识别模型都行不通. 在这种情况下, 人们只好另辟蹊径. 半音节的方法就是其中之一, 它首先是在拼接合成中应用的, 现在已开始被自动识别方面采用. 以半音节为单元跟以声母和韵母为单元很相似, 但又不完全相同. 以半音节为单元可以较好地解决音节内声母韵母的平滑连接问题, 不过, 仍然不能很好地解决音节之间的音联问题. 双音子和三音子就能弥补这个缺陷. 而且, 已经有试验表明,•在连续话语识别中采用双音子和三音子可以明显地提高识别率(祖漪清, 1995). •还有人主张在识别中采用半音节跟三音子相结合的办法(Lee, 1990), 这应该是一条更好的出路. 因此, 搞清楚汉语的双音子和三音子结构系统, 对于汉语语音处理显然是具有现实意义的.2.2 汉语的双音子结构汉语普通话共有1000多个音节, 即使不计声调区别, 也有400多个, 它们是由38个韵母跟22个声母结合而成的. 一般说来, 多数音节内部都包含着2-3个双音子结构. 不过, 多数双音子是可以为不同音节共享的. 例如,•音节"•金"/jin/•里的第一个双音子可以跟"京" /jing/里的第一个(这里用j'i表示)共享. 所以, 音节内部的双音子总数只有100多个.汉语音节之间的双音子结构就比较复杂一些, •因为每一个音节都有可能跟包括它自身在内的音节毗邻. 例如, 音节"介"/jie/与"绍"/shao/相连, •就会产生一个音节间的双音子(这里用e-sh表示); 相反, 如果是"绍"与"介" 邻接, 它们之间又会产生另一个双音子o-j. 但是, 这种音节间的双音子大多数也是能共享的, 因而可以大幅度地归纳合并. •根据普通话的语音结构规则, 音节间双音子的总数可以归纳为300余个.2.3 汉语的三音子结构三音子涉及一个音素左右两方面的语音环境, 所以, •这种结构的数目要比双音子的多得多. 特别是音节间的三音子, 不但数目多, 而且结构复杂. 根据初步研究结果, •普通话里有270多个音节内三音子和3700余个音节间三音子,它们在结构上可以分为两类.2.3.1 1+2式: 这类三音子是由一个单音子(monophone)和一个双音子构成, 它以后音节的起首音为核心,可以用前一个音节末尾的音素跟后一个音节起首的两个音素来代表,所以叫做1+2式。
例如, "这" 与"•类" •两个音节间的三音子就可用e-l'e来代表, 通常写作l(e,e), 它表示这两个音节边界上的/l/在左右两个/e/的环境中生成的声学音段. 由此可见,这类三音子实际上是由前音节的尾音跟后音节的起首双音子结合而成的。
在普通话里,所有的尾音可以归纳为11个,所有音节的起首双音子可以归纳为110个。
因此,由它们结合而成的音节间三音子共有1200多个。
2.3.2 2+1式: 这类三音子是以前音节的尾音为核心,它可以用前一个音节末尾的两个音素跟后一个音节起始的音素来代表,所以叫做2+1式. 例如, "这" 与"类" 之间的另一个三音子就是zh'e-l,•它表示边界上的/e/ 在左右环境分别为/zh/ 和/l/时产生的声学音段. 这类三音子实际上是由前音节的收尾双音子和后音节的起首音结合而成的。
在普通话里,所有音节的收尾双音子可以归纳为93个,所有音节的起首音可以归纳为28个,因而这样构成的音节间三音子共有2500多个。
根据上述分析,汉语普通话里双、三音子结构从绝对数目来看似乎相当大, 但是, •若从它们的实际应用价值来看还是相当典型精练的. 这是因为:第一, 从结构上看, 上述音节间三音子实际上不但包括了音节间的双音子,而且还涵盖了所有的基本音节的音韵结构,因而也就包含了所有的音节内双音子和三音子。
因此,汉语里双音子和三音子结构的总数实际上只有3700多个。
第二, 这个系统的归纳是建立在相对穷尽的原则基础上的. 就是说, •它是根据普通话语音结构规律, 给出了所有可能出现的双、三音子, 能够全面覆盖普通话里的音联现象, 满足连续话语合成和识别的需要. 从这个角度看, 3000多个结构应该是非常有限的了;第三, 这个系统所包含的是理论上可能存在的最多的数目, 在实际语言里, •有许多语音环境是非常相似的, 比如,在某一语音环境里,相同发音部位的一组辅音具有相似的声学过渡,因而可以共享一组音子. 这样, 经过合理的归并, •就可以获得本质上较少的、随环境而定的、概括的音子结构。