现代汉语述语动词机器辞典和现代汉语名词槽关系...
- 格式:ppt
- 大小:107.00 KB
- 文档页数:23
现代汉语常见语法问题二、语法具有什么性质?语法具有抽象性、层次性、递归性、系统性、稳固性、民族性。
1、抽象性抽象性是语法最基本的特征。
语法是从个别和具体的语言现象中抽象出来的,因此语法学并不研究具体的某个词、短语或句子的内容,而是从语素、词、短语、句子等语法单位的组合里抽象概括出共同的组合方式、类型及其如何表达语义。
2、层次性语法从表面上看是线性排列的东西,但是语法结构却是有层次性的。
除了联合短语外,主谓、述宾、述补、偏正等短语都能切分出两个直接成分。
直接成分还可以进一步切分出更小的直接成分,这样复杂短语就可以由大到小分析出若干层次。
3、递归性语法结构的递归性是指反复使用有限的语法规则,可以构成结构复杂的短语或句子。
4、系统性语法具有鲜明的系统性,是由组合关系和聚合关系构成的严整有序的规则系统。
语法系统由若干子系统构成,包括语素系统、词类系统、短语系统、句子系统和句群系统。
组合关系和聚合关系是语法结构规律中最基本的两种关系。
5、稳固性语法与基本词汇构成语言的基础,具有很大的稳固性。
语法也会随着时间的推移而发展演变,但是语法的变化比词汇、语音的变化缓慢得多,而且语法很难受到外来因素的影响而改变。
语法的急剧变化会影响语言交际的顺利进行。
6、民族性不同语言的语法之间既具有人类语言共同的语法结构规律,同时每种语言的语法同每个民族共同体的全体成员密切相关,具有鲜明的民族性特点。
五、汉语有哪些语法结构单位?这些语法单位之间有什么区别?汉语语法的结构单位分为语素、词、短语、句子、复句和句群六级。
1、语素是语言中最小的音义结合体,是语法分析的最小单位。
语素是构成词的备用单位。
2、词是语言中最小的能够独立运用的语法单位,是构成短语和句子的备用单位。
一部分词加上句调可以单独成句。
3、短语又称词组,是由两个或两个以上的词按照一定的语法规则构成的语法单位,是没有句调的一组词。
短语一般加上句调就可以成句。
4、句子是由词或短语按照一定的语法规则构成的、能表达相对完整的意思、带有句调的语法单位。
“现代汉语语义词典”的结构及应用♣王惠 俞士汶詹卫东(北京大学计算语言学研究所)(北京大学中文系)whui@; yusw@; zwd@摘要:“现代汉语语义词典”是一部面向汉英机器翻译的语言知识库,它以数据库文件形式收录了6.8万余条现代汉语的实词,不仅给出了每个词语所属的词类、语义类,而且以义项为单位详细描述了它们的各种语义搭配限制。
目的是为计算机语义自动分析,词义消歧等任务提供强有力的支持。
本文介绍这部语义词典的结构、内容,并且以实例说明这部词典可有效地解决翻译系统中的词汇歧义问题。
关键词:语义词典 语义类 词义消歧 计算词典学 中文信息处理The Semantic Knowledge-base of Contemporary Chineseand its Applications in MTWang Hu i1, Yu Shiwen1, Zhan Weidong21(Institute of Computational Linguistics, Peking University, Beijing 100871, China)2(Dept. of Chinese Language and Literature, Peking University, Beijing 100871, China)whui@; yusw@; zwd@AbstractThe Semantic Knowledge-base of Contemporary Chinese (SKCC) is a machine-readable dictionary, which provides rich semantic information such as a thesaurus, semantic collocation, and parts-of-speech (POS) of 68,000 Chinese words. The paper introduces the outline of SKCC, and indicates that it is effective for word sense disambiguation in MT system and is likely to be important for general Chinese NLP.Key words:Semantic knowledge-base, Chinese thesaurus, computational lexicography, word sense disambiguation(WSD), Chinese language information processing♣本研究得到国家973重点基础研究项目“面向新闻领域的汉英机器翻译系统”(项目号:G1998030507-4)与“面向中文信息处理的现代汉语动词论旨结构系统和汉语词语语义分类层级系统研究”(项目号:G1998030507-1)的支持。
现代汉语名词解释归纳1.现代汉民族共同语:以北京语音为标准音,以北方话为基础方言,以典范的现代白话文著作为语法规范的普通话。
2.六书:东汉许慎在《说文解字》中对“六书”理论进行了阐述。
“六书”指的是:象形、会意、指事、形声、转注、假借,这是六种不同的造字方法。
3.假借:本无其字而根据被记录的词的读音,借用音同或音近的已有汉字表示新词的一种方法。
这种由于音同或音近而被借来表示另外意义的字叫假借字。
4.转注:部首相同,声音相同或相近,意义相通,可以互相训释的字。
5.隶书:隶书是秦汉时期所用的字体,分为秦隶和汉隶,秦隶是古今文字的转折点。
6.部首:部首是具有字形归类作用的部件,是字书中各部的首字。
7.部件:部件又称偏旁,是由笔画组成的具有组配汉字功能的构字单位。
8.浊声母:声带颤动而产生的声母。
9.零声母:有的声母不以辅音开头,元音前头那部分是零,习惯上叫零声母。
10.鼻化元音:发音时,软腭下降,口腔和鼻腔同时打开,元音就会带上鼻音色彩,这种元音叫做鼻化元音。
11.鼻韵母:由一个或两个元音音素后面带上一个鼻辅音作韵尾的韵母叫鼻韵母。
12.四呼:四呼是我国传统音韵学上按有无韵头及韵头的不同对韵母所作的分类,即把韵母分为开口呼、齐齿呼、合口呼、撮口呼四类,简称“四呼”。
13.押韵:把两个以上的韵母相同或相近的字放在诗句的同一位置上,使声音和谐悦耳。
14.声调:贯穿整个音节的语音的高低升降变化,是整个汉语中不可缺少的成分,具有区别意义的作用,其性质主要取决于音高,又叫字调。
15.调值:是声音高低升降曲直长短的变化,也就是声调的实际读法。
16.调类:声调的种类,就是把调值相同的字归纳在一起所建立的类。
17.儿化:儿化指的是后缀“儿”与它前一个音节的韵母合成一个音节,并使这个音节带上卷舌的音色的一种特殊的音变规律。
18.轻声:轻声是一种特殊的音变现象,一定条件下读得又短又轻的句子。
19.离合词:某些合成词在使用中往往可以扩展,变成了词组。
现代汉语离合词及其离合槽研究现代汉语中的离合词是构词方式中的一种特殊形式,这种词汇形式在语言中起着非常重要的作用。
离合词的研究对于深入了解汉语的语法体系和词汇运用有着重要的意义。
本文将围绕现代汉语离合词及其离合槽展开研究,重点分析离合词的构词规律以及离合槽的语义功能,并探讨离合词在语言运用中的作用与特点。
一、离合词的基本概念及构词规律离合词是汉语中一种独特的构词方式,指的是由两个单字合成的一个词,其中一个词作为主要成分,另一个词则起到修饰或补充作用。
在离合词中,两个单字之间具有一定的关联性,构成一个词语整体,而且词义通常与两个单字的意义有所关联。
离合词的构词规律主要有以下几种形式:1.名词+名词:如“红楼、书房、茶杯”等。
这种形式的离合词常常表示一种具体的事物或实体,如“红楼”指的是一座建筑物,“书房”指的是一个房间,“茶杯”指的是一种容器。
2.动词+名词:如“走廊、跑道、坐椅”等。
这种形式的离合词通常表示动作和场所的关系,如“走廊”指的是行走的通道,“跑道”指的是用于跑步的场所,“坐椅”指的是供人坐的椅子。
3.形容词+名词:如“美丽、聪明、高大”等。
这种形式的离合词通常表示一种属性或特征,如“美丽”指的是外表优美漂亮,“聪明”指的是智力高明,“高大”指的是体型高大。
4.副词+动词:如“慢走、快跑、低头”等。
这种形式的离合词通常表示动作的方式或状态,如“慢走”表示行走的方式,“快跑”表示跑步的方式,“低头”表示头部的状态。
以上是离合词的一般构词规律,根据词义的不同,离合词还可以进一步分为动词加动词、动词加副词等形式。
总的来说,离合词的构词规律比较灵活多样,可以根据语境和需求进行组词,丰富了汉语词汇的表达方式。
二、离合槽的语义功能及特点离合槽是离合词中一个特殊的语法槽,指的是离合词中的主要成分和修饰成分之间的语义关系。
离合槽在离合词中起着非常重要的作用,决定了离合词的词义和语法功能。
离合槽的语义功能主要有以下几个特点:1.表达补充关系:离合槽通常表示主要成分和修饰成分之间的补充关系,起到对主要成分进行补充或修饰的作用。
XHK汉语词义知识库的设计与规范王惠新加坡国立大学中文系chswh@.sg摘 要XHK是一部人机两用、基于语法分布特征的现代汉语词义知识库,它收录了《现代汉语词典》(修订版)中的全部5.6万词条,共8.1万余义项。
不仅提供准确的释义,而且详细标注词语在每个义项上的拼音、词类、语义类、语法功能、语义组合、特殊搭配、语体风格、来源出处,使用频率,以及来自真实语料的丰富例句,从而为大规模、系统的汉语词义分析和计算词典学理论探讨提供一个坚实可靠的研究平台。
同时,作为一个以义项为单位的大型词义知识库,XHK也可直接应用于机器翻译、信息检索、文本处理等多种中文信息处理系统,为词义消歧(WSD)和语义自动分析提供强有力的支持。
本文概要介绍XHK的设计原则、结构规模、属性项目与填写规范。
关键词:词义知识库、多义词、义项、词类、语义类1.引言在相当长的一段时间内,词义和语法曾被认为是两个完全不同的研究领域。
在不少语法学家看来,词义数目庞大、松散,而且随着语言的不同而不同(language-specific);大多数词汇语义学家也是往往仅满足于词汇层面或词义系统内部的描写,不去涉足句法分析的范围。
直到上个世纪70年代,这种情况才开始出现一些改变的迹象。
生成语法学家Kazt 和Fodor最早尝试把词义特征分解引进句法分析之中(Kazt & Fodor,1963; Kazt, 1972)。
80年代以后,随着语言研究的深入,利用词义分析探索形态和句法过程的语义基础,说明词汇和句子之间的语义关系,成为欧美词汇语义学与语法学共同的研究热点。
在这种背景下,如何充分利用词在语法结构中的不同表现来观察词义特征的细微差别,探索词在实际运用中的意义变化、分布特点和组合限制,日益引起国内外越来越多词汇语义学家的关注。
英国著名语义学家Lyons明确指出“任何词义,无论组合受严格限制与否,都应包括该词的替换关系和组合关系(1995:124)”。
自考现代汉语复习———课后思考练习题第一章绪论课后思考题1.现代汉语有几大方言区?你所在的地方属于哪个方言区?这个方言区在语音、词汇和语法上有那些明显的特点。
答:十大方言:北方方言、吴方言、赣方言、湘方言、客家方言、粤方言、闽北方言、闽南方言、晋语方言、平话方言。
北方方言区2.说明文言与白话、口语与书面语、方言与共同语之间的关系。
答:(1)文言与白话的关系:文言和白话都指书面语,两者是相对而言的。
文言指五四以前通用的,以古汉语为基础的书面语。
它最初是在口语的基础上形成的,但是当它逐渐固定下来形成一种书面语言的传统以后,就不再跟着口语一起变化,久而久之,就逐渐和口语脱节,最后变成了一种不仅读出来听不懂,而且不经过专门学习连看也看不懂的书面语言。
文言在语法和词汇方面与口语有较大差别。
白话是现代汉语普通话书面形式的源头。
它的产生是由于文言与口语完全分家,学习起来比较困难,所以在人民群众中间就逐渐产生了与口语直接联系的这种新的书面语言。
白话始终是和口语密切联系的,语法和词汇方面与口语比较一致。
白话和文言虽然也相互影响,但基本上是分道扬镳,各有各的应用范围。
但长期以来,白话文著作一直被看作是‚俗‛文学,在书面语言在始终是文言文占统治地位,直到1919年五四运动以后,白话文才取得正式书面的资格。
(2)口语与书面语的关系:①口语和书面语是两种不同的语体。
书面语表诸文字的记述,口语通过口头发音而传播。
两者的载体是不同的,前者是文字,后者是语音。
两者的主要不同,还在于语体。
口语是人们口头上应用的语言,其特征在于简短,疏放,有较多省略因而常用短句。
这种风格的形成,是由于口语常呈现为当面交谈,有特定的语境存托,又有身手势态和语音变化的帮助。
从而具有较多的辅助性信息作为支持。
书面语在口语的基础上形成,但具有与口语不同的语体风格。
书面语趋于周密,严谨,结构完整,因而长句较多。
这种风格的形成,往往是由于书面语缺少不同语境下当面会话所具备的种种辅助信息,不得不要求语句自身得以规范化,标准化,进而成为文学语言,即标准语的基础。
《现代汉语词典》是一本权威的汉语词典,收录了大量的汉语词汇,并对每个词汇进行了详细的解释。
其中,名词、动词、形容词是词汇中最常见的三类词性。
多义词现象是指一个词具有多个不同的意义,这种现象在汉语中尤为常见。
在《现代汉语词典》中,名词、动词、形容词的多释义并置现象主要是指这些词性的多个意义并列放置,不区分主次。
这种编排方式可能是为了方便读者查阅和学习,同时也展示了汉语词汇的多样性和丰富性。
例如,在《现代汉语词典》中,“上”既可以作为动词,表示“装载”的意思,也可以作为名词,表示“装载的东西”的意思。
同时,“上”还可以作为形容词,表示“上述的”或者“上面的”的意思。
这三个释义并没有被分开排列,而是并列放置在一起,方便读者查阅。
这种多释义并置现象在名词、动词、形容词中都很常见。
例如,“头”可以作为名词表示“脑袋”,也可以作为动词表示“思考、谋划”,还可以作为形容词表示“头部的”。
这种现象反映了汉语词汇的丰富性和复杂性。
总的来说,《现代汉语词典》中的名词、动词、形容词多释义并置现象是为了方便读者查阅和学习汉语词汇。
这种现象反映了汉语词汇的多样性和丰富性,但也需要注意在使用多义词时避免混淆其不同的意义。
运用模板匹配的汉语生语料动宾关系提取*张开旭孙茂松清华大学计算机科学与技术系北京 100084E-mail: zhangkx03@, sms@摘要:本文的目的是从大规模汉语生语料中提取具有动宾关系的动词-名词对。
在没有任何标注甚至未经分词的中文生语料中,我们以虚词、词序、标点等作为线索,设计了使用模板匹配抽取动宾关系的方法。
在SogouT 语料的部分数据上进行了实验,所得结果的准确率与召回率估计均在80%左右。
证明基于模板匹配的方法能够适应大规模汉语生语料的特点。
其性能仍有进一步提升的空间。
关键词:中文信息处理;语料库语言学;动宾关系Verb-Object Relationship Extraction from Raw Chinese CorpusUsing Template MatchingKaixu Zhang Maosong SunDepartment of Computer Science and Technology, Tsinghua University, Beijing 100084E-mail: zhangkx03@, sms@Abstract:The aim of this method is to extract verb-noun pairs that can form the verb-object relationship from large-scale Chinese raw corpus without any manually annotated. Templates are designed based on clues such as function words, word-order and punctuation marks. The verb-object relationships between words are determined according to the template matching results. Experiment on part of the SogouT corpus showed that the precision and recall of this method is both about 80%. Results indicate that the template matching method is suitable for large-scale Chinese raw corpus, and the performance could be further improved.Keywords:Chinese information processing; Corpus linguistics; V erb-object relationship1 前言中文动宾关系提取任务指的是提取容易在句子中构成动宾关系的动词与名词的词对。