第五章 语义分析
- 格式:ppt
- 大小:299.50 KB
- 文档页数:58
第五章语义和语用语言的意义分为两个层次:一、涉及语言形式如何与它所指代的现实世界发生联系,即语言符号以及符号的组合与现实世界、人类经验的关系。
——语义学(词义、句义)二、涉及语言与使用者的关系,说话人具体运用语言时所要表达的交际目的,即涉及语言形式与语境,特别是与语境中说话者的关系。
——语用学第一节词汇一、词汇的概念及特点1、概念:词汇是一种语言中所有的词和成语等固定短语的总汇,是语言的建筑材料。
2、特点:结构的凝固性(不能随意增删改动或改变词序)和意义的整体性。
3、分类:可以分为基本词汇和一般词汇。
二、基本词汇和一般词汇(04)(08)1、基本词汇是语言中词汇的核心部分,它和语言中的语法一起构成语言的基础。
基本词汇是指语言中产生较早而又比较稳定的、使用频率高的词,为全民所理解。
基本词汇所标记的概念,大多是与人类生存和人类社会生活密切相关的事物、现象和行为,其特点是:稳固性、能产性、全民常用性。
2、一般词汇是词汇中基本词汇以外的词汇。
其特点是:开放性、非稳固性、非普遍性、非能产性。
一般词汇所包含的词数量大、成分杂、变化快。
一般说来,新词、古语词、外来词、方言词、行业用语、科技术语、方言俚语等都属于一般词汇。
社会的变化发展首先会在一般词汇中得到反映。
3、基本词汇和一般词汇的关系:(1)派生关系:一般词汇中的词多是由基本词汇中的词派生的。
(2)转化关系:一方面,一般词汇随着社会的发展,所表示的事物或概念在较长的历史时期与人类社会日益密切变成基本词汇;另一方面,基本词汇也会随着社会发展其所指示的现象或概念与人类社会的联系不再密切从而退出一般基本词汇,变成一般词汇。
4、区分基本词汇和一般词汇的意义:(1)研究语言的历史:基本词汇和语法是语言的基础,具有较强的稳固性,基本词汇是判定亲属语言的重要依据,区分二者,有利于探索词汇及语言的发展。
(2)有利于进行语文教学:基本词汇是语言词汇的核心,构词能力强,一般词汇中大量的词语都是以基本词汇为材料构成的,学习一种语言,应首先学习它的基本词汇,牢固掌握基本词汇就等于掌握了整个词汇的主干。
第二章文本预处理研究图2,1信息过滤中的文本预处理过程当文本的内容被简单地看成是它含有的基本语言单位(字、词、词组或短语等)所组成的集合时,这些基本的语言单位统称为项,也就是说文本D可以用项集(TermList)来表示,即D(T,,T2.…,兀),其中砟是项,1≤女≤H。
本文中,在不引起混淆的情况下,将使用“词”代替“项”这个术语。
定义2.3特征词特征词又称关键词.是指能够较好反映文本内容的项,是文本内容的简约表示。
文本D可以进一步用特征词集表示,即D僻,,膨,…,Km),其中膨是特征词,1≤f≤卅,m≤月。
定义2.4词的权重对于含有H个词的文本D(乃,T2,…,死),词n常常被赋予一定的权重%(1≤女≤”),表示它们在文本中的重要程度,即D(Tj,%;T2.盼:…;L,%)。
有时在特征词条确定时.常简记为D=-D(%.%.…,%)。
定义2.5向量空间模型(VectorSpaceModel,VSM)给定一文本D=D(乃,%;T2,W2;…:L,%),由于死在文本中既可以重复出现又应该有先后次序的关系,分析起来仍有一定的难度。
为了简化分析,可以暂不考虑孔在文本中的先后顺序并要求n互异(即没有重复)。
这时可以把乃,乃,…,瓦看成一个盯维的坐标系,而%,%.…,%为相应的坐标值,因而D(WI,%,…,%)被看成是”维空间中一个向量。
我们称D(%,%.…,%)为文本D的向量表示。
VSM是60年代末由GerardSalton等人提出的,是近几年来应用较多且效果较好的文本表示方法之一。
若非特别说明,本文中的文本均采用VSM表示。
南开人学博士学位论文图2.3利用概念推理网的词组自动识别过程(虚线部分表明实际并不存在)2.3文本潜在特征词(词组)的挖掘近些年,Internet尤其是www(WorldWideWeb)得到了飞速的发展,在线文本信息急剧增加。
人们一方面可以轻松地享有互联网所提供的丰富信息,但另一方面,网络信息安全问题也随之而生,人们越来越容易受到色情、反动、暴力、迷信等不健康信息的侵袭。
第五章语义和语用一、词汇和词义(一)基本词和一般词基本词:一种词汇系统中居于核心地位的部分。
特点:1. 全民常用;2. 稳固性;3. 构词能力强。
(有些基本词没有构词能力,如:表示语法关系的虚词:的、地、得、吗、啊等。
表示指称的代词,如:你、我、他。
基本词汇三个特点之间的关系:互相联系、互相影响、互为因果。
一般词:词汇系统中除了基本词汇以外的所有词汇。
(二)词的词汇意义(词义)和词的语音形式结合在一起的人们对现实现象的反映。
词义是语言得以存在的基础。
词义的特征:一方面是以现实为基础,对现实现象作概括的反映;另一方面,词义往往带有人的主观态度、主观评价色彩。
词义包括理性意义和附加色彩。
理性意义:词义的核心部分,是所有词都具有的,是整个词义的基础。
附加色彩:除理性意义之外表示人们的主观态度和评价的意义。
理性意义比较稳固,附加色彩容易变化。
“天堂、地狱、神、鬼”之类的词虽然是主观臆造的,但其形成仍然具有现实基础。
(三)词义的概括性词义对客观现实现象的概括反映,它不是反映个别的具体的事物的特征,而是反映同一类事物现象的共同特征。
任何词都是在概括。
词义的概括性把纷繁的客观现象化简了,获得了以简驭繁的功效。
词义概括性的特征:一般性、模糊性、全民性。
一般性:词义是从特殊的具体的对象事物中抽象出来的,舍弃了个别的具体事物的特点,反映的是同类事物的共同特征,一般性特点。
模糊性:指人们认识中产生的关于客观事物的边界、状态的不确定性。
词义不是对客观现实的细致反映,而是大致的反映。
产生模糊性的原因:一方面,客观事物是连续不断运动的,难以切割,人们要认识它、把握它,就只能省略一些环节,使之变得相对清晰明确。
另一方面,因为人的个性上的差异,人们的认知水平、心理、态度、爱好及所处的环境都有所不同,对事物的看法并不都一致,很难有一致的标准。
“我们能分清好坏,但是我们分不清好和坏的界线。
”模糊性主要表现在概念的边沿区域,在中心区域概念的区别还是清楚的。
第五章语言的表达内容──语义教学目的与要求:了解语素、词语、词组和句子等语言单位的定义以及具有的意义;了解语音、语汇和语法这三个语言要素的意义第一节语义概说一、什么是语义1、定义:语义指的是“语言的意义”,是语言形式的表达内容2、语义所包括的内容:(1)语汇意义:实词和固定短语所表达的意义语法意义:虚词、语序、形态、句调等所表达的意义。
(2)言内之意:一般的、稳定的意义言外之意:个别的、临时的意义如:今天天气很热(3)理性意义:表达人们对客观世界的事物和现象的认识非理性意义:表达人们的主观情感、态度及语体风格如:你真讨厌二、语义的性质★(1)概括性:人们可以从具体事物中抽象概括出使一类事物区别于他类事物的特征,同时舍弃同类事物之间的各种差别。
如:笔(2)模糊性:模糊性是指词义所反映的对象只有一个大致的范围,而没有明确的界线。
如:土豪、中午。
(3)民族性:由于不同的民族对客观事物的认识不同,对客观事物的概括及分类也存在差异,因而不同语言的语义也会有所不同。
如:龙:中国的龙是一种吉祥的动物;而西方的dragon是一种危害人间的怪物。
三、语义在语言系统中的地位1、要不要研究语义语言形式和语言意义彼此密不可分,互相不能取代,强调语言研究中形式和意义的“结合”2、怎样研究语义:研究各种语言片段表示的语汇意义和语段意义第二节词语的意义一、词义的构成要素1、理性意义和非理性意义(1)理性意义:是人们对主观世界事物的反映,而且是概括性的反映如:山、河、神仙、天堂(2)非理性意义:附着在词的理性意义之上的,因而又叫做词义的附加色彩。
主要表现为:感情色彩、语体色彩、形象色彩2、语素义(1)单纯词:词义=语素义,单纯词由一个语素构词如:书(2)合成词:①词义=语素义+语素义如:皮包②词义并不能从其构成语素义推导而来如:针线3、义项★(1)定义:义项是词典释义的最小单位。
一个词有几个义项,根据词所反映的对象的多少来决定的如:凉:①温度低。
6语⾔学概论第五章语义和语⽤提纲第五章语义和语⽤【内容简介及重点】主要要掌握词义的聚合和组合的种种情况,要能通过具体的材料认识并正确运⽤词汇的⼀般特点。
第⼀节词汇和词义⼀词和词汇1.1 词汇1.1.1 概念(1)词汇是⼀种语⾔中词的总汇,是语⾔的建筑材料。
不同语⾔的词汇系统各⾃独⽴,有⾃⼰的特点。
因为:a.什么样对意义与什么样地语⾳结构在⼀起构成⼀个词,在不⽤语⾔的词汇中是不同的。
b.⼀个词可以只有⼀个意义,但也可以有⼏个意义。
c.甲语⾔中⽤⼀个词来标志的⼀定范围的事物,在⼄语⾔中却要⽤两个或两个以上的词来分别标志;反过来,⼄语⾔的⼀个词所标志的事去在甲语⾔中却要⽤词的组合来标志。
(2)词是⼀种语⾔建筑材料的单位,也就是造句时能⾃由运⽤的最⼩单位。
词是构成语⾔词汇的单位。
(3)语⾔的词汇可以分成基本词汇和⼀般词汇两⼤部分,⽽“语⾔的词汇中的主要东西就是基本词汇”。
从表达概念意义的⾓度看,⼀种语⾔词汇的范围要⼤于词的范围。
1.1.2 基本词汇(1)语⾔中有这样⼀些词,它们标志着与⼈们世世代代的⽇常⽣活关系密切的事物,如⽇常接触的⾃然现象、⼈的器官和肢体、亲属、⽅位和时令、数⽬、某些劳动⼯具以及与⽇常⾔⾏有关的现象等等。
(2)基本词的特点全民常⽤,稳固,有构词能⼒是基本词汇的主要特点。
(3)斯⽡迪⼠核⼼词斯⽡迪⼠核⼼词列表(Swadesh list),是由美国语⾔学家莫⾥斯·斯⽡迪⼠在1940年代到1950年代提出的⼀个列表。
他从统计学的⾓度⽤分析不同的语⾔(以印欧语系语⾔为主),从⽽得出⼀个约莫有200字的核⼼词列表。
他认为,基本上所有语⾔的词汇都应该包含这⼆百多个词语;⽽另⼀⽅⾯,只要认识这⼆百多个词语,亦可以利⽤该种语⾔作最基本的沟通。
1.1.3 ⼀般词汇语⾔词汇中的基本词汇以外的词构成语⾔对⼀般词汇。
(1)特点与基本词汇相⽐,⼀般词汇的特点是:它不是全民性常⽤的,或者虽然在短时期内为全民所常⽤,但不稳固,它所包括的词⼀般没有构词能⼒或构词能⼒⽐较弱。
第五章语义**************************************** 没有语义的语言是毫无意义的。
没有意义地发出声音,就象鸟在树林里唧唧喳喳叫,就象水在溪流里哗啦哗啦响。
我们在语音上捕捉语义,也许象风声过去一样一无所获,也许象熟练的渔民一样满载而归。
**************************************** 第一节 词义一个词有两方面的意义:语法意义和词汇意义。
一般所说的词义指词汇意义,就是词典中对词项所作的说明。
词义是客观事物在人们头脑中的概括反映,并以一定的语音形式固定下来。
书、人、蛇。
1、概括性2、客观性与主观性的辨证统一3、模糊性4、全民性词或名称是标志一类事物的符号。
词义概括了词所指称的客观事物的共同特性。
桌子 椅子 书 车英雄——旧指勇武过人的人;今指不畏艰险,奋不顾身,为人民利益而英勇斗争,令人钦敬的人2、词义客观性词义概括了词所指称的事物的共同特性。
这种概括,是客观事物在人们头脑中的反映,因而词义既有客观性,同时,又有一定的主观性,是客观性同主观性的辩证统一。
词义概括的对象可以是客观存在的,也可以是使用语言的人们想象出来的。
桌子 椅子 火 走 跑 高兴 悲伤鬼怪 神仙 上帝 天堂 地狱通过概括而成的一般的、简单的东西,本身往往带有一定的模糊性,词义指称的只有一个大致的范围,没有明确的界限。
但词义概括反映的现实现象的中心和典型是比较清楚的。
年龄词的模糊性2002年8月30日中中央电视台《开心辞典》栏目有一题目: 世界卫生组织规定,下列哪一年龄段为中年人的年龄段?A、30——45岁 B、40——59岁 C、30——55岁 D、45——59岁 世界卫生组织规定: 45岁以下为年轻人; 45——59岁为中年人; 60——74岁位年轻的老年人; 75以上为老年人; 90岁以上为长寿的老年人; “中年、青年,怎样划分计算?算生命除去几分之几,还是时光走了大半?” ——黄宗英《给中青年科技工作者》 这段诗的前两行说明中年、青年是两个模糊概念,后两行说明模糊概念是不能用精密数学去处理的。
第五章语义1. 简答语言的理性意义和非理性意义.答:语言是交流思想和感情的工具,语义也就必然包含这两方面的内容,即一是思想,就是所谓的“理性意义”,二是情感,就是所谓的“非理性意义”.理性意义也叫逻辑意义或指称意义,是对主客观世界的认识.在词语平面上,它是与概念相联系的那一部分语义,在句子平面上它是与判断和推理相联系的那一部分语义.理性意义是语义的基本要素.非理性意义是说话人的主观情绪、态度以及语体风格等方面的内容,它一般总是附着在特定的理性意义之上.2. 解释“语义”.答:语义是同语言形式结合在一起的意义,同语言形式的结合是语义的基本特征.3. 解释“语言意义”答:语言意义是一般的、稳定的意义,是语言形式本身表达的意义.4. 解释“语境意义”.答:语境意义是个别的、临时的意义,是语言形式在特定的交际场合、知识背景等语境音素作用下所表达的意义.5. 解释“词义”.答:词义是同词的语音形式结合在一起的人们对一定对象的概括反映和主观态度.6. 解释“词的理性意义”.答:同词的语音形式结合在一起时,对一定对象的区别性特征的认识就是词的理性意义.7. 解释“义素”.答:义素是从义项中分析得到的词义的语义特征.8. 解释“义项”.答:义项是词典释义的最小单位,是从词语的各种用例中概括出来的共同的、一般的、稳定的意义.9. 简答义素和语素之间的区别.答:义素和语素不是同一个概念,它们是两种性质上根本不同的单位.义素是对一个词的语义特征进行分析后所得到的最小语义单位;语素则是最小的音义结合体.义素是一种从理论上分析出来的语义单位,就不是一种自然语言的单位,义素不直接与语音相结合.语素不仅有一定的意义而且有一定的读音,是人们可以直接感受到的自然语言的单位.10. 简答义素和义项之间的关系.答:一个词可以同时有几个理性意义,其中一个意义在语言学上叫一个义项.现代语义学把分析音位的区别特征原理用于词义分析,把义项进一步分析为若干语义特征,这些语义特征就是义素.11. 简答词的通俗意义和科学意义的区别.答:词的理性意义由于概括深度上的差别而分为两类:一种是人们对事物所具有的一组非本质特征的反映,这种词的理性意义可以称之为“通俗意义”;另一种是人们对事物的本质特征的反映,这种词的理性意义可以称之为“科学意义”.12. 简答义素分析的作用.答:义素研究在语义研究和语法研究中被广泛使用,在许多方面发挥着重要的作用:(1)义素分析可以清楚间接地说明词义的结构,便于比较词义之间的异同,揭示近义词、反义词等词义关系,有利于词义的研究、学习和掌握.(2)义素分析有助于说明词语组合的语义条件.13. 解释“单义词”.答:单义词即一个词的意义可以概括反映一类现象,单义词只有一个义项.14. 解释“多义词”.答:多义词即一个词的意义可以概括反映相互关联的几类对象,也就是包含几个互相联系的义项.15. 解释“本义”.答:多义词的多个义项中,最初的那个意义叫本义.16. 解释“引申义”.答:由本义直接或间接衍生出来的意义.17. 解释“同义词”.答:同义词指一种语言或方言中意义相同或相近的两个或两个以上的词.18. 解释“反义词”.答:反义词指一种语言或方言中意义相反或相对的两个词.19. 解释“上位词、下位词”.答:语言中有些词所代表的范围大,有些词所代表的范围小,如果后者所代表的事物可以完全包容在前者所代表的事物范围内,那么它们之间就具有上下位关系.其中所代表的范围大的词叫上位词,所代表的事物范围小的词叫下位词.20. 简答多义词和同音词的关系.答:多义词和同音词的共同之处在于它们都是以一个语音形式来表示多个意义.区别在于:多义词的各个意义之间有着内在的联系,同音词的意义之间没有任何联系.多义词是一个词兼有几个互相联系的意义,是词义的一种聚合方式,而同音词则是两个或几个不同的词,与词义的聚合没有直接的关系.21. 为什么多义词在交际中一般不会造成歧义?答:一个词虽然可以有几个意义,但在使用中一般不会产生歧义.(1)词语总是在一定的上下文中使用的,特定的上下文会使多义词只体现一个意义;(2)人们的言语交际总是在一定环境中发生的,特定的交际环境也可以使多义词只体现一个意义.22. 简答近义词之间的差别.答:(1)词的理性意义.有的近义词词义所概括反映的对象只是基本相同,但它们所指的范围不完全重合.有的近义词的词义所概括的对象虽然相同,但在强调的重点、方面或达到的程度都有所不同.(2)词的非理性意义,即附加色彩.有些是感情色彩不同;有些是语体色彩不同.23. 简答语义场的层次性和系统性.答:层次性是语义场的一个显著特点,事物本身的分类是有层次的,因而反映事物类别的语义场也就形成了有层次的结构,若干较小的语义场可以集合成较大的语义场,若干较大的语义场可以集合成更大的语义场.系统性也是语义场的一个重要特点.一个语义场就是一个局部的语义系统.在这个系统中,类属义划定的意义领域,被划分为若干块并分配给不同的词语,这些词语以一种互补的方式来对同一意义领域进行反映.系统中某个词语的意义会受到系统中其他词语的制约,系统中某个词义的变化或词语数量的增减,会导致意义领域的重新划分和分配,从而引起系统中其他词义的变化.语义场的系统性的特点反映出语言的词汇具有一定的系统性.24. 解释“关系意义”答:词语在组合时都要形成一定的结构关系,由这些结构关系所赋予的意义就叫做关系意义,包括语法关系意义和语义关系意义.25. 解释“语气意义”.答:反映说话人使用句子的目的和说话人情绪的意义,包括陈述、疑问、祈使、感叹等不同的意义.26. 解释“述谓结构”答:从语义结构上看,一个句子包括“情态”和“命题”两部分,情态包括时态、语态、语气等方面的意义,情态以外的部分即命题.一个命题在语义结构上可进一步分析为一个“述谓结构”.一个述谓结构由一个“谓词”和若干个“变元”组成,谓词一般就是句子中的谓语动词或形容词,是处于支配地位的核心成分.27. 解释“语义指向”.答:句子某个成分在语义上指向哪儿,或者说同哪个成分或哪些成分发生语义联系,就是这个成分的语义指向.28. 解释“歧义”.答:歧义是指同一形式的语言符号序列可能表达不同意义的现象.29. 解释“变元”.答:变元又称“题元”、“项”等,是与谓词有直接关系并受谓词支配的语义成分.变元一般都是名词性的词语,在句子中经常充当主语或宾语.30. 解释“语义角色”.答:根据谓词和变元之间不同的关系,可以把变元分为若干个类型,这种变元的类型一般称之为“语义角色”.常见的语义角色有施事、受事、与事、工具、结果、处所等.31. 解释“蕴含”.答:蕴含是句义之间的关系的一种,就话语本身所表达的意义而言,如果有句义甲就必然有句义乙,就说甲蕴含乙.在一般情况下,蕴含的规律是含有下位概念或局部概念的句义蕴含有上位概念或整体概念的句义,而不是相反.这种蕴含关系通常可以从句子本身的意义推知,而不必以来特殊的背景关系.用公式表示为甲乙.32. 解释“预设”.答:预设是句义之间的一种关系,预设是就话语本身表达的意义而言的,有句义甲就必然有句义乙.蕴含包含在句子的断言范围内,是句子的基本信息;预设不在句子的断言范围内,是句子的背景信息,用公式表示为甲乙.33. 为什么谓词是处于支配地位的核心地位?答:一个述谓结构可以有多少变元以及可以有何种性质的变元,都是由谓词的语义决定的.因为谓词语义规定了述谓结构的内容,从而也就规定了句子的语义框架,有了这个语义框架,在用符合谓词语义要求的变元把这个框架填满,就产生了句子的命题.因此,在述谓结构中,谓词是处于支配地位的核心成分.。
第五章词汇和语义【教学目的】认识词汇的构成和词义的特点;掌握词义的聚合与组合;词语在思想表达中的灵活运用。
简单了解语义学的发展;了解语义特征分析法和相关的语义场理论。
【基本概念】词汇基本词汇一般词汇词义理性意义附加意义单义词和多义词本义基本意义派生意义引申隐喻换喻区别性语义特征义位义素语义特征分析法语义场上下义关系同义关系反义关系多义关系义项第一节词汇的性质和构成第二节语义第一节词汇的性质和构成一.词汇的定义词汇:一种语言中所有的词和成语等固定用语的总汇,是语言结构系统的一个要素。
它只能指一种语言中全部词和成语等固定用语的整体,而不能指具体的一个一个的词或成语。
它分为基本词汇和一般词汇两种:二.词汇的性质特点1、语言的建筑材料→从功能角度言的。
其最终职能是进入句子→完成交际2、词汇是语言符号聚合而成的分层体系→系统性。
(各级单位有序的组合体:彼此联系,共同制约)3、具体语言中的词汇形成特定的系统→民族性4、直接反映社会变化→发展性三.词汇的构成基本词汇:词汇体系中,标志着与人们世世代代的日常生活有密切关系的事物的词以及表示事物关系的常用虚词的总汇。
是一种语言的词汇的核心部分,是人们自古至今常用的,用来表达日常事物现象的,并成为构成新词基础的那一部分。
基本词汇具有全民常用性,稳固性,能产性三个特点。
一般词汇:词汇中基本词汇以外的词构成的集合体,其特点是变化迅速,缺少历史稳固性.构词能力差,包括古语词.方言词.外来词.新造词等。
固定结构的总汇(熟语总汇)(1)成语:固定的结构形式和完整的意义→结构的定型化+意义整体性+语法作用相当于词(2)惯用语:人们口头上经常使用的结构定型、意义完整的固定结构。
结构形式有一定的灵活性。
(3)专有名称:专门用来指称某类事物、现象的固定称谓。
(4)固定的句子结构:谚语、歇后语→人们口头上流传形成的,具有固定形式和完整的内容,可作为词的作用进入句子,也可独立成句,应该也属于词汇的范围。