当前位置:文档之家› 语义特征分析

语义特征分析

语义特征分析
语义特征分析

语义特征分析

一、含义

?语义特征是语言单位之间相互联系或相互区别的语义要素,它很大程度上制约着语言单位相互组合的可能性以及组合的方式,反映了语言单位的组织形式跟现实世界的对应关系。

?语义特征分析为进一步分化同形句式,为根据句法研究的需要对同一类实词划分小类,提供了更为可靠的句法、语义依据,因此语义特征分析无疑使语法研究朝着形式和意义相结合的方式迈出了更可喜的一步

二、作用

?语义特征分析能够促使语法研究的精密化,从而使语法研究更具解释力。20世纪80年代以来,语义特征分析在汉语语法研究中得到了广泛的运用。除朱德熙以外,陆俭明、邢福义、马庆株、邵敬敏等都是积极实践者。概括起来,语义特征分析在以下诸多方面有很强的解释力,具有广泛的实践价值。

?(一)语义特征分析能够较好的揭示一个句法组合能否成立的原因。“香蕉、苹果、梨子、杨桃”因为共有[+水果]的范畴特征而被认为是有意义的组合,而“香蕉、石子、泉水、黄土”因为缺乏共同的范畴特征而不被理解。“笔墨纸砚”、“桌椅板凳”、“锅碗瓢盆”、“油盐酱醋”都是这种类型的并列。“吃馒头”可说而“喝馒头”不能被接受,同样“喝汤”可说而“吃汤”不能被接受。“吃”和“喝”的这种对立可以用语义特征表示为:吃[+施事;+固体食物;+咀嚼;+吞咽],喝[+施事;-固体食物;-咀嚼;+吞咽]。

?(二)语义特征分析可以揭示某些词语的比较隐蔽的语义特征。例如“写、搛、留、舀”等动词本身并不包含“给予”的意义。但当说到“写信、搛菜、舀汤、留座位”的时候,就有可能取得“给予”的意义[6]。这时,它们可以跟“卖、送、递、让”等本身包含“给予”意义的动词一样,可以出现在“V+NP(受)+给+NP(与)”或“V+给+NP(与)+NP(受)”格式中。例如:?(2)写一封信给老王? 写给老王一封信

?舀一瓢水给小张(喝)? 舀给小张一瓢水(喝)

?留一个座位给老大爷? 留给老大爷一个座位

?“写、搛、留、舀”等的这种特性使它们有别于其他行为动词,如“看、读、撞、拉”等。?(三)语义特征分析可以揭示某些句式能否成立的语义依据。例如,现代汉语里有一种由形容词加“(一)点儿”构成的祈使句:形容词+(一)点儿!可是,并不是所有的形容词都能进入该句式[7]。试比较:

?(3)A. 虚心点儿!积极点儿!坚强点儿!

?主动点儿!灵活点儿!大方点儿!

?B. 粗一点儿!近一点儿!高一点儿!

?浓一点儿!大一点儿!慢一点儿!

?C. *骄傲点儿!*悲观点儿!*罗嗦点儿!

?*胆小点儿!*嘈杂点儿!*蛮横点儿!

?D. *可爱点儿!*健康点儿!*伟大点儿!

?*优秀点儿!*美丽点儿!*高尚点儿!

?(3)中四组格式中的形容词的语义特征可以用矩阵图区别如下:

?(3')形A:[+褒义,-贬义,+可控]

?形B:[-褒义,-贬义,+可控]

?形C:[-褒义,+贬义,±可控]

?形D:[+褒义,-贬义,-可控]

?可见,只有同时具备[-贬义]和[+可控]两项语义特征的形容词才能够进入以上格式。?(四)语义特征分析能够较好地解释某些看似狭义同构的句式的内部差异,同时为词类的进一步细分提供“最可靠的语法、语义依据”[4]。例如:

?(4)a. 兰兰在钢笔上刻记号

?? 兰兰刻记号在钢笔上

?b. 明明在帽檐上别校徽

?? 明明别校徽在帽檐上

?c. 兰兰在冰柜里取饮料

?≠兰兰取饮料在冰柜里

?d. 明明在碟子里抓花生米

?≠明明抓花生米在碟子里

?e. 兰兰在词典里查生词

?* 兰兰查生词在词典里

?f. 明明在兰兰头上数白发

?* 明明数白发在兰兰头上

?(4)中各例原式可以抽象为:

?N1+在+NPL+V+N2

?可以看出,(4)a和(4)b的V具有[+使附着]的语义特征,这使“在+NPL”移至补位后语义关系保持不变;(4)c和(4)d的V具有[+使去离]的语义特征,这使“在+NPL”移至补位后语义关系发生了很大变化;(4)e和(4)f的V既不具有[+使附着]特征,也不具有[+使去离]特征,这使“在+NPL”不能被移至补位。

?同时,通过语义特征分析,格式中的动词V被划分为三个小类:“附着”类、“去离”类和“非附着、非去离”类。

?(五)语义特征分析可以揭示同形格式中相关词语语义指向不同的原因。例如:

?(5)a. 我给了他一本自己的书。

?b. 我送了他一筐自己种的蔬菜。

?c. 我告诉他好几遍自己的通讯地址。

?d. 我要了他一本自己的书。

?e. 我买了他一筐自己种的蔬菜。

?(5)a-c中的动词具有[+给予]的语义特征,而(5)d-f中的动词具有[+获取]的语义特征。动词语义特征的不同影响到句中的“自己”的语义指向也不同:(5)a-c的“自己”指向句首主语“我”,(5)d-f的“自己”指向间接宾语“他”。

?(六)一些句法格式究竟表示怎样的语法意义,以及该格式的组成成分究竟需具有怎样的语义特征,二者可以互相鉴定。换言之,语义特征分析可以帮助揭示某些结构或某些句式的语法意义,同时可以促进对已有认识的改进。例如:

?(6)把冷菜热热*把冷菜扔扔

?把衣服晒晒*把衣服看看

?把门窗修修*把门窗拆拆

?把地板拖拖*把地板指指

?把文章读读*把文章写写

?把战马刷刷*把战马骑骑

?(6)左列的动词可以重叠,右列的动词不可以重叠。这跟把字句的语法意义和动词本身的语义特征都有关系,但目前对把字句的认识并不能很好解释这种现象。这就促使人们对把字句的语法意义进行更加深入的思考。

?(七)语义特征分析有助于促进机器翻译和人机对话的研究。语义特征决定词语组合的可能性和组合的方式,它制约着词语和词语之间的搭配,也制约着语法单位的组合和表达。计算机自动生成句子需要人工对词项进行语义特征的标注,因此,语义特征的研究状况直接影响计算语言学的进展

三、语义特征的提取

?三、语义特征的提取

?索绪尔认为,在整个语言的机构中,一切要素都是按照组合关系和聚合关系来运行。这个观点已经得到人们的普遍接受,并以此为基础来开展研究。但是不同语言单位何以能够组合,何以能够聚合,类似问题却一直未见有正面的系统而深入的讨论。事实上,不同语言单位之所以能够组合或聚合,首先是因为它们具有相容性语义特征。具有相容性语义特征的一组词语如果不是完全等义(事实上等义词在词汇系统中只占很小的比率),这样就会存在区别性语义特征。因此语义特征的提取实际包括相容性语义特征的提取和区别性语义特征的提取。

?(一)相容性语义特征可以从词语组配、词义系联、词典释义等途径提取。

?1.词语组配。根据“语义一致性原则”,“两个词语能够组合成一个语言结构,它们必定具有某个或某些相同的语义特征。”[9]例如,状态形容词“雪白、冰冷、红彤彤”不能受“很”修饰,而性质形容词“白、冷、红”则可以,这是因为前者的[+极性量]特征跟“很”的语义特征不相容,而后者的[+可变量]特征跟“很”的语义特征相容的缘故。相容性语义特征可能由于组配对象的不同不一定完全一致,例如在“烧了一张纸、烧了一件衣服”中“一张纸、一件衣服”的[+可燃;+可毁]特征跟“烧”的[+燃烧;+使消失]特征相容,而“烧了一壶开水、烧了一锅鸡汤”中的“(开)水、(鸡)汤”的[+可加热;+可使成]特征跟“烧”的[+加热;+使成]特征相容。这种情况会导致某些结构产生歧义,例如“烧了一车炭”就存在二解。

?2.词义系联。马庆株指出,“词义系联分为同义系联和不同义系联两类。经过同义系联替代之后可以得到表示同一意义的词语的聚合,这表示同一意义的词语有相同的语义特征。”例如“逃跑、喊叫、修理、折叠、尝试、收藏”等,构成这些词的同义的成词语素在单独成词时一定有共同的语义成分。“不同义系联包括上下位系联、类义系联,系联的结果得到上下位词。类义词,原词与其上下位词、类义词也一定有共同的语义特征。此外反义系联得到的反义词虽然不能保证语义特征完全相同,但总会有共同的语义成分。”[10]马先生还认为,通过方言际、语际比较和对比,即比较词义学和对比词义学的方法也可以发现语义特征。例如可以从“看、瞧、瞅、望、瞄”,“搅和、和弄、和、搅、拌、调”两组中分别找出共同的语义成分。

?3.词典释义。有时,借助于词典对词义的解释可以帮助确定词语的相容性语义特征。对比下列两组例子:

?(7)字写在黑板上在黑板上写字

?灯笼挂在屋檐下在屋檐下挂灯笼

?秧苗插在水田里在水田里插秧苗

?纸船漂在水面上在水面上漂纸船

?(8)*饭吃在食堂里在食堂里吃饭

?*手洗在盆子里在盆子里洗手

?*信寄在邮局里在邮局里寄信

?*歌唱在教室里在教室里唱歌

?(7)既有“N+V+在+Np”格式,也有“在+Np+V+N”格式;(8)只有“在+Np+V+N”格式,而“N+V+在+Np”格式不成立。这是因为“N+V+在+Np”格式中的“在+Np”表示N通过V 导致的结果或状态,而“在+Np+V+N”格式中的“在+Np”只表示V动作发生的处所。(8)中的V不能致使N产生“在+Np”表示的结果或状态,而(7)则可以。《现代汉语词典》对(7)中的V的释义可以说明这一点[11]:

?写:用笔在纸上或其他东西上做字。

?挂:借助于绳子、钩子、钉子等使物体附着于某处的一点或几点。

?插:长形或片状的东西放进、挤进。刺进或穿入别的东西里。

?漂:停留在液体表面不动。

?这些动词的语义特征可以概括为[+使附着于某处],这跟整个格式的语义特征相容[12]。?(二)区别性语义特征可以通过句法变换、性质对比、添加成分等途径提取。

?1.句法变换。陆俭明认为,变换分析的依据有三点[13]:语言表达的多维特点致使语言中相同的语义结构可以用不同的句法格式来表达,从而造成大量的同义格式,如“我送给他一本书”可

以根据表达的需要说成“书我送给他了”、“我送了本书给他”、“我把书送给他了”等。其次,要表达的意义是无限的,而格式则是相对有限的,因此用有限的格式来表达无穷的意义势必会造成大量的同形格式,如“山上架着炮”既可以理解为“山上正在架着炮”,也可以理解为“炮架在山上”。第三,含有相同语义结构关系的不同句法结构之间总是存在着某种内在的结构关系。根据以上事实,一些同形格式可以通过格式变换进行分解。例如:

?(9)a. 去的是工作队

?b. 看的是工作队

?c. 做的是工作队

?(9)的句法形式相同,可以抽象为“V+的+是+N”格式,但它们的语义关系是不一样的。这可以通过句法变换来检验。首先,虽然它们都可以变换为“N+V”,但V的语义自足性有差别,“工作队去”是自足的,而“工作队看”和“工作队做”的V缺乏受事而不自足,这说明“看”“做”和“去”的语义特征存在差别。其次,上述格式变换为“V+N”后,(9)a和(9)c不能变为该格式,只有(9)b能变为该格式(“看(望)工作队”,不过,“工作队”由变换前的施事变成了受事。这说明“看”和“做”的语义特征也存在差别。综合起来,“去”“看”“做”代表了三类不同语义特征的动词,在对受事角色的要求这一点上,“去”类动词的语义特征可以描写为[-有生受事/-无生受事],“看”类动词的语义特征可以描写为[+有生受事/+无生受事] ,“做”的语义特征可以描写为[-有生受事/+无生受事]。

?2.性质对比。语义特征分析也可以从考察词语的语法性质入手。比如,一般认为名词不受表示时体意义的副词“已经”,“都”,“才”等修饰,也不能跟体助词“了”共现。如:

?(10)桌子:*才桌子*已经桌子了*都桌子了

?汽车:*才汽车*已经汽车了*都汽车了

?蓝图:*才蓝图*已经蓝图了*都蓝图了

?但例外也不少。例如:

?(11)星期二:才星期二已经星期二了都星期二了

?三月份:才三月份已经三月份了都三月份了

?中学生:才中学生已经中学生了都中学生了

?副教授:才副教授已经副教授了都副教授了

?通过对比,(10)的名词不跟同类名词形成顺递关系,因而不具有[+顺递]特征,而(11)的名词可以跟同类名词形成顺递关系,因而具有[+顺递]特征。但是,(11)的名词仍有区别:有的可以在前面加“又是”,有的不可以。由此(11)又可以分为两类:

?(11')星期二:才星期二已经星期二了

?又是星期二了

?三月份:才三月份已经三月份了

?又是三月份了

?(11″)中学生:才中学生已经中学生了

?*又是中学生了

?副教授:才副教授已经副教授了

?*又是副教授了

?可以前加“又是”的名词具有[+可循环]的特征,不可以前加“又是”的名词不具有[+可循环]特征。可见,名词可以分为三类:“非顺递非循环”名词、“可循环顺递”名词和“不可循环顺递”名词

?3.添加成分。添加成分提取语义特征的根据仍然是“语义一致性原则”。马庆株认为,“两个词之所以能够搭配组合,是因为它们有共同的意义或语义特征给了它们以亲和力或组合力。”[10]例如“看书”是表示活动的动词语,本身无内在终结点,具有[+无界]的特征;“看一本书”中“看”的无界性和“一本书”的有界性导致该动词语的界性特征是模糊的,既有[+有界]的一面,也有[+无界]的一面;而“看完一本书”中的“看完”和“一本书”都是有界性的,因此整个词语也具有[+有界]的特征。它们在界性特征上的区别可以通过添加时量短语得以进一步突显:

?(12)看书:看书看了一个上午了。

?看一本书:看一本书看了一个上午了。

?看完一本书:看完一本书看(完)了一个上午了。

?“看书”后接时量短语,表示活动持续(呈“无界”特征)的时间;“看一本书”后接时量短语,既可以表示活动持续的时间,也可以表示活动结束后(呈“有界”特征)事件状态的持续时间;“看完一本书”后接时量短语,表示活动结束后事件状态的持续时间。

?(三)语义特征提取方法的综合运用。由于语义特征对词语的组合、聚合、乃至词语的句法性质等都起到约束限制的作用,因此对语义特征的分析有时并不局限于某一种特定的方法,而是从不同角度综合运用多种方法来进行。

?马庆株通过添加时量短语研究过动词的语义特征对时量短语的语义的影响[14],他在区别“看”类和“等”类动词时除了添加时量短语外,还设计了一种语义解释型的变换式:

?是T前V完的

?检验的结果是,“看”类动词(弱持续性动词)能适应这个变换式,具有[+完成]这一语义特征,而“等”类动词(强持续性动词)不能适应这个变换式,因此不具有[+完成]这一语义特征。?再如,“不”和“没(有)”都有共同的语义特征,即[+否定],但它们显然还存在下位区别。比较:

?(13)这只菠萝不大*这只菠萝不拳头大

?我家离他家不远*我家离他家不几里远

?(14)*这只菠萝没大这只菠萝没拳头大

?*我家离他家没远我家离他家没几里远

?*这块砖头没重这快砖头没两斤重

?(13)和(14)左列是对“不”和“没(有)”的语法性质的对比,说明“不”后可接性质形容词,而“没(有)”却不能;(13)和(14)右列则采用了添加成分的方法,说明“不”后的性质形容词不能受离散性名词(有界名词)修饰,而“没”后的性质形容词却可以受离散性名词修饰。“不”和“没”分布的不同,说明它们下位语义特征存在着差别。“不”和“没(有)”的语义特征可以描写为:不[+否定;+连续;-离散],没(有)[+否定;-连续;+离散]

语义分析

语义分析 1.语义分析? 机器机和人不一样的地方是人可以直接理解词的意思,文章的意思,机器机不能理解。 人看到苹果这两个字就知道指的是那个圆圆的,挺好吃的东西,搜索引擎却不能从感性上理解。但搜索引擎可以掌握词之间的关系,这就牵扯到语义分析。 可参考:https://www.doczj.com/doc/7e5205866.html,/dispbbs.asp?boardID=2&ID=74541 2.为什么要使用语义分析? 我国中文自然语言处理普遍采用西基于拉丁语系的“关键词”技术,以此来分析理解中文。然而,中文本身的特点决定它与西语之间巨大的区别,所以从汉语信息处理的需要看,当前急迫需要突破的是语义问题。 可参考: https://www.doczj.com/doc/7e5205866.html,/dicksong2008/blog/item/88fb751e9ac9501a4134 17f4.html 2.1中文与西语不同决定我们无法采用西语的架构体系来处理中文,具体区别在于: 西语词间有间隔,汉语词间无间隔。众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。 例如,英文句子I am a student,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白“学”、“生”两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。 “我是一个学生”,分词的结果是:“我是一个学生”。中文分词就成了计算机处理的难题。 汉语形态不发达,句尾没有形态标记。英语动词、名词很清楚,加上词尾可以是副词;西语有时态,过去式、现在式等等非常清楚,中文则依靠词语或者依靠自己的判断来确定时态。 同音字多增加了机器识别的难度。 汉语语义灵活,由于形态不发达,所以语序无规律。在一次学术会议上,一位著名的人工智能专家说:“按…主-谓-宾?或…名-动-名?这一规则,计算机可显出…牛吃草?,也可显出…草吃牛?。从语法格式上看,…草吃牛?也不错,但这句话是说不通的。 人依靠自己的经验可以判断,机器如何来判断呢?

语义分析程序的设计与实现

语义分析程序的设计与实现 班号:2008211316姓名:张荣学号:08211627序号:26 实验日期:2010-11-23 一:实验内容: (2) 二:实验要求: (2) 三:实验方法: (2) ◆由LEX建立YACC的词法分析程序 (2) ◆yacc原理介绍 (3) ◆词法分析 (4) ◆解析器如何工作 (5) ◆Yacc环境 (6) ◆常用代码 (7) 第四:YACC内部名称: (7) 第五:运行结果(源代码见附录) (8) 第六:实验总结 (9) 第七:附录 (10) 附录一:yacc程序,加注释 (10) 附录二:词法分析器的工作原理 (16)

一:实验内容: 编写语法分析程序,实现对算术表达式的语法分析,要求所分析的算术表达式由如下的文法产生。 ◆E->E+T|E-T|T ◆T->T*F|T/F|F ◆F->id|(E)|num 二:实验要求: 在对表达式进行分析的同时,输出所采用的产生式。 可以采用多种方法 ◆编写递归调用程序,实现自顶向下的分析。 ◆编写LL(1)语法分析程序,要求: ◇编程实现算法4.2,为给定的文法自动构造预测分析表 ◇编程实现算法4.1,构造LL(1)预测分析程序, ◆编写语法分析程序,实现自底向上的分析,要求: ◇构造识别所有活前缀的DFA ◇构造LR分析表 ◇编程实现算法4.3,构造LR分析程序 ◆利用yacc自动生成语法分析程序,调用LEX自动生成的词法分析器程序 三:实验方法: ◆由LEX建立YACC的词法分析程序 由LEX产生的词法分析程序可用于YACC,LEX编译程序根据LEX

源程序产生词法分析程序yylex(),这个名字就是YACC所需要的词法分析程序的名字。如果YACC要调用LEX产生的词法分析程序,则在YACC源程序的第三部分用语句#include“lex.yy.c”代替函数yylex()的定义,这一yylex()就可以访问YACC中记号的名字,因为LEX的输出时候YACC输出文件的一部分,所有,每个LEX的动作都返回YACC 知道的终结符。 在UNIX的环境下,如果LEX源程序在first.l中,YACC的源程序在second.y中,可以使用以下命令得到所需要的分析程序。 Lex first.l Yacc second.y cc-o yaccdemo y.tab.c lex.yy.c ◆yacc原理介绍 Yacc 是用可移植的C 语言写成的。接受的规定类别是非常一般性的: 带有去歧义规则的LALR(1) 文法。 Yacc 提供了一个通用工具来在计算机程序的输入上施加结构。Yacc 用户准备输入处理的规定;它包括描述输入结构的规则,在识别了这些规则的时候调用的代码,和做基本输入的一个低层例程。Yacc 接着生成一个函数来控制输入处理。这个函数叫做解析器(parser),它调用用户提供的低层输入例程(词法分析器(analyzer))来从输入流中选取基本项目(叫做记号(token))。依据叫做文法规则的输入结构规则来组织这些记号;在识别了这些规则中的某一个的时候,接着调用为这个规则提供的叫做动作的用户代码;动作有能力返回值并

把字句的语义特征

“把字句”的语义分析 孙志景 我们这里所要讲的句式指的是一种比较有特色的动词性谓语句——把字句。把字句是用介词“把”将谓语动词支配关涉的对象提到动词前面的句子,它是现代汉语中很重要、很有特色的句式。其形式是“主语+(把+宾语)+谓词性词语”。 在现代汉语中,句子是语言运用的基本单位,它由词、词组(短语)构成,能表达一个完整的意思,如告诉别人一件事,提出一个问题,表示要求或者制止,表示某种感慨,表示对一段话的延续或省略。句子和句子中间有较大停顿。它的结尾应该用上句号、问号、省略号、或感叹号。 我们这里所要讲的句式指的是一种比较有特色的动词性谓语句——把字句。把字句是用介词“把”将谓语动词支配关涉的对象提到动词前面的句子,它是现代汉语中很重要、很有特色的句式。其形式是“主语+(把+宾语)+ 谓词性词语”。把字句强调的是对某物的处理结果。把字句是一种有特色的句子,那么这种句式到底有什么特点呢?第一,谓语动词大多数是表动作的及物动词,并且在语义上能支配把字后边的词语。及物动词一般后面都可以接宾语。例如:他把书看完了。“看”是及物动词,在语义平面“书”是“看”的受事。当然,这里的“书”可以被“看”所支配。又例如:“我踩到了石头”一句就不能改成了把字句,这里的“踩”对“石头”没有支配能力。第二,谓语动词(特别市单音节词)的后面或前面通常都有一些别的词语。例如:他把作业做完了。动词“做”的后面加了“完了”一词,表示一种结果,作业完成了。同时,又例:我把论文认真地审查了一遍。这个句子中,谓语动词前面加了“认真地”修饰动词,表明一种态度;而谓语动词的后面也加了“一遍”表示一种频率或者一个量。当然,有些谓语动词本身含结果意义,如“采纳、接受、拒绝、说服”等,这类动词如果前面有某些状语,后面可以没有别的词语。例如:董事会已经把她的建议采纳了。“已经”一词表示一种完成的结果,同时 采纳也有一定的结果含义,那么动词后面可以不用加词语。第三,“把”字后面的词语所代表的事物一般是定指的,是上下文出现过或交际双方都知道的。上例中的“作业、话、论文”都是定指的。有时候“把”字后面的词语包含有“一个、几个”之类的词语,但说话人认为所指的对象或范围仍是明确的。例如:我们把一个强大的中国带入了二十一世纪。这里的“中国”这个当然是特指,而后面的“一个”也是特指的,是大家都知道的,所表示的物象是明确的。第四,如果句中有否定副词或助动词,则出现在“把”字前面。例如:他没有把话说清楚。这里的“没有”要放在把字的前面。其实,看到这个特点,我想起了英文中的一个词“think”,跟我们这个把字句的这个否定特点很相似,都是将否定词放在前面。 前面都是在讨论“把”字句一些特点,下面我们就要讲讲把字句的作用。首先,语用表达的需要:强调动作的处置结果。这种把字句有不用把字的相对格式。例如:他推翻了原计划。//他把原计划推翻了。把字句就是把大家的焦点聚焦在句末,聚焦在谓语动词上,是大家能够更好地理解句意。在这个例子中强调的是已然的处置结果推翻了。又例:我明天可以看完这本书。//我明天可以把这本书看完。这里强调的是未然的处置结果看完。当然,也有一些“把”字句强调动作的致使结果,这种把字句的谓语中心通常是不及物动词或形容词。例如:繁忙的工作把他累垮了。其次,是在使用过程中结构上的需要。同时它们没有其相对格式。这里,有三种情况:第一,动词紧接着补语,不允许宾语将它跟动词隔开,这种情况一般用把字短语。例如:他把自行车放在车棚里。(“放”与“在……”关系密切)。第二,动词带双宾语,其中的一个或两个宾语都比较复杂,放在一起累赘拖沓,这种情况一般用“把”字把直接宾语提前。例如:我们把那封最后的通牒式的信退还给了他们。第三,动词后有“为、

英语习语解析——认知语义学视角

Vol.28No.3 M ar.2012 赤峰学院学报(自然科学版)Journal of Chifeng University (Natural Science Edition )第28卷第3期(下) 2012年3月英语习语凝聚了英语民族人民的勤劳和智慧,是英语语言国家历史文化发展的结晶,体现了英语国家丰富的历史文化背景.学习英语习语可以成为英语专业学生学习和了解英语语言文化的一扇窗.可是,英语习语却因其结构与语义之间的差异,涉及面广泛繁杂,大多与民族历史发展、地理环境、传统习俗、宗教信仰,神话传说有关,而使学生深感习语语义难以理解,难以记忆,用法难以掌握.认知语义学研究表明,语言的意义与人的认知经验密切相关,习语的意义也是在人类在认知世界的过程中,通过一定的认知机制发展起来的,本文拟从认知语义学的角度出发来揭示英语习语的本质,并运用概念隐喻、转喻与常规知识等主要认知机制分析英语习语的语义.1 传统语义学对习语语义的阐释 传统语义学认为,习语是具有固定的结构,在语义和语法上能独立运用的词组.它的意义一般不能由各组成部分推断出来(王宗炎,1988).习语是独立于大脑理性思维和人类认知经验之外的抽象符号,它的本质是词汇,是语言系统的一个部分,而不是概念性的. 习语语义具有完整性,我们必须把习语作为一个整体来理解,构成习语的各个词汇失去了它们独立的语义,正如构成单词的每一个字母一般,分开以后毫无意义可言.习语的意义不是构成它的各个单词的意义的相加;如果将其拆分开,尽管可以理解每个单词的意义,但是仍然无法理解这个习语的意义.比如,“I am under the weather ”一句中,un-der the weather 意指“unhappy ”,单从字面意思来理解,毫无无法解释,一个人怎么能“在天气之下”呢?这也正是传统语言学家从习语的语义整体性来研究习语的原因. 习语具有结构的固定性,一般不能用别的词来代替,即使是同义词也不可以,比如,have an axe to grind (另有打算),不能换成“have a hatchet to grind ”.还有,习语中冠词的用法,名词单复数的用法,动词的主动或被动形式等都是固定的,大部分都不能随便进行句法转换.传统语义学认为,习语是一种约定俗成的习惯用法,是一种死喻,对于习语的学习就是死记硬背,模仿和记忆.2认知语义学视角下的习语意义阐释 2.1 习语是概念化的产物 针对传统的客观主义语义学观点,Lakoff &Johnson (1999)提出了基于体验哲学的认知语义观.他们认为人类的知识结构并非符号结构,也不能与客观世界直接对应,人类的知识结构,是概念结构,是人客观世界互动过程中逐渐获得.意义是基于体验的心智现象,是主客观互动的结果.意义需依靠原型范畴,概念化、意象图示来限定的.范畴、概念、推理和心智并不是外部现实客观的、镜像的反映,也不是先天就有的,而是人们在对客观外界感知和体验的基础上认知加工而形成的.完全可以想象,我们的祖先是从认识空间和自身开始认识世界的.人们在经验和行为中形成了范畴和概念,与此同时也就形成了意义(王寅,2007). 从这个意义上来看,习语也是人类认知和体验的结果.因此,我们可以这样认为,在语言和现实之间存在思维和认知这一中间层次,如果不依赖范畴知识、概念结构和认知方式,就无法接近现实.习语是人类概念体系的产物,不仅仅属于语言本身的问题.习语确实有它的特殊意义,我们应看到这些特殊意义正是来源于人类对客观物质世界的认识,而我们的概念体系正体现了这种认识. 在日常生活中,人们往往参照他们熟知的,有形的,具体的概念来认识、思维、经历、对待无形的、难以定义的概念,形成了一个不同概念之间相互关联的认知方式.以head 一词为例,the head of deparment,head of state,head of government,head of page,head of queue,head of a flower,head of stairs,head of a bed,head of a tape recorder,head of syntactic construction …在head 的所有例子中,所表达的概念都与“头”这一概念紧密联系,表达“the front part of …”或“the vitally important part ”. 比如,在英语中有大量这样以身体词汇概念,产生的习语,play it by ear(随机应变,见机行事),rack your brains (绞尽脑汁想),turn a blind eye (熟视无睹),a stiff upper lip (泰然自若,坚定不移),keep your mouth shut and your eyes open (多看少说),从这些习语的语义,可以看出人类的认知 英语习语解析———认知语义学视角 李红珍 (孝感学院外国语学院,湖北孝感432000) 摘要:认知语义学为我们提供了探索习语语义的新视角。传统的习语意义观认为习语是不可分析、任意的.认知语义学则认为习语是概念体系的产物,其意义有理据和可分析性.在英语教学中运用认知语义学理论解释和分析英语习语的语义,可以提高学生准确运用习语的能力. 关键词:习语;认知语义学;认知机制中图分类号:G642.3 文献标识码:A 文章编号:1673-260X (2012)03-0250-02 250--

现代汉语语法的五种分析方法

现代汉语语法的五种分析方法

现代汉语语法的五种分析方法 很有用,请好好学习之。 北语之声论坛专业精华转贴 现代汉语语法的五种分析方法是语法学基础里 很重要的一个内容,老师上课也会讲到,我在这 里把最简略的内容写在下面,希望能对本科生的专业课学习有所帮助 详细阐释中心词分析法、层次分析、变换分析法、语义特征分析法和语义指向分析的具体内涵:一. 中心词分析法: 分析要点: 1.分析的对象是单句; 2.认为句子又六大成分组成——主语、谓语(或述语)、宾语、补足语、形容词附加语(即定语)和副词性附加语(即状语和补语)。 这六种成分分为三个级别:主语、谓语(或述语)是主要成分,宾语、补足语是连 带成分,形容词附加语和副词性附加语是附加成分; 3.作为句子成分的只能是词; 4.分析时,先找出全句的中心词作为主语和谓

语,让其他成分分别依附于它们; 5.分析步骤是,先分清句子的主要成分,再决定有无连带成分,最后指出附加成分。 标记: 一般用║来分隔主语部分和谓语部分,用══标注主语,用——标注谓语,用~~~~~~标注宾语,用()标注定语,用[ ]标注状语,用< >标注补语。 作用: 因其清晰明了得显示了句子的主干,可以一下子把握住一个句子的脉络,适合于中小学语文教学,对于推动汉语教学语法的发展作出了很大贡献。 还可以分化一些歧义句式。比如:我们五个人一组。 (1)我们║五个人一组。(2)我们五个人║一组。 总结:中心词分析法可以分化一些由于某些词或词组在句子中可以做不同的句子成分而造成的歧义关系。 局限性: 1.在一个层面上分析句子,

层次性不强; 2.对于一些否定句和带有修饰成分的句子,往往难以划分; 如:我们不走。≠我们走。 封建思想必须清除。≠思想清除。 3. 一些由于句子的层次关系 不同而造成的歧义句子无法分析; 如:照片放大了一点儿。咬死了猎人的狗。 二. 层次分析: 含义: 在分析一个句子或句法结构时,将句法构造的层次性考虑进来,并按其构造层次逐层进行分析,在分析时,指出每一层面的直接组成成分,这种分析就叫层次分析。 朱德熙先生认为,层次分析不能简单地将其看作是一种分析方法,而是应当看做一种分析原则,是必须遵守的。(可以说说为什么) 层次分析实际包含两部分内容:一是切分,一是定性。切分,是解决一个结构的直接组成成分到底是哪些;而定性,是解决切分所得的直接组成成分之间在句法上是什么关系。

N+N概念合成名词的认知语义分析

N+N概念合成名词的认知语义分析 20世纪90年代,Fauconnier 和Turner 创建了概念合成理论,揭示了自然语言中的意义实时构建和连接各心理空间的映射过程。新词的概念合成主要包括:N+N合成、Adj.+N组合以及一个单词的合成。其中,N+N合成是最主要的形式,其语义关系可归结为五类:联合型、关系型、特征映射型、混合型和合成型。本文以这五种语义关系为切入点,以概念合成理论为支撑,以汉语新词为例,对N+N概念合成名词进行认知上的解读。 标签:概念合成新词语义分析 一、引言 当今时代,越来越多的汉语新词涌现出来。新词的概念合成主要包括:N+N 合成、Adj.+N组合和一个单词的合成。其中,N+N合成是构成新词的最主要的形式。以往研究大都将概念合成名词的语义关系概括为四类:联合型、关系型、特征映射型、混合型。刘正光(2004)在此基础上又提出了合成型的语义关系。 过往对新词的研究多聚焦于其构成方式和意义来源。本文基于概念合成理论来探讨新词意义的认知机制。概念合成理论是由Fauconnier 和Turner (2002)创建的。该理论的主旨就是揭示自然语言中的意义在线构建及连接各心理空间的映射过程(王文斌,2004:7)。Fauconnier(1994)认为意义的构建过程就是概念的复合过程,认知者通过概念在各心理空间中的相互映射和投射来建立各心理空间中的网络关系,最后在复合空间中通过概念合成而产生派生结构。本文以五种语义关系为基点,从概念合成的角度阐释新词的语义认知机制。 二、N+N概念合成名词的语义关系 新词大多数以组合方式构成,以合成词、缩略语、外来词等为主(王文斌,2011:233)。N1+N2概念合成是构成新词最主要的形式,表面上看似简单,实则其内部意义的建构过程极其复杂。概念合成名词的语义关系主要分为五类:联合型、关系型、特征映射型、混合型以及合成型。 (一)联合型 联合型语义关系是指N1和N2两个成分合并到一起,产生新的概念。合成概念既包括N1的意义又包括N2的意义。两个名词之间无明显修饰与被修饰的关系。如: (1)宠物狗(a dog that is also a pet) (2)志愿者爸爸(a man who servers as both a volunteer and a father,especially for some orphans)

现代汉语语法分析报告地五种方法

北语之声论坛专业精华转贴 现代汉语语法的五种分析方法是语法学基础里很重要的一个内容,老师上课也会讲到,我在这里把最简略的内容写在下面,希望能对本科生的专业课学习有所帮助 详细阐释中心词分析法、层次分析、变换分析法、语义特征分析法和语义指向分析的具体内涵: 一. 中心词分析法: 分析要点: 1.分析的对象是单句; 2.认为句子又六大成分组成——主语、谓语(或述语)、宾语、补足语、形容词附加语(即定语)和副词性附加语(即状语和补语)。 这六种成分分为三个级别:主语、谓语(或述语)是主要成分,宾语、补足语是连 带成分,形容词附加语和副词性附加语是附加成分; 3.作为句子成分的只能是词; 4.分析时,先找出全句的中心词作为主语和谓语,让其他成分分别依附于它们; 5.分析步骤是,先分清句子的主要成分,再决定有无连带成分,最后指出附加成分。 标记: 一般用║来分隔主语部分和谓语部分,用══标注主语,用——标注谓语,用~~~~~~标注宾语,用()标注定语,用[ ]标注状语,用< >标注补语。 作用: 因其清晰明了得显示了句子的主干,可以一下子把握住一个句子的脉络,适合于中小学语文教学,对于推动汉语教学语法的发展作出了很大贡献。 还可以分化一些歧义句式。比如:我们五个人一组。 (1)我们║五个人一组。 (2)我们五个人║一组。 总结:中心词分析法可以分化一些由于某些词或词组在句子中可以做不同的句子成分而造成的歧义关系。 局限性: 1.在一个层面上分析句子,层次性不强; 2.对于一些否定句和带有修饰成分的句子,往往难以划分; 如:我们不走。≠我们走。

封建思想必须清除。≠思想清除。 3. 一些由于句子的层次关系不同而造成的歧义句子无法分析; 如:照片放大了一点儿。咬死了猎人的狗。 二. 层次分析: 含义: 在分析一个句子或句法结构时,将句法构造的层次性考虑进来,并按其构造层次逐层进行分析,在分析时,指出每一层面的直接组成成分,这种分析就叫层次分析。 朱德熙先生认为,层次分析不能简单地将其看作是一种分析方法,而是应当看做一种分析原则,是必须遵守的。(可以说说为什么) 层次分析实际包含两部分内容:一是切分,一是定性。切分,是解决一个结构的直接组成成分到底是哪些;而定性,是解决切分所得的直接组成成分之间在句法上是什么关系。 基本精神: 1.承认句子或句法结构在构造上有层次性,并在句法分析上严格按照内部的构造层次 进行分析; 2.进行分析时,要明确说出每一个构造层面的直接组成成分; 3.分析时只管直接成分之间的语法结构关系,不管间接成分之间的语法结构关系或句 法结构中实词与实词之间的语义结构关系; 优越性: 1.注意到了句子构造的层次性; 如: 他刚来我们便宜他了 ││__│││___│ │___││_____│ 他刚来我们便宜他了 __ _______ ____ ___________ ___ ___ ____ _____

语义分析

三、词法、语法、语义分析结合 一、实验目的与要求 在实现词法、语法分析程序的基础上,编写相应的语义子程序,进行语义处理,加深对语法制导翻译原理的理解,进一步掌握将语法分析所识别的语法范畴变换为某种中间代码(四元式)的语义分析方法,并完成相关语义分析器的代码开发。 二、实验内容 语法制导翻译模式是在语法分析的基础上,增加语义操作来实现的。对于给定文法中的每一产生式,编写相应的语义子程序。在语法分析过程中,每当用一个产生式进行推导或归约时,语法分析程序除执行相应的语法分析动作之外,还要调用相应的语义子程序,以便完成生成中间代码、查填有关表格、检查并报告源程序中的语义错误等工作。每个语义子程序需指明相应产生式中各个符号的具体含义,并规定使用该产生式进行分析时所应采取的语义动作。这样,语法制导翻译程序在对源程序从左到右进行的一遍扫描中,既完成语法分析任务,又完成语义分析和中间代码生成方面的工作。 输入:包含测试用例,如由无符号数和+、?、*、/、(、)构成的算术表达式的源程序文件。 输出:将源程序转换为中间代码形式表示,并将中间代码序列输出到文件中。若源程序中有错误,应指出错误信息。 三、实验设计 语法制导翻译模式实际上是对前后文无关文法的一种扩展。一般而言,首先需要根据进行的语义工作,完成对文法的必要拆分和语义动作的编写,从而为每个产生式都配备相应的语义子程序,以便在进行语法分析的同时进行语义解释。要求从编译器的整体设计出发,重点通过对实验二中语法分析程序的扩展,完成一个编译器前端程序的编写、调试和测试工作,形成一个将源程序翻译为中间代码序列的编译系统。 对文法G3[<算术表达式>]中的产生式添加语义处理子程序,完成无符号数的四则运算的计值处理,将输入的四则运算转换为四元式形式的中间代码。本实验只进行了算术表达式四元式的翻译。 四、源代码 1、在.h文件中添加了 //语义分析部分 #define PMAX 5//define 后面不加括号,定义产生式符号属性字符串的长度 int NXQ=0; /*全局变量NXQ用于指示所要产生的下一个四元式的编号*/ int NXTemp=1;//整型变量NXTemp指示临时变量的编号 int SentenceCount=1;//存放文件中句子的个数 struct QUATERNION /*四元式表的结构*/ { char op[PMAX]; /*操作符*/ char arg1[PMAX]; /*第一个操作数*/ char arg2[PMAX]; /*第二个操作数*/ char result[PMAX]; /*运算结果*/ }pQuad[256]; /*存放四元式的数组*/ char EBracket_Place[PMAX];//(E)的语义属性

义素分析法分析“看的方式”语义场

义素分析法分析“看的方式”语义场 摘要:“看的方式”的语义场可以归为同义语义场。通过义素分析的方法,并写出 每个词的基本义的义素表达式,来分析该语义场内的词之间的异同。词不仅有理 性意义还有感性意义,通过感性意义能更好的区别和运用同义词。 关键字:义素分析法,同义词辨析,看的方式 一、义素分析法在同义词辨析中的运用 同义词辨析一直以来都是语言研究的重要方面,不仅是在语言研究,还是在 语言运用中,甚至在语言的教学中都具有特殊的意义。义素分析法是准确描写和 掌握词义的有效方法。词义并不是一个整体,而是有若干层次的结构,义素是构 成词义的最小意义单位。将义素分析法引入对外汉语词汇教学,可以对词义的微 观层面进行准确有效的分析,把词义分割成若干个义素的组合,不仅有利于准确 掌握同义词之间的大同小异,还能提高人们对语言的运用能力,有利于第二语言 学习者在语言学习中理解两个及两个以上抽象的同义词,加深对汉语词汇的理解 和运用。 本文主要通过义素分析法来分析比较“看的方式”的语义场,来说明义素分析 法在同义词比较中的运用。运用义素分析法的表达式来研究“看的意义相同或相近的词”。本文研究的看的方式词有:看、望、顾、瞪、瞥、瞅、盯、窥、伺、瞟、瞰。 二、“看的方式”的语义场义素分析的方法和步骤 1.确立语义场 语义场是通过不同词之间的对比,根据它们词义的共同特点或关系划分出来 的类。同义语义场相当于一些论著中讲的一组广义的同义词(即不包括等义词),它所包括的各个义位间大同小异。所谓的同,表现为基本义相同或者是基本义有 一部分相同。所谓的异,就是附加义不同,或者是基本义有一部分不同,又或是 不只是基本义有一部分不同附加义也不一样。“看的方式”语义场内的词是眼部动 作描写都有“用眼睛看”这一基本义项,因此,这些看的方式词都可以看作是“看” 这个词的同义词。那么“看的方式”就构成了一个眼部动作的同义语义场。根据义 素分析法的分析并通过表达式的比较,可以准确的辨析出同义语义场内各个词之 间的细微区别,有利于第二语言的学习。 2.通过义素的具体对比分析“看的方式:看、望、顾、瞪、瞥、瞅、盯、窥、伺、瞟、瞰”的异同。 这些字从现代汉语词典第七版中查到“看的方式”词的意义如下所示: (1)看: [动] 使视线接触人或物:~书|~电影|~了他一眼。 [动] 观察并加以判断:我~他是个可靠的人l你~这个办法好不好。 [动] 取决于;决定于:这件事能 不能成功全~你了|飞机能否准时起飞,要~天气如何。 [动] 访问;探望:~望|~朋友。 [动] 对待:~待|另眼相~|别拿我当外人~。 [动] 诊治:王大夫把我的病~好了。照料:照~l衣帽自~。 [动] 用在表示动作或变化的词或词组前面,表示预见到某 种变化趋势,或者提醒对方注意可能发生或将要发生的某种不好的事情或情况: 行情~涨|别跑!~摔着!|~饭快凉了,快吃吧。 [助] 用在动词或动词结构后面, 表示试一试(前面的动词常用重叠式):想想~I找找~|等一等~l评评理~先做几 天~。 (2)望: [动] 向远处看:登山远~|一~无际的稻田。观看;察看:~风!观~|~ 闻问切。探望:拜~|看~。盼望;希望①:~子成龙l~准时到会。盼头;希望②:

中文语义依存分析评测大纲

中文语义依存分析评测大纲 一、评测对象 本次评测的对象是中文句子的词语之间的语义及句法依存关系分析技术。 二、评测内容 本次评测主要评测依存关系分析系统对中文句子进行依存分析的准确性。 三、评测方法 1.评测方式 本次评测为离线评测,参评单位自行处理数据,生成相应结果后提交。训练语料将提前1个月公布。 2.评测步骤 1)评测单位预先给出若干训练数据(已标注依存分析结果); 2)评测单位给出测试数据(未标注依存分析结果); 3)参评单位运行被测系统,得出测试结果; 4)参评单位提交测试结果; 5)评测单位标注答案,运行自动评测程序,统计评测结果。 3.评测标准 1)量化指标 本次评测采用三个指标对被测试系统进行评测,分别为: i.依存标注准确率(Labeled Attachment Score, LAS) ii.依存准确率(Unlabeled Attachment Score, UAS) iii.标注准确率(Labeled Accuracy, LA) 令整个测试预料包含的词数为N,任意词语的依存用三元组进行表示,其中word为词本身,word以关系relation依存于headword。在被测试系统的输出中,令所有headword正确的词语的数目为N a,所有relation正确的词语的数目为N l, 所有headword和relation都正确的词为N al,那么,测试指标的计算方法如下: LAS=N al N UAS=N a N LA=N l N 三个指标的优先级分别为LAS>UAS>LA。 4.数据格式 测试数据采用CONLL1格式,数据文件采用UTF-8编码。测试数据总共提供6列值,分别为:词语ID、词语、词性(粗粒度)、词性(细粒度)、被依存词ID和依存关系,即CONLL 格式中的第1、2、4、5、7和8列。其他列留空(用“_”填充)。列与列之间用“\t”分隔,行与行之间用“\n”分隔,句子与句子之间用空行分隔。被测试系统可以自行对其他列进行补充,但不允许修改分词结果(清华大学SDN语料的词性为自动标注结果,参评者可对词性进行重新标注)。 输出数据同样采用CONLL格式,其中第1、2列应当与测试数据严格一致,分析结果填充到第7,8列。其他列可留空(用“_”填充),也可以保留自行补充的数据。 1http://ilk.uvt.nl/conll/#dataformat

语义分析与中间代码生成程序的设计原理与实现技术__实验报告与源代码_北京交通大学

语义分析及中间代码生成程序设计原理与实现技术 XXX 1028XXX2 计科1XXX班 1.程序功能描述 完成以下描述赋值语句和算术表达式文法的语法制导生成中间代码四元式的过 程。 G[A]:A→V:=E E→E+T∣E-T∣ T→T*F∣T/F∣F F→(E)∣i V→i 说明:终结符号i 为用户定义的简单变量,即标识符的定义。 2. 设计要求 (1)给出每一产生式对应的语义动作;(2)设计中间代码四元式的结构(暂不与符号表有关)。(3)输入串应是词法分析的输出二元式序列,即某算术表达式“实验项目一”的输出结果。输出为输入串的四元式序列中间文件。(4)设计两个测试用例(尽可能完备),并给出程序执行结果四元式序列。 3.主要数据结构描述: 本程序采用的是算符优先文法,文法以及算符优先矩阵是根据第四次实验来修改的,所以主要的数据结构也跟第四次差不多,主要为文法的表示,FirstVT集和LastVT 集以及算符优先矩阵:

算符优先矩阵采用二维字符数组表示的: char mtr[9][9]; //算符优先矩阵 4.程序结构描述: 本程序一共有8功能函数: void get(); //获取文法 void print(); //打印文法 void fun(); //求FirstVT 和LastVT void matrix(); //求算符优先矩阵 void test(); //测试文法 int cmp(char a,char b); 比较两个运算符的优先级 1 0 -1 void out(char now,int avg1,int avg2); //打印四元式 int ope(char op,int a,int b); //定义四元式计算方法 5.实验代码 详见附件 6.程序测试 6.1 功能测试 程序运行显示如下功能菜单:

语义分析器

重庆大学课程设计报告课程设计题目:简单编译器的设计与实现 学院:计算机学院 专业班级:计算机科学与技术2班 年级:2010级 姓名:唐允恒,张楠 学号:20105208,20105333 完成时间:2013 年 6 月12 日成绩: 指导教师:张敏 重庆大学教务处制

指导教师评定成绩: 指导教师签名:年月日

指导教师评定成绩: 指导教师签名:年月日

重庆大学本科学生课程设计任务书

简单编译器设计与实现 目录 (一)目录 (1) (二)简单编译器分析与设计 (2) (1)简单编译器需求分析 (3) (2)词法分析器的设计 (3) 1.词法表设计 (3) 2.token串取法简单流程图 (3) (3)语法分析器的设计 (4) 1.算符优先文法设计 (4) 2.符号优先表 (6) (4)语义分析器的设计 (6) 1.简单四元式分析 (6) 2.简单四元式的实现 (6) (三)关键代码以及算法 (7) (1)词法分析器的关键算法 (7) (2)语法分析器的关键算法 (7) (3)四元产生式的关键算法 (8) (四)系统测试 (9) (1)用例测试 (9) (2)差错处理 (10) (3)设计自我评价 (10) (五)运行效果 (11) (六)总结 (13)

简单编译器分析与设计 简单编译器需求分析 编写目的 《编译原理》是一门实践性较强的软件基础课程,为了学好这门课程,必须在掌握理论知识的同时,加强上机实践。本课程设计的目的就是要达到理论与实际应用相结合,使同学们能够根据编译程序的一般原理和基本方法,通过具体语言的编译程序的编写,掌握编译程序的主要实现技术,并养成良好的程序设计技能。 设计背景 此项目是开发一个C++语言编辑器,完成编辑C++语言源程序,对C++语言源程序进行高亮显示、错误处理、代码重排版、显示当前文件的函数列表和跳转、成对括号、语句块标识的功能,同时描述了编译器执行每个步骤流程。 在词法分析,语法分析和语义分析等方面加深对课程基本内容的理解。同时,在程序设计方法以及上机操作等基本技能和科学作风方面受到比较系统和严格的训练。 对一个c++语言的子集编制一个编译程序,主要包括以下步骤: 词法分析 设计、编制并调试简单的C++语言的词法分析程序 语法分析 编制一个语法分析程序,实现对词法分析程序所提供的单词序列进行语法检查和结构分析。 语义分析 采用语法制导翻译原理,将语法分析所识别的语法成分变换成四元式形式的中间代码序列。

义素分析

○对下面各组词进行义素分析。 1.名词 a.毛笔铅笔圆珠笔钢笔粉笔 毛笔:[+书写用具]、[+笔头用毛制成]、[+用墨汁书写] 铅笔:[+书写用具]、[+笔心用石墨或加颜料的黏土制成]、[+用笔心材料书写] 圆珠笔:[+书写用具]、[+笔尖是小圆钢珠]、[+用油墨书写] 钢笔:[+书写用具]、[+笔头用金属制成]、[+用墨水书写] 粉笔:[+书写用具]、[+笔身用白垩、熟石膏粉等制成]、[+用笔身材料书写] (注:为了简明,每词只注出具有的义素。不具备的义素一对比便知。) b.哥哥弟弟姐姐妹妹 哥哥:[+同胞]、[+年长]、[+男性] 弟弟:[+同胞]、[-年长]、[+男性] 姐姐:[+同胞]、[+年长]、[-男性] 妹妹:[+同胞]、[-年长]、[-男性] 2.动词 动词的义素结构模式可概括为{动词}=[主体、方式、动作、客体、结果]。试分析下列各组动词的义素结构模式。 a.切砍剁削 {切}=[+用刀、+向下、-用猛力、+分开、+物体本身、+成块状或片状] {砍}=[+用刀斧、+向下、+用猛力、+分开、+物体本身、+成块状] {剁}=[+用刀斧、+向下、+用猛力、+分开、+物体本身、+成小块或碎末状] {削}=[+用刀、+向下、-用猛力、+分开、+物体表层、+成片状] b.坐蹲站 {坐}=[+身体动作]、[+臀部着物]、[-脚部支撑身体重量]、[-直着身体] {蹲}=[+身体动作]、[-臀部着物]、[+脚部支撑身体重量]、[-直着身体] {站}=[+身体动作]、[-臀部着物]、[+脚部支撑身体重量]、[+直着身体] c.走跑跳 {走}=[+脚部动作]、[+双脚交互运动]、[+向前]、[+迅速]、[+用力] {跑}=[+脚部动作]、[+双脚交互运动]、[+向前]、[+迅速]、[+用力] {跳}=[+脚部动作]、[-双脚交互运动]、[+向前]、[+迅速]、[+用力] 3.形容词 请用义素分析法对下列词的词义进行辨析和描写。 优秀优良优异良好 优秀:[+好]、[+用于成绩]、[-修饰习惯]、[+修饰人才]、[-修饰品种]、[+程度2] 优良:[+好]、[+用于成绩]、[-修饰习惯]、[-修饰人才]、[+修饰品种]、[+程度1] 优异:[+好]、[+用于成绩]、[-修饰习惯]、[-修饰人才]、[-修饰品种]、[+程度3] 良好:[+好]、[+用于成绩]、[+修饰习惯]、[-修饰人才]、[-修饰品种]、[+程度0] (注:程度0表示基础级,1、2、3表示程度渐高。)?第七章语用 ?语用,即语言的使用。语用学(pragmatics)是语言学的一门新兴学科,也是符号学 (semiotics)的一个部门。它研究语言符号同符 号使用者之间的关系,即研究人们怎样运用语言 符号进行交际。它从语言使用的角度,探讨人们 在用语言进行交际时出现的种种现象及其规律。 ?第一节语用要素 一、语用要素概说 ?一次言语交际,必须具备以下要素:发话人(sender)、受话人(receiver)、话语 (discourse)、语境(context)。 ?发话人是言语行为的主体,受话人是言语行为的客体,话语是联系主、客体的媒介,语境是 言语行为存在的环境。 ?我们理解的语境是:与言语行为密切相关的各种主客观因素构成的交际环境。主要包括三个 方面: ?(1)言辞语境:前后词、前后语、上下段等。 ?(2)情景语境:交际时的具体情景因素构成的语境,如时间、地点、场合、受众(如人数 多少)等。 ?(3)社会语境:言语交际双方具有的社会人文因素所构成的语境,如地位、职业、性别、 年龄、信仰、情绪、修养等。 ?第二节语用行为 一、什么是语用行为 ?语用行为是使用语言进行交际的行为,也叫言语行为(speech act)。如问“这书是不是你 的?”你可以用点头这种身体行为表示肯定回答, 也可以用“是的。”这种言语行为进行回答,两 者是等价的。因此,言语行为和其他行为一样, 也是人类重要的行为。 二、语用行为的类型

语义特征分析

语义特征分析 一、含义 ?语义特征是语言单位之间相互联系或相互区别的语义要素,它很大程度上制约着语言单位相互组合的可能性以及组合的方式,反映了语言单位的组织形式跟现实世界的对应关系。 ?语义特征分析为进一步分化同形句式,为根据句法研究的需要对同一类实词划分小类,提供了更为可靠的句法、语义依据,因此语义特征分析无疑使语法研究朝着形式和意义相结合的方式迈出了更可喜的一步 二、作用 ?语义特征分析能够促使语法研究的精密化,从而使语法研究更具解释力。20世纪80年代以来,语义特征分析在汉语语法研究中得到了广泛的运用。除朱德熙以外,陆俭明、邢福义、马庆株、邵敬敏等都是积极实践者。概括起来,语义特征分析在以下诸多方面有很强的解释力,具有广泛的实践价值。 ?(一)语义特征分析能够较好的揭示一个句法组合能否成立的原因。“香蕉、苹果、梨子、杨桃”因为共有[+水果]的范畴特征而被认为是有意义的组合,而“香蕉、石子、泉水、黄土”因为缺乏共同的范畴特征而不被理解。“笔墨纸砚”、“桌椅板凳”、“锅碗瓢盆”、“油盐酱醋”都是这种类型的并列。“吃馒头”可说而“喝馒头”不能被接受,同样“喝汤”可说而“吃汤”不能被接受。“吃”和“喝”的这种对立可以用语义特征表示为:吃[+施事;+固体食物;+咀嚼;+吞咽],喝[+施事;-固体食物;-咀嚼;+吞咽]。 ?(二)语义特征分析可以揭示某些词语的比较隐蔽的语义特征。例如“写、搛、留、舀”等动词本身并不包含“给予”的意义。但当说到“写信、搛菜、舀汤、留座位”的时候,就有可能取得“给予”的意义[6]。这时,它们可以跟“卖、送、递、让”等本身包含“给予”意义的动词一样,可以出现在“V+NP(受)+给+NP(与)”或“V+给+NP(与)+NP(受)”格式中。例如:?(2)写一封信给老王? 写给老王一封信 ?舀一瓢水给小张(喝)? 舀给小张一瓢水(喝) ?留一个座位给老大爷? 留给老大爷一个座位 ?“写、搛、留、舀”等的这种特性使它们有别于其他行为动词,如“看、读、撞、拉”等。?(三)语义特征分析可以揭示某些句式能否成立的语义依据。例如,现代汉语里有一种由形容词加“(一)点儿”构成的祈使句:形容词+(一)点儿!可是,并不是所有的形容词都能进入该句式[7]。试比较: ?(3)A. 虚心点儿!积极点儿!坚强点儿! ?主动点儿!灵活点儿!大方点儿! ?B. 粗一点儿!近一点儿!高一点儿! ?浓一点儿!大一点儿!慢一点儿! ?C. *骄傲点儿!*悲观点儿!*罗嗦点儿! ?*胆小点儿!*嘈杂点儿!*蛮横点儿! ?D. *可爱点儿!*健康点儿!*伟大点儿! ?*优秀点儿!*美丽点儿!*高尚点儿! ?(3)中四组格式中的形容词的语义特征可以用矩阵图区别如下: ?(3')形A:[+褒义,-贬义,+可控] ?形B:[-褒义,-贬义,+可控] ?形C:[-褒义,+贬义,±可控] ?形D:[+褒义,-贬义,-可控] ?可见,只有同时具备[-贬义]和[+可控]两项语义特征的形容词才能够进入以上格式。?(四)语义特征分析能够较好地解释某些看似狭义同构的句式的内部差异,同时为词类的进一步细分提供“最可靠的语法、语义依据”[4]。例如:

语义分析与中间代码生成

实验内容: 可选择LL1分析法、算符优先分析法、LR 分析法之一,实现如下表达式文法的语法制导翻译过程。文法G[E]如下所示: E →E+T | E-T | T T →T*F | T/F | F F →P^F | P P →(E) | i 要求构造出符合语义分析要求的属性文法描述,并在完成实验二(语法分析)的基础上,进行语义分析程序设计,最终输出与测试用例等价的四元式中间代码序列。 实验目的: 1.掌握语法制导翻译的基本功能。 2.巩固对语义分析的基本功能和原理的认识。 3.能够基于语法制导翻译的知识进行语义分析。 4.掌握类高级语言中基本语句所对应的语义动作。 5.理解并处理语义分析中的异常和错误。 实验要求: 1.在实验二的基础上,实现语法制导翻译功能,输出翻译后所得四元式序列; 2.要求详细描述所选分析方法进行制导翻译的设计过程; 3.完成对所设计分析器的功能测试,并给出测试数据和实验结果; 4.为增加程序可读性,请在程序中进行适当注释说明; 5.整理上机步骤,总结经验和体会; 6.认真完成并按时提交实验报告。 实验步骤: ---1语义子程序为:(会生成四元式的部分:) (1) P →i (2) E →E+T emit(+,E.place,T.place,E.place); (3) E →E-T emit(-,E.place,T.place,E.place); (4) T →T*F emit(*,T.place,F.place,T.place); (5) T →T/F emit(/,T.place,F.place,T.place); (6) F →P^F emit(^,P.place,F.place,F.place); (7) P →(E) 开始 词法分析 中间代码 语法、语义分析 出错处理 语法、语义分析 中间代码生成 结束

相关主题
文本预览
相关文档 最新文档