第五章 句法分析
- 格式:ppt
- 大小:234.00 KB
- 文档页数:35
第五章句法学(掌握)基本知识点:句法分析They elected him president。
会以S(主语)+V (谓语)+O(宾语)+OC(宾语补语,objective complement)的方式作分析说明。
后来他从事翻译工作,发现遇到难句时,这样的分析相当费事,有时反而混淆不清。
于是他再看O。
他在耶斯柏森(Otto Jespersen,一八六○-一九四三年,丹麦语言学家,研究英语语法专家)的著作,看到耶斯柏森对They elected him president的分析,指出句中的him president是以nexus作为宾语,成为elected的 object。
这个nexus是耶斯柏森的造语,我们称之为“叙述关系”,又称“主(语)谓(语)关系”,或“二元语校”。
Nexus源于拉丁语nectere,是to bind之意,因此作连结、关系、中心、核心解(如 the cash nexus 是“现金交易关系”。
耶斯柏森在一九三七年出版的“分析性句法”(Analytic Syntax)中,对“主谓关系”(又作宾谓结构)解说相当全面。
句法关系1.句法关系syntatic relationship2.并列coordinate3.从属subordination4.修饰modification5.前置修饰pre-modification6.后置修饰post-modification7.限制restriction8.双重限制double-restriction9.非限制non-restriction成分分析法句子成分(Members of the Sentence)为什么又要分词类,又要分句子成分呢?两者既然关系密切,为什么不合并起来谈呢?合并起来,容易造成混乱,因为两者是不同的概念。
同一个词类可以在句中充当不同的成分,同一个句子成分也可以由不同的词类来担任。
那么什么叫句子成分呢?句子成分是句子中起一定功用的一个组成部分。
現代漢語章五語法一、名詞解釋:1、语法:是词、短语、句子等语言单位的结构规律;2、语法单位:可分为四级,即语素、词、短语、句子,均为音义结合体;3、句子:具有一个句调,可表达一个相对完整的意思的语言单位;4、句类:根据语气划分出的句子类型,可分为四类:陈述句、疑问句、感叹句、祈使句;5、句型:根据句子结构划分出的句子类型,可分为单句和复句两大类;6、句式:句子的特征分类,句式是根据局部特点分出的下位结构类型;7、实词:有词汇意义和语法意义,可充当句法成分的词;8、虚词:没有词汇意义,仅有语法意义,不可充当句法成分的词;9、谓词:指在前面可以加“不”,在句法结构中经常作谓语,同时能作主语和宾语的词。
包括动词、形容词和一部分描述性代词,如“这么”;9、区别词:表示事物的属性,有分类作用的词,其属性常存对立性质,故多成对或成组出现,如中式:西式;10、代词:有代替、指示作用的词,与所代替、指示的语言单位的语法功能大致相当,传统语法按作用将之划分为三大类:代替人或事物的人称代词,表疑问的疑问代词,指称或区别人事物的指示代词;11、拟声词:即模拟声音的词,又称“象声词”,如“叮当”。
有修辞作用,可使语言具体形象,予人以身临其境之感,故常运用于口语及文学作品中;12、短语:即意义上和语法上可搭配而没有句调的一组词,又称词组,是大于词而不成句的语法单位;13、层次分析法:分析短语和句子的一种方法,即尽量将短语或句子划分出两个直接组成成分,除联合结构等可能由多个并列组成的短语或句子外,其余均可采用此法,故又称“二分法”,最能反映出短语和句子的内部组合层次;14、中心语:即偏正短语中的中心成分,可为词或短语。
主要有三种类型:定语中心语、状语中心语、补语中心语;15、独立语:句子中的某个实词或短语与其前后的词语没有结构关系,互不为句法成分,但句意上又是必需的成分,这种没有配对成分的特殊成分即独立语。
按表意作用可将之分为四类:插入语、称呼语、感叹语、拟声语;16、单句:由短语或词充当的,有特定的语调,可独立表达一定的意思的语言单位,据不同的标准可分出句型和句类两类。
语言学中的句法分析语言是人类最重要的交流工具之一,它通过词汇和语法来传达思想和意义。
在语言学中,句法分析是一项重要的研究领域,旨在理解和描述句子的结构和组成成分。
本文将介绍句法分析的基本概念和方法,并探讨其在语言学和人工智能领域的应用。
一、句法分析的基本概念句法分析是研究句子结构的学科,它关注句子中的词汇和它们之间的关系。
在句法分析中,句子被看作是由词汇和短语组成的,而这些词汇和短语之间的关系可以通过语法规则来描述。
句法分析的目标是确定句子的句法结构,即句子中各个成分之间的关系和层次。
二、句法分析的方法句法分析有多种方法,包括基于规则的方法、基于统计的方法和基于机器学习的方法。
基于规则的方法是最早的句法分析方法之一,它通过定义一系列语法规则来分析句子的结构。
这些规则可以是基于语言学知识的,也可以是基于实际语料库的。
基于统计的方法则是通过分析大量的语料库数据来学习句子的结构和语法规则。
这些方法使用统计模型来预测句子中不同成分之间的关系。
基于机器学习的方法则是将机器学习算法应用于句法分析任务中,通过训练模型来预测句子的句法结构。
三、句法分析的应用句法分析在语言学和人工智能领域有着广泛的应用。
在语言学中,句法分析可以帮助研究者理解不同语言的句法结构和语法规则。
通过分析句子的句法结构,语言学家可以揭示出不同语言之间的共性和差异,进一步探索语言的本质和演化。
在人工智能领域,句法分析是自然语言处理和机器翻译等任务的基础。
通过对句子的句法结构进行分析,计算机可以更好地理解和处理自然语言,从而实现自动翻译、问答系统等人机交互的应用。
四、句法分析的挑战和发展尽管句法分析在理论和应用方面取得了一些进展,但仍然面临着一些挑战。
首先,不同语言之间的句法结构和语法规则存在差异,这给跨语言句法分析带来了困难。
其次,句法分析需要处理大量的语言数据,包括语料库和语法规则,这对计算资源和算法效率提出了要求。
此外,句法分析还需要解决歧义和多义性等问题,以确保准确分析句子的结构。
句法分析句法分析,作为自然语言处理领域的核心技术之一,主要研究句子内部的语法结构关系以及句子之间的语法关系。
它通过分析句子中的词汇、词性、句法树等要素,帮助人们理解句子的意义和组织结构。
本文将介绍句法分析的基本概念、常见方法以及在自然语言处理中的应用。
句法分析是自然语言处理中的重要任务之一,它对于理解自然语言文本具有重要意义。
在句法分析过程中,常用的方法有基于规则的方法和基于统计的方法。
基于规则的方法是根据语法规则来进行句法分析,它需要人工编写一系列的语法规则。
而基于统计的方法则是利用大规模语料库进行训练,通过统计模型来进行句法分析。
句法分析在自然语言处理领域有着广泛的应用。
其中,句法分析在机器翻译中起到了至关重要的作用。
通过句法分析,可以有效地对源语言句子进行结构化表示,从而更好地进行翻译。
此外,在信息检索、问答系统、文本分类等领域中,句法分析也发挥着重要的作用。
通过对文本进行句法分析,可以帮助计算机更好地理解文本的意思,从而实现更精准的信息抽取和语义推理。
在句法分析的研究中,有许多经典的算法和模型。
其中,最为常见的句法分析算法有基于规则的上下文无关文法(Context-Free Grammar,CFG)、依存句法分析(Dependency Parsing)和成分句法分析(Constituency Parsing)等。
这些算法和模型在句法分析任务中各有优劣,适用于不同的应用场景。
例如,成分句法分析更适用于处理形式更加标准化的新闻文本,而依存句法分析则更适用于处理更为自由化的口语文本。
在实际应用中,句法分析面临着一些挑战和困难。
首先,句法分析需要准确地识别和标注词性,但词性标注的准确率会对句法分析的性能产生很大影响。
其次,句法分析还需要处理歧义性的问题,如歧义词的处理和多义词的消歧,这需要更深入的语义理解。
此外,句法分析还需要处理非标准化的文本,如网络文本、口语文本等,这对于模型的泛化能力提出了更高的要求。
第五章语法第一节语法概说1.语法和语法体系(这俩术语均有两种解释)语法:语素、词、短语、句子等语言单位的结构规律1)语法——语法规律,客观的语法事实 + 语法学的理论,学者对语法事实的主观说明语法体系——语法系统,客观存在的语法事实,语法规律的系统性 + 语法学体系,语法学者根据自己的学说解释语法事实时所用的分析方法一个民族的语法系统只有一个,但是一个民族的语法体系可以不止一个。
2)语法研究由句法、语义和语用三个方面的研究组成。
句法:造句的规则(短语、句子的结构规律和类型)——包括传统的词法和句法语义:句法结构的变化对语义的影响及反作用语用:句法结构的变化对语境,句子的语调、口气等的影响及反作用2.语法的性质:1)抽象性:语法不研究个别的,而是从众多的语法单位的组合里抽象出其中共同的组合方式或类型及如何表达语义。
如:汉语中“看看”“学习学习”词的重叠现象。
说明有些动词可以用重叠的方法来表示动作的少量或短时。
2)稳固性:语法的变化比语音、词汇慢得多。
如:词序和虚词是汉语的重要语法手段。
3)民族性:每个民族都有明显的民族特点,不仅表现在语音和词汇上,也表现在语法上。
如:俄语用词形变化(形态)表示词的句法功能,语序比较自由;而汉语里的词没有表示句法功能的形态变化,词在句中充当什么成分,主要靠语序来表示。
3.语法单位:1)语素:语言中最小的音义结合体。
构词的备用单位2)词:最小的能够独立运用的语言单位。
构成短语、句子3)短语:语义上和语法上都能搭配的,没有句调的一组词。
造句的备用单位4)句子:具有一个句调,能够表达一个相对完整的意思的语言单位。
关系:语素可以 = 词词组>语素词可以 = 句子词组可以 = 句子4.句法成分:句子结构的组成成分1)句法成分到底是什么,是凭句法关系定名的。
如:主语是被陈述的对象,谓语是陈述主语的,两者之间是陈述关系。
2)句子成分间的语法关系:主谓、动宾、定中、状中、中补口诀:动前有主状,动后有补宾。
系统学习NLP(五)--句法分析句法分析的基本任务是确定句⼦的语法结构或句⼦中词汇之间的依存关系。
句法分析不是⼀个⾃然语⾔处理任务的最终⽬标,但它往往是实现最终⽬标的关键环节。
句法分析分为句法结构分析和依存关系分析两种。
以获取整个句⼦的句法结构为⽬的的称为完全句法分析,⽽以获得局部成分为⽬的的语法分析称为局部分析,依存关系分析简称依存分析。
⼀般⽽⾔,句法分析的任务有三个:判断输出的字符串是否属于某种语⾔消除输⼊句⼦中词法和结构等⽅⾯的歧义分析输⼊句⼦的内部结构,如成分构成、上下⽂关系等。
第⼆三个任务⼀般是句法分析的主要任务。
⼀般来说,构造⼀个句法分析器需要考虑两部分⼯作:⼀部分是语法的形式化表⽰和词条信息描述问题,形式化的语法规则构成了规则库,词条信息等由词典或同义词表等提供,规则库与词典或同义词表构成了句法分析的知识库;另⼀部分就是基于知识库的解析算法了。
语法形式化属于句法理论研究的范畴,⽬前在⾃然语⾔处理中⼴泛使⽤的是上下⽂⽆关⽂法(CFG)和基于约束的⽂法,后者⼜称合⼀⽂法。
简单的讲,句法结构分析⽅法可以分为基于规则的分析⽅法和基于统计的分析⽅法两⼤类。
基于规则的句法结构分析⽅法的基本思路是,由⼈⼯组织语法规则,建⽴语法知识库,通过条件约束和检查来实现句法结构歧义的消除。
根据句法分析树形成⽅向的区别,⼈们通常将这些⽅法划分为三种类型:⾃顶向下的分析⽅法,⾃底向上的分析⽅法和两者相结合的分析⽅法。
⾃顶向下分析算法实现的是规则推导的过程,分析树从根结点开始不断⽣长,最后形成分析句⼦的叶结点。
⽽⾃底向上分析算法的实现过程恰好想法,它是从句⼦符号串开始,执⾏不断规约的过程,最后形成根节点。
基于规则的语法结构分析可以利⽤⼿⼯编写的规则分析出输⼊句⼦所有可能的句法结构;对于特定领域和⽬的,利⽤有针对性的规则能够较好的处理句⼦中的部分歧义和⼀些超语法(extra-grammatical)现象。
但对于⼀个中等长度的输⼊句⼦来说,要利⽤⼤覆盖度的语法规则分析出所有可能的句⼦结构是⾮常困难的,⽽且就算分析出来了,也难以实现有效的消歧,并选择出最有可能的分析结果;⼿⼯编写的规则带有⼀定的主观性,还需要考虑到泛化,在⾯对复杂语境时正确率难以保证;⼿⼯编写规则本⾝就是⼀件⼤⼯作量的复杂劳动,⽽且编写的规则领域有密切的相关性,不利于句法分析系统向其他领域移植。