当前位置:文档之家› 基于主动学习的中文依存句法分析

基于主动学习的中文依存句法分析

基于主动学习的中文依存句法分析
基于主动学习的中文依存句法分析

现代汉语语法

层次分析法,又称“直接成分分析法”,是对句法单位(包括短语和句子)的直接成分进行结构层次分析的方法。由于切分过程中尽可能采用二分,所以层次分析法又称作“二分法”。 1、基本分析原则 语法从表面上看是线性排列的符号序列。线性排列是指按照时间先后顺序说出或写出的形式。但是语法结构却是有层次性的,层次是指句法单位在组合时所反映出来的不同的先后顺序。 表层的线性关系背后暗含着隐性的层次关系。小的语法单位是大语法单位的组成部分,大的语法单位是由小的语法单位组合而成的,本身又可以成为更大语法单位的组成部分。 语法结构的每个层次一般直接包含比它小的两个语法单位,这两个小的语法单位就是直接成分。每一个直接成分又可以包含更小的直接成分。 例如: 我们进行社会调查 |主||____谓_______| |_述 | 宾____ | |_定)中 | 层次分析法就是逐层将一个句法单位(联合短语等由多个直接成分组成的短语除外)切分成两个直接成分,直到不能再切分为止的句子分析方法。 2、分析过程 层次分析法的分析过程主要包括两个步骤:第一步是切分结构层次,第二步是确定结构关系。 例如: 他去年去了一趟美国。 |__||___________________| 主谓关系 |___||______________| 状中关系 |________| |__| 述宾关系 |_| |___| 述补关系

切分过程中应注意: ①第一步切分非常重要,第一步切分不当,后面便容易全都切错。 ②必须逐层切分,直至分析出每个实词,语素不需要切分。 ③为避免切分过程中的遗漏,一般采用从左到右、从上到下、逐块切分的分析步骤。 3、层次分析法的图解表示 层次分析法中常用的图解表示法是切分法、组合法和树形图。 ①切分法 切分法是最常用的方法,将所要分析的短语或句子作为一个整体,从大到小,逐层切分。 例如: 申奥成功有助于中国的改革与开放。 |_ 主 __| |______ 谓 ________________| |主| |谓| |_述_ |______ 宾___________| |__ 定_)_ 中 _______| | 联 + 合 | ②组合法 组合法是把所要分析的短语或句子切分到单词,然后从小到大,依次组合起来。例如: 他弟弟在北京念大学 |_定中_| |_介宾_| |_述宾_| | |____状中____| |_____主谓______| ③树形图

中文复杂名词短语依存句法分析

优先出版 计 算 机 应 用 研 究 第32卷 -------------------------------- 基金项目:国家自然科学基金项目(61173095),国家自然科学基金重点项目(61133012) 作者简介:陈永波(1990-),男,山东禹城人,硕士研究生,无,主要研究方向为自然语言处理、句法分析、机器学习等(chenyongbo1990@https://www.doczj.com/doc/0214119044.html,);汤昂昂(1990-),男,硕士研究生,无,主要研究方向为自然语言处理、信息检索、机器学习等;姬东鸿(1967-),男,博士,博导,主要研究方向为自然语言处理、语义网技术、机器学习、数据挖掘等; . 中文复杂名词短语依存句法分析 * 陈永波,汤昂昂,姬东鸿 (武汉大学 计算机学院,武汉 430072) 摘 要:针对中文复杂名词短语的依存句法分析进行了研究,提出简单边优先与SVM 相结合的依存句法分析算法。算法的每一步迭代根据边的特征于每一对相邻子树之间的无向边中选择最优者,然后利用支持向量机根据边两端子树的特征确定该边的方向,即得到两棵子树的中心语之间的依存关系。实验证明对于复杂名词短语的依存句法分析,算法准确率比简单边优先算法有明显提高,且优于基于最大生成树算法的中文句法分析器。算法分析效率更高,时间复杂度为O (n2logn )。 关键词:中文复杂名词短语;依存句法分析;决策式算法;支持向量机;特征 中图分类号:TP391.1 文献标志码:A Dependency parsing of Chinese complex nominal phrase CHEN Yong-bo, TANG Ang-ang, JI Dong-hong (Computer School, Wuhan University, Wuhan 430072, China) Abstract: This paper developed Easy Arc First Algorithm Combined with SVM, and used it in dependency parsing of Chinese Complex Nominal Phrase. In each iteration step, the algorithm finds out the optical non-directional arc among arcs linking neighboring subtrees according to their features, and determines the arc ’s direction using SVM. Results of experiments show that accurate rate of the algorithm is significantly higher than Easy First Arc Algorithm, and higher than Chinese parser based on MST algorithm. Time complexity of the algorithm is O(n2logn). Key Words: Chinese complex nominal phrase; dependency parsing; deterministic algorithm; SVM; feature 0 引言 复杂名词短语的语义解释是自然语言处理领域最具挑战性的课题之一[1]。研究复杂名词短语的依存句法分析算法,对句子依存分析计算复杂性的简化和准确率的提高具有重要意义 [2]。当前主流的依存句法分析算法可以分为三类:基于转换的 算法、基于图的算法和同时基于图与转换的算法。基于转换的算法计算简单,而准确率较低;基于图的算法准确率高,但计算复杂。Yoav 等[3]结合前两种方法,提出了简单边优先算法。该算法能较好地处理长句,却不能移植到复杂名词短语的句法分析。针对复杂名词短语的内部结构特征,本文提出了简单边优先与SVM 相结合的依存句法分析算法。算法考虑了复杂名词短语的内部结构特征,在降低计算复杂度的同时有效地保证了准确率。实验证明该算法能良好地应用于复杂名词短语的依存分析,且准确率和效率高于基于最大生成树算法的中文句法分析器。 本文内容主要分为五部分:本部分为引言;第一部分介绍 复杂名词短语的定义及其语义结构;第二部分介绍依存句法分析的定义及目前的主流算法;第三部分介绍简单边优先与SVM 相结合的依存句法分析算法;实验及结果分析在第四部分。 1 复杂名词短语 1.1 定义 本文的研究对象是指包含至少三个词语且不含助词“的”的复杂名词短语。下面1)和2)给出了两个复杂名词短语的例子。 1) 多种语言现象 2) 多种语言习得 研究复杂名词短语的识别和依存分析对于句子分析的简化和准确率的提高具有重要意义。目前国内外对于复杂名词短语语义结构的研究主要集中在NN 二词短语,而对于多词名词短语的研究比较少见。但多词名词短语的语义结构远非二词名词短语所能涵盖。例如1)中如果没有“现象”,“多种”语义上指向“语言”;如果添上“现象”,则很可能指向“现象”。相比

空间句法的新方法_比尔_希利尔

54 世界建筑2005/11 1 步行可达指数。图中显示了影响伦敦哈罗兹,金茨桥区域的步行活 动的重要因素。/Walkability Index.Bar chart showing significantfactors influencing pedestrian movement in the area aroundHarrods in Knightsbridge, London, as identified by the WalkabilityIndex.2 同一地区的步行活动预测图显示出了对新的联系(金茨桥和海德公园之间)的需求,可以同其他重要因素联系起来。预测等级通过不同 空间句法是一种研究城市的方法,主要是了解社会和经济因素是如何逐步影响并形成空间的。用当今的流行术语来说就是把城市看成是自组织系统。 空间句法最为人所知的方面也许是它建立了在建筑环境里分析空间模式或者说分析空间组构的方法。这些方法不仅揭示了城市中的空间结构,而且把它们和人的移动、停留和交流方式相联系。空间句法还能预测设计和规划所带来的中长期效果,因此,能让设计者和规划者在工作中遵循社会和经济发展规律,而不是违背它们。 这些研究方法已经在一段时间内得到了成功地运用,其中包括轴线分析法(用来分析城市街道网络和步行系统)和“可视性分析”(用来分析公共空间内的视域模式)。但是同时新的分析方法正不断地由伦敦大学学院空间句法实验室以及它的商业合作伙伴空间句法有限公司开发和研究出来。本文将简要地介绍其中一些发展。 组构的修正:步行可达指数 正如空间句法理论所说,空间组构强烈地影响人的流动,但并不意味着组构完全决定了人流或者它的作用是放之四海皆准的。在一些案例中,组构的影响比较弱,所以,要理解人流模式或者预测设计结果就需要一些其他额外的信息。这些附加的信息包括一些相关因素,如交通节点、土地利用、临街建筑、基础设施、主要吸引物和美学因素等。 现在这些其他因素都通过最近研发的一项称为步行可达指数的技术整合到了组构模式上。步行可达指数是 建立在统计学方法的多重回归分析(MRA)的基础上。多重回归分析是经验性地分析数据,以此来决定每个元素作为人流模型中所起的可变量作用。多重回归分析模型可以更好地理解与人流模式相关的问题,因为它强调了因素的相对重要程度,比如建筑高度、交通节点或者活跃的临街行为等等,有时它们和局部整合度(影响人流的主要组构量度)一样重要。 同时,改变不同的输入变量的值,例如那些步行道的宽度或者活跃临街行为的数量,都可以帮助预测可能发生的人流模式。事实上,这些因素的结合是可以被分析和修改的,这也就有了一个灵活性的方法。 步行可达指数在一些地区尤其有效,这些开发对空间结构、人流和土地利用的影响不同步,比如伦敦的大象城堡(Elephant and Castle)地区(它的总图设计采用了很多空间句法分析)。实际上,对于这样一个技术的需求正好说明路网结构、人流和土地利用三者之间的协调发展是一个发育良好的城市的产物。这也许是为什么传统城市更为人称道的主要原因。这并不意味着城市必须设计得和过去一样,但是却意味着它们设计的根据应借鉴那些具有活力的城市的经验。 更精确尺度的组构:线段分析 空间句法的一个很大优势在于它可以同时在城市宏观和微观尺度上分析空间。线是都市分析的一个主要单位(这反映了一个事实:城市空间本质上是一个线性空间网络)。但是这并不是我们需要了解的最精确的尺度,因为这些线在交点之间的不同线段经常是起着不同作用的。同样重要的是要考虑到不同城市存在非常不同的几 何形式,从更加网格状到更加有机状。 为解决这些问题,现在发展出了一种新的句法模式。它仍然是建立在线网的基础上,但是它的基本单位是交点之间的线段。这种模式不仅能在更精确的尺度上进行结构分析,而且可以通过不同的方式定义一个节点和另外一个之间的距离来进行不同类型的分析:实际路程距离(从点A到点B多远),最少转弯距离(一条路线有多少转弯),最小角度距离(两点之间的实际路径与连接两点的直线所形成的偏差角度大小)。这些不同的分析方法从不同的方面反映了都市的复杂程度。 尽管这种新模型还在研究测试中,但是它已经被证明对于分析城市最微观尺度的土地利用变化非常有效。这个模式现在被用来分析更精确的人流模式,同时它也指明了路程、几何和拓扑3个元素的作用使得城市空间网络本身形成了人流。这个领域的重要新成果在不久的将来公布,某种程度上可能是惊人的成果。 主观的组构:空间中智能行动者 现在来介绍最新的发展:EVAS空间中智能行动者。它是从视线分析(VGA)方法发展而来,已经被运用在很多公共空间项目上,包括最近的特拉法加广场(Trafalgar Square)的重新设计。 EVAS创造了虚拟环境(它建立在地图或者建筑图纸基础上),然后给虚拟的智能行动者赋予限制视角的朝前的视域。当这些智能行动者四处活动时,他们用“感知—行动”的规律来指导他们的运动行为,例如他们会被某个进入视野的特殊物体所吸引。如果环境改变(例如模拟一个新设计),EVAS会显示人流模式如何相应变 空间句法的新方法 NEW METHODS IN SPACE SYNTAX 比尔?希利尔,克里斯?斯塔茨/Bill Hillier, Chris Stutz 作者简介:比尔?希利尔 ,伦敦大学学院巴特雷特研究生院教授 兼院长,空间句法咨询公司非执行董事。 克里斯?斯图兹,空间句法咨询公司副主管。 收稿日期:2005-10-09 1 2 颜色来表达,红色最高,蓝色最低。/Pedestrian movement forecast map of same area with proposed new link (betweenKnightsbridge and Hyde Park), incorporating likely effects oflayout/configuration and other significant factors. Forecastlevels for each segment are represented on a colour scale, withhighest levels red and lowest levels blue. 影响步行活动的因素/Factors influencing movement 非常重要/Very significant 不重要/Not significant 重要/Significant 空间布局/Spatial layout 零售/Retail 地铁/Tube 特殊因素/Special 静止边界/Inactive frontages 哈罗兹/Harrods

现代汉语语法的五种分析方法

现代汉语语法的五种分析方法

现代汉语语法的五种分析方法 很有用,请好好学习之。 北语之声论坛专业精华转贴 现代汉语语法的五种分析方法是语法学基础里 很重要的一个内容,老师上课也会讲到,我在这 里把最简略的内容写在下面,希望能对本科生的专业课学习有所帮助 详细阐释中心词分析法、层次分析、变换分析法、语义特征分析法和语义指向分析的具体内涵:一. 中心词分析法: 分析要点: 1.分析的对象是单句; 2.认为句子又六大成分组成——主语、谓语(或述语)、宾语、补足语、形容词附加语(即定语)和副词性附加语(即状语和补语)。 这六种成分分为三个级别:主语、谓语(或述语)是主要成分,宾语、补足语是连 带成分,形容词附加语和副词性附加语是附加成分; 3.作为句子成分的只能是词; 4.分析时,先找出全句的中心词作为主语和谓

语,让其他成分分别依附于它们; 5.分析步骤是,先分清句子的主要成分,再决定有无连带成分,最后指出附加成分。 标记: 一般用║来分隔主语部分和谓语部分,用══标注主语,用——标注谓语,用~~~~~~标注宾语,用()标注定语,用[ ]标注状语,用< >标注补语。 作用: 因其清晰明了得显示了句子的主干,可以一下子把握住一个句子的脉络,适合于中小学语文教学,对于推动汉语教学语法的发展作出了很大贡献。 还可以分化一些歧义句式。比如:我们五个人一组。 (1)我们║五个人一组。(2)我们五个人║一组。 总结:中心词分析法可以分化一些由于某些词或词组在句子中可以做不同的句子成分而造成的歧义关系。 局限性: 1.在一个层面上分析句子,

层次性不强; 2.对于一些否定句和带有修饰成分的句子,往往难以划分; 如:我们不走。≠我们走。 封建思想必须清除。≠思想清除。 3. 一些由于句子的层次关系 不同而造成的歧义句子无法分析; 如:照片放大了一点儿。咬死了猎人的狗。 二. 层次分析: 含义: 在分析一个句子或句法结构时,将句法构造的层次性考虑进来,并按其构造层次逐层进行分析,在分析时,指出每一层面的直接组成成分,这种分析就叫层次分析。 朱德熙先生认为,层次分析不能简单地将其看作是一种分析方法,而是应当看做一种分析原则,是必须遵守的。(可以说说为什么) 层次分析实际包含两部分内容:一是切分,一是定性。切分,是解决一个结构的直接组成成分到底是哪些;而定性,是解决切分所得的直接组成成分之间在句法上是什么关系。

现代汉语句法结构理解

《现代汉语》句法结构理解 词与词组合构成句法结构.句法结构可以是词组也可以独立成句例如"他去"这个句法结构可以是主谓词组也可以单独成句.词组与句子的区别在"语法单位"一节已讨论过了.本章所涉及的"句法结构"(或"结构")若不用作句子与"词组"或"短语"同义. (注,本人在原文基础上用蓝字加注释,理解不一定对;令本人进行了文档结构编排,供学术研究之用,如有侵权,请联系本人文库账号) 1句法结构的分类 1.1从部组合的方式看 1.1.1基本结构 句法结构的基本类型有主谓、动宾、偏正、补充、联合五种.这五种类型体现了汉语的基本语法关系我们把它们叫作基本句法结构分别称为主谓结构、动宾结构、偏正结构、补充结构和联合结构. 1.1.1.1主谓结构 结构部两个成分之间有述和被述关系.例如: 鲜花盛开身体好今天晴天门开了窗台上放着一盆鲜花 1.1.1.2动宾结构 结构部两个成分之间有支配与被支配关系.例如: 去是老师买一本写钢笔站着一个人 1.1.1.3偏正结构 结构部两个成分之间有修饰和被修饰的关系.例如: A高尚的情操崇高理想南国风光春天般的温暖他的到来老人的孤独这部著作的出版 B都去很好应该去认真学习严格地训练慢慢地走 A组是"定语+中心语"(即为"定中关系")B组是"状语+中心语"(即"状中关系").

结构部两个成分之间有补充与被补充的关系.例如: 打扫干净好极了走出来跑了两趟好得很听得清楚高兴得跳起来 1.1.1.5联合结构 结构部有两个或两个以上的成分它们之间有并列或选择关系.例如: 语言文学准确鲜明生动谦虚谨慎研究决定少而精 讨论并通过容和形式今天或明天 1.1.2非基本结构 除了上述五种句法结构以外还有同位连动兼语紧缩等结构. 1.1. 2.1同位结构 结构部两个成分从不同的角度复指同一个人或事物.例如: 英雄城革命摇篮井冈山他们俩你自己雷锋同志坚医师工人周大勇 1.1. 2.2连动结构 主语相同的两个或两个以上的动词性成分连用它们之间没有主谓动宾偏正补充联合等关系;中间没有语音停顿书面上没有逗号隔开没有关联词语;动词性成分之间有先后方式目的等关系.例如: 走过去开门站着说话坐在台上看球赛赖着不走借书看有理由提出 (连动结构可以看成:基本结构的组合,走过去+开门整体式一个偏正结构,其中走过去是补充结构;站着说话:站着+说话是偏正,站着是补充;坐在台上看球赛:坐在台上+看球赛是偏正,坐在台上是补充,看球赛是动宾;赖着不走:赖着+不走是偏正,赖着是补充,不走是偏正;借书看:借书+看偏正,借书动宾) 1.1. 2.3兼语结构 由一个动宾结构和一个主谓结构套合而成动宾结构的宾语兼作主谓结构的主语.例如: 领着我们走请他讲一讲使他相信送他出国叫他来托他帮忙派小王去

句法分析工具指南(parser guideline)

PARSER GUIDELINE S tanford parser 一个简易的Stanford parser系统只需要包含四类文件,它们分别是:①java包(最新版本为stanford-parser-2011-04-20.jar)、②模板(英文:englishFactored.ser.gz/englishPCFG.ser.gz/wsjFactored.ser.gz/wsjPCFG.ser.gz。中文:chinesePCFG.ser.gz /chineseFactored.ser.gz/xinhuaFactored.ser.gz/xinhuaPCFG.ser.gz)、③输入文件(一般为.txt后缀的分词文件(、④输出文件(一般为.parse后缀的成分句法树文件或是以.dep 后缀的依存句法树文件) 1.英文句法分析 举例: Java -mx1g -cp stanford-parser-2011-04-20.jar edu.stanford.nlp.parser.lexparser.LexicalizedParser -maxLength 100 –outputFormat oneline -sentences newline -outputFormatOptions removeTopBracket englishFactored.ser.gz input.txt > output.std_Factored_parse 参数解释: ①-mx1g:给java虚拟机分配的最大内存为1g(大小可自行设置)。 ②-cp :为了加载java包stanford-parser-2011-04-20.jar。 LexicalizedParser:parser类. ③-maxLength:指定句子单词长度最大为100。 ④–outputFormat:指定输出句子的格式。 outputFormat具体选项值如下: Oneline:成分句法分析输出文件的格式为每行一句的广义表形式的树结构。Penn:成分句法分析输出文件的格式为层次化树的形式。默认选项为penn。latexTree:格式类似于penn Words:只给出分词格式。如: 继续播报详细的新闻内容。 wordsAndTags:给出分词文本和标记。如: 继续/VV 播报/VV 详细/VA 的/DEC 新闻/NN 内容/NN 。/PU rootSymbolOnly:只给出ROOT结点 typedDependencies:给出依存句法分析结果。 mmod(播报-2, 继续-1) rcmod(内容-6, 详细-3) cpm(详细-3, 的-4) nn(内容-6, 新闻-5) dobj(播报-2, 内容-6) conllStyleDependencies、conll2008:conll格式(每行一词,每词十项)如下: 1 继续_ VV _ _ 2 _ _ _ 2 播报_ VV _ _ 0 _ _ _ 3 详细_ VA _ _ 4 _ _ _ 4 的_ DEC _ _ 6 _ _ _ 5 新闻_ NN _ _ 6 _ _ _ 6 内容_ NN _ _ 2 _ _ _

面向领域的数据驱动的数据挖掘一个新的理解数据挖掘-中文版

面向领域的数据驱动的数据挖掘一个新的理解数据挖掘 抽象:最近,在计算机、通讯、数据存储技术、高通量数据采集技术上的进步使得收集和存储令人难以置信的海量数据成为可能。为从数据库中发现大量知识创造了前所未有的 机遇。数据挖掘是一种为处理大量的数据提供了新的理论,技术和工具的新兴领域的计 算智能,例如:数据分析、决策等等。有许多研究人员从事于设计有效的数据挖掘技术、方法和算法。不幸的是,大多数的数据挖掘研究人员把重心放在了发展数据挖掘的模式 和方法上,只有一小部分致力于数据挖掘的基本问题。本文中我们会提出一个新的数据 挖掘的理解,那就是面向领域的数据驱动的数据挖掘(3DM)模型。数据驱动的数据挖 掘算法在我们的实验室开发出来同时提出来以显示她的有效性。 1.介绍 数据挖掘是被我们从巨大的数据集总获取知识的渴望刺激的产物。它使用机器学习,统 计和可视化技术去发现数据中的知识,并且以一种很容易为用户理解和使用的形式表现 出来。许多数据挖掘方法是基于机器学习算法、统计方法的扩展、组合和调整和知识的 提取和抽象。在过去的二十年里,许多技术被应用在数据挖掘中,例如人工神经网络, 模糊集,粗糙集,决策树,遗传算法,最近邻方法,基于统计规则归纳法,线性回归, 线性预测编码等等。对于数据挖掘的研究有很多观点。现有的大量研究可以被粗略的分 为三种观点,不管在数据挖掘的研究中采取的哪种观点,大多数的数据挖掘人员对发展 数据挖掘模式和方法的技术问题投入的大量的精力,只有少数的人关注数据挖掘的基本 问题。什么是数据挖掘?数据挖掘的产物是什么?我们这数据挖掘中在做什么?我们在 数据挖掘中应该遵守的规则是什么?数据领域专家的先验知识和知识丰富的头脑直接的 关系式什么? 为了回答以上问题,我们需要研究数据挖掘的过程。首先,大量相关的研究已经被 证实,一个三层的概念框架被Yao提出,它包括哲学层,技术层和应用层。这个框架的 层代表了知识利用的理解,发现和区分。Peng为数据挖掘和知识的发现领域提出了一个系统框架,它的目的就是区分数据挖掘领域和知识发现。此外,国际上还举办了有关数 据挖掘基础的研讨会。遗憾的是,仍然没有被完全认可和没有争议的答案对于之前提到 的问题。在本文中,我们将会对基于概念上的数据挖掘模式提出一种新的理解。我们的 答案将会是“数据挖掘是知识转型的一个过程”。我们工作中关于数据挖掘技术的最经 的成果也会给以介绍以展示3DM模式的合理性。 2、面向领域的数据驱动的数据挖掘模式 2.1 数据驱动的数据挖掘 数据挖掘是对数据中隐含的之前未知的潜在的有用知识的非一般的提取。知识可以以许 多不同的方式表现出来,对于编码知识有很多种形式,最简单的格式或许是象征性的格

《现代汉语》句法结构资料讲解

浅析现代汉语语法中句法结构的分类类型 摘要:现代汉语的语法中,词和词相搭配构成短语和句子,在这个过程中所形成的结构就是句法结构。句法结构是构成句子的基本要素和框架,也是现代汉语在交流过程中的基本原则。对句法结构的分析是现代汉语构词成句固定性的要求。本文通过对相关例子的枚举和分析,浅要探析现代汉语语法中句法结构的主要类型。 关键词:现代汉语语法句法结构搭配分类 词与词组合构成句法结构.句法结构可以是词组也可以独立成句。从内部组合的方式看句法结构的基本类型有:主谓、动宾、偏正、补充、联合五种。这五种类型体现了汉语的基本语法关系。我们把它们叫作基本句法结构。分别称为主谓结构、动宾结构、偏正结构、补充结构和联合结构。 一.基本句法结构的分类 1主谓结构 主谓结构是指结构内部两个成分之间有陈述和被陈述关系.例如:“鲜花盛开”中鲜花为主语,盛开为谓语,两个词之前呈现陈述与被陈述的关系。 与之类似的还有:身体好,今天晴天,门开了,窗台上放着一盆鲜花,等。 2动宾结构 结构内部两个成分之间有支配与被支配关系.例如:“上车”中动词“上”支配名词“车”,新城动宾结构。 因此,“去北京”“是老师”“买一本”“写钢笔”“站着一个人”等结构都属于动宾结构。3偏正结构 偏正结构是指结构内部两个成分之间有修饰和被修饰的关系.例如:“帅哥”中形容词“帅”修饰名词“哥”,两个成分构成偏正结构。与之属于同类的还有“高尚的情操”“崇高理想”“南国风光”“春天般的温暖”“他的到来”等。 以上所叙述的是偏正结构中"定语+中心语"(即为"定中关系")。除此之外偏正结构中还有一种情况,例如:“都去”“很好”“应该去”“认真学习”“严格地训练”“慢慢地走”,这些属于是"状语+中心语"(即"状中关系")。 4补充结构 结构内部两个成分之间有补充与被补充的关系.例如: “打扫干净”“好极了”“走出来”“跑了两趟”“好得很”“听得清楚”等,以补语补充中心语(动词、形容词)的形式出现。 5联合结构 结构内部有两个或两个以上的成分它们之间有并列或选择关系.例如: “语言文学”“准确鲜明生动”“谦虚谨慎”“研究决定”“少而精”“讨论并通过”“内容和形式”“今天或明天”中,前后几个成分的关系是相对单独并列或选择的,所以称为联合式结构。 二.特殊句法结构分类。 除了上述五种基本句法结构以外,汉语中还有同位、连动、兼语、紧缩等特殊形式结构的存在。 1.同位结构 结构内部两个成分从不同的角度复指同一个人或事物,例如: “首都北京”中“首都”从功能和象征意义上、“北京”从名称上指代同一座城市,因此构成同位结构。与此相类似的还有:“英雄城南昌”“革命摇篮井冈山”“他们俩”“你自己”等。

现代汉语语法研究

现代汉语语法研究

论现代汉语语法研究历史 学院名称:人文社科学院专业:汉语言文学 班级:13东策划 姓名:丁玎 学号:2013801102 指导教师姓名:程树铭 指导教师职称:教授

2014年6月 摘要:通过对语法历史发展的回顾,即八十年代以后,汉语语法学者借鉴国外语法理论,发掘汉语事实,探讨适合于汉语的分析方法,在汉语的语法范畴、语法关系、语法单位以及语法表达功能等方面都进行广泛的探究这段历史,充分领悟现代汉语语法在现代汉语中的重要性,帮助我们更好掌握语法知识,能使我们再以后的语言表达能力上更上一层楼。 关键字:语法关系,语法单位,语法表达功能 语言是由语音形式、语义内容、结构关系三个方面构成的统一体,三个方面缺一不可,互相作用,构成了语言。语音是语言的形式部分,词汇是语言的意义部分,语法是语言单位的关系部分,说的是符号与符号怎样组合的问题。三个部分在语言中的作用,我们可以这样简单来表述:没有语音形式,语言就无法存在,

没有词汇的内容意义,语言就是一个毫无作用的空壳,没有语法,语言就是一盘杂乱而毫无章法的散沙。例如:山上草在吃牛儿--牛儿在山上吃草从上面的一些组合的例子可以看出,语法虽然是看不见摸不着的东西,可是它又是实实在在的,客观存在于语言之中的。一种语言,即使是最原始的语言,也得有一套语法规则系统,指导人们按照已有的规则去组织符号,构成表达思想的句子,否则,像上面所举的例子那样,同样的意思同样的词语,不同的人完全自说自话,别人就根本不可能理解你说的什么内容,语言也就不可能成为人类的交际工具了。 语法是语言结构的三个要素之一,而且从某种意义上说是最重要而又最容易被人忽视的一个要素。简单地说语法就是用词造句的规则系统,它是词的构成规则、变化规则、组合规则的总和。而从八十多年来,汉语语法学者借鉴国外语法理论,发掘汉语事实,探讨适合于汉语的分析方法,在汉语的语法范畴、语法关系、语法单位以及语法表达功能等方面都进行了广泛的探究。 汉语语法学者从一开始就关注语法范畴的确立问题,数十年来关于"词类"问题的广泛讨论和不懈探究就是一部汉语基本语法范畴的确立历史。和其他语言的研究者一样,汉语语法学者首先准确地辨析出了名词、动词、形容词这样的基本词类范畴,但在分析手续上却遇到了许多西方学者所未曾遇到的难题。因为汉语几乎没有可供辨识的外在词形标记,在确定词类成员的问题上就很难得出明确的结论。早期的汉语语法学者看到英语这样形态

汉语句法分析方法的嬗变

汉语句法分析方法的嬗变 综述:我国古代就有学者对语言进行研究,但我们的研究更多的是音韵、文字等方面,而语法一直是我们研究的弱点,我国的语法研究起步晚,可以说是以《马氏文通》为起点,它奠定了汉语传统语法学的基础。不难发现,我国的语法研究深受西方语言法学研究的影响,当然关于句法分析的研究也是如此。关于汉语句法分析的研究,从20世纪80年代初以来,一直都没有停止过,先后出现了中心词分析法与层析分析法相结合的方法、变换分析法、语义特征分析法、配价分析法、语义指向分析法等汉语句法分析方法。 摘要: 汉语是一门简单而又复杂的语言,为了让我们更好地了解汉语,语言学家想出了一些方法来解释说明语言中的种种现象,我们称之为“句法分析法”。经过许多学者的努力,到目前已经有不少的研究成果了。众多学者站在不同的专业角度研究出了不同的分析方法来解释语言现象。如层次分析法、变换分析法、语义特征分析法、配价分析法等。那关于汉语句法分析的研究进行了这么多年,其中历经了哪些演变?结合所学知识,我对此做了以下分析。 关键词:句法分析、演变、汉语、作用 正文: 汉语是一门简单而又复杂的语言,为了让我们更好地了解汉语,语言学家想出了一些方法来解释说明语言中的种种现象,我们称之为“句法分析法”。所谓句法分析就是指对句子中的词语语法功能进行分析,比如“我来晚了”,这里“我”是主语,“来”是谓语,“晚了”是补语。迄今为止,众多学者已经研究出了许多不同的分析方法来解释语言现象,从句子成分分析法、层次分析法、变换分析法、语义特征分析法、配价分析法到语义指向分析法,句法分析逐步走上兼顾形式和意义的道路,可以说句法分析在自然语言处理领域中具有十分重要的地位。 句子成分分析法(也叫中心词分析法)是我国语言研究中最早使用的一种句法分析法,黎锦熙在《新著国语文法》中首次提出了“六大句子成分说”,为句子成分分析法的产生奠定了基础。对于这句子成分分析法,我们比较熟悉。所谓句子成分分析法是从句法结构的关系意义出发,对句子的成分功能或作用分析的方法,即用各种方法标出基本成分(主语、谓语、宾语)和次要成分(定语、状语、补语)。这种分析方法,分析的对象是句子,认定句子有六个大的句子成分,即所谓的主语、谓语、宾语、定语、状语、补语。在一个句子中,做句子成分的原则上都只能是词,而且分析时,应该先找出全句的中心词作为主语和述语,再看述语是哪一种动词,决定它后面有无连带成分宾语或补足语,最后指出句中所有的附加成分——形容性附加语和副词性补足语。 句子成分分析法的优点是:第一,容易找出句子的脉络;第二,可以分析由中国特色的句子,如兼语句。但是它只能分析单句中的主谓句,不能分析单句中的非主谓句,不能分析复句,也无法分析句组;分析歧义句的能力差,忽视了句子的层次性。 句子成分分析法被语言教学界广泛接受和使用,中小学教学一般采用这种方法来给学生进行句法分析。它对推动汉语教学语法的发展做出了很大的贡献。 在句子成分分析法之后,又一句子分析法出现在我国的语言界——层次分析法。它是美国著名语言学家布龙菲尔德在20世纪30年代提出的一种语言分析方

现代汉语句法分析中的变换分析法

现代汉语句法分析中的变换分析法 摘要:对变换分析法在汉语语法学界的发展运用作较全面的分析阐述并对变换现象加以分类,分析变换的方法和原则,阐明变换的作用,归纳分析这方面的研究成果,也指出了变换分析的局限性。关键词:变换分析;句法分析;汉语 我们想要认识和了解语言,就要对其作深一层的分析,要了解其中的规则,句法分析就是必不可少的。从句法的角度来解释说明种种语言现象,就称之为“句法分析”。句法分析经历了长时间的发展,逐渐形成了句子成分分析法、层次分析法、变换分析法、语义特征分析法、配价分析法、语义指向分析法等多种方法。 首先一般比较熟悉的是句子成分分析法,它可以让人一下子把握住一个句子的脉络,但它不大关注语法结构的层次性。由于它的这一局限性,便出现了层次分析法,层次分析法将句法结构的层次性考虑进来,按其构造层次逐层进行分析,但它不能揭示句法结构内部的实词之间的语义结构关系,特别是歧义。要揭示这种隐含在句子里边的实词与实词之间的语义结构关系,就得寻求新的分析手段,于是变换分析法就又适应这种需要而产生了,成为最易于和普遍运用的一种方法。 一、什么是变换分析法 关于变换的思想,早在1942年出版的吕叔湘的《中国文法要略》一书里就有了。之后,吕叔湘在《中国文法要略》中讨论了句子和词组相互转换的问题,但未具体展开。50年代,海里斯和乔姆斯基

分别在结构语言学和生成语法的框架下展开了转换的研究。而继海里斯之后,在中国朱德熙先生在变换分析上作出了重要的贡献。在《语法讲义》中,朱先生充分运用了变换分析的方法来解释许多层次分析法不能解决的问题,在分化歧义句式、层次切分、判断词类以及分化语义角色等方面都发挥了重要作用意义。 变换分析法是通过移位、添加、删除、替换等方法来考察具有内在联系的不同句法结构之间联系的一种分析方法,即按照一定的规则,把甲句变成乙句。它是根据句法格式的相关性,是两种结构不同的句式之间根据依存关系的变换。目的是通过变换分辨句法结构的异同,看清句子结构的特点。朱德熙先生首先提出变换分析法,并在国内最早运用这种理论进行实践。例如: a台上坐着主席团可以转换为: a1主席团坐在台 b 操场上放着电影b1 操场上正在放电影 这两组例句都是“处所名词+动词+助词+名词”,是相同的结构,但在语义关系上还存在区别。 具体的来看,变换分析法可以分为两类来更清楚地加以认识:(1)当句法同义时 1.我打破了杯子。 可变换为: a、杯子被我打破了。 c、我把杯子打破了。 虽然转换成不同的句子格式,但是施事受事都未发生变化,意思

《现代汉语》句法结构教学内容

】《现代汉语》句法结构 词与词组合构成句法结构.句法结构可以是词组也可以独立成句例如"他去香港"这个句法结构可以是主谓词组也可以单独成句.词组与句子的区别在"语法单位"一节已讨论过了.本章所涉及的"句法结构"(或"结构")若不用作句子与"词组"或"短语"同义. 一句法结构的分类 (一)从内部组合的方式看句法结构的基本类型有主谓动宾偏正补充联合五种.这五种类型体现了汉语的基本语法关系我们把它们叫作基本句法结构分别称为主谓结构动宾结构偏正结构补充结构和联合结构. 1主谓结构 结构内部两个成分之间有陈述和被陈述关系.例如: 鲜花盛开身体好今天晴天门开了窗台上放着一盆鲜花 2动宾结构 结构内部两个成分之间有支配与被支配关系.例如: 去北京是老师买一本写钢笔站着一个人 3偏正结构 结构内部两个成分之间有修饰和被修饰的关系.例如: A高尚的情操崇高理想南国风光春天般的温暖他的到来 老人的孤独这部著作的出版 B都去很好应该去认真学习严格地训练慢慢地走 A组是"定语+中心语"(即为"定中关系")B组是"状语+中心语"(即"状中关系").

结构内部两个成分之间有补充与被补充的关系.例如: 打扫干净好极了走出来跑了两趟好得很听得清楚 高兴得跳起来 5联合结构 结构内部有两个或两个以上的成分它们之间有并列或选择关系.例如: 语言文学准确鲜明生动谦虚谨慎研究决定少而精 讨论并通过内容和形式今天或明天 除了上述五种句法结构以外还有同位连动兼语紧缩等结构. A同位结构 结构内部两个成分从不同的角度复指同一个人或事物.例如: 英雄城南昌革命摇篮井冈山他们俩你自己雷锋同志赵坚医师 工人周大勇 B连动结构 主语相同的两个或两个以上的动词性成分连用它们之间没有主谓动宾偏正补充联合等关系;中间没有语音停顿书面上没有逗号隔开没有关联词语;动词性成分之间有先后方式目的等关系.例如: 走过去开门站着说话坐在台上看球赛赖着不走借书看 有理由提出

基于依存句法的实体关系抽取

龙源期刊网 https://www.doczj.com/doc/0214119044.html, 基于依存句法的实体关系抽取 作者:周亮俊 来源:《电子技术与软件工程》2016年第24期 本文首先介绍了自然语言处理的概念,并给出了自然语言处理模型,与此同时,分析了依存句法的有关问题,包括其公理以及具体分析方法等,最后阐述了基于依存句法的实体关系抽取过程。 【关键词】计算机自然语言处理依存语法实体关系抽取 计算机技术与人工智能的结合,形成了自然语言处理,使得人与计算机的结合更加紧密,依存句法能够实现对实体关系的抽取和对自然语言的分析,进而使自然语言处理成为可能,这对于信息抽取效率的提高以及人与计算机之间联系的加强意义重大。 1 自然语言处理 1.1 自然语言处理的概念 自然语言处理,是计算机领域的一种技术,是计算机技术发展到一定阶段,与人工智能逐渐结合的产物。自然语言即人类的常用语言,自然语言处理的意义在于,对上述语言进行处理,使其能够被计算机所识别,进而将其应用于计算机软件系统当中,使软件的研发以及修改等得以实现的一种技术。鉴于语言本身存在复杂性的特点,因此自然语言处理的实现也十分复杂,建立相应的计算模型,是使处理过程能够有效实现的基础。 1.2 自然语言处理模型 自然语言处理模型由自然语言(N)、问题(P)、模型(M)、算法( A)、输入集(I)与输出集(O)几种因素组成。自然语言属于人类的语言,计算机作为机器,不能够对其进行识别,将其转换为问题,能够使其与计算机的识别要求相适应,与此同时,使其以模型的方式体现,可以使自然语言处理得以实现。在充分考虑输入集的前提下,应用相应的算法,将其与在问题的基础上所得到的模型相结合,能够产生输出集,最终完成自然语言处理过程。 2 依存句法 依存句法的应用,是实现自然语言处理的基础。在依存句法的基础上,自然语言能够以依存树等形式存在,为语言的处理提供了便利条件。 2.1 依存句法公理 依存句法的公理主要包括以下几方面内容:

再论“空间句法”(图文整理详细版)

再论“空间句法”(图文整理详细版) 作者:张愚王建国 国内建筑界对空间句法的了解,多数仅限于由赵冰翻译的《空间句法——城市新见》一文[1]。发表于1985年第一期《新建筑》上的这篇文章,简要介绍了早期的空间句法方法在城市空间形态研究方面的应用,但未全面介绍其方法背景、原理和其他应用,因此,至今很多人仍颇有不解或“持保留态度”[2]。多年来,空间句法在各方面已有长足发展,国内杂志却鲜有论及。本文试图比较清晰地介绍和评析空间句法的理论、方法、实践及其最新研究进展。 简单地说,空间句法是一种通过对包括建筑、聚落、城市甚至景观在内的人居空间结构的量化描述,来研究空间组织与人类社会之间关系的理论和方法(Bafna, 2003)。它是由伦敦大学巴利特学院的比尔•希列尔(Bill Hillier)、朱利安妮•汉森(Julienne Hanson)等人发明的。早在1974年,希列尔就用“句法”一词来代指某种法则,以解释基本的但又是根本不同的空间安排如何产生[3]。到1977 年,空间句法研究则略具雏形。经过二十余年的发展,空间句法理论已经深入到对建筑和城市的空间本质与功能的细致研究之中,并得到不断完善;由此开发出的一整套计算机软件,可用于建成环境各个尺度的空间分析;而且在建筑和城市设计中进行了广泛的应用。如今,空间句法的研究和应用已经在世界范围内普遍展开。 1997年,首届世界性的空间句法研讨会在伦敦举行;其后于1999年和2001年又在巴西利亚和亚特兰大举行了第二和第三届。2003年6月,在伦敦刚刚举行的第四届研讨会上,来自世界数十个国家和地区的82篇论文,从不同角度对空间句法进行了广泛深入的探讨。另外,日趋成熟的空间句法分析技术,已经成功应用于商业咨询。理查德•罗杰斯、诺曼•福斯特、泰瑞•法雷尔等知名事务所,在众多建筑和城市设计项目中雇请空间句法咨询公司进行空间分析,为其设计提供了有力的引导和支持。 由于篇幅所限,本文以解释构形概念为主线,重点从空间知觉的角度简析空间句法的方法原理,使读者能真正理解并实际运用它;而对于空间句法的理论概念和具体应用成果仅作扼要介绍。 1. 构形与建筑学 1.1 构形的含义 构形(configuration),从字面上看,是指“轮廓由其各部分或元素配置决定的外形”(据美国传统辞典)。希列尔将构形定义为“一组相互独立的关

现代汉语语法的句法分析

《现代汉语语法研究》第三讲现代汉语语法的句法分析这里的句法是指语法的句法结构平面。词语与词语按照一定的方式组合起来,构成一定的句法结构,对句法结构进行分析,就是句法分析。在这一讲里,我们主要讲三个问题: 1、句法结构的结构类型 2、句法结构的结构成分 3、句法结构的分析一、句法结构的结构类型1、句法结构的分类词语与词语按照一定的方式组合起来,构成一定的句法结构。根据构成句法结构的词语的性质和结构方式,我们可以把句法结构分成不同的类型。由实词与实词构成的句法结构,根据实词与实词之间不同的结构方式分为不同的类。主要有:联合结构、偏正结构、动宾结构、中补结构、主谓结构、连动结构、兼语结构、同位结构、方位结构、量词结构。由实词与虚词构成的句法结构,根据虚词的标志特征分为不同的类。主要有:“的”字结构、介词结构、比况结构、“所”字结构这些不同的结构,从结构形式上讲又可以分为两类:复合式和附加式。(1)、复合式由实词与实词构成的句法结构,其中联合结构、偏正结构、动宾结构、中补结构、主谓结构、连动结构、兼语结构、同位结构是复合式。 ①偏正结构由修饰语和中心语两部分组成,一前一后。如:“他的哥哥”“明天回来”②动宾结构两部分构成,前一部分是动词,后一部分是动词涉及的对象。例如:“考大学”“想念亲人”③中补结构

两部分组成,后一部分补充说明前一部分,中补短语的中心语通常是谓词性词语,如:“跑得快”(中心语为动词)“好得很”(中心语为形容伺)④主谓结构两部分组成,前一部分是主语,是被陈述的对象,后一部分是谓语,是陈述前一部分的。如:⑤兼语结构由一个动宾短语和一个主谓短语套叠而成,动宾短语的宾语兼作主谓短语的主语。如:⑥连动结构由不止一个动词性词语连用,隐含同一个主语,各部分之间没有关联词语,没有语音停顿,也没有联合,偏正、主谓、补充等关系,这样的短语叫连动短语。如:⑦联合结构由两个或两个以上的部分组成,各部分之间具有并列、顺承、选择、递进等关系。如:“城市乡村”“我和你”⑧同位结构两部分组成,这两部分从不同的方面称说同一个人或物。构成同位的两项词语必须是两个不同的词语,而且必须是复指关系,即在同一个句法位置上指同一个对象。如:“古城西安”、“通讯员小王”。(2)、附加式由实词与虚词构成的句法结构都是附加式的,由实词与实词构成的方位结构、量词结构也可看成附加式。①方位结构由方位名词附加在其他词或短语的后面组成,表示处所,范围或时间。如:“教室里”“操场上”“整洁的房间里”“毕业前”“前进中”“会议结束之前””吃完饭后”②量词结构由数词或代词加上量词组成,如:“一个”“五次”“这件”“那位”③“的”字结构由结构助词“的”

相关主题
文本预览
相关文档 最新文档