当前位置:文档之家› 事件关系检测的语言学资源、评测及研究综述?

事件关系检测的语言学资源、评测及研究综述?

事件关系检测的语言学资源、评测及研究综述

作者:杨雪蓉

来源:《智能计算机与应用》2014年第02期

摘要:事件关系是一种客观存在于事件之间的逻辑关系,事件关系检测是一项面向文本信息流进行事件关系判定的自然语言处理技术。事件关系检测的核心任务是以事件为基本语义单元,通过分析事件的篇章结构特征及语义特征,借助语义关系识别和推理,对事件关系进行自动分析与理解。事件关系检测技术在自动文摘,自动问答,信息检索等领域有着广泛的应用。本文首先介绍事件关系检测的任务定义、语言学资源和评测方法;然后,回顾国内外现有的主要研究方法;最后,给出这一研究的关键问题及技术难点。

关键词:事件抽取;事件关系;事件推理;机器学习

中图分类号:TP391 文献标识码:A 文章编号:2095-2163(2014)02-

A Survey of Event Relation Detection

YANG Xuerong, MA Bin, HONG Yu, YAO Jianmin, ZHU Qiaoming

(Provincial Key Laboratory of Computer Information Processing Technology, Soochow University, Suzhou Jiangsu 215006 ,China)

Abstract: Event relation is a kind of logic relation, which exists between events objectively. And event relation detection, as one of natural language processing technologies, faces information stream of texts detecting unknown event relations. The key to event relation detection is to recognize the event relation automatically by analyzing the corresponding discourse structure and semantic features of events, with the techniques of semantic relation recognition and inference,which treats event as the basic semantic unit. The notion of event relation detection has been applied to many areas such as automatic summarization, automatic question answering and information retrieval. This paper mainly introduces background, definition, linguistics resource, evaluation and methods of event relation extraction, and explores its future development trend through analyzing current research. Finally, the paper correspondingly points out the critical issues and the technical difficulties of the research.

Key words: Event Extraction; Event Relation; Event Inference; Machine Learning

0 引言

事件是一种描述特定人、物、事在特定时间和特定地点相互作用的客观事实(也称“自然事件”)。文本中的事件则是这一客观事实诉诸文字的独特语用形式,多见于新闻报道、评论或博文等。

然而,自然事件的出现往往不是孤立现象,其发生与发展往往与外在的其它自然事件有着本源的逻辑关系。例如,事件“袭击”就常常与“死亡”、“摧毁”和“伤害”事件同时出现在同一语言环境中,并且存在强烈的因果关系。针对以上文本现象,事件关系检测是一种强调针对多个相关事件之间逻辑关系进行分析的自然语言处理技术,通过解析文本结构和语义,对文本中描述自然事件的文本片段(包括短语、子句、句子和段落)间的逻辑关系进行判定。事件关系检测对于现有信息处理技术有着重要的应用价值,比如自动问答、自动文摘和话题预测等。同时,借助事件的固有逻辑关系,能够推理特定事件的衍生与发展概率,从而有效辅助信息传播中话题的监控。事件含有较为丰富的结构信息(触发词、事件元素和事件角色等),探索如何有效利用事件结构化信息和上下文环境进行事件关系检测对自然语言领域的发展具有重要的意义。

本文介绍事件关系检测的相关知识,重点论述和分析事件关系检测的任务定义及近期国内外的相关研究,并阐述事件关系检测领域面临的关键问题。

1 事件关系检测研究体系

1.1 事件关系定义

自然事件的逻辑关系,即事件关系,是事件之间相互依存和关联的逻辑形式,具有客观性、事实性和规律性三种主要特征。以往的事件关系检测工作主要针对常见的事件关系类型进行研究,如时序关系(Temporal Relation)和因果关系(Causal Relation)[1,2]。Mani[3]将事件时序关系(Temporal Relation)定义为:在特定时间段内,同时或者先后发生的相关事件之间蕴含的关系。在事件时序关系识别过程中,借助“相关事件对”之间的显式连接词(如“然后”、“接着”、“自从”等)和明确的时间短语辅助事件时序关系的判定。事件间的因果关系[4] [5]是指:一个事件的发生引起另外一个事件的发生。

然而,目前的相关研究尚未形成事件关系的统一定义,因此,当前研究中提及的事件关系定义及其类别划分不能作为解释深层事件关系的核心参照标准。已有的相关研究对事件关系进行了初步的定义和类别划分。Allen[6]将事件的时序关系细分为13种子类关系,比如,“After”(时序“后”)关系,“Before”(时序“前”)关系,“Be included”(“被”包含)关系等;Takashi[7]则将因果关系扩展为4种子类型(即“因”,“果”,“前置条件”和“后置条件”);刘宗田[8]提出了一种面向事件的本体模型,将具有共同特征集合的事件归类,并从事件类的角度将事件关系的类别划分为分类关系(也称上下位关系、父子关系)和非分类关系,其中非分类关系包括组成关系、因果关系、跟随关系(时序关系)和伴随关系。

针对这一任务的研究刚刚起步,尚不深入,自然语言理解领域的篇章分析[9]能在一定程度上给予补充。篇章分析是近几年自然语言处理领域新兴的研究热点,包含了篇章结构理解、篇章关系理解和篇章修辞理解三个主要研究任务。其中,篇章关系理解是与事件关系检测直接相关的研究任务,研究的核心问题是判定一对论元之间的逻辑关系(如“因果”关系),而论元是一种具有完整语义并表述独立观点的文字片断,既可以是开放域中的词组、子句、句子、段落或章节,也可以是限定域(如新闻报道、评论或博文等)中的事件描述。特别地,事件关系的解析即是事件之间关联逻辑的解析,从而,篇章关系理解为解释和辨识事件之间的伪关系提供了一条有效途径。区别于浅层关系识别仅仅判定论元之间是否具有相关性(相关或不相关的二元判定),篇章关系理解则需额外地指定相关性的属性(即逻辑关系类别)。针对这一研究,PDTB(Penn Discourse TreeBank,即Penn篇章树库)给予了明确任务定义,设置了全面的逻辑关系层次体系,并提供了用于评测的专业语言学资源。

但是,篇章关系着眼于篇章内部关系,事件关系却不仅仅局限于篇章内部,某些关系建立在不同篇章中的事件之间(即跨篇章性)。并且,与篇章内部关系不同,跨篇章的事件关系往往不具有文字线索辅助关系推理。从而,两者检测方法存在交叉,但不能绝对平行地交换使用。

1.2 任务定义

事件关系检测任务包括事件抽取、事件关系关联性识别和事件关系判定三个主要过程。

1.2.1事件抽取

事件抽取将蕴含在文本中的事件信息用结构化文本片段表示,作为事件关系检测中逻辑关系分析的基本文字单元,事件抽取能够为事件关系检测提供内部属性明确的事件描述;事件关系关联性识别主要是判断两个事件之间是否具有逻辑或者语义关系,为事件之间的深层关系检测预先采集样本,是深入解析事件逻辑关系的重要前提条件;事件关系判定则是在事件关系关联性识别的基础上,判定相关联事件属于何种事件逻辑关系的过程。事件关系检测涉及各个语言分析层面,如词汇层(分词和词性标注)、句法层(命名实体识别和语法分析)、语义层(语义分析)和篇章层(跨句的指代消解)。

事件抽取作为自动内容抽取(Automatic Content Extraction,简称ACE)的子任务之一,旨在从含有事件信息的非结构化源文本中抽取结构化的事件描述,在自动文摘[10,11],事件抽取任务自动问答[12]以及信息检索等领域有着广泛的应用。事件抽取能够提供事件的基本属性,并建立事件内部各组成成分之间的语义关系,从而塑造事件本质的描述结构。而事件本质往往决定了事件与外部事件发生作用的逻辑形式,比如,仅就事件类型而言,一种“袭击”事件,往往与“死亡”或“伤害”事件相互关联,并形成“因果”关系。因此,事件抽取是实现关联事件识别和事件关系判定的先决条件,也是事件关系检测的关键问题之一。

1.2.2事件关系关联性识别

相关主题
文本预览
相关文档 最新文档