语料库语言学的发展及研究现状

  • 格式:pdf
  • 大小:261.78 KB
  • 文档页数:9

下载文档原格式

  / 9
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

当代语言学(试刊)1998年第1期4-12页,北京

语料库语言学的发展及研究现状

丁信善

1.0引言

语料库语言学已经成为语言研究的主流。基于语料库的研究不再是计算机专家的独有领域,它正在对语言研究的许多领域产生愈来愈大的影响。 这是J.Thomas等人1996年为祝贺语料库语言学的主要奠基人和倡导者G.Leech六十诞辰而出的语料库语言学研究论集的开场白。近年来,对语料库语言学类似的评说频频见于导论和方法论的书及教科书中,它不仅仅是语料库语言学家们的自誉,而正在成为整个语言学界的共识。

2.0语料库语言学的定义

关于语料库语言学的定义,现引述三例:

a. 根据篇章材料对语言的研究称为语料库语言学。 (K.Aijmer&B.Aitenberg,1991,p.1)

b. 基于现实生活中语言运用的实例进行的语言研究称为语料库语言学。 (T.M c Enery&A.

Wilson,1996,p.1)

c. 以语料为语言描写的起点或以语料为验证有关语言的假说的方法称为语料库语言学。 (D.

Crystal,1991,p.86)

由上述几个定义可见,语料库语言学不是研究语言自身某个方面,而是一种以语料库为基础的语言研究方法。它实际上包括两个方面:一是对自然语料进行标注,二是对已经标注的语料的研究和利用的方法。从方法论的角度,它不仅可以用于研究语言系统的各个层面,而且可以应用于语言学之外的其他领域。

3.0语料库语言学的历史发展

语料库语言学作为一种研究语言的方法,可以追溯到上个世纪,甚至更为久远。现在一般以乔姆斯基转换生成语法的兴衰时间为参照,将其发展大致分为以下几个阶段:

3.1语料库语言学的早期发展

早期的语料库语言学指的是本世纪五十年代中期以前,即乔姆斯基提出转换生成语法理论之前的所有基于语言材料的语言研究。此类研究主要集中在以下几个方面:

(1)语言习得是应用语料研究方法较早且较普遍的领域。19世纪70年代在欧洲兴起了儿童语言习得研究的第一个热潮,当时的许多研究就是基于父母详细记载其子女话语发展的大量日记的。据悉,这些日记作为原始材料,不仅是当时W.Preyer和W.Stern等人的理论假说的依据,而且时至今日仍是许多学者的研究语料之一。自本世纪30年代以来,语言学家和心理语言学家提出了众多关于儿童在不同年龄段的语言发展模式。这些模式大都是建立在对儿童自然话语大量材料的研究分析上的。

(2)利用自然语料开展音系研究,在西方当首推美国早期的结构主义语言学家,如F.Boas和

E.Sapir等人。他们注重 野外工作 ,强调语料获取的自然性和语料分析的客观性。这些都为后来的语料语言学所继承和发展。

本文承蒙哥本哈根大学翻译与词典学研究中心主任C.Dollerup博士提供有关欧洲语料库网络的材料,特此致谢。

(3)方言学从其产生以来就与语料结下不解之缘。在西方,方言学脱胎于19世纪的历史比较语言学,最初兴趣主要是研究运用直接法所获取的有关单音不同分布的事实来绘制方言地图。 方言研究者手持笔记本,后来是手提录音机,记下或录下他所遇到的一切方言材料。此种取样法至今仍为某些业余研究者所用,它对于研究方言词汇的分布有一定价值。 (Francis,1983:49-50)在我国,运用语料的方法远至周秦。据应劭∀风俗通义序# 周、秦常以岁八月遣轩之使,求异代方言 。我国汉语方言学第一部著作∀方言#就是这种方法的产物。据载,扬雄非常喜爱方言,他利用考廉(略等于后代的举人)和士兵们集中在首都的方便,普遍地进行走访,不断积累材料,坚持编纂整理,经过27年的艰苦努力,终成∀轩使者绝代语释别国方言#。

3.2新的语料库语言学

1959年,R.Quirk着手建立 英语用法 语库(Survey of English Usage)。该项目旨在收集大量的风格题材各异的语料作为对英国英语口语和书面语进行系统描写的基础。几乎与此同时,以N.Francis和H.Kucera为首的一批语言学家和计算机专家汇集在美国的布朗大学合力攻关,并于1961年建成了当今最早的机读语料库∃布朗语库(Brown Corpus)。这两个库可以说是现代语料库语言学的开端。

3.3语料库语言学与乔姆斯基转换生成语法

50年代中前期,在实证主义和行为主义思潮的影响下,语言研究总体上是经验主义占主导,这种氛围无疑促进了对语料的重视,使其成为当时的热点之一。特别在美国,以Z.Harris等人为代表的后布龙菲尔德结构主义语言学家视语料为语言学的唯一研究对象。在他们看来,直觉证据是第二位的,是靠不住的,应该放弃。但是这种状况随着乔姆斯基1957年∀句法理论#及其以后的一系列论著的发表被根本转变。笛卡尔主义的理性主义占据主导地位,经验主义几乎无立足之地,被视为经验主义产物的语料研究自然被完全否定。乔姆斯基及其转换生成语法学派否定早期语料研究主要有两点:

(1)语料研究的方向有误。乔姆斯基认为,语言研究的主要目标是建立一种能反映说话人心理现实的语言认知模式,简言之,语言能力模式。因为只有语言能力才能对说话人的语言知识作出解释和描述,而语言运用只是语言能力的外在证据,它往往会因超语言因素的影响而发生变化,因此,它不能确切地反映语言能力。语料从本质上只是外在化的话语的汇集,基于语料的研究所建立的经验模式充其量只能对语言能力作出部分解释,因而语料不是语言学家从事语言研究的得力工具。

(2)语料的不充分性,乔姆斯基在∀句法理论#一书中首次发现英语短语结构规则具有递归性。这种递归性表明,自然语言的句子是无限的,而作为语料基本单位的句子的无限性决定了语料是难以穷尽的,换言之,语料永远是不完整的,不充分的。

转换生成语法学派的上述批评从根本上改变了50年代结构主义语言学的研究方向。在此后的近20年里,整个语言学界几乎唯直觉是从,唯思辨独尊,语料研究方法几乎名誉扫地。但是语料研究并未完全终止。除了R.Quirk和N.Francis等语言学家凭其非凡的学术勇气,顶着无形的压力,继续其研究项目并不断取得进展之外,另有十多项小的研究也在展开,特别是1975年,以J.Svartvik为首的一批语言学家汇集于瑞典的隆德大学,开始对R.Quirk语料的口语部分作韵律标注,并最终实现了机读,建成了伦敦∃隆德语料库(London-Lund Corpus)。对此,G.Leech (1991:9)认为 作为英语口语研究的语料源,它至今仍无与伦比。 上述项目的持续进行为80年代语料库语言学的复兴奠定了基础。

4.0语料库语言学的复兴