当前位置:文档之家› 3 基于语料库的泡沫隐喻研究

3 基于语料库的泡沫隐喻研究

3 基于语料库的泡沫隐喻研究
3 基于语料库的泡沫隐喻研究

收稿日期:2013-07-01;本刊修订:2013-12-28

基金项目:国家社会科学基金项目(11BYY055);教育部人文社会科学重点研究基地重大项目(12JJD740010);广东省哲学社会科学规划项目(GD12XWW04);广东外语外贸大学教学研究重点项目(GWJYZD11003)

作者信息:胡春雨(1974-),男,河南西平人,副教授,博士,研究方向为语料库语言学,E?mail:ecolinguistic@gmail com三

基于语料库的泡沫隐喻研究

胡春雨

(广东外语外贸大学国际商务英语学院,广东广州510420)

摘一要:本文通过检索BUBBLE在5个语料库中的使用情况,调查经济类泡沫隐喻在经

济话语和大众话语中的历时变化及其背后的机制三研究表明,尽管经济类泡沫隐喻在长达一百多年的时光里较为罕见,近年来却成为经济话语和大众话语的常用隐喻模式三BUBBLE在不同时间段搭配词的变化,展示了过去几十年来经济泡沫演化的轨迹三导致泡沫隐喻使用增加的原因可能有三:1)当今社会金融经济的迅猛发展以及投机的盛行;2)经济学家开始正视经济泡沫并加强了这方面的研究;3)词语使用的频数效应三

关键词:泡沫隐喻;话语;语料库;经济学;频数效应

中图分类号:H315一一文献标识码:A一一文章编号:1002?722X(2014)01?0018?013

0.引言

泡沫 是我们耳熟能详的一种物理现象:色彩斑驳二轻盈飘荡,一旦触及,即刻破灭三泡沫的这些特征,很容易被用来比喻人事的空虚或幻想三通过检索COHA(TheCorpusofHistoricalAmericanEnglish)中的BUBBLE(bubble/bubbles),我们发现,该词

常用来形容头衔二荣誉二名声等:(1)Myfaithabjured!Apostate!Renegade!Forwhat?Tomarryavillain,foratitle.Emptybubble!Forthat,wasHeavendefied.(COHA_1815FIC)

(2)Andforwhat,itmaybeasked,isallthisinhumansacrificemade?Probablytogaintheemptybubblecalledhonor,astandardofrightandwrongwithoutformordimensions.(CO?HA_1815FIC)(3)Andshehadtobefamous:Areputationbubblesurroundedher,acohortoffriends

andgroupiestokeepextrasaway.(COHA_2009FIC)此外,BUBBLE也被用在经济活动中喻指表面繁荣兴旺而实际上虚浮不实的成分:(4)Theremustbeacertainnucleusofsoapforabubble,butitoften...happensinWall?streetthatthelargestandmostiridescentbubbles,whenpunctured,collapseutterlywithout四18四一一一一解放军外国语学院学报JournalofPLAUniversityofForeignLanguages第37卷一第1期2014年1月

leavingthesmallesttraceofanythingsaid.(COHA_1884NEWS)上述两类隐喻尽管内涵不同,但其隐喻机制却很相似:声名荣誉头衔,犹如泡沫,无论外表多么光鲜,终竟破灭;同样,发生在华尔街的资产泡沫,无论看起来多么绚丽诱人,爆破后也是灰飞烟灭三第一类泡沫隐喻更多属于文学或小说的研究范畴,不是本文的研究对象三本研究重在探讨泡沫隐喻在经济话语中的历时变化及其背后的原因三1.经济隐喻研究述评Lakoff&Johnson(1980)提出了概念隐喻理论(ConceptualMetaphorTheory),其基本假设是:人们赖以思维和行动的一般概念体系本质上是隐喻性的;人们往往参照熟知的二有形的二具体的概念来认识二思考二经历或对待无形的二难以定义的概念,形成一个不同概念之间相互关联的认知方式,基于此,隐喻又成为一个系统的整体,即体现为以概念隐喻为特征的隐喻体系三Lakoff&Johnson运用源域(sourcedomain)与目标域(targetdomain)之间的映射(mapping)以及意象图式(imageschema)来解释隐喻现象,就是将源域的图式结构映射到目标域上,通过源域的结构来建构和理解目标域三这种映射不是随意产生的,而是根植于人们的身体经验,基于跨域的认知相关,通过一种概念诠释另一概念的认知过程三

受Lakoff&Johnson的影响,一些经济学家开始从隐喻的角度重新审视经济学的概念二模型及理论模式三Henderson(1982)探讨了隐喻在经济学中的作用方式,认为隐喻在经济学和很多其他学科中都十分常见,并进而概括了隐喻在经济语篇中的特征:润色或阐释语篇;是所有语言的核心组织方式;对经济学问题的探索有所帮助;是拓宽经济学领域的根本思维方式三

芝加哥学派经济学家McCloskey受Henderson的启迪,对隐喻在经济学理论建构中的作用做了更为深刻的阐述三通过分析多个流派在其经典著作中的隐喻使用模式,她发现,隐喻在经济学中几乎是无所不在的:经济学中的数学理性思维和模型建构都是隐喻的,甚至图表上的直线二曲线和点以及表格都是用隐喻表示经济和经济学变量的三(Mc?Closkey1985,1990,1995)McCloskey的观点引发了更多经济学家对隐喻研究的兴趣三Klameretal.(1988)认为,经济学离不开隐喻和叙事,它兼具数学和文学两种属性三Mirowski(1994)则提出,隐喻既是探索未知的重要手段,也能为已知提供新解,因而对整个经济学结构和内容的影响十分巨大三

近年来,语言学家(尤其是从事ESP研究的学者)也对经济隐喻产生了很大的兴趣三按其研究内容不同,可分为3类三第一类调查单一语言中的经济隐喻模式,以发现经济语篇中的概念隐喻及其语言表达为主要研究任务三(如Boers2000;Charteris?Black2000;White2003)第二类分析不同语言对同一财经事件的报道,以发现跨语言二跨文化中的隐喻使用异同三(如Charteris?Black&Ennis2001;Charteris?Black&Musolff2003;Chung2008;Fukuda

2009;Semino2002)第三类调查经济隐喻在不同时期的历时变化三(如陈敏2010)经济学家和语言学家的经济隐喻研究存在较大不同三经济学家采用的是自上而下的方法,关注的是隐喻与经济学的理论建构(Henderson1994,2000)三语言学家多采用语料库方法,感兴趣的是隐喻所在的话语和交际环境,以量化研究见长三Alejo(2010)认四91四一第1期胡春雨一基于语料库的泡沫隐喻研究

四02四解放军外国语学院学报2014年一为,这两种研究分开来看,都不算完整,需相互补充三

本文旨在通过语料库检索,调查BUBBLE使用频率及搭配词的变化,并以此为依托探讨经济泡沫的本质二产生的原因以及泡沫隐喻对经济理论建构的启迪三因而,本研究在一定程度上可视作上述两类研究的综合三

2.研究设计

2 1研究问题

隐喻属于思维的范畴,是人类将某一领域的经验用来说明或理解另一类领域经验的一种认知活动三要研究概念隐喻,必须依托语言三在本文中,我们选择BUBBLE作为研究泡沫隐喻的出发点,具体探讨以下4个研究问题:

1)BUBBLE在经济学语料库和通用语料库中的使用频率有何差异?

2)BUBBLE在不同语料库中的搭配词有何不同?呈现出什么样的变化特征?3)经济泡沫的本质及产生的原因是什么?

4)如何理解泡沫隐喻在经济语篇中使用频率的变化?

围绕问题1二2所开展的研究属于定量研究,完全依赖语料库方法三对问题3的回答,固然离不开对搭配词所在索引行的定性分析,但更需借助于经济学的相关理论框架三问题4以上述研究为基础,从更宏大的层面分析泡沫隐喻使用频率的变迁三

2 2语料库的选用

本研究共选用DCE二WebCorp二COHA二COCA二TMC5个语料库三DCE(DiachronicCorpusofEconomics)是笔者为了研究西方经济思想史的变迁而建的语料库三该库收集的经济学经典著作包括AnInquiryintotheNatureandCauseofWealthofNations(AdamSmith,1776)二EssayonPopulation(ThomasMalthus,1798)二TreatiseonPoliticalEcono?my(J Say,1806)二OnPrinciplesofPoliticalEconomyandTaxation(DavidRicardo,1817)二PrinciplesofPoliticalEconomics(JohnMill,1848)二PrinciplesofEconomics(AlfredMarshall,1890)二TheGeneralTheoryofEmployment(JohnM Keynes,1936)二BusinessCycles(JosephSchumpeter,1939)三

DCE虽已初具规模,但仍处于建设中,目前尚未收录近几十年的经济学名著三为了调查当代经济学家对BUBBLE的使用情况,我们使用WebCorp检索BUBBLE在英国著名周刊TheEconomist(‘经济学人“)网站中的使用情况三

然而,WebCorp每次检索的网页不超过64个,很难精确统计出BUBBLE的使用频率和搭配词三为了弥补这一不足,我们决定另行采用COHA二COCA(CorpusofContem?poraryAmericanEnglish)二TMC(TimeMagazineCorpus)这3个大型语料库(参照Davies2010,2012)三COHA的库容为4亿词,收录从1810到2009年的美国英语样本,所收语料不仅做到各个时代(每十年)之间的平衡,同时还做到口语二小说二杂志二报纸和学术五大语类之间的平衡三COCA是最大的美国英语动态语料库,目前有4 5亿词汇库容,所收集的是最近20多年来(1990 2012年)美国英语的语料,均衡分布于口语二小说二杂志二报纸和学术五大语类三TMC的库容为1亿词,收录从1923到2006年间发表在美国最为主流的杂志Time上的文章,话题涉及经济二金融二政治二艺术等三

2 3研究步骤

根据研究问题,本研究按以下步骤实施:1)在不同的语料库中检索BUBBLE,调查它在经济学语料库和通用语料库中的历时变化三2)寻找BUBBLE在不同语料库中的搭配词三使用COHA二COCA二TMC时,网络程序会自动计算在跨距4?4内搭配词和BUBBLE共现的频率二在整个语料库中的频率二共现频率二在整个语料库中的百分比以及MI(MutualInformation)值三但WebCorp所依赖的程序在计算搭配词时,主要是根据在跨距4?4内搭配词和BUBBLE共现的频数,没有计算MI值三3)结合索引行以及索引行所在的拓展文本,开展定性研究三下面的截图来自CO?HA,展示的是BUBBLE的一个搭配词tech在2000 2009年十年间与BUBBLE共现的语境以及所在文本的信息,包括时间二语体类型(MAG代表magazine,FIC代表fiction)以及次语体的名称(如Forbes二Time等)三

图1.COHA截图

一一3.研究结果3 1BUBBLE使用频率的变化

来自DCE的研究表明,BUBBLE除了在Keynes(1936)中出现2次,Schumpeter(1939)中出现3次外,在其他经典名著中都没有出现三

使用WebCorp检索TheEconomist网站的64个网页得到了792个索引行三可见,泡

沫隐喻成了部分经济学人热衷探讨的话题三图2给出了BUBBLE在COHA中的频率变化,下页图3比较BUBBLE在小说部分(COHA_FIC)的频率和它在COHA中总频率的百分比(图下方的数字1 20分别代表

1810 2000二十个时间段):图2.BUBBLE在COHA中的频率变化

一一下页图3显示,BUBBLE在COHA小说部分的频率远远高于它在其他语体中的频率,其最低百分比是1850s的46 97%,最高的是1900s的82 36%三

12四一第1期胡春雨一基于语料库的泡沫隐喻研究

一一图3.BUBBLE在COHA小说部分的频数和总频数百分比的变化

一一在COCA中,最高的为1990 1994年间的33 86%,最低的为2010 2012年间的

21 67%,BUBBLE在COCA小说中的频率呈现明显下降趋势,在COCA_MAG中的频率则呈现上升趋势,如下图所示三

图4.BUBBLE在COCA_FIC和COCA_MAG中的频数和总频数百分比的变化一一进一步的研究表明,BUBBLE在小说中主要有以下两种用法:非隐喻用法,如例(5);文学类隐喻用法,如例(6)以及前文提到的例(1) (3)三

(5)Hehadahabitofchewingbubblegumevenwhenheplayed,andhismouthwasgo?ingthen.(COHA_1993FIC)

(6)Ibear,Itrust,thenameofmanhoodandhopetobearitstillandtotheend.Itisavanity,Iknow,tolovethebubblereputation,butleavemewhatlittleworthIhave.(COHA_

1950FIC)上述两种用法虽然也出现在杂志中,但通过观察BUBBLE在杂志中的索引行,发现里面有更多的用法属于我们所探讨的经济类隐喻三例如:

(7)TheactivityofEnglandinthedayofthe SouthSeabubble ,ofFranceinthatofthe Mississippischeme ,andoftheUnitedStatesduringthelastexpansionwereunparal?leled.(COHA_1844MAG)图5.BUBBLE在TMC

中的频率变化

四22四解放军外国语学院学报2014年一

一一图5给出了BUBBLE在Time杂志中的频率变化三其中,最为显著的变化是2000s这个时间段,BUBBLE的使用频率突然飙升,远超其他时期三3 2BUBBLE的搭配词特征为了搞清上述变化的原因,我们对比了TMC_2000s和TMC_1990s中BUBBLE的搭配词(跨距为4?4,MI>3),发现在TMC_2000s出现了很多在TMC_1990s中未曾出现的搭配词,按频数高低分别为tech二dotcom二housing二stocks二estate二1990s二market三还有一些搭配词,尽管TMC_1990s中也出现,但其频数却很低三比如,internet在TMC_2000s中和BUBBLE共现14次,在TMC_1990s中仅共现2次;stock二IT在TMC_2000s中和BUBBLE分别共现3次和11次,在TMC_1990s中分别共现1次和4次三类似的发现在COCA中得到更为充分的验证:

表1.BUBBLE在COCA5个时间段中的前30个搭配词(MI>3)排名1990 1994

1995 19992000 20042005 20092010 20121gumairburstbursthousing2airgumairhousingburst3burstburstgumairair4bathbathbathbubblereal5gassoapinternetbathbath6bubblesurfacewrapgumgum7soapeconomysurfacesoapestate8surfaceblowingeconomywrapsoap9tinybubblemarketblowingbubble10plastictinyburstingburstingwrap11blowingplasticsoapbubblesasset12hotblowchampagnetinyblowing13bubblesblewstockestatesurface14risingglasstechdot?comgas15glassmixturedot?comtechmarket16spaceJapantinymarketedges17blewgasbubblesstocktech18burstingappearbubblesurfaceform19speculativeheatglass2000blow20createbubblesteabathsmixture21streamwrapblowingpopdot?com22removerisingpopplasticbursting23piecebeginsremoveinternettiny24dubblebathsgasgascredit25chewingremoveplasticpoppedpopped26wrapspeculativeblowedgesmortgage27blowroserisingbeginsstock28wallsfloatedrisecreditcaused29filledfoamfillspeculativecreating30mouthburstspopping1990sappear一一在1990 1994年和1995 1999年期间,BUBBLE的搭配词和经济相关的极少,仅四32四一第1期胡春雨一基于语料库的泡沫隐喻研究

四42四解放军外国语学院学报2014年一限于speculative和economy,但在2000 2004年,增加了internet二market二stock二tech二dot?com等,这些词的出现是因为美国的互联网泡沫(又被称为高科技泡沫或dot?com

泡沫)在2000年开始破灭三2005 2009年和2010 2012年阶段最显眼的搭配词是hous?ing以及和它相关的realestate二property二credit二mortgage等三这一特征在表2中就更加明显:

表2.BUBBLE在TheEconomist中的前30个搭配词

排名词L4L3L2L1R1R2R3R4总计

1housing50257032271

2burst00301384735

3education73212052132

4new25116003027

5tech22018002024

6prices4420038223

7markets2640037022

8asset01015031121

9bursting7322401019

10pop0132252015

11financial00110021115

12see1242112215

13property1005053115

14economy2213401114

15credit20010000113

16price3311102213

17next1108002012

18biggest1028000011

19house0100090111

20another0226001011

21history0110153011

22Asset?price00011000011

23market0116000311

24classic2104003010

25inflating2002411010

26com0002400410

27just0200043110

28really1520110010

29forming100043019

30stock114300009

一一如何寻找BUBBLE搭配词的关联性,并将它们整合为一个有机的整体呢?首先,我们发现一部分搭配词是用来描述泡沫特性的动词,如burst二pop二blow二deflate二in?flate二prick二form二collapse等三一些名词性搭配词是用来限定BUBBLE的,很多已经成了固定搭配,如bubblegum二bubblewrap二bubblebath等三另外一些名词性搭配词则明显属于bubble的隐喻性表达,如dotcom(dot?com)二internet二stock二housing二asset二tech二real?estate等三形容词搭配词也多用来修饰BUBBLE的属性,如new二biggest二

classic二financial等三从语料中,可以清晰地看到,20世纪90年代最大的股市泡沫是互联网泡沫(又被称为high?tech或dot?com泡沫),因此internet二stock二tech二dot?com等都成了BUBBLE的搭配词三(8)Theburstingofthedotcombubblein2000sawthesharesofawiderangeoftechnolo?gycompaniesplunge,Icarus?like,toearth.Nowthereistalkofanewtechbubbleinflating.(TheEconomist2011/06/14)自2000年股票市场泡沫破灭后,世界经济需要一个新的增长点,房地产市场应运

而生,成了推动全球经济发展的引擎,但同时也成了替代股市泡沫的一个新兴泡沫三(9)Inmanycountriesthestockmarketbubblehasbeenreplacedbyaproperty?pricebub?ble.(TheEconomist2003/05/29)和房地产相关的是 房价泡沫 (housingpricebubble二housingbubble)三由于价格是在市场中形成的,所以房价泡沫还可以采用下面的表达式三

(10)Somesaidthehousingmarketisabubblethat sboundtobreak(Time2005/04/04)BUBBLE在COCA不同时间段搭配词的变化,不但展示了过去20多年来世界经济发展及经济泡沫演化的轨迹,也为剖析泡沫的本质做了铺垫三3 3泡沫的本质及其形成机制BUBBLE的经济类搭配词让我们意识到,所谓的经济泡沫实际上就是资产价格泡

沫三通过搭配词的拓展语境,我们对泡沫的本质有了更清晰的理解三(11)Abubbleisaperiodofwidespread,overwhelmingbeliefthataninvestmentwillcon?tinuetosoarhigher,nomatterhowhighpriceshavealreadymoved.(COCA_2012_News)(12)Golddoesexhibitanotherbubble?likefeature,however theincreasingparticipa?tionofthepublic.(TheEconomist2011/04/28)不难看出,经济泡沫具有以下特征:1)资产价格高估(overvalued);2)人们坚信或盲信价格会进一步上升;3)不断增加的大众参与三那么,价格高估的依据是什么呢?以下观点都指向资产的内在价值或基本面三

(13)Bubblesformwhenthepriceofanyassetgetsoutoflinewithitsunderlyingvalue.

(TheEconomist2003/05/29)(14)Atechbubbleistherapidinflationinthevaluationofpublicandprivatetechnologycompaniesthatexceedstheirfundamentalvaluebyalargemargin.(TheEconomist2011/06/14)资产价格超出其内在价值的繁荣可以称为泡沫,反之则不为泡沫三然而,由于资产的内在价值难以精确评估,人们对于某一资产价格或经济现象是否为泡沫,往往存在不同的判断三比如,20世纪90年代由于新技术和企业重组而促使生产力的提高和利润的增长,并导致股价飙升,‘经济学人“认为这种经济存在泡沫,而相信新技术威力的乐观派们却很不以为然三(15)BydescribingAmerica seconomyasabubbleinearly1998,TheEconomistmadefewfriendsforitselfinthatcountry.Optimistsclaimthatthesurgeinsharepricesreflectsthe四52四一第1期胡春雨一基于语料库的泡沫隐喻研究

四62四解放军外国语学院学报2014年一 newera ofrapidgrowthinproductivityandprofits,broughtaboutbynewtechnologyandcorporaterestructuring.This,theyargue,justifiesthehighsharepricesrecentlyseen.(TheE?

conomist1999/09/23)

既然经济泡沫的本质是一种价格现象,那么要理解泡沫的形成机制,就必须先理解价格的形成机制三作为经济学的核心理论,价格理论流派众多,其中,马歇尔的均衡价格理论已经成为当前主流的价格决定理论,也为众多经济学教科书所采用(参见Mankiw2009)三按照这种理论,价格取决于供给和需求,当供给不变,需求增加,价格将会上涨;当需求不变,供给增加,价格将会下降三

以房价为例三房价既取决于房屋的供应量,也取决于购房的需求三对房子的需求可分为居住性需求和投资性需求三大城市土地供应有限,但因为有更好的就业机会及其他优势,导致每年新增人口较多,从而使房子的需求大于供给,造成房价上涨且涨幅高于中小城市的局面三TheEconomist的一篇文章谈到,英国很多地区的房价都在下降,扣除通胀因素,房价甚至回到了2003年时的水平,但伦敦的房价却是另外一番光景三(16)InLondon,bycontrast,pricesarerocketing.Usingaffordabilitymetrics,theyap?peartobedefyinggravity.Butcomparingpricestoaverageincomesislessrelevanttherebe?causelargeswathesofcentralLondonareownedbyforeigners.(TheEconomist2013/06/22)(17)Butanotherphenomenonisatworktoo:homeshavebecomesafe?havenassets.Lon?donpropertyisabitlikegoldorfrancsinaSwissbank.Cashfloodsinwhentherestoftheworldlooksrisky....Londonpriceswere225%ofthenationalaveragein2005.Todaytheyare625%oftheaverage.(TheEconomist2013/06/22)

伦敦的房价之所以能逆市上涨,不仅仅因为很多外国人加入了购房队伍从而提高了居住性需求,也因为人们认为伦敦的房产具有像黄金一样的抗风险价值三当缺乏其他投资渠道时,房市往往成为人们投资的对象三

(18) BUYINGpropertyisbyfarthesafestinvestmentyoucanmake.Housepriceswillneverfalllikeshareprices. Thisistheadviceofferedbycountlessestateagentsaroundtheglobe.Intheabsenceofattractiveinvestmentopportunitieselsewhere,homebuyershavenee?dedlittleencouragement:fromLondontoMadridandfromWashingtontoSydney,risinghousepriceshavebeenthehottopicofconversationatdinnerparties.(TheEconomist2003/05/29)在多数情况下,房产的投资性需求来自大众对通胀的恐惧三宏观经济学有一个公式:RealInterestRate=NominalInterestRate?InflationRate三(Mankiw2009:541)如果名义利率小于通胀率,则真实利率为负,也就意味着储蓄存款在受侵蚀三因此,当货币发行泛滥或利率较低时,出于保值(或增值)的需要,很多家庭都会倾向于贷款投资而不是储蓄三

(19)Theglobalboominhousepriceshasbeendrivenbytwocommonfactors:historicallylowinterestrateshaveencouragedhomebuyerstoborrowmoremoney;andhouseholdshavelostfaithinequitiesafterstockmarketsplunged,makingpropertylookattractive.(TheEconomist2005/06/16)

房价上涨而产生的财富效应,会吸引更多人参与房产的投资或投机三当房价被推高到远远超出人们的支付能力而大多数人依然相信房价会继续上涨时,泡沫就形成了三人们之所以会盲信 房价永远上涨 这样的神话,一种可能性是因为来自媒体话语的鼓吹,另一种可能性则是因为资产的内在价值难以确定,投资者在买卖某一资产时往往只是参照周围人的行动,产生所谓的羊群效应(herdeffect)三

那么,泡沫在什么情况下破灭呢?前面的分析表明,导致房价泡沫的原因尽管多种多样,但概而言之,无非都是资金的流入三如果我们把房价比作船,资金比作水,则水去船跌三资金流出的原因也多种多样,其中较为重要的一个诱因是利率的变化三总的来说,当央行开始提升利率时,泡沫就会朝着相反的方向发展三(20)Thatiswhysomeexpertsbelieveaninterestratespikecouldbethepinthatpopsthehousingbubble.Inthebest?casescenario(onealreadyunderwaysincetheFederalReservebe?ganraisinginterestratesinJune),asteadybutmodestriseinmortgageratesbeginstocoolde?mandasbuyersfindtheycan taffordtopaytopdollar.(COHA_2004MAG)4.讨论以上,我们结合语料库数据和价格理论,剖析了泡沫的形成机制三但仍有一个问题悬而未决:既然 南海泡沫 事件在当代经济学的开山之作AnInquiryintotheNatureandCausesoftheWealthofNations(Smith,1776)问世半个世纪前已经出现,那么,为什么在长达100多年的时间里,BUBBLE都很少出现在经济学名著中呢?又是什么原因导致BUBBLE在当今的经济语篇中广为使用呢?

首先,我们认为,出现这种变化的原因和当代经济特征有很大关系三自布雷顿森体系于1973年崩溃后,美元的发行就不再和黄金挂钩,美国乃至全球出现了货币滥发现象,使泡沫成为当代经济的一个重要现象三(21)EMERGINGmarkets,technologystocks,American(andIrish)housesandthemortgage?linkeddebtthatwasassociatedwiththem:thehistoryofthepast30yearshasbeenmarkedbyaseriesofasset?pricebubbles,oftenfuelledbycheapmoney.Investorshaveputtheircashtoworkinsearchofthenext surething .(TheEconomist2013/03/09)

生活在这个时代的经济学家自然需要描述和探讨这种现象,从而使BUBBLE的使

用频率远高于以往三其次,经济泡沫的无所不在,也让一些经济学家重新审视已有经济理论三经典经济学家过分相信市场这只 看不见的手 的调节作用,认为需求和供给最终会在价格机制下趋于均衡,因此拒绝泡沫隐喻三然而,由于投资者既是市场的观察者,又是市场的参与者,他们在认识世界的同时还希望按照自己的意图改变世界,从而使得所要认识的客观世界模糊不清(Soros1997)三投资者不但对市场的理解不完备,而且在操作中由于贪婪与恐惧而产生种种不理性行为,让价格远远脱离资产基本面,产生泡沫三经济周期性的 繁荣 衰退 其实就是泡沫的形成二发展和破灭的过程三(Soros2008)

最后,泡沫隐喻使用频率的增加也和 频数效应 (frequencyeffects)有一定关系三频数效应是语法化研究中的一个概念,也被一些学者借用来解释语言习得三(Ellis2002)

72四一第1期胡春雨一基于语料库的泡沫隐喻研究

四82四解放军外国语学院学报2014年一从我们对泡沫隐喻的历时研究看,似乎它的使用也颇受频数效应制约三对COHA的调

查表明,在长达一百多年的时间内,人们实际上很少使用泡沫来描述经济三从COCA的

搭配词看,即便在20世纪90年代,经济类的泡沫隐喻也相当有限三也许对比Soros的

成名作TheAlchemyofFinance(1987/1994)和他的另外一本书TheNewParadigmforFi?nancialMarkets(2008)中BUBBLE出现的频数,我们可以获得更好的旁证三在Soros(1987)中BUBBLE仅出现7次,其中5次出现在speculativebubble这样的用法中;而在Soros(2008)中,BUBBLE出现了104次,其搭配词也无比丰富三

频数效应让泡沫隐喻思维变得越来越固化(entrenched),并延伸到了其他行业三(22)Somecommentatorsarepredictingthatbusinesseducationwillbethenextbubbletogopop.Asthenumberofbusiness?schoolstudentsrises,theyargue,andtheavailabilityofjobsdiminishes,wewillseeaglutofMBAshittingthejobmarket.(TheEconomist2011/04/13)(23)Ithinktheword bubble hasbecomeeveryone sfavoritewordthesedays.Housingmarketswasabubblebecausepeopleinvestedinmorethantheycouldafford.Itwasgreedthatdroveit.Education,peopleinvestsothattheyhaveacomfortablefuture.Notgreed.(TheEcono?mist2011/04/21)

显然,例(23)的作者反对滥用 泡沫 这一隐喻三在他看来,房地产市场存在

泡沫,是因为投资者为贪婪驱使,投资超过他们的支付能力;而人们投资教育的目的是

为了有一个舒适的未来,这种投资不是贪婪驱动的,不应被看作泡沫三

5.结语

本文通过调查语料库中BUBBLE的使用情况,发现尽管该词很少出现在古典经济

学名著中,但在当代经济话语中却有很高的使用频率三BUBBLE在COCA不同时间段搭

配词的变化,则让我们看到了过去20多年来经济泡沫演化的轨迹三泡沫就其本质而言,

是指资产价格脱离实际价值,并因不断增加的大众参与而被进一步推高的经济现象三就

房市而言,投资性需求是产生泡沫的直接原因三大众投资性需求的增加,固然离不开货

币滥发二通胀居高不下这一主因,媒体的渲染二人性的贪婪和恐惧是推高房价泡沫的重

要因素三

自概念隐喻理论诞生后的三十多年里,人们越来越深切地意识到隐喻在人类认知和

社会活动中不可低估的作用三在某种程度上,隐喻决定了人们的思维方式和看待这个世

界的方式(Clancy1999)三泡沫隐喻固然有助于人们理解和预测某一经济现象,但也存在

让人们误判经济形势从而错误投资的可能三我们知道,泡沫靠空气来支撑其光鲜的外

表,其特征是很容易在较短的时间内破灭三但所谓的 经济泡沫 不一定具备物理泡

沫的这些特征三比如,早在多年前,很多经济学家就预言中国房地产泡沫要崩盘,但房

价仍在一片唱衰声中涨涨不休三这一现象说明,隐喻表达的 相似性 与 真实性

不能等同,单纯把房地产看作泡沫而不具体问题具体分析的隐喻性思维,可能会让购房

者做出错误的判断三

本文尝试把隐喻的经济学研究和语言学研究相结合,这在国内同类研究中当属首

创三这样的研究,能较好地做到定量与定性的结合,有助于问题的深入探讨三此类研究

也符合语料库语言学走出去战略①,即不再把目光局限于语言学或应用语言学自身的问题上,而是和社会科学的其他领域相互交融,从而更好地理解人类知识的建构三

本研究也存在一定的局限性三我们在识别BUBBLE的隐喻用法时,并没有采用常见的依据索引行或其拓展语境逐个判别的方法,而是依据BUBBLE的搭配词进行判别三这种方法虽然高效,但也会存在少统计个别隐喻式的现象三克服这种局限性的方法是,进一步完善DCE建设,把调查语料限制在一个可人工识别经济隐喻式的范围三注释:① 语料库语言学走出去战略 这一提法为笔者所倡,其灵感来自英国兰卡斯特大学启动的350万英镑的大型项目CorpusApproachestoSocialScience三笔者2012年曾就这一项目的主要内容和RichardXiao及PaulRayson做过交流,在此表示感谢三参考文献:[1]陈敏.经济话语中的隐喻与意识形态[M].成都:四川大学出版社,2010.

[2]Alejo,R.Wheredoesthemoneygo?Ananalysisofthecontainermetaphorineconomics:Themarketandtheeconomy[J].JournalofPragmatics,2010,42(4):1137-1150.[3]Boers,F.Enhancingmetaphoricalawarenessinspecializedreading[J].EnglishforSpecificPurposes,2000,19(2):137-147.[4]Charteris?Black,J.MetaphorandvocabularyteachinginESPeconomics[J].EnglishforSpecificPurpo?ses,2000,19(2):149-165.[5]Charteris?Black,J.&A.Musolff. Batteredhero or innocentvictim ?Acomparativestudyofmeta?

phorsforeurotradinginBritishandGermanfinancialreporting[J].EnglishforSpecificPurposes,2003,22(2):153-176.[6]Charteris?Black,J.&T.Ennis.AcomparativestudyofmetaphorinSpanishandEnglishfinancialreport?ing[J].EnglishforSpecificPurposes,2001,20(3):249-266.

[7]Chung,S.Cross?linguisticcomparisonsoftheMARKETmetaphors[J].CorpusLinguisticsandLinguisticTheory,2008,4(2):141-175.[8]Clancy,J.TheInvisiblePower:TheLanguageofBusiness[M].Lanham:LexingtonBooks,1999.[9]Davies,M.TheCorpusofContemporaryAmericanEnglishasthefirstreliablemonitorcorpusofEnglish[J].LiteraryandLinguisticComputing,2010,25(4):447-465.

[10]Davies,M.Expandinghorizonsinhistoricallinguisticswiththe400millionwordCorpusofHistoricalA?mericanEnglish[J].Corpora,2012,7(2):121-157.[11]Ellis,N.Frequencyeffectsinlanguageprocessing:Areviewwithimplicationsfortheoriesofimplicitandexplicitlanguageacquisition[J].StudiesinSecondLanguageAcquisition,2002,24(2):143-188.

[12]Fukuda,K.AcomparativestudyofmetaphorsrepresentingtheUSandJapaneseeconomies[J].JournalofPragmatics,2009,41(9):1693-1702.[13]Henderson,W.Metaphorineconomics[J].Economics,1982,18(4):147-153.

[14]Henderson,W.Metaphorandeconomics[C]//R E Backhouse.NewDirectionsinEconomicsMethod?ology.London:Routledge,1994:343-367.[15]Henderson,W.Metaphor,economicsandESP:Somecomments[J].EnglishforSpecificPurposes,四92四一第1期胡春雨一基于语料库的泡沫隐喻研究

四03四解放军外国语学院学报2014年一2000,19(2):167-173.

[16]Klamer,J.,D McCloskey&R Solow.TheConsequencesofEconomicRhetoric[M].NewYork:Cam?bridgeUniversityPress,1988.

[17]Lakoff,G.&M Johnson.MetaphorsWeLiveby[M].Chicago:TheUniversityofChicagoPress,1980.[18]Mankiw,G.PrinciplesofEconomics(4thEd.)[M].北京:清华大学出版社,2009.

[19]McCloskey,D N.TheRhetoricofEconomics[M].Madison,WI:TheUniversityofWisconsinPress,1985.

[20]McCloskey,D N.IfYou reSoSmart:TheNarrativeofEconomicExpertise[M].Chicago:TheUniver?sityofChicagoPress,1990.

[21]McCloskey,D N.Metaphorseconomistsliveby[J].SocialResearch,1995,62(2):215-227.[22]Mirowski,P.NaturalImagesinEconomicalThoughts[M].Cambridge:CambridgeUniversityPress,1994.

[23]Semino,E.Asturdybabyoraderailingtrain?MetaphoricalrepresentationsoftheeuroinBritishandI?taliannewspapers[J].Text,2002,22(1):107-139.

[24]Soros,G.TheAlchemyofFinance(2ndEd.)[M].NewYork:JohnWiley&Sons,1997.

[25]Soros,G.TheNewParadigmforFinancialMarkets[M].NewYork:PublicAffairs,2008.[26]White,W.Metaphorandeconomics:Thecaseofgrowth[J].EnglishforSpecificPurposes,2003,22(2):131-151.

(责任编辑一张立飞)(上接第17页)

一一tragedyinahealthinsurancecustomerservice[C]//A deFina,etal.DiscourseandIdentity.Cam?bridge:CambridgeUniversityPress,2006:188-212.

[6]deFina,A.,etal.DiscourseandIdentity[C].Cambridge:CambridgeUniversityPress,2006.[7]Firth,J.Modesofmeaning[C]//J Firth.PapersinLinguistics:1934 1951.London:OxfordUniver?sityPress,1951/1957:190-215.

[8]Giddens,A.ModernityandSelf?identity[M].Cambridge:PolityPress,1991.

[9]Greenbaum,S.ComparingEnglishWorldwide:TheInternationalCorpusofEnglish[C].Oxford:OxfordUniversityPress,1996.

[10]Kilgarriff,A.,etal.TheSketchEngine[C]//ProceedingsofEuralex.Lorient,France,July,2004:105-116.

[11]Pearce,M.InvestigatingthecollocationalbehaviourofMANandWOMANintheBNCusingSketchEn?gine[J].Corpora,2008,3(1):1-29.

[12]Sinclair,J.Thesearchforunitsofmeaning[C]//J.Sinclair.TrusttheText.London:Routledge,1996/2004:24-48.

[13]Tognini?Bonelli,E.CorpusLinguisticsatWork[M].Amsterdam:JohnBenjamins,2001.

[14]Xiao,R.MultidimensionalanalysisandthestudyofworldEnglishes[J].WorldEnglishes,2009,28(4):421-450.

(责任编辑一张立飞)

语料库研究的优势及问题的理论解析

语料库语言学的理论解析 摘要:本文试图剖析有关语料库语言学的几个理论问题,以期揭示语料库语言学的本质。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。 关键词:语料库语言学;基于语料库的研究方法;理论架构;语料库数据;发展前景 Abstract: This paper attempts to answer some theoretical questions of corpus-based language studies. Three theoretical considerations are addressed to capture the nature of corpus linguistics. 1) Is Corpus Linguistics an independent branch under the umbrella of linguistics? 2) What can corpus data offer to linguists? and 3) What kind of research that Corpus Linguistics should be? Answers to the three theoretical questions will conduce to a fuller understanding of the nature of corpus-based language studies and their development. Key words: Corpus linguistics; corpus-based approach; theoretical construct; corpus data; future directions 1.0 导言 目前利用语料库从事研究的学者主要有两类。一类是计算语言学家。他们主要从事自然语言处理(NLP)的研究,诸如语音合成、语音识别和机器翻译等等。他们的终极目标并非要揭示语言的本质,而是注重技术层面的研究,比方如何改进算法,如何完善词库的建设以实现技术上的突破。另一类就是语言学家,他们则希望借助这一强大的工具去揭示语言的本质这一学科目标,这正是本文所要关注的。 本文缘起于语言研究者中的一种争论,即“语料库语言学”是否配得上这个名称,它是一种新兴的理论视角还是“暴发户造谱牒”?而本文要探讨的正是有关于语料库语言学研究的理论意义。或者说,语言学家从语料库所提供的信息中到底可以获得什么?这是本文试图解决的核心问题。语料库建设、开发和利用在国内外语言学界日渐兴起,在国内也有相当数量介绍性和综述性文献涌现,为语料库语言学在我国的发展奠定了一定的理论基础。此外,一些语言学者和语言教师(包括外语教师和对外汉语教师)也设计、建立了一些自己的语料库以服务于教学科研。 然而真正对语料库的理论问题进行深入探讨的著述却为数不多。本文将试图剖析语料库语言学的几个理论问题,以期对语料库语言学的优势和不足有进一步的认识。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。 2.0 语料库语言学是不是独立的新兴学科? 2.1 语料库语言学是一种理论架构 完全赞成语料库语言学是一种理论架构的几乎没有。只是某些学者比较强调语料库语言学的理论意义。比如,Halliday(1991;1992;1993)指出,语料库语言学作为一种理论架构(theoretical construct),将语料收集和理论概括统一了起来,从而使我们对语言的理解产生一种质变。这种新的理论架构有助于考察同时作为系统和实例(instance)的语言的本质。因为在Halliday的语言学思想当中,实际话语是语言系统的实例再现(instantiation)。而语言系统,或者说是语法体系是一种统计概率上(probabilistic)的自然结果。这一思想与所谓

国内语料库翻译学20年述评_1993_2012_宋庆伟(DOC)

上海翻译Shanghai Journal of Translators2013 No. 2 国内语料库翻译学20年述评( 1993—2012) 宋庆伟匡华吴建平( 厦门大学外文学院,福建厦门 361005;济南大学外国语学院,山东济南 250022) ( 山东大学外国语学院,山东济南250061) ( 厦门大学外文学院,福建厦门361005) [摘要]本文以中国知网( CNKI) 1993-2012年外语核心期刊中关于语料库翻译学的学术论文为样本,从翻译语言特征、译者风格和应用研究等六个方面对国内近20年语料库翻译学的发展历史进行钩沉,梳理其主要研究脉络和现状,总结语料库翻译学研究的成就、问题与趋势,以期能为该领域研究提供全景式的概况。作者认为,当前研究还存在诸如研究内容与视角比较狭窄,跨学科性研究不足,定量研究层次不高和语料库( 特别是口译语料库) 建设和研究相对滞后等问 题,亟待有针对性的改进与完善。 [关键词]语料库翻译学; 翻译共性; 译者风格; 口译 [中图分类号]H059 [文献标识码] A [文章编号]1672-9358( 2013) 02-0025-06 1 引言到翻译研究当中,使语料库翻译研究迅速发展,逐步 近几年,语料库翻译学随着语料库语言学和描成为描述翻译研究中的一种新范式( Laviosa,1998: 写翻译理论的发展和融合迅速成长起来。从发展历474; 2002: 22)。基于语料库的研究为翻译学提供程来看,她还非常年轻,从1993年Mona Baker发表了新的方法和思路,现在学界形成的共识是利用语语料库翻译学的开山之作《语料库语言学与翻译研料库进行翻译研究是一种不可或缺且可靠的手段。究: 启示和应用》至2012年,刚刚走过了短短的20 从一定程度上来讲,语料库翻译学即语料库语言学年。国内语料库翻译研究几乎与国外同步,肇始于和描写性翻译研究的相加,二者的结合可以说是相1993 年,代表作为杨惠中《语料库语言学与机器翻得益彰,在当今翻译研究注重描写和实证的趋势下,译》一文。如今,国内语料库翻译研究已初具规模,语料库翻译学应运而生。语料库翻译学以翻译本体在翻译共性、译者风格和语料库建设等诸方面都取为研究对象,从大规模翻译文本或翻译语言整体入得了可喜的进步,Tymoczko( 1998: 652) 曾大胆预言手,采用语内对比与语际对比相结合的模式,对翻译基于语料库的翻译研究将是翻译研究的重中之重。现象进行描写和解释,探索翻译的本质。( 王克非、近20年,特别是近几年涌现出一大批语料库翻译学黄立波,2008: 9-14) 的专著和论文,国家社科基金和教育部人文社科基 金对该领域的研究也进行了倾斜。鉴于此,笔者认 3 数据采集 为极有必要对其发展脉络进行梳理和分析,以期为近几年,国内基于语料库的翻译研究发展迅速,今后的研究提供借鉴和参考。本文以中国知网研究的深度和广度也不断拓展,发表文章数量逐年( CNKI) 近20年来外语核心期刊中收录的有关语料增加。为了更好地说明这种趋势,笔者统计了近20 库翻译学的学术论文为基础,借以梳理其研究现状、年( 1993-2012) 中国知网收录的外语核心期刊中关分析成就和问题并展望发展趋势。于语料库翻译学的文章,该统计涉及2012-2013年 版CSSCI外语类来源期刊( 包括扩展版) 共15种,2 语料库翻译学基本原理收集有关文章共97篇,具体数据如下表所示: Mona Baker( 1993)开创性地把语料库方法应用 [基金项目]本文是上海市科委课题“英汉双语平行句对应语料库建设”( 编号: 08dz1501100) 的阶段性成果。论文在写作过程中,得到秦洪武 教授的悉心指点,谨致谢忱! [收稿日期]2013-02-20 [作者简介]宋庆伟,厦门大学博士生,济南大学外国语学院讲师,研究方向: 语料库翻译学、双语词典编纂与翻译; 匡华,山东大学外 国语学院讲师,研究方向: 语料库语言学与英语教学; 吴建平,厦门大学外文学院教授,博士生导师,研究方向: 翻译学与双语词典学。

自建小型语料库在英语教学中的运用

自建小型语料库在英语教学中的运用 引言:随着语料库语言学近年来的发展,运用电脑语料库进行教学已经成为现代外语教育的新趋势。各种大型语料库(如LOB, BROWN, ELEC)已被广泛用于课堂教学的很多方面,如语料库在语法教学中的应用(何安平,2001;关文玉,2004),语料库在英语精读课中的应用(林丽云,2004)以及语料库在词汇(莫咏仪,2004;邓飞,2004)及写作(胡玉迎,2004)等方面的应用。然而,大型语料库最初的建库目的并非直接用于课堂教学,其语料规模庞大,就语言教学的具体方面而言,难免缺乏针对性,而且,由于价格,市场等原因,个人很难购买到大型语料库及检索软件。因此,在日常教学中,个人教学语料库的建设就显得尤为重要。Ragan(2001)指出小型语料库已成为以课堂为中心的实证教学研究的有力手段。而国内目前对个人教学语料库的研究还相对贫乏,本文将初步探讨自建小型语料库在帮助学生理解课文篇章主题意义方面的作用。 1.自建小型语料库的特征 1.1 针对性强。首先,与大型语料库相比,自建小型语料库规模小,但在内容选择上却比较有针对性,建库者可以根据自己教学及学生自主学习的需要科学的选择合适的语料,从而,使语料能够充分体现学习者的需求,满足不同层次学习者的需要,如目前大多数小学都开设了英语课,但适合这些初学者的语料库却几乎没有。在这种情况下,老师便可以通过因特网搜集儿童英语的材料和儿童感兴趣的话题制成小型语料库,从而是儿童能从开始就学到地道的英语。其次,小型语料库易于突出语言的语域和语体特征,正如Beaugr (2001)所说,依据特定的语域,语篇和话题而建的小型语料库有助于学习者培养语言的体裁,语域,语篇感,深化对语言在具体环境下的涵义的理解。 1.2 实效性强。与大型语料库相比,小型语料库在内容选择上非常灵活,可以避免选择那些语法正确但已经过时的语料,使语料库能跟上语言不断发展变化的步伐,尤其是新闻,杂志等语料更是能把最前沿的语言变体及新词,新句带给学习者。另外,小型语料库标注比较灵活,能满足更多学习者的个性化需求,而且,检索方便快捷,学习者可以在自己的操作过程中去发现目标语的各种语法特征和规律,便于学习者进行自主学习。 2.自建小型语料库促进英语教学的实例 正如Guy(1997)所说,小型语料库有助于学习者通过建构陈述性和程序性知识培养语言使用能力。目前计算机的使用已经相当普遍,所以对中学生灌输有关计算机方面的知识是非常有必要的。下面我们将以the use of computer 一文为例,说明在引导学习者建构该篇课文主题意义及对已有知识进行扩展方面,自建小型语料库能起什么作用。 学习者通过日常接触,对有关计算机方面的基础知识已经有了一定的基本图式,如计算机是一种高科技产品,运用广泛,速度快,因特网,游戏等。然而,若要比较全面的建构出有关计算机的图式,则还需对已有图式进行深入和扩展,如对计算机功能,利弊,历史,前景等方面知识的掌握。为了使学习者能够最大限度熟悉该话题,建构起该话题的心理词库,流利准确的表达该话题的相关知识,我们将利用自建的语料库的词频显现和语境共现功能,为学习者提供大量真实的语料,让学习者在自己观察,分析,概括的基础上归纳出相关图式,建构起该话题的陈述性知识;并通过小组讨论,任务汇报,课堂演示等方法扩展和巩固该话题的图式,从而,实现程序性知识的建构。 2.1 建立相关微型语料库 在大学英语第二册中有一篇the use of computer的课文,主要介绍了计算机的历史及目前计算机在各个行业中的广泛运用。为了向学习者提供更多的相关语料,笔者另外从因特网上搜集了十篇难度和体裁相当的相关文章,通过对无关内容的删减,加工,标注后制成微型

语料库语言学的发展及研究现状

当代语言学(试刊)1998年第1期4-12页,北京 语料库语言学的发展及研究现状 丁信善 1.0引言 语料库语言学已经成为语言研究的主流。基于语料库的研究不再是计算机专家的独有领域,它正在对语言研究的许多领域产生愈来愈大的影响。 这是J.Thomas等人1996年为祝贺语料库语言学的主要奠基人和倡导者G.Leech六十诞辰而出的语料库语言学研究论集的开场白。近年来,对语料库语言学类似的评说频频见于导论和方法论的书及教科书中,它不仅仅是语料库语言学家们的自誉,而正在成为整个语言学界的共识。 2.0语料库语言学的定义 关于语料库语言学的定义,现引述三例: a. 根据篇章材料对语言的研究称为语料库语言学。 (K.Aijmer&B.Aitenberg,1991,p.1) b. 基于现实生活中语言运用的实例进行的语言研究称为语料库语言学。 (T.M c Enery&A. Wilson,1996,p.1) c. 以语料为语言描写的起点或以语料为验证有关语言的假说的方法称为语料库语言学。 (D. Crystal,1991,p.86) 由上述几个定义可见,语料库语言学不是研究语言自身某个方面,而是一种以语料库为基础的语言研究方法。它实际上包括两个方面:一是对自然语料进行标注,二是对已经标注的语料的研究和利用的方法。从方法论的角度,它不仅可以用于研究语言系统的各个层面,而且可以应用于语言学之外的其他领域。 3.0语料库语言学的历史发展 语料库语言学作为一种研究语言的方法,可以追溯到上个世纪,甚至更为久远。现在一般以乔姆斯基转换生成语法的兴衰时间为参照,将其发展大致分为以下几个阶段: 3.1语料库语言学的早期发展 早期的语料库语言学指的是本世纪五十年代中期以前,即乔姆斯基提出转换生成语法理论之前的所有基于语言材料的语言研究。此类研究主要集中在以下几个方面: (1)语言习得是应用语料研究方法较早且较普遍的领域。19世纪70年代在欧洲兴起了儿童语言习得研究的第一个热潮,当时的许多研究就是基于父母详细记载其子女话语发展的大量日记的。据悉,这些日记作为原始材料,不仅是当时W.Preyer和W.Stern等人的理论假说的依据,而且时至今日仍是许多学者的研究语料之一。自本世纪30年代以来,语言学家和心理语言学家提出了众多关于儿童在不同年龄段的语言发展模式。这些模式大都是建立在对儿童自然话语大量材料的研究分析上的。 (2)利用自然语料开展音系研究,在西方当首推美国早期的结构主义语言学家,如F.Boas和 E.Sapir等人。他们注重 野外工作 ,强调语料获取的自然性和语料分析的客观性。这些都为后来的语料语言学所继承和发展。 本文承蒙哥本哈根大学翻译与词典学研究中心主任C.Dollerup博士提供有关欧洲语料库网络的材料,特此致谢。

浅析语料库对于翻译研究的意义

浅析语料库对于翻译研究的意义 【摘要】基于语料库的翻译研究在当今已进入一个全新模式,多种语料库被开发应用在人工翻译和机器翻译等实践领域当中。本文对语料库的概念以及某些种类语料库在翻译活动中具体实用情况做出分析,揭示语料库对于翻译研究的意义。 【关键词】语料库;翻译;双语语料库;平行/对应语料库 An Analysis on the Significance of Corpus to Translating Research CHEN Dan (Eastern Liaoning University,Dandong Liaoning 118000,China) 【Abstract】Translating research based on corpus has stepped into a new mode today,and many kinds of corpora are developed and applied in practical fields of manual translation and machine translation. The thesis analyzes the concept corpus and the application of some corpora in translating,which exemplify the significance of corpus to translating research. 【Key words】Corpus;Translating;bilingual corpus;Parallel corpus “语料库”的英语单词corpus来源于拉丁语,意思是body,有“全集”的含义,即“语料的集合”。有的学者认为语料库是基于形式和目的的存储于电子数据库中的文本集合,是描述自然发生语言的集合;也有人认为它是按照明确的语言学标准选择并排序的语言运用材料的汇集,旨在用作语言的样本。国内语料库学者杨惠中对语料库的定义做了较为详细的界定。他指出,“语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片段而建成的具有一定容量的大型电子文库”。 语料库所收集的语料是真实、自然的语言。不同于普通的文本数据库,它的设计和建设是以系统的理论语言学原则为依据,并且具有明确的目的性。语料库的结构严格依照既定程序设定,以一定研究目的为基础,按学科或语篇类型分类存储。语料库中的语料必须符合科学的语言研究,语料可以随机抽取或按统计学方法采集。 语料库的类型和分类标准很多。按用途分,语料库可分为通用语料库(general corpus)和专用语料库(specialized corpus);按语料选取时间,语料库可分为历时语料库(diachronic corpus)和共时语料库(synchronic corpus);按不同结构,语料库可分为平衡语料库(balanced corpus)和自然随机结构语料库(random structure corpus);按语料库的性质,语料库可分为原始语料库(raw corpus)和标注语料库(annotated corpus);按语言种类,语料库可分为单语语料库

语料库语言学与中国外语教学_桂诗春

2010年11月November 2010 第33卷第4期Vol.33No.4 现代外语(季刊) Modern Foreign Languages (Quarterly )语料库语言学与中国外语教学 桂诗春 冯志伟杨惠中何安平卫乃兴李文中梁茂成 [编者按] 为推动我国应用语言学研究的新发展,教育部人文社科重点研究基地———广东 外语外贸大学外国语言学及应用语言学研究中心于2010年9月24-25日成功举办了“首届广外应用语言学论坛”,庆贺我国著名语言学家、应用语言学学科的开拓者桂诗春教授八十华诞。期间,举行了题为“语料库语言学与外语教学”的高层论坛,就语料库语言学的现状、发展前景及语料库的建设、共享、应用等展开了互动讨论。以下是根据专家发言,整理后的主要内容。 [中图分类号]H319 [文献标识码]A [文章编号]1003-6105(2010)04-0419-08 语料库语言学的发展前景与资源共享 广东外语外贸大学 桂诗春 1.语料库语言学的发展前景 语料库语言学在外国和国内都发展很快,有的人选择了它作为发展方向,因为它的入门比较容易,上手较快;有的人把语料库语言学作为收集数据的重要手段。但是总的来说,我们的语料库研究还处在比较初级阶段,需要提高。究其原因是很多人把它看成是一种工具或手段,可以运用现有的一些现成的程序和公开的语料库,如Brown ,LOB ,Frown. Flob , BNC ,CLEC ,只要选题得当,就能获得很多量化的数据,从而写出洋洋洒洒的文章来。在计算机和扫描仪的支持下,自行收集一些语言素材,建立一个特定的语料库,也不是什么难事。 我觉得,语料库语言学既是一种工具,但更是一门学科;它是对语言行为进行概率性归纳和概括的一门学科,它本身是跨学科性的,要做语料库语言学研究必须许多方面要有比较雄厚的基础。首先是数学和统计学。Herdan (1960)的一本早期著作,叫做《词次/词型数学》(Type /token Mathematics ),其副标题就是《数理语言学教科书》(A Textbook of Mathematical Linguistics ),当时还是前计算机 时代,但Herdan 觉得有两件语言事实值得我们注意:一是大量语言资料(language in mass ),二是语言排列(language in line ),它们是任何语言运作都不能离开的两个方面。某些语言学研究分支如果考虑到这两个方面,将会从中获益。当时还没有真正的机读语料库, Brown 的语料库在1967年才面世,美国心理 学家John Carroll 根据该语料库以及他后来参与制作500万词的AHI 语料库,所提出的词汇频数对数正态模型(lognormal model )均源于Herdan 所奠定的基础。一直到最近美国Barber 利用计算机对英语语体的各种研究,更是利用了因子分析的统计方法。其次是计算机科学。语料库的发展离不开现代科学技术,其主要表现是个人电脑、扫描仪和大容量硬盘的普及,当初Brown 语料库要动用到大型电脑,而到如今,只需一万元左右就能在家里拥有这些设备,制作出甚至比Brown 还要大的语料库。但是我们往往只注意到硬件部分,而不认识到软件的建设。从事语料库语言学研究的人而不掌握一到两种编成语言,也不可能拓展他们的研究领域,因为他不能根据个人的研究需

语料库整理要求及方法

一、需整理的多是ppt语料,也有些word文档的语料(见Boston Consulting-需做库-12.10文件夹)。整理要求如下: 1、利用Align Assist工具将ppt中原文译文提取出来,并根据中英文内容一句句对齐。如图: 2、利用Align Assist工具对ppt中的内容进行提取时,软件会遗漏部分内容。因此需要在对齐之后将软件自动提取后遗漏的句对逐句复制补充进去。 3、对齐完成后,将对齐结果分别保存为tmx格式及aares格式,tmx为最终需要的语料格式,但无法修改且预览不便。aares为临时语料文件,可修改,可即时预览。因此,请大家对齐时两种格式都保存下来。保存方法见第二部分。 二、整理方法: 1、安装Align Assist语料对齐工具(安装程序见AlignAssist_Setup_1.5.1文件夹)。双击AlignAssist_Setup_1.5.1.exe的程序进行安装。语言选择为english。

2、双击运行。将要对齐的原文文件和译文文件分别添加进去。

注意原文和译文语言方向。根据文件夹要求确定英文、中文何为原文,何为译文。 例:project1-中到英,则中文文件为source file,英文文件为target file。 源文本和译文本添加完成后,点击Align。进入如下界面。 3、注意split、merge、delete、swap的用法。 (1)split:将一句话断开为两句

随意举例:将第六句原文“当前全球经济正经历深度调整,各国需联手培育新的经济增长点和竞争优势。”断为:“当前全球经济正经历深度调整,”及“各国需联手培育新的经济增长点和竞争优势。”选中第六句原文,边框变黑。 单击上方菜单split。 进入下图界面。将第二小句内容剪切粘贴到cell 2部分,然后单击ok。 即分句完成。

语料库与英语教学

语料库与英语教学-英语论文 语料库与英语教学 文/续娜 【摘要】随着我国基础教育课程改革的实行,大学英语教师的教学观念也受到了一定程度的影响。然而,由于大学教育课程改革还处于改革的初级阶段,很多方面还不是很成熟,所以,在大学英语教育中应用语料库时就出现了很多问题。因此,研究语料库与英语教学具有非常重大的意义。本文分析了当前英语教学的现状,阐述了语料库与英语教学的关系,最后介绍了语料库语言学在英语教学中的应用。 关键词语料库;英语;教学 前言 随着我国基础教育课程改革的新形势情况下,英语教师的教学观念也受到了一定程度的影响。对于英语课堂教学而言,语料库在英语教育中的应用被越来越多的教师所接受。然而,由于基础教育课程改革还处于改革的初级阶段,因此在很多方面还不是很成熟。在大学英语教学过程中采用语料库的应用出现了很多问题,从而影响了大学英语教学的质量。因此,为了更好地提高大学英语教学的课堂效率,大学英语教学应用语料库显得很有必要。 一、当前大学英语教学的现状分析 当前,我国大学英语课堂教学中的互动只是流于形式化,大学英语教学课堂中师生之间的互动都缺少实质性的内容。但是,这种形式化的课堂师生之间的互动并到达启迪学生思维的效果,更不用说激发学生更深层次的思维活动了。在这样的大学英语教学模式下,造成很多大学生根本不了解语料库。这种课堂师生之

间的对话不仅压抑了学生的学习主动性,从而造成语料库在大学英语教学中的应用无法正常进行,因为学生才是学习的主人,只有让学生了解语料库的真实含义,才能发挥语料库在大学英语中的作用。因此,在大学英语课堂教学中,必须要突出学生的主体地位,充分发挥语料库的作用。只有这样,才能给学生充分展示才能的空间。因此,语料库的应用受到了大学英语教学教师的广泛关注,随着语料库在大学英语教学中的应用不断加深,语料库的应用也出现了一定的问题,从而影响了大学英语教学的质量。 二、语料库与英语教学的关系 从语料库在大学英语教学中的应用实践来看,表明语料库更加合适在大学英语教学中的应用。然而,在大学英语教学中,传统的以课本为主的大学英语教学方式已经无法满足大学英语教学的需要,因此,现阶段的大学英语教学中,教师应该更加全面地使用语料库。同时,将语料库应用于大学英语教学中,这样不仅可以很好地改变传统的大学英语教学模式,还能极大地提高学生学习英语的兴趣,从而充分挥发学生的积极性。当然,语料库的英语也是现代大学英语教学的改革的必然选择。并且语料库的应用,还能使学生更能掌握学习的主动权,进而为大学英语教学创造更加便捷的途径。因此,语料库能够方便的应用在大学英语教学过程中。 从语料库的理论方面来说,语料库与大学英语教学的关系包括以下几个方面,第一,现代的大学英语教学理论应该为学生为中心,因而现代的大学英语教学更加要求学生能够参加到英语教学的过程中,进而激发学生英语创新思维。由于语料库的应用还能够开发学生的注意力、记忆力和推理能力。同时,由于语料库含有大量的实例和数据,因而语料库能够更好地吸引学生的注意力,还能强化

英语语料库在英语语法教学中的应用

英语语料库在英语语法教学中的应用 张国庆 [摘要]本文主要论述语料库的发展及其对英语语法教学不可替代的作用。语料库在英语语法教学中的应用可以把枯燥的难以理解的语法现象以生动、新鲜的形式加以表现,从而改变语法教学的方法和模式。 [关键词]语料;语料库;英语语法 [中图分类号]H319.3[文献标识码]A[文章编号](2007)02-0038-06 一、引言 语料库(corpus)亦称语库或素材,是收集并科学地组织起来的一套语言材料,这种材料是某种语言中自然出现的,可以是书面的,也可以是口头的。这些未经加工的材料是语言统计的基础,是分析和研究语言规律,编纂辞书,利用计算机加工自然语言以及语言教学绝好的第一手资料。过去,语料库中的材料由人工收集和整理;今天,由于使用了计算机的先进技术,语料库建设的效率和规模都大大提高了,为语料库能够得到更广泛的应用打下了坚实的基础。 总的来说,语料库可分成两大类:普通语料库和特殊语料库。出于不同的研究和应用目的,可建立不同的语料库,如COBUILD,即柯林斯伯明翰大学国际语言资料库(Collins Birmingham University international Language Database),是一个大型的普通英语语料库,至今它的词库(The Bank of English)已收录了2000万词。而BNC(The British National Corpus)包括了9000万词的书面文本和1000万词的口语文本。目前较有名的英语词典,如LONGMAN和CHAMBERS都是根据BNC词频选择词条,选用例句。而在伯明翰的阿斯顿大学,建立了一个特殊语料库——ASTI语料库(Aston Scientific and Tech-nical English Corpus),其主要研究领域为:科技文章的话语特点、类型的定量分析、类型分布的定量分析、类型分布的比较分析,文章体裁分析和词汇研究等。它可用作Non.native speaker写作科技论文的参考、演示读者和文本之间的互相交流,也可作为ESP需要分析的组成部分。 在英语教学过程中,我们经常思考这样一些问题:学习者怎样才能学到真正的(authentic)英语?怎样了解某一词语在不同语境(context)中的含义?如何认识某一语言变体的特点?作为英语教师,怎样在计算机技术迅速发展的形势下,利用新的教学手段,改进教学内容和教学方法?英语语料库为我们解决这些问题提供了一个新途径,尤其是为英语教学提供了全新的视角。 收稿日期:2007-04-26 作者简介:张国庆(1980-),男,吉林华桥外国语学院应用英语学院,助教,长春130117

语料库在大学英语教学中的应用

语料库在大学英语教学中的应用 摘要:语料库可以应用于语言教学的很多方面,主要包括:教学大纲的设计,教学内容的确立,教学方法的采用,语料库应用于课堂教学,学习者语料库及中间语研究和语言测试。合理利用语料库对英语教学能起到巨大的推动作用。 关键词:语料库;语言教学;中间语 按照科学的方法定义,语料库就是书写文本或口语转写的集合体:语料库可以用于语言的分析和描写。语料库是“电子机读文本的有限集合,从最大限度上代表了某种语言或语言变体。” 1987年,第一本基于语料库编写的字典《柯林斯COBUILD英语词典》出版,这在语料库语言学界荡起了一股不小的涟漪,引起了众多语言教师的极大关注。同时也激起了语料库驱动的和基于语料库的语言教学研究,很多有影响的论文也相继发表。 继此,基于语料库的语言研究和语言教学研究如雨后春笋般迅速发展。对语言内在结构描述和语言运用的研究领域涌现出大量含金量高的论文著作,基于语料库的英语教学和语料库驱动的英语教学研究继而被推举到非常重要的地位。 语料库应用于语言教学主要表现在以下几个方面:母语语料库为准确地描述语言提供了可靠的依据,它基于真实的语言,对教材内容的编排和词典的编纂提供了丰富而真实的语料。学习者语料库提供了学习者习得第二语言的大量信息。研究学习者的语言特点、学习过程、编排学习者字典等工作都可以从中获益。和母语语料库相比,用于编排教材的专门语料库不但对教材编写有很大的裨益,对测试材料的选择和试题构建也有着功不可没的贡献。总之,无论是母语语料库还是学习者语料库对教学材料的选择和教学实践活动都带来了很大帮助。 一、大纲设计 语料库的广泛应用为描写准确的语言提供了依据,同时也为语言教学的大纲设计和教学内容的编写提供亍素材。 语料库对语言教学的简单而重要的作用表现在它为语言教学提供的是真实的语料、实际生活中使用的语言。另外,语料库提供的语言数据表明了语言使用状况的各种频率信息,为确立教学内容提供了可靠依据。Mindt主张教学大纲应该以经验数据为基础,而不是像传统做法那样以个人的直觉和个人经验作为教学的首选依据。Hunston也积极响应Mindt的观点,她认为“语料库会带来全新的大纲设计”。需要注意的是她这里指的“大纲”是“词汇大纲”。词汇大纲的概念最初由Sinclair和Renouf提出,并由Willis给予了大纲性的论述。词汇大纲应该注重以下几点:“(a)语言的最基本的词形;(b)词的中心用法;(c)词的最典型搭配”。从这里可以看出词汇大纲不仅仅包含词的词条,它还涉及了语言的方方面面,而

语料库研究与综述

语料库研究与应用综述 一概述 语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源。 语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。有人曾经把语料库分成四种类型:(1)异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;(2)同质的(Homogeneous):只收集同一类内容的语料;(3)系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;(4)专用的(Specialized):只收集用于某一特定用途的语料。除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。 语料库建设中涉及的主要问题包括: (1)设计和规划:主要考虑语料库的用途、类型、规模、实现手段、质量保证、可扩展性等。 (2)语料的采集:主要考虑语料获取、数据格式、字符编码、语料分类、文本描述,以及各类语料的比例以保持平衡性等。 (3)语料的加工:包括标注项目(词语单位、词性、句法、语义、语体、篇章结构等)标记集、标注规范和加工方式。 (4)语料管理系统的建设:包括数据维护(语料录入、校对、存储、修改、删除及语料描述信息项目管理)、语料自动加工(分词、标注、文本分割、合并、标记处理等)、用户功能(查询、检索、统计、打印等)。 (5)语料库的应用:针对语言学理论和应用领域中的各种问题,研究和开发处理语料的算法和软件工具。 我国语料库的建设始于80年代,当时的主要目标是汉语词汇统计研究。进入90年代以后,语料库方法在自然语言信息处理领域得到了广泛的应用,建立了各种类型的语料库,研究的内容涉及语料库建设中的各个问题。90年代末到新世纪初这几年是语料库开发和应用的进一步发展时期,除了语言信息处理和言语工程领域以外,语料库方法在语言教学、词典编纂、现代汉语和汉语史研究等方面也得到了越来越多的应用。 语料库与语言信息处理有着某种天然的联系。当人们还不了解语料库方法的时候,在自然语言理解和生成、机器翻译等研究中,分析语言的主要方法是基于规则的(Rule-based)。对于用规则无法表达或不能涵盖的语言事实,计算机就很难处理。语料库出现以后,人们利用它对大规模的自然语言进行调查和统计,建立统计语言模型,研究和应用基于统计的(Statistical-based)语言处理技术,在信息检索、文本分类、文本过滤、信息抽取等应用方向取得了进展。另一方面,语言信息处理技术的发展也为语料库的建设提供了支持。从字符

中国语料库研究的历史与现状(一)

中国语料库研究的历史与现状(一) 语言学的研究必须以语言事实作为根据,必须详尽地、大量地占有材料,才有可能在理论上得出比较可靠的结论。传统的语言材料的搜集、整理和加工完全是靠手工进行的,这是一种枯燥无味、费力费时的工作。计算机出现后,人们可以把这些工作交给计算机去作,大大地减轻了人们的劳动。后来,在这种工作中逐渐创造了一整套完整的理论和方法,形成了一门新的学科——语料库语言学(corpuslinguistics),并成为了自然语言处理的一个分支学科。 语料库语言学主要研究机器可读自然语言文本的采集、存储、检索、统计、语法标注、句法语义分析,以及具有上述功能的语料库在语言定量分析、词典编纂、作品风格分析、自然语言理解和机器翻译等领域中的应用。多年来,机器翻译和自然语言理解的研究中,分析语言的主要方法是句法语义分析。因此,在很长一段时间内,许多系统都是基于规则的,而根据当前计算机的理论和技术的水平很难把语言学的各种事实和理解语言所需的广泛的背景知识用规则的形式充分地表达出来,这样,这些基于规则的机器翻译和自然语言理解系统只能在极其受限的某些子语言(sub-language)中获得一定的成功。为了摆脱困境,自然语言处理的研究者者们开始对大规模的非受限的自然语言进行调查和统计,以便采用一种基于统计的模型来处理大量的非受限语言。不言而喻,语料库语言学将有可能在大量语言材料的基础上来检验传统的理论语言学基于手工搜集材料的方法所得出的各种结论,从

而使我们对于自然语言的各种复杂现象获得更为深刻全面的认识。 本文首先简要介绍国外语料库的发展情况,然后,比较详细地介绍中国语料库的发展情况和主要的成绩,使我们对于语料库研究得到一个鸟瞰式的认识。 一、国外语料库概况 现在,美国Brown大学建立了BROWN语料库(布朗语料库),英国Lancaster大学与挪威Oslo大学与Bergen大学联合建立了LOB语料库。欧美各国学者利用这两个语料库开展了大规模的研究,其中最引人注目的是对语料库进行语法标注的研究。他们设计了基于规则的自动标注系统TAGGIT来给布朗语料库的100万词的语料作自动标注,正确率为77%.他们还设计了CLAWS系统来给LOB语料库的100万词的语料作自动标注,根据统计信息来建立算法,自动标注正确率达96%,比基于规则的TAGGIT系统提高了将近20%.最近他们同时考察三个相邻标记的同现频率,使自动语法标注的正确率达到99.5%。这个指标已经超过了人工标注所能达到的最高正确率。 现在,国外的主要语料库还有: London-Lund口语语料库:收篇目87篇,每篇5000词,共为43.4万词,有详细的韵律标注(prosodicmarking)。 AHI语料库:美国Heritage出版社为编纂Heritage词典而建立,有400万词。 OTA牛津文本档案库(OxfordTextArchive):英国牛津大学计算中心建立,

语料库的分类

III.Existing corpora 20.Well-known and in luential corpora 1.Introduction 2.National corpora 3.Monitor corpora 4.Corpora of the Brown family 5.Synchronic corpora 6.Diachronic corpora 7.Spoken corpora 8.Academic and professional English corpora 9.Parsed corpora 10.Developmental and learner corpora 11.Multilingual corpora 12.Non-English monolingual corpora 13.Well-known distributors of corpus resources 14.Conclusion 15.Appendix:URLs 16.Literature 1.Introduction As corpus building is an activity that takes times and costs money,readers may wish to use ready-made corpora to carry out their work.However,as a corpus is always designed for a particular purpose,the usefulness of a ready-made corpus must be judged with regard to the purpose to which a user intends to put it.There are thousands of corpora in the world,but most of them are created for specific research projects and are not publicly available.This article introduces well-known and influential corpora,which are grouped in terms of their primary uses so that readers will find it easier to choose corpus resources suitable for their particular research questions.Note,however,that overlaps are inevitable in our classification.It is used in this article simply to give a better account of the primary uses of the relevant corpora.The higher number of English corpora covered here might reflect the fact that English was the forerunner in corpus research,though as we will see shortly,many other languages are catching https://www.doczj.com/doc/ba6431715.html,rmation on the web site addresses for the corpora discussed in this article are given in the appendix. 2.National corpora National corpora are normally general reference corpora which are supposed to repre-sent the national language of a country.They are balanced with regard to genres and domains that typically represent the language under consideration.While an ideal na-tional corpus should cover proportionally both written and spoken language,most exist-

相关主题
文本预览
相关文档 最新文档