当前位置:文档之家› 基于语料库的儿童动画片词汇研究

基于语料库的儿童动画片词汇研究

基于语料库的儿童动画片词汇研究
基于语料库的儿童动画片词汇研究

基于语料库的儿童动画片词汇研究

动画片与儿童生活联系紧密,是儿童重要的娱乐方式之一。而由

于儿童本身辨识能力弱,模仿能力强,幼龄儿童尚处于语言关键期,因

此动画片中的语言对儿童来说至关重要。本文以儿童动画片中的词汇为研究对象,采用语料库语言学研究方法,通过国产儿童动画片和国

外儿童动画片语言对比研究,分别指出了国产儿童动画片和国外儿童

动画片中语言存在的问题,并基于语言学视角提出了相关建议。全文

共分为六个章节:第一章绪论部分介绍了本研究的背景,回顾了动画

片及动画片对儿童语言影响的相关研究。同时阐明了本研究的意义,

并对本文的研究方法进行了介绍。第二章详细介绍了建立语料库的过程,首先调查了5个主流网络平台上儿童动画片的播放次数,并对动

画片播放次数进行了统计,筛选出排名靠前的国产儿童动画片和国外

儿童动画片,确立了动画片抽样对象,并对所抽样儿童动画片进行了

语料转写,分别建立了国产儿童动画片语料库(48401个字)和国外儿

童动画片(48900个字)语料库,还对语料库文本进行了加工,包括分词、词性标注和词频统计等。第三章将国产儿童动画片和国外儿童动画片中的实词进行了对比,分别考察了动画片在名词、动词、形容词、量词、副词和代词使用上的差异,列出了各词类的高频词表,同时就各词类间的使用情况作了相应讨论。第四章将国产儿童动画片和国外儿童动画片的虚词进行了对比分析,发现国外儿童动画片的虚词量远超出

国产儿童动画片。其次,通过对比二者在介词、连词方面的使用差异,发现二者在介词使用上较为一致,而连词差异较大。第五章基于语料

库中的数据分析,分别指出了国产儿童动画片和国外儿童动画片词汇使用中存在的问题,如用词与儿童年龄特点不符,用词存在网络与暴

力词汇,用词不符合汉语表达习惯,儿童翻译动画片中词汇使用单一。第六章从语言学视角出发,针对当前儿童动画片中存在的问题,提出

了一些词汇使用建议,如借鉴当前儿童语言学研究成果,尤其应在动

画片所使用语言中应当予以体现;实行动画片分级制度;提升动画片

译介水准和儿童翻译文学理论研究等。本文的创新之处在于抽样采集了当前流行的国产以及国外儿童动画片中的语言,通过对其转写标记,进行了定性定量的描写和分析,统计出了使用的词种,词次,词频等。基于以上数据分析,指出了当前儿童动画片词汇使用中存在的问题,

如当前动画片市场混乱,动画片适合观看年龄瞎标乱标,用词暴力等,并有针对性地提出了相关建议,尤其是第一次从语言学角度提出了《中国大陆儿童动画片分级制度(建议)》,以期规范儿童动画片市场,同时也引起动画片制作者和翻译者的重视,创制出更多更优秀的儿童动画片作品,从而更有利于儿童身心健康发展。

语料库辅助的大学英语词汇教学初探

语料库辅助的大学英语词汇教学初探 发表时间:2012-08-30T09:32:30.327Z 来源:《时代报告》2012年第6期作者:毛晓迎[导读] 因此,教师在语言教学中应该推广并充分利用网络中的可用语料库资源。 毛晓迎(武汉科技大学外国语学院,湖北武汉 430065) 中图分类号:H319.3 文献标识码:A 文章编号:1033-2738(2012)06-0063-01 摘要:分析了语料库的辅助大学英语词汇教学的的必要性和可行性,认为本族语语料库和学习者语料库相结合,可以促进学习者词汇搭配、词义以及词汇语义韵等方面的学习,满足教师课堂词汇教学的需要,提高学习者的词汇能力,提高大学英语词汇教学和学习的效率。关键词:语料库;英语词汇教学;词汇能力 一、引入 词汇是标志外语学习者语言能力的核心成分之一,语言的习得和运用离不开词汇的积累和灵活掌握。学习者只有掌握了足够的词汇量才能理解他人的话语或文章,才能通过口头或书面等方式表达自己的所思和所想。反之,则会影响正常的语言交际。由此可见,词汇教学是外语教学中的一个必不可少的重要环节,起着举足轻重的作用。 二、关于语料库 根据欧洲语料库语言学的开拓者辛克莱尔( J. Sinclair)的定义,语料库( Corpus) 是指为研究语言,用计算机处理和储存的书面和口头的语言材料(吴耀武, 2009)[2] 。语料库作为一种辅助性工具应用于语言教学中,还属一个新兴领域。随着计算机辅助语言教学( Computer AssistedLanguage Learning) 的不断发展,语料库的使用正渐渐普及,以计算机为基础的语料库的产品越来越丰富,为语言教学提供大量鲜活、客观的教学资源,尤其为词汇教学提供了直观、科学的教学依据,能够快捷、准确地提供与某一关键词有关的大量真实语料,以全新的方式促进了外语教学与研究的发展,使人们更加认识到语料库在现代外语教学中正发挥着越来越重要的作用。因此,教师在语言教学中应该推广并充分利用网络中的可用语料库资源。 三、语料库在英语词汇教学中的应用 一般来说,传统的高职英语词汇教学是泛讲,往往脱离一定的上下文语境而孤立的谈某些词汇现象,不是选择对有代表性的词汇进行详细讲解。以往对某一单词进行讲解,所涉及到的主要内容大多是词典里面对该单词解释的繁杂罗列,包括单词的发音、拼写、词性、固定搭配、例句等基本信息。毫无疑问,这些信息是学习一门语言必须要掌握的基础知识,具有重要意义。 四、BNC和CLEC辅助词汇学习的必要性和可行性 BNC中的1亿词汇基本涵盖了人物、文学、体育、科学、军事、经济、政治、艺术、航天以及其他学科领域的高频词汇。学习者可以检索并在同一个语义场丰富的语料输入中学习与目标词(target word)相关的搭配、文体和语用等知识。可以充分缓解教学内容繁多与课时不足的矛盾,提供给学生大量的语言事实并营造真实的语言环境,弥补教师凭借自己直觉经验来讲解词汇的不足,从而减少学习者的语言失误;同时更重要的是BNC中大量真实的语言有利于培养学习者的预感。 五、CLEC和BNC辅助英语词汇学习 众所周知,教师经常在课堂上能否为学生举出比较适合英语习惯的、鲜活的英语例句而发愁。另外,一个主要的问题是:仅仅用课堂上有限的例句来让学习者全面掌握词的不同词义、搭配等知识可能性不大。因此,在课堂的英语词汇教学中,教师很有必要采取“预防”措施,即从CLEC中检索出已经标注好的语料分析归纳不同水平英语学习者(如大学英语四、六级以及英语专业)经常犯的词汇拼写和搭配错误,对这些高频语言错误反复强调和训练,然后,通过检索BNC归纳要学的目标词搭配和语义韵等知识,通过大量的例子让学习者逐渐学习不同词汇的各种知识。 (一)词汇搭配的学习。 词汇搭配是大学英语学习的重点和难点之一,在这方面,CLEC和BNC语料库为我们提供了有效探索词汇教学的途径。例如,在词序方面,这样的词序往往困扰一些学生,“such+a/an+形容词+名词”与“so+形容词+a/an+名词”,运用这两种语料库我们可以轻而易举地解决这个问题,只要在BNC或CLEC的查询框中键入“such(a/an)”或so,我们可以得到大量的包含这一结构的样句。表 BNC中检索出的部分语料 (二)语义韵的学习。 语义韵(semantic prosody)是Sinclair借用Firth的“音韵”(prosody)一词而新创的一个专为语料库语言学研究使用的术语。Firth 首先使用prosody这个词来表示跨音段语音色彩。而“语义韵”则表示超越词界的联想色彩。跨越词界的联想色彩主要是指词义的感情色彩。感情意义指词语的褒贬色彩,如statesman(政治家)和politician(政客);修辞意义指的是词语的委婉、夸张、讽刺、戏谑等色彩,如die (死亡)可以说成是pass away(逝世)或go to the west(上西天)等,one's wife(妻子)可以戏谑地说是one's better half(较好的那一半);动词cause(导致,造成)搭配使用的词群,发现该词染有较强的“贬韵”,充当其宾语的往往是accident,concern,trouble,damage,death之类的词。但是好多中国英语学习者经常把cause和表示褒义的词联用,例如,cause my sensation,cause a good result 等。通过分析CLEC中的有关cause的语料就可以知道学习者对该词语义韵的掌握情况,然后教师通过检索BNC中相关的搭配,分析并且归纳常出现在cause之后的名词,让学习者知道cause后面经常接表示“后果”而非“结果”的名词。 语料库辅助的英语教学为教师课堂词汇教学提供了丰富、真实的语料,教师可以通过这些语料归纳总结,和学习者语料库中的语料进行对比,找到学习者经常出现错误的原因,进行对症的单词教学。而且语料库使用比较方便,学生在课后可以直接在线检索并接触语料库,直接接触现代真实的语言信息,学生会感到事业宽阔,有如在外语海洋里畅游。

基于COCA语料库和CCL语料库的翻译教学探索

基于COCA语料库和CCL语料库的翻译教学探索 南京大学 常熟理工学院 朱晓敏 提 要:从上世纪80年代起,作为一种研究语言现象和语言本质的新模式,语料库语言学取得了令人鼓舞的成就。语料库已经渗透到语言研究的各个领域。翻译研究领域里使用的语料库多为双语平行语料库和翻译语料库。单语语料库与翻译研究相结合,尤其是与翻译教学相结合,是一个鲜有人探索的未知领域。在课堂上使用可以免费获取的美国杨百翰大学的英语单语语料库(CO CA语料库)和北京大学汉语语言学研究中心的汉语单语语料库(CCL语料库)能改变传统翻译教学模式,为翻译教学的改革提供借鉴。 关键词:语料库,COCA,CCL,翻译教学 一、引言 作为一个新的研究领域,一种全新的探究语言现象和语言本质的方法,语料库语言学在上世纪80年代得到了蓬勃的发展。韩礼德(1993:24)曾指出: 语料库语言学将数据收集与理论论述有机地结合在一起,使我们对语言的理解发生了质的变化(转引自王克非,2004:4)。 根据收集语料的语言种类,语料库可分为单语语料库(monolingual corpus)和双语/多语语料库(bilingual/multilingual corpora)。前者仅采用一种语言的语料,通过大量收集本族语者的语言实例而建成;而后者是由两种或两种以上的语言文本构成的语料库,它可以有对应/平行的、类比的和翻译的三种形式。 单语语料库的研发历史要追溯到上世纪50年代末,由夸克等人在伦敦大学率先建立起现代意义上的语料库,即 英语用法调查(Survey of English Usage)。到目前为止,比较大型的英语单语语料库有BNC英国国家语料库,CBECobuild 英语库,Brow n布朗语料库,美国杨百翰大学M ark Davis教授主持的美国当代英语语料库(Corpus of Contemporary American English,简称COCA语料库),汉语的有北京大学汉语语言学研究中心的CCL汉语语料库等。国际上双语/多语语料库在近十几年得到了长足的发展,比较早的双语语料库有20世纪90年代早期建立的英语-挪威语双语平行语料库和英语-意大利语双语平行语料库,以及后来建立的英语和德语,英语和法语等双语语料库。国内目前规模最大的汉英双语语料库是北京外国语大学中国外语教育研究中心近年建成的达3000万字词的通用汉英语料库。国际上多语语料库有T he ECI M ultilingual Corpus多语种语料库(The ECI M ultilingual Corpus,简称IECI/M CI),近1亿字,包含了欧洲主要的语言及土耳其语、日语,俄语、汉语和马来语。而国内目前多语语料库的研究开发还是空白。 二、传统翻译教学面临的挑战与改革的出路 我国传统的翻译教学模式,即 理论讲解!举例验证!结论巩固,曾经为我国培养了一批优秀的翻译人才,他们中的很多人仍然是现在翻译行业的主力军。他们拥有扎实的中、英文功底和孜孜不倦的翻译探索精神。进入21世纪以来,信息技术迅猛发展,知识更新速度加快,传统的翻译教学难以适应新的挑战。从学生对课堂教学的反馈和专业八级考试中翻译部分的得分来看,传统翻译教学存在以下三个方面的问题:首先,翻译教学观念比较陈旧,课堂教学以教师讲述为主,学生听记为辅。学生只记得了抽象的翻译技巧,其实际的翻译能力并没有得到发展。其次,讲授的内容受教材限制,例句少且多为人造语境,学生感觉枯燥,难以提高学生的翻译能力。最后,课堂信息输入量小。 粉笔+黑板+教材+课后翻译练习的单一的教学方法导致课堂容量小,节奏缓慢。要改变以上现状,就要 实现翻译课程结构的科学化,扩大课堂教学的信息输入量,让学生在教师提 本文是南京大学2009年博士研究生科研创新基金课题 基于网络的英汉/汉英平行语料对自动获取(项目编号2010CW02)的前期研究成果。感谢匿名评审人员的宝贵意见。文责自负。

语料库辅助的词汇教学

语料库辅助的词汇教学 《普通高中英语课程标准(2003)》提倡词汇教学应为学生创设一些运用的语境,并提供语言支持,使学生在运用中加深理解,学会运用。语料库特有的语境共现界面能够批量地呈现目标词的使用语境,由此带出由目标词与周围的词共建短语词块的词汇搭配范式、语法范式、语义功能以及语用功能等,使词汇教学落实到深层知识的理解和应用。 高三学生在每次月考中反映困难最大的就是词汇问题:生词太多或者对熟悉的词的新含义不了解。针对这一现象,研究者从2012年9月高三开学起,手工加工学生正在学习的模块10的语料库,在学生学习每个单元的前后利用课文语料库使目标词汇在学生眼前多次重现,达到对词汇深层理解。具体做法如下(以模块10第一单元Reading为例): 1)要求学生上新课前预习Reading部分的生词和课文。 2)把Reading部分语料库中的所有生词用“________”代替,并打印出来,在上新课前让学生用5-8分钟练习。下面举其中的第一段为例: Teach a man to fish In 1985, there was little 1____________ in Ethiopia, which led to poor harvests and the death of many of the country’s cattle. The 2____________ of the situation shocked Bob Geldof, an Irish musician, so he organized a charity concert called Live Aid to raise money for victims of hunger in 3_____________. The concert took place on 13 July 1985 in two places---LondonandPhiladelphia---and included the biggest stars of the time. Geldof intended the concert to raise money for hunger relief and to make the public more aware of the problem. In the end, $100 million was raised, which was used to buy food and to provide help with development projects inEthiopia. The concert also made the 4____________ around the world, and 5_____________________ 6______________ and 7_____________ to do something about the problem of world hunger. 说明:如果学生在没有任何提示的情况下完成该练习有困难,可以把所有生词打乱顺序摆在练习的最上端供学生选择。 3)学习完该单元后,再针对学生在学习过程中的遇到的重点和难点词汇、短语,重新设置“________”进行练习,达到词汇在正确的使用语境中重复练习的目的。 三、结语 由于研究者经验不足和能力有限,《牛津高中英语》教材语料库的建设和应用还存在以下问题:

国内语料库翻译学20年述评_1993_2012_宋庆伟(DOC)

上海翻译Shanghai Journal of Translators2013 No. 2 国内语料库翻译学20年述评( 1993—2012) 宋庆伟匡华吴建平( 厦门大学外文学院,福建厦门 361005;济南大学外国语学院,山东济南 250022) ( 山东大学外国语学院,山东济南250061) ( 厦门大学外文学院,福建厦门361005) [摘要]本文以中国知网( CNKI) 1993-2012年外语核心期刊中关于语料库翻译学的学术论文为样本,从翻译语言特征、译者风格和应用研究等六个方面对国内近20年语料库翻译学的发展历史进行钩沉,梳理其主要研究脉络和现状,总结语料库翻译学研究的成就、问题与趋势,以期能为该领域研究提供全景式的概况。作者认为,当前研究还存在诸如研究内容与视角比较狭窄,跨学科性研究不足,定量研究层次不高和语料库( 特别是口译语料库) 建设和研究相对滞后等问 题,亟待有针对性的改进与完善。 [关键词]语料库翻译学; 翻译共性; 译者风格; 口译 [中图分类号]H059 [文献标识码] A [文章编号]1672-9358( 2013) 02-0025-06 1 引言到翻译研究当中,使语料库翻译研究迅速发展,逐步 近几年,语料库翻译学随着语料库语言学和描成为描述翻译研究中的一种新范式( Laviosa,1998: 写翻译理论的发展和融合迅速成长起来。从发展历474; 2002: 22)。基于语料库的研究为翻译学提供程来看,她还非常年轻,从1993年Mona Baker发表了新的方法和思路,现在学界形成的共识是利用语语料库翻译学的开山之作《语料库语言学与翻译研料库进行翻译研究是一种不可或缺且可靠的手段。究: 启示和应用》至2012年,刚刚走过了短短的20 从一定程度上来讲,语料库翻译学即语料库语言学年。国内语料库翻译研究几乎与国外同步,肇始于和描写性翻译研究的相加,二者的结合可以说是相1993 年,代表作为杨惠中《语料库语言学与机器翻得益彰,在当今翻译研究注重描写和实证的趋势下,译》一文。如今,国内语料库翻译研究已初具规模,语料库翻译学应运而生。语料库翻译学以翻译本体在翻译共性、译者风格和语料库建设等诸方面都取为研究对象,从大规模翻译文本或翻译语言整体入得了可喜的进步,Tymoczko( 1998: 652) 曾大胆预言手,采用语内对比与语际对比相结合的模式,对翻译基于语料库的翻译研究将是翻译研究的重中之重。现象进行描写和解释,探索翻译的本质。( 王克非、近20年,特别是近几年涌现出一大批语料库翻译学黄立波,2008: 9-14) 的专著和论文,国家社科基金和教育部人文社科基 金对该领域的研究也进行了倾斜。鉴于此,笔者认 3 数据采集 为极有必要对其发展脉络进行梳理和分析,以期为近几年,国内基于语料库的翻译研究发展迅速,今后的研究提供借鉴和参考。本文以中国知网研究的深度和广度也不断拓展,发表文章数量逐年( CNKI) 近20年来外语核心期刊中收录的有关语料增加。为了更好地说明这种趋势,笔者统计了近20 库翻译学的学术论文为基础,借以梳理其研究现状、年( 1993-2012) 中国知网收录的外语核心期刊中关分析成就和问题并展望发展趋势。于语料库翻译学的文章,该统计涉及2012-2013年 版CSSCI外语类来源期刊( 包括扩展版) 共15种,2 语料库翻译学基本原理收集有关文章共97篇,具体数据如下表所示: Mona Baker( 1993)开创性地把语料库方法应用 [基金项目]本文是上海市科委课题“英汉双语平行句对应语料库建设”( 编号: 08dz1501100) 的阶段性成果。论文在写作过程中,得到秦洪武 教授的悉心指点,谨致谢忱! [收稿日期]2013-02-20 [作者简介]宋庆伟,厦门大学博士生,济南大学外国语学院讲师,研究方向: 语料库翻译学、双语词典编纂与翻译; 匡华,山东大学外 国语学院讲师,研究方向: 语料库语言学与英语教学; 吴建平,厦门大学外文学院教授,博士生导师,研究方向: 翻译学与双语词典学。

语料库的类型

语料库的类型 [作者:李文中转贴自:Corpora and the ELT点击数:97 文章录入:neilruan ] 语料库来自拉丁词corpus,原意为“汇总”、“文集”等,复数形式为corpora或corpuses。语料库是“作品汇集,以及任何有关主题的文本总集”(OED)是“书面语或口头语材料总集,为语言学分析提供基础”(OED)。语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”(Sinclair,1986:185-203)。语料库是按照明确的设计标准,为某一具体目的而集成的大型文本库(Atkins and Clear,1992:1-16)。 Renouf认为,语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”(Renouf, 1987:1)。 Leech指出,大量收集的可机读的电子文本是概率研究方法中获得“必需的频率数据”的基础,“为获得必需的频率数据,我们必须分析足量的自然英语(或其它语言)文本,以便基于观测频率(observed frequency)进行合乎实际的预测。 因此,就需要依靠可机读的电子文本集,即可机读的语料库”(Leech, 1987:2)。综上所述,语料库具有以下基本特征: 1〕语料库的设计和建设是在系统的理论语言学原则指导下进行的,语料库的开发具有明确而具体的研究目标。如二十世纪六十年代初的BROWN语料库主要目的是对美国英语进行语法分析,而随后的LOB语料库基本按照BROWN语料库的设计原则收集了同年代的英国英语,目的是进行美国英语和英国英语的对比分析和语法分析。 2〕语料库语料的构成和取样是按照明确的语言学原则并采取随机抽样方法收集语料的,而不是简单地堆积语料。所收集的语料必须是语言运用的自然语料(naturally-occurred data)。 3)语料库作为自然语言运用的样本,就必须具有代表性(representativeness)。Chomsky曾经批评语料库不过是试图用很小的样本代表巨量的甚至无限的实际语言材料,其结果必然存在偏差,缺乏代表性,“自然语料库存在如此严重的偏差,以至于对其所进行的描述将不过是一个词表而已”(Chomsky, 1962:159)。这种批评对任何以概率统计为基础手段的研究都是有价值的(McEnery, 1996:5)。 但是,目前的计算机语料库可以通过控制抽样过程和语料比例关系来缩小偏差,增强语料的代表性。决定语料代表性的主要因素不外乎样本抽样的过程和语料量的大小。语料库抽样一般采取随机抽样方法。一种做法是在抽样前首先确定抽样的范围,如BROWN语料库和LOB语料库分别是以1961年全年的美国英语和英国英语出版物作为抽样范围i[i];再就是确定语料的分层结构,进行分层抽样,如把语料按文类(genre)和信道(channel, 如书面语和口语等)进行分层,如图2.1所示。从各种语料的抽样比例上又可分为‘均衡抽样’(balanced)和‘塔式抽样’(pyramidal)。前者对各种语料按平均比例抽取,而后者对不同的语料进行不等比例抽取。 4)语料库语料以电子文本形式储存并且是通过计算机自动处理的。巨量语料以纯文本形式存储在磁盘上,以便语料库索引软件检索和处理。也可以通过转换软件把其它格式的文件如超文本(htm 或html)格式转换为纯文本。另外,语料库具有一定的容量。语料库的大小取决于语料库的设计原则和研究需求,以及建库过程中语料资源的获取难度及其它因素。计算机语料库实际上提供了一种人机交互,这种交互方式随着语料库工具的发展而逐步加强其自动化特性。Leech认为这种人机交互有以下四种渐进的模式:(1)‘数据检索模式’。计算机以便利的形式提供数据,人进行分析。(2)‘共生模式’。计算机提供部分经过分析的数据,人不断改善其分析系统。(3)‘自我组织模式’。计算机分析数据并不断改善其分析系统,人提供分析系统参数及软件。(4)‘发现程序模式’。计算机基于数据自动划分数据范畴并进行分析,人提供软件(Leech,1991:19)。 计算机自动处理包括自动词性附码(tagging)、自动句法分析(parsing)等。其基本处理和分析过程包括以下几个步骤: 语音分析(phonetic analysis)指音段分析,主要用于语音识别和语音合成。 正字分析(orthographic analysis)指对文本中各种非文字符号、标点、大小写问题等进行处理和歧义消除。 形态分析(morphological analysis)即词性指定和附码。语料库自动附码软件通过概率统计和分析,对所给句子每一个词指定一个或多个词性码。结果显示分列显示和行显示两种。目前语料库自动词性附码准确率一般在97%以上。 句法分析(syntactic analysis)是指句子成分切分、句法关系识别、以及句法分析。语义分析(semantic analysis)和语用分析对语篇进行语义指定和意义解释。 5)基于语料库的研究以量化研究为基石,以概率统计为基本手段,以“数据驱动”为基本理念。其基本方法是通过对实际语言运用的抽样,确定其对语言整体的代表性,通过对样本特征的描述概括整体特征。在量化分析中,首先对特征进行分类,并统计各个特征的频率,通过建立复杂的统计模型对观测到的数据进行解释。分析结果可对研究对象总体进行概括。量化分析能够使我们发现在某一种语言或语言变体中哪些现象反映了语言的真实特征,那些现象仅属于偶然的个例。针对某一语言变体而言,我们还可以确切地知道某一语言现象的显著性,从而确认该现象是规范的还是异常的(McEnery,1997:3)。 6)语料库既是一种研究方法,又代表着一种新的研究思维,并以当代先进的计算机技术为技术手段。 7)语料文本是一连续的文本或话语片断(running text or continuous stretches of discourse),而不是孤立的句子和词汇。在语料库研究中,对某一搜索词的语法关系、用法、以及搭配的观察是通过分析提供的语境(context)进行的。语料库索引提供的语境可分为以下几种:(1)指定跨距,即使用者指定以搜索词为中心左右相邻的词数;(2)意元语境,即以某一意义单元结束为一微型语境,在语料库索引中意元的确定是以意义结束符号如“,;”等为标识的;(3)句子语境,即以句子终结符号如“. !”等为标识;(4)可扩展语境,即对搜索词所在语境可无限扩展。这对研究词汇的语法关系、词汇用法、词汇搭配、词丛(word cluster)、词汇在连续语篇中呈现的范型(pattern)、以及主题词汇之间的意义关系提供了可靠而方便的途径。如“necessarily”一词在《新英汉词典》中作为“necessary”词条下该词的副词形式,定义为“必定,必然”;Oxford Advanced Learner’s Dictionary of Current English把它列为一个单独的词条,给出的定义为“adv as a necessary result; inevitably”;各种英语教科书中对该词的定义和解释也大同小异。在上海交大科技英语语料库(以下简称JDEST)中搜索“necessarily”这个词,发现该词在全库中出现264次,频率最大的搭配词“not”出现在该词左边第一个位置,观察搭配频数为136。全库中出现5次以上的三词词丛有20组,同时含有“not”和“necessarily”的词丛有18组。通过索引行统计和词丛统计可以看出(见图2.4示例),“necessarily”一词最典型的用法是与“not”

基于语料库语学的英语词汇教学.doc

基于语料库语言学的英语词汇教学- 传统的语言学把词汇分成可以借助语法规则进行自由组合的单词和不能用语法规则解释的固定短语,因此传统上的词汇教学即指单词教学(蒋利,2003)。我国传统的词汇教学主要以词义驱动为主,学生往往只通过机械记忆单词或短语的形式及与其对应的中文意思来扩大词汇量(刁琳琳,2004)。教师在备课及授课过程中也很少涉及词块、搭配、语用规则和语义韵等较深层次的内容。而当把学生已机械记忆的单词放进具体语篇时,学生在理解和应用上都会出现问题。因此,在教学实践中,如果将语料库方法引入词汇教学,有助于区分词汇学习的不同层面及意义类型,并能切实改进词汇教学效果。 一、用语料库方法教授词汇的搭配、类联结与语义韵 卫乃兴(2001:100)将词汇的搭配定义为:在文本中实现一定的非成语意义并以一定的语法形式因循组合使用的一个词语序列,构成该序列的词语相互预期,以大于偶然的几率共现。词汇学习不是简单地记忆单词的读音与拼写,不了解词汇的搭配范围就很难真正习得了这些词汇,因此,词语搭配是词汇学习及研究的重点。类联结是发生于词语搭配中的语法结构和框架,因此它较之词汇搭配更抽象一些。甄凤超(2005:19-28)指出通过建立类联结,我们可以发现词汇的语法模式,并且词汇与语法密不可分。语法形式和词汇行为相关,并和意义发生联系。关于语义韵,卫乃兴(2002)指出词项的搭配行为显示一定的语义趋向即一定的词项会习惯性地吸引某一类具有相似语义特点的词项,构成搭配。由于这些具有相同语义特点的词项及其搭配在文本中高频共现,整个语境就弥漫了某种语义氛围,这种氛围被称

作语义韵。语义韵概念的引入对于区分同义词或近义词能起到很好的解释作用。由于受篇幅限制,本文主要探讨基于语料库语言学的词汇搭配教学。 二、语料库在词汇搭配教学中的应用 近年来语料库语言学发展迅速,基于语料库的搭配研究越来越被重视,逐步成为语言研究与教学的重要领域。在语言教学中引入索引工具,让学习者从大量的地道真实的语料中考察词语的搭配模式,有利于提高学习者的搭配水平、语言使用能力和自主学习能力。现以make和have为例讨论学习者通过接触真实语料,可以分析不同搭配在文体以及句法等方面存在的差异。首先使用AntConc检索工具从COCA和BNC中搜集部分与make和have搭配的常见词。如表2.1所示: 英语动词make的核心含义为制造,然而事实证明只了解单词的汉语意义显然不够,对以它们为中心词的各种搭配进行分析能促进学生更好地掌握其语义及使用差异。根据表格我们可以观察到如make后常跟change / corrections / comment / contribution / decision / effort / excuse / friend等。动词have的核心含义之一为经历,与其搭配频率较高的名词有accident / argument / break / conversation / difficulty / dream / experience / good time / problem 等。词汇教学中引入语料库方法,可以有效帮助学生掌握词汇的不同搭配更好地理解词之间的语义差异。学会并灵活使用大量的搭配词语有助于全面提高语言学习效率及应用能力。 三、结语 利用语料库工具辅助英语词汇教学具有重要意义。首先,提供给学生大量真实语料,营造真实语言环境,能够保证学生语言输入的质量;其次,用语料库检索工具使关键词在其索引行中

基于语料库的词汇自主学习

首都医科大学学报社会科学版增刊(2010年) 一、语料库的定义 语料库是按照一定的语言原则,运用随机抽样方法,收集自然出现的连续的语言,运用文本或话语片断而建成的具有一定容量的大型电子文本库。从其本质上来说,语料库是一个通过对自然语言运用的随机抽样,以一定大小的语言样本代表某一研究中所确定的语言运用总体。 经过科学选择和标注、具有适当规模的语料库能够放映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。语料库已经成为外语教学和研究良好的基础资源。 二、自主学习的内涵 自主学习(Autonomous Learning)的概念是在20世纪60年代,以建构主义理论为依据,针对如何培养终生学习能力的问题提出来的。强调的是“学”,要求学生由外部的被动接受者和知识的灌输对象转变为信息加工的主体和知识意义的主动建构者。建构主义认为,学习者要想完成对所学知识的意义建构,即达到对该知识所反映事物的性质、规律以及该事物与其它事物之间联系的深刻理解,最好的办法是让学习者到现实世界的真实环境中去感受、去体验(即通过获取直接经验来学习),而不是仅仅聆听别人(例如教师)关于这种经验的介绍和讲解。 自主学习通常包括以下主要特征:学习者应为自己的学习负责,例如决定学习目标,选择学习方法及评估进展情况。环境通常是促进学习者自主学习的重要因素之一,而网络语料库所具有的虚拟性、开放性、交互性和多元性正是为学习者自主学习提供了有利的环境。 三、基于语料库的词汇自主学习 (一)词汇学习的传统方法 传统的语言学把词汇分成两大部分,即:可以借助语法规则进行自由组合的单词和不能用语法规则解释的固定短语(例如习语),词汇教学即单词教学。传统的词汇教学以“词义驱动”(mean-ing-driven)为主,学生往往只通过机械记忆单词或固定短语的形式及中文对应意思来扩大词汇量。然而,词汇学习并不是简单的词表背诵,它还涉及到词汇意义的不同层面以及词汇的语体意识、搭配使用等产出性词汇能力的培养和形成。在教学实践过程中,教师往往只注重词汇的音、形、义,而忽略了词汇的搭配、类连接形式和词汇的语义选择取向等,也很少涉及词块、搭配、语用和语境等较深层次的内容。学生所输入的只是一些零散的词汇块,而非词块,因此,即使学生的词汇量很大,当把这些单词放进语境中时,理解和应用也经常出错。近年来,虽然教师在教学中对词汇的搭配越来越予以重视,但往往是凭借其教学经验或直觉产出,教学语料属非真实输入或是一些理想化的语料,其教学效果往往不尽如人意。 但是,语料库可以为英语学习者提供真实的语料和地道的词汇表达,有利于学生语用能力的提高。 (二)基于语料库的词汇自主学习 1.基于语料库的词汇自主学习的必要性 我国教育改革的目标是学生个性化学习方法的形成和学生自主学习能力的发展,即发现学习、探索学习、研究学习。大学英语教学要向个性化、协 基于语料库的词汇自主学习 闵楠 (首都医科大学卫生管理与教育学院,北京100069) 【摘要】当今社会信息化、网络化技术的发展为大学英语教学带来新的教学手段和方法。语料库的应用和网络自主学习都改变了传统大学英语教学模式。本文在实践的基础上,浅谈自主学习理念指导下的英语词汇学习的语料库方法。 【关键词】语料库;词汇;自主学习 【中图分类号】H03【文献标识码】J【文章编号】10-105 279

浅析语料库对于翻译研究的意义

浅析语料库对于翻译研究的意义 【摘要】基于语料库的翻译研究在当今已进入一个全新模式,多种语料库被开发应用在人工翻译和机器翻译等实践领域当中。本文对语料库的概念以及某些种类语料库在翻译活动中具体实用情况做出分析,揭示语料库对于翻译研究的意义。 【关键词】语料库;翻译;双语语料库;平行/对应语料库 An Analysis on the Significance of Corpus to Translating Research CHEN Dan (Eastern Liaoning University,Dandong Liaoning 118000,China) 【Abstract】Translating research based on corpus has stepped into a new mode today,and many kinds of corpora are developed and applied in practical fields of manual translation and machine translation. The thesis analyzes the concept corpus and the application of some corpora in translating,which exemplify the significance of corpus to translating research. 【Key words】Corpus;Translating;bilingual corpus;Parallel corpus “语料库”的英语单词corpus来源于拉丁语,意思是body,有“全集”的含义,即“语料的集合”。有的学者认为语料库是基于形式和目的的存储于电子数据库中的文本集合,是描述自然发生语言的集合;也有人认为它是按照明确的语言学标准选择并排序的语言运用材料的汇集,旨在用作语言的样本。国内语料库学者杨惠中对语料库的定义做了较为详细的界定。他指出,“语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片段而建成的具有一定容量的大型电子文库”。 语料库所收集的语料是真实、自然的语言。不同于普通的文本数据库,它的设计和建设是以系统的理论语言学原则为依据,并且具有明确的目的性。语料库的结构严格依照既定程序设定,以一定研究目的为基础,按学科或语篇类型分类存储。语料库中的语料必须符合科学的语言研究,语料可以随机抽取或按统计学方法采集。 语料库的类型和分类标准很多。按用途分,语料库可分为通用语料库(general corpus)和专用语料库(specialized corpus);按语料选取时间,语料库可分为历时语料库(diachronic corpus)和共时语料库(synchronic corpus);按不同结构,语料库可分为平衡语料库(balanced corpus)和自然随机结构语料库(random structure corpus);按语料库的性质,语料库可分为原始语料库(raw corpus)和标注语料库(annotated corpus);按语言种类,语料库可分为单语语料库

论人格词汇语料库的创建及应用

Advances in Psychology 心理学进展, 2019, 9(8), 1424-1428 Published Online August 2019 in Hans. https://www.doczj.com/doc/af10094090.html,/journal/ap https://https://www.doczj.com/doc/af10094090.html,/10.12677/ap.2019.98174 On the Construction and Application of Personality Vocabulary Corpus Ying Chang*, Chun Yong# School of Psychology, Inner Mongolia Normal University Hohhot, Hohhot Inner Mongolia Received: Jul. 24th, 2019; accepted: Aug. 8th, 2019; published: Aug. 15th, 2019 Abstract Healthy and sound personality education is an inevitable requirement to comprehensively promote psychological health education and realize students’ physical and mental development. This paper adopts document analysis, lexicology, semantics and database description to collect and encode personality words. The steps of building the corpus of personality vocabulary are as follows: corpus collection, corpus standardization, corpus labeling, updating and perfecting, and forming the corpus of personality vocabulary. Vocabulary is the basic material for the study of personality, including the language information base of personality description vocabulary, personality evaluation vocabulary, personality trait vocabulary and personality state vocabulary, which aims to promote the develop-ment of students’ positive personality and cultivate the personality characteristics needed by the development of modern society in the mental health education. Keywords Psychological Health Education, Personality Vocabulary, Corpus, Big Data, Information Processing 论人格词汇语料库的创建及应用 常颖*,永春# 内蒙古师范大学心理学院,内蒙古呼和浩特 收稿日期:2019年7月24日;录用日期:2019年8月8日;发布日期:2019年8月15日 摘要 健康健全的人格教育是全面推进心理健康教育,实现学生身心发展的必然要求。文章采用文献分析法、 *第一作者。 #通讯作者。

基于双语平行语料库的翻译教学

基于双语平行语料库的翻译教学 翻译是英语专业高年级学生一门非常重要的课程。传统的翻译教学以教师讲解为中心,以翻译教材为学习载体,学生在上完课之后很难具备一定水平的翻译能力。针对于此,我们把双语平行语料库及相应的检索功能引入到翻译教学当中,以提高翻译教学质量,提升学生的翻译能力。 标签:双语平行语料库;翻译;教学 双语平行语料库是指使用两种语言撰写相互间具有翻译关系的文本的集合平台,与普通的词典相比,这种翻译方法更加准确、便利、快捷,更新速度快,可以提供大量真实的双语对译语料以供学习者查询。 何安平指出,将语料库引入翻译教学,会改变传统的翻译教学模式,使学生可以开展各种学习活动,比如互动式学习、开放式学习和分析归类型学习,这一系列学习可以激发学生的好奇心、求知欲,帮助学生塑造的批判精神和反思精神,为培养学生的创新思维提供了条件。 本文例句所使用的双语平行语料库是指北京外国语大学通用双语平行语料库。 1.基于双语平行语料库的词汇翻译 曾有人提出,平行语料库最典型的应用范围之一是双语词汇教学。无论是英译汉还是汉译英,在很多时候英汉两种语言不存在一一对应的词汇,一词多义的现象很普遍,这就意味着这个词有多种译文;而且,在某些特定的语境中,有的词被赋予固定的意思,这又是新的译文。北京外国语大学王克非教授以汉语“克服”一词为例,在北京外国语大学通用汉语双语平行语料库中检索,发现24处“克服”一词中,有15处翻译为overcome。在学生学习完这24个例子后,他们就会明白,在以后的翻译中,不是所有的“克服”都用overcome翻译,在其他情况下使用cope with,fight down,get rid of 等会更加贴切。 学习者可以借助双语平行语料库的真实语境平台,找到单词在不同语境下的地道翻译,既丰富了词汇量,快速准确地译出对应语,同时可增强语感,提升双语翻译能力。 2.基于双语平行语料库的句式翻译 有时候,学生会感觉无论是英语还是汉语,其中一些句式很难理解,至于翻译更是无从下手。在这种情况下,双语平行语料库为学生们提供了大量的特殊句式翻译例句。我们以英文中“it is said that”为例。这是英语中常用的句式,很多学生张口就翻译为“据说”,好像也没有人怀疑过;包括我本人在接触双语平行语料库之前,见到it is said that也随口就翻译为“据说”。但是,笔者通过双语平行语

桂诗春等-2010-语料库语言学与中国外语教学

2010年11月November 2010 第33卷第4期Vol.33No.4 现代外语(季刊) Modern Foreign Languages (Quarterly )语料库语言学与中国外语教学 桂诗春 冯志伟杨惠中何安平卫乃兴李文中梁茂成 [编者按] 为推动我国应用语言学研究的新发展,教育部人文社科重点研究基地———广东 外语外贸大学外国语言学及应用语言学研究中心于2010年9月24-25日成功举办了“首届广外应用语言学论坛”,庆贺我国著名语言学家、应用语言学学科的开拓者桂诗春教授八十华诞。期间,举行了题为“语料库语言学与外语教学”的高层论坛,就语料库语言学的现状、发展前景及语料库的建设、共享、应用等展开了互动讨论。以下是根据专家发言,整理后的主要内容。 [中图分类号]H319 [文献标识码]A [文章编号]1003-6105(2010)04-0419-08 语料库语言学的发展前景与资源共享 广东外语外贸大学 桂诗春 1.语料库语言学的发展前景 语料库语言学在外国和国内都发展很快,有的人选择了它作为发展方向,因为它的入门比较容易,上手较快;有的人把语料库语言学作为收集数据的重要手段。但是总的来说,我们的语料库研究还处在比较初级阶段,需要提高。究其原因是很多人把它看成是一种工具或手段,可以运用现有的一些现成的程序和公开的语料库,如Brown ,LOB ,Frown. Flob , BNC ,CLEC ,只要选题得当,就能获得很多量化的数据,从而写出洋洋洒洒的文章来。在计算机和扫描仪的支持下,自行收集一些语言素材,建立一个特定的语料库,也不是什么难事。 我觉得,语料库语言学既是一种工具,但更是一门学科;它是对语言行为进行概率性归纳和概括的一门学科,它本身是跨学科性的,要做语料库语言学研究必须许多方面要有比较雄厚的基础。首先是数学和统计学。Herdan (1960)的一本早期著作,叫做《词次/词型数学》(Type /token Mathematics ),其副标题就是《数理语言学教科书》(A Textbook of Mathematical Linguistics ),当时还是前计算机 时代,但Herdan 觉得有两件语言事实值得我们注意:一是大量语言资料(language in mass ),二是语言排列(language in line ),它们是任何语言运作都不能离开的两个方面。某些语言学研究分支如果考虑到这两个方面,将会从中获益。当时还没有真正的机读语料库, Brown 的语料库在1967年才面世,美国心理 学家John Carroll 根据该语料库以及他后来参与制作500万词的AHI 语料库,所提出的词汇频数对数正态模型(lognormal model )均源于Herdan 所奠定的基础。一直到最近美国Barber 利用计算机对英语语体的各种研究,更是利用了因子分析的统计方法。其次是计算机科学。语料库的发展离不开现代科学技术,其主要表现是个人电脑、扫描仪和大容量硬盘的普及,当初Brown 语料库要动用到大型电脑,而到如今,只需一万元左右就能在家里拥有这些设备,制作出甚至比Brown 还要大的语料库。但是我们往往只注意到硬件部分,而不认识到软件的建设。从事语料库语言学研究的人而不掌握一到两种编成语言,也不可能拓展他们的研究领域,因为他不能根据个人的研究需

相关主题
文本预览
相关文档 最新文档