语料库语言学视野下搭配的定义与分类
- 格式:doc
- 大小:37.50 KB
- 文档页数:7
语料库在词汇搭配研究中的应用语料库(Corpus)在语言学研究中的应用越来越受到重视。
语料库是指一种特定语言的大量文本数据,可以是书籍、文章、对话录音等任何文字形式。
语料库在词汇搭配研究中的应用非常广泛,因为它们提供了丰富的实际语言数据,可以帮助研究人员更深入地了解特定单词与其他单词之间的关系。
首先,语料库可以帮助研究人员识别和区分不同的词汇搭配。
词汇搭配是指两个或更多单词在语言中经常一起出现,形成了一种固定的组合。
(例如,“make a decision”和“take a shower”等)。
研究人员可以使用语料库来查找常见的词汇搭配,并分析它们在不同语境中的使用方式。
通过这种分析,研究人员可以确定不同的搭配方式对于不同的情境可能会有不同的意义。
其次,语料库可以帮助研究人员了解单词的词性和语义。
在语言中,一个词的意义通常是由它周围的单词和句子组成的背景所决定的。
使用语料库可以使研究人员快速准确地找到一个单词在语境中的使用方式,从而帮助他们确定它的词性和语义。
例如,当我们在研究“run”的含义时,我们可以使用语料库来查找出现“run”的句子,并据此了解其词性和含义。
最后,语料库可以帮助研究人员进行跨语言比较。
由于不同语言的语法和词汇使用方式有所不同,语言翻译的准确性是一个非常关键的问题。
通过对多个语言的语料库进行比较,研究人员可以发现这些语言之间的相似之处和不同之处,并进一步了解不同语言中词汇搭配之间的联系。
总之,语料库在词汇搭配研究中的应用非常广泛,可以帮助研究人员深入了解语言的使用方式和语义,还可以促进不同语言之间的比较和研究。
然而,需要指出的是,语料库也有其局限性,例如语料库中的数据可能不够丰富,可能存在一定的偏差和误差。
因此,在使用语料库进行研究时,研究人员需要进行多维度的数据分析,并且需要充分考虑语料库中的数据质量和准确性。
语料库的分类\创建和检索简述随着计算机技术的发展,语料库开创了新的研究方向,引起了越来越多的注意。
本文将简单介绍语料库的概念、分类、创建和检索及其在应用中的优越性和局限性,使相关爱好者初步了解语料库这一新的范畴。
标签:语料库;平行语料库;类比语料库;创建;检索1.引言自20世纪中期, 美国布朗大学创建了世界上第一个语料库,即标准美国英语布朗语料库,开创了语料库研究的先河,到20世纪80年代,这一星星之火开始渐渐有燎原之势,上海交通大学杨惠中教授便在这一崭新的浪潮之下,于80年代中期率先建成中国第一个真正意义上的语料库,即上海交大英语科技语料库、接着像中国学习者英语语料库、大学英语学习者口语英语语料库、北外的汉英汉日平行语料库等陆续建成,并且还吸引了一些教授、博士生、硕士生的目光,开始把研究方向转向语料库研究,为中国语料库研究的发展注入了新的力量,同时也推动了基于语料库的语言学研究和翻译研究的发展.2.语料库的定义及分类语料库是以计算机储存大量的真实语料,对语料做各种带有研究目的的加工标注,利用研制的检索工具对标注语料进行快捷的搜寻和分类,以发现并分析以往因条件限制而未能注意的语言现象(王克非,2004)。
研究的性质和需要决定着语料库的性质,根据语料库中收集语料的种类多少可以分为,单语语料库、双语语料库和多语语料库(王克非,2004)。
单语语料库指只收集一种语言的语料库,早期开发的语料库大多都是单语的,如布朗语料库。
双语语料库指收集两种语言文本的语料库。
多语语料库指收集两种以上语言文本的语料库。
而双语和多语语料库又可以分为平行语料库、类比语料库和翻译语料库三类。
平行语料库又可称为对应语料库,是由原文和它对应的译文文本构成的,可以有词语、句子和段落三种级别的对应关系;类比语料库是由同一语言不同变体的文本或不同语言的文本构成;翻译语料库是由具有翻译关系的不同语言的文本构成,它和平行语料库的区别在于,它仅仅只是篇章上的对应关系,不一定有其它级别的对应关系如词语、句子和段落等。
浅谈语料库分类及用途一、语料库的定义在语言学中,语料库是指大量文本的集合。
在语料库语言学中,他们是主要用来进行统计分析与假设检定,在某一领域中,测试语言规律的出现或有效性。
语料库可以是某一单独语种的文本(单语语料库),又或者是多种语言中的文本数据。
二、语料库的分类1.多语种语料库多语种语料(Multilingual corpora)经常经过格式特殊处理进行比对研究,也被称作平行语料库。
它是由大量的平行文本(parallel text)组成。
平行文本通常是几种语言放在一起,有原文有译文,对齐放置。
较为著名的平行文本有洛布古典丛书和克莱梵语丛书。
平行文本不仅仅是两种语言的平行,有时会有多种语言集合。
如圣经研究中,关于圣经的译文可以有多种版本。
较为著名的便是俄利根的《圣经六国译文合璧》,其中为旧约提供了六个版本。
在多語种语料库中,一定要注意多语种语义的平行对齐,这是保障语言学研究的前提条件。
一般情况下,双语平行语料库中,主要有两种类型,翻译语料库(translation corpus)和对比语料库(comparable corpus)。
在翻译语料库中,一种语言的文本会是另外语种语言文本的翻译。
在翻译过程中,翻译人员可以对句子进行拆分、合并、删除、插入或重新排列。
翻译语料库现如今广泛运用于机器翻译中,机器翻译实际属于计算机语言学中的一类,其方法是通过某种程序将一种语言翻译成另外一种语言。
借助语料库,便可以提供大量准确而地道的目标语言文本,从而使计算机可以生成更加复杂的自动翻译,处理更复杂的语言翻译。
在对比语料库中,文本都是同种类型,覆盖同种内容,但是他们并不是互相翻译的关系。
为开发平行语料库,有些文本需以一个短语或句子组成的语块进行匹配。
其中,经常会运用由两种语言语料库组成的平行语块对双语的机器翻译进行训练。
为使语料库能够对语言学研究更能有用,他们通常会运用到注释程序,比如,对演讲的部分内容进行注释或是词性标注。
搭配问题知识点总结一、搭配的定义和分类1、搭配的定义搭配是指词语之间在特定语言环境下能够结合在一起使用的规律,使语言表达更加准确、自然。
搭配是语言的一个基本特征,是语言表达的基本单位。
2、搭配的分类从语言角度看,搭配可以按照词语之间的关系和作用分为词汇搭配和语法搭配。
词汇搭配:指的是词语之间在意义上相互配合的关系,是词语之间在特定语境中的固定搭配。
如动词和名词的搭配、形容词和名词的搭配等。
语法搭配:指的是词语在句子中的搭配关系,包括词语之间的逻辑关系、句法关系以及语法规律。
如动词和宾语的搭配、形容词和副词的搭配等。
二、搭配问题的影响1、影响语言表达的准确性搭配不当会导致语言表达的不准确,使语言表达失去明确的或原有的意义。
2、影响语言表达的自然性搭配不当会导致语言表达的不自然,使语言表达失去流畅和自然。
3、影响语言交流的效果搭配不当会导致语言交流的效果减弱,使沟通双方无法准确理解对方的意图,造成误解和冲突。
三、搭配问题的分析1、搭配问题的原因搭配问题主要是因为不同词语之间有着不同的语义特征和语法特征,需要根据实际情况进行搭配。
而搭配的正确与否往往受到语言习得程度和语言应用环境的影响。
2、搭配问题的解决解决搭配问题需要多方面的努力。
首先,要提高语言习得能力,积极学习正确的搭配用法。
其次,要注重语言实践,通过大量的语言输出和输入,逐渐提高自己的搭配能力。
最后,要深入了解语言的语义和语法规律,从根本上掌握搭配问题的解决方法。
四、搭配问题的举例分析1、动词和名词的搭配问题在英语中,动词和名词的搭配问题是非常常见的。
比如,"make a decision"是固定的搭配,表示"做出决定",而"do a decision"就是不正确的搭配。
2、形容词和名词的搭配问题在汉语中,形容词和名词的搭配问题也是比较突出的。
比如,"美好的未来"是固定的搭配,表示"good future",而"好的未来"就是不正确的搭配。
第三章语料库证据支持的词语搭配研究引言词语搭配(collocation)无疑是语料库语言学研究活动中最为活跃的研究领域,处于它的中心地位。
这种局面主要由两方面的原因使然。
实践上讲,在语料库问世之前,人们不可能有效地获得大量的真实语言数据(authentic language data)对语言进行研究,而只好使用相当多的直觉数据(intuitive data)对语言进行描述。
这种描述主要集中在抽象的句法结构和语义框架方面。
基于现代计算机技术的语料库使得成百上千万词的连续文本可被有效地储存和检索,过去可望而不可及的词语行为(lexicalbehaviour)研究变得既可能又便捷。
所以,词语行为—主要是词语搭配的研究便成了极富活力的研究领域。
从理论上讲,一系列重要的语言学观点无疑对词语搭配研究起了关键的指异和推动作用。
这些观点主要包括下列内容:第一,语言交际主要是词语驱动的(lexis-driven )。
语言体系中的词语具有其意义潜势(meaning-potential)。
人们的交际活动,主要是选择合适的词语,包括词语的适当语法形式,来实现意义的一个过程。
从这个意义上说,传统语言学理论所建立的“句法第一,词语从属”的理论框架是靠不住的。
这些语言学家试图使人们相信,句法是一套关于语言使用的普遍性的或整体的结构规则,词语仅仅是用以填充这个结构的材料。
语料库语言学的研究表明,情况绝非如此。
第二,语言学研究应以词语研究为出发点。
词语和语法的关系在语言使用中是一种共选关系(co-selection)。
一定的词语和意义总是以一定的语法形式表现出来;一定的语法结构也总要以最经常和最典型的词语来实现。
从某种意义上说,每个词都有其典型的语法结构,词的每个义项也有其一定的语法形式。
在语言交际中,一旦词语被选定,相应的语法形式也就随之选定。
也就是说,词语和语法是密不可分的。
二者在语言使用中处于一个连续体,而词语搭配研究将词语和语法密切结合起来,正好研究这个连续体。
2018年41期总第429期基础教育研究ENGLISH ON CAMPUS浅谈语料库在高中英语词汇搭配教学中的应用文/邓桂花新课改对于教师既是机遇也是挑战,教师在教学中要及时学习应用新时代的产物,改进我们的教学方法,满足新课改的教学需求。
语料库是大数据时代的产物。
在高中英语教学中,应用语料库进行教学可以提高学习者的语言意识和学习能力。
应用语料库进行教学就是在课堂上使用电脑生成的共现行,帮助学生发现语言模式的规律,并基于共现行设计相应的活动和练习。
本文主要对语料库在高中英语词汇搭配教学中的应用进行分析,希望可以对丰富高中英语词汇搭配教学有帮助。
一、词汇搭配学习的重要性词汇是语言的三大要素之一,是语言系统赖以存在的支柱。
在英语学习中,词汇学习贯穿于英语学习的全过程,是英语学习的中心任务。
词汇学习很重要,词汇搭配的学习更重要,因为词汇搭配的学习是词汇学习的基础。
掌握词汇搭配可使学生语言学习事半功倍并能有效扩大学生的词汇量。
反之,缺少词汇搭配知识的学生会犯更多的错误,因为他们会用更长的表达来代替简单的词汇搭配。
二、当前词汇搭配学习存在的问题值得注意的是,虽然词汇搭配在英语学习中很重要,受到很多语言学家的关注,但是现实情况却不尽如意。
桂诗春和杨惠中证实搭配失误在中国英语学习者会犯的主要错误中排名第六。
当前学生词汇搭配学习的现状主要存在以下五个问题:第一,学生学习英语时会受到母语负迁移的影响;第二,学生学习中没有真实的语境。
如部分教师让学生直接背诵词组,这种搭配教学方式脱离语境,学生难以记忆、应用搭配。
第三,学生没有很高的搭配意识,不会主动去注意搭配和运用搭配,没有有效的搭配学习方法。
第四,学生对英语词汇学习兴趣不高。
第五,在日常词汇学习中,大多数学生用时不多,没有养成良好的词汇学习习惯和掌握有效的词汇记忆方法。
大部分学生认为搭配和词汇运用是学习的难点,对词汇的掌握停留在语音,字面意义和拼写等表层层次。
三、应用语料库进行词汇搭配教学1.语料库的定义。
语料库的定义及类别1.语料库的定义语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言文本或话语片段而建成的具有一定容量的大型电子文库(杨惠中2002:33)。
在语料库基础上,以语言学、文学、文化和翻译理论为指导,运用概率和统计的方法,对翻译本质、翻译过程和翻译现象等进行系统分析,成为语料库翻译学的经典研究范式。
1993年,Mona Baker教授最早将语料库应用于翻译研究,其经典文章《语料库语言学与翻译研究:启示与应用》(Corpus linguistics and translation studies:Implications and applications)成为语料库翻译学的奠基之作。
2.语料库的类别一般而言,运用于翻译研究领域的语料库主要有单语语料库、双语平行语料库、类比语料库、翻译语料库、口译语料库和多模态语料库等六种类别,以下进行简要介绍:单语语料库单语语料库可分通用语料库和专门语料库,通用语料库是指收录不同主题或文本类型的目的语原创文本的语料库;专门语料库是指收录某一特定主题或文本类型的目的语原创文本的语料库。
单语语料库可以提供关于具体词汇或短语结构在目的语或目的语特定语境中的使用情况(胡开宝2011:163)。
双语平行语料库双语平行语料库是指收录某一A语言源语文本及其对应的B语言目的语文本的语料库,两种语言文本之间存在不同层次的平行对应关系。
按照语料平行对应的方向,双语平行语料库分为单向平行和双向平行。
单向平行语料库是指所收录语料均为一种语言的源语文本及其译成另一种语言的目的语文本。
双向平行语料库所收录的语料由A语言文本及其B语言译本,以及B语言及其A语言译本组成(胡开宝2011:34)。
类比语料库类比语料库是指由某一语言的原创文本和翻译文本组成的语料库,其中翻译文本译自不同语言。
原创文本和翻译文本在语料库大小、领域、语言变体和时间上应该具有相似性,但不具有翻译关系。
矿产资源开发利用方案编写内容要求及审查大纲
矿产资源开发利用方案编写内容要求及《矿产资源开发利用方案》审查大纲一、概述
㈠矿区位置、隶属关系和企业性质。
如为改扩建矿山, 应说明矿山现状、
特点及存在的主要问题。
㈡编制依据
(1简述项目前期工作进展情况及与有关方面对项目的意向性协议情况。
(2 列出开发利用方案编制所依据的主要基础性资料的名称。
如经储量管理部门认定的矿区地质勘探报告、选矿试验报告、加工利用试验报告、工程地质初评资料、矿区水文资料和供水资料等。
对改、扩建矿山应有生产实际资料, 如矿山总平面现状图、矿床开拓系统图、采场现状图和主要采选设备清单等。
二、矿产品需求现状和预测
㈠该矿产在国内需求情况和市场供应情况
1、矿产品现状及加工利用趋向。
2、国内近、远期的需求量及主要销向预测。
㈡产品价格分析
1、国内矿产品价格现状。
2、矿产品价格稳定性及变化趋势。
三、矿产资源概况
㈠矿区总体概况
1、矿区总体规划情况。
2、矿区矿产资源概况。
3、该设计与矿区总体开发的关系。
㈡该设计项目的资源概况
1、矿床地质及构造特征。
2、矿床开采技术条件及水文地质条件。