常用语料库软件的应用
- 格式:ppt
- 大小:463.00 KB
- 文档页数:25
语料库的应用(最终)语料库的应用语料库方法广泛应用于语言学理论研究、军事等领域。
当代语料库语言学(以语料库方法为取向的研究语言的分支就被称为语料库语言学)已是高歌猛进,日新月异,新的语料库更是层出不穷,经过科学选材和标注,具有适当规模的语料库能够反映和记录语言的实际使用情况,人们通过语料库观察和把握语言事实,分析和研究语言系统的规律,极大地方便了语言研究者。
军事语料库对信息化条件下的军事斗争具备潜在价值,积极开展军事语料库的研究和建设实践活动,并把研究成果转化到实战之中。
和平时期对信息化高科技武器的建设不可小视,对战场态势的综合信息捕捉、把握和利用的能力建设至关重要,但对身边已有的各类信息的综合收集和利用也同样不可忽视。
军事语料库的建设正是针对实现信息化战争中争夺与占有信息资源、获取不对称的战争中的信息掌握和信息利用的不对称优势。
【一】、语料库成为语言学理论研究的基础资源语料库是计算语言学的基础。
语料库对应的英文是corpus,复数形式为corpora。
这个词既可以指语料也可以表示语料库。
英国语言学专家戴维?克里斯特尔认为,语料库“指收集的一批语言学数据,或为书面文本或为言语录音的转写,可用作语言学描写的出发点,也可作为验证语言假说的手段。
计算机语料库是一大批机器可读文本的结集。
各种为不同目的而建立的语料库可以应用在词汇、语法、语义、语用、语体研究,社会语言学研究,口语研究,词典编纂,语言教学以及自然语言处理、人工智能、机器翻译、言语识别与合成等领域。
起初语料库主要用于语言学研究,而且建成的语料库多为通用语料库,服务的研究领域主要集中于词典编纂、词语搭配与结构、基于平行语料库的英汉互译、文学作品和作家语言风格的研究以及基于语料库的外语教学研究等。
随着研究的不断深入,各种专业领域语料库也相继建立,语料库的应用研究逐渐扩大到其他学科。
我国在语料库的应用上还处于起步阶段,在计算语言学和语言信息处理领域,语料库主要用来为统计语言模型提供语言特征信息和概率数据,在语言研究的其他领域,多使用语料的检索和频率统计结果。
语料库的应用语料库方法广泛应用于语言学理论研究、军事等领域。
当代语料库语言学(以语料库方法为取向的研究语言的分支就被称为语料库语言学)已是高歌猛进,日新月异,新的语料库更是层出不穷,经过科学选材和标注,具有适当规模的语料库能够反映和记录语言的实际使用情况,人们通过语料库观察和把握语言事实,分析和研究语言系统的规律,极大地方便了语言研究者。
军事语料库对信息化条件下的军事斗争具备潜在价值,积极开展军事语料库的研究和建设实践活动,并把研究成果转化到实战之中。
和平时期对信息化高科技武器的建设不可小视,对战场态势的综合信息捕捉、把握和利用的能力建设至关重要,但对身边已有的各类信息的综合收集和利用也同样不可忽视。
军事语料库的建设正是针对实现信息化战争中争夺与占有信息资源、获取不对称的战争中的信息掌握和信息利用的不对称优势。
【一】、语料库成为语言学理论研究的基础资源语料库是计算语言学的基础。
语料库对应的英文是corpus,复数形式为corpora。
这个词既可以指语料也可以表示语料库。
英国语言学专家戴维•克里斯特尔认为,语料库“指收集的一批语言学数据,或为书面文本或为言语录音的转写,可用作语言学描写的出发点,也可作为验证语言假说的手段。
计算机语料库是一大批机器可读文本的结集。
各种为不同目的而建立的语料库可以应用在词汇、语法、语义、语用、语体研究,社会语言学研究,口语研究,词典编纂,语言教学以及自然语言处理、人工智能、机器翻译、言语识别与合成等领域。
起初语料库主要用于语言学研究,而且建成的语料库多为通用语料库,服务的研究领域主要集中于词典编纂、词语搭配与结构、基于平行语料库的英汉互译、文学作品和作家语言风格的研究以及基于语料库的外语教学研究等。
随着研究的不断深入,各种专业领域语料库也相继建立,语料库的应用研究逐渐扩大到其他学科。
我国在语料库的应用上还处于起步阶段,在计算语言学和语言信息处理领域,语料库主要用来为统计语言模型提供语言特征信息和概率数据,在语言研究的其他领域,多使用语料的检索和频率统计结果。
第24卷第4期 佛山科学技术学院学报(社会科学版) N o .4V o l .242006年7月Journal of Fo shan U niversity (Social Science Editi on )Jul .2006语料库、语料库语言学及其应用陈 潇(暨南大学外国语学院,广东广州510632)摘 要:语料库的发展随着计算机科学的发展经历了三个阶段;语料库语言学是基于借助计算机大规模对语料库的语料进行分析和标注的语言科学。
语料库语言学在语言教学和研究中所能发挥的作用越来越大,从语言研究,语言教学、语言测试、词典编撰到人工智能等领域都开始应用语料库语言学。
语料库语言学给以学生为中心的交际法语言教学提供理论和实践平台。
关键词:语料库;语料库语言学;语言研究中图分类号:H 0 文献标识码:A 文章编号:10082018X (2006)0420014206收稿日期:2006204216作者简介:陈 潇(19662),女,湖南长沙人,暨南大学讲师,文学硕士。
随着计算机科学的迅猛发展,人类语言学的发展不断加速,特别是过去语言学家在语言研究方面认为十分困难或几乎不可能的研究工作,今天凭借语料库和语料库语言学可以顺利进行。
本文拟就语料库发展、语料库语言学理论基础、研究方法及其应用进行研究。
一、语料库语料库,即所收集的全套语言材料,它是某种语言中自然出现的,可以是书面的,也可以是口头的,许多语言学家都把这种材料作为研究语言的素材。
过去,语料库中的材料由人工收集和整理;现在,由于使用计算机的先进技术建设语料库,效率和规模都有了很大提高。
语料库是由从有代表性的语言材料中随机抽样输入计算机并可由计算机处理的大量文本组成的。
语料库收入的文本(或词次)越多,其所覆盖的面越宽,则语料库提供的信息就越可靠。
语料库的发展经历了三代更替。
第一代以20世纪60年代的B row n Co rpu s 和LOB Co rp u s 为代表。
高中英语听说语料库的构建及应用研究一、背景语料库是以电子计算机为载体承载语言知识的基础资源,它是按照采样标准、代表语言变体和代表某一种语言的电子文本集合。
立足于语言教学角度,语料库可以为语言学习者提供自然文本,其最具代表性的语言功能是索引关键词,学习者通过划定特定词汇、短语和句子获得大量被查询相关语言实例,进而采取分析推理,获得语言学习规律和心得。
构建英语教学语料库的平台基础是多媒体信息技术,本研究采用AntConc语料库检索软件,它适合于语言文字等方面的研究,具有索引,词表生成,主题词计算,搭配和词族提取等多种功能,以便于更好地分析文本中的词汇主题。
随着计算机技术的突飞猛进,语料库软件开发和应用也得到极大地推广,基于语料库技术的语块教学在高中英语听说教学方面有着极大的优势。
二、意义语料库中收集了真实环境中产生的语言,更加重视单词频度的作用,更加强调单词的搭配关系和词语用法,更加注意语言变异,更加注意词汇在语法中的作用,更加重视语料的真实性,提高了词汇教学大纲( lexical syllables),词典和其他教学材料的编写。
提高学生在语言学习中的主动性。
例如“数据驱动的学习” (DDL), “交互式学习”(reciprocal learning)。
本构建高中英语听说语料库并采用Lewis的“语块教学法”,旨在探讨利用语料库技术把语块教学法应用到高中英语听说教学中的可行性。
三、现状述评随着认知语言学和心理语言学理论的发展和研究的深入,美国心理学家米勒(Miller)和塞尔弗里奇(Selfridge)于1950年率先提出“chunking”即组块的概念,主要指将若干小的单位组合成更大一记忆单位的信息加工过程。
组块策略的运用对提高记忆效率,巩固短时一记忆的效果有很大的好处。
里奇(1991)曾指出,一个语料库具有代表性,是指在该语料库上获得的分析结果可以概括成为这种语言整体或其指定部分的特性。
罗凤文等(2002)研究得出词块教学对提高英语学习者的语言输出能力具有促进作用。
语料库概念与语料库语言学基础知识语料库语言学是以语料库为基础的语言学研究方法。
语料库指的是大量真实语言使用情况的集合,可以包含各种类型的语言材料,例如口语、书面语和专业语言等。
语料库语言学主要涉及以下几个方面:1、语言描述和分析:通过对语料库中的语言数据进行收集、注释和分析,得到关于语言结构和功能的描述和分析。
2、语言学习和教育:通过语料库分析和应用,为语言学习者提供更真实、生动和有效的语言学习材料,同时也可以开发出更优质的语言教学软件。
3、自然语言处理:语料库作为自然语言处理技术的基础数据,能够为机器翻译、文本分类、信息检索等领域提供重要支持。
4、语言变化研究:通过比较不同时间段、地区和社会群体的语料库,可以研究语言变化的规律和特点。
在实际应用中,语料库语言学能够促进语言技术的发展,提高语言学研究的精度和可靠性,同时也给我们带来了更深入的语言理解和认知。
标题:语料库语言学研究的重要性一、语料库语言学的概念及发展历程语料库语言学,是指使用语料库进行研究的语言学分支,其研究对象是自然语言。
语料库是一个按照某种原则建立的、用于语言研究的庞大数据集合。
语料库语言学的理论基础是结构主义语言学、生成语法和实证语言学。
随着计算机技术的飞速发展,语料库规模越来越大,语料质量也越来越高,语料库语言学得以迅速发展。
二、语料库语言学的重要性1、提高语言教学效果语料库语言学可以通过收集大量语言数据来提高语音、词汇、语法和语用的教学效果。
比如,通过语料库分析来确定常见的语言错误类型,帮助学生避免这些错误;通过语料库调查来了解实际使用情况,让教学更接近实际使用。
2、推动语言研究发展语料库语言学以语料为基础,通过数据驱动的方法对语言进行分析,可以帮助我们更好地理解语言的本质和变化规律。
语料库语言学可以帮助我们更好地研究语音、词汇、句法和语用等多个方面,也能够关注不同社会群体间语言使用的差异,因此为语言研究提供了新的视角。
3、促进跨学科研究语料库语言学的方法论在不同领域都有应用。
我想有些亲可能并不是学英语的,需要处理中文的语料库,所以我就把Anthony的AntConc 的使用手册翻译了一下,没有全部,只是某些功能的使用步骤,版本是AntConc3.2.1w(windows)20071.索引工具(concordance)使用步骤1)从file菜单的open file 或open dir选择一个或多个要处理的文件,选出来的文件按顺序在主窗户的左边框里显示出来。
2)在左边search term下的输入框里输入一个搜索词3)使用右边"Search Window Size"的按钮条的增加和减少按钮来选择在搜索词两边显示的字符数。
4)按“Start”键开始产生索引行的检索结果。
检索过程中可按“stop"键随时停止检索。
5)使用Kwic Sort下的按钮条选择一个目标词来重排索引行,0是搜索词,1L,2L是搜索词左边的第一,第二个单词,1R,2R是搜索词右边第一,第二个单词。
注意,三级分类均可,软件刚启动时,二三级未选择。
6)按“Sort”键开始分类处理。
7)将指针移到其中一个索引行的突出的搜索词之上,系统默认为蓝色,与前一项分类得出的目标词不一致,是最开始的搜索词。
指针会转变成一个手形的图标。
点击突出的搜索词,可以使用户看到搜索词在原文中出现的情况。
见“File View"工具。
今天让我们来了解一下什么是语料库。
同样,为了让大家容易理解,我先不准备用专业术语。
可以这样理解,语料就是语言材料的集合。
学外语的同行通常少不了要给人翻译东西,有时候我们可能会碰到我们从来没有遇到过的东西,比如,广告或者说明书。
这时候,我们真希望有类似的用目的语写成的广告或者说明书在手头,我们可以参考,起码我们知道这种广告或者说明书该如何措辞,还有这种广告或者说明书的文本结构方面的特征。
我们可以把收集到的这些文本集合看做是简单的语料库。
所以,语料库本质上就是一文本集合。
语料库语言学在外语教学与研究中的应用语料库语言学是指基于大规模语言样本的语言研究方法。
它通过对现实语料库进行分析和处理,旨在揭示语言的内在规律、认知机制和社会功能。
在外语教学与研究中,语料库语言学的应用主要体现为以下几个方面:一、词汇教学。
语料库可以用来提取常用词汇、搭配、习惯用语等,帮助学习者更好地掌握词汇使用方法以及了解实际语言使用情况。
二、语法研究。
语料库可以用来研究语法结构的频率、变异和演化情况,为外语教学提供科学依据。
三、语用研究。
语料库可以用来分析语境下的语言使用情况,研究语用规律以及对话交际策略,有利于外语学习者更好地理解和运用语言。
四、语音研究。
语音是语言的重要组成部分,语料库可以用来研究语音特征的变化、声调模式的差异等,帮助外语学习者更好地掌握发音技巧。
总之,语料库语言学在外语教学与研究中的应用十分广泛,为提高外语学习效果和推进语言研究提供了有力的工具和方法。
五、语料库语言学的意义语料库语言学是一门基于大规模语言样本(即语料库)的研究方法,旨在揭示语言的真实使用情况。
语料库语言学研究的意义可以从以下三个方面来考虑:一是对语言本身的认识有所助益,二是对外语学习与教学有所帮助,三是对跨学科领域的研究有所启示。
(一)对语言本身的认识有所助益语料库语言学研究可以帮助人们更加客观地认识语言本身。
语言是人类思维和文化的产物,它不仅具有表达和交流的功能,同时也代表了人类文化的精华。
然而,传统的语言研究方法往往只是通过少量的语言样本来推断语言规律,这种方法存在着很多局限性,比如受到研究者主观意识的影响,无法代表语言的全貌等等。
而语料库语言学方法则采用海量的语料库数据来研究语言现象,使得研究结果更加客观、真实、可靠。
通过语料库语言学研究,可以更好地了解语言的本质及其演变规律,从而更加准确地描述和解释语言现象。
(二)对外语学习与教学有所帮助语料库语言学研究还可以为外语学习和教学提供帮助。
语言学习者在学习一门外语时,需要掌握大量的词汇、语法和句型等知识,同时也需要了解这些知识在语境中的运用情况。