基于语料库的“一准”词汇化和语法化考探
- 格式:pdf
- 大小:467.32 KB
- 文档页数:6
语料库语言学方法与认知探究1.理论基础语料库语言学主要基于一些经典的语言研究理论,其中最为重要的是教授 Firth 的语言学思想。
Firth 认为语言是由大量的模式组合而成的,这些模式反映了社会生活中的各种经验和文化内涵。
这种从实际语料中精确提取语言模式的思想成为了语料库语言学的基石。
此外,语料库语言学还受到了认知语言学、信息学、数学、心理学等学科的影响。
认知语言学认为,语言是人类思维过程中一个重要的组成部分。
在此基础上,语料库语言学通过实际语料库中的多样性和差异性挖掘语言的认知本质,从而理解语言的发展规律。
2.研究方法语料库语言学的研究方法主要是通过大规模、多变的语料库实验数据,对自然语言的使用、组成、结构以及发展规律等各个方面的问题进行深入剖析。
具体的研究方法包括以下几种:(1)语料库的搜集与整理。
语料库的质量和数量是语料库语言学研究的重要前提,因此,语料库的精准搜集和整理往往需要长时间和高精度地工作。
(2)语言特征的提取。
通过计算机技术和自然语言处理技术,从语料库中提取并量化语言现象的各种特征,如语音、语义、句法等,是语料库语言学研究中的一项关键工作。
3.研究成果语料库语言学在自然语言处理、机器翻译、语音识别等领域得到了广泛应用,具体涉及到以下几个领域。
(1)语音识别。
语音识别技术是语料库语言学在计算机技术领域中的应用之一,凭借海量的语音语料数据,可以训练机器精准地解释语音信号并识别出语音的真实内容。
(2)机器翻译。
机器翻译作为语料库语言学的重要应用领域,致力于通过对语言模式的训练和模拟,使得机器能够理解并翻译不同语言之间的文本信息。
(3)自然语言处理。
自然语言处理是运用计算机技术对自然语言进行理解、分析和处理的学科,语料库语言学和自然语言处理可以相互协调,共同实现对自然语言的深入研究和改进。
词汇化与语法化一、本文概述《词汇化与语法化》这篇文章旨在深入探讨语言演变中的两个重要现象:词汇化和语法化。
这两个过程在语言的自然发展中起着至关重要的作用,它们不仅塑造了语言的形态和结构,也影响了语言的表达方式和功能。
词汇化指的是语言中的词汇元素如何通过组合和重新分析形成新的词汇项,而语法化则关注语言中的语法元素如何随着时间的推移而发生变化,包括词类转变、语法结构的变化等。
本文将首先介绍词汇化和语法化的基本概念和理论框架,阐述它们在语言演变中的重要性。
接着,我们将通过具体的语言实例来展示词汇化和语法化的具体过程,包括词汇项的形成、词义的演变、语法结构的变化等。
我们还将探讨词汇化和语法化对语言理解和语言教学的影响,以及如何在语言研究和语言教学中更好地理解和应用这两个概念。
通过本文的阐述和分析,我们希望能够为读者提供一个全面而深入的理解词汇化和语法化的视角,同时也为语言研究和语言教学提供有益的参考和启示。
二、词汇化现象分析词汇化,作为一种语言现象,是指语言中原本独立的词或词组在某些情况下结合成一个新的词汇单位的过程。
这一过程往往涉及到语义、语法和语用等多个层面的变化。
词汇化现象不仅丰富了语言的词汇库,也对语言的表达方式和语法结构产生了深远的影响。
词汇化现象的产生通常与语言的使用环境密切相关。
在长期的语言使用中,人们为了表达更为复杂或特定的概念,往往会将一些常用的词组或短语固定下来,形成一个新的词汇单位。
这种固定化的过程往往伴随着语义的泛化或特指化,使得新的词汇单位能够承载更多的信息或表达更为精确的概念。
词汇化现象在语言发展中扮演着重要的角色。
一方面,词汇化使得语言更加简洁、高效,能够更好地适应社会的快速发展和人们日益复杂的交流需求。
另一方面,词汇化也促进了语言的创新和发展,为语言带来了新的表达方式和语法结构。
然而,词汇化现象也带来了一些挑战。
一方面,词汇化可能导致语言的模糊性和歧义性增加,使得语言的理解和使用变得更加困难。
基于语料库的英语语法认知概念体系研究学科分类:高等教育课题类别:重点课题关键词:语料库认知语法概念体系预期研究成果:研究报告课题设计论证1、问题的提出、课题界定、国内外研究现状述评、选题意义与研究价值。
随着社会的发展,语言已上升为提高认知能力、探索人类心智的重要突破口。
英语语法是英语语言体系中的框架体系,是形成英语语言思维的概念框架体系。
当前,国内对英语语法的学习与研究重心放在形式上。
中国学生学习语法停留在对知识的记忆上,在写作及口语中出现多种语法错误,不会自然规范地创造符合场景的句子,究其原因是不能将语法上升到与认知结合起来的高度,不能像熟悉母语那样熟悉英语语法到进入潜意识的程度。
英语语法从形式上用来描述英语内在规律,但是语法并不仅仅是形式。
把语法描述为纯粹的形式体系是错误的,语法是有意义的。
语法的认知语义基础是概念或者是识解。
(Langacker,2008)当前,国内英语语法的研究有同认知语法结合的趋势,但是仍然不成体系,没有从认知角度进行概念体系的研究。
国内外对认知语法的研究目前局限在原有认知语法框架中的定性研究。
因此,将语法研究与心理语言学、认知心理学结合起来进行跨学科定性与定量的研究是必要的。
使用语料库的方法进行研究是英语语法认知概念体系研究的一个创新。
本研究者已创建的《英语语法场景语料库》及国内的相关的二语习得者语料库将提供严密的数据,使语法与认知的研究更为科学、系统。
专门对认知语法的研究在国内外认知语言学界不是很多,John Talor(2013) 著Cognitive Grammar ,和Langacker(2008)著Cognitive Grammar—A Basic Introduction 对认知语法的背景、概念、原理进行了阐释。
GünterRadden和RenéDirven联合编撰的Cognitive English Grammar将认知语言学的理论观念与传统语法中的概念与规则有机地结合起来,对传统语法中各项内容通过认知语法的理念逐一进行了梳理和重构。
基于语料库的同义词辨析在语言学研究中,同义词辨析一直是一个重要的课题。
同义词指的是意义相近的词语,它们在用法、语境和语义等方面存在差异。
为了更好地理解和使用同义词,我们需要进行深入的研究和分析。
本文将介绍一种基于语料库的同义词辨析方法,并运用该方法对一组同义词进行分析。
选择合适的语料库是进行同义词辨析的关键步骤。
语料库是大量真实语料的集合,可以为同义词辨析提供丰富的语境信息。
我们可以选择电子书、论文、新闻等多种类型的语料库,以获取不同领域和体裁的语料。
在准备好数据集后,我们就可以运用各种方法进行同义词辨析。
同义词辨析的方法有很多,其中比较常用的有构词法、形似度比较和语音比较等。
构词法是通过分析词语的构词成分来辨析同义词。
例如,“看见”和“目睹”是一组同义词,但它们的构词成分不同,“看”和“睹”在意义上有一定的差异。
形似度比较是通过比较词语的形状来辨析同义词。
例如,“唯一”和“独一”是一组同义词,但它们的形状不同,因此在一些情况下可能存在用法上的差异。
语音比较是通过比较词语的发音来辨析同义词。
例如,“以后”和“之后”是一组同义词,但它们的发音不同,可能会影响词语的语感和情感色彩。
在进行同义词辨析时,我们需要根据实际需要选择合适的方法。
同时,我们还需要注意以下两点:重视语境信息。
同义词在不同语境下可能有不同的用法和意义,因此我们需要结合具体语境来进行辨析。
在借助语料库进行同义词辨析时,我们需要从大量真实的语料中提取相关信息,并通过对上下文的分析来理解同义词的用法和差异。
保持客观公正。
同义词辨析要求我们在分析时保持客观公正,不能主观臆断或带有偏见。
为了确保分析的准确性,我们需要充分了解同义词之间的细微差异,并依据语料库中的实际语料来进行判断。
下面,我们以“马上”和“立刻”为例,说明如何运用基于语料库的同义词辨析方法。
我们选择一个电子书语料库作为数据集,并使用检索工具在其中检索“马上”和“立刻”这两个词语的出现情况。
《基于汉语语料库的中文词句快速检索算法研究》篇一一、引言随着信息技术的飞速发展,中文语料库的规模不断扩大,如何快速、准确地从海量的中文文本中检索出所需的词句成为了重要的研究课题。
本文旨在研究基于汉语语料库的中文词句快速检索算法,以提高检索效率和准确性,满足用户对信息的需求。
二、研究背景与意义在互联网时代,信息量呈现出爆炸式增长,如何从海量的中文文本中快速找到有用的信息成为了亟待解决的问题。
传统的中文词句检索算法在处理大规模语料库时,往往存在检索速度慢、准确率低等问题。
因此,研究基于汉语语料库的中文词句快速检索算法具有重要的现实意义。
三、相关文献综述近年来,国内外学者在中文词句检索算法方面取得了显著的研究成果。
其中,基于倒排索引的检索算法、基于向量空间模型的检索算法、基于深度学习的检索算法等在中文词句检索中得到了广泛应用。
然而,这些算法在处理大规模语料库时仍存在一定的问题,如索引构建复杂、检索速度慢等。
因此,本研究将结合汉语语料库的特点,研究更为高效的中文词句快速检索算法。
四、算法设计针对现有算法的不足,本文提出了一种基于汉语语料库的中文词句快速检索算法。
该算法主要包括以下几个步骤:1. 预处理:对汉语语料库进行分词、去停用词等预处理操作,提取出有价值的词汇信息。
2. 构建索引:采用倒排索引和向量空间模型相结合的方式,构建高效的词汇索引。
其中,倒排索引用于快速定位包含特定词汇的文档,向量空间模型则用于计算文档间的相似度。
3. 检索策略:根据用户的查询需求,采用多种检索策略相结合的方式,如基于关键词的精确匹配、基于语义的模糊匹配等,从词汇索引中快速检索出相关词句。
4. 结果后处理:对检索结果进行排序、去重等后处理操作,以提高检索结果的准确性和可读性。
五、实验与分析为了验证本文提出的算法的有效性,我们采用了一个大规模的汉语语料库进行实验。
实验结果表明,本文提出的算法在检索速度和准确性方面均取得了显著的提升。
基于语料库的英语专业大一、大三学生英语议论文中的名词语块研究刘士祥1,朱兵艳1,邱广民2(1. 海南软件职业技术学院 外语与旅游系,海南 琼海571400;2. 海南大学三亚学院 外国语学院,海南 三亚 572022 )摘 要:基于SWECCL 语料库作文子库的大一、大三限时作文,研究中国英语专业大学生议论文中名词词块应用。
结果显示:1. 中国英语专业大一学生使用名词语块类型相对单一,过度使用3词语块;2. 大三学生使用名词语块种类相对丰富,以后置性定语、同位语为典型代表;3. 中国英语专业学生使用名词词块呈现线性句法特征,映射中式英语思维特征。
本研究对二语习得与外语教学具有启发意义。
关键词:名词语块;语料库;二语习得与教学;议论文中图分类号: 文章标识码: A 文章编号:DOI: 网络出版时间: 网络出版地址:随着语料库语言学的迅速发展,语块(formulaic language or chunk) 研究在二语习得与应用中倍受关注。
人们普遍认为,语块可作为整体单位储存于心理词典,或者在语言神经网络中紧密联系在一起、减少大脑处理信息时的负担,有助于提高语言理解的速度和表达的流利性。
作为3种主流研究方法之一的“语料库提取”方法,更是以铁的事实和详尽的数据,进一步描述语言运用的“痕迹”,帮助学者探查语言运用背后的秘密。
20世纪以来,国内关于二语语块习得与二语写作研究已取得了一些成果。
例如,二语词块能力与各种二语技能之间存在显著相关关系[1] (P35-38);运用词块的能力与写作成绩相关,高分者具有更丰富的词块知识[2] (P49-53);通过以语块为核心的多稿式写作教学方式的实验,达到了提高学生写作能力的目的[3] (P104-106)然而,运用语料库方法,对中国英语专业作文中名词语块提取、分类并系统研究的为数不多。
马广惠等。
[4] (P54-60)使用Wordsmith 软件提取英语说明文3词词块,并用同样方法从二语限时作文提取3词词块191个,并计算其标准频数,将它们重新分为7大类进行研究。
每一个语言体系都离不开词汇这一重要组成部分,对于英语学习者来说,词汇正确的使用方法也是学习过程中必须掌握的内容。
有实证研究显示:词汇是提高语言综合水平的必要前提,如果词汇不过关,那么提高语言其他环节水平也就无从谈起。
词汇对于语言学习的重要性,好似基石和建造万丈高楼之间的关系一样。
将语料库运用于词汇教学领域,对于提高后者的教学效率和质量来说发挥着不可忽视的重要作用。
本文即要对语料库在英语词汇教学过程中扮演的角色进行分析,为英语词汇教学整体水平的提高提供理论参考依据,为英语教学的发展做出贡献。
一、语料库简介所谓语料库,就是语言材料的集合。
语料即语言素材,简单地说就是语言使用者在使用相关语言时各种材料的累积,而将这些所积累的材料在按照一定的标准收集整理,久而久之这些材料越来越多,就形成了语料库,语料库的产生和发展已有较长时间。
第一阶段距现在已有较长历史,那时候甚至还没有产生算机,更不用说将计算机运用于语料库领域,该阶段是语料库发展的最初阶段。
所以手工是那个阶段解决语料库方面的问题最主要的手段,虽然由于时代所限,该阶段的语料库代表性有限,可是这丝毫不影响其在语料库发展过程中始终占据着重要地位。
第二阶段的语料库则以使用计算机为主要特点,很多数量庞大的电子语料库应运而生,所以该阶段的语料库水平和容量较第一阶段相比已经一有了质的突破。
语料库建设则是第三阶段的主旋律,该阶段的语料库发展已进入成熟阶段,很多针对语料库的研究活动如雨后春笋一般如火如荼开展,而在这样的背景下,之前的语料库显然已经无法满足人们的需求,所以产生了第二代超大型计算机语料库。
上世纪50年代,针对语料库语言教学的研究进入瓶颈期,主要原因是部分理性语言学家对该研究活动的反对。
经过二三十年的低潮过后,语料库势头有所起色,而到了90年,语料库则迎来了发展的春天,针对语料库的建设和应用都取得了里程碑式的突破,产生该现象主要是因为:第一,很多人发现将语料库方法运用在商业领域收效颇丰,典型的有编写词典等活动;第二,全世界各地区之间的交流日益频繁,进而催生了大规模外语学习活动,这为促进语料库和外语教学的有机结合带来了千载难逢的良机。
语言本体研究odern chinese2012.10基于语料库的动宾复合词属性考察及其词汇化程度分析□李进学摘 要:本文以《现代汉语词典》中所有动宾复合词为分析对象。
首先在数据库中从“儿化、轻声、词性、结构、是否是离合词、能否带宾语、《辞源》中是否已有、义项数”等八个方面对所有动宾复合词的属性进行了逐词分析。
然后,从“语音、语义、结构、语法”四大层面对这些属性进行了量化统计和性质判断。
在对比分析的基础上,笔者得出结论:现代汉语中不同动宾复合词的词汇化程度是不同的,整体来看,现代汉语中动宾复合词的词汇化程度比较低。
同时从历时角度提出了动宾短语词汇化为动宾复合词六阶段的设想。
关键词:语料库 汉语 动宾复合词 属性 词汇化动宾复合词是现代汉语词汇系统的重要组成部分,其中双音节动宾复合词①占主体。
本文的研究以双音节动宾复合词为对象,多音节动宾复合词暂不涉及。
“词汇化”是指比词大的句法单位随时间推移,逐渐凝结为结构不可自由分离、意义具有整体性的词汇单位的过程和现象。
本文所说的词汇化特指动宾短语凝结为动宾复合词的过程和现象②。
现代汉语平面的动宾复合词从历史来源看,很大一部分由动宾短语衍化而来。
在共时平面上表现为:或改变词性,如“将军、著名”;或变为及物动词,如“得罪,注意”;或结构凝固,不可扩展,如“阅兵、称谢”;或结构可以有限扩展,意义具有整体性,如“逼宫、拆台”等等。
动宾式双音节复合词在共时层面呈多样性,这种多样性是词汇历时演变在共时平面上的表现,应该从历时角度寻找原因。
动宾短语发展为动宾复合词是古汉语的以单音节词汇为主发展到现代汉语的以双音节词汇为主的具体表现。
动宾类词汇化发展的不同阶段在现代汉语词汇中均有表现,通过分析现代汉语动宾类词语的特征,可以推测动宾短语发展到动宾复合词的发展历程和不同阶段。
一、研究对象和方法本文以双音节动宾复合词为研究对象,多音节动宾复合词暂不涉及。
具体选材范围设定为《现代汉语词典》(下文简称《现汉》)中的双音节动宾复合词。
《基于蒙古语学术语体语料库的句法计量研究》篇一一、引言蒙古语作为我国少数民族语言之一,其学术语体句法研究对于丰富和发展语言学理论、推动蒙古语言文化传承具有重要意义。
本文旨在通过建立蒙古语学术语体语料库,运用句法计量研究方法,对蒙古语学术语体的句法结构进行深入探讨,以期为蒙古语的语法研究和语言教学提供新的思路和方法。
二、语料库的构建1. 语料来源本研究所用语料主要来源于蒙古语学术期刊、学术论文、专著等,确保了语料的学术性和代表性。
2. 语料处理在收集到原始语料后,进行分词、词性标注、句法分析等预处理工作,为后续的句法计量研究提供基础数据。
3. 语料库的建立在完成预处理工作后,建立蒙古语学术语体语料库。
该语料库包含了丰富的句式、词汇和语法结构,为后续的句法计量研究提供了可靠的数据支持。
三、句法计量研究方法1. 句法结构分析通过句法分析,对蒙古语学术语体中的句子进行层次划分,明确句子成分之间的关系,为后续的计量研究提供基础。
2. 计量指标设计根据句法结构分析结果,设计合适的计量指标,如句子长度、从属关系数量、句子类型等,用于量化描述蒙古语学术语体的句法特征。
3. 统计分析方法运用统计学方法,对计量指标进行统计分析,揭示蒙古语学术语体句法结构的规律和特点。
四、研究结果与分析1. 句法结构特点通过对蒙古语学术语体语料库的句法结构分析,发现蒙古语句子以主谓结构为主,同时存在大量的从属结构和并列结构。
从属关系中,动词的形态变化丰富,体现了蒙古语的语法特点。
2. 计量指标分析通过对计量指标的统计分析,发现蒙古语学术语体的句子长度适中,从属关系数量较多,说明句子结构较为复杂。
此外,不同句子类型在语料库中的分布也存在差异,反映了蒙古语学术语体的语言风格和表达习惯。
3. 句法结构与语言风格的关系通过对比分析不同语言风格的句法结构,发现句法结构与语言风格密切相关。
例如,正式的学术语言多采用长句和复杂的从属结构,而口语化的语言则多采用短句和简单的并列结构。
基于语料库的英语语法教学研究作者:潘美兰来源:《读书文摘(下半月)》2019年第04期[摘要:基于语料库的语法教学方式合理的应用于课堂教学中,可以有效的保证教学的整体质量和效果。
但是随着教育改革力度的不断加大,这对当前的基于语料库的教学方式提出了更高的要求,要切实的处理好实际教学过程中暴露的多种问题。
本文主要从原型范畴理论的角度出发,结合实际的课堂教学情况来进行了有效的探究分析,提出了一些建设性的意见。
关键词:语料库;英语语法;教学探究]一、原型范畴观以及语法教学的相关探讨人们在对世界进行客观认知和探索的进程之中,对那些熟悉的对象进行更加有效的体验、互动以及比较和综合等,从中获取到更加一致的部分,并且以此为基础进行更加高效的分类处理,再更进一步的对这些分类使用语言进行固定处理,我们将整个过程叫做范畴化,其最后的结果就是认知范畴。
范畴化探究最早开始于亚里士多德年代,范畴是由范畴内部的成员共有的一组充分必要的属性而完成定义,具有明显的二分性质、成员地位一致、不同范畴边界线较为清晰等多个特点。
原型范畴观提供了更加有效审视二语习得的新途径,对于语言的教学实践而言起到了非常重要的启示作用。
当前我们国家内将原型范畴理论和英语教学结合最为密切的部分就是在词汇之中,而语法也是语言中非常重要的一个组成部分,包含了时、体、态等多个范畴,也具有自己的典型成员以及非典型成员。
但是结合我们国家现有的教学情况不难发现,其在语法教学中的应用探讨十分的稀少,而且也很少涉及到语料库的相关问题,并没有对这种新型的教学资源有一个充分的认知。
二、原型范畴观以及以语料库为基础的英语语法教学探究1.需要将目标语法范畴的典型语法价值意义以及特点进行突出使用语料库学习的最为基础的一点就是要进行索引行。
在计算机之中输入需要查找的关键字,相关的索引软件就会对语料库进行更加有效的自动检测,并且将含有关键词的句子展示于大屏幕之上,在左右两边也会呈现出一定数量的语境词汇,之后老师就可以有效的指引学生来对索引进行有效的观察探究分析以及综合等,通过这些活动过程来进行更加高效的学习。
基于语料库的英语词汇教学模式初探
胡军叶
【期刊名称】《科教导刊-电子版(中旬)》
【年(卷),期】2016(000)006
【摘要】结合语料库的优势和英语词汇教学的特点,探讨建立基于语料库的英语词汇教学模式。
语料库辅助词汇教学的得与失进行分析,得出基于语料库的词汇教学有助于扩大词汇量同时促进深度学习。
【总页数】2页(P117-117,192)
【作者】胡军叶
【作者单位】四川师范大学外国语学院四川·成都 610068
【正文语种】中文
【中图分类】G642
【相关文献】
1.基于语料库的大学英语词汇教学--《新视野大学英语》教材语料库使用初探 [J], 王颖
2.基于语料库的大学英语词汇教学实例研究 [J], 何蔚涵
3.基于自建语料库的中医英语词汇教学 [J], 靳乾
4.语料库在大学英语词汇教学中的应用研究——基于读后续写对词汇教学的思考[J], 王倩
5.语料库在大学英语词汇教学中的应用研究
——基于读后续写对词汇教学的思考 [J], 王倩
因版权原因,仅展示原文概要,查看原文内容请购买。
《当代语言学》第7卷2005年第3期225-236页,北京词汇化二例3———兼谈词汇化和语法化的关系王灿龙中国社会科学院语言所提要 词汇化是指一个短语或由句法决定的其他语言单位在语言的发展演变中其自身变成一个稳固词项的过程。
本文以汉语中的“恨不得”和“物色”为例,通过对它们词汇化过程的分析,试图揭示某些词汇化的机制和规律。
文章还在此基础上简单探讨了词汇化与语法化的关系问题。
本文认为,词汇化和语法化虽是两种不同的语言演变形式,但有的演变机制却为二者所共有,有的词汇化过程常常伴随着语法化,在宏观动因上它们也有很大的一致性。
词汇化和语法化的研究应该纳入整个语言变化的框架内来进行,既要看到它们各自的特点,也要看到它们之间的联系,任何将它们割裂开来甚至对立起来的作法都不利于全面、准确地认识和把握语言的演变规律。
关键词 词汇化个案分析语法化1.引言自二十世纪初Meillet 提出“语法化”(gra mmaticalizati on )并初步分析这种语言变化的现象以来①,语法化理论得到了很大的发展和丰富,世界范围内的语言研究特别是历时语言研究非常重视该理论,语言学家们利用语法化理论分析研究语言现象取得了丰硕的成果。
随着研究的深入和发展,人们开始注意到语言演变过程中的另一种现象,即一个短语或由句法决定的其他语言单位在经历了一段时间之后,其自身变成一个稳固的词项(lexical ite m ),并且进入基本词汇或一般词汇,人们称这一过程或现象为词汇化(lexicalizati on )。
简而言之,词汇化就是一种句法单位成词的凝固化。
同语法化一样,词汇化也不仅仅局限于个别语言,可以说它是人类语言演变的一个较为普遍的现象,它在各种语言中都有不同程度的反映。
本文拟从汉语中选取两个个案进行分析,并在此基础上简单探讨一下词汇化与语法化的关系问题。
本文考察的两个个案都是《现代汉语词典》(2002年增补本,中国社会科学院语言研究所词典编辑室编纂,1996年修订本)收录的词项。