当前位置:文档之家› 语料库语言学术语汇编V20-CORPUSnplcorpora

语料库语言学术语汇编V20-CORPUSnplcorpora

语料库语言学术语汇编V20-CORPUSnplcorpora
语料库语言学术语汇编V20-CORPUSnplcorpora

语料库语言学术语汇编(V2.0) Last updated 2015-07-31 by 许家金

常用语料库

语料库术语中英对照

Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词 AWL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Comparable corpora 类比语料库、可比语料库 ConcGram 同现词列、框合结构 Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引生成、索引分析 Context 语境、上下文 Context word 语境词 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现 Corpora 语料库(复数) Corpus Linguistics 语料库语言学 Corpus 语料库 Corpus-based 基于语料库的

语料库语言学综述

语料库语言学综述 作者:刘美良 作者单位:柳州铁道职业技术学院,广西,柳州,545001 刊名: 科技信息 英文刊名:SCIENCE & TECHNOLOGY INFORMATION 年,卷(期):2010,""(21) 被引用次数:0次 参考文献(19条) 1.Chomsky,N Syntactic Structure 1957 2.Sinclair.John Corpus.Concordance Collocation 3.Susan Hunstom Corpora in Applied Linguistics 2006 4.Aijmer,K.Altenberg,B English Corpus Linguistics:Studies in Honour of Jan Svartvik 1991 5.杨惠中语料库语言学导论 2002 6.何安平语料库在外语教育中的应用--理论与实践 2004 7.何安平谈语料岸研究 1997(5) 8.丁信善语料库语言学的发展及研究现状 1998(1) 9.李文中2003上海语科库语言学国际会议述评 2004(1) 10.粱旭红语料库语言学研究综述 2001(1) 11.粱燕近十年我国语料库实证研究综述 2004(6) 12.刘满堂近40年英语语料库及语料库语言学研究的回顾与出展望 2004(1) 13.潘永本梁语料库语言学的目的和方法 2001(3) 14.王建新语料库语言学发展史上的几个重要阶段 1998(4) 15.许家金语料库语言学的理论解析 2003(6) 16.卫乃兴专业性搭配初探--语料库语言学方法 2001(4) 17.卫乃兴语料库语言学的弗斯学说基础 2008(3) 18.甄风超.张霞语料库语言学发展趋势瞻望--2003语料库语言学国际会议综述 2004(4) 19.吴菲国内外英语语料库的建设和发展述评 2007(6) 相似文献(4条) 1.期刊论文王虹.岳俊发.Wang Hong.Yue Jun Fa书面言语鉴定技术的发展历程-中国公共安全(学术版)2005,""(3) 书面言语鉴定技术产生于20世纪80年代中期.随着电子打印技术的普及,涉案的不留笔迹的打印文件显著增加,书面言语鉴定技术倍受关注.近年来,运用统计语言学、语料库语言学和计算机词频检索与统计等新技术获得了新的研究成果并应用于鉴定实践.书面言语鉴定技术已经发展成为文件检验学的一个新的分支,必将在司法鉴定领域发挥更大的功效. 2.期刊论文孙丰果话语分析整合研究-聊城大学学报(社会科学版)2010,""(2) 近60年来.话语分析经历了从无到有,从小到大的发展历程.话语分析要取得长足发展,需要有一个明确的概念,需要人们对其以前的发展情况进行总结和评述.对话语分析研究的评述不妨从系统功能语言学、认知语言学、语料库语言学等多角度进行.今后,话语分析研究可以从话语分析的哲学转向、心理学转向及整合批评话语分析和积极话语分析等方面展开. 3.期刊论文杨连瑞.Yang Lianrui第二语言习得研究的学科定位和进展-外语与外语教学2005,""(5) 第二语言习得是一种复杂的人文现象.作为一门新兴的交叉学科,第二语言习得研究在发展中应重视其学科性质的科学定位和学科体系的科学建构.本文在对第二语言习得研究的学科定位、学科性质和研究对象进行讨论后,回顾和评述了国外第二语言习得研究从对比分析、错误分析、中介语理论、普遍语法研究、语言类型学研究到语料库语言学研究的发展历程和研究问题,分析了目前我国开展这一学科研究的现状,并结合我国外语教学实际对目前开展这一学科的研究提出建设性意见. 4.学位论文魏琳中国英译旅游宣传材料的语料库分析2006 旅游业在全球范围内的迅猛发展使不同文化背景的人们进行文化交流变成了一种需要。在我国,旅游英语特别是网上的旅游英译材料是外国游客接触和了解我国的媒介。因此,旅游材料的翻译质量举足轻重。而目前旅游文本的翻译研究在中国还是一个比较新的话题,近年来主要是结合最新语言学

语料库话语分析综述

近十年国内基于语料库的话语研究综述 A Review of Ten - year Research on Corpus-Based Discourse Analysis in China 摘要:文章从基于语料库的话语研究领域出发,通过对2002年至2011年发表在国内八种核心期刊上的论文进行统计与分析,发现这些研究在研究领域取得了很大的进步,涉及到话语各个方向,对于实践有重大指导作用,但同时也出现一些问题值得我们关注。 Abstract: From corpus-based discourse analysis, this thesis finds this field has made great progress, relates to many directions of discourse and has a significant guiding role for the practice, but also brings many problems worthy our attention. All of these are derived from the research and analysis of thesises published in 8 kinds of core journals from 2002 to 2011 in China. 关键词: 语料库话语基于语料库的话语研究 0. 引言 现代语料库语言学是20世纪中后期兴起的一门语言研究科学。语料库是指按一定的语言学原则,运用随即抽样的方法,收集自然出现的连续的语言运用文本或话语片段而建成的具有一定容量的大型电子文库。在20 世纪后半叶的西方语言学界, Chomsky的观点大行其道,秉承该学说的语言研究者唯直觉语料独尊。他们躲在书斋,满足于依靠自己的直觉语料从事语言研究。随着社会语言学、话语分析、语用学、语料库语言学的兴起,越来越多的语言学家认识到光靠直觉语料来研究语言是远远不够的,人们还必须借助语料库语料以及其他各种语料,只有这样我们才能更好地揭示语言的本质,克服直觉语料的局限与不足。这样基于语料库的话语研究越发引起大家的重视,并取得了丰硕的成果。国内基于语料库的话语研究虽然起步较晚,但是成果仍然颇丰。 1. 研究样本 由于近几年运用语料库来做话语研究已经成为语言研究的热点,笔者通过检索主题与关键词,将文献定在2002年至2011年这十年期间,研究样本来源为发表在八种外语类核心期刊的22篇文章。这是因为这8种外语类期刊有一定的权

语料库常用术语

语料库常用术语 Type 类符 Tokens 形符 例如“I see a cat and a dog”类符6个,形符7个 Type/token ratio =TTR TTR 是衡量文本中词汇密度的常用方法,可以辅助说明文本的词汇难度。但是,文本中有大量功能词出现,文本每增加一个词,形符就会增加一个,但类符却未必随之增加。这样文本越长,功能词重复次数越多,TTR会越低。因此用TTR衡量词汇密度不合理,于是,出现了标准化类符/形符比,即STTR。例如,计算每个文本1000词的TTR,均值处理,得出STTR。Frequency(频率) 例如每百万词、十万词中,某单词出现次数。常常将某个单词在两个语料库中出现的频率参照两个语料库的容量,用卡方检验或对数似然率进行对比,来确定两个库中该单词的使用是否有差异。 Wordlist词表 根据单词或词组在语篇中出现的频率大小而排列形成的列表。 Ranks Lemma词目,词元 比如go是lemma,对应各种屈折变化形式(inflections),go,goes,went,going,gone共5种屈折变化形式。在分析语言时,需要将它们全部归到go名下,这个过程叫词形还原。Keywords关键词、主题词positive keywords 正关键词negative keywords 负关键词 Concordance 索引(KWIC 语境中的关键词key words in context) 运用索引软件在语料库中查询某词或短语的使用实例,然后将所有符合条件的语言使用实例及其语境以清单的形式列出。通过前后语境,可以分析“collocation词汇搭配”“colligation 类连接、语法搭配”“semantic preference语义倾向”“semantic prosody语义韵”Collocation词汇搭配 搭配强度MI,T-score ,Z-score Colligation类连接、语法搭配 semantic prosody语义韵 词汇的语义韵大体可分为积极语义韵、中性语义韵、消极语义韵。 POS tagging 词性赋码 Regular expression regex 正则表达式

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编 ( V2.0 ) Last updated 2012-10-08 by许家金 Aboutness所言之事 Absolute frequency绝对频数 Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的 Annotate标注(动词) Annotated text/corpus标注文本 /语料库、赋码文本/语料库Annotation标注(名词) Annotation scheme标注方案 ANSI/American National Standards Institute美国国家标准学会 ASCII/American Standard Code for Information美国信息交换标准码 Exchange Associates (of keywords)(主题词的)联想词 AWL/academic word list学术词表 Balanced corpus平衡语料库 Base list/baselist底表、基础词表 Bigram二元组、二元序列、二元结构 Bi-text/bitext双语合并文本、双语分行对齐文本 (一句源语一句目标语对齐后的文 本) Bi-hapax两次词 Bilingual corpus双语语料库 Bootcamp debate/discourse/discussion(新手)训练营大辩论 /话语 /大探讨CA/Contrastive Analysis对比分析 Case-sensitive/case sensitivity大小写敏感、区分大小写 Category-based approach基于类(范畴)的方法 Chi-square test/ 2χ卡方检验 Chunk词块 CIA/Contrastive Interlanguage Analysis中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-CLAWS 词性赋码系统 tagging System Clean text policy干净文本原则 Cluster词簇、词丛 Colligation类联接、类连接、类联结 Collocate n./v.搭配词;搭配 Collocability搭配强度、搭配力 Collocation搭配、词语搭配 Collocational strength搭配强度 Collocational framework/frame搭配框架 Collocational profile搭配概貌

语料库语言学的发展

语料库语言学的发展 语料库顾名思义就是放语言材料的仓库。现在人们谈起语料库,不言而喻是指存放在计算机里的原始文本或经过加工后带有语言学信息标注的语料文本。现在世界上已经有了不少规模较大的语料库,有些是国家级的,有些由大学和词典出版商联合建设。另外,由于个人微机的迅猛发展和存贮数据的硬盘造价持续下降,研究者个人也开始建立适合于自己研究的小型语料库。 语料库语言学(英文corpus linguistics)这个术语有两层主要含义。一是利用语料库对语言的某个方面进行研究,即“语料库语言学”不是一个新学科的名称,而仅仅反映了一个新的研究手段。二是依据语料库所反映出来的语言事实对现行语言学理论进行批判,提出新的观点或理论。只有在这个意义上“语料库语言学”才是一个新学科的名称。从现有文献来看,属于后一类的研究还是极个别的。所以,严格地说,现在不能把语料库语言学跟语言学的分支, 如社会语言学、心理语言学、语用学等相提并论。 近年来,随着我国经济的发展,科研经费的增加,汉语语料库的建设得到了开展。1999 年我院把建立汉语语料库列为院重大课题。目前语言所正在构建三个大规模的语料库: 现场即席话语语料库,主要方言口语库和现代汉语文本语料库。在世界范围内,我国的语料库建设在规模上还赶不上欧洲的一些发达国家,特别是英国。然而,在语料库语言学的研究上,以及语料库的实际运用上,我国已经进入世界前沿的行列。 20 世纪语言研究的总特点可以用四个字概括──高度抽象。最近几十年来,语言研究的高度抽象倾向已经失去主导地位。这主要缘于两个方面的因素: 一是计算机技术,特别是基于计算机处理的多媒体技术的飞速发展;二是社会语言学、语用学、会话分析、人类语言学、计算语言学、人机对话研究、语音识别与合成等研究取得令人瞩目的成就。先前难以抓住并进行有效处理的五花八门的实际语料,现在可以对其进行大规模地的、自动的或人机配合的处理。比如个人发音特征,先前认为这跟语言学毫无关系,现在成了侦破语音学的重要内容。侦破语音学家首先建立个人发音特征语料库,这个语料库可以用来鉴别嫌疑犯。概言之,当今的语言研究由先前的高度抽象逐步走向最具体的语言的实际活动,其中

桂诗春等-2010-语料库语言学与中国外语教学

2010年11月November 2010 第33卷第4期Vol.33No.4 现代外语(季刊) Modern Foreign Languages (Quarterly )语料库语言学与中国外语教学 桂诗春 冯志伟杨惠中何安平卫乃兴李文中梁茂成 [编者按] 为推动我国应用语言学研究的新发展,教育部人文社科重点研究基地———广东 外语外贸大学外国语言学及应用语言学研究中心于2010年9月24-25日成功举办了“首届广外应用语言学论坛”,庆贺我国著名语言学家、应用语言学学科的开拓者桂诗春教授八十华诞。期间,举行了题为“语料库语言学与外语教学”的高层论坛,就语料库语言学的现状、发展前景及语料库的建设、共享、应用等展开了互动讨论。以下是根据专家发言,整理后的主要内容。 [中图分类号]H319 [文献标识码]A [文章编号]1003-6105(2010)04-0419-08 语料库语言学的发展前景与资源共享 广东外语外贸大学 桂诗春 1.语料库语言学的发展前景 语料库语言学在外国和国内都发展很快,有的人选择了它作为发展方向,因为它的入门比较容易,上手较快;有的人把语料库语言学作为收集数据的重要手段。但是总的来说,我们的语料库研究还处在比较初级阶段,需要提高。究其原因是很多人把它看成是一种工具或手段,可以运用现有的一些现成的程序和公开的语料库,如Brown ,LOB ,Frown. Flob , BNC ,CLEC ,只要选题得当,就能获得很多量化的数据,从而写出洋洋洒洒的文章来。在计算机和扫描仪的支持下,自行收集一些语言素材,建立一个特定的语料库,也不是什么难事。 我觉得,语料库语言学既是一种工具,但更是一门学科;它是对语言行为进行概率性归纳和概括的一门学科,它本身是跨学科性的,要做语料库语言学研究必须许多方面要有比较雄厚的基础。首先是数学和统计学。Herdan (1960)的一本早期著作,叫做《词次/词型数学》(Type /token Mathematics ),其副标题就是《数理语言学教科书》(A Textbook of Mathematical Linguistics ),当时还是前计算机 时代,但Herdan 觉得有两件语言事实值得我们注意:一是大量语言资料(language in mass ),二是语言排列(language in line ),它们是任何语言运作都不能离开的两个方面。某些语言学研究分支如果考虑到这两个方面,将会从中获益。当时还没有真正的机读语料库, Brown 的语料库在1967年才面世,美国心理 学家John Carroll 根据该语料库以及他后来参与制作500万词的AHI 语料库,所提出的词汇频数对数正态模型(lognormal model )均源于Herdan 所奠定的基础。一直到最近美国Barber 利用计算机对英语语体的各种研究,更是利用了因子分析的统计方法。其次是计算机科学。语料库的发展离不开现代科学技术,其主要表现是个人电脑、扫描仪和大容量硬盘的普及,当初Brown 语料库要动用到大型电脑,而到如今,只需一万元左右就能在家里拥有这些设备,制作出甚至比Brown 还要大的语料库。但是我们往往只注意到硬件部分,而不认识到软件的建设。从事语料库语言学研究的人而不掌握一到两种编成语言,也不可能拓展他们的研究领域,因为他不能根据个人的研究需

(完整版)语言学专业词汇中英文对照版

语言学术语(英-汉对照)表 A abbreviation 缩写词,略语ablative 夺格,离格 accent 重音(符) accusative 宾格 achievement test 成绩测试acoustic phonetics 声学语音学acquisition 习得 acronym 缩略语 action process 动作过程 actor 动作者 address form 称呼形式addressee 受话人 addresser 发话人 adjective 形容词 adjunct 修饰成分附加语 adverb 副词 affix 词缀 affixation词缀附加法 affricate 塞擦音 agreement 一致关系 airstream 气流 alliteration 头韵 allomorph 词/语素变体 allophone 音位变体 allophonic variation 音位变体allophony音位变体现象 alveolar ridge 齿龈 alveolar 齿龈音 ambiguity 歧义 analogical creation 类推造字anapest 抑抑扬格 anaphor 前指替代 anaphoric reference 前指照应animate 有生命的 annotation 注解 antecedent 先行词前在词anthropological linguistics 人类语言学 anticipatory coarticulation 逆化协同发音 antonomasia 换称代类名antonym 反义词 antonymy 反义(关系) appellative 称谓性 applied linguistics 应用语言学applied sociolinguistics 应用社会语言学 appropriacy 适宜性appropriateness 适宜性得体性 approximant 无摩擦延续音 aptitude test 素质测试 Arabic 阿拉伯语 arbitrariness 任意性 argument 中项中词主目 article 冠词 articulation 发音 articulator 发音器官 articulatory phonetics 发音语音学 artificial speech 人工言语 aspect 体 aspirated 吐气送气 assimilation 同化 associative 联想 associative meaning 联想意义 assonance 准压韵半谐音 attributive 属性修饰语定语 auditory phonetics 听觉语音学 authentic input 真实投入 authorial style 权威风格 authoring program 编程 autonomy 自主性 auxiliary 助词 auxiliary verb 助动词 B babbling stage 婴儿语阶段 back-formation 逆构词法 base component 基础部分 behavioural process 行为过程 behaviourism 行为主义 bilabial 双唇音 bilabial nasal 双唇鼻音 bilateral opposition 双边对立 bilingualism 双语现象 binary division 二分法 binary feature 二分特征 binary taxonomy 二分分类学 binding 制约 binding theory 制约论 blade 舌叶舌面前部 blank verse 无韵诗 blending 混成法 borrowing 借用借词 bound morpheme 粘着语素 bounding theory 管辖论 bracketing 括号法 brevity maxim 简洁准则 bridging 架接 broad transcription 宽式音标 broadening 词义扩大 Brown corpus 布朗语料库 C calculability 可计算性 calque 仿造仿造词语 cancellability 可删除 cardinal numeral 基数 cardinal vowel 基本元音 case 格 case grammar格语法 case theory格理论 category 范畴 categorical component 范畴成分 causative 使役的使投动词 center 中心词 central determiner 中心限定词 chain relation 链状关系 chain system 链状系统 choice 选择 choice system 选择系统 circumstance 环境因子 class 词类 class shift 词性变换 clause 小句从句 click 吸气音咂音 clipping 截断法 closed class 封闭类 closed syllable 闭音节 cluster 音丛 coarticulation 协同发音 coda 结尾音节符尾 code 语码信码 cognitive psychology 认知心理学 cognitive system 认知系统 coherence 相关关联 cohension 衔接 co-hyponym 同下义词 colligation 类连结 collocative meaning 搭配意义 color word 色彩词 color word system 色彩词系统 command 指令 common core 共核 common noun 普通名词 communication 交际 communicative competence 交际能 力 communicative dynamism, CD 交际 性动力 communicative language teaching, CLT

中医药术语汉英双语平行语料库的创建和应用 探讨

Modern Linguistics 现代语言学, 2019, 7(2), 207-211 Published Online April 2019 in Hans. https://www.doczj.com/doc/8714597175.html,/journal/ml https://https://www.doczj.com/doc/8714597175.html,/10.12677/ml.2019.72027 Construction and Application of Chinese-English Bilingual Corpus for TCM Terminologies Xiao Ye1*, Ling Tong2 1Humanities and Management College, Zhejiang Chinese Medical University, Hangzhou Zhejiang 2College of Health Science, University of Wisconsin Milwaukee, Milwaukee USA Received: Apr. 1st, 2019; accepted: Apr. 16th, 2019; published: Apr. 23rd, 2019 Abstract In order to solve the problem of the confusion of English translation of terminology of traditional Chinese medicine (TCM) in the world, experts and scholars from several domestic and foreign au-thoritative organizations have tried to establish an international unified standard for it. However, due to the complexity of the English translation of TCM terminology, plus factors such as the history, economy, culture, and national discourse rights, many domestic and international standards for TCM terms have not been widely promoted and uniformly recognized in the world, resulting in ob-stacles of international exchanges. Under this circumstance, the author believes that by collecting and arranging various versions of TCM terminology translation standards at home and abroad, and applying corpus technology, the function of looking up multiple English versions of TCM terms can be achieved by one click. It can not only largely solve the problem of communication, but also make people understand more about the various meanings of the TCM terms and the situation in multiple versions of English translation. This article is to give some introductions and useful endeavors on the establishment and application of the Chinese-English bilingual corpus of TCM terminologies, hoping to contribute to TCM’s international exchanges and “One Belt One Road” services. Keywords Traditional Chinese Medicine (TCM), Terminology, English Translation, Corpus 中医药术语汉英双语平行语料库的创建和应用探讨 叶晓1*,童凌2 *通讯作者。

语言学常用术语

语言学常用术语

A List of Commonly-used Linguistic Terminology 语言学常用术语表 Part I General Terms 通用术语 Acquisition 习得 Agglutinative language 粘着语Anthropology 人类学 Applied linguistics 应用语言学Arbitrariness 任意性 Artificial intelligence (AI)人工智能Behaviorism 行为主义Behaviorist psychology 行为主义心理学 Bilingualism 双语现象 Cognition 认知 Cognitive linguistics 认知语言学Cognitive science 认知科学Comparative linguistics 比较语言学Computational linguistics 计算语言学 Corpus-linguistics 语料库语言学Creole 克里奥耳语;混合语 Culture 文化 Descriptive linguistics 描写语言学Design features 识别特征Developmental psycholinguistics 发展心理语言学 Diachronic/historical linguistics历时语言学 Dialect 方言 Dialectology 方言学 Displacement 不受时空限制的特性Dualism 二元论 Duality 二重性 Epistemology认识论 Etymology 辞源学 Experimental psycholinguistics 实验心理语言学 Formalization 形式化 Formal linguistics 形式语言学Forensic linguistics 法律语言学Functionalism 功能主义General linguistics 普通语言学Grammaticality 符合语法性Ideography 表意法 Inflectional language 屈折语 Inter-disciplinary 交叉性学科的Isolating language 孤立语 Langue 语言 Macro-sociolinguistics 宏观社会语言学 Mentalism 心智主义 Micro-sociolinguistics 微观社会语言学 Montague grammar蒙太古语法Neuro-linguistics 神经语言学Orthography 正字法 Orthoepic 正音法的 Paradigmatic 聚合关系 Parole 言语 Pedagogy 教育学;教授法Philology 语文学 Philosophy 哲学 Phonography 表音法 Pidgin 皮钦语;洋泾浜语Polysynthetic language 多式综合语Prescriptive linguistics 规定语言学Psycholinguistics心理语言学Psychology 心理学 Semeiology 符号学 Sociology 社会学 Speech 言语 Sociolinguistics社会语言学Structuralism 结构主义 Synchronic linguistics 共时语言学Syntagmatic 组合关系 Theoretic linguistics 理论语言学Universal grammar 普遍语法Universality 普遍性 Part II Phonology 音位学 Ablaut 元音变化 Acoustic phonetics 声学语音学Affricate 塞擦音 Allophone 音位变体

基于学习者英语语料的类联接研究概念、方法及例析

第127期2009年05月 外语电化教学 CAFLEC No.127 May2009 基于学习者英语语料的类联接研究 概念、方法及例析 许家金,熊文新 (北京外国语大学中国外语教育研究中心,北京100089) 摘要:本文主张类联接研究应兼顾词形、语法类别以及篇章和语类等不同语言层面来观察搭配行为。具体可包含:单个语法范畴的类联接、语法串分析、词形与语法范畴的类联接、不连续结构类联接、语法范畴与话语、语体的类联接等。本文结合中国英语学习者语料进行了示例分析,旨在说明可以结合类联接开展中间语对比分析、语体分析等。 关键词:类联接;学习者语料库;语料库语言学;研究方法;类联接分析器 中图分类号:H319.3文献标识码:A文章编号:1001-5795(2009)03-0018-0006 搭配(或称共现关系)是语料库语言学的核心概念之一。目前的搭配研究已不单限于词汇间的共现关系,很多学者试图借助语料库语言学的方法观察语法及其他语言相关层面的共现现象,其中以Hoey的“词汇触发”(1exiealpriming)理论涵盖层面最宽泛。Hoey将词汇间的共现关系扩展到词汇与其在篇章中的出现位置以及在不同文体中的分布等十个层面(2005:13)。事实上,对于搭配范围的不同处理,体现了不同的语境观,即对共现语境范围的不同认识。本文将基于赋码语料探讨如何兼顾词形和语法类别,以及篇章和语类等不同层面来观察搭配问题。本文示例所用语料主要为中国英语学习者英语。 1类联接及其扩展 1.1类联接 “类联接”(eolligation,又译作“类联结”或“类连接”)即语法层面的搭配关系。该术语由Firth(1957[1968]:181)提出,他将1watchedhim背后体现的“第一人称代词+动词过去时+第三人称代词”语法类别共现关系称为类联接。这一术语中的“类”即词类或语法类别之意。换言之,类联接就是有关词类或语法类别的共现关系。而新近的一些文献,如Baker,Hat-die&McEnery(2006:36)的《语料库语言学术语汇编》里对colligation这一词条的解释除了原有的句法共现关系外,还专门以window为例,说明window常和介词构成类联接。 目前的类联接研究很大程度得益于一些优良的自动词性赋码工具(如CLAWS,准确率高达96—7%)(Garside&Smith,1997)。因此通过赋码语料研究词类或语法类别的共现关系成为可能。相关研究大致分三类。一、有关赋码串(tagsequences或POSgrams)和语法搭配的总体分析(如,Aarts&Granger,1998;Tono,1999;Hunston&Francis,2000;濮建忠,2003b);二、针对某一词类的总体研究,通常以对动词的考察为主(如,Francis,Hunston&Manning,1996,1998;Mindt,1995,2002;濮建忠,2003a;孙海燕,2004;孙海燕,陈永捷,2006);三、还有一些专题研究。如Biber&Reppen(1998)关于补语从句,Gabrielatos(2007)关于if条件句的类联接,张军、李文中(2004)关于动名搭配,以及梁茂成(2008)有关情态序列的研究等。 作者简介:许家金:男,博士、副教授。研究方向:话语分析、语料库语言学。 熊文新:男,博士、副教授。研究方向:计算语言学。 收稿日期:2008-12-25 基金项目:本研究得到教育部人文社会科学研究项目(08JC740002)资助;本文的撰写还得到梁茂成教授的指导,在此一并致谢。?18?  万方数据

国家标准《建立术语研究用语料库的一般原则与方法》.

国家标准《建立术语研究用语料库的一般原则与方法》 (征求意见稿)编制说明 一、任务来源 随着科学技术的发展,新术语、新概念层出不穷,为了更好的管理、规范日益增多的新术语,需要借助更先进的工具及方法。目前国内外已经建立了大量的术语数据库,为了更好的对大量术语资源进行研究就需要建立术语语料库,大规模真实语料库是术语研究的可靠基础和最主要的来源,建设与术语库相配合的、统一规范的精加工术语语料库,可以使我们对中文术语构成、术语专业分布、术语地域分布、术语来源以及术语发展等各种复杂现象获得更为直观、深刻的全面认识,进而为推动中文术语规范化和标准化的进程、促进语言信息处理技术的总体发展起到关键的作用。因此制定建立术语语料库的标准已经十分必要。 GB/T XXXX-XXXX《建立术语研究用语料库的一般原则与方法》项目由中国标准研究中心提出,于2002年列入国家质量监督检验检疫总局制、修订国家标准项目计划,项目编号:20020411-T-424。该标准由中国标准研究中心归口,计划于2002年底完成。 二、工作情况: 1、标准起草小组的同志积极参与对《建立术语研究用语料库的一般原则与方 法》国家标准的制定工作,在工作中深入的研究了术语语料库的功能,吸取国内外先进经验,制定出一套实用的术语语料库建立标准。 2、进行了广泛的调研工作,搜集了使用者的一些建议,同时争求了一部分专 家的意见,作为本项目的重要参考。 3、在制定标准过程中,标准起草工作组根据实际情况制定工作计划,保证工 作顺利进行。 4、标准起草工作组多次召开会议,反复研究了《建立术语研究用语料库的一 般原则与方法》讨论稿,广泛征求了该专业领域的专家及用户的意见,对

语言学专业词汇中英文对照版

语言学术语(英-汉对照)表Aabbreviation缩写词,略语ablative夺格,离格 accent重音(符) accusative宾格 achievement test成绩测试 acquisition习得 acronym缩略语 action process动作过程 actor动作者 address form称呼形式 addressee受话人 addresser发话人 adjective形容词 adjunct修饰成分附加语 adverb副词 affix词缀 affixation词缀附加法 affricate塞擦音 agreement一致关系 airstream气流

alliteration头韵 allomorph词/语素变体 allophone音位变体 allophonic variation音位变体 allophony音位变体现象 alveolar ridge齿龈 alveolar齿龈音 ambiguity歧义 analogical creation类推造字 anapest抑抑扬格 anaphor前指替代 anaphoric reference前指照应 animate有生命的 annotation注解 antecedent先行词前在词 anthropologicallinguistics人类语言学anticipatorycoarticulation逆化协同发音 antonomasia换称代类名 antonym反义词 antonymy反义(关系) appellative称谓性

applied linguistics应用语言学appliedsociolinguistics应用社会语 言学 appropriacy适宜性appropriateness适宜性得体性approximant无摩擦延续音 aptitude test素质测试 Arabic阿拉伯语 arbitrariness任意性 argument中项中词主目 article冠词 articulation发音 articulator发音器官 artificial speech人工言语 aspect体 aspirated吐气送气 assimilation同化 associative联想 associative meaning联想意义 assonance准压韵半谐音 attributive属性修饰语定语 authentic input真实投入

语言学专业术语

语言学专业术语 语言学及应用语言学陈倩雯李学娇徐玮琳殷彦明邓利洁 acquisition习得 Active articulator 积极发音器官 Affixation(词缀) Allophones音位变体 Alphabet 字母 anthropological linguistics人类语言学 Antonymy(反义关系) applied linguistics应用语言学 applied sociolinguistics应用社会语言学 Aspect体 associative联想 Bilingual corpus 双语语料库 Bound Morphemes (粘着词素) Broad transcription 宽式标音 Case-格 category范畴 Category-范畴 Clause-小句\从句 Clean text policy 干净文本原则

Cluster 词簇、词丛 Colligation 类联接、类连接、类联结Collocate n./v. 搭配词;搭配 Collocation 搭配、词语搭配Cognitivegrammars-认知语法 Collocation(搭配) Compound vowel 韵母 compounding(复合) computational linguistics计算语言学concept概念 Consonant 辅音 Construction-句子结构 contextual analyses语境分析 context语境 contrastive analysis对比分析 Conversion(转换) Corpus Linguistics 语料库语言学 Corpus 语料库 Comparable corpora 类比语料库、可比语料库corpus linguistics语料库语言学 derivation(派生) Derivational affixes (派生词缀)

相关主题
文本预览
相关文档 最新文档