语言测试的发展历史
- 格式:doc
- 大小:44.00 KB
- 文档页数:5
语言测试的发展历史语言测试的发展历史测试的起源测试是人类社会发展的结果,是人们为了适应社会发展的需求而设计的,并逐渐发展起来的。
人类在劳动的过程中,感到有必要确定物体的属性,例如数量、大小、重量之类的物理属性,于是就产生了测量,并研究用测量的方法来了解这些属性。
随着人类文明的发展,测量的范围越来越广,测量的工具越来越多,测量的方法也越来越多。
测量的对象逐渐从物扩大到人,从对人的形体测量扩大到对人其他方面的测量,例如对人的能力和知识的测量。
对人的知识和能力的测量,始于原始社会后期。
当时,生产水平日益提高,氏族、部落之间的交往增多,冲突也逐渐加剧。
为了维持氏族、部落的生存和发展,要向年轻一代传授生产技能、军事技术、宗教知识,于是产生了教育。
为了检验教育的成果,开始用骑马、射箭、搏斗等演示活动来考察技艺。
青少年一般要经过严格的考核之后才能被承认是氏族、部落的正式成员。
后来,随着生产力水平的提高,社会出现了阶级,社会分工更明确了,教育逐渐从生产、劳动中分化出来,出现了专门从事教育的人和专门从事教育的机构,也就是说,出现了教育和学校。
随着教育的发展,测量受教育者的方法日趋完善。
人们在教学过程中不仅把测量作为一种手段,而且开始研究教育测量(educational measurement),因此出现了教育测量学。
世界各国的考试制度(一)、中国是测试的故乡中国是考试的故乡。
就出现大规模的、严格管理考试而言,中国早于西方各国。
我国的考试制度在奴隶社会末期就初步形成了。
《礼记》比较详细地介绍了秦汉以前贵族的教育制度、教学内容和教学方法;同时显示出,在西周的时候就有定期考查学生作业的考试制度,而且当时的“国学”中的大学,每隔一年必须考一次。
考试制度到了封建社会得到进一步发展、运用。
据记载,早在公元前165年的时候,汉献帝就使用正式的考试来选官职候选人。
到了隋朝,这一做法发展成为系统的科举制度。
唐代继续实行科举制度。
那时,科举大体可分为两类:一类是常科,有秀才、明经、进士、明书、明法、明算等基本科目,每年定期举行;另一类是制举,由皇帝根据需要临时下令举行。
普通话水平测试的历史和发展随着中国的经济崛起和国际地位的提高,普通话的地位和影响力也日益增强。
因此,对于普通话的准确度和流利程度的要求也越来越高。
普通话水平测试应运而生。
本文将探讨普通话水平测试的历史和发展。
一、普通话水平测试的起源普通话作为中国的官方语言,在不同地区有着不同的方言和口音。
为了提升全国范围内的通用性和统一性,需要对普通话的准确性进行评估,从而形成普通话水平测试的需求。
从上世纪50年代开始,中国开始积极推广普通话并进行相关的水平测试。
二、普通话水平测试的发展历程1. 早期测试形式早期的普通话水平测试主要采用面试和口语测试的方式。
测试者通过提问和听取被测试者的口语表达,来评估其普通话水平。
这种形式虽然能够初步了解被测试者的口语交流能力,但存在主观性较大,评判依据不够客观的问题。
2. 规范化发展为了提高测试的客观性和准确性,普通话水平测试逐渐转向规范化。
在上世纪80年代,中国国家语言文字工作委员会开始制定普通话水平测试标准,并建立了相应的考试系统。
这项规范有力地推动了普通话水平测试的发展。
3. 创新技术的应用随着科技的进步,普通话水平测试也开始使用创新技术。
例如,语音识别技术的引入,使得测试过程更加方便快捷,并且减少了人为评判的主观性。
另外,网络技术的应用也使得远程测试成为可能,不再受限于地理位置。
三、普通话水平测试的重要性和影响1. 维护语言统一中国作为一个多民族国家,语言统一对于国家统一和人民团结至关重要。
普通话水平测试可以帮助人们提高普通话的准确性和流利程度,进而增加各地区交流的便利性和效果。
2. 推进国家发展普通话作为中国的官方语言,对于国家发展有着重要的推动作用。
普通话水平测试可以帮助培养人才,提高人们的普通话沟通能力,促进国家的经济、教育、文化等各个领域的进步。
3. 国际交流与合作随着中国在国际舞台上的影响力不断提升,普通话在国际交流和合作中的作用也越来越重要。
普通话水平测试可以帮助外国人提高普通话能力,促进国际间的有效对话和合作。
雷妮氏语言发展量表雷妮氏语言发展量表(Reynell Developmental Language Scales,RDSL)是一种用于评估3岁到7岁儿童语言发展的标准化测试工具。
本篇文章将分步骤阐述雷妮氏语言发展量表的发展和使用方法。
一、发展历程:雷妮氏语言发展量表是由英国语言学家Reynell于1969年开发的,原设计目的是针对那些语言落后于同龄人的儿童进行测评。
后来该量表得以得到更新和拓展,现在的版本是RDSL-4,覆盖了3岁到7岁儿童的语言水平。
二、测试内容:雷妮氏语言发展量表包括两部分:语言表达和语言理解。
语言表达部分包括“句子复述”“习语”“描述”“对话”等项目,主要评估儿童的口头表达能力。
语言理解部分包括“词汇”、“句子理解”、“单词句子组合”等项目,主要评估儿童的语言理解能力。
其中的每个项目评估的内容都涉及到语音、词汇、句子构建等方面。
测试时,评估者根据儿童的表现在量表上打分,最终得出儿童的语言发展水平得分。
三、测试适用性:雷妮氏语言发展量表是广泛用于医学临床、教育科研等领域的量表,适用于有语言障碍、听力障碍、言语困难等问题的儿童。
同时,该量表对于不同语言文化背景的儿童也都具备较好的适用性。
四、使用方法:使用雷妮氏语言发展量表需要具备专业的评估人员和评估场地。
评估人员需要接受过相应的培训和考试,熟悉量表使用方法和评估标准。
评估场地应该保持安静和私密,儿童应该被告知评估的过程,以免引起紧张情绪影响结果。
在测试中,评估者将量表项目一一呈现给儿童,观察和听取儿童的表现,根据量表上的评估标准,对儿童进行记录和打分。
总体来说,雷妮氏语言发展量表是一种简单易用、适用性广泛的评估工具,在评估儿童语言发展问题时具有较高的可靠性和重复性。
对于家长和教育工作者来说,了解和掌握该量表的使用方法和阅读结果的能力,对于帮助儿童克服语言困难,促进语言发展具有重要作用。
backman的交际语言能力模式包括一、前言国外学者对交际语言测试的研究有近三十年的历史,而国内的起步研究要晚得多。
目前,语言测试一斤逐步发展成为语言学的一门重要分支学科,并且交际英语测试的理论研究还处在不断发展之中。
随着交际教学法的发展,语言测试理论也受到了交际教学法思想的影响,认为语言测试所要衡量的也必须是考生的语言交际能力,于是产生了以语言交际能力学说为基础的交际语言测试。
二、语言测试的四个发展阶段和三个理论模式语言测试大致经历了以下四个变化时期:1.前科学时期;2.心理测量——结构主义时期;3.心理语言学和社会语言学时期;4.交际法语言测试时期。
三种语言测试模式,即:心理测量——结构主义模式、心理语言学——社会语言学模式、交际语言测试模式。
三、交际语言测试的理论模式交际语言测试理论的核心是交际能力的学说,这一学说是在20实际70年代初由美国的人类学教授、社会语言学家德尔·海姆斯首先提出的。
在80年代初经过加拿大学者卡纳尔和斯温的补充,在80年代末,90年代初又由美国学者巴克曼作了进一步发展。
(一)海姆斯的交际能力学说交际能力学说是由美国的社会语言学家德尔·海姆斯在他1972年发表的《论交际能力》一文中首先提出的,海姆斯创造“交际能力”这一术语是针对另一著名美国语言学家乔姆斯基的语言能力而言的。
海姆斯提出一个人的语言能力不仅包括乔姆斯基提出的能否造出合乎语法句子的语言能力,而且还包括他能否恰当地使用语言的能力,即:语言运用能力。
由此他首次提出了包含“语言能力”和“语言运用”两个方面的交际能力。
海姆斯把交际能力归纳为四个方面:1.能辨别、组织合乎语法的句子;2.能在恰当的语言环境中使用适当的语言;3.能判断哪些语言形式可以接受,哪些不可以接受;4.能知道出现的语言形式:是常用的习惯,还是罕见的个人用语。
简而言之就是语法的正确性、语言的接受性、语言的得体性和语言的可行性。
海姆斯的交际能力学说为日后交际语言教学的蓬勃发展奠定了必要的理论基础。
国内英语语言测试研究综述1 引言在过去的三十年里,国人学习英语的热情不断高涨,国内学者的相关研究也应运而生,起步虽晚,发展较快。
为了让研究者了解我国英语语言测试的历史、发展现状和未来的发展趋势,从而深入国内的测试研究,笔者对过去三十年核心期刊上的相关研究加以综述。
2 研究综述2.1 文献检索范围及基本趋势笔者以语言测试作为关键词和篇名在CNKI中国期刊网全文数据库(范围限核心期刊及CSCI)上联合检索,从过去30年(1984-2013)所发表的论文中筛选出共291篇相关论文。
基本情况如下表所示:英语语言测试的研究始于80年代中期,初期的成果较少,从84到93这十年中共有19篇论文,占研究总数的6.5%。
94-98年情况略为发生改变,论文数量占论文总数的8.2%,说明此类研究逐渐为学界重视。
从99年以来,研究者热情高涨,论文发表的数量突然大幅攀升,5年内年平均发表超过12篇,此后的研究依旧如火如荼,从04年开始,该研究数量稳步上升,年平均量接近20篇。
由此可见,国内学者越来越重视英语语言测试,中国的研究也步入了系统的、稳定的、科学化研究英语语言测试的阶段。
2.2研究内容第一类,英语语言测试理论的阐释介绍。
从80年代中后期,国内学界开始关注英语语言测试,出现了介绍美国和英国的语言测试研究的综述型文章,引领国内语言测试走向科学化专业化(如桂诗春1989)。
韩宝成,(1995;2006)介绍了Bachman的交际语言能力测试模式,分析了语言能力和如何对其进行测量,并讨论语言测试研究与发展趋势,分析了国外有影响的几个语言能力量表(标准),建议研制我国统一的学生英语能力标准。
有学者介绍了经典测试理论和项目反应理论这两大语言测试理论的主要内容和数学模型。
杨惠中等(2011)进行了较大规模的实证研究检验制定语言能力等级量表的原则和方法的科学性与可行性。
第二类,测试回顾、改革、问题与发展趋势。
有学者(如杨满珍2002)回顾和分析了国内外语言测试的研究成果,给学界以启发。
语言测试的发展历史一、测试的起源测试是人类社会发展的结果,是人们为了适应社会发展的需求而设计的,并逐渐发展起来的。
人类在劳动的过程中,感到有必要确定物体的属性,例如数量、大小、重量之类的物理属性,于是就产生了测量,并研究用测量的方法来了解这些属性。
随着人类文明的发展,测量的范围越来越广,测量的工具越来越多,测量的方法也越来越多。
测量的对象逐渐从物扩大到人,从对人的形体测量扩大到对人其他方面的测量,例如对人的能力和知识的测量。
对人的知识和能力的测量,始于原始社会后期。
当时,生产水平日益提高,氏族、部落之间的交往增多,冲突也逐渐加剧。
为了维持氏族、部落的生存和发展,要向年轻一代传授生产技能、军事技术、宗教知识,于是产生了教育。
为了检验教育的成果,开始用骑马、射箭、搏斗等演示活动来考察技艺。
青少年一般要经过严格的考核之后才能被承认是氏族、部落的正式成员。
后来,随着生产力水平的提高,社会出现了阶级,社会分工更明确了,教育逐渐从生产、劳动中分化出来,出现了专门从事教育的人和专门从事教育的机构,也就是说,出现了教育和学校。
随着教育的发展,测量受教育者的方法日趋完善。
人们在教学过程中不仅把测量作为一种手段,而且开始研究教育测量(educational measurement),因此出现了教育测量学。
二、世界各国的考试制度(一)、中国是测试的故乡中国是考试的故乡。
就出现大规模的、严格管理考试而言,中国早于西方各国。
我国的考试制度在奴隶社会末期就初步形成了。
《礼记》比较详细地介绍了秦汉以前贵族的教育制度、教学内容和教学方法;同时显示出,在西周的时候就有定期考查学生作业的考试制度,而且当时的“国学”中的大学,每隔一年必须考一次。
考试制度到了封建社会得到进一步发展、运用。
据记载,早在公元前165年的时候,汉献帝就使用正式的考试来选官职候选人。
到了隋朝,这一做法发展成为系统的科举制度。
唐代继续实行科举制度。
那时,科举大体可分为两类:一类是常科,有秀才、明经、进士、明书、明法、明算等基本科目,每年定期举行;另一类是制举,由皇帝根据需要临时下令举行。
宋代科举的办法,大体上用的是唐代的老办法。
明代做了一些变更,其中最为突出的是宪宗成化年间(1465----1487)开始盛行所谓的“八股文”。
这种特殊文体,对于明清两朝的教育和文风都有重大影响。
科举考试的方法,同现代的考试有相似之处。
例如,题型之一是贴经,这种题型多少有点像今天的填空题。
所谓贴经,就是从经书中任揭一页,留出一行,其余的文字都盖起来。
留出的一行,要用纸贴盖三个字。
考生得把这三个字说出来,或者写出来。
又如,考试常常用策问。
策问就当时的政治、经济、军事、生产等方面的问题提问,要考生书面答题,阐述自己的意见。
与今天的政治课的问题颇有类似之处。
中国的科举考试不仅有笔试,还有口试。
例如,唐代有一种考试方法,称为口义,要应考者口述经义。
《新唐书•选举志上》有这样的记载:“凡明经,先贴文,然后口试经文大义十条……元和二年……明经停口义,复试墨义十条。
”“口义”是口试经义;“墨义”是将所答内容,录于纸上,“直书其义,不假文言”。
封建帝王用科举考试来选拔官员,具有一定的积极的意义。
首先,科举制度有利于加强中央集权权制,把选择官员的权利从世家大族手里夺过来。
其次,科举制度可以确保封建帝王根据考试成绩广泛地从下层吸收、选拔人才。
这种做法,不仅可以提高官员的文化素质,还调动了知识阶层,特别是中小地主阶层子弟的学习积极性。
历代以科举入仕的人,有才识的人不少。
可以说,我们的祖先很早就认识到了考试的重大作用,为我们积累了丰富的经验。
当代中国的考试,继承了中国古代考试的一些优良传统,也从国外吸收了大量科学的理论和有用的经验。
以学校考试为例,教育的发展大大促进了学校考试的改革和发展。
教育工作者逐步懂得,考试要为社会服务,要遵循教学的客观规律;考试的目标、内容、方法标准等的确定,都要有利于受教育者的身心发展,有利于社会的发展。
现代的学校考试,与旧社会的那一套已完全不同了。
首先,内容发生了重大变化。
不再局限于古代圣贤说教和文学、政治经典,而是现代社会科学、自然科学的各个方面;不再局限于记忆和背诵,比较注重理解和应用。
其次,教育方法有重大改进。
20世纪70年代以来,我国英语考试的改革走在其他学科的改革之前。
我国英语界最早引进多项选择题技巧(multiple choice technique),后来又率先采用完形填空技巧(close technique),为题型的改革做了有益的尝试。
1981年,在当时高教部的领导下,我国第一个标准化考试(简称EPT,即English Proficiency Test)诞生,在此基础上,又推出了MET (Matriculation English Test)、CET(College English Test)等颇具影响的英语标准化考试。
另外,英语界最早使用光电阅读器阅卷,最早在像高考这样大型考试中应用教育统计学的理论指导实践。
(二)、西方的考试制度西方国家建立国家考试制度,比中国晚的多。
据史料记载,到19世纪,西方才有比较完备的考试制度(或称考绩制度),政府根据竞争性的考试以及对业绩的客观评价来选拔官员。
最早建立这种制度的是普鲁士和英国。
1883年,美感正式用考试来选拔官员,用所谓的量才录用制取代原来的政党分摊制。
现在,除了欧洲、北美各国,很多国家实行国家公务员任职考试制度。
例如日本就有比较完善的公务员制度。
根据日本《国家公务员法》的规定,要做公务员就得参加考试。
考试分为初、中、高三个等级。
三个等级中,参加高、中级考试的人必须具备大学学历。
很多国家非常重视中学统考和高等院校入学考试,把这一类考试看作是选拔人才的重要手段。
以美国为例,1959年,衣阿华州衣阿华市一个名为美国大学院校测验规则处(American College Testing Program,缩写为ACTP)的机构推出一种标准化考试系列,取名为美国大专院校测试(Academic College Test ,缩写为ACT)。
测试分为课程测试,包括英语、数学、社会知识、自然科学四个认知领域;兴趣发明测试,包括六个方面、两大类。
ACTP负责命题、制卷、阅卷等各项有关测试的工作,提供成绩报告,另外还提供学生简况(ACT Student Profile)。
现在,很多中学把ACT作为高中结业或毕业考试,很多高等学校把ACT分数作为录取新生的主要依据。
又如,美感的学习能力测试(SAT 即Scholastic Aptitude Test )也是一种被当做高等学校入学考试的著名的标准化考试。
考试这种测试形式不会因为朝代的变更或社会制度的变革而失去作用。
随着社会的不断进步,考试越来越广泛地被人们接受,测试的方式方法也会越来越科学,而研究测试的重要性也会越来越明显。
三、语言测试的发展语言测试是语言教学过程中一个重要环节,是教学大纲中教学要求的具体体现,对教和学双方都起着直观的指导作用并产生在重大的影响。
关于现代语言测试理论和实践的分期,不同的人有不同的分法。
我们这里采用以色列著名应用语言学家伯纳德•斯波基斯(Bemard Spolsky)的观点,把整个语言测试和测试理论分为三个时期:前学科时期或传统(traditional)时期、心理测量――结构主义(psychometric—structuralist)时期或现代(modem)时期、心理语言学――社会语言学(psycholinguistic—sociolingguistic)时期或后(postmodern)时期。
语音测试是随着教学而出现的,教学和测试有着密切的关系,要了解测试的历史,必须了解教学的历史。
教学理论决定着测试的理论、方法和实践,而测试的理论、方法和实践则反映着教学了理论。
(一)、前科学语言测试或传统语言测试阶段语法翻译法目前人们把20世纪40年代以前的语言测试统称为前科学语言测试(The prescientific language testing)。
语言学家斯波尔斯基(1995)称这一时期为语言测试前科学时期。
纵观语言教学的历史,特别是欧美语言教学的历史,我们就会发现,在大约四百年前,欧洲的语言教学,尤其是外语教学,形成了一套完整的教学理论。
当时,主导语言教学领域的是语法翻译法。
这是同当时人们对语言的认识是分不开的。
当时主导欧洲的理论是“功能心理学”。
人们认为拉丁语是最合乎逻辑的语言,它的语法可以用来训练人的思维。
再加上当时的文艺复兴运动,鼓励人们去重新重视、挖掘古希腊、古罗马的文化财富,对古典文献给以了特别关注。
这种现象反映在外语教学领域,就是人们在学习语言的过程中把古典文献作为学习的材料。
与此同时,人们认为各种语言之间并没有实质上的差异,不同语言的词汇表达的概念完全相同,因而外语学习也就是一个翻译古典材料、学习语法的过程。
因此,我们可以说语法翻译法强调的是知识的传授。
它侧重在系统地讲解语言知识,练习形式主要有背诵、听写、造句、回答问题、翻译等;强调死记硬背,语言训练是单技能的,脱离上下文语境的;使用的材料以语码为纲。
在此基础上产生的语言测试也就考察学习者对这三方面知识的掌握情况。
题型“语法翻译法”的教学中心是知识的传授,它的测试方式就有“死”和“活”的两大类。
较“死”的题型有:标音、拼写、听写、配对、语法填空、单词释义,给出同义词、反义词或派生词,朗读、背诵、词法变位、完成句子、变换句式、词类辨义、句法分析、条件翻译、复述段文等。
这些较“死”的题型大部分要求“记”的功夫,测试的目的是语言的形式、规则以及汉外对译等。
较“活”的题型有:造句、改写、答问、翻译、作文、口头作文等。
总的说来,该阶段的语言教学和测试完全以教师和命题人员的经验和主观判断来确定,以孤立的语言点为主,基本谈不上有什么科学依据。
考试的形式大都是分析句子(parsing sentence)、翻译(translating prose)和写作(writing essays)。
这种考试对完成当时的教学大纲,提高学生的语法分析、翻译和写作能力都发挥了应有的作用,是语言测试史上一个重要的阶段。
局限性语法翻译法对语言教学的影响一直持续到20世纪40年代。
在这个时期,语言教师对于什么是语言这个最基本的问题,没有科学的认识,只是把语言当作一门包括语法、词法、语音的知识体系去教。
所以这种考试从命题到评分大都主观性很强,题目覆盖的知识面狭窄,容量较小,还常带有命题者的偏见,因此有明显的片面性,所以就不能够很客观全面地衡量学生的语言知识和技能。
评分中有很多方面的问题,如用词、造句、篇章结构以及思想内容等缺乏科学准确的尺度来衡量,要靠阅卷人的主观判断,加之阅卷人的水平、好恶和偏见的差异,都会严重影响分数的高低。