计算机在语言测试中的应用
- 格式:pdf
- 大小:114.35 KB
- 文档页数:4
LabVIEW在自动化测试中的应用与优势自动化测试是现代化测试领域的重要组成部分,它通过利用计算机或其他智能设备来执行测试任务,以替代传统的手动测试。
LabVIEW (Laboratory Virtual Instrument Engineering Workbench)是一种广泛应用于工程和科学领域的编程语言和开发环境,其强大的功能和应用广泛性使其在自动化测试中有着广泛的应用和明显的优势。
一. LabVIEW在自动化测试中的应用1. 控制系统测试:LabVIEW可以轻松与各种外部仪器和设备进行通信,实现对系统的监控、控制和测试。
通过其直观的图形化界面,测试人员可以方便地设置测试参数,执行测试任务,并即时获取和分析测试数据,从而实现对控制系统的全面评估和调整。
2. 产品质量测试:LabVIEW提供了一套完整的测试工具和功能,可以对产品的功能、性能和稳定性进行全面的测试。
测试人员可以根据产品测试要求,自主开发相应的测试模块和测试仪器,通过图形化界面进行配置和控制,大大提高了测试效率和可靠性。
3. 数据采集和分析:LabVIEW具备强大的数据采集和分析功能,可以通过与各类传感器和数据采集设备的连接,实现对实验数据的高效采集和处理。
同时,LabVIEW还提供了丰富的数据分析和可视化工具,方便测试人员对采集的数据进行多维度的分析和展示,从而更好地理解和评估系统性能。
4. 自动化程度高:LabVIEW是一种图形化编程语言,具有易学易用的特点。
测试人员可以通过拖拽和连接图形化的程序块来完成测试任务,无需编写繁琐的代码。
这大大降低了测试人员的门槛,提高了测试的自动化程度。
二. LabVIEW在自动化测试中的优势1. 灵活性和可扩展性:LabVIEW具备模块化和可扩展的特点,可以根据测试需求自由组合和调整测试模块和功能。
无论是对现有测试系统的升级,还是对新的测试需求的适应,LabVIEW都能够提供灵活、可靠的解决方案。
从计算机辅助语言教学视角探析标准分在英语测试与评价中的应用摘要:传统的测试与评价方法中数据的计算过于简单难以对学生学习成绩形成正确的评价。
该文从计算机辅助语言教学视角以建构主义理论和标准分为依据,结合教学中的实例说明原始分制度的弊端和标准分的比较优势,进而探讨标准分在英语测试与评价中的运用。
关键词:计算机辅助语言教学;结构主义理论;标准分;英语测试与评价中图分类号:g42 文献标识码:a 文章编号:1009-0118(2011)-05-00-02英语测试与评价是英语教学的重要组成部分,科学、客观、系统的测试与评价能够服务于学生,服务于家长。
同时,英语测试与评价是英语教学之间既相互促进又相互制约,一方面,英语教学从性质、目标、内容等方面制约着英语测试与评价;另一方面,英语测试与评价又在性质、目标、内容上对英语教学起着重要的反馈作用。
因此,教师应树立科学、客观、公正的评价理念,充分利用现代信息技术采取相应策略提高英语测试与评价的有效性。
然而在传统的实际教学中,评价方式过于简单,存在许多不合理的亟待解决的问题。
其中,依据原始分高低进行排名的方法难以激发学生英语学习的积极性、主动性,不利于培养全面发展的英语语言学习者。
一、教育部《大学英语课程教学要求》中关于教学性质和目标的阐述在我国高等教育发展的新形势和全国大学英语教学改革的大形式下,教育部《大学英语课程教学要求》中关于大学英语教学的性质阐述为:“大学英语是以英语语言知识与应用技能、学习策略和跨文化交际为主要内容,以外语教学理论为指导,并集多种教学模式和教学手段为一体的教学体系。
”这就阐明了大学英语测试与评价作为教学体系之一,应要能够促进学习者的哪些方面。
同时,该要求还指出:“大学英语的教学目标是培养学生英语综合应用能力,特别是听说能力,使他们在今后工作和社会交往中能用英语有效地进行口头和书面的信息交流,同时增强其自主学习能力、提高综合文化素养,以提高我国经济发展和国际交流的需要。
图灵测试在计算机科学中的应用随着计算机科学的不断发展,人工智能逐渐成为了一个备受关注的话题。
而图灵测试,则是衡量人工智能智能程度的一种方法。
在本篇文章中,我们将会探讨图灵测试在计算机科学中的应用以及其对人工智能的发展造成的影响。
什么是图灵测试?图灵测试是由英国数学家艾伦·图灵于1950年提出的,用于衡量人工智能是否能够逼近人类的思维水平。
该测试的基本理念是,人工智能是否具备意识和思维能力,在于它是否能够进行人类式的对话,并且在这个过程中表现出类似于人类的思考方式和智力水平。
具体而言,图灵测试由一名评判员、一名机器和一名人进行测试。
评判员通过一个终端和这两个对象进行通讯,而不知道它们的真实身份。
如果评判员无法通过对话区分出哪一个是机器,哪一个是人,那么这个机器就被认为“通过了”图灵测试。
围绕图灵测试的观点和理念,一系列的研究及应用也随之展开。
下面,我们就介绍一些图灵测试相关的领域和应用。
人工智能在人工智能领域,图灵测试被广泛应用于检验计算机是否具备智能。
若计算机能够通过图灵测试,将意味着人工智能已经可以真正地逼近人类的智力水平了。
人机交互人机交互是计算机科学和人类学的交叉学科,主要研究人与计算机如何进行有效的互动。
在这个方面,图灵测试有着很大的应用价值。
通过进行图灵测试,可以检验计算机的对话系统是否可以有效地响应人类的语言要求。
机器翻译机器翻译是指通过计算机程序将一种自然语言翻译成另一种自然语言的过程。
在机器翻译研究中,图灵测试也被广泛应用,用于检验机器翻译是否具备“流利”的语言表达能力,以及是否能够推测人类的意图。
大数据分析随着大数据技术的发展,越来越多的数据需要进行处理和分析。
而在这个过程中,图灵测试也可以起到一定的作用。
通过对图灵测试的分析和建模,可以对大数据分析的效果进行评价和改进。
图灵测试对人工智能的影响图灵测试作为衡量人工智能智力水平的基本方法,对人工智能的发展产生了重大的影响。
探讨计算机软件测试的相关技术应用计算机软件的测试是确保软件符合设计要求、质量可靠并且、安全可靠的重要环节。
软件测试的技术应用与日俱增,以适应更加复杂的软件开发和应用环境。
本文将探讨计算机软件测试的相关技术应用。
一、自动化测试技术自动化测试是在软件进行自动化测试工具的帮助下,自动执行测试用例、整合测试结果和能够自动完成缺陷定位和记录。
它具有极高的可重复性、计算精度和激发开发团队参与度等优点,是解决繁重、耗时的测试工作和保证软件质量的有效手段。
在自动化测试中,最常用的技术是自动化测试脚本编写,主要是利用测试自动化工具、编程语言和脚本语言完成。
通过自动化测试脚本,可以方便地编写测试用例、模拟用户操作、完成测试报告生成等操作。
自动化测试技术虽然能够提高测试效率和质量,但也有其局限性。
例如,无法覆盖所有测试场景和异常情况,需要耗费一定的时间和资金用来开发自动化测试脚本,还需要不断维护和更新。
二、质量保障技术质量保障技术的主要目的在于提高软件质量和可靠性。
其中,质量保障技术包括代码审查、静态代码分析、单元测试、集成测试等技术。
代码审查是对源代码的检查,它可以有效防控软件缺陷的产生,同时也能够提高程序员的工作水平和代码质量。
静态代码分析可以检查源代码的规范性与一致性,并在代码质量有问题时进行警告和建议。
单元测试是在代码编写后立即进行测试,主要是检测单个程序单元的功能和边界条件。
集成测试是多个单元测试程序在相互配合、协作的环境中进行测试,测试产品接口和功能交互。
三、性能测试技术性能测试技术指的是在不同负载下对软件的响应时间、资源消耗、稳定性等方面进行测试,以确保软件能够正常运行。
性能测试应该在软件开发的早期阶段开始进行,以便发现和解决问题。
性能测试技术包括压力测试、容量测试等。
压力测试是针对软件运行在最大负荷下的情况,测试系统是否会崩溃或响应变慢。
容量测试则是在缺省负荷下测试系统能够承受多少负荷。
四、安全测试技术安全测试技术指的是测试软件在外部攻击下的安全性能。
基于计算机语言测试初探【摘要】科学技术和互联网技术的发展,给语言教学和语言测试领域带来了革命性的变化。
计算机语言教学和测试受到许多教师和机构的青睐,随着它的广泛运用,引起了许多学者的关注。
本文就用计算机进行语言测试进行了计算机熟练掌握程度和计算机实用性两方面进行了初步探索。
【关键词】语言测试;计算机熟练度;实用性一、引论测试存在于人类生活的各个方面,人们随时都处于一种测试和被测试中。
语言作为人类生活必不可少的交流工具,也是测试的一个目标。
随着信息交流技术的发展,计算机技术在语言教学和测试领域发挥着日益重要的作用。
同时随着经济全球化的发展,英语日益成为一门具有世界性质的语言,在一些正式交际中,对语言的要求提高了,这也就意味着我们必须寻找一门合理有效公正的测试方式来评估人们的语言水平。
计算机技术的发展促使语言测试的介质发生了变化,由传统的基于笔纸的语言测试发展到计算机适应性语言测试,并向基于网络的个性化自适应性语言测试发展(孔文,李清华 2002)。
因此,基于计算机技术的语言测试发展起来了,研究者也开始在这一方面给予更多的关注。
二、语言测试特点任何测试无论其测试方法和目标,它必须具有两个特性,即信度和效度。
信度指测试结果是否稳定可靠。
即测试的成绩是否反映了受试者的实际语言水平。
例如,如果在受试者不变的情况下,在同一测试中,受试者的分数忽高忽低,则这个测试缺乏信度。
测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。
效度亦称测试的有效性,指一套测试对应该测试的内容所测的程度,即一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。
测试的信度与测试的效度有着密切的关系。
一般来说,只有信度较高的测试才能有较高的效度,但效度较高不能保证信度也一定较高。
测试结果愈重要,愈要确保测试的信度和效度。
计算机技术的迅速发展在一定程度上改变了教育,语言学习是教育的一个方面,同样也受到了计算机技术的影响,对语言掌握熟练程度的语言测试研究者们开始转向对基于计算机的语言测试研究。
国内语言测试研究综述作者:张芳芳来源:《教育教学论坛》 2016年第8期张芳芳(湖北工业大学工程技术学院,湖北武汉430068)摘要:语言测试作为一门独立的研究学科,在近半个世纪取得了重要的发展。
国内对语言测试的研究主要集中在介绍语言测试社会伦理研究、语言测试工具内容研究和语言测试效应研究几个方面。
文章在总结这几个方面的研究内容的基础上,提出国内语言测试存在的不足和未来的发展方向。
关键词:语言测试;社会伦理;反拨效应中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)08-0074-02语言测试是语言学研究的一个重要领域,是语言教学的一个重要环节。
研究语言测试,对于各种语言测试的形式和内容具有重大的指导意义。
为了使研究者更好的了解国内英语语言测试研究的现状、存在的不足及发展趋势,从而促进语言测试的进一步深入研究,提高英语教学效果,本文对近10年来国内语言测试的研究内容进行了总结分析。
纵观国内主要外语类杂志,语言测试研究主要有以下几个方面:语言测试社会伦理研究、语言测试工具内容研究及语言测试效应。
一、国内语言测试研究的内容1.语言测试社会伦理研究。
Messick(1989)提出效度整体观之后,人们开始关注语言测试的社会功能、公平性、科学性及测试的结果和影响。
梅昳、聂建中(2009)总结了语言测试伦理问题的研究范围和解决方案。
测试伦理问题主要涉及反拨与影响、问责制、标准与职业化、公平性、考试相关方、权力与控制、测试使用与解释等方面,解决方案则包括测试领域专业化、制定质量控制体系和另类评估。
在此基础上,两位研究者提出,对于我国的语言测试研究和实践,首先应该制定适合国情的语言测试相关标准和测试人员的道德行为准则,其次要提高语言测试工作者的专业化程度,最后需要开发多元化的语言能力测量方法,规避考试风险。
杨惠中和桂诗春(2007)则从社会学角度阐释了语言测试的一系列社会问题。
何莲珍、吕洲洋(2013)从另外一个角度阐释了语言测试的社会伦理观,即批判语言测试。
应用语言学在教学中的应用研究一、引言应用语言学是语言学的一个分支领域,它注重语言的使用和应用,研究语言的功能、结构和意义等方面,特别是在实际情境中的应用。
在教育领域,应用语言学可以帮助我们更好地了解和应用语言,改善教学效果,提高学生的英语学习成绩。
二、语言学习用途1.教学法应用语言学可以帮助我们更好地理解学生的学习过程,调整教学策略,改善教学效果。
例如,教师可以使用自然语言通信和互动技术来促进学生的口语交流,使用多媒体技术来增强学习体验,提供各种有效的教学资源和支持,从而更好地满足学生的学习需求。
2.语言测试应用语言学也可以用于评价和测试学生的语言能力。
比如,我们可以使用先进的自然语言处理和人工智能技术,对学生的口语和书写能力进行评估,并据此制定更有针对性的教学计划和训练课程。
此外,应用语言学还可以用于评估课程效果和学生学习成果,从而帮助教师改进教学方法和提高教学质量。
三、语言学习技术1.计算机辅助学习计算机辅助学习(CALL)是应用语言学的一个重要领域,在教学中发挥着重要的作用。
计算机辅助学习可以将学习与技术相结合,形成一种高效的学习方式,提高学习效果。
例如,计算机辅助学习可以使用多媒体技术,通过音频、视频、图形等形式来呈现教学内容,增强学习体验;可以提供各种练习和测验,帮助学生更好地掌握知识。
2.虚拟现实技术虚拟现实技术(VR)是一种通过计算机模拟人类感知和交互体验的技术。
它可以模拟各种情景和场景,为学生提供更加真实、生动的学习体验。
例如,在英语教学中,虚拟现实技术可以模拟各种场景,如旅游、购物、餐厅等,让学生在语言学习中体验真实的场景,提高他们的语言交流能力和应变能力。
四、语言学习策略1.目标型语言学习策略目标型语言学习策略(GOALS)是一种以目标为中心的语言学习模型,它强调学生个性化学习需求,注重学习的实际应用和目标实现。
目标型语言学习策略可以指导学生参与学习,帮助他们显著提高语言学习的效果,最终实现语言能力的提高和个人职业发展的提升。
探究基于计算机的语言测试及其效度验证摘要:随着计算机技术与认知科学、语言学以及测量学等结合在一起,对成绩报道与分析、试题设计编写、评分、任务呈现、评估与语言测试管理等产生了异常重要的影响。
具备高真实性的测试题型以及计算机自动评分系统和测试技术的应用,是测试结果可靠性和测试概念代表性得到了提升。
所以,建立在计算机基础之上的语言测试也开始受到管理者和语言测试开发人员的青睐。
文中就基于计算机的语言测试进行了大致论述,并就其效度进行了验证,以期为我国语言测试的进步提供可供参考的意见和建议。
关键词:计算机;语言测试;效度验证中图分类号:tp391.1文献标识码:a文章编号:1007-9599 (2013) 06-0000-021基于计算机语言测试发展状况在语言评估和测试方面,计算机技术所引起的改变主要体现在如下两点:使测量准确度以及管理实施效率得到了提升。
建立在计算机基础之上的语言测试的发展状况大致可以归为如下几点:(1)初期计算机化的语言测试。
在计算机技术限制作用下,语言测试初期主要是运用计算机的管理语言进行测试又或者将传统笔试试题搬至计算机上。
它的特点在于,只改变了测试方式,而在测试构念和任务方面与笔试并无实质性的差别。
(2)适应性的计算机语言测试。
测量学以及计算机技术的进步使得新一代的语言测试技术开始出现。
此种测试形式相比于传统的笔试具有非常多的优势,例如,它能起到反馈的作用,在测试中加强了人性化和个性化,同时也提升了安全性。
它为受试者所提供的任务和题目在受试者能力范围之内,可以使他们提升兴趣,进而将他们将自己的最佳水平发挥出来,从而使受试者语言能力的测量更加准确。
(3)自动评分系统。
现如今,自动评分系统所应用的范围主要是写作部分。
尽管作文评分系统受到学者和专家的质疑,但在学生自我评估以及高风险考试中依旧得到了广泛的应用。
由于自动评分系统可以节省时间、人力和物力等相关资源,并且相较于人工评分其客观性和准确性还要更高一些。
第24卷第1期长春师范学院学报(自然科学版)2005年3月V ol.24 N o.1Jo ur nal o f Chang Chun T eacher s Co lleg e(N atur al Science)M a r 2005计算机在语言测试中的应用田巧智(大连海事大学外语系,辽宁大连 116026)[摘 要]本文综合讨论计算机在语言测试中应用的三个主要方面:题库建设,计算机辅助语言测试以及计算机自适应语言测试,同时分析了这三方面在应用中的优势,应注意的问题以及语言测试今后的发展趋势。
[关键词]语言测试;题库建设;计算机辅助语言测试;计算机自适应语言测试[中图分类号]T P39 [文献标识码]A [文章编号]1008-178X(2005)01-0103-041.语言测试的发展历史 中国是考试的故乡,但是语言测试作为心理测量学的一个分支则是从西方引进的,是60年代初才形成的一门新兴学科。
测试的目的是了解、评价学生的语言水平。
Spolsky把测试的发展分为前科学阶段,心理测量与结构主义相结合阶段和心理语言学与社会语言学为基础阶段。
从时间上看,70年代以前属于心理测量与结构主义时期,其占主导地位的测试方法是分析法(analy tic approach)。
在这一时期语言测试中大量使用多项选择题题型。
其试题量大,评分具有客观性,因而信度较高,这一时期开发了一系列统计分析方法,使语言测试成为一门既有坚实的理论基础又有成熟的测量统计方法的学科。
但用分散式分析法最大弱点是重语言形式而轻语言应用,得到的分数不能对语言水平作直接的解释,结构效度不高。
自70年代中期起属于心理语言学与社会语言学时期,总体综合法(global integr ative approach)受到人们广泛重视。
这一时期采用比较多的是综合题,主要形式是完形填空、综合改错、听写、口试、作文等。
综合性测试的主要特点是往往把听、说、读、写等技能混合在一起测试,但其缺点是难以做到评分的客观性和一致性。
自80年代中期起交际法语言测试(com municative testing)越来越受到重视。
Canale&Swain(1980, 1983)提出交际能力包括四种能力,语法能力(gr am matical co mpetence):即掌握词汇、句法、语义的知识;社会语言能力(so ciolinguistic competence):即语言在社会中的得体性;语篇能力(discour sal co mpetence):即会话中的连贯性:策略能力(strateg ic com petence):即加强交际效果的一种方法。
语言交际的过程是一种解释过程,是交际双方协同过程。
语言测试就必须在真实的语境中采用真实材料进行。
到了90年代,Bachman把交际语言能力分成三部分:语言能力(lang uag e com petence),包括结构组织能力(o rganizational com petence),语用能力(prag matic com petence);策略能力(strateg ic co mpetence)和心理生理机制(psy chophy siolog ical mechanism s)。
Bachman的理论对90年代有关交际语言能力测试方面的研究起到十分重要的作用。
交际性测试既可以使题目相互间具有独立性,又可使语境明确,被认为是语言测试的理想模式。
2.计算机在语言测试中的应用 到了20世纪末,随着测试理论的完善、计算机技术的发展、多媒体技术的应用,计算机越来越多的应用在语言测试中,语言测试的方法和手段由此开始发生根本性变化,因计算机具有存储量大、处理速[收稿日期]2004-10-08[作者简介]田巧智(1970- ),女,辽宁大连人,大连海事大学外语系讲师,从事计算机应用研究。
度快、分析能力强以及信息反馈及时等特征,计算机辅助教学以及电脑化测试手段已经开始逐步普及,网络化学习环境及测试手段也开始发展起来。
计算机辅助教学以及电脑化测试手段的应用使语言学习和语言测试的许多方面都得到了发展。
计算机在语言测试中的应用越来越受到人们的关注,它的应用主要体现在题库建设(item banking),计算机辅助语言测试(computer-assisted language testing)以及计算机自适应语言测试(com puter adaptive language testing)。
2.1 题库建设.题库是指由许多适用于不同目的、技能和任务需要,且具有必要参数的大量优质题目组成的集合,是进行测试的基础。
高质量的题库应具有优质、量大、等值、动态可扩充等特点。
题库建设不是简单地将数量众多的试题存储在计算机中,而是一项复杂的系统工程,它不仅涉及到教育测量理论,还涉及到统计、认知心理、控制论等多方面的理论,它首先要建立系统的数学模型,然后确定试题的属性指标以及试题的组成结构,然后再组织大批量的优秀的教师编写试题。
为了保证这些试题的科学性和有效性,还要组织大量的被试样本,进行抽样测试,对试题参数标注的有效性进行校正,一个相对完整的题库系统需要成千上万道试题,编写和测试这些试题的工作量是无比巨大的。
而对试题库的规模、试题的分布平衡状况以及题目的个性特征等的评价还需要通过设置题目的一些技术参数才能实现。
计算机技术在题库建设上起着十分重要的作用,例如它可以方便地完成对试题的储存、扩充、修改,可以按一定的模式自动生成试卷。
但是在题库建设中还是有许多问题值得注意。
试题库的管理就是一项重要的工作,它包括控制入库试题的质量,控制入库题目具有合理的结构比例,保证内容上的广泛性,组织上的严密性,以及数据的安全性等问题。
随着计算机在测试领域的应用以及项目反应理论(Item Response Theory,简称IRT)的兴起,以此为基础的计算机化自适应考试(Com puter Adaptive T est)越来越受到人们的重视,它能自动地适应被试者的具体情况,试题的难度、数量、知识单元分布等可根据被试者的特点而灵活变通。
而且由于IRT理论具有参数不变性等优点,题库的扩充变的更为容易,只需安排一些连接题目与新题目相混合进行试测,就可以将新题目的参数值与旧题目的参数值统一到一张量表中来。
而这一任务只有通过计算机管理的试题库系统才能完成。
2.2 计算机辅助语言测试.在传统的教学中,教师为了准备一个测验,常常是从被选择的测试题目中构成单独问题或成组的问题。
一般情况下,构成一个测验对教师来说是一种手工处理方式。
每一个新的测验都要从头开始重复整个过程。
为了减少准备过程,教师们年复一年地保存测验题目。
在60年代,美国首先将计算机用于教育测量,并称这种计算机管理教学为计算机辅助测试(Computer-Assisted Testing)。
即教师或计算机按预定的测试目标发送测试题目;学生接收、并根据自己的理解和认识作出反应;教师或计算机将学生的反应与设定目标相比较,按教学策略进一步传送反馈信息、教学内容等,使教学在新的基础上发展,直至学生的反应与目标相匹配为止,对学生的学习进行分级和判断,达到计算机辅助测试的目的。
计算机辅助测试系统有一个比较强大的题库,它的测试构成与传统的测试构成是一样的,但整个过程得到相当大的简化和改进。
计算机能够按要求随机构成试卷,无论是题型的搭配、分值的分配,还是时间的确定,都是十分精确的。
计算机辅助测试具有生成试卷,实施测验,辅助阅卷,分析试卷,管理成绩等功能。
并且计算机阅卷快速,准确,能够及时地对考试结果做出分析,发现题目存在的缺陷,并帮助修复,从而可以提高测试的信度和效度。
因为计算机辅助测试能够减轻教师在测试这一教学环节的许多劳动(如编制测试、评阅分析等),对提高教学质量和效率能起到良好的促进作用。
2.3 计算机自适应语言测试.计算机自适应语言测试是计算机辅助语言测试的发展趋势并具有更大的潜力.它有三个主要特点:1)考试项目根据单个考生的情况而定;2)当考生的能力水平得到确定时考试就结束;3)考试项目较一般纸笔考试更少,而且时间更短.在传统考试中,无论考生水平高低全部要接受同一批题目的测验,对于每个考生而言,测试题目中只有一部分是符合自己真正能力的,其余的题目要么简单,要么过难。
计算机自适应测试的出现有效的解决了上述问题。
计算机自适应测试就是对每个考生提供难易度合适的测验项目的一种测试方法。
其基本过程是:考生首先回答一个中等难度的测试项目。
如果考生正确回答了这一初始项目,那么下一个测试项目的难度就要增加;如果考生答错了,那么下一个测试项目的难度就要降低。
接受计算机自适应测试的考生需在计算机屏幕前进行。
测验题目自动显示在屏幕上,考生根据自己的判断按键作答。
答后计算机还可立即反馈答对和答错信息,根据项目反应理论考生以后每回答一个测验项目,计算机就给出一个相应的能力估计值。
这个能力估计值就成为选择下一个测验项目的依据水平,直到准确测出考生水平为止。
CALT比常规测试具有更高的效率,它可以用比常规测试更少的试题而获得可与之相比或更佳的测量效果,有实验表明,在同等测量精确度的条件下,自适应测试可缩短40%至60%的测试长度。
另外,由于按照个体的能力水平而确定测试的难度,对个体来说能提供最好的测量,CALT就可以从题库中对每个应试学生选出难度水平适合他们的试题,从而可以解决测量精确度和能力跨度不能兼顾的问题。
例如托福电脑化测试就是近年来较著名的一种考试.每位考生的座位都配备了电脑及耳机,即使是没有使用过电脑的考生也可以配合动画及图片说明的电脑使用指导,在正式测试之前轻松学会使用以电脑作答的基本技巧。
听力及语法结构两项就是采用考题难易度配合考生程度的计算机自适应测验的型态——通常第一道考题为中等难度的题目,如果考生答对了,则下一道考题难度会提高;答错了,则下一道考题难度会降低。
测试结束后,除了写作成绩须待ETS的专业人员评分外,应试者可从电脑屏幕上看到其他各项测试的成绩。
计算机使语言测试的方法和手段开始发生根本性变化,可以说是在向一个时代告别,即:向纸笔考试时代告别,同时意味着一个全新时代的到来,即:计算机化考试时代的到来。
3.计算机在语言测试中应用的优势3.1 利用计算机技术构成的题库系统自动化程度高,可大大提高命题效率,不仅能动态地增删、修改试题,还具有自动生成试卷的功能,有助于命题过程规范化。
它是多层次、多用途的,既有用于各类学校一般测验用的经验型题库,也有为全国性单纯选拔人才使用的题库。
3.2 由于基于IRT的题库试题的属性可以与施测样本无关,因此即使在不同时间内进行的考试,其测量结果也是可以比较的。
题库的建设有利于学生自我检验学习成绩,也有利于教师出题考试及判断教学效果。