浅析语言测试中信度与效度两者之间的关系
- 格式:pdf
- 大小:127.88 KB
- 文档页数:3
如何区分信度与效度之间的关系
信度与效度两者间的关系是历年来的重要考点也是同学们做题时候的难点,常以单选、填空和简答来考察大家,理解性去做题就比较容易得分,今天中就来为大家解读一下这部分知识点。
1、信度
信度是表明评价工具质量的又一重要指标,主要指测验结果的前后一致性程度。
2、效度
效度是指一个测验或测量工具能真实地测量出所要测量的事物的程度。
效度是对测量的准确性程度的估计,而信度则是对测量的一致性或可靠性程度的估计。
研究表明,效度和信度是交叠的,即有时一个测量工具对于某一个目的具有一定的信度,但并不一定是有效的;而一个测量工具如果对于某一个目的是有效的,那么它一定是可信的。
这正如拿一把米尺去量身高是有效的,也是可信的。
他们两者之间的关系是信度高效度不一定高、效度高信度高、信度低效度一定低、效度低信度不一定低。
那么我们如何有效的去记忆他们呢?老师教大家一个秘诀。
效度达到最高点的时候,必然超越了信度,因此效度高信度一定高。
而信度达到最高点的时候,效度不一定达到了,因此信度高效度
不一定高。
反过来,效度低的时候,信度可能超越了最高点,因此效度低信度不一定低。
而信度低必然就达不到效度的最高点,因此信度低效度一定低。
通过图形分析同学们就能快速回忆起这部分知识点,进行答题,希望同学们看完以上讲解,能顺利掌握这部分知识点。
2000年3月第8卷 第1期 西安外国语学院学报Journal of Xi an F oreign Languages U niversityM ar.2000Vol.8N o.1谈语言测试的信度与效度赵成发(复旦大学大学英语教学部上海200433)中图分类号:H0 文献标识码:A 文章编号:1008-4703(2000)01-0011-05信度与效度原是计量学中的两个重要概念,20世纪30年代被引入语言测试领域。
60年代,以L a-do等为代表的结构主义测试学家对这两个概念进行了系统的阐述和论证,标志着语言测试已形成科学的体系,成为一门独立的学科。
可以说,语言测试理论及实践上的发展和纷争都是以信度与效度为主线进行的,信度与效度是语言测试永恒的主题。
一、信度与效度的概念语言测试的信度是指测试结果的可靠程度。
语言测试信度的高低主要说明的是测试结果在多大程度上反映了受试者真实的语言行为。
影响信度的因素很多,它们存在于语言测试的每个环节中。
对试卷本身来说主要是样本的大小(size of sample)和区及各种组织之间的横向协作与联合。
这样一来,新亚欧大陆桥就不仅成为一条国际性贸易大通道,而且会成为一条经济、科技等多种领域使用和东西方文化交流的桥梁。
第二,充分发挥连云港市的桥头堡作用。
我国长江三角洲经济区的形成和迅速发展,有两个至关重要的因素,一是有黄金水道之称的长江,一是有中心城市上海的辐射作用。
上海凭着沿江与沿海交汇点独特的地理优势,率先发展起来,从而带动长江三角洲区域经济的发展。
陇兰经济带有一个协作与联合的纽带新亚欧大陆桥还不够,还必须有一个能像上海一样发挥作用的中心城市。
连云港作为沿线与沿海的交汇点,其地理位置的优势不亚于上海,完全可以把连云港市建设成为新亚欧大陆桥沿线省区共有的出口产品加工区,外贸基地和窗口。
连云港市也将对大陆桥沿线省区产生新的、更大的渗透力。
进一步增强新亚欧大陆桥东桥头堡和陇兰经济带的龙头地位。
一一一一一一一考试英语本栏目责任编辑:唐一东浅析外语口语测试的信度与效度李燕(桂林理工大学外国语学院,广西桂林541006)摘要:作为语言五大技能之一,口语对于外语学习的重要性不言而喻,外语口语测试是衡量语言技能高低的重要手段。
结合当前外语口语测试存在的问题,从信度、效度在测试各阶段的表现出发,对二者关系进行研究,有利于为今后外语口语测试提供借鉴,保证测试的结果的真实性。
关键词:口语测试;信度;效度中图分类号:H09文献标识码:A文章编号:1009-5039(2016)20-0053-02外语技能的衡量标准主要体现在听、说、读、写、译五个方面,“说”(口语)作为其衡量指标之一,在整个外语学习过程中占重要地位,口语测试则是衡量该指标的手段之一。
随着经济全球化进程的加快,对外语口语的人才的需求也呈逐渐上升趋势,外语口语测试成绩的真实性也得到愈来愈多人的关注,如何保证口试信度与效度的平衡,是当前口语测试的重要问题。
1信度与效度信度与效度在语言测试中是两个重要概念,是衡量语言测试质量的重要依据。
1.1信度李筱菊(2001)提出测试的信度,指它的结果分数对受试者的表现而言的可靠程度。
换言之,信度指的是测试结果的可靠性和稳定性,有信度的试题在任何时间地点环境下进行测试,结果都是一致的;然而,测试的绝对一致性是难以达到的,我们能做到的只能是达到相对的一致性。
对考试信度的验证,有一系列的方法,较常见的有考后复考法、试题分半法、平行试题法。
相比于这三种间断性使用的考试信度验证方法,更为重要的是经常性验证方法,即对每场测试结果都进行分析研究汇总,并公布数据,从而提高测试信度。
1.2效度衡量考试的另一个标准是考试效度。
所谓效度是指“成功地实现测试目的程度”(Clark,1979:35~49)。
李筱菊(2001)提出“效”不是效率的效,效度指是否站得住脚、是否能成立的意思。
而语言测试的效度,亦称有效性,指测试所考的,是否就是所要考的,或者说,在多大程度上,是为了目的所要考的。
- 200-校园英语 /语言测试中的效度与信度西南科技大学/邹微 杨纾凡【摘要】语言测试是检验学生语言习得效果最直接的手段,是语言教学的有机组成部分。
本文旨在对语言测试的信度和效度进行分类阐释,并分析影响语言测试信度与效度的主要因素,同时,对二者的关系进行分析,以期为考题设计者命制考题提供借鉴和参考,使语言测试真正服务于语言教学。
【关键词】语言测试 语言教学 信度 效度一、引言随着语言教学的不断推进,语言测试逐渐从应用语言学中分离出来,成为一门独立的学科。
Bachman 曾说“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。
”测试是检验学生学习效果最直接的方式,有效、可靠的测试,其结果能够帮助教师了解学生的学习水平,是因材施教的一个重要参照。
同时,测试也是评估教师教学效果的重要手段之一,为教师下一步教学计划的制定、教学方法的调整、教学重难点、目标的明确提供了依据。
评估一项测试的指标主要有“信度、效度、区分度和实用性,其中以信度和效度最为重要。
”二、效度效度,简而言之就是测试的有效性,是指该测试是否测试出命题人想要检测的内容、达到命题人预期的测试目的。
它是测试最基本的出发点。
“波尔斯基和梅西克视效度为外语测试的主要问题,其范畴包括内容效度、标准相关效度、构卷效度和表面效度等。
”1.内容效度。
内容效度,是指试题的内容是否考查了出题人想要考查的语言技能及语言要素等。
如,一个专项的语法考试,出题人需按照教学大纲的要求,大纲里规定有哪些语法是必考,那么出题人在出题的时候就必须考虑到这些语法点,考题的内容必须要覆盖大纲里规定的所有必考点,这样的考试才能算的上是有内容效度的。
内容效度是衡量测试效度的一把重要的尺子,在教学过程中,通过内容效度较高的测试,教师能更好地制定教学计划,了解教学的重难点,进而明确语言教学的方向。
2.标准相关效度。
标准相关效度指的是“测试与某一个独立并且相当可靠的学生能力测量工具”之间的关联程度。
信度和效度的关系和区别公式
信度和效度是评估研究或测量工具的两个重要指标。
信度指的是测量工具的稳定性和一致性,即重复使用同一工具是否能得到相似的结果。
效度则是指测量工具是否能够真实地衡量所需测量的概念或变量。
信度和效度之间的关系可以用以下公式进行描述:
效度 = 信度× 相关性
其中,相关性表示测量工具与所需测量的概念之间的相关程度。
具体来说,信度是通过测量工具的重复性或一致性来评估的。
例如,如果一个问卷调查在不同时间或不同样本中得到的结果是一致的,那么就可以说该问卷具有较高的信度。
信度可以通过计算相关系数、内部一致性系数等进行评估。
效度则是评估测量工具是否能够准确地衡量所需测量的概念或变量。
例如,如果一个心理测量工具能够准确地衡量一个人的抑郁程度,那么就可以说该测量工具具有较高的效度。
效度可以通过与其他已经被广泛接受的测量工具进行比较,或通过专家评估等方法进行评估。
总结起来,信度和效度是评估测量工具质量的两个重要指标。
信度评估的是测量工具的稳定性和一致性,而效度评估的是测量工具是
否能够准确地衡量所需测量的概念或变量。
这两个指标在评估研究结果的可靠性和有效性时都非常重要。
信度和效度的区别与联系在教学这章中涉及了信度和效度这一知识点,这既是我们考试的重点也是难点。
很多同学都分不清什么是信度和效度,信度和效度有着怎样的区别和联系呢?一、信度和效度的区别测验的信度:又称测验的可靠度,是指一个测验经过多次测量所得结果的一致性程度,以及一次测量所得结果的准确性程度。
信度主要是指测量结果的可靠性、一致性和稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征。
测验的效度,指一个测验能测出它所要测量的属性或特点的程度。
效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。
学业成绩检查是要测量所学的学科基本知识技能,作为测量工具的试题就应和要检查的目标相关。
效度分为三种类型:内容效度、准则效度和结构效度。
总体来说,效度是对测量的准确性程度的估计,而信度则是对测验的一致性或可靠性程度的估计。
二、信度与效度的联系我们可以通过下图进一步了解信度和效度:以打靶为例,打中目标才算是高效度。
第一个图,弹痕非常分散,代表不稳定,随机误差高,信度就低,另外大部分都是打偏了,所以效度也不高。
第二个图,很稳定地打偏了,稳定性高,就是信度高,但是却完全没有击中目标,偏离很多,所以就是效度低第三个图,很稳定地正中靶心,那就是信效度都很高。
对于信度与效度的联系,我们可以用一句话来概括:信度是效度的必要不充分条件。
有效度一定有信度,但是有信度不一定有效度。
下面,我们通过几个真题加深对信度和效度的理解:1.开学考试成绩能够预测学生入学后的学业成绩,这说明该测验具有较高的()。
A.信度B.难度C.效度D.区分度答案:C2.在测验学生英译汉的技巧时,由于所选的短文中词汇量较大,学生受到词汇量的障碍而难以发挥翻译技巧,测验的结果在很大程度上说明了学生掌握词汇量的多少,然而并没有确切说明学生的翻译技巧,这样的测验()不高。
A.难度 B.效度 C.信度 D.区分度答案:B3.某学校采用性格量表来测量学生,分别在一年的3月、8月、12月测量,其结果基本相当,测验结果如此相同,说明其()。
第24卷第5期延安职业技术学院学报Vol.24.No.5JournalofYan'anVocational&TechnicalInstitute2010年10月Oct.2010浅论校内英语测试的信度和效度吴文辉(陕西广播电视大学延安分校,陕西延安716000)[摘法。
要]语言测试是语言教学的重要环节,是测量学生语言习得成果的重要手段。
衡量语言测试的关键是看它的信度和效度,好的测试是信度和效度的合理平衡的结果。
拟就大学英语校内测试在信度和效度上的不足谈自己的看法,并提出相应的改进方[关键词]英语测试;信度;效度[中图分类号]H319[文献标识码]A[文章编号]1674-6198(2010)05-0090-03语言测试(languagetesting)是语言教学中一个不可或缺的环节,在语言教学中处于重要的地位,它为教学提供目标并为教师和学生成功地实现这些目标提供现实依据。
语言测试影响教学,这在教学界似乎已经成为大家的共识。
这种所谓的“影响”有不同的称谓,如“textimpact”(DavidBaker,1991)、“consequentialvalidity”小(sizeofsample)和区分度(discrimination)等。
语言测试的效度表明一种相关性(relevance),即测试与测试目标的关联程度。
根据结构主义测试学家的传统解释,语言测试的效度是指测试是否考了它所要考的。
测试效度有五种:结构效度(constructvalidity)、内容效度(contentvalidity)、同期效度(concurrentvalidity)、预测效度(predictivevalidity)和表面效度(facevalidity)。
语言测试是以语言能力作为测量目标,而语言能力又是抽象的,是通过具体的语言行为表现出来的,不能以直接测量。
另外,任何测试都不必要也不可能测量所有的语言行为,所以语言测试的目的是通过受试者语言行为样本的测试结果来推测受试者的语言能力。
论英语语言测试的信度和效度摘要:信度和效度是英语语言测试中两个比较重要的评价标准,也是衡量测试是否有效且可靠的重要因素。
信度是指测试结果的可靠性,可信性以及稳定性;效度是指语言测试的科学性和有效性,即考试达到预定目标的程度。
本文将深入探讨信度和效度的两个概念,并进一步阐述两者之间的关系。
关键词:英语语言测试;信度;效度;语言测试是一门具有语言教学的综合性科学,并运用一系列科学而又具有实践性的方法来客观评估学生的语言运用能力。
语言测试的标准包括信度,效度,真实度,区分度,实用性等。
在这些衡量标准中,信度和效度是两个非常重要的衡量维度,也是必须在英语语言测试中应用到的两个衡量标准。
信度和效度这两个概念最初于1930年引进到语言测试这个领域中的。
以Lado为代表的结构主义测试者,他系统地阐述并论证了信度和效度这两个概念,认为语言测试已经形成了一个科学体系,成为一个独立的学科。
从整体上看,语言测试在理论和实践上都偏向于信度和效度。
此外,信度和效度是评价学业测试的重要依据。
两者之间的关系是学术考试的基本问题,学术考试的最终目标是为语言教学服务。
因此,两者的作用在于是否对英语教学产生重要影响,是否能够支撑英语教学,是否能够实现教学目标,又是否能和学习的过程相契合。
语言测试不仅能够检查学生掌握知识的能力和水平,还能够发现学生学习中存在的潜在问题,并能够为教师之后的教学提供有效的指导和帮助。
鉴于此,本文将深入探讨信度和效度的两个概念,并进一步阐述两者之间的关系。
1.语言测试中的信度和效度信度又称有效性,是指测试结果的可靠性、可信性和稳定性,要求其结果不受受试群体和试题的干扰,从而反映被测试者真实的语言行为。
简而言之,测试结果应当客观真实地反映,不受其他因素影响。
如果一份英语试卷了信度,也就不能客观公正地反映被测试者的语言行为,那么这份试卷就失去了它的使用价值。
因此,同一份测试题在不同场合下测试,得到的结果在很大程度上保持一致,则该测试的信度是比较高的(冯彤,2003)。
语言测试的信度与效度之间的关系李翌豪【摘要】测试的信度和效度是用来衡量一门考试是否有效和可靠的两个关键因素,任何测试的开发与评估都应当把二者纳入到重点考虑范围之内。
然而,一些研究者对于测试信度的定义往往过于理论化,甚至把其成立的基础建立在某些理想化的客观条件之上;同时他们在测量信度时所采取的过于机械化的统计方法,也导致了其结果不能准确地反映出试题的客观稳定性。
考虑到信度与效度之间不可避免的逆反关系,为了满足语言测试的首要目的,测试的开发者应当首先给予效度最大限度的重视。
由于“套题”中包含了复杂的“题内相关性”,所以它并不利于测试在数据上达到令人信服的“可靠性系数”值;但如果以此为依据就盲目地将其排除在外,我们就忽略了其在考查被测能力方面的作用,从而忽视了对测试整体效度的把握。
%There are lots of concerns involved in developing a test,especially a language test for second and foreign lan-guage learners,but the two most important ones that any test developer should take into consideration are reliability and validity.However,reliability and validity are not always mutually contributive to each other,and sometimes even an in-verse relationship could exist between them.Aiming at assessing and reflecting the true language ability of test-takers,I think any test-developing activities should be organized around how to make the test more valid,in other words,how to resolve the potential tension between reliability and validity and ensure the latter one at the same time.My article will dis-cuss how certain assumptions and suggestions underlying the theoretical definition and statistical measurement of reliabili-ty might distract testdevelopers'attention away from validity and negatively affect their decision concerning the selection and construction of test items conducive to validity.【期刊名称】《江苏师范大学学报(哲学社会科学版)》【年(卷),期】2016(042)005【总页数】5页(P88-92)【关键词】测试信度;测试效度;语言测试【作者】李翌豪【作者单位】江苏师范大学外国语学院,江苏徐州 221116【正文语种】中文【中图分类】H08众所周知,在一门测试的开发过程当中需要考虑诸多因素,尤其是对专门为第二语言或外语学习者所打造的语言能力测试而言,试题开发者对其信度和效度的把握无疑是试题开发当中最关键的两个环节。
科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION我们知道 , 测试是教与学的向导 , 而为了让它发挥出向导的作用 , 一份好的试卷是必不可少的 , 而且是至关重要的 . 一般情况下 , 我们判断一份试卷的好坏的主要标准是:是否有信度、效度、区分度、实用性、全面性、公正性及后期效应。
其中, 以信度和效度最为重要。
一、语言测试的信度语言测试的信度, 又叫可靠性, 是指考试结果的可靠性和稳定性。
即看学生的分数是否稳定, 如果同一个学生做同一套试卷 , 做的几次的结果都是一致的 , 那么我们说这次考试是有信度的; 反之 , 如果分数忽高忽低就说明信度不高 , 那么表明考试的信度不高。
信度可以分为复测的效度、判卷的效度和每一个测试项目的效度。
同一学生不管考多少次, 所得的分数都是一样, 那么就说这个分数有复测的可靠性。
影响分数的一个很重要的因素就是判卷人, 在判卷过程中, 不同的判卷人对同一试卷也会做出不同的反映; 同一个人在不同的时间对同一试卷给的分数也是不一样的。
试卷不仅要达到其整体的可靠性, 而且每一题都必须能达到这个标准, 那才是一份有信度的试卷。
与能力无关却又会影响试卷信度评判的因素有很多,例如:1. 考试条件差, 天气热、考场周围太吵闹等。
2. 考试条件不一样。
同一个学生在安静与吵闹的环境中做同一份试卷,其结果不一样。
3. 监考施策。
不同的老师对考生的松与严, 看见考生作弊或违纪不勒令禁止。
4. 题目要求不清, 学生根本无法弄清题义, 也就无法真实的反映考生的水平。
5. 保密工作做的不好, 泄题事件发生。
6. 评分。
主观测试的评分常常因评卷人而异, 难以达到较高的信度; 客观试卷的评分不受评卷人的影响因此信度较高。
7. 样品数量太小, 样本不足。
8. 身体及心理状态不好等等, 这些因素都会影响到信度。
因此, 为了提高信度, 我们必须对症下药, 采取各种措施。
研究信度与效度的关系一、信度与效度的定义信度即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度,或者说,信度是指测量结果的一致性或稳定性。
效度即准确度,它是指测量工具或测量手段能够准确测出所要测量的变量的程度,或者说能够准确、真实地度量事物属性的程度。
二、信度与效度的关系(一)教育科学研究中信度与效度的关系信度是研究结果所显示的一致性、稳定性程度,也是对研究结果一致性和稳定性的评价标准。
一个具有信度的研究程序,不论其过程是由谁操作,或进行多少次同样的操作,其结果总是非常一致的。
效度是一个研究程序的性质和功能,也是对研究结果正确性的评价标准,一个有效度的研究程序,不仅能够明确地回答研究的问题和解释研究结果,而且能够保证研究结果在一定规模的领域中推广。
把两者的作用结合起来看,信度和效度是一项教育科学研究活动和结果具有科学价值和意义的保证。
研究的信度是研究的效度的一个必要的前提,没有信度,效度不可能单独存在,也就是说,一项研究不可能没有信度却具有效度。
(二)人力资源招聘信度与效度的关系影响测评信度的因素有很多,主要是系统误差和随机误差。
包括测评者的专业性和素质、被测评者本人的心理、侧评工具的稳定性、环境的稳定性等都会影响测评的可信度。
影响测评的效度因素也有很多,如测评工具、测评过程及测评者因素、被测评者状态、效标因素和信度因素等。
在实际招聘与录用评估过程中要把握各相关方面,不仅要有专业的测评人员,同时也要在稳定的环境中为被测评者提供一个放松真实的氛围。
信度和效度是人才侧评与选拔质量的重要指标。
图形形式表现分析得出的信度和效度的三种关系,则会是以下这些样式,如图8-l .图8-2和图8-3所示。
所以,:高信度是高效度的必要条件,但非充分条件。
即信度高不一定其效度就高,但要想获得较高的测评效度,其信度必定要高,(三)用结构式问卷来测量家长“溺爱孩子”的行为中信度与效度的关系当我们用结构式问卷来测量家长“溺爱孩子”的行为时,可以得到相对较高一些的测量信度,用同样的问题反复询问同样的对象时,所得到的结果的一致性程度会比较高,但是,这种测量方法的效度往往会比较低,因为家长们在培养孩子方面的认识、态度和具体做法远比问卷中的五个问题丰富多彩,我们在问卷中所能够测量的只是其中的很少、很表面、很有限的一部分,反之,如果我们用深入到每一个家庭、实地去考察、与家长仔细交谈的方法来进行测量,那么,所得到的资料的效度会比较高,我们实实在在地看到和感受到家长们是如何培养孩子的,但是,此时,我们却降低了观察的一致性程度。
浅析语言测试中信度与效度两者之间的关系语言测试在语言教学中处于中心地位,是从属于应用语言学这一学科的。
在过去语言测试在应用语言学中处于边缘地位,而在长达三十多年的发展中,语言测试现已发展成为一个相对独立的学科,已经在学术上占有了一席之地。
通过语言测试教育者可以及时发现学习者学习上存在的不足之处并在日后的教学过程中加以正确引导,也可以衡量教学任务和教学大纲的执行情况,但是这些都是基于科学的语言测试能够得到良好的反馈情况,反之,如果是一套不科学的语言测试就很可能对学习者做出错误的判断从而影响学习效率,所以科学的语言测试无论是对受教育者还是对教育者来说都是非常重要的。
一套设计比较科学的测试应该是具有信度,效度,难度和区分度四点特征,信度与效度是难度和区分度的基础,同时也是语言测试的两大根本要求,只有正确认识了信度与效度两者之间的关系才能寻找出一个科学的方法使得语言测试更加科学准确。
信度指的是测量的一致性,一个实验或测试的信度指它在重复测量时产生同样结果的程度,也就是说测量的稳定性是否一致。
影响信度的因素很多,其不仅存在于考试过程中的各个环节,也存在于阅卷的过程中,如试卷中的试题长度偏长,项目种类多,那么测试的信度就会提高,反之则会降低,考试分数集中于某一点或某一个区域时信度也会有所降低;考试期间考生时间充裕那么估算能力考试的信度也相对较高等等,这些都是存在于考试过程中各个环节的部分举例,在阅卷过程中阅卷者自身的信度和阅卷者之间的信度等问题也是影响信度的因素之一,如在评阅主观性的题目时(作文,口语等),阅卷者在评分时就具有很大的主观色彩,而不同的阅卷者掌握的主观的评分标准在评阅主观性试题时,不容易取得一致,也会使得测试的信度不稳定。
效度指的是我们所获的证据在多大程度上支持我们根据分数所做出的推断,也就是考试是否检测到了它所要检测的东西,是否达到了它的预定目标。
效度共分为三种不同的类型,其不同类型的效度测试有各自不同的测试着重面,内容效度测试的目的是为了了解测试者在一些实际环境中是如何运作的,如果测试的样本能够充分代表总体,那么测试在内容上就是有效的,反之效度则不高;预测效度和共时效度都是属于与标准有关的效度,预测效度是标志测试者将来能力的标准,如通过摸底考试分班,共时效度是指一个测试结果与另一个同时使用的标准的结果的关系;构想效度是指要考察一个测试者在多大程度上和我们根据某一理论所作出的预测是否一致,也就是说验证的是我们所做的假设是否有效。
信度和效度是语言测试中的两个最重要的方面,两者之间既相互依存又相互对立,可以说二者是存在于对立统一的一个整体中。
语言测试是以语言能力为测量目标的,而语言能力又是抽象的,是通过具体的语言行为体现出来的,很难直接测量,因此在语言测试的目的是通过对受试者语言行为样本的测量结果来推测受试者的语言能力,在语言测试中效度反映所测试的语言行为和语言能力之间的关系,信度则是说明考试结果与语言行为的关系,没有信度只有效度的语言测试并不能真实反映应试者的语言能力,没有效度只有信度的语言测试也是毫无意义的,由此可见,信度和效度不仅在语言测试中扮演着重要的角色,而且二者之间的关系也是相互依存,密不可分的。
信度与效度在语言测试中二者是缺一不可的,这是两者之间的统一性。
但是另一方面,信度与效度在一定程度上又是相互对立,相互矛盾的,两者具有相互排斥的作用。
首先是量和质之间的矛盾,量的测量容易保持高信度,但是语言测试要实现效度,这就要求质的测量,量的测量要求测量对象必须是可数的,而我们所测量的语言不仅是语言形式结构的运用,而且还包括不可数不可见的语言运用能力,因此从本质上来讲,信度与效度之间就是对立的,矛盾的。
如果语言测试偏重信度,那么测试就可以设置为定量型,但忽略了效度;反之测试设置为定性型,那么就忽视了效度。
其次是有限的语法和无线运用之间的矛盾,一种语言的语法总是有限的,如果将它作为语言测试的目的,很容易保证语言测试的信度,但是语言测试又不能仅仅测试语言的语法,也要测试运用语言的能力,语言运用的能力又是不可见不可数的,将其作为语言测试的目标能力就很难去把握信度,因此这就是信度与效度的又一大矛盾。
最后是抽象的行为和具体的行为之间的矛盾,行为是目标能力的表征,如果把言语行为置身于没有真实语境的情况下,这种行为便是抽象的,语法规则越抽象,其概括性就越强,概括性强,抽样的外推性就越强,那么测试的可信度就高;反之,如果把言语行为置身于真实语境的情况下,那么这种行为就是具体的,行为越具体,作为抽样的外推行就越欠缺,那么信度自然也就不高,但是语言的测试的效度就会相应高很多。
关于语言测试中信度与效度之间的矛盾并不是只有这三点,应该有很多矛盾,如两分判断和连续判断的矛盾,分割法和整体法的矛盾,单维观和多维观的矛盾等等,但在论文中只参考课本罗列了三种说明论点即可。
语言测试中信度和效度存在着多方面的矛盾,在语言测试中应该如何正确处理两者之间的矛盾便成了需要解决的问题,查询资料后发现现在有四种不同的处理方式,分别是保证高效度,忽略信度;保证高信度,忽略效度;消极妥协和积极平衡,用信度高的形式测试效度高的内容,但是在这四种处理方式中都存在不同程度的问题,在目前的语言测试中采用的最多的方式是积极平衡,从而在科学的发展中不断在积极探索新的方法去完善语言测试中的不足。
在信度和效度难以
兼得的情况下,我觉得语言测试应首先考虑效度要求,然后在此基础上再追求信度的提高。
参考文献:
齐沪杨,陈昌来主编的《应用语言学纲要》
外语教学与研究出版社《语言测试的设计与评估》
上海外语教育出版社《语言测试要略》
温俭,杨华《论语言测试的效度与信度》。