测验的效度(新教材)
- 格式:ppt
- 大小:1.09 MB
- 文档页数:2
测验的效度的名词解释测验是一种常用的评估工具,用于评估个体在特定领域的能力、技能或知识水平。
然而,仅仅进行一场测验并不足以确定其有效性。
在评估中,一个重要的概念是测验的效度(validity),它涉及到测验是否能够准确地衡量我们想要评估的内容。
效度是一个相对复杂的概念,它包含多个维度,旨在提供测验结果的可靠性和准确性。
下面将对一些常见的效度类型进行解释,并探讨它们在测验设计和解释中的重要性。
1. 内容效度(Content validity)内容效度关注的是测验是否涵盖了完整的评估领域。
简而言之,内容效度涉及测验内容是否充分、全面地反映了目标领域的重要特征和要求。
在设计或选择测验时,我们需要确保测验项(如题目、任务)覆盖目标领域的各个方面,并区分不同水平的表现。
例如,一场针对学生数学能力的测验在内容效度方面,需要涵盖不同难度级别的数学题目,包括基础概念、运算技能和问题解决能力等。
如果测验只包含简单的计算问题,那么它的内容效度就会受到质疑,因为它没有涵盖数学能力的全面范围。
2. 结构效度(Construct validity)结构效度关注的是测验项目和测验整体结构与被评估领域的概念结构之间的联系。
简而言之,结构效度涉及测验能否正确地衡量和区分不同的能力或维度。
举个例子,假设我们设计了一场针对大学生英语能力的测验。
如果测验包含了不同维度的英语技能,如词汇、语法、听力和口语等,并通过测验结果得出一个综合的英语能力评分,那么这场测验就具备了良好的结构效度。
3. 预测效度(Predictive validity)预测效度关注的是测验是否能够准确地预测被评估领域的未来表现。
这对于许多评估来说是至关重要的,尤其是在教育和职业背景中。
例如,大学招生考试常用的高中学业水平考试(SAT)被广泛用作预测大学入学成功的指标。
如果考试结果与大学的学业成绩和毕业率之间存在着较强的关联,那么就可以说该考试具备了较高的预测效度。
教育学出题的信度效度一、效度(一)效度的涵义测验的效度指的是测验的正确性和有效性。
换言之,效度指的是测验能在多大程度上实现测验的目的。
效度是科学测验工具最重要的质量指标。
能测出来想测量东西的程度,则效度高;测不出来,则效度低。
例如:想要测量小明的身高,测量工具是秤,那么,测量不出想要测量的东西,则效度低。
(二)效度的类型根据测量的问题不同,可以分为三类,即内容效度、构想效度、预测效度。
1.内容效度内容效度指的是测验所选取的项目是否符合所要测量的东西,其代表性是否适当。
例如:要测量小学生现代文的阅读能力,就应该选取适合他们的现代文。
假如选取了文言文,则不能测出他们现代文的阅读能力,说明该试卷缺乏内容效度。
2.构想效度构想效度是指测验对某种理论的符合程度,其目的在于用心理学的理论观点对测验结果加以解释及探讨。
简而言之,构想效度就是从某一理论出发,根据理论构想有关的假设,据此设计和编制测验,然后由果溯因,审查结果是否符合心理学的相关理论。
例如:假设学生获得语言知识的能力会随着年龄的增长而不断提升。
测验后,发现确实是这样,那么,构想效度较高。
3.预测效度指的是一个测验能够预测学生将来某种特定行为或表现的程度。
预测得越准,效度就越高。
例如:李老师预测小明经过一个星期的学习后,数学成绩会有所提高。
事实确实是,那么构想效度较高。
二、信度(一)信度的涵义测验的信度又叫做测验的可靠性,指的是测验的一致性程度,即多次测验结果要保持一致。
信度指标通常以相关系数表示,即用同一被试样本所得的两组资料的相关系数作为测量一致性的指标,成为信度系数。
例如:想要测量小明的性格是什么样的,测验结果发现,第一次测验是内向,第二次测验是外向,第三次测验是中性的,那么它的信度比较低。
(二)信度的类型1.再测信度用同一组被试对同一测验前后两次施测的测验得分的相关系数表示信度,它反应测验分数的稳定程度。
例如:用同一张智力测验试卷对同一组人去进行测验,前后两次测验后的结果一致,则表明这份智力测验信度高。
心理测量学知识第四节测验的效度第一单元效度的概念一、效度的定义。
效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说,是指一个心理测量的准确性。
在测量理论中,效度被定义为在一组测量中,与测量目标相关的真实方差与总方差的比率。
二、效度的性质。
(一)效度具有相对性在评鉴测验的效度时,必须考虑其目的与功能。
(二)效度具有连续性效度和信度的关系:1、信度是效度的必要而非充分条件2、效度是受信度制约的。
第二单元效度评估的方法美国心理学会在1974年所发行的《教育与心理测量之标准》一书中将效度分为三大类:1、内容效度2、构想效度3、效标效度一、内容效度(一)什么是内容效度。
内容效度指的是测验题目对有关内容或行为取向的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。
(二)内容效度的评估方法1、专家判断法请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。
如果专家认为测验题目恰当地代表了所测内容,即测验具有内容效度。
内容效度又称逻辑效度。
为了使内容效度的确定过程更为客观,可采用如下步骤:(1)定义好测验内容的总体范围(2)编制双向细目表(3)制定评定量表来测量测验的整个效度。
2、统计分析法除了描述性语言外,内容效度的测验也可采用一些统计分析方法。
例如计算两个评分者之间评分的一致性。
再测法也可以用于内容效度的评估。
3、经验推测法:这种效度是通过实践来检验效度。
(三)内容效度的特性在编制测验时,表面效度是一个必须考虑的特性。
编制最高行为测验,除了内容效度,也要求有较高的表面效度。
二、构想效度(一)什么是构想效度构想效度的概念是1954年提出来的,也有人翻译成构思效度,还有人叫结构效度。
它主要涉及心理学的理论概念问题,是指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。
(二)构想效度的估计方法1、对测验本身的分析(1)测验的内容效度可以作为构思效度的证据。
第四章效度信度解决的是测验分数是否可靠的问题,但即使一个测验分数有跨时间的稳定性和跨情境的一致性,却不能保证测验分数代表了被试的真实水平。
比如说,某测验的目的是测量能力,但测题却都是一些死记硬背的知识,测验分数是不能代表被试真实能力水平的。
这就涉及了测量的客观性和准确性问题,即测验的效度问题。
第一节效度概述一、效度的概念测验的效度(validity)指的是测验的有效性,即测验分数能够代表所要测量的心理特质的程度,或测验结果达到测验目的的程度。
任何测验对所要测量的心理特质的测量都不是绝对客观和准确的。
一些编制得好的智力测验一般是效度较高的,但也免不了受智力之外的因素的影响。
因为测验的题目必然要从人们的生活实践中选材,来自不同生活背景的人对同一个测验题目的熟悉程度是不同的,即使智力相同,测验分数也会不同。
因此人们的知识经验就成了影响测验分数的无关因素之一。
研究表明,文化和种族因素会造成测验的不公平,因为与测验分数有关的并不完全是智力。
人格和成就测验同样存在无关因素影响测验分数的问题。
效度总是针对一定的测验目的而言的。
例如,用编制得好的人格测验测量人的个性,诊断心理障碍是有效的,即有一定效度,但若用来测量智力,测量结果就是无效的。
因为人格与智力无关,故分数的高低不能代表智力的高低。
以上讨论的是心理测量中的效度问题,在物理测量中,效度问题也是同样存在的。
如,用不标准的尺子量物体,用不准确的称去称物体,都会使测量的结果不准确。
可见,效度是由于测量工具(量尺)本身的问题造成的,在多次测量中都会恒定地出现而无法消除,因而称系统误差。
测量的效度问题是测验结果中包含了多大比例的系统误差的问题,系统误差可能是由以下几方面原因造成的:(1)所要测量的特质有多方面的含义,而量表本身未能全部包含这些方面;(2)测验题目中包含了与所测特质无关的题目;(3)记分方面的问题,如选择题的备选答案是不全面的,即没有完全体现被试情况的差异,因此答案就不是足够准确的,而且各题目得分是简单累加而未经加权处理,不同题目的重要性程度就没有得到区分。