统一构念效度及其特性
- 格式:pdf
- 大小:87.21 KB
- 文档页数:1
论心理学构念及其测量效度的估计论心理学构念及其测量效度的估计【作者】李朝旭/李竹琴〔内容提要〕本文试图澄清学界长期以来对“心理学构念”不够准确的模糊认识,并讨论了构念效度及其估计方法。
笔者认为,构念效度在心理学研究中扮演着非常重要的角色,尤其是在社会心理学领域的研究中。
对于一个特定的量具而言,有两类资料可以作为其构念效度的证据,一是关于所测构念的本质的资料,一是关于该构念影响因素的资料。
〔关键词〕构念心理学构念构念效度构念效度的估计对于心理学的学科性质,中国人一直在争论不休,至少已经辩论了半个世纪的时间。
现在,国家教委最终把心理学类专业确定为理科专业(专业类别代码为0715)[1][2],从此以后,心理学专业和应用心理学专业的本科毕业生应授予“理学士”学位,而不再是“教育学学士”学位。
我们认为心理学之所以被视为理科专业的原因之一,是与心理学研究中对测量、统计的高度重视分不开的。
哲学家探讨形而上学的问题时,他们无须依赖测量技术;文学家激昂文字时,也用不着测量;唯独心理学家无论在哪一个分支的研究中,大都要对所探讨的心理学构念进行操作化、数量化,然后再借助统计手段来分析。
然而,我国心理学研究的现状并非如此理想化,存在着的一个主要问题就是仍有某些研究的构念不清晰、测量效度不高。
那么,什么是构念呢?构念效度的确切涵义又是什么?如何对一个心理量具的构念效度进行估计?一何谓构念“构念”这一概念是与构念效度的提出有密切关系的。
“构念效度”在英文中是construct validity,最早出现于美国心理学会(1954)制定的《心理测验与诊断技术的技术推介》(即《教育与心理测验标准》的初版)之中,翌年由克龙巴赫(L.J. Cronbach )和米尔(P. E. Meehl)两人在一篇经典性的文章中系统地提出这一概念[3]。
国内心理学界及教育测量学工作者在引进“构念效度”这一术语时,形成了两种有代表性的译法,即以郑日昌(1987)[4]、王重鸣(1990)[5]为代表的一部分学者主张译作“构想效度”或“构思效度”(“建构效度”的译法也属于这一类),而以戴忠恒(1987)[6]、王汉澜(1987)[7]为代表的另一部分学者主张译作“结构效度”。
效度的标准-回复效度的标准是评价一个测量工具是否能够准确地衡量所要测量的特质或概念的程度。
它是心理学研究中非常重要的概念,因为一个测量工具的效度决定了它的信用度和可靠性。
在本文中,我们将逐步回答关于效度的标准的问题,并解释如何评估一个测量工具的效度。
一、内容效度内容效度是指测量工具是否能够全面和准确地反映出所要测量的特质或概念。
它关注测量工具中包含的所有项目是否反映了所要测量的特质的各个方面。
评估内容效度的常用方法是专家评议法。
在这种方法中,专家们会对测量工具的项目进行评估,确定每个项目是否包含了特质的相关方面。
他们的意见和反馈将用于决定测量工具是否具有良好的内容效度。
二、构念效度构念效度是指测量工具是否能够衡量所要测量的特质或概念,以及与其他相关特质或概念之间的关系。
评估构念效度的方法之一是相关效度。
这种方法通过与测量工具所要测量的特质有关的其他已经被广泛研究的特质进行比较,来确定是否存在相关关系。
如果两个特质之间存在显著的正相关或负相关关系,那么可以认为测量工具具有良好的构念效度。
三、判准效度判准效度是指测量工具是否能够与其他已经被广泛接受的测量工具进行比较,以确定它们之间是否存在一致性。
这种效度可以通过与其他测量同一个特质的工具进行相关性研究,来评估测量工具的准确性和一致性。
如果测量工具与其他被认可的工具之间存在高度显著的相似性,那么可以认为它具有良好的判准效度。
四、预测效度预测效度是指测量工具是否能够预测未来的行为或结果。
它可以通过与所要预测的特质或概念相关的相关变量进行比较来评估。
如果测量工具能够准确地预测未来的行为或结果,那么可以说它具有良好的预测效度。
以上是关于效度的标准的简要介绍。
要评估一个测量工具的效度,需要考虑其内容效度、构念效度、判准效度和预测效度。
不同的效度标准在不同的研究领域有不同的重要性和适用性。
因此,在选择和使用测量工具时,研究者应根据研究目的和领域的需求,合理选择和评估测量工具的效度。
⼼理学中的各种信度和效度⼼理学中的各种信度和效度⼀、信度所谓信度,指的是测量结果的稳定性程度,其操作定义是,信度乃是⼀个测验X与它的任意⼀个“平⾏测验X'的相关系数。
⽆关因素、测验的长度、测验试题的区分度、被试团体的代表性都会影响信度。
(⼀)重测信度1、定义:利⽤同⼀量表,让同⼀被试群体在不同时间两次施测之后的相关值。
这⼀信度值表⽰的是测验结果的稳定性,故也称之为稳定性系数。
2、形式:施测——经过适当时间——再施测3、举例:假设有⼀份主观幸福感调查表,先后两次施测于10名学⽣,时间间隔为半年,结果如下表所⽰,求该测验的重测信度。
4、使⽤的前提条件(1)所测量的⼼理特质必须是稳定的。
(2)遗忘和练习的效果基本上互相抵消。
(3)在两次施测的间隔期内,被试在所要测查的⼼理特质⽅⾯没有更多的学习和训练。
5、注意事项(1)有些测验不宜采⽤重测法估计信度,如测量推理和创造⼒的测验。
那些不易受重复使⽤影响的测验才能⽤再测法估计信度。
如感觉运动测验、⼈格测验。
(2)两次测验间隔的时间要适当,并注意提⾼被试的积极性(3)测验⼿册中报告重测信度时应说明两次施测的间隔,以及在此期间内被试的有关经历(4)时间间隔的把握:适宜时间间隔依照测验⽬的、性质及被试特点⽽定,可以是⼏分钟甚⾄⼏年。
例如对于年幼⼉童的间隔要⼩;年长群体的间隔可⼤。
但智⼒测验的间隔不能太短,成就测验的间隔不能太长。
⼀般间隔时间不超过六个⽉,既不能让被试记住上⼀次测验的内容,⼜不能让其特质发⽣变化,或对所学知识产⽣遗忘。
6、重测信度的评价:(1)优点:能够提供有关测验结果是否随时间⽽变异的资料,可作为预测受测者将来⾏为表现的依据。
(2)缺点:易受练习和记忆的影响,前后两次施测间隔的长短必须要适度。
(⼆)复本信度1、什么是复本:任何测验只是所有可能题⽬中的⼀份取样,所以可编制许多平⾏的等值测验,叫做复本。
复本等值要符合下列条件:(1)各份测验测量的是同⼀种⼼理特性。
知识文库 第14期64 语言测试中的构念效度研究王天予1.引言在考虑到语言测试发展、解释和使用时首要考虑的就是效度。
那么什么是构念效度?如何更好地理解构念效度?该效度与其他效度的不同之处是什么?2.构念及构念效度 2.1构念要想理解什么是构念效度,首先要明白什么是构念(construct)。
从心理学的角度来看,构念指的是人类头脑中存在的一种特质、水平、能力或技巧(Brown,2000:9)。
在教育测量领域,构念就是一种能力(Wiley,2002),“指成功完成特定任务所要求的人类特征”。
Ebel 和Frisbie(1991:108)将构念解释为“有关人类行为某一方面的心理构建或理论概念,是既不能够直接测量也不能够直接观察的。
”构念效度是指某个心理测验在多大程度上正确地验证编制测验的理论构想。
《标准》(APA,1999)将构念视为一个测验拟测的概念或特征。
这是从广义上将构念来指测验所涉及测量的概念或特征。
实际上,构念的选择对考试内容、考试方式和分数意义的解释息息相关,是效度研究的基础,也对考试的设计和评价起着重要的作用。
2.2 构念效度如何更好的理解构念效度呢?在教育测量领域,上述讨论的内容效度、准则关联效度和构念效度这三种类型效度都是作为整体构念效度的不同方面。
语言测试者认为这种把构念效度作为整体观点是一种新的发展。
理论界对构念的定义有不同的看法,因此,通过识别他们是如何解释应答一致性来定义构念(Messick 1981) 。
Loevinger(1957:636)最早提出要把构念效度作为整体效度来看待。
在80 年代, 这一观点逐渐得到人们的认同: 构念效度不再作为效度的一种证据,而应包括内容和标准证据、信度及其它与理论验证有关的方法 (Messick 1975, 1980, 1988, 1989; Anastasi 1986)。
其中影响最大的是 Messick 的“效度整体观”。
Messick (1988,1989)进一步丰富了效度理论,对测试的解释和使用提供了证据基础。
语言测试构念效度理论:发展、贡献与挑战
高怀勇;刘峰;戢焕奇
【期刊名称】《东北师大学报:哲学社会科学版》
【年(卷),期】2013()5
【摘要】构念效度自20世纪50年代提出以来,经历了一个从无到有,从"三足鼎立"到"核心地位"的过程,逐渐成为语言测试评价中最重要的考量因素。
随着统一效度观的逐渐确立,构念效度理论在取得新进展的同时却伴随着诸多问题和挑战。
本文在梳理分析构念效度发展轨迹的基础上,重点讨论在统一效度框架下构念效度理论之贡献及其面临的问题和挑战,并提出了笔者的观点和立场。
【总页数】4页(P135-138)
【关键词】构念效度;语言测试;发展;贡献;挑战
【作者】高怀勇;刘峰;戢焕奇
【作者单位】四川农业大学文法学院
【正文语种】中文
【中图分类】H310.41
【相关文献】
1.语言测试中的构念效度研究 [J], 王天予;
2.国内语言测试构念效度验证研究近十年来的发展 [J], 张春青;
3.语言测试中构念效度的影响因素研究 [J], 王天予
4.国内语言测试构念效度验证研究近十年来的发展 [J], 张春青
5.计算机化语言测试的效度研究——浅析计算机能力与测试构念的关系 [J], 金艳因版权原因,仅展示原文概要,查看原文内容请购买。
构想效度(construct validity):亦称“构念效度”“结构效度”。
效度最重要的一种。
美国心理学家克龙巴赫和米尔1955年提出。
测验对理论上的构想或特质的测量程度。
确定方法主要有:(1)测验内法,确定测验的内容效度、分析被试的反应过程、考查测验的同质性等;(2)测验时间法,考查测验的聚合效度、区分效度、因素效度等;(3)效标关联法,计算测验结果与某一效标之间的相关程度;(4)实验操作法,通过控制实验条件,观察测验分数的变化。
构想效度的出现,是自比内发明智力测验以来,测验领域中最为显著的变化,至今仍影响着测验领域。
区分效度(differential validity):与“聚合效度”相对。
不同特质的测验结果之间的相关程度。
相关程度越低,说明测验之间区分效度越好。
聚合效度(convergent validity):与“区分效度”相对。
不同测验测定同一特质的测验结果之间的相关程度。
相关程度越高,说明测验之间聚合程度越好,即不同测量方式应在相同特质的测定中聚合在一起。
内容效度(content validity:)测验项目对相关内容或行为领域的代表性取样的适当程度。
反映测验项目在多大程度上与预测量或预测的内容相一致。
确定方法主要有:(1)专家评定,由相关领域专家对测验项目与所涉及内容范围进行符合性判断;(2)统计分析,由两个独立取自同样内容范围测验分数的相关来表示;(3)经验法,通过多次测验实践积累判断的标准和原则,同时与表面效度相区分。
一个测验要具备较好内容效度须满足两个条件:(1)清晰界定内容范围,使测验全部项目均在此范围内。
内容范围包括具体知识或技能、复杂行为。
成就测验特别重视内容效度。
(2)测验项目应是内容范围内代表性样本,即选出的项目能够代表内容范围的主要方面,并使各部分项目比例适当。
效标关联效度(criterion-related validity):亦称“效标效度”“实证效度”。
效度类指标引言在社会科学研究中,效度是一个重要的概念。
它用来评估一个测量工具或实验设计的质量和准确性。
效度类指标是用来衡量研究工具或方法是否能够准确地衡量或预测所要研究的现象或变量。
本文将对效度类指标进行详细介绍,并探讨其在研究中的应用。
效度的定义和分类效度是指测量工具或方法是否能够准确地衡量或预测所要研究的现象或变量。
它反映了研究工具的信度和有效性。
一般来说,效度可以分为内部效度和外部效度。
内部效度内部效度是指测量工具或方法在特定样本中是否能够准确地衡量所要研究的现象或变量。
内部效度可以通过以下几个方面进行评估:1.构念效度:构念效度是指测量工具是否能够准确地反映出所要研究的概念。
例如,如果我们想要测量一个人的幸福感,那么我们需要确保所设计的问卷能够全面而准确地衡量幸福感的各个方面。
2.信度:信度是指测量工具在重复测量同一样本时的稳定性和一致性。
常用的信度指标包括重测信度、等价形式信度和内部一致性信度。
高信度意味着测量工具在不同时间或条件下的结果是相似的。
3.内容效度:内容效度是指测量工具是否包含了所要研究的所有重要方面。
评估内容效度可以通过专家评审、文献综述和逻辑推理等方法进行。
外部效度外部效度是指测量工具或方法在不同样本中是否能够准确地衡量所要研究的现象或变量。
外部效度可以通过以下几个方面进行评估:1.相关效度:相关效度是指测量工具与其他已经被广泛接受为有效的测量工具之间的相关性。
如果一个新设计的测量工具与已有的有效工具之间存在高相关性,那么它就有较高的相关效度。
2.预测效度:预测效度是指测量工具对未来结果或行为进行预测的能力。
例如,如果一个心理测试能够准确地预测一个人的学术成绩,那么它就具有较高的预测效度。
3.构念效度:构念效度在内部效度中已经提到,但它也可以用来评估测量工具在不同样本中的外部效度。
如果一个测量工具在不同样本中都能够准确地反映出所要研究的概念,那么它就具有较高的构念效度。