测量工具的信度和效度分析.
- 格式:doc
- 大小:133.00 KB
- 文档页数:8
心理测量信度与效度分析在心理学领域,心理测量是一项重要的研究和应用工具。
而在心理测量中,信度和效度是两个至关重要的概念,它们对于评估测量工具的质量和可靠性起着关键作用。
信度,简单来说,就是测量结果的一致性和稳定性。
想象一下,你用同一把尺子去测量同一个物体的长度,每次测量的结果都应该比较接近,如果结果差异很大,那么这把尺子的信度就有问题。
在心理测量中也是如此,如果一个心理测验今天测出来一个人的某种心理特质是这样,明天再测又变成了另外一个样子,那这个测验就不可靠,信度低。
信度主要包括重测信度、复本信度、内部一致性信度等几种类型。
重测信度就是在不同时间对同一批被试进行相同的测量,然后比较两次测量结果的一致性。
比如说,给一组学生在本学期初做了一次智力测验,到期末的时候再做一次,看看两次结果是否相似。
复本信度则是使用两个平行的测验版本(也就是内容相似但题目不同的测验)对同一批被试进行测量,比较这两个测验结果的相关性。
内部一致性信度通常用于衡量一个测验内部各个项目之间的一致性,比如一份问卷中的各个题目是否都在测量同一个心理特质。
信度的高低受到多种因素的影响。
测量工具本身的质量是一个重要因素,如果题目表述不清、选项设置不合理,就容易导致测量结果不稳定。
被试的状态也会有影响,比如被试在两次测量之间经历了重大的生活事件,情绪和心理状态发生了很大变化,可能会影响测量结果的一致性。
此外,测量的环境和施测者的差异也可能对信度产生影响。
那么,如何提高心理测量的信度呢?首先,要确保测量工具的质量,题目设计要科学合理,经过充分的预测试和修订。
在施测过程中,要尽量保持环境的一致性,施测者要严格按照规定的程序进行操作,减少人为因素的干扰。
对于被试,要提前告知测量的目的和注意事项,让他们能够以稳定的状态参与测量。
说完信度,我们再来看效度。
效度指的是测量工具能够准确测量出所要测量的心理特质或概念的程度。
一个有效的心理测验应该能够真正反映出被试在特定心理特质上的真实水平。
10第十章信度与效度分析方法信度与效度是研究中经常涉及的概念,用于评估测量工具(问卷、测验等)的质量和可靠性。
本文将重点介绍常用的信度分析方法和效度分析方法。
信度是指测量工具能够稳定和一致地评估所要测量的概念或现象的程度。
信度分析主要包括重测信度、内部一致性信度和切割信度。
1.重测信度重测信度是通过对同一群体在不同时点进行两次测量得到的数据进行比较来评估测量工具的稳定性和一致性。
常用的重测信度分析方法包括相关系数法和检验差异法。
相关系数法可以通过计算测量工具在两个不同时间点的得分之间的相关系数来评价测量工具的信度。
一般认为,相关系数大于0.7表示信度较高。
使用检验差异法时,可以使用t检验或Wilcoxon符号秩检验来比较两次测量之间的差异。
2.内部一致性信度内部一致性信度是评估测量工具各个项目或子量表之间的相关性来衡量测量工具整体测量的一致程度。
常用的内部一致性信度分析方法包括Cro nbach's α系数、Kuder-Richardson公式20(KR-20)和Split-half 法。
Cronbach's α系数是最常用的内部一致性分析方法,一般认为,α系数大于0.7表示信度较高。
3.切割信度切割信度是评估测量工具中各个项目之间的一致性。
常用的方法包括检验差异法和相对切割信度系数。
检验差异法使用t检验或Wilcoxon符号秩检验来检验测量工具中各个项目之间的差异,一般认为,差异显著性水平小于0.05表示项目之间具有较高的切割信度。
相对切割信度系数通过计算测量工具中各个项目得分的标准差和总分的标准差之比来评估切割信度,一般认为,相对切割信度系数大于0.3表示切割信度较高。
效度是指测量工具能够准确地评估所要测量的概念或现象的程度。
效度分析主要包括内容效度、构效度和准确性效度。
1.内容效度内容效度是评估测量工具是否充分地反映所要测量的概念或现象的内容和特征。
常用的内容效度分析方法包括专家评分法、相关系数法和因素分析法。
信度和效度分析范文信度分析:信度是指测量工具在不同时间、不同测量者或不同测量内容下的稳定性和一致性。
如果测量工具具有高信度,那么它将能够产生相似或一致的结果。
以下是几种常见的信度分析方法:1.重测信度方法:重测信度方法是通过对同一组被试者进行两次以上的测量来评估测量工具的信度。
可以使用相关系数(如皮尔森相关系数、斯皮尔曼相关系数)来计算两次测试结果之间的相关性。
如果相关系数接近于1,则表明测量工具具有较高的重测信度。
2.分裂半信度方法:分裂半信度方法通过将测量工具分为两部分或多部分,然后计算这些部分得分之间的相关性来评估信度。
常见的方法包括将问卷的奇数题目和偶数题目分开计分,然后计算这两个得分之间的相关系数。
如果相关系数接近于1,则说明测量工具具有较高的分裂半信度。
3.内部一致性信度方法:内部一致性信度方法通过统计测量工具各个项目之间的相似性来评估信度。
最常见的方法是计算Cronbach's Alpha系数。
Cronbach's Alpha 系数越接近1,说明测量工具的内部一致性越高。
效度分析:效度是指测量工具能否准确地度量所要研究的概念或变量。
以下是几种常见的效度分析方法:1.内容效度:内容效度评估测量工具中各个项目是否能够充分覆盖研究的内容领域。
一般通过专家评审的方式来进行评估,专家将判断每个项目是否与所要研究的概念相关。
通常采用一致性指数来衡量内容效度,如简单一致性指数。
2.结构效度:结构效度评估测量工具所测量的概念结构的一致性。
可以使用因子分析或验证性因子分析来进行评估。
如果因子载荷值较高且具有合理的因子结构,那么测量工具就具有较高的结构效度。
3.判据效度:判据效度评估测量工具与其他已经被接受为有效的判据测量工具之间的相关性。
例如,对于一个测试学生的数学能力的测量工具,可以与学生成绩进行相关性分析。
如果相关系数较高,则说明测量工具具有较高的判据效度。
综上所述,信度和效度分析是量化研究中评估测量工具的关键步骤。
心理测量学中的信度和效度分析心理测量学是研究心理测量方法与技术的学科,旨在通过反映被测者的心理特征和过程,揭示其心理素质、智力水平等信息。
而在心理测量过程中,信度和效度分析是两个重要的概念。
一、信度分析信度是指测量工具在测量同一心理特征或过程时的稳定性和一致性。
换句话说,信度反映了测量工具在同一被测者群体中的结果是否稳定,并且是否能复现。
具体来说,信度分析主要从可靠性和稳定性两个方面来考量。
1.可靠性可靠性是指测量工具的结果是否稳定且一致。
在心理测量学中,一种常用的方式是通过内部一致性来评估可靠性,最常见的统计方法是Cronbach's α系数。
Cronbach's α系数介于0和1之间,数值越大代表内部一致性越高,通常要求α系数达到0.7以上为可靠。
2.稳定性稳定性是指测量工具在不同时间或在不同条件下所得到的结果是否一致。
为了评估测量工具的稳定性,常用的方法是再测法和半分法。
再测法是指在不同时间或条件下对同一样本重复测量,然后通过计算相关系数来评估稳定性。
而半分法则是将测量工具的题目分成两部分,分别进行测量并计算两部分得分的相关系数。
二、效度分析效度是指测量工具是否能够准确地测量所要测量的心理特征或过程。
也就是说,效度是评估测量工具是否真的测量到了我们想要测量的东西。
效度分析主要从描述效度、判别效度和预测效度三个方面来考量。
1.描述效度描述效度是指测量工具是否能够全面、准确地描述被测者的心理特征或过程。
具体来说,可以通过专家评定法和内容效度等方法来评估描述效度。
专家评定法是通过请相关领域的专家对测量工具进行评定,包括评估题目的合理性、适用性等方面。
而内容效度是指测量工具的题目是否充分、恰当地涵盖了被测者的心理特征或过程。
2.判别效度判别效度是指测量工具能否区分不同的心理特征或过程。
为了评估判别效度,常用的方法是构太效度。
构太效度是通过与已知测量工具或理论进行比较,来确定测量工具是否能够与其他相关测量工具或理论得到一致或相似的结果。
心理测量信度与效度分析在心理学领域,心理测量是一项至关重要的工具,它帮助我们了解个体的心理特征、能力水平和行为倾向。
而信度和效度则是评估心理测量工具质量的两个关键指标。
理解信度与效度对于正确使用和解释心理测量结果具有重要意义。
信度,简单来说,就是测量的可靠性或稳定性。
想象一下,你用一把尺子去测量一个物体的长度,如果每次测量的结果都差不多,那么这把尺子就具有较高的信度;反之,如果每次测量的结果差异很大,那么这把尺子的信度就很低。
在心理测量中也是如此,如果一个心理测试在不同时间、不同情境下对同一个人进行测量,得到的结果都比较接近,那么这个测试就具有较好的信度。
信度主要有以下几种类型。
重测信度是指在不同时间对同一组被试进行相同的测量,然后计算两次测量结果之间的相关性。
例如,我们对一组学生进行智力测验,两周后再次对他们进行相同的测验,比较两次测验的得分,如果相关性较高,说明该测验的重测信度良好。
复本信度则是使用两个内容相似但形式不同的测验版本,对同一组被试进行测量,然后比较两个版本测验结果的一致性。
内部一致性信度常用于衡量一个测验内部各个项目之间的一致性程度,比如通过计算克朗巴哈系数来评估。
那么,如何提高心理测量的信度呢?首先,测验的题目应该表述清晰、明确,避免产生歧义。
其次,测量的环境要保持稳定,减少外部因素的干扰。
再者,增加测验的长度通常也能提高信度,因为更多的题目可以更全面地反映被试的特征,从而减少随机误差的影响。
接下来,我们谈谈效度。
效度指的是测量的准确性或有效性,即一个测验能够真正测量到它想要测量的东西的程度。
如果一个智力测验确实能够准确地反映一个人的智力水平,那么这个测验就具有较高的效度。
效度可以分为内容效度、结构效度和效标效度等类型。
内容效度关注的是测验的内容是否涵盖了所要测量的领域的主要方面。
比如,一个数学考试如果能够全面覆盖数学的各个重要知识点,那么它就具有较好的内容效度。
结构效度则考查测验是否符合某种理论上的结构或模型。
信度与效度分析步骤信度与效度是社会科学研究中的重要概念,其对于研究结果的可靠性和有效性有着至关重要的影响。
在进行量表研究、问卷调查等量化方法的研究时,需要进行信度与效度分析,以确保研究结果的准确性。
下面将介绍信度与效度分析的步骤。
一、信度分析步骤1. 了解信度在进行信度分析之前,首先需要了解什么是信度。
信度是指量表或问卷的稳定性、一致性和可靠性程度。
在同样条件下,如数据的采集方式、研究对象、时间等条件不变的情况下,同一测验所得分数的一致性程度越高,则表明该测验的信度越高。
2. 测量信度的方法测量信度的方法有很多种,如测试重测法、平行测验法、内部一致性检验法等。
其中,测试重测法是最常用的方法之一。
该方法的基本思想是在不同的时间或条件下,对相同的受试者进行同一测验的重复测量,用相关系数或可信度系数来评价测试结果的稳定性和一致性。
3. 数据处理与分析在获得原始数据后,需要进行数据处理和分析。
常用的方法是计算相关系数和可信度系数。
常用的相关系数有皮尔逊相关系数和斯皮尔曼等级相关系数。
可信度系数是反映量表或问卷信度的最常用的统计指标之一。
常用的可信度系数有克朗巴赫α系数、Mcnemar法、Kappa系数、ICC系数等。
4. 结果解释最后需要对得出的数字进行解释,并结合实际情况来评估测量工具的信度程度。
一般来说,可信度系数越高,信度越高。
二、效度分析1. 了解效度效度是指测量工具所充分、准确地反映测量对象的特征和属性的程度,即测量工具所提供的信息与真实情况的匹配程度。
在进行效度分析之前,需要了解量表或问卷的检验目的和测量内容。
2. 提高效度的方法提高效度是所有研究中的重点,效度的提高有多种方法,如构思效度、判别效度、预测效度等。
在测量工具的设计初期,需要充分考虑效度,并进行合理的测量工具设计。
同时,还需要加强试题的设计和选择。
在进行测量之前,还需要对测量工具进行预测效度的检验,以确保测量结果的准确性。
3. 数据处理与分析在获得原始数据后,需要进行数据处理和分析。
统计学中的信度与效度在统计学中,信度与效度是涉及测量工具的两个重要却又常常相互关联的概念。
它们分别从不同的侧面来评估测量工具的质量和可靠性。
在科学研究、心理测量以及社会调查等领域,理解和掌握信度与效度的概念,对于研究结果的解释和应用至关重要。
本文将深入探讨信度与效度的定义、类型、影响因素及其在实际研究中的应用。
一、信度信度指的是测量工具在多次测量中所获得结果的一致性或稳定性。
换句话说,如果我们使用同样的测量工具对同一对象多次进行测量,理论上应该得到相似或相同的结果。
如果测量结果的一致性较高,则说明该测量工具具有良好的信度。
1. 信度的类型信度可以分为以下几种主要类型:重测信度重测信度是通过对同一组受试者在不同时间点使用同一测量工具进行测试,以评估其一致性。
若两次测量结果高度相关,说明该工具具有较高的重测信度。
内部一致性内部一致性评估的是测量工具内各个项目之间的一致性。
例如,在问卷调查中,针对某一特定特质的多个问题,若回答之间存在高度相关,说明问卷具有良好的内部一致性。
常用的评估方法是计算克朗巴赫α系数。
评分者间信度评分者间信度用于比较不同评分者对同一现象或对象进行评价时所给出的结果一致性。
当多个评分者对同一个被试进行评分时,如果他们的评分高度一致,则表明该测量工具具备良好的评分者间信度。
2. 信度的重要性信度在统计学研究中的重要性不可低估。
首先,高信度意味着研究结果稳定可靠,能够有效反映所要研究的对象特征。
同时,低信度可能导致统计分析结果的不准确,使得结论失去可信性。
因此,在设计研究时,确保所使用的测量工具具备较高的信度,是任何研究者必须关注的重要环节。
二、效度效度则是指测量工具是否能够准确地测量其所声称要测量的内容或特质。
简单来说,一个具备效度的测试应该能够区分出不同被试之间真实存在的差异,而不仅仅是能重复地得到相同结果。
1. 效度的类型效度一般可分为以下几种类型:内容效度内容效度指的是测量工具所包含内容是否全面代表了待测特质。
信度和效度检验方法
信度和效度是常用于科学研究中的两个重要概念。
一种测量工具只有
通过信度和效度的检验,才能够被认为是可靠的。
信度是指一个测量
工具在不同时间下得出的结果是否一致;效度是指测量工具所衡量的
内容是否与实际情况相符。
在本文中,我们将详细探讨信度和效度检
验方法。
一、信度检验方法
1.测试-重测法:这种方法需要在不同时间下对同一组参与者进行测量,然后将两次测量结果进行比较。
若结果相似,则说明该测量工具有很
好的信度。
2.内部一致性方法:这种方法通过分析同一个测试工具中各个题目之间的相关性来检验信度。
如果各题目之间的相关性较高,则说明该测量
工具有很好的信度。
3.切割半法:将测试工具中的题目一分为二,然后比较两个半部分得分的相关性操作。
若相关性较高,则说明该测量工具有很好的信度。
二、效度检验方法
1.试验效度:这种方法需要将测试工具与其他评估工具进行比较,以确定它是否正确地测量了特定变量。
2.构效度:这种方法通过分析测量工具是否与预期的变量进行了关联来检验效度。
如果两者相关性较高,则说明该测量工具具有很好的效度。
3.面向任务效度:这种方法需要将测试工具应用于实际任务中,看其是否能够有效地预测参与者的表现情况。
综上所述,信度和效度的检验方法可以确保测量工具的可靠性和准确性。
然而,这并不意味着所有测量工具都必须通过所有的检验方法。
研究者应该根据自己的需要来选择合适的方法,从而确保研究的可信
度和准确性。
测量工具的信度和效度分析常用的测量工具主要有调查问卷和量表,它们都是对个人行为和态度的一种测量技术,是测量答卷者对问卷题目主观认识的个体差异的工具,也是研究者用来搜集资料的一种技术。
一般情况下,编制一份量表必须做效度和信度评价,而调查问卷则不是必须的。
对于有些调查问卷,其包含了类似量表性质对答卷者客观指标测量的题目,对这部分题目需要进行效度和信度的评价。
第一节信度分析概述一、信度的概念信度是指测量工具的可靠性和稳定性的程度,或是指使用某测量工具所获得结果的一致程度或准确程度。
测量工具的信度包含2层含义:一是相同的个体在不同时间,以相同的测量工具测验或以复本测验,或在不同的情景下测验,是否能得到相同的结果,即测量工具的测验结果是否随时间和地点等因素而变化;二是能否减少随机误差对测量工具测验结果的影响,从而反映测量工具所要测量的真实情况,即测量工具是否具有稳定性、可靠性和可预测性。
信度的三个特征是:稳定性、内部一致性和等同性。
一个好的测量工具必须是稳定可靠,且多次测验结果应前后一致。
信度本质上是一个统计学概念,是用于估计测量误差大小的尺度,主要说明测量工具测验结果中测量误差所占的比例。
实际应用中主要通过构建平行测验来计算测量工具的信度。
二、信度的评价方法信度研究的是测量工具测验结果的可靠性与稳定性,这种可靠性与稳定性可以从4个不同的角度来评价:①在相同条件下所得测量工具测验结果一致程度;②不同研究者用同一种测量工具同时测验所得结果的一致程度;③同一研究者用同一种测量工具在不同时间内测验所得结果的一致程度;④同一答卷者在不同时间内对同一种测量工具测验的稳定程度。
根据研究角度不同,信度分为外在信度(external reliability)与内在信度(internal reliability)两大类。
外在信度是指不同时间测量时测量工具测量的一致性程度。
内在信度是指测量工具是否测量的是单一概念,同时也表明测量工具各项目之间的内在一致性程度。
衡量信度高低的统计指标是信度系数(r)来表示,r 〉0.75表明信度水平较高;r= 0.5-0.75表示信度处于中等水平低水平;r〈 0.5表示信度处于较低水平。
常见的信度系数有重测信度、复本信度、分半信度和Cronbach's系数等。
重测信度是最常用的外在信度,Cronbach's系数是最常用的内在信度。
三、信度的分析方法1重测信度(test-retest reliability)1.1定义:用同一工具两次或多次测定同一研究对象,所得结果的一致程度。
1.2指标:重测相关系数(r) r=0-1 ;r 越接近1,重测信度越高计算公式:r==∑X:第一次测试研究对象各得分之和∑Y:第二次测试研究对象各得分之和∑X2:第一次测试研究对象各得分平方之和∑Y2:第二次测试研究对象各得分平方之和1.3在SPSS中计算重测信度的步骤:在任务栏中选Analyze→correlate bivaviate→ varables→ pearson1.4使用重测信度需考虑的问题①两次测量间隔时间②研究工具所测量的变量性质:适用较稳定的变量:人格特征、能力、生活质量、某些生理指标。
③测量环境的一致,包括:物理环境、时间、测量程序与测试者等④样本量:预计样本的10%(10-20例1.5重测信度结果的影响原因:变量随时间推移而发生改变;第一次测量结果的记忆效应;被调查者对第二次测评的不认真;条目设置问题;答案的评分等级问题研究表明:采用同一份由204个问题组成的自填式医学问卷,对2352名病人进行两次调查,间隔30分钟,发现仅20%的人对所有问题两次回答一致,有5%的人对13个及以上的问题两次回答不一致。
2 复本信度(alternative form reliability):也叫等值性系数(coefficientOf equivalence)。
指两个大致相似的研究工具同时被用于研究对象,即题目不同但内容相似的两份测量工具。
复本信度越高,测量工具越可靠,越能代表所欲测量的内容。
计算方法是用两个复本间隔一定时间或同时施于同一答卷者所得分数的相关系数。
3分析测量工具内部一致性(internal consistency)的信度系数:适用于由多个条目组成的问卷或量表,是护理研究中最常用的信度测量方法。
种类包括:折半信度(split-half reliability)、Cronbach's a系数以及适用于计算二分类是非题同质性信度的库德-理查森20号公式(KR20)。
3.1折半系数:将测量工具(量表)的各项目分成两部分,分别加以计分,对这两个部分的数值进行相关分析,然后采用Spearman-Brown公式计算信度。
折半方法:奇偶折半法、前后折半法计算方法:先根据重测信度公式计算出相关系数r,再使用Spearman-Brown公式计算折半信度。
折半系数测定的缺点是:不同的折半方法会导致不同的结果,而Cronbach’a 系数与KR-20值所计算的是工具中所有项目的平均相关程度。
3.2 Cronbach’a系数:该系数是Cronbach于1951年创立的,取值范围在0-1之间,a系数越高,信度越高,测量工具内部一致性越好。
计算公式:α=N p/[1+p(N-1)在SPSS中计算重测信度的步骤:在任务栏中选Analyze→scale→ reliability→item→alpha3.3 KR-20:是Cronbach’a的一种特殊形式,适用于二分制的测量工具,例如回答“是”或“否”、“正确”或“错误”的测量工具。
计算公式:α= [k/(k - 1) ]. (δ2 -Σpiqi)/δ24 评分者信度:不同评定者使用相同的工具,同时测量相同的对象时,需计算评定者间一致程度。
检验方法:相关系数。
信度系数的计算有多种方法,各种方法所适用的信度类型也不同,因此在计算信度系数时必须认真考虑实际所求信度的类型,然后选择恰当的信度系数公式。
由于误差来源不同,即使同一个测量工具用不同方法所计算的信度系数也会不同,所以各信度系数间也不具有可比性。
一般在信度分析中,要分别报告不同方法计算出的信度值。
各种信度及其误差来源:重测信度:检验量表的稳定性,考虑的误差来源是时间取样。
分半信度:检验量表的一致性,它考虑的误差来源是内容取样。
内部一致性系数:检验量表的一致性,考虑的是测验内容是否异质。
评分者信度:检验量表的等同性,考虑的误差来源是评分者间的差别。
复本信度:检验量表的等同性,考虑的误差来源是内容取样。
四提高测量工具信度的方法1 适当延长测量工具的长度。
测量工具的题目越少,得分越容易受偶然因素的影响,测量工具的信度就越低;反之,测量工具题目越多,扩大了被测量者得分范围,在一定程度上排除了偶然因素的影响,提高了测量工具的信度。
但是测量工具长度的增加与测量工具信度的提高并不总成正比,当信度系数较小时,延长测量工具的题目,信度系数增加较大;而当信度系数较大时,延长测量工具的长度对信度系数的影响就较小。
2测量工具难度适中。
测量工具题目太难或太易都会使测量工具得分差异减小,从而降低了测量工具的信度。
3测量工具的内容尽可能同质。
4测验时间要充分,测验程序要统一,测量工具的评分要客观。
第二节效度分析概述一、效度的概念1 效度的定义:效度通常是指测量工具的有效性和正确性,即所用的测量工具能够测量出研究者所欲测量特性的程度。
效度是测量工具最重要的特征,效度越高表示该测量工具测验的结果所能代表要测验行为的真实度越高,越能够达到测验目的,该测量工具才越正确越有效。
对于一个标准测验来说,效度比信度更为重要,效度的大小由效度系数来表示。
效度包括了两方面的含义:其一是测量工具的测验目的;其二是测量工具对测量目标测量的精确度和真实性。
2 效度的性质效度是指测验结果的正确性或可靠性,而不是指测验工具本身;效度并非全有或全无,只是在程度上有高低不同的差别;效度是针对某一特殊功能或者某种特殊用途而言,不具有普遍性;效度无法实际测量,只能从现有信息作逻辑推断或对实证资料作统计检验分析。
3效度的分类①内在效度(internal validity)是指某特定测量工具中自变量与因变量之间存在因果关系的程度,反应测量工具的内容的正确性与真实性。
内在效度是测量研究工具中应具备的最基本的效度,测量工具的内在效度越高,其价值也越高。
②外在效度(external validity)是指研究结果的概括性和代表性,即研究结果可否推论到研究对象以外的其它受试者,或研究情景以外的其它情境。
一项研究越能实现以上目标,就表示该研究的外部效度越好。
二、效度的评价方法评价效度的指标有:表面效度(face validity)、内容效度(content validity)、效标关联效度(criterion-related validity)、结构效度(construct validity)、判别效度(discriminant validity)、聚合效度(covergent validity)、因子效度(factorial validity)等。
1表面效度( Face validity):定义:指通过粗略观察判断研究工具是否能测出所期望的概念。
表面效度属于一种直觉判断用“有”或“无”来评价,在阐述表面效度时,应详细报告评价者的特点及其评价的可信度。
缺点:缺乏科学性,不能体现效度在程度上差异2内容效度(content validity):2.1定义:指量表中条目反映所测量内容的程度。
即每个条目与所测内容的相关性,以及量表中条目是否充分地反映了测量工具所测的领域。
适用范围:问卷或量表形式的研究工具。
建立在大量查阅文献、工作经验、综合分析、判断的基础上。
2.2评价方法:专家组(expert panel)以文字形式评价评定,由专家对工具内容的合适性进行判断,一般需3个以上专家。
应包括社会心理学领域、相关领域的临床护理专家、护理教育专家。
专家资质要求:在本领域具有较高的学术水平;具有较高的教育背景;具有丰富的社会心理学知识;熟悉测量工具的发展与心理学特征测定的方法;严谨求实的科学态度。
2.3实施步骤:内容效度指数CVI公式( content validity index)专家两两配对成组,分别计算各组中两个专家都认为相关的条目数占总条目数的百分比。
如:AB-0.8 AC-0.9 AD-0.85、AE-0.9、BC-0.7、BD-0.8、BE-0.85、CD-0.7、CE-0.75、DE-0.75。
计算所有组的平均值,得到CVI为0.83、效标效度(criterion-related validity)定义:以一个公认有效的研究工具作为标准,检验新工具与标准工具测定结果的相关性。