当前位置：文档之家› 第四章测验信度作业

第四章测验信度作业

第四章测量信度

一、单选题

1.速度测验的信度应以( c )取得。d

A．奇偶法 B.筛选法 C.反应时法 D.重测法

2.在其他条件均等的情况下，测验长度和信度之间的关系是( d )。b

A.测验越长，信度越低

B.测验越长，信度越高

C.没有关系

D.上述说法都不正确

3.计算一项测验的分半信度最常用的方法是比较( b )。

A.测验的前半部分与后半部分的得分。

B.奇数项目与偶数项目的得分。

C.将测验随机分为两部分,比较这两部分的得分。.

D.上述方法都可以。

4.一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少?

( b )

A. 0.50

B. 0.67

C. 0.80

D. 1.0

5.当测验的信度减少(接近0)时,测量的标准误将会怎样变化(c )?

A.减小,趋向于零。

B.只要趋向于1.0,它就会要么增大,要么减小。

C.增大,趋向于测验的标准差。

D.增大,逼近无限大。

6.再测信度所考虑的误差来源是(d )所带来的随机影响。

A.形式的不同

B.题目的不同

C.考生的不同

D.时间的不同

7.在考查评分者信度时,如果三人以上评阅数份试卷,则需计算( a )。

A.肯德尔和谐系数

B.等级相关系数

C.皮尔逊积差相关系数

D.克伦巴赫α系数

8.(a )是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。

A.信度

B.效度

C.难度

D.区分度

9.信度只受(d )的影响。b

A ．系统误差 B.随机误差 C.恒定效应 D.概化理论

10.复本信度又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系效。复本信度反映的是测验在( c )上的等值性。d

A.时间

B.题目

C.评分

D.内容

11.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系效。这个相关系数就代表了( d )内容取样的一致程度。

A.原测验

B.所有条目之间

C.题目与分测验之间

D.两半测验

⒓.斯皮尔曼―布朗公式21tt hh hh r r r =+式中hh r 为(c )的相关系数, tt r 为测验在原长度时的信度估计值。

A.全测验

B.原测验

C.一半分数

D.全部分数

13.同质性信度主要代表测验内部( b )间的一致性。

A.两半测验

B.所有题目

C.题目与分测验

D.分测验

14.KR 20公式、KR 21公式有别于克伦巴赫α系数的是,它们只能用于( b )。

A.多项选择题

B.是非题

C.简答题

D.论述题

15.一般要求在成对的受过训练的评分者之间平均一致性达到(c )以上,才认为评分是客观的。

A. 0.70

B. 0.80 c. 0.90 D. 1.00

16.确定可以接受的信度水平的一般原则是,当(a )时,测验不能用于对个人做出评价或预测,而且不能作团体比较。

A. tt r <0.70

B. 0.70≤tt r <0.85

C. tt r ≥0.85

D. tt r =1.00

17.一般而言,若获得信度的取样团体较为异质的话,往往会(a )测验的信度。

A.高估

B.低估

C.忽略

D.不清楚

18.对于不同平均能力水平的团体,题目的(b )会影响信度系数。a

A.难度

B.区分度

C.信度

D.效度

19.一个包括40个题目的测验信度为0.80,欲将信度提高到0.90,通过斯皮尔曼―布朗公式的

导出公式计算出至少应增加(d )个题数。

A. 40

B. 60

C.100

D. 50

20.以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越(a )。

A.大

B.低

C.小

D.不变

21.如果某测验的信度系数为0.81,那么该测验中真分数造成的变异占(a )。

A. 81%

B.19%

C.9%

D.18%

22.在能力测验中,代表测验量表的稳定性和一致性的指标是(c )。

A.效度

B.区分度

C.信度

D.难度

23.衡量测验内部一致性的指标是(a )。c

A.重测信度

B.肯德尔和谐系数

C.α系数

D.复本信度

24.分半信度求出后通常需要进行校正,通常用(b )校正。

A.α系数

B.斯皮尔曼—布郎公式

C.KR20公式

D.肯德尔W系数

参考答案:1.D 2.B 3.B 4.B 5.C 6.D ⒎A ⒏A 9.B 10.D 11.D 12.C 13.B 14.B 15.C 16.A 17.A 18.A 19.D 20.A 21.A 22.C 23.C 24.B

二、多选题

1.以下哪些因素会导致测验信度被低估?(abd )abcd

A.测验的题目难度过高

B.被试的同质性太高

C.测验题目很多

D.测验的题目难度过低

=，公式中SE为测量的标准误，从公式中可以看出，测量的标准误与信2．SE S

度之间的关系是( bd )。

A. 信度越低，标准误越小

B.信度越低，标准误越大

C. 信度越高，标准误越大

D.信度越高，标准误越小

3.复本信度的缺点有(bcd )。abd

A. 如果测量的行为易受练习的影响，则复本信度只能减少而不能完全消除这种影响。

B. 由于第二个测验只改变了题目的内容，已经掌握的解题原则可以很容易地迁移到同类问题。

C. 能够避免重测信度的一些问题，如记忆效果、学习效应等。

D. 对于许多测验来说，建立复本是十分困难的。

4.一般来说,在一个测验中增加同质的题目,可以使信度提高。下列描述中正确的是(b

d )。abd

A．测验越长，测验的测题取样或内容取样就越有代表性。

B. 测验越长，被试者受猜测因素的影响就越小。

C. 测验越长，越遵循报酬递增率原则。

D．测验太长,有时反而会引起被试者的疲劳和反感而降低可靠性。

5.信度系数在解释个人分数的意义时的作用是( ac )。bc

A.估计误差分数的范围

B．估计真实分数的范围

C.了解实得分数再测时可能的变化情形

D.了解误差分数的大小

6.信度是指测验结果的(a d )。

A．可靠性 B.有效性 C.特殊性 D.一致性

7.计算内部一致性信度常用的指标包括(abd )。

A.分半信度

B.克伦巴赫α系数

C.肯德尔W系数

D.KR20。

8.下列信度类型中受测量的时间间隔影响的有(ad )。

A.重测信度

B.复本信度

C.分半信度

D.重测复本信度

参考答案:1.ABCD 2.BD 3.ABD ⒋ABD ⒌BC 6.AD 7.ABD 8.AD

三、概念题

1.克郎巴赫α系数

2.测量的标准误

四、简答计算题

1.指出各种信度系数所对应的误差来源。

2.已知“16人参加一次测验后在奇数题和偶数题上的得分情况，试用两种以上方法估计测量信度。

解：r=0.89

3.已知某态度量表有6道题，被试在各题上得分的方差分别是0.80、0.81、0.79、0.78、0.80、0.82，测验总分的方差为16.00，求α值。

解：

4.信度的影响因素有哪些?怎样提高测量信度?

5.某智力测验的信度r=0.75，某次施测得到分数的标准差为3.00，则该测验的标准误是多少?若某被试得分为100，试估计其真分数95%的置信区间?

解：Se=2.5 95.1~104.9

6.甲被试在韦氏成人智力量表测验中言语智商为102，操作智商为110。已知两个分测验都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的信度为0.93和0.94，问：甲被试的操作智商是否显著高于言语智商?

解：

7.如何根据测验的类型选择信度的估计方法?

答:测验信度是测验在测量它所测特质时得到的分数(测值)的一致性。它反映了测验工具对各种随机误差控制的好坏，是测验性能的重要质量指标。由于真分数无法直接得到，因而通常需要采用重测法、复本法、分半法和内部一致性系数等几种方式来估计信度，但由于每一种方法都特别强调了对某方面误差的控制，因此，它们并不适用于所有类型的测验。重测法多用于所测特质是相对稳定的测验。如智力测验、能力倾向测验和人格测验等。复本法和分半法多用于学业成就测验和智力测验。内部一致性系数多用于智力测验、能力倾向测验和个性测验，但当测验所测特质包含性质不同的方面时，不能采用内部一致性系数。以上信度系数估计方法的选择是相对的，实践中可根据测验目的、性质不同采取多种估计方法。

8.为什么可以用标准误估计个人测验分数的误差?

解：

9.在一次测验中,有些学生得了80分,已知这次测验的标准差为5,信度系数为0.84，如再测一次他们的分数将改变多少?

解：1.96Se=3.92

10.已知某个测验的信度为0.75，要使该测验的信度达到0.90，必须增加多少题目?

解：n=3，增加到原来的3倍

11.为节省测验成本，将某个信度为0.98的测验由500题减为300题，则信度变为多少?(结果保留两位小数)

解：r=0.967

12. 一个包括10个题目的测验，信度为0.5，若增至50个题目，其信度将是多少?

解：r=0.83

信度与效度的关系

研究信度与效度的关系一、信度与效度的定义信度即可靠性，它指的是采取同样的方法对同一对象重复进行测量时，其所得结果相一致的程度，或者说，信度是指测量结果的一致性或稳定性。效度即准确度,它是指测量工具或测量手段能够准确测出所要测量的变量的程度，或者说能够准确、真实地度量事物属性的程度.二、信度与效度的关系 (一)教育科学研究中信度与效度的关系信度是研究结果所显示的一致性、稳定性程度，也是对研究结果一致性和稳定性的评价标准。一个具有信度的研究程序，不论其过程是由谁操作，或进行多少次同样的操作，其结果总是非常一致的.效度是一个研究程序的性质和功能，也是对研究结果正确性的评价标准，一个有效度的研究程序，不仅能够明确地回答研究的问题和解释研究结果，而且能够保证研究结果在一定规模的领域中推广。把两者的作用结合起来看，信度和效度是一项教育科学研究活动和结果具有科学价值和意义的保证。研究的信度是研究的效度的一个必要的前提，没有信度,效度不可能单独存在，也就是说，一项研究不可能没有信度却具有效度。（二）人力资源招聘信度与效度的关系影响测评信度的因素有很多，主要是系统误差和随机误差.包括测评者的专业性和素质、被测评者本人的心理、侧评工具的稳定性、

环境的稳定性等都会影响测评的可信度。影响测评的效度因素也有很多，如测评工具、测评过程及测评者因素、被测评者状态、效标因素和信度因素等。在实际招聘与录用评估过程中要把握各相关方面，不仅要有专业的测评人员,同时也要在稳定的环境中为被测评者提供一个放松真实的氛围。信度和效度是人才侧评与选拔质量的重要指标.图形形式表现分析得出的信度和效度的三种关系,则会是以下这些样式，如图8—l .图8-2和图8—3所示。所以，：高信度是高效度的必要条件，但非充分条件.即信度高不一定其效度就高，但要想获得较高的测评效度,其信度必定要高, （三）用结构式问卷来测量家长“溺爱孩子”的行为中信度与效

毕业学位论文调查问卷信度效度检验--总结

毕业学位论文调查问卷信度效度检验一、隗金水--博士论文运动员选材的选育结合理论与实证研究 1、问卷的效度问题。本研究的调查问卷是在大量阅读有关运动员选材和早期训练及管理等资料的基础上,结合运动选材和训练实际,同时考虑教练员和运动员的特殊性(时间问题,阅读能力问题,对理论研究的兴趣问题等)编制而成,内容方面力求全面反映选育现状,文字表达方面字斟句酌,反复修改,力求简单朴素,言简意赅.按照《体育测量评价》效度理论及《社会研究方法》中的概念操作化的方法(艾尔.巴比,2000),先对调查的基本内容进行纲要式的拟订、修改,并在征求专家意见的基础上,最后确定调查内容纲要细目表(见表2一1表2一),这样可以在结构上保证内容的全面性而避免遗漏重要内容,再根据细目表逐一进行问卷的编写,达到概念操作化的目的,即将抽象的概念转化为可观测的具体指标或题目。然后在小范围内进行预备测试,并结合教练员和运动员的意见进行反复修改,力争在内容效度和表面效度达到较高要求。 2、调查问卷的信度检验。调查问卷定稿后,以重测法在小范围内进行了信度检验。其中教练员问卷在以沁2年7月在教练员进修班(45名学员)中进行重测,其信度系数为091(P劝.01);运动员问卷在60名运动员(田径专项)中进行重测,其信度系数为0.87(P劝.01)。在问卷设计和正式实施调查的过程中,采取了下列措施以确保问卷信度,(l)问卷题目数量尽量少,控制在一张A4纸(正反面)内。(2)语言表达上尽量通俗、简单扼要,主要采用选择题型,极少数题目采用填空题型。(3)匿名填写问卷。(4)运动员问卷的发放和填写尽量避开教练员在现场。二、宋秀丽博士论文新农村社区体育研究--以东尉社区为个案 1、问卷信度：笔者之所以能有这样的便利条件发放问卷,原因在于本人的爱人是当地市日报社的记者,长山镇是其常年负责宣传报道的乡镇之一,在2008年6月曾经为东尉社区写过整版宣传报道,并获得滨州市新闻媒体单位的精品工程"本人爱人的工作特点为本论文问卷的发放回收以及实地考察提供了极为便利的条件"问卷调查的对象之所以将56岁以上老年人排除在调查范围之外,原因在于两方面,一是东尉社区对老年人采用集中供养的方式,凡是年龄达56岁者其家庭每年向公寓交一定象征性的费用就可以入住东尉社区的老年公寓,在老年公寓有专门为老年人提供的各种文体活动场地设施;二是东尉社区老年公寓老人文化水平一般较低,问卷的填答对他们来说有相当的难度"所以,对于老年公寓老年人的体育活动开展状况多是采用访谈方式进行 2、效度检验：问卷制定之后,请8位专家对问卷的内容和结构效度进行了检验,有5位专家认为合理,3位专家认为基本合理,问卷具有较高的结构效度" 三、陈琦--博士论文从终身体育思想审视我国学校体育的改革与发展 1、信度检验：问卷设计完后请专家判定问卷的指标是否能够含盖研究主题是否合适从而进行效度检验学生问卷专家认定率为91.72%教师问卷专家认定率为90.41%市民问卷专家认定率95.56%参见表2-1

第四章-测验信度作业

第四章测量信度一、单选题 1.速度测验的信度应以( c )取得。d A．奇偶法 B.筛选法 C.反应时法 D.重测法 2.在其他条件均等的情况下，测验长度和信度之间的关系是( d )。b A.测验越长，信度越低 B.测验越长，信度越高 C.没有关系 D.上述说法都不正确 3.计算一项测验的分半信度最常用的方法是比较( b )。 A.测验的前半部分与后半部分的得分。 B.奇数项目与偶数项目的得分。 C.将测验随机分为两部分,比较这两部分的得分。. D.上述方法都可以。 4.一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少? ( b ) A. 0.50 B. 0.67 C. 0.80 D. 1.0 5.当测验的信度减少(接近0)时,测量的标准误将会怎样变化(c )? A.减小,趋向于零。 B.只要趋向于1.0,它就会要么增大,要么减小。 C.增大,趋向于测验的标准差。 D.增大,逼近无限大。 6.再测信度所考虑的误差来源是(d )所带来的随机影响。 A.形式的不同 B.题目的不同 C.考生的不同 D.时间的不同 7.在考查评分者信度时,如果三人以上评阅数份试卷,则需计算( a )。 A.肯德尔和谐系数 B.等级相关系数 C.皮尔逊积差相关系数 D.克伦巴赫α系数 8.(a )是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。 A.信度 B.效度 C.难度 D.区分度 9.信度只受(d )的影响。b A．系统误差 B.随机误差 C.恒定效应 D.概化理论 10.复本信度又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系效。复本信度反映的是测验在( c )上的等值性。d A.时间 B.题目 C.评分 D.内容 11.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系效。这个相关系数就代表了( d )内

如何保证人才测评的信度和效度

如何保证人才测评的信度和效度人才测评的主要工作是通过各种方法对被试者加以了解，从而为企业组织的人力资源管理决策提供参考和依据。经过长期的发展和适应不同情况的需要，形成了多种人才测评方法。而人才素质测评作为一项重要的人事技术，已经为越来越多的企业人力资源部门所接受，而如何保证能力素质测评中的信度和效度，也越来越受到关注。下面，就具体案例讲讲如何保证能力素质测评的信度和效度。一、案例背景 N公司是一家外资工程管理公司，成立于1998年，总部设在上海。随着WTO的开放和工程项目的增多，工程公司在国内如雨后春笋般成长起来，就此拉开了人才竞争的序幕。尤其是上海，工程项目管理人才的争夺十分激烈，N公司老总越来越感觉到市场的压力和人才的短缺。为了应对市场压力，保留现有中高层骨干人才，并让他们“适人适位”，N公司请来了北大纵横管理咨询公司，希望通过专业评估解决这个问题。二、建立人才能力素质模型并实施测评（一）中高层能力素质模型及测评方法的确定鉴于本次测评的对象是N公司的中高层管理人才和精英人物，测评的目的是为了保留人才、适人适岗，因此经过双方共同探讨，项目组在北大纵横经理人能力素质指标体系的基础上，结合N公司的实际情况，选择个人驱动力、判断能力、分析能力、决策能力和水准、创新能力、客户服务能力、影响力、项目管理能力、任务分配能力等作为测评因素。同时，采用广泛用于企业人员素质测评、方案比较、科学技术成果评比等方面的层次分析法，来确定各测评因素在管理素质和业务素质上的权重。通过向N公司老总介绍人才测评的方法及工具，大家一致选定评价中心技术进行本次人才测评，并主要运用三类测评工具：心理测验、深度面谈和情景模拟测验。（二）测评实施程序 1、设计测评题目。咨询顾问和N公司相关人员一起，围绕测评因素，结合N公司实际情况进行测试题目的设计，并给出评分标准和评分参考。本次心理测试采取16PF人格要素测试，人机对话；深度面谈设计了20个题目，涵盖了测评的各个维度；情景模拟采用案例分析和主题演讲两种测评工具，其中案例分析题库包含12题，主题演讲题库包含15题，被测人员可以从各题库中抽取一题进行测试。 2、成立测评小组。其中，测评小组成员由N公司内部专家、外部专家，以及北大纵横项目组组成。在测评实施前，对测评小组进行培训，使大家能全面了解测评的程序、评分标准及方法。 3、实施测评。深度面谈和情景模拟测试是由测评小组根据测试题目对被测评人进行提问，被测评人根据提问回答问题，与测评小组进行双向沟通后，由测评小组根据评分标准对被测评人的表现现场打分，填入评分表；16PF人格要素测试要求被测试人进行40分钟的人机对话，由测评小组保存有效答卷。由于不同的测评者其衡量的尺度会存在差异，为保证各个被试者成绩排序的正确性，在测评时，向测评者提供“成绩比较表”，供其记载各个被试者的各项测试的评分，便于他们进行比较。 4、分析测评结果并统计成绩。采用肯德尔和谐系数法对每个被测评者在各个测评要素上的得分进行评分者信度分析，并结合各测评要素在管理素质和业务素质方面的权重，计算出被测评人在业务素质和管理素质上的得分。测评结束后，测评小组对被测人员进行了问卷调查，了解他们对测评效果的看法。三、测评为保证信度和效度所采取的措施（一）保证测评信度采取措施分析 1、16PF测试采取的是计算机标准化题目的方式，计算机答题、计算机处理结果。被测试人员全部独立进行测试，并在规定时间内完成了测试。 2、深度面谈使用了20个题目，围绕测评因素的各个维度对被测评者进行考察。面谈进行顺利，被测人员都能较积极配合回答问题，和主试人进行较好的双向交流。 3、情景模拟采用案例分析和主题演讲两种测评工具，被测人员从两个题库中各抽取1题，测评小组根据其表现进行现场评估。测评得到了被测人员的积极配合，都能就问题提出自己的见解。 4、为增加评分者信度，本次测评工作专门成立了测评小组，并在测评前熟悉了整个测评程序和操作；各类能力素质附有评分标准，各类试题附有评分参考，力图对被测试者的表现进行量化分析；测评中，向测评者提供“成绩比较表”，

SPSS与测验信度、效度、及项目分析

SPSS在测验信度、效度、及项目分析中的应用李鹏云南师范大学教育科学与管理学院在SPSS中，专门用来进行测验信度分析的模块为Scale下的Reliability Analysis；使用Data Reduction之下的Factor模块，可以利用因素分析的方法来进行测验的建构效度检验；至于项目分析则没有专门的模块可以之间进行计算分析，但是却可以利用Summarize下的Frequencies、Correlate下的Bivariate 和Compare Mean下的Independent-Samples T Test来计算几个常用的项目分析指标。一、信度分析 Reliability Analysis模块主要功能是检验测验的信度，主要用来检验分半信度、库李及a系数以及Hoyt信度系数值。至于重测信度和复本信度，只需将样本在二次（份）测验的分数的数据合并到同一数据文件之后，利用Correlate 之下的Bivariate求其相关系数，即为重测或复本信度；而评分者信度则就是使用的Spearman等级相关及Kendall和谐系数。表1 Reliability Analysis模块的Model选项的参数及对应中文术语关键字功能 Alpha Cronbach a系数 Split-half 分半信度，n是第二分量表的题数 Guttman Guttman最低下限真实信度法 Parallel 各题目变异数同质时的最大概率（maximum-likelihood）信度Strict parallel 各题目平均数与变异数均同质时的最大概率信度表2 Reliability Analysis模块的Statistics部分选项的参数及对应中文术语关键字功能 F test Hoyt信度系数 Friedman Chi Friedman等级变异数分析及Kendall和谐系数 Cochran Chi Cochran’s Q检验，适用于答案为二分（如是非题）的量表

量表的信度效度检验

第六章量表的信度效度检验我们采用含有多个项目的量表来测量人们的意见、态度、看法等、这样得到的结果是否准确、可靠，是否有适用性？这就需要评价量表的信度和效度。从理论的观点来看，一个良好的测量工具（量表）应具有足够的效度和信度。一、信度检验信度（Reliability）即可靠性，是指采用同一方法对同一对象进行调查时，问卷调查结果的稳定性和一致性，即测量工具（问卷或量表）能否稳定地测量所测的事物或变量。信度指标多以相关系数表示，具体评价方法大致可分为三类：稳定系数（跨时间的一致性），等值系数（跨形式的一致性\替换形式）和内在一致性系数（跨项目的一致性）。信度表示的方法主要有以下四种： 1、稳定性系数稳定性系数是采用同样的问卷，对同一组访问对象在尽可能相同的情况下，在不同时间内进行两次测量，用两次测量结果间的相关分析来评价量表信度的高低，连皮尔逊积差相关系数即是信度系数，也称为重测信度，或再测信度。两次测量，如果间隔时间过长，调查对象容易受环境和个人经历的影响而发生态度的转变，如果间隔时间过短，则受到上次调查记忆的影响。适当的间隔时间是既不能让调查对象记住上一次测验的内容，也不能让其被测的主观特征在两次测验之间没有发生较大的变化。适合的间隔时间要视调查对象和测量内容不同而不同，一般来说，年幼儿童，间隔时间要小，年长者，间隔时间可以延长。并且调查对象在两次测量期间没有发生于相关的重大事件。在最后提交调研报告时，要对间隔时间加以说明，报告间隔的时间。 2、等值系数（复本信度）用两个复本在最短时间内对同一组调查对象进行测量所得结果的一致性程度，复本信度系数等于两个复本测量所得分数的皮尔逊积差相关系数。复本信度的高低反映了这两个测验复本在内容上的等值性程度，是等值系数。复本类似于考试中得A、B卷，如果一个人在A卷和B卷的得分相同，就说明考题具有信度；如果两者差异很大，则缺乏信度。复本信度的使用前提是测量所用的两个复本必须是等效的，两个复本要满足以下几个条件：两个复本测量的是同一种特征。两个复本具有相同的内容和形

信度和效度检验

2.3.3 信度和效度检验（1）信度检验采用Cronbach α系数、个别项目信度、潜在变量的组合信度（Composite Reliability, CR）进行信度检验，其中运用SPSS15.0中的“Analyze-Scale-Reliability Analysis”命令，并选择“Statistics”中的“Scale if item deleted”，来计算Cronbach α系数，利用LISREL8.70进行验证性因子分析来计算个别项目信度和组合信度，验证性因子分析的运算结果（详见附录3）经整理如表2.6所示：从表2.6中关于Cronbach α系数的三栏中可以看出：C1、B4对应的“校正得项总计相关性”（Corrected Item-Total Correlation）偏低（相对于该部分量表中的其他指标对应值而言），且删除C1、B4有利于分别提升该部分量表的总体信度，故应将C1、B4两个指标删除。同时“个别项目信度”一栏中C1、C2、B3、B4、P1这5个指标的因子负荷均小于0.50，根据社会科学研究特点，这5个指标也应删除，且删除后有利于提高整个因素的一致性；而另外35个指标的因子负荷均大于0.5，满足信度要求。除此之外，诚信环境、企业素质、投标诚信、履约诚信、社会诚信各个量表以及整体的Cronbach α系数分别为0.750、0.845、0.817、0.862、0.830、0.939，属于很可信的区间范围；且对应的组合信度分别为0.75、0.85、0.83、0.86、0.83、0.96，均大于0.5，满足信度要求。（2）效度检验在信度检验删除5个指标基础上，首先，对有效样本数据进行KMO抽样适当性检验和Bartlett球形检验，检验结果显示KMO值为0.5，Bartlett球形检验的x2值为250.278（自由度为105），达到显著水平（p=0.000<0.001）。一般认为，当KMO值大于0.5时，即可进行因子分析，而本次KMO的检验值为0.5，说明本调查问卷的样本数据基本适合进行因子分析。其次，采用主成分分析法，进行V arimax方差正交旋转，最终提取特征值大于1的因子4个，7个共同因子累计解释的变异量为60.74%，且正交旋转后得到的因子负荷矩阵如表2.7所示：

试题的难度、区分度、信度和效度

试卷的难度、区分度、信度和效度一.试卷的难度（一）什么是难度难度是指试卷的难易程度，是评价考试的一个非常重要的一个指标。一个题目，如果大部分考生都能答对，那么这个题目的难度就小；如果大部分考生都不能答对，那么这个题目的难度就大。客观题难度计算公式：P（难度指数）＝试卷答对人数/考生人数；主观题难度计算公式：P＝试卷平均得分/试卷满分。试卷难度计算公式：P＝为平均分，K 为试卷满分值。易、中、难的标准为：易：P≥0.7，中：0.4≤P≤0.69，难：P≤0.39；P值越大，难度越低，P值越小，难度越高。一般来说，难度值平均在0.5最佳，难度值过高或过低，都会降低测验的信度。（二）难度的计算（1）客观性试卷难度P（这时也称通过率）计算公式： P=k/N（k为答对该题的人数，N为参加测验的总人数）（2）主观性试卷难度P计算公式： P=X/M（X为试卷平均得分；M为试卷满分）（3）适用于主、客观试卷的计算公式： P=（P H +P L ）/2（P H 、P L 分别为试卷针对高分组和低分组考生的难度值）步骤为:①将考生的总分由高至低排列；②从最高分开始向下取全部试卷的27%作为高分组；③从最低分开始向上取全部试卷的27%作为低分组；④计算。（三）试卷难度的一般要求就高考来说，难度以适中为宜，单个试卷的难度以0.3--0.7之间为好，整卷以0.5--0.6之间为最佳。一般将难度值大于和等于0.7的试卷定为容易题；大于0.4和小于0.7的定为中档题；小于和等于0.4的试卷定为难题。命题时难度一般要按一定比例分配，如3：6：1或3：5：2。二.试卷的区分度（一）什么是区分度区分度是指考试卷目对考生心理特征的区分能力。区分度高的试卷能将不同水平的考生区分开来，水平高的考生得高分，水平低的考生得低分。区分度高的

(完整word版)SPSS信度和效度检验全套资料

关于调查问卷的信度和效度检验（一）信度 1 、信度的含义测验的信度又称测验的可靠性 , 是指同一个测验对同一组被试施测两次或多次 , 所得结果一致形程度。一个好的测验必须是稳定可靠的 , 多次使用所获得的结果是前后一致的。例如 , 用直尺测量长度 , 其结果是稳定可靠的 ; 用橡皮筋测长度则是不可靠的 , 前后测量结果缺乏一致性。在测量理论中 , 信度被定义为 : 某次测验分数的真变异数与总变异数 ( 即实测分数 ) 之比 : 2 2 S R x xx ST = 式中 Rxx 表示测量的信度 ,ST 2 代表真分数的变异数 ( 方差 ),Sx 2 表示实得分数的变异数 ( 方差 ) 。从上式可看出 , （ 1 ）信度是指实测值和真值相差的程度 , 实测值是指对某物实际进行测量时所获得值 , 也称实测分数 (X); 真值是指被测事物的真实规模取值 , 也称真分数 (T) 。由于各种原因 , 实得分数常不等于真分数 , 两者之差称为测量误差或误差分数 (E) 。从理论上看 , 实得分数由真分数和误差分数两部分组成即 :X=T+E Rxx 就是对一组测验数据的实测分数与真分数相差程度的最好估计。（ 2 ）信度又是指相同的测验对相同的被试再次测量时引起的同样反应的程度。如果两次测验中 , 受测者所得分数或所处等级前后一致 , 则说明测验结果的信度较高 ; 反之 , 两次测验结果一致性低 , 说明测验结果的信度低。信度是任何一种测量的必要条件 ( 但不是唯一条件 ), 只有测量值接近或等于真值 , 用同一工具多次测量同一特性获得相同或相近的结果 , 才能认为这个测量结果是可靠的。信度对于教育测量尤其重要 , 只有信度高的教育测验才能成为教育工作者有用的工具 , 才能为教育工作者提供可靠的信息 , 为教育预测和决策提供客观依据。 2 、信度的估计方法测验的信度是用信度系数的大小来表示的 , 根据测量理论 , 信度系数 2 2 S R x xx ST = 但是在实际测量中 , 一般只能获得实得分数 (X) 及实得变异数 (Sx 2 ), 而真分数 (T) 及真变异数 (ST 2 ) 是不知道的 , 因此 , 依据上述公式还无法机算信度系数。在统计上 , 主要采用相关分析的方法即机算两列变量的相关系数 , 用相关系数的大小来表示信度的高低。主要用以下方法来求得信度 : （ 1 ）再测法 : 用同一测验对同一被试 , 前后施测两次 , 根据两次测验分数计算相关系数 , 即是再测信度。该信度反映了测验的稳定性程度 , 故又称稳定性系数 , 是用皮尔逊积差相关公式计算的 : 2 12 1/21S S M M N X X R xx ?-= ∑ 式中 X 1 .X 2 为同一被试的两次测验得分 ,M1.M2 为两次测验的平均分数 ,S 1 .S 2 是两次测验的标准差 ,N 是被试人数。用再测法估计信度 , 可以得到有关测验结果是否随时间而变化及变化程度的资料 , 可以作为预测被测者将来行为表现的依据。但也存在明显的局限性 : 前后两次测验结果易受到练习和记忆的影响 , 前后两次施测的时间间隔影响稳定性系数 , 特别是对学绩测验的影响较大。如果时间间隔太长 , 被测者的身心因受环境影响将发生大的变化 , 从而对第二次施测结果产生较大影响 , 使稳定性系数降低 ; 如果间隔太短 , 则被试第一次完成测验时练习和记忆会对第二次测验产生较大影响 , 使第二次测验性质发生变化。另外 , 有些测验不宜用再测法估计信度 , 如测量创造力测验 , 被试一旦掌握了解决问题的办法、原则 , 重测时 , 他将很容易作出反应 , 这样测验的性质就发生了改变。因此 , 只有在没有复本可用 , 测验不易受重复使用影响 , 现实条件又允许重复施测的情况下才使用重测法估计信度。用重测法估计信度 , 间隔时间长短没有严格的规定 , 一般说 , 间隔时间越长 , 稳定性系数越低 , 最适

第四章信度

第四章信度 [内容提示] 一、信度的定义二、信度估计的方法一、什么是信度含义：指的是测量结果的稳定性程度（或叫可靠性）。也指同一被试在不同时间内用同一测验（或用另一套相等的测验）重复测量，所得结果的一致程度。 1、理论定义：测验实测值和真值的相差程度。 2、操作定义：定义1：一组测量分数的真分数变异数（方差）与总变异数（总方差、实得分数的方差）的比率，或者是真实分数方差占总方差的的百分比。计算公式： r xx=S T2/S X2 定义2：信度乃是一个被试团体的真分数与实得分数的相关系数的平方。即 r xx=ρTx2 2、操作定义：定义3：信度乃是一个测验X（A卷）与它的任意一个“平行测验”X’（B卷）的相关系数。即r xx=ρxx’ 二、信度的类型及估计方法（一）重测信度 1、含义与计算又称稳定性系数。他的计算方法是采用重测法，即使用同一测验，在同样条件下对同一组被试前后施测两次测验，求两次得分间的相关系数。

三、信度的类型及估计方法（一）重测信度（再测信度）例：15名同学在1个月间隔内，先后2次重复施测某测验，测验结果如表中所列，请根据这些数据对该测验的重测信度进行计算。三、信度的类型及估计方法（一）重测信度三、信度的类型及估计方法（一）重测信度 2、使用的前提条件（1）所测量的心理特性必须是稳定的。（2）遗忘和练习的效果基本上相互抵消。（3）在时间间隔中没有学习另外的与测验有关的东西，或者说每人学习其他东西的程度都一样。 3、优缺点：优点：（1）它最符合重复测验的涵义，是重复测验最简单最明确的方式。（2）首测和再测只需要一套测验题目，省时、省力。（3）同一套题目无论施测几次，所测的属性是完全相同的。缺点：（1）同一组被试对同一个测验先后两次作答相互之间是不独立的。（2）如果两次施测时间间隔较长，在此期间被试的身心发展，新知识的获得，都会使两次测验结果不相同。（3）同一个被试对现一个测验先后两次作答，对测验的兴趣不同，影响测验结果。（4）两次施测的环境不同，也是产生测量误差的因素。（二）复本信度

什么是测试的信度和效度,如何保证测试的信度和效度

什么是测试的信度和效度，如何保证测试的信度和效度棋盘中小张倩倩在教育研究中，信度与效度是很常见的两个概念。但每次看到或听到这两个名词，我的脑袋老反应不过来，看来基础就是不扎实。我在这里就谈谈我浅显的认识。一、信度所谓的信度，是指使用相同指标或测量工具重复测量相同事物时，得到相同结果的可能性。如果说某个指标或测量工具的信度高，那它提供的测量结果就不会因为指标、测量工具或测量设计本身的特性而发生变化；反之亦然。根据测量过程中不同的误差来源，可分为再测信度、复本信度和折半信度。再测信度，是用同一测量工具在不同的时间对同一群受试者前后测量两次，然后计算两次测量分数的相关系数，相关系数越大说明两次测量的一致性越高。相隔的时间不应该太长。复本信度，是用两个完全等值的（平行的）复本对同一群受试者进行测试，计算两种复本测量分数的相关系数，相关系数越大说明两个复本构成带来的变异越小。如考试中使用的Ａ、Ｂ卷折半信度，只用一个测量工具对同一群受试者实施一次测量，但将奇数题和偶数题分开计分，再计算奇数试题和偶数试题分数之间的相关系数。二、效度所谓的效度，是指测量工具能够测出其所要测量的特征的正确性程

度。效度越高，即表示测量结果越能显示其所要测量的特征。如果说根据某项特征能够区分人、物或事件，那么说某个测量该特征的测量工具是有效的，就是指它的测量结果能把具有不同特征的人、物或事件进行有效的区分。常用的有变面效度、内容效度和效标效度。表面效度是指测量效果和人们头脑中的印象或学术界形成的共识之间的吻和程度，吻合程度高，表面效度就高。内容效度是指测量在多大程度上涵盖了被测量概念的全部内涵，测量工具代表概念定义的内容越多，内容效度就越高。效标效度是指测量结果与一些标准之间的一致性程度，这些标准能够精确表示被测概念。三、信度与效度的关系信度是效度的必要条件，但不是充分条件。一个测量工具要有效度必须有信度，没有信度就没有效度；但是有了信度不一定有效度。信度低，效度不可能高。因为如果测量的数据不准确，也并不能有效地说明所研究的对象。信度高，效度未必高。例如，如果我们准确地测量出某人的经济收入，也未必能够说明他的消费水平。效度低，信度很可能高。例如，即是一项研究未能说明社会流动的原因，但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。效度高，信度也必然高。

如何进行信度检验、效度检验：概念介绍 & 软件操作

如何进行信度检验、效度检验：概念介绍&软件操作一、构念的维度：可以用验证性因子分析（CFA）检验因子（维度）与测项之间的从属关系是否正确。检验指标是各个拟合优度指数和路径系数。二、量表的信度：信度包括重测信度、复本信度和内部一致性信度。在一次测量中，只能检验内部一致性信度，通常是用α系数。SPSS可以进行信度检验，一般要求α>0.7。每个测项的item-total correlation（项对总项相关系数）>0.4。同时还要看每个测项“α if item deleted”的值，它表示的是当删除该测项时，量表的α系数的值。如果α if item deleted>原来的α，则应该删除该测项。三、构念的效度 1. 构念的收敛效度（convergent validity）收敛效度指的是量表与同一构念的其他指标确实相互关联的程度。收敛效度可通过CFA检验，观察测量项目在构念上的负载（loading），如果标准化估计值（standardizes estimate）大于0.5，且t值大于1.96，平均提取方差（Average variance extracted，AVE）大于0.6，组合信度（construct reliability，CR）大于0.7，通常认为收敛效度较高。 ●平均提取方差（AVE）：表示的是潜变量的变异量中有多大比例能用指标变异量来解释（即指标解释潜变量的程度）； ●组合信度（CR）：模型内在质量的判别准则之一，反映了每个潜变量中所有测项是否一致性地解释该潜变量。 2. 构念的判别效度（discriminant validity）判别效度指的是一个测量值与其他应该有所不同的构念之间不相互关联的程度。判别效度可通过CFA检验，如果各个因子的AVE的平方根比该因子与其他因子之间的相关系数都大，则判别效度较高（或者说AVE的平方根大于该构念与任何其他构念的相关系数，则判别效度较高）。另外一种检验判别效度的方法是卡方检验。在一个限制模型中(相关系数限制为1)，配对构念之间的相关系数如果允许自由估计，卡方值显著地减少了，则说明两个构念之间的判别效度较高。卡方分布临界点为 3.84(P<0.05)或6.63(P<0.01)。 3. 构念的法则效度（nomological validity）法则效度指的是量表以在理论上可以预测的方式，与不同但相关的构念的测量值之间相互关联的程度。 ◆收敛效度、判别效度、法则效度并称为建构效度（construct validity）；另外两种效度是内容效度（content validity）和标准效度（criterion validity）。内容效度是对量表的内容表现特定测量项目任务的优劣程度的一个主观而系统的评价。标准效度指一个量表是否像预期的那样反映与选作标准的其他变

评估测评的信度与效度

评估测评的信度与效度案例一、案例背景 N公司是一家外资工程管理公司，成立于1998年，总部设在上海。随着WTO 的开放和工程项目的增多，工程公司在国内如雨后春笋般成长起来，就此拉开了人才竞争的序幕。尤其是上海，工程项目管理人才的争夺十分激烈，N公司老总越来越感觉到市场的压力和人才的短缺。为了应对市场压力，保留现有中高层骨干人才，并让他们“适人适位”， N公司请来了北大纵横管理咨询公司，希望通过专业评估解决这个问题。二、建立人才能力素质模型并实施测评（一）中高层能力素质模型及测评方法的确定鉴于本次测评的对象是N公司的中高层管理人才和精英人物，测评的目的是为了保留人才、适人适岗，因此经过双方共同探讨，项目组在北大纵横经理人能力素质指标体系的基础上，结合N公司的实际情况，选择个人驱动力、判断能力、分析能力、决策能力和水准、创新能力、客户服务能力、影响力、项目管理能力、任务分配能力等作为测评因素。同时，采用广泛用于企业人员素质测评、方案比较、科学技术成果评比等方面的层次分析法，来确定各测评因素在管理素质和业务素质上的权重。通过向N公司老总介绍人才测评的方法及工具，大家一致选定评价中心技术进行本次人才测评，并主要运用三类测评工具：心理测验、深度面谈和情景模拟测验。（二）测评实施程序 1、设计测评题目。咨询顾问和N公司相关人员一起，围绕测评因素，结合N公司实际情况进行测试题目的设计，并给出评分标准和评分参考。本次心理测试采取16PF人格要素测试，人机对话；深度面谈设计了20个题目，涵盖了测评的各个维度；情景模拟采用案例分析和主题演讲两种测评工具，其中案例分析题库包含12题，主题演讲题库包含15题，被测人员可以从各题库中抽取一题进行测试。 2、成立测评小组。其中，测评小组成员由N公司内部专家、外部专家，以及北大纵横项目组组成。在测评实施前，对测评小组进行培训，使大家能全面了解测评的程序、评分标准及方法。 3、实施测评。深度面谈和情景模拟测试是由测评小组根据测试题目对被测评人进行提问，被测评人根据提问回答问题，与测评小组进行双向沟通后，由测

前测数据分析--信度和效度分析

第二节信度和效度分析一、信度分析与预测试数据分析方法一样，为了确保问卷的可靠性，先进行信度分析，信度检验指标在前面已详细述，在此不再述。问卷信度分析如表4-2所示：表4-2：量表信度检验结果 - . -优质文档

经过SPSS24.0数据统计软件分析得知个变量Cronbach's α均大于0.6，且组合信度在0.792以上，说明所有问卷都具备可靠性，能够较好的反应变量的真实情况。二、效度检验（一）容效度为了确保调研问卷容的有效性，问卷量表通过文献研究先初步圈定问卷容，所用量表大多采用国外已经开发出的成熟量表，对于这部分量表，本文给予直接采用的方式，其余量表则是在前人研究的基础上，根据本文的研究目的和方向进行谨慎的拟定。因此，本问卷具有容效度。（二）结构效度在测量结构效度时，通常采用探索性因子分析。在进行因子分析时，通常采用主成分分析法，主成分分析的目的在于利用变量间的线性组合来解释每个层面的方差，变量的第一个线性组合可以解释最大的变异量，以此类推，所以主成分分析法的步骤是，选取特征值大于1的因子，然后利用方差最大旋转法进行旋转，使得旋转后题目在各个因子的负荷量大小出现明显差异，大部分题目在每个公共因子中有一个差异较大的因子负荷量出现。但在因子分析之前需要进行KMO值- . -优质文档

和Bartlett球形检验，只有当KMO>0.5且Bartlett球形检验的Sig.值小于0.05时，问卷才具有结构效度，才能够进行因子分析。本研究中对三个量表进行的结构效度分析具体情况如下。（1）虚拟品牌社群价值的效度检测 1.1虚拟品牌社群价值的KMO值和Bartlett球形检验在对虚拟品牌社群价值做因子分析之前，先做KMO值和Bartlett球形检验，检测结果如表4-3所示：表4-3：虚拟品牌社群价值的KMO值和Bartlett检验取样足够度的Kaiser-Meyer-Olkin度量.901 Bartlett的球形度检验近似卡方4892.820 df 186 Sig. .000 通过对虚拟品牌社群价值量表的14个题项进行KMO检验和Bartlett球形检验，发现虚拟品牌社群价值量表的KMO值为0.901，表明各个变量之间的相关系数非常高，适合做因子分析，同时Sig.值为0.000<0.05，达到显著性水平，综上可以得出虚拟品牌社群价值量表适合做因子分析。 1.2虚拟品牌社群价值因子分析通过KMO值和Bartlett球形检验可知，虚拟品牌社群价值适合做因子分析，运用主成分提取法进行因子旋转后得到以下数据，如:表4-4所示：表4-4：虚拟品牌社群价值旋转因子负荷值 - . -优质文档

如何进行信度检验效度检验概念介绍软件操作

如何进行信度检验、效度检验：概念介绍& 软件操作一、构念的维度：可以用验证性因子分析（CFA）检验因子（维度）与测项之间的从属关系是否正确。检验指标是各个拟合优度指数和路径系数。二、量表的信度：信度包括重测信度、复本信度和内部一致性信度。在一次测量中，只能检验内部一致性信度，通常是用α系数。SPSS可以进行信度检验，一般要求α>0.7。每个测项的item-total correlation（项对总项相关系数）>0.4。同时还要看每个测项“α if item deleted”的值，它表示的是当删除该测项时，量表的α系数的值。如果α if item deleted>原来的α，则应该删除该测项。三、构念的效度 1. 构念的收敛效度（convergent validity）收敛效度指的是量表与同一构念的其他指标确实相互关联的程度。收敛效度可通过CFA检验，观察测量项目在构念上的负载（loading），如果标准化估计值（standardizes estimate）大于0.5，且t值大于1.96，平均提取方差（Average variance extracted，AVE）大于0.6，组合信度（construct reliability，CR）大于0.7，通常认为收敛效度较高。 ●平均提取方差（AVE）：表示的是潜变量的变异量中有多大比例能用指标变异量来解释（即指标解释潜变量的程度）； ●组合信度（CR）：模型内在质量的判别准则之一，反映了每个潜变量中所有测项是否一致性地解释该潜变量。 2. 构念的判别效度（discriminant validity）判别效度指的是一个测量值与其他应该有所不同的构念之间不相互关联的程度。判别效度可通过CFA检验，如果各个因子的AVE的平方根比该因子与其他因子之间的相关系数都大，则判别效度较高（或者说AVE的平方根大于该构念与任何其他构念的相关系数，则判别效度较高）。另外一种检验判别效度的方法是卡方检验。在一个限制模型中(相关系数限制为1)，配对构念之间的相关系数如果允许自由估计，卡方值显著地减少了，则说明两个构念之间的判别效度较高。卡方分布临界点为 3.84(P<0.05)或6.63(P<0.01)。 3. 构念的法则效度（nomological validity）法则效度指的是量表以在理论上可以预测的方式，与不同但相关的构念的测量值之间相互关联的程度。 ◆收敛效度、判别效度、法则效度并称为建构效度（construct validity）；另外两种效度是内容效度（content validity）和标准效度（criterion validity）。内容效度是对量表的内容表现特定测量项目任务的优劣程度的一个主观而系统的评价。标准效度指一个量表是否像预期的那样反映与选作标准的其他变

专题3信度真题

专题3 信度【07】 57.将测验对等分半后，两半测验得分的相关系数为0.6，校正后该测验的分半信度是（b） A、0.70 B、0.75 C、0.80 D、0.85 【08】 44.衡量测验跨时间一致性的信度称为（a） A.重测信度 B.复本信度 C.同质性信度 D.评分者信度【09】 44．重测信度的主要误差源是（b）。 A．内容取样 B．时间取样 C．统计方法 D．评分者【09】 50．反映测验结果可靠性、稳定性的指标是（b）。 A．效度 B．信度 C．难度 D．区分度【10】 53．某测验的信度为0.64，实得分数的标准差为5，该测验的标准误为（c） A．0.36 B．1.04 C．3.00 D．4.36 【11】（多选） 74.在经典测量理论中，表示测验结果精确程度的指标有（ac） A测验信度 B测验效度 C测验标准误 D测验准确率【12】 58.信度系数不仅可以解释测验总变异中的随机测量误差，还可以解释( c)

A样本标准差 B、组间误差 C、真分数变异 D、组内误差【13】 57.克龙巴赫提出的a系数主要用来计算(d ) A、重测信度 B、复本信度 C、评分者信度 D、内部一致性信度【13】 60.由于幼儿的智力发展迅速，收集幼儿智力测验信度资料的最佳方法是( c) A、再测法 B、复本法 C、分半法 D、方差分析法【07】 78、什么是测验的信度？影响信度的主要因素有哪些？信度指的是测量结果的稳定性程度。换句话说，若能用同一测量工具反复测量某人的同一种心理特质，则其多次测量的结果间的一致性程度就叫信度，有时也叫测量的可靠性。这是信度的描述性定义。信度的操作性定义，主要包括三个方面：①、信度乃是一个被测团体的真分数的变异数与实得分数的变异数之比，即r =s /s 。②、信度乃是一个被试团体的真分数与实得分数的相关系数的平方，即r =PT 。③信度乃是一个测验X ( A 卷）与它的任意一个“平行测验”X ' ( B 卷）的相关系数，即r =P 。测量信度是测量过程中随机误差大小的反映。随机误差大，信度就低，随机误差小，信度就高。在测量过程中影响随机误差的因素主要包括被试、主试、测试内容、施测情境等。

调查表的的信度与效度评价方法

调查表的的信度与效度评价方法问卷调查法是教育研究中广泛采用的一种调查方法，根据调查目的设计的调查问卷是问卷调查法获取信息的工具，其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性，在形成正式问卷之前，应当对问卷进行试测，并对试测结果进行信度和效度分析，根据分析结果筛选问卷题项，调整问卷结构，从而提高问卷的信度和效度。一、信度分析信度（Reliability）即可靠性，是指采用同一方法对同一对象进行调查时，问卷调查结果的稳定性和一致性，即测量工具（问卷或量表）能否稳定地测量所测的事物或变量。信度指标多以相关系数表示，具体评价方法大致可分为三类：稳定系数（跨时间的一致性），等值系数（跨形式的一致性）和内在一致性系数（跨项目的一致性）。信度分析的方法主要有以下四种： 1、重测信度法同样的问卷，对同一组访问对象在尽可能相同的情况下，在不同时间进行两次测量。两次测量相距一般在两到四周之内。用两次测量结果间的相关分析或差异的显著性检验方法，评价量表信度的高低。 2、折半法。折半法是将上述两份问卷合成一份问卷（通常要求

这两份问卷的问题数目相等），每一份作为一部分，然后考察这两个部分的测量结果之间的相关性。 3、折半信度法折半信度法是将调查项目分为两半，计算两半得分的相关系数，进而估计整个量表的信度。折半信度属于内在一致性系数，测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷（如年龄与性别无法相比），常用于态度、意见式问卷的信度分析。在问卷调查中，态度测量最常见的形式是5级李克特（Likert）量表。进行折半信度分析时，如果量表中含有反意题项，应先将反意题项的得分作逆向处理，以保证各题项得分方向的一致性，然后将全部题项按奇偶或前后分为尽可能相等的两半，计算二者的相关系数（rhh，即半个量表的信度系数），最后用斯皮尔曼-布朗（Spearman-Brown）公式：求出整个量表的信度系数（ru）。 4、α信度系数法 Cronbach α信度系数是目前最常用的信度系数，其公式为：其中，K为量表中题项的总数，为第i题得分的题内方差，为全部题项总得分的方差。从公式中可以看出，α系数评价的是量表中各题项得分间的一致性，属于内在一致性系数。这种方法适用于态度、意见式问卷（量表）的信度分析。二、效度分析效度（Validity）即有效性，它是指测量工具或手段能够准确测出所需测量的事物的程度。效度分为三种类型：内容效度、准则效度

文档之家

第四章 测验信度作业