当前位置：文档之家› 信度的计算

信度的计算

1．问卷设计质量的信度检验

所谓问卷设计质量的信度检验，指的是对问卷测量结果准确性的分析，即对设计的问卷在多次重复使用下得到的数据结果的可靠性的检验。在实际应用中，信度检验多以相关系数表示，常用的方法有：重测信度，复本信度，折半信度，克朗巴哈信度，评分者信度等。国内外已经有很多关于这些信度分析方法介绍的文献，在这里，笔者不再一一详述，仅列出相关公式作为参考。

（1）重测信度，也叫稳定系数，对同一组调查对象采用同一调查问卷进行先后两次调查，采用检验公式

，其中

为两次调查结果的协方差，

为第一次调查结果

的协方差，为第二次调查结果的协方差。系数值越大说明信度越高。

（2）复本信度，也叫等值系数，对同一组调查对象进行两种相等或相近的调查，要求两份问卷的题数、形式、内容及难度和鉴别度等方面都要尽可能的一致。检验公式同稳定系数公式，系数越大，说明两份问卷的信度越高，具体调查时使用哪一份都可以。

（3）折半信度，也叫内在一致性系数，将调查的项目按前后分成两等份或按奇偶题号分成两部分，通过计算这两部分调查结果的相关系数来衡量信度。当假定两部分调查结果得分的方差相等时，检验用Spearman-Brown 公式来表示：

，其中表示折半信

度系数；当假定方差不相等时，采用Flanagan 公式：，其中、分别

表示两部分调查结果的方差，表示整个问卷调查结果的方差。如果折半信度很高，则说明这份问卷的各项题之间难度相当，调查结果信度高。

（4）Cronbach’s α系数是Cronbach 于1951年创立的，是指测验内部的项目在多大程度上考察了同一内容，评价的是量表中各题项得分间的一致性。同构型信度低时，即使各个测试题看起来似乎是测量同一特质，但测验实际上是异质的，即测验测量了不止一种特质。α信度系数法是目前最常用的内部信度系数。

实际上，α系数是所有可能的分半信度的平均值，α系数是估计信度的最低限度，α系数高时，信度就高，α系数低时，信度不一定低。低信度：α<0.35, 中信度： 0.35<α<0.70,高信度： 0.70<α。一般来说，问卷的α系数在0.8以上该问卷的信度较好，达0.85以上，表明问卷信度良好。

克朗巴哈信度，是对折半信度的改进，检验公式是：)1(1

k k 2

σα∑-

-= ，其中K

表示问卷中的题目数，为第i 题的调查结果方差，为全部调查结果的方差。信度

系数是目前最常用的信度分析法。

（5）评分者信度，包括信度和

信度，将问卷中的每道题看作是一个变量，然后

通过调查的结果得分对所有问题做因子分析。得到，

，其中

是最大特征值，N 是问题数, 是因子分析法的第i 个问题的共同度。

例：

【壹】内部一致性（Internal Consistency Coefficient）【计算α系数】

步骤一输入数据

步骤二按【Analyze】→【Scale】→【Reliability Analysis】将左边方格内的变项全选入右边items的方格内，在左下角

的Model框中选取Alpha后按键。

步骤三出现下列对话框候选取下列勾选处，后按键

按。

Reliability

****** Method 2 (covariance matrix) will be used for this analysis ******

R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)

Correlation Matrix

ITEM_1 ITEM_2 ITEM_3 ITEM_4 ITEM_5

ITEM_1 1.0000

ITEM_2 .2970 1.0000

ITEM_3 .7647 .5941 1.0000

ITEM_4 .6860 .4330 .8575 1.0000

ITEM_5 .1588 .8018 .4763 .4629 1.0000

N of Cases = 6.0

Item-total Statistics

Scale Scale Corrected

Mean Variance Item- Squared Alpha if Item if Item Total Multiple if Item Deleted Deleted Correlation Correlation Deleted

ITEM_1 13.0000 6.4000 .5251 .6471 .8472 ITEM_2 13.1667 5.3667 .6757 .7500 .8116 ITEM_3 12.3333 5.4667 .8333 .8588 .7642 ITEM_4 13.5000 6.7000 .7481 .7857 .8093 ITEM_5 12.6667 5.8667 .5922 .7143 .8333

Reliability Coefficients 5 items

Alpha = .8457 Standardized item alpha = .8609

纸笔计算结果

σi 2 =

.4722 .6667 .4722 .2222 .5833

X =16.1667, σ2=7.4722 σ=2.7335 k=5 N=6

.84575.)3234.1)(25.1()4722

.74166.21)(25.1()4722

.75833

.2222.4722.6667.4722.1(4

5==-=-

=++++-

信效度计算的题目

信度计算题 1. 方法一：运用卢伦公式计算方法二：运用弗朗那根公式计算方法三：分别计算两部分的方差，发现方差大小近似相等，故可以先计算两者的皮尔逊积差相关系数，然后用斯皮尔曼—布朗校正公式校正。主要问题：大部分同学都能正确运用公式，计算正确，但是有部分同学在运用皮尔逊积差相关公式后，忘记校正。还有部分同学在使用积差相关公式之前没有计算两者的方差。 2. 直接运用公式α=K（1-）/(K-1)计算克伦巴赫α系数即可. 该题除部分同学计算错误外，大部分同学都能够正确运用斯皮尔曼—布朗公式，并得到结果：0.84. 3. 先计算测验的标准误：SE= Sx。从而得出被试分数误差分布的标准差。根据题目可知取Z=1.96，故其分布范围为：X-SE·Z T X+SE·Z。该题除部分同学计算错误外，大部分同学都能够正确运用公式，并得到结果：[109,120] 4. 先计算差异的标准误：SE=S 方法一：（116-108）/SE=1.33<1.96<2.58 方法二：116-108=8<1.96*SE<2.58*SE 因此差异不显著。这道题错的人很多，一种错误在于标准误的计算，由于本题中是两个测验结果的比较，需要计算分部整体的标准误，而许多同学错用了第三题的标准误公式，分别计算两个测验的标准误。另一种错误是部分同学没有理解题意，分别计算了两个测验的分布范围，然后看实际得分是否在这个分布范围内。 5. 直接运用公式r=1-（1-r1）/计算。

该题绝大部分同学都能够正确运用上述公式，并得到结果：0.40 效度 1.直接运用公式r2=Kr1/(1-r1+Kr1)计算。结果为6.4、13.8。这道题部分同学取了整数，因为公式中的K是整数，但是取整数的时候需要注意，不能四舍五入，而是只要有有小数部分就要进1。该题不取整数亦可。 2.根据公式b=r·/可求得回归方程的系数b、a。根据公式= 可得分布的标准误。根据公式Y-Z·SE y即可求得分布范围。该题出现错误的同学也较多，一部分同学在最后没有将员工的测验成绩通过回归公式换算成工作表现成绩。还有同学在计算标准误时，公式运用错误。 3.大家都能正确运用公式P=（正确接受+正确拒绝）/总人数最后结果为0.76

信度的计算

1．问卷设计质量的信度检验所谓问卷设计质量的信度检验，指的是对问卷测量结果准确性的分析，即对设计的问卷在多次重复使用下得到的数据结果的可靠性的检验。在实际应用中，信度检验多以相关系数表示，常用的方法有：重测信度，复本信度，折半信度，克朗巴哈信度，评分者信度等。国内外已经有很多关于这些信度分析方法介绍的文献，在这里，笔者不再一一详述，仅列出相关公式作为参考。（1）重测信度，也叫稳定系数，对同一组调查对象采用同一调查问卷进行先后两次调查，采用检验公式，其中为两次调查结果的协方差，为第一次调查结果的协方差，为第二次调查结果的协方差。系数值越大说明信度越高。（2）复本信度，也叫等值系数，对同一组调查对象进行两种相等或相近的调查，要求两份问卷的题数、形式、内容及难度和鉴别度等方面都要尽可能的一致。检验公式同稳定系数公式，系数越大，说明两份问卷的信度越高，具体调查时使用哪一份都可以。（3）折半信度，也叫内在一致性系数，将调查的项目按前后分成两等份或按奇偶题号分成两部分，通过计算这两部分调查结果的相关系数来衡量信度。当假定两部分调查结果得分的方差相等时，检验用Spearman-Brown 公式来表示：，其中表示折半信度系数；当假定方差不相等时，采用Flanagan 公式：，其中、分别表示两部分调查结果的方差，表示整个问卷调查结果的方差。如果折半信度很高，则说明这份问卷的各项题之间难度相当，调查结果信度高。（4）Cronbach’s α系数是Cronbach 于1951年创立的，是指测验内部的项目在多大程度上考察了同一内容，评价的是量表中各题项得分间的一致性。同构型信度低时，即使各个测试题看起来似乎是测量同一特质，但测验实际上是异质的，即测验测量了不止一种特质。α信度系数法是目前最常用的内部信度系数。实际上，α系数是所有可能的分半信度的平均值，α系数是估计信度的最低限度，α系数高时，信度就高，α系数低时，信度不一定低。低信度：α<0.35, 中信度： 0.35<α<0.70,高信度： 0.70<α。一般来说，问卷的α系数在0.8以上该问卷的信度较好，达0.85以上，表明问卷信度良好。克朗巴哈信度，是对折半信度的改进，检验公式是：)1(1 k k 2 2i σ σα∑- -= ，其中K 表示问卷中的题目数，为第i 题的调查结果方差，为全部调查结果的方差。信度系数是目前最常用的信度分析法。（5）评分者信度，包括信度和信度，将问卷中的每道题看作是一个变量，然后通过调查的结果得分对所有问题做因子分析。得到，，其中是最大特征值，N 是问题数, 是因子分析法的第i 个问题的共同度。

信度分析

信度分析信度分析又称可靠性分析，是检验测量工具的可靠性和稳定性的主要方法；信度问题要回答的问题是：用这个测量工具在同一条件下对同一人进行测试，每次测试的结果是否相同的问题。在社会科学中如果使用的测量工具无论对谁施测，也无论使用什么形式，只要产生相似的结果，那么可以认为此测量工具是可信的。信度问题其实测的是一致性的问题，所谓信度是衡量没有误差的程度。一致性分为内部一致性和外部一致性。效度问题要回答的是：此测量工能够测量我想要测得的东西吗？不能混淆信度与效度。信度的测量 1．克伦巴赫α系数。测度内部一致性的一个指标；及测量表内的所有项目测量的都是同一样东西吗？α与皮尔逊r 系数都是一样的范围在0—1 之间，如果为负值则表明表中某些项目的内容是其他一些项目的反面；α越接近于1，则量表中项目的内部一致性越是高。α 的计算式非常简单，根据量表中的项目数K 和各项之间的相关系数r 计算而来 1(1)kr k r α= +- 当量表中项目K 增加时，α值也会增大；同时，项目之间的相关系数r 较高时，α也会比较大。这里的r 是指各项与其他各项之和计算相关系数的平均值。 2、重测信度法这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测，计算两次施测结果的相关系数。显然，重测信度属于稳定系数。重测信度法特别适用于事实式问卷，如性别、出生年月等在两次施测中不应有任何差异，大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变，这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次，被调查者容易受到各种事件、活动和他人的影响，而且间隔时间长短也有一定限制，因此在实施中有一定困难。 3、复本信度法复本信度法是让同一组被调查者一次填答两份问卷复本，计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外，在内容、格式、难度和对应题项的提问方向等方面要完全一致，而在实际调查中，很难使调查问卷达到这种要求，因此采用这种方法者较少。 4、折半信度法折半信度法是将调查项目分为两半，计算两半得分的相关系数，进而估计整个量表的信度。折半信度属于内在一致性系数，测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷（如年龄与性别无法相比），常用于态度、意见式问卷的信度分析。在问卷调查中，态度测量最常见的形式是5级李克特（Likert ）量表。进行折半信度分析时，如果量表中含有反意题项，应先将反意题项的得分作逆向处理，以保证各题项得分方向的一致性，然后将全部题项按奇偶或前后分为尽可能相等的两半，计算二者的相关系数（rhh ，即半个量表的信度系数），最后用斯皮尔曼-布朗（Spearman-Brown ）公式：求出整个量表的信度系数（ru ）。

第四章信度

第四章信度一、什么是信度含义：指的是测量结果的稳定性程度（或叫可靠性）。也指同一被试在不同时间内用同一测验（或用另一套相等的测验）重复测量，所得结果的一致程度。 1、理论定义：测验实测值和真值的相差程度。 2、操作定义：定义1：一组测量分数的真分数变异数（方差）与总变异数（总方差、实得分数的方差）的比率，或者是真实分数方差占总方差的的百分比。计算公式： rxx=ST2/SX2 定义2：信度乃是一个被试团体的真分数与实得分数的相关系数的平方。即 rxx=ρTx2 定义3：信度乃是一个测验X（A卷）与它的任意一个“平行测验”X’（B卷）的相关系数。即 rxx=ρxx’ 二、信度的类型及估计方法（一）重测信度 1、含义与计算又称稳定性系数。他的计算方法是采用重测法，即使用同一测验，在同样条件下对同一组被试前后施测两次测验，求两次得分间的相关系数。三、信度的类型及估计方法（一）重测信度（再测信度）例：15名同学在1个月间隔内，先后2次重复施测某测验，测验结果如表中所列，请根据这些数据对该测验的重测信度进行计算。三、信度的类型及估计方法（一）重测信度

三、信度的类型及估计方法（一）重测信度可见，这两次测验分数之间有较高的正相关，该测验有较高的重测信度。 2、使用的前提条件（1）所测量的心理特性必须是稳定的。（2）遗忘和练习的效果基本上相互抵消。（3）在时间间隔中没有学习另外的与测验有关的东西，或者说每人学习其他东西的程度都一样。 3、优缺点：优点：（1）它最符合重复测验的涵义，是重复测验最简单最明确的方式。（2）首测和再测只需要一套测验题目，省时、省力。（3）同一套题目无论施测几次，所测的属性是完全相同的。缺点：（1）同一组被试对同一个测验先后两次作答相互之间是不独立的。（2）如果两次施测时间间隔较长，在此期间被试的身心发展，新知识的获得，都会使两次测验结果不相同。（3）同一个被试对现一个测验先后两次作答，对测验的兴趣不同，影响测验结果。（4）两次施测的环境不同，也是产生测量误差的因素。（二）复本信度 1、含义与计算：含义：又称等值性系数。它是以两个平行或复本的测验（等值但题目不同）来测量同一群体，然后求得被试在两个测验上得分的相关系数，这个相关系数就代表了复本信度的高低。复本信度反映的是测验在内容上的等值性，故称等值性系数。 2、使用的前提条件：（1）要两份或两份以上真正平行的测验。（2）被试要有条件接受两个测验。主要取决于时间、经费等几方面。 3、优缺点：优点：（1）一个测验的复本使得测验数目的增加，对于所欲测量的属性相联系的行为总体代表性强，因此，一个测验的两个复本在两三天至一周对同一组被试施测时，获得的复本信度系数是相当准确的。（2）测验的两个复本，如果在不同时间使用，其信度不仅可以反映在不同时间的稳定性，而且还可以反映对于不同测题的一致性。（3）两个复本在同时使用时，可以避免再测验信度的缺点。缺点：（1）编制两个完全相等的测验是很困难的。（2）复本法只能减少而不能完全排除练习和记忆的影响。（3）被试同时接受性质相似的两个测验可能减少完成测验的积极性。（三）分半信度 1、含义指采用分半法估计所得的信度系数。这种方法估计信度系数只需一种测验形式，实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半，并分别计算每位被试在两半测验上的得分，求出这两半分

15. 信度分析

15 信度分析在调查研究中，对调查问卷的结果进行统计分析之前必须先对其信度（reliability ）和效度（validity ）进行分析，只有信度和效度在可以接受的研究范围之内时，调查问卷的统计分析结果才是可靠和准确的。在SPSS 中选择菜单Analyze →Scale （量表）→Reliability Analysis （信度分析）来完成信度分析。 15.1 信度分析介绍收集数据时，经常出现三种测量误差。一是系统误差。例如缺斤短两的秤，使测量结果产生了误差（小于真实值），这种误差称为系统误差，它在多次测量中是比较稳定的。二是随机误差，它是在实际相同条件下，多次测量同一量时，误差的绝对值和符号的变化，时大时小，时正时负，没有确定的规律，也不可以预知，但具有抵偿性的误差。由于随机误差在测量中的单个无规律性，导致了它们的数值和有正负相消的机会，随着测量次数的增加，误差的均值趋于零，因此多次测量的平均值的随机误差比单个测量值的随机误差小，这种性质通常称为抵偿性。三是叫粗差，粗心大意带来的错误。如，明显歪曲测量结果的误差。这些测量值一般称为坏值或异常值，可作误差分析，将其剔除。但是，处理异常值时要小心，也许某些异常值具有重要信息。如：生物医学中，某些异常值可能就是研究的新发现。由于在测量中存在误差，使得各次测量结果并不完全一致，于是就产生了两类问题： 1．测量结果的一致性程度问题，它包括：在各种不同条件下所得数据的关系如何？测量数据与真实数据的接近程度如何？ 2．造成测量数据变异的原因问题，它包括：是什么因素造成了数据的不一致性？各种因素产生效应的相对比例如何？目前研究比较多的是前一类问题，即对测量的一致性进行精确估计的方法，也就是如何估计精确度：反映随机误差大小的程度的问题。这个问题是用“信度”的概念描述的。所谓信度是一个测量工具可靠性的指标，它是对测量一致性程度的估计。一个测量工具是可靠的，表示测量多次，测量结果是一致的和稳定的。计算的方法是将信度定义为：在一组测验分数中，真实值的方差和实得数据方差的比，用公式表示就是：22 x T xx S S r 。式中，xx r ：测验的信度；2T S ：真实值的样本方差；2 x S ：实得数据的样本方差。但是，由于我们无法确知真实值，所以实际上这个公式不能使用。所以我们需要其他的进行信度分析的方法。信度可分为以下两类：内在信度和外在信度。 1．内在信度指的是调查表中的一组问题（或整个调查表）是否测量的是同一个概念，也就是这些问题之间的内在一致性如何。如果内在信度系数在0.8以上，则可以认为调查表有较高的内在一致性。常用的内在信度系数为Cronbach α系数和折半信度。

心理测量学信度-计算题

计算题例题：1.已知WISC-R的标准差为15，信度系数为0.84，对一名12岁儿童实施该测验后IQ为100，那么他的真分数在95%的可靠度要求下，变动范围应是多大？ 2.某被试在韦氏成人智力测验中言语智商为102，操作智商为110。已知两个分数都是以100为平均数，15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88。问其操作智商是否显著高于言语智商？ 3.某智力测验信度系数rxx＝0.91，测验分数标准差为15，求该测验的测量标准误。若甲、乙二人成绩为127，135，说明二人各可能处在什么分数区间。 4.如果某个测验的测量标准误为5，对某个班级实测的结果是S2＝50，请估计该测验的信度系数。例题：1.假设有一份主观幸福感调查表，先后两次施测于10名学生，时间间隔为半年，结果如下表所示，求该测验的重测信度。

. 例题：1.用６个论文题的测验对５人学生施测，结果如下表，试估计测验的同质性信度 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 被试 a奇 32 40 42 28 35 30 41 28 32 34 26 34 36 25 40 41 数题 31 39 45 30 40 29 39 30 32 30 30 40 36 26 40 42 b偶数

题 3.已知某态度量表有6道题，被试在各题上得分的方差分别是0.80、0.81、0.79、0.78、 0.80、0.82测验总分的方差为16，求值 4.语文测验（10道题）模拟资料如表6，试求内部一致性系数α的值。例题：1. ４位评分者对５个学生作文评定，评定结果如下表，试估计评分者信度． 2.下面是甲，乙两组人对A、B、C、D、E、F、G、H 8幅图画的不同评价等级：（1）计算甲、乙两组人评判结果的等级相关系数。（2）两组人对哪两幅图画的评价最不一致？ A B C D E F G H 甲8 7 1 5 6 4 2 3 乙 4 2 1 6 7 5 8 3 总分12 9 2 11 13 9 10 6 d 4 5 0 -1 -1 -1 -6 0