当前位置:文档之家› SPSS信度和效度检验全套资料

SPSS信度和效度检验全套资料

SPSS信度和效度检验全套资料
SPSS信度和效度检验全套资料

关于调查问卷的信度和效度检验 (一)信度

1 、信度的含义

测验的信度又称测验的可靠性 , 是指同一个测验对同一组被试施测两次或多次 , 所得结果一致形程度。一个好的测验必须是稳定可靠的 , 多次使用所获得的结果是前后一致的。例如 , 用直尺测量长度 , 其结果是稳定可靠的 ; 用橡皮筋测长度则是不可靠的 , 前后测量结果缺乏一致性。在测量理论中 , 信度被定义为 : 某次测验分数的真变异数与总变异数 ( 即实测分数 ) 之比 :22

S

R x

xx ST =

式中 Rxx 表示测量的信度 ,ST 2 代表真分数的变异数 ( 方差 ),Sx 2 表示实得分数的变异数 ( 方差 ) 。 从上式可看出 , ( 1 )信度是指实测值和真值相差的程度 , 实测值是指对某物实际进行测量时所获得值 ,

也称实测分数 (X); 真值是指被测事物的真实规模取值 , 也称真分数 (T) 。由于各种原因 , 实得分数常不等于真分数 , 两者之差称为测量误差或误差分数 (E) 。从理论上看 , 实得分数由真分数和误差分数两部分组成即 :X=T+E

Rxx 就是对一组测验数据的实测分数与真分数相差程度的最好估计。

( 2 )信度又是指相同的测验对相同的被试再次测量时引起的同样反应的程度。如果两次测验中 , 受测者所得分数或所处等级前后一致 , 则说明测验结果的信度较高 ; 反之 , 两次测验结果一致性低 , 说明测验结果的信度低。

信度是任何一种测量的必要条件 ( 但不是唯一条件 ), 只有测量值接近或等于真值 , 用同一工具多次测量同一特性获得相同或相近的结果 , 才能认为这个测量结果是可靠的。信度对于教育测量尤其重要 , 只有信度高的教育测验才能成为教育工作者有用的工具 , 才能为教育工作者提供可靠的信息 , 为教育预测和决策提供客观依据。

2 、信度的估计方法

测验的信度是用信度系数的大小来表示的 , 根据测量理论 , 信度系数

2

2

S

R

x

xx

ST =

但是在实际测量中 , 一般只能获得实得分数 (X) 及实得变异数 (Sx 2 ), 而真分数 (T) 及真变异数 (ST 2 ) 是不知道的 , 因此 , 依据上述公式还无法机算信度系数。在统计上 , 主要采用相关分析的方法即机算两列变量的相关系数 , 用相关系数的大小来表示信度的高低。主要用以下方法来求得信度 :

( 1 )再测法 : 用同一测验对同一被试 , 前后施测两次 , 根据两次测验分数计算相关系数 , 即是再测信度。该信度反映了测验的稳定性程度 , 故又称稳定性系数 , 是用皮尔逊积差相关公式计算的 :2

12

1/21S S M M N X X R xx ?-=

式中 X 1 .X 2 为同一被试的两次测验得分 ,M1.M2 为两次测验的平均分数 ,S 1 .S 2 是两次测验的标准差 ,N 是被试人数。

用再测法估计信度 , 可以得到有关测验结果是否随时间而变化及变化程度的资料 , 可以作为预测被测者将来行为表现的依据。但也存在明显的局限性 : 前后两次测验结果易受到练习和记忆的影响 , 前后两次施测的时间间隔影响稳定性系数 , 特别是对学绩测验的影响较大。如果时间间隔太长 , 被测者的身心因受环境影响将发生大的变化 , 从而对第二次施测结果产生较大影响 , 使稳定性系数降低 ; 如果间隔太短 , 则被试第一次完成测验时练习和记忆会对第二次测验产生较大影响 , 使第二次测验性质发生变化。另外 , 有些测验不宜用再测法估计信度 , 如测量创造力测验 , 被试一旦掌握了解决问题的办法、原则 , 重测时 , 他将很容易作出反应 , 这样测验的性质就发生了改变。因此 , 只有在没有复本可用 , 测验不易受重复使用影响 , 现实条件又允许重复施测的情况下才使用重测法估计信度。

用重测法估计信度 , 间隔时间长短没有严格的规定 , 一般说 , 间隔时间越长 , 稳定性系数越低 , 最适

宜的时距应根据测验目的、性质及被试特点而定 , 最好不超过六个月。对儿童的时距应该短些 , 对成年人的时距可适当长些 , 因为个体早期的身心特征变化较大 , 而成年人的身心特征则相对稳定。

( 2 )复本法 . 根据同一测验目的编制的许多平行德等值测验 , 可测定被试的同一特征 , 这些等值的测验叫做复本。对一组受测者间隔一定时间或同时施测两个复本 , 根据两次测验结果求得相关系数 , 即得等值性系数 , 又称复本信度。对一组受测者间隔一定时间后施测两个复本所求得的稳定性系数又称等值稳定性系数。因为用这种方法求得的信度不仅受复本质量的影响 , 而且受时间练习等因素的影响 , 因此 , 等值稳定性系数更全面地反映了测验的信度。计算等值稳定性系数是对两个复本测验结果计算斯皮尔曼积差相关系数 ( 具体公式见前 ) 。

( 3 )分半法 . 当测验没有复本 ( 复本的编制是很复杂的 ) 而且测验只适合施测一次的情况下 , 可用分半法估计信度 , 即将测验题目分成对等的两半 , 根据每人在这两半测验中的得分 , 计算其相关系数 , 这个系数又称内部一致性系数。

要求得分半信度 , 首先要将测验分成对等的两半。绝大多数测验是由许多题目排列组成的 , 但是若将测验简单地分成前后两部分 , 常常是不对等的 , 对等的两部分起码有两个要求 : 一是测验的两部分在难度、区分度及测验目标上基本是相同的 ; 一是被测者以同等的态度来对待两部队测验 , 即在完成两部分测验过程中 , 练习 , 疲劳 , 情绪等因素对被试产生了同等的影响。因此 , 将一个测验分成两部分时 , 常用的是奇偶分半法 , 即将奇数题分为一部分 , 将偶数题分为一部分。 特别是测验题目是按由易到难排列时 , 这种分法可以将测验分为大致相等的两半 , 但是 , 对于速度型的测验不适合用奇偶分半法。 用分半法求出的测验的信度系数并不能反映整个测验的信度。这是因为信度受测验的长度的影响 , 测验越长 , 信度越高 , 将测验分成两半求得的信度系数 , 低估了整个测验的信度 , 因此 , 需对测验系数加以校正 , 校正公式是斯皮尔曼—布朗 (Spearman — Brown) 公式 :Rhh

Rhh R xx +=

12

Rxx 是整个测验的信度估计系数 ,Rhh 是两个分半测验的相关系数。上述公式的前提假设是两个半测验分数的变异性相等 , 但是若测验资料不符合这个假定 , 可用下列公式求得信度 : 弗朗那根 (Flanagan) 公式 :)2

2

21(2Sx Sb Sa R xx +-

?=

Sa 2 和 Sb 2 分别代表两个分测验分数的变异数 ,Sx 2 代表整个测验的变异数。 卢伦 (Rulon) 公式 :2

21Sx Sd Rxx -

=

Sd 2 代表两个半测验分数之差的变异数 ,Sx 2 代表总测验变异数。

对于由客观性题目组成的测验 ( 即答对一题得一分 , 答错得 0 分 ), 则可用库得─理查逊 (Kuder ─ Richardson) 公式估计测验的内部一致性 :)2

)(1)(1

(

Sx pq k k Rkk ∑-

-=

k 为测验的总题目数 ,p 为某一个题目的答对率或通过该题目的人数比例 ,q 为未通过该题目的人数比例 ,p=1-q,Sx 2 为测验总分的方差。

对于由客观性题目和主观性题目组成的测验 , 有些题目是多重计分的情况下 , 则要用克伦巴赫 (Cronbach) 公式计算α系数来估计测验的内部一致性 :)2

21)(1

(

Sx Si k k ∑-

-=α

k 为测验题目总分 ,Si 2 是某一题目得分的方差 ,Sx 2 是整个测验分数的方差。

上面这些公式不适用于速度性测验 , 因为只有每个人做完所有的题目 , 题目的方差才是准确的。 3 、提高测验信度的方法 :

影响测验信度的误差归纳起来主要有 :

(1) 抽样误差 : 简单说 , 这是在抽样过程中由于被试间的差异所造成的误差。被试间的差异可以用全距和方差大小来表示。全距是指某一心理量最大值与最小值之差。全距大说明被试间差异大 , 全距小说明被试间差异小。被试间在某一心理量上参差不齐 , 差别悬殊 , 则该心理量的方差大 ; 反之 , 方差小。对于方

差小的样本 , 被试间在某一心理特征上相差较小 , 则前后两次测验结果的一致性较低 , 即降低了信度。 因为被试之间的差别越小其同质性越高 , 被试的分数只要发生小的变化 , 其名次就可能改变 , 从而降低信度。

(2) 随机误差 : 由于各种偶然因素的影响而产生的误差 , 表现为用同一方法多次测量同一对象时结果上不一致。随机误差是由许多因素造成的 , 如量标的质量 , 测量的程序 , 被试的身心状态 , 测量的环境等。

根据影响测验信度的因素 , 可从以下几方面来提高测验的信度 : 一是从测验本身考虑 , 如测验的长度、难度、区分度、速度、程序、环境条件与计分方法等 ; 一是从被试自身考虑 , 如被试在被测心理特征上的差异大小 , 参加测验的动机水平 , 对测验的态度和积极性等。在此主要介绍如下几种提高测验信度的方法 :

( 1 )适当延长测验的长度 :

测验的长度主要指量表所包含的题目多少。对一个测验来说 , 测验的题目越少 , 得分越容易受偶然因素的影响 , 故测验的信度越低。反之如果测验题目较多 , 即测验长度延长 , 扩大了被试得分范围 , 可在一定程度上排除偶然因素的影响 , 从而提高测验信度。但是测验信度的增加并不是等比例提高信度系数。当信度系数较小时 , 延长测验长度信度系数增加较大 ; 当信度系数已经较大时 , 延长测验长度对信度系数的影响就较小了。而且 , 在延长测验长度时 , 还需考虑其他因素的影响 , 如被试在回答问题时是否疲倦或产生厌烦情绪 , 是否节省时间、物力和财力 , 测题是否附合测验目的等。

( 2 )测验的难度要适中 : 难度即测验的难易程度 , 当测验难度太大时 , 被试得分普遍太低 , 呈负偏态分布 ; 当测验难度太小时 , 被试得分普遍较高 , 呈正偏态分布。太难太易的测验都使被试得分差异减小 , 使实得分数方差减小 , 从而降低测验信度。参见公式 :

2

2

1x E R δδ-=

( 3 )测验的内容尽量同质 : 性质相同的测验内容 , 对被试也要求相同的能力、知识和技能 ; 而内容不同质的测验 , 则要求被试不同的能力、 知识和技能。因而为了提高测验信度 , 测验内容应尽量同质。 ( 4 )测验的时间要充分 : 对某一测验而言 , 应保证绝大多数被试在规定时间内完成测验 ; 否则 , 如果被试不能从容回答所有问题 , 就不能反映被试的真实水平。

( 5 )测验的程序要统一 : 包括测验的题目统一 , 指导语、回答问题的方式、分收试卷的方法、测验时间等都要统一。

( 6 )评分要客观 : 评分是否客观对测验信度有直接的影响。对于客观性题目 , 评分标准明确 , 评分容易做到客观 ; 但对于主观性题目 , 受评分者影响较大 , 不易做到客观。为了尽可能客观评分 , 应制定明确而易掌握的评分标准 , 尽量做到一卷多评 , 或一人只评一题等。 (二) 效度 1 、效度的含义

效度 (V alidity) 是指测量的有效程度或测量的正确性 , 即一个测验能够测量出所要测量特性的程度。例如 , 用直尺测量长度是有效的 , 而用来测量温度则是无效的。对效度的定义可作如下理解 :

( 1 )任何一种测验只是对一定目的来说才是有效的。

( 2 )测验的效度是对测量结果而言的 , 即一种测量工具只有经过实际测量 , 才能根据测量结果判断它的效度。

( 3 )测验的效度是相对的而非绝对的。测验是根据行为样本 , 对所要测量的心理特性作间接推断 , 只能达到某种程度的准确性 , 而没有全有、全无的差别。

在测量理论中 , 效度被定义为 : 在一系列测量中 , 与测量目的有关的真变异数 ( 即有效变异 ) 与总变异数之比 : 2

22Sx Sy rxy =

rxy 表示测量的效度系数 ,Sv 2 代表有效变异数 ,Sx 2 代表总变异数。 根据上述公式 , 可看出效度与信度的关系 : ∵ Sx 2 =Sv 2 +SI 2 +SE 2

ST 2 =Sv 2 +SI 2 2

22

2

22

22Sy SI Sx SI ST Sx Sy rxy =-=

=

∴ rxy 2 ≤ rxx

SI 2 表示系统误差方差 , 它稳定地与有效方差结合在一起 , 对信度没有影响 , 而影响效度。从以上证明看出 , 测验的效度受测验的信度所制约 , 而且效度系数不会大于信度系数。效度高的测验 , 信度必定高 ; 但信度高的测验 , 效度则未必高。

效度在教育测量中有重要的意义。对一个测验来说 , 效度比信度更为重要 , 测验首先要保证能如实地测量出所要测量的东西 , 否则 , 这种测量将是没有意义的。在教育测量中 , 效度问题尤其重要 , 首先 , 教育测量的对象大多是精神现象 , 只能对被测者的外部表现进行测量 , 以间接了解其心理活动特点或知识技能水平。其次 , 学生的心理活动特征与其外部表现之间 , 仅有相关关系而没有严格的函数关系 , 外部行为有时并不能准确地反映某种心理状态。再次 , 教育测量对象是有主观能动性的人 , 人是能够有意识地调节自己的外部行为 , 掩盖自己的内心活动 , 这就更增加了教育测量的难度。 2 、效度的类型与估计

(1) 内容效度 (Content V alidity): 是指测验目的代表所欲测量的内容和引起预期反应所达到的程度。例如 , 以考查学习成绩为目的的测验来说 ," 所欲测量的内容 " 是指教学大纲所规定的全部教材 ;" 起预期反应 " 是指学生学习这些教材所产生的行为变化 , 如对教材的记忆、理解和应用。

在编制测验时 , 内容效度是一个相当复杂的问题 , 例如教师编制学绩测验 , 其目的是了解学生在某一学科或专题上对知识掌握情况 , 若条件允许 , 应该对大纲规定的所有内容进行全面考试 , 这显然是行不通的 , 只能从这一范围总体内容中选取有代表性题目 ( 样本 ), 组成测验 , 根据测验分数推论学生对该范围总体知识的掌握。若测验题目较好地代表了这个知识范围 , 则推论是有效的 , 即测验的内容效度高 ; 若选题有偏差 , 则推论是无效的 , 即测验的内容效度低。从另一方面看 , 测验题目所引起的被试反应 ( 是一个样本 ), 若能代表其对本学科或专题的全部行为反应 , 也说明该测验是有效的 ; 反之 , 则是无效的。因此 , 一个测验要有较高的内容效度应具备如下两个条件 :1. 要有定义好的内容范围。 2. 测验题目取样应有代表性 ( 对所界定的内容范围而言 ) 。 估计内容效度的方法 :

A 、由专家进行逻辑分析 : 即请有关专家对测验题目与原来的内容范围是否符合进行分析 , 作出判断 , 看测验题目是否较好地代表了原来的内容。

B 、统计分析 : 克伦巴赫 (Cronbach) 认为内容效度可以进行数量估计 , 方法是从同一教学内容总体中抽取两套测题 , 分别对同一组被试进行测验 , 两种测验的相关系数可用来估计内容效度。若相关系数大 , 则内容效度高 ; 若相关系数小 , 则两个测验中至少有一个内容效度低。

另外 , 有经验的任课教师对本学科测验的内容效度有较好的判断。当然 , 若能与有关专家配合会更好些。 ( 2 )结构效度 (Construct V alidity): 又称构想效度 , 是测验对某一理论概念或心理特质量的程度。即某测验对所要测量的结构或心理特质实际测量的程度。心理测验都是建立在心理学理论基础的 , 例如比纳─西蒙智力量表的制订 , 心理学家比纳 (Binet) 首先详细研究了智力的结构 , 他认为智力行为是一种连锁性的过程 , 包括判断、推理、 解决问题等。他根据这一理论编制的智力测验 , 确实测量出被试的判断、推理和解决问题能力 , 可以认为他所编制的测验具有结构效度。一般说 , 学科测验主要看内容效度 , 心理测验主要看结构效度。 判断内容效度更容易一些 , 有教学大纲作依据 ; 判断结构效度更难一些 , 因为理论结构和心理特质不易把握。因此 , 要制订有构想效度的测验 , 首先要建立理论结构 , 例如智力测验 , 先要确定关于智力的一套理论 , 如智力的概念、结构、与环境的关系、与年龄的关系、与性别的关系等 , 在理论的基础上提出若干假设并编制测题。

确定结构效度的方法 :

A 、对测验题目进行分析 : 主要是分析测验的内容 , 被试对题目所作的反应 , 测验题目的同质性以及分测验之间的关系来判断测验的构想效度。

B 、计算与同类权威测验的相关 : 某一个新测验如果与同类的大家公认有效的已有测验之间 , 在测验结

果上相关很高, 说明这两个测验测的是相同特质, 即新测验也有较高的结构效度, 如后编的智力测验常与斯坦福─比纳智力量表进行比较。

C 、因素分析: 通过因素分析找到影响测验分数的共同因素, 在测验分数的总变异中来自有关因素的比例, 可以作为构想效度的指标。

(3) 预测效度(Predictive V alidity): 又称实证效度, 是指一个测验对个体将来的行为或获得的成就进行预测时的准确性。一个测验预测得越准确, 预测效度越高。被预测的行为或成绩是检验预测效度的标准, 简称效标(Criterion), 即衡量测验有效性的参照标准。效标是估计预测效度的主要依据, 应具备如下一些条件1) 有效性: 即效标测量本身必须有效。(2) 可靠性: 效标测量要具有较高的信度。(3) 客观性: 在效标测量时要防止受评定者主观印象和成见的影响, 要防止效标污染, 即由于主试知道某个人原来的测验成绩, 因而影响了在效标测量中对这个人的评定分数。(4) 效标测量应该简单省时, 花费少, 经济实用。一般常用学业成就, 等级评定, 临床诊断, 实际的工作表现作为效标。例如, 一个智力测验其预测效度既可用被试的学业成就作效标, 也可用熟悉的班主任对其进行等级评定作效标。

估计预测效度的主要方法是:

A、相关法: 即求某测验分数与效标测量间的相关, 所得结果即效标系数。当测验分数与效标测量分数都是连续变量时, 用积差相关公式求相关系数( 具体公式见统计教材) 。

当测验分数是连续变量, 而效标测量分数是二分变量时, 可用二列相关公式计算效度系数( 具体公式见统计教材) 。

B 、区分法: 即看原先测验的分数是否可以区分由效标测量所化分的团体。例如, 某工厂通过测验录用了一批工人, 过一段时间后, 根据工作成绩将其分为称职和不称职两种, 然后回过头来检查他们的测验分数, 运用t 检验看看两组在测验上的平均分数是否有显著差异。若有显著差异, 说明测验是有效的; 若差异不显著, 说明测验是无效的。

C 、功利率: 为了测定测验的功效, 人们还可对使用测验所化掉的费用与得到的利益进行比较, 看其利弊大小, 这种效度指标叫功利率。

U=B(Ns)-C(Nu)-S

U 代表功利率,B 表示录用一个合格的工人所产生的平均利润,C 表示录用一个不合格的工人所造成的损失,Ns 和Nu 分别代表所录用的人中成功和不成功的人数,S 代表整个选人程序的费用。

计算功利率说明, 如果一个测验简单易做, 适合于团体施测, 即使效度低些, 也会有人采用; 反之, 如果测验复杂, 只能个别施测, 费时费力, 那么只有效度极高, 给人带来极大好处时, 人们才会使用它。

提高测验效度对教育测验非常关键, 效度系数多大合适? 要根据测验的具体情况而定:

(1) 智力测验分数与熟悉教师对学生智力等级评定之间的效度系数一般在0.30 ─0.50 之间。教师评定常受许多其他因素的影响。

(2) 某一科目的标准测验成绩与任课教师对学生名次排列之间的相关系数应达到0.60 ─0.70 。

(3) 两种不同的智力测验或两种标准测验之间的相关系数应达到

0.60 ─0.80

效度系数可解释为效标分数中的变异有百分之几来源于测验的变异。例如效度系数为0.50, 则说明效标分数中有0.502=25% 的变异来自原测验分数的变异; 若效度系数为0.71, 则效标分数中有50% 的变异来自原测验分数。

3 、提高测验效度的方法:

( 2 )控制系统误差: 系统误差是影响测验效度的主要因素。它主要包括仪器不准, 题目和指导语有暗示性, 答案按排不当( 被试可以猜测) 等, 控制这些因素可以降低系统误差, 提高效度。

(2) 精心编制测题和测验量表: 首先测题内容要适合测验目的, 如知识性测题就不能全面反映被试的智力水平, 它主要测量其知识水平。其次, 测题要清楚明了, 用语要让被试理解, 排列由易到难。第三, 测题的难度和曲分度要合适。

(3) 严格按照测验程序进行测量, 防止测量误差: 要严格按照测验手册进行测量, 不能作过多的解释, 按标准评分, 两次测验间隔要适当。

(4) 样本容量要适当 : 当样本容量增大时 , 样本对总体的代表性提高 , 样本大 , 被试的内部差异增大 , 扩大了真分数的方差 , 使效度提高。样本容量一般不应低于 30 。另外 , 抽样方法也很重要 , 一般用随机抽样 , 当群体很大时 , 可分层抽样 , 样本容量扩大时 , 其代表性才随之增大。

(5) 正确处理好信度与效度的关系 : 信度是效度的必要条件 , 但信度高的测验 , 效度不一定高 ; 而效度高的测验 , 信度却比较高。但是 , 既要有高效度 , 又要有高信度是不容易做到的。“最大可靠度(信度)要求测验项目之间有高度的组间相关;最大预测有效度却要求低度的组间相关。最大可靠度(信度)要求项目等同的难度;最大预测有效度却要求项目的难度有所区别。中等程度的组间相关( 0.10 ─ 0.60), 通常可产生良好的效度 (0.30 ─ 0.80), 并且产生满意的信度 (0.90) 。” ( 郝德员 : 《教育与心理统计》 , 教育科学出版社 ,1962 年版 .P429)

(6) 适当增加测验的长度 : 增加测验的长度可提高测验的信度 , 也可以提高效度 , 但增加测验的长度对信度的影响大于对效度的影响。如果增加测验长度到原来的 n 倍 , 则新测验的效度系数 Rnxy 计算公式 :Rxx

n

Rxx Rxy Rnxy +-=

1

式中 Rxy 、 Rxx 分别是原测验的效度系数和信度系数。

2.3.3 信度和效度检验

(1)信度检验

采用Cronbach α系数、个别项目信度、潜在变量的组合信度(Composite Reliability, CR)进行信度检验,其中运用SPSS15.0中的“Analyze-Scale-Reliability Analysis”命令,并选择“Statistics”中的“Scale if item deleted”,来计算Cronbach α系数,利用LISREL8.70进行验证性因子分析来计算个别项目信度和组合信度,验证性因子分析的运算结果(详见附录3)经整理如表2.6所示:

从表2.6中关于Cronbach α系数的三栏中可以看出:C1、B4对应的“校正得项总计相关性”(Corrected Item-Total Correlation)偏低(相对于该部分量表中的其他指标对应值而言),且删除C1、B4有利于分别提升该部分量表的总体信度,故应将C1、B4两个指标删除。

同时“个别项目信度”一栏中C1、C2、B3、B4、P1这5个指标的因子负荷均小于0.50,根据社会科学研究特点,这5个指标也应删除,且删除后有利于提高整个因素的一致性;而另外35个指标的因子负荷均大于0.5,满足信度要求。

除此之外,诚信环境、企业素质、投标诚信、履约诚信、社会诚信各个量表以及整体的Cronbach α系数分别为0.750、0.845、0.817、0.862、0.830、0.939,属于很可信的区间范围;且对应的组合信度分别为0.75、0.85、0.83、0.86、0.83、0.96,均大于0.5,满足信度要求。

(2)效度检验

在信度检验删除5个指标基础上,首先,对有效样本数据进行KMO抽样适当性检验和Bartlett球形检验,检验结果显示KMO值为0.5,Bartlett球形检验的x2值为250.278(自由度为105),达到显著水平(p=0.000<0.001)。一般认为,当KMO值大于0.5时,即可进行因子分析,而本次KMO的检验值为0.5,说明本调查问卷的样本数据基本适合进行因子分析。

其次,采用主成分分析法,进行V arimax方差正交旋转,最终提取特征值大于1的因子4个,7个共同因子累计解释的变异量为60.74%,且正交旋转后得到的因子负荷矩阵如表2.7所示:

表2.6 第三轮问卷信度检验

编号校正的项总计相

关性

对应指标删除后的

Cronbach α系数

部分量表

Cronbach α系数

整体量表

Cronbach α系数

个别项目

信度

组合信度

诚信环境C1 0.365 0.752

0.750

0.939

0.31

0.75

0.96 C2 0.408 0.735 0.33

C3 0.498 0.712 0.63

C4 0.628 0.674 0.80

C5 0.575 0.690 0.77

C6 0.479 0.717 0.59

企业素质E1 0.504 0.834

0.845

0.59

0.85 E2 0.539 0.831 0.57

E3 0.584 0.827 0.62

E4 0.608 0.824 0.60

E5 0.498 0.835 0.55

E6 0.565 0.828 0.64

E7 0.526 0.832 0.62

E8 0.561 0.829 0.64

E9 0.567 0.828 0.62

E10 0.470 0.837 0.56

投标诚信B1 0.554 0.794

0.817

0.63

0.83 B2 0.579 0.791 0.66

B3 0.432 0.810 0.44

B4 0.409 0.821 0.42

B5 0.499 0.801 0.53

B6 0.616 0.785 0.71

B7 0.656 0.780 0.76

B8 0.598 0.787 0.71

履约诚信P1 0.435 0.862

0.862

0.46

0.86 P2 0.516 0.854 0.56

P3 0.563 0.850 0.57

P4 0.558 0.850 0.64

P5 0.634 0.844 0.71

P6 0.634 0.844 0.69

P7 0.609 0.846 0.63

P8 0.558 0.850 0.61

P9 0.617 0.845 0.69

P10 0.619 0.845 0.67

社会诚信S1 0.548 0.813

0.830

0.65

0.83 S2 0.609 0.801 0.74

S3 0.586 0.805 0.66

S4 0.661 0.789 0.69

S5 0.615 0.799 0.62

S6 0.584 0.806 0.62

表2.7 旋转后因子负荷矩阵

共同因子

1 2 3 4 5 6 7

施工安全0.682 0.095 0.283 0.110 0.118 0.053 0.188

合同工期0.672 0.192 -0.066 0.160 0.194 0.099 0.097

工程质量保证0.672 0.251 0.307 0.165 0.018 0.000 0.009

保修义务履行情况0.649 0.195 0.127 0.109 0.109 0.279 0.025

设备到位情况0.564 0.113 0.065 0.007 0.192 0.110 0.402

工程索赔0.522 0.337 0.013 0.161 0.170 0.238 -0.097

工人工资支付0.484 0.365 0.233 0.161 0.023 0.270 0.060

缔约过失行为0.207 0.739 0.164 0.158 0.161 0.154 0.016

中标放弃0.164 0.715 0.107 0.223 0.176 0.132 -0.006

参与串标围标0.228 0.677 0.232 0.143 -0.016 0.200 0.042

低于成本价投标0.100 0.594 0.003 0.025 0.181 0.067 0.268

转包违法分包0.421 0.551 0.204 0.049 -0.028 0.183 0.082

资质真实性0.224 0.464 0.333 0.296 0.037 0.113 0.143

政府诚信水平0.122 0.155 0.784 0.138 0.138 0.032 0.118

诚信法律环境0.077 0.287 0.736 0.165 0.157 0.064 -0.066

诚信文化环境0.102 0.035 0.681 -0.068 0.182 0.175 0.047

征信体系建设水平0.164 0.094 0.663 0.182 -0.063 0.163 -0.002

职工素质0.379 0.100 0.389 0.181 0.275 -0.098 0.304

工程业绩0.062 0.213 0.010 0.681 0.100 -0.003 0.263

建设单位评价0.317 0.060 0.240 0.647 0.137 0.239 -0.066

守法诚信评价0.225 0.354 0.320 0.522 -0.043 0.336 0.078

资质等级0.018 0.153 0.049 0.501 0.343 -0.046 0.363

监理单位评价0.386 0.009 0.128 0.446 0.351 0.351 -0.014

项目部情况0.285 0.346 0.170 0.419 -0.057 -0.033 0.360

资格审查材料真实性0.363 0.226 0.341 0.394 0.113 0.090 0.115

管理素质0.279 0.262 0.358 0.390 0.070 -0.037 0.384

总资产收益率0.133 0.131 0.100 0.101 0.767 0.099 0.117

资产负债率0.182 0.192 0.249 0.066 0.702 0.166 0.071

企业净资产0.177 -0.004 0.045 0.119 0.662 0.061 0.392

银行信用等级0.118 0.238 0.289 0.409 0.425 0.184 -0.012

法院评价0.106 0.227 0.066 0.117 0.086 0.805 0.067

纳税评价0.105 0.224 0.191 0.184 0.142 0.736 0.057

劳动保障评价0.354 0.124 0.150 -0.099 0.137 0.710 0.193

机械设备0.086 0.035 -0.019 0.096 0.430 0.054 0.754

技术创新0.095 0.120 0.066 0.178 0.051 0.212 0.737 根据因子分析中对因子负荷的要求,由于“职工素质”、“资格审查材料真实性”、“管理素质”、三个指标的因子负荷均小于0.4,故这三个指标应删除;而第7个因素只包含“机械设备”、“技术创新”两个指标,所涵盖的指标太少,降之删除较为适宜[43]。

此时,剩下的30个指标在所属因子下的因子负荷均大于0.4,且在非所属因子下的因子负荷均小于0.4,所以,第三轮问卷的聚敛效度和区分效度均满足相关要求,第三轮问卷通过效度检验。

最后,根据各个共同因子所涵盖的指标,将共同因子依次命名为“投标诚信(BI)”、“履约诚信(PI)”、“行业评价(CONSTRUCTION E)”、“银行诚信(BaI)”、“诚信环境(IE)”、“社会评价(SOCIAL E)”。

检验信度步骤:Analyze--scale--reliability--data reduction--fator然后看Cronbach's α系数。一般来说Cronbach’alpha系数在0.65以上是可接受的最小信度值。

检验效度步骤:

因子分析前,首先进行KMO检验和巴特利球体检验,KMO检验系数>0.5,(巴特利特球体检验的x2统计值的显著性概率)P值<0.05 时,问卷才有结构效度,才能进行因子分析,因子分析主要是你自己做了一份调查问卷,你要考量这份问卷调查来的数据信度和效度如何,能不能对你想要调查的东西起代表性作用啊,说得很通俗呵呵不知道能不能理解呢,在SPSS里面,Analyze—Factor就是因子分子,在左下角第一个框框description里面勾选最下面的那个KMO and Bartlett’s test of sphericity,就会出来结果哈,看表格的第一行为KMO值,最后一行Sig为球星检验的P值,小于0.05即可

1.在做因子分析时,是否输出KMO结果,是与原始数据没有关系的,它只是作为判定原始数据是否适合做因子分析的依据。

2.做因子分析时,要想输出KMO结果,要在复选框做相应的选择(在默认状态是没有这个结果输出的).具体的操作过程:Analyze--Date Reduction--Factor--Descriptives---选中:KMO and Bartlettis test of sphericity--continue

首先必须要做KMO和Bartlett球形检验,这个你应该会了吧,如果这两个检验合格的话说明数据是适合做因子分析的。

然后提取因子后,看主因子解释总变异的百分比和个因子的因子载荷,主因子解释总变异一般若大于60%的和因子载荷大于0.6的话说明结构效度很好。

pS: ,如果题目没有规定就是选特征值大于1的,如果题目事先要提取几个因子,那么在操作的时候,用SPSS那个因子分析的选项里面有一个地方可以著名,因子载荷在输出的结果直接可以看到(rotated compoment matrpx),一定要是旋转后的因子载荷

除此之外,你可以用因子分析里面Descriotives里面KMO和巴特利检验(battele,不知道是不是这样写的),KMO 的值如果>0.5,则说明因子分析的效度还行,可以进行因子分析;另外,如果巴特利检验的P<0.001,说明因子的相关系数矩阵非单位矩阵,能够提取最少的因子同时又能解释大部分的方差,即效度可以。

spss 信度分析

第九章第九章信度分信度分析析?6?1一再测信度·用同一个测验对同一组被试前后两次施测两次测验分数所得的相关系数为再测信度·因为它能反映两次测验结果有无变动也就是测验分数的稳定程度故又称稳定性系数·计算再测信度应满足一下几个假设①所测量的特质必须是稳定的②遗忘与练习的效果相同③两次施测期间被试的学习效果没有差别···。·根据一组被试在两个平行等值测验上的得分计算的相关数。因为它反映的是两个测验之间的等值程度因此又叫等值性系数。·采用此法一定要注意①两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似②两次测验的时间间隔要适当·复本信度的局限①复本法只能减少而不能完全排除练习和记忆的影响②对于许多测验来说建立复本是相对困难的?6?1按正常的程序实施测验然后将全部项目分成相等的两半根据各人在这两半测验的分数计算其相关系数?6?1斯皮尔曼—布朗校正公式弗朗那根估计信度公式。?6?1使用奇偶分半法一定要注意两个问题①如遇到有牵连的项目或一组解决同一问题的项目时这些项目应放在同一半否则将会高估信度的值②当试卷中存在任选题或试卷为速度测试时不宜采用分半法·同质性也称内部一致性指的是测验内部所有题目间的一致性。1、测量同质性的基本公式2、库德—理查逊公式估计测验的信度估计同质性信度·适用于答对一题得分答错无分3、克伦巴赫系数·适

用于项目多重记分的测验·评分者之间的变异是产生误差的重要原因之一·考察评分者信度的方法是随机抽取部分试卷由两个或多个评分者独立按评分标准打分然后求其间的相关。如果是两个评分者则采用积差相关或等级相关的方法一般认为结果训练的成对评分者之间的一致性达到0.90以上评分才是客观的。如果是多个评分者则采用和谐系数来估计信度。一评价测验·信度系数是衡量测验好坏的一个重要技术指标·一般能力与成就测验的信度系数常在0.90以上·性格、兴趣、态度等人格测验的信度系数通常在0.80-0.85之间二解释分数1、个人测验分数的误差·个人在两次测验中分数的差异就是测量误差据此可得出一个误差分数的分布这个分布 的标准差就是测量的标准差它是测量误差大小的指标。2、两种测验分数的比较·来自不同测验的原始分数是无法直接比较的只有参照同一团体的平均分数将它们转换成相同尺 度的标准分数才能进行比较。一被试的样本·团体的异质程度与分类的分布有关一个团体越是异质其分数分布的范围也 就越大信度系数就越高。·信度系数不仅受样本团体的异质程度的影响也受样本团体平均水平的影响。因为对于不同水平的团体项目具有不同的难度每个项目在难度上的变化累积 起来便会影响信度。这种影响不能用统计公式来推估只能从经验中发现。二测验的长度·一般来说测验越长信度值越高。因为①测验加长可能改进项目取样的代表性从而能更好地

spss数据分析教程之SPSS信度分析和效度分析

信度分析和效度分析 数据计分方法说明 类别 小分类 对应题项 每题计分方法 维度计分方法 题项 职业倦怠 情感枯竭 1-3题 正向计分 全部题项直接加总 3 去个性化 4-6题 正向计分 全部题项直接加总 3 个人成就感 7-10题 逆向计分 全部题项取倒数后加 总 4 心理资本 11-18题 正向计分 全部题项直接加总 8 组织气氛 19-26题 21题为逆向计分,其余题项正向计分 21题取倒数后与其余 题项加总 8 总体幸福感 27-31题 27题和31题为逆向计分,其余题项为正 向计分 27和31题取到术后与 其余题项加总 5 整体问卷 以上各个维度的总分 直接加总 31 讲问卷调查的数据进行如上表的数据预处理后,接下来再进行如下分析。 1 信度分析 这里有63份问卷,首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图,问卷中的各个问题是否测量了相同的内容和信息;同时,对于调查问卷所得到的数据是否具有可靠性,就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关,它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言,如果问卷的信度系数达到0.9以上,该问卷调查的信度就较好;信度系数在0.8以上,是不错的;一般认为试卷信度在0.5至0.9以内是合理的,如果信度系数低于0.5,则此问卷的调查结果就不可信了。 将以上63份问卷的数据用SPSS21.0先进行标准化处理,再进行信度分析,其结果如表一所示: 表一 信度分析表

类别Cronbach's Alpha项数 整体问卷.61731 职业倦怠.82210 心理资本.8018 组织气氛.8378 总体幸福感.6795 表一显示,整体问卷和问卷中的各个维度的Cronbach's Alpha系数值均大于0.6,所以可以推断此问卷的可信度一般,该评价问卷只具有很较高的内在一致性。 2 效度分析 具备信度的问题不一定具备效度,因此做完信度分析,再用SPSS21.0对其进行效度分析。 2.1 因子模型适应性分析 效度分析使用的是因子分析模型,在运用因子模型分析之前,首先要对问卷数据进行因子模型适应性分析,分析结果如下表所示: 表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。.657 Bartlett 的球形度检验近似卡方1187.636 df 465 Sig. .000 由上表的数据可知,问卷数据的KMO值为0.657,并且通过了显著性水平为0.05的巴特利球型检验,说明问卷调查的数据非常适合做因子分析。 2.2 因子分析结果 在进行了适应性检验之后,接下来就进行因子分析,其结果如下: 表三方差贡献率 解释的总方差 成份初始特征值提取平方和载入旋转平方和载入

spss数据分析教程之SPSS信度分析和效度分析

信度分析和效度分析 数据计分方法说明 讲问卷调查的数据进行如上表的数据预处理后,接下来再进行如下分析。 1 信度分析 这里有 63 份问卷,首先我们需要的判定的是问卷中的调查题目能否反映调 查的目的和调 查的意图,问卷中的各个问题是否测量了相同的内容和信息;同时, 对于调查问卷所得到的数据是否具有可靠性,就必须在对问卷分析之前做信度分 析。信度本身与测量结果的正确与否无关,它的用途在于检测问卷本身的稳定性。 信度分析中常用 Cronbach α系数的大小来衡量调查问卷的信度。一般而言,如 果问卷的信度系数达到 0.9 以上,该问卷调查的信度就较好;信度系数在 0.8 以上,是不错的;一般认为试卷信度在 0.5至 0.9以内是合理的,如果信度系数 低于 0.5,则此问卷的调查结果就不可信了。 将以上 63份问卷的数据用 SPSS21.0先进行标准化处理,再进行信度分析, 其结果如表一所示: 表一 信度分析表 类别 小分类 对应题 项 每题计分方法 维度计分方法 心理资本 组织气氛 总体幸福感 整体问卷 情感枯竭 1-3 题 正向计分 去个性化 4-6 题 正向计分 个人成就感 7-10 题 逆向计分 11-18 题 19-26 题 27-31 正向计分 全部题项直接加总 全部题项直接加总 全部题项取倒数后加 总 全部题项直接加总 21 题为逆向计分,其 余题项正向计分 27 题和 31 题为逆向 计分,其余题项为正 向计分 21 题取倒数后与其余 题项加总 27 和 31题取到术后与 其余题项加总 以上各个维度的总分 直接加总 3 3 4 8 8 5 31

整体问卷.617 31 职业倦怠.822 10 心理资本.801 8 组织气氛.837 8 总体幸福感.679 5 表一显示,整体问卷和问卷中的各个维度的 Cronbach's Alpha 系数值均大于 0.6,所以可以推断此问卷的可信度一般,该评价问卷只具有很较高的内在一致性。 2 效度分析 具备信度的问题不一定具备效度,因此做完信度分析,再用 SPSS21.0 对其进行效度分析。 2.1 因子模型适应性分析效度分析使用的是因子分析模型,在运用因子模型分析之前,首先要对问卷数据进行因子模型适应性分析,分析结果如下表所示: 表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Mey er-Olkin 度量。.657 近似卡方1187.636 Bartlett 的球形度检验df465 Sig..000 由上表的数据可知,问卷数据的KMO 值为0.657,并且通过了显著性水平为0.05 的巴特利球型检验,说明问卷调查的数据非常适合做因子分析。 2.2 因子分析结果在进行了适应性检验之后,接下来就进行因子分析,其结果如下: 表三方差贡献率 解释的总方差 成份初始特征值提取平方和载入旋转平方和载入

spss软件进行信度分析

spss软件进行信度分析 问卷的信度分析一、概念:信度是指根据测验工具所得到的结果的一致性或稳定性,反映被测特征真实程度的指标。一般而言,两次或两个测验的结果愈是一致,则误差愈小,所得的信度愈高,它具有以下特性:1 、信度是指测验所得到结果的一致性或稳定性,而非测问卷的信度分析 一、概念: 信度是指根据测验工具所得到的结果的一致性或稳定性,反映被测特征真实程度的指标。一般而言,两次或两个测验的结果愈是一致,则误差愈小,所得的信度愈高,它具有以下特性: 1、信度是指测验所得到结果的一致性或稳定性,而非测验或量表本身; 2、信度值是指在某一特定类型下的一致性,非泛指一般的一致性,信度系数会因不同时间、不同受试者或不同评分者而出现不同的结果; 3、信度是效度的必要条件,非充分条件。信度低效度一定低,但信度高未必表示效度也高; 信度检验完全依赖于统计方法。 信度可分为:内在信度:对一组问题是否测量同一个概念,同时组成量表题项的内在一致性程度如何;常用的检测方法是Cronbach’s alpha系数。外在信度:对相同的测试者在不同时间测得的结果是否一致,再测信度是外在信度最常用的检验法。 二、信度指标: 1.用信度系数来表示信度的大小。信度系数越大,表明测量的可信程度越大。究竟信度系数要多少才算有高的信度。学者DeVellis(1991)认为,0.60~0.65(最好不要);0.65~0.70(最小可接受值);0.70~0.80(相当好);0.80~0.90(非常好)。由此,一份信度系数好的量表或问卷,最好在0.80以上,0.70至0.80之间还算是可以接受的范围;分量表最好在0.70以上,0.60至0.70之间可以接受。若分量表的内部一致性系数在0.60以下或者总量表的信度系数在0.80以下,应考虑重新修订量表或增删题项。 2.信度指标多以相关系数来表示:大致可分为三类:稳定系数(跨时间的一致性)、等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。 三、信度分析方法: 1.重测信度法: 用同样的问卷对同一被测间隔一定时间的重复测试,也可称作测试——再测方法,计算两次测试结果的相关系数。很显然这是稳定系数,即跨时间的一致性。重测信度法适用于事实性的问卷,也可用于不易受环境影响的态度、意见式问卷。由于重测信度需要对同一样本试测两次,而被测容易受到各种事件、活动的影响,所以间隔时间需要适当。较常用者为间隔二星期或一个月。 2.复本信度法(等同信度法): 复本信度法是让被测一次填写两份问卷复本,计算两个复本的相关系数。由于这种方法要求两个复本除表达方式不同外,在内容、格式、难度和对应题项的提问方式等方面都要完全一致,所以复本信度属于等值系数。在实际的调查中,问卷很难达到这种要求,这种方法较少被采用。 3.折半信度法: 折半信度法是指将测量项目按奇偶项分成两半,分别记分,测算出两半分数之间的相关系数(实际应用EXCEL软件),再据此确定整个测量的信度系数RXX。折半信度属于内在一

spss数据分析教程之SPSS信度分析和效度分析

s p s s数据分析教程之S P S S信度分析和效度 分析 集团标准化工作小组 [Q8QX9QT-X8QQB8Q8-NQ8QJ8-M8QMN]

信度分析和效度分析 数据计分方法说明 1 信度分析 这里有63份问卷,首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图,问卷中的各个问题是否测量了相同的内容和信息;同时,对于调查问卷所得到的数据是否具有可靠性,就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关,它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言,如果问卷的信度系数达到以上,该问卷调查的信度就较好;信度系数在以上,是不错的;一般认为试卷信度在至以内是合理的,如果信度系数低于,则此问卷的调查结果就不可信了。 将以上63份问卷的数据用先进行标准化处理,再进行信度分析,其结果如表一所示:

表一显示,整体问卷和问卷中的各个维度的Cronbach's Alpha系数值均大于,所以可以推断此问卷的可信度一般,该评价问卷只具有很较高的内在一致性。 2 效度分析 具备信度的问题不一定具备效度,因此做完信度分析,再用对其进行效度分析。 因子模型适应性分析 效度分析使用的是因子分析模型,在运用因子模型分析之前,首先要对问卷数据进行因子模型适应性分析,分析结果如下表所示: 表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。.657 Bartlett 的球形度检验近似卡方 df465 Sig..000 由上表的数据可知,问卷数据的KMO值为,并且通过了显着性水平为的巴特利球型检验,说明问卷调查的数据非常适合做因子分析。 因子分析结果 在进行了适应性检验之后,接下来就进行因子分析,其结果如下: 表三方差贡献率 解释的总方差 成份 初始特征值提取平方和载入旋转平方和载入 合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 % 1 2 3 4 5 6 7 8 9.958 10.880 11.762 12.714 13.684 14.623 15.580 16.509 17.449 18.394 19.342 20.289.934

信度分析

1 信度概述 1.1 信度 问卷调查法是研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷架构,从而提升问卷的信度和效度,在此主要讨论信度分析。 信度又叫可靠性,是指测量结果的稳定性程度或一致性程度。一个好的测验必须稳定可靠,即多次测量的结果保持一致,否则便不可信。作好问卷调查后,接下来为了进一步考验问卷的可靠性与有效性,即要做信度分析(Reliability Analsis),信度本身与测量所得结果正确与否无关,它的功用在于检验测量本身是否稳定。 例如:我们用一个智力量表去测量某一个儿童,第一次测得的结果是IQ=90,第二次测得的结果是IQ=120。那么我们就会问:到底这儿童的智商是多少?这就是该智力测验的可靠性有问题。就好象用橡皮筋去量东西的长度。前面讲过,任何一种测量,总有或多或少的误差,信度受随机误差的影响。随机误差越大,信度也就越低;随机误差越小,信度就越高。因此,信度也可看作测量结果受机遇影响的程度。测验信度越高,表示测验结果越可信,但也无法期望两次测验结果完全一致,信度除受测验质量影响外,亦受很多其他受测者因素的影响,故没有一份测验是完全可靠的。信度只是一种程度上大小的差别而已。一致性高的问卷便是只同一群人接受性质相同题型相同目的相同的各种问卷测量后,在各衡量结果间显示出强烈的正相关。稳定性高的测量工具则是指一群人在不同时空下接受同样的衡量工具时,结果的差异很小。 一般信度的测量时容易产生误差的原因,是来自研究者的因素包括:测量内容(遣词用句、问题形式等)不当、情境(时间长短、气氛、前言说明等)以及研究者本身的疏忽(听错、记错等);而来自受访者的因素则可能是由于其个性、年龄、教育程度、社会阶层及其他心理因素等,而影响其答题的正确性。 问卷内容的同构型及受访时间间隔的影响是影响信度的两个主要因素。 在测量理论中,信度被定义为:一组测量分数的真变异数与总变异数(实得分数的变异数)的比率。即: XX = S T2 /S X2

运用spss软件进行信度分析

运用spss软件进行信度分析 问卷的信度分析 一、概念: 信度是指根据测验工具所得到的结果的一致性或稳定性,反映被测特征真实程度的指标。一般而言,两次或两个测验的结果愈是一致,则误差愈小,所得的信度愈高,它具有以下特性: 1、信度是指测验所得到结果的一致性或稳定性,而非测验或量表本身; 2、信度值是指在某一特定类型下的一致性,非泛指一般的一致性,信度系数会因不同时间、不同受试者或不同评分者而出现不同的结果; 3、信度是效度的必要条件,非充分条件。信度低效度一定低,但信度高未必表示效度也高; 信度检验完全依赖于统计方法。 信度可分为:内在信度:对一组问题是否测量同一个概念,同时组成量表题项的内在一致性程度如何;常用的检测方法是Cronbach’s alpha系数。外在信度:对相同的测试者在不同时间测得的结果是否一致,再测信度是外在信度最常用的检验法。 二、信度指标: 1.用信度系数来表示信度的大小。信度系数越大,表明测量的可信程度越大。究竟信度系数要多少才算有高的信度。学者DeVellis(1991)认为,0.60~0.65(最好不要);0.65~0.70(最小可接受值);0.70~0.80(相当好);0.80~0.90(非常好)。由此,一份信度系数好的量表或问卷,最好在0.80以上,0.70至0.80之间还算是可以接受的范围;分量表最好在0.70以上,0.60至0.70之间可以接受。若分量表的内部一致性系数在0.60以下或者总量表的信度系数在0.80以下,应考虑重新修订量表或增删题项。 2.信度指标多以相关系数来表示:大致可分为三类:稳定系数(跨时间的一致性)、等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。 三、信度分析方法: 1.重测信度法: 用同样的问卷对同一被测间隔一定时间的重复测试,也可称作测试——再测方法,计算两次测试结果的相关系数。很显然这是稳定系数,即跨时间的一致性。重测信度法适用于事实性的问卷,

信度分析报告报告材料spss例析

信度分析 信度分析又称可靠性分析,是检验测量工具的可靠性和稳定性的主要方法; 信度问题要回答的问题是:用这个测量工具在同一条件下对同一人进行测试,每次测试的结果是否相同的问题。在社会科学中如果使用的测量工具无论对谁施测,也无论使用什么形式,只要产生相似的结果,那么可以认为此测量工具是可信的。信度问题其实测的是一致性的问题,所谓信度是衡量没有误差的程度。一致性分为内部一致性和外部一致性。 效度问题要回答的是:此测量工能够测量我想要测得的东西吗?不能混淆信度与效度。 信度的测量 1.克伦巴赫α系数。测度内部一致性的一个指标;及测量表内的所有项目测量的都是同一样东西吗?α与皮尔逊r 系数都是一样的范围在0—1 之间,如果为负值则表明表中某些项目的内容是其他一些项目的反面;α越接近于1,则量表中项目的内部一致性越是高。α 的计算式非常简单,根据量表中的项目数K 和各项之间的相关系数r 计算而来 1(1)kr k r α=+- 当量表中项目K 增加时,α值也会增大;同时,项目之间的相关系数r 较高时,α也会比较大。这里的r 是指各项与其他各项之和计算相关系数的平均值。 2、重测信度法 这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一

样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 3、复本信度法 复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 4、折半信度法 折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。在问卷调查中,态度测量最常见的形式是5级李克特(Likert)量表。进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(rhh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式:求出整个量表的信度系数(ru)。 例1某医学院某年级生物化学考试成绩已建立数据库文件(reliabil.sav)。试求该考试成绩的可靠性(信度)系数。 (7个试题,60名学生的考试成绩),见下图

如何利用SPSS做因子分析等分析(仅供参考)

我就以我的数据为例来做示范,仅供参考 一、信度分析(即可靠度分析) 1.分析——度量——可靠度分析 图 1 2.然后就会弹出上图1的 框框。在这里,你可以对 所有的问题进行可靠度分 析,如果是这样,那你只 需要选中所有的问题到右 边这个白色的框框,然后 点击“统计量”,按照右 边这个图进行打钩。然后 点“继续”。之后就点“确 定”图2 3.接着去“输出1”这个框看分析结果,你就 会看到很多分析结果,其中有一个就是右图, 那第一个0.808就是你所选择进行分析的数据 的信度。如果你想把每一个维度的数据进行独 立的信度分析,那道理也是一样的。 二、因子分析 在做因子分析之前首先要判断这些数据是否适合做因子分析,那这里就需要进行效度检验,不过总共效度检验是和因子分析的操作同步的,意思就是说你在做因子分析的时候也可以做效度检验。具体示范如下: 1.分析——降维——因子分析 图 2 一般来说,咱们做因子分析的时候是为了把那些具有共同属性的因子归类成一类,说的简单点就是要验证咱们所选取的每一个维度下面的题目是属于这个维度,而非其他维度的。那一般来说,因子分析做出来的结果就是你原本有几个维度,最终分析结果就会归类成几个公因子。 2.一般来说,自变量的题目和因变量的题目是要独立分析的。我的课题是“店

面形象对顾客购买意愿的影响”那自变量就是店面形象的那些维度,因变量就是顾客购买意愿。 3.将要做分析的题目选择到右边的白框之后,就如下图打钩: “抽取”和“选项”两个不用管他。然后就点“确定” 4.按照上述步骤操作下来之后,就可以去“输出1”看分析结果。首先看效度 检验的结果:这里要看第一行和最后一行的数据,第一行数据为0.756,表明效度较高,sig为0.000,这两个结果显示这份数据完全可以做因子分析。 那就去看因子分析的结果。 5.看下面这张图,看“初始特征值”这一项下面的“合计”的数值,有几个数 据是>1,那就表明此次因子分析共提取了几个公因子。下图所示,有5个数据是>1,这表明可以提取5个公因子。我之前提到了,一般来说,在自变量中设计了几个维度,因子分析就会显示出几个公因子,我设计了5个维度,所以我因子分析的结果就显示我可以提取5个公因子。然后就看“旋转平方和载入”下面的“累积%”的最后一行那个数据,我这里是68.713,这表明表中数据可以很好的解释自变量。 6.然后就看“旋转成分矩阵”,如下图,我把数值比较>0.5的归为一类,然后 重命名,这一步就是因子分析的精髓所在啊。根据数值,把这些因子提取,并合并成一个公因子。这就为下面的相关分析和回归分析做准备了。如何合并成一个公因子,这就需要结合你之前所设计的自变量的维度了。我把店面形象分为产品形象、服务形象、价格形象、促销形象、环境形象,根据这个旋转成分矩阵的分析结果,我把1列几个加红的数据所对应的因子归类成产品形象。其他几个也是同样的道理。不过也要注意,这些因子所涉及的内容是否和公因子一样。如下表3这一列,我原本第三个维度是价格形象,但是从分析结果来看是和促销形象相关的,而4这一列恰恰和价格相关,所以我就把3这一列提取为促销形象,4提取为价格形象。 7.上面讲的是自变量的因子分析,就是店面形象的维度的因子分析,那还需要做因变量的因子分析,就是购买意愿的因子分析,操作手法和上面一样,我就不说了。 三、相关分析

利用SPSS进行量表分析

第五节利用SPSS进行量表分析 在第五章调查研究中,我们介绍了量表的类型、编制的步骤及其应用,在本节将介绍利用软件对量表进行 SPSS 处理分析。 在获取原始数据后,我们利用SPSS对量表可以作出三种分析,即项目分析、因素分析和信度分析。 项目分析,目的是找出未达显著水准的题项并把它删除。它是通过将获得的原始数据求出量表中题项的临界比率值一一CR值来作岀判断。通常,量表的制作是要经过专家的设计与审 查,因此,题项一般均具有鉴别度,能够鉴别不同受试者的反应程度。故往往在量表处理中 可以省去这一步。 因素分析,目的是在多变量系统中,把多个很难解释,而彼此有关的变量,转化成少数有概念化意义而彼此独立性大的因素,从而分析多个因素的关系。在具体应用时,大多数采用 “主成份因素分析”法,它是因素分析中最常使用的方法。 信度分析,目的是对量表的可靠性与有效性进行检验。如果一个量表的信度愈高,代表量表愈稳定。也就表示受试者在不同时间测量得分的一致性,因而又称“稳定系数”。根据不 同专家的观点,量表的信度系数如果在以上,表示量表的信度甚佳。但是对于可接受的最小 信度系数值是多少,许多专家的看法也不一致,有些专家定为以上,也有的专家定位以上。 通常认为,如果研究者编制的量表的信度过低,如在以下,应以重新编制较为适宜。 在本节中,主要介绍利用SPSS软件对量表进行因素分析。 一、因素分析基本原理 因素分析是通过求岀量表的“结构效度”来对量表中因素关系作岀判断。在多变量关系中,变量间线性组合 对表现或解释每个层面变异数非常有用,主成份分析主要目的即在此。变量的第一个线性组合可以解释最大的变异 量,排除前述层次,第二个线性组合可以解释次大的变异量, 最后一个成份所能解释总变异量的部份会较少

如何使用spss进行问卷效度和信度分析

如何使用spss软件进行效度和信度分析 如果一个问卷设计出来无法有效地考察问卷中所涉及的各个因素,那么我们为调查问卷所作的抽样、调查、分析、结论等一系列的工作也就白做了。那么,我们如何来检验设计好的调查问卷是否有效呢?信度分析是评价调查问卷是否具有稳定性和可靠性的有效的分析方法。 二、信度分析的提出及分析方法 信度,又叫可靠性,是指问卷的可信程度。它主要表现检验结果的一贯性、一致性、再现性和稳定性。一个好的测量工具,对同一事物反复多次测量,其结果应该始终保持不变才可信[1]。例如,我们用一把尺子测量一张桌子的高度,今天测量得高度与明天测量的高度不同,那么我们就会对这把尺子产生怀疑。因此,一张设计合理的调查问卷应该具有它的可靠性和稳定性。 调查问卷的评价体系是以量表形式来体现的,编制的合理性决定着评价结果的可用性和可信性。问卷的信度分析包括内在信度分析和外在信度分析。内在信度重在考察一组评价项目是否测量同一个概念,这些项目之间是否具有较高的内在一致性。一致性程度越高,评价项目就越有意义,其评价结果的可信度就越强。外在信度是指在不同时间对同批被调查者实施重复调查时,评价结果是否具有一致性。如果两次评价结果相关性较强,说明项目的概念和内容是清晰的,因而评价的结果是可信的。信度分析的方法有多种,有Alpha信度和分半信度等,都是通过不同的方法来计算信度系数,再对信度系数进行分析[2]。 目前最常用的是Alpha信度系数法,一般情况下我们主要考虑量表的内在信度——项目之间是否具有较高的内在一致性。通常认为,信度系数应该在0~1之间,如果量表的信度系数在0.9以上,表示量表的信度很好;如果量表的信度系数在0.8~0.9之间,表示量表的信度可以接受;如果量表的信度系数在0.7~0.8之间,表示量表有些项目需要修订;如果量表的信度系数在0.7以下,表示量表有些项目需要抛弃。我们可以通过目前比较流行的SPSS软件对调查问卷进行信度分析,这样我们就可以判断一个调查问卷是否具有稳定性和可靠性。 三、利用SPSS软件进行信度分析 下面就以兵团广播电视大学“人才培养模式改革和开放教育试点”毕业生追踪调查[3]中《电大教学效果评价》(毕业生用)这一调查量表进行分析。量表见下图。 (一)对量表进行纬度划分,将量表分为知识、能力、业绩三个纬度。其中,第1~4题划分到知识纬度,第5~12题划分到能力纬度;第13~15题划分到业绩纬度。通过每一纬度的Alpha系数来考察每一项得分间的一致性。 1、打开SPSS软件,调入930条记录的数据文件,进入SPSS主界面。 2、在知识纬度中,对项目(1)专业知识的掌握;(2)所学知识与工作岗位的实际需要;(3)知识面的拓宽;(4)专业水平的提高;进行内部一致性分析。 ①单击“分析”菜单中的“尺度分析”,再在“尺度分析”的子菜单中点击“可靠性”分析,打开“可靠性分析”的主对话框。 ②在左侧的源变量框中选择上述四个项目所对应的变量c1,c2,c3,c4加入到对话框右边的“项目”中,作为分析变量,再在对话框下面的“模型”中选择“Alpha”,进行Alpha 信度分析。 ③点击对话框中的“统计量”按钮,打开相应的对话框,选择要输出的统计量、变量描述、方差分析,总结等。在这个例题中为了看的清楚,我们用默认方式,即只输出样本个数、项目个数和信度系数。 ④点击“继续”按钮,回到“可靠性分析”的主对话框,勾选“列出项目标签”,再单击“确

相关主题
文本预览
相关文档 最新文档