4.2.3 效标效度

格式：pdf
大小：146.10 KB
文档页数：1

下载文档原格式

大五人格量表BFI的初步修订

５．４正式施测结果………………………………………………………………………………………４１６常模制定………………………………………………………………………………………………４ｌ６．１常模……………………………………………………………………………………………………………………………４１６．１．１表示方法…………………………………………………………………………………………４２６．１．２常模团体…………………………………………………………………………………………４２６．２性别差异检验与性别常模…………………………………………………………………………４２６．２．１性别差异检验……………………………………………………………………………………４２６．２．２性别常模…………………………………………………………………………………………４３６．３专业差异检验和专业常模…………………………………………………………………………４３６．３．１专业差异检验……………………………………………………………………………………４３６．３．２专业常模…………………………………………………………………………………………４４６．４常模分数的解释及应用范围………………………………………………………………………４４６．４．１常模的解释………………………………………………………………………………………４４６．４．２常模的应用范围…………………………………………………………………………………４４第四章综合讨论………………………………………………………………………………………４５１研究意义………………………………………………………………………………………………４５１．１理论意义…………………．．．．………………………………………………………………………．４５１．２实践意义……………………………………………………………………………………………４５２本研究的不足…………………………………………………………………………………………４５２．１翻译问题……………………………………………………………………………………………４５２．２题项问题……………………………………………………………………………………………４６２．３样本问题……………………………………………………………………………………………４６２．４结果问题……………………………………………………………………………………………４６３值得进一步研究的方向………………………………………………………………………………４６４结论……………………………………………………………………………………………………………………………………．４６参考文献…………………………………………………………………………………………………４８附录………………………………………………………………………………………………………………………………………．．５ｌ弱【谢……………………………………………………………………………………………………………………………………．５５攻读硕士期间发表的论文………………………………………………………………………………５６扬州大学学位论文原创性声明和版权使用授权书…………………………………………………………………………………………１

调查问卷的信度与效度

内容效度的评价主要通过经验判断进行，通常考虑3方面的问题：
其一是项目所测量的是否真属于应测量的领域；
其二是测验所包含的项目是否覆盖了应测领域的各个方面；
其三是测验题目的构成比例是否恰当。
常用的内容效度的评价方法有两种：
一是专家法，即请有关专家对问卷题目与原来的内容范围是否符合进行分析,作出判断，看问卷题目是否较好地代表了原来的内容。
Scale if item deleted:去掉当前题目整个问卷的描述统计量，即敏感性分析，包括以下内容： Scale Mean if Item Deleted:去掉当前题目问卷合计分的均数；
Scale Variance if Item Deleted: 去掉当前题目问卷合计分的方差；
可以将“Alpha if Item Deleted”值，作
为调整题目的一个重要参考依据。
如果“Alpha if Item Deleted”值越大，其相对应的题目越应是首先考虑调整的题目。从本次问卷结果敏感性分析可以看出，量表的各个题目的“Alpha if Item Deleted”值均在0.97左右变化，且变化的幅度很小。所以，就 “Alpha if Item Deleted”值这项指标看量表各题目均可以保留，无需调整。这个结果可能与研究者所采用的SCL-90量标是一个经典量表有关。
（1）在相同条件下所得问卷测验结果的一致程度；
问卷测验中测量误差通常来源于两个方面：
一是产生于问卷测验过程中的误差，称为测量误差（measurement Error），也称为随机误差（random error）；
二是由问卷的结构质量造成的误差，称为系统误差（system Error）。
二、what

效度

效度是针对某个特定的测验目的的
比如，NEO是测量正常人格的，对某些特殊的人格障碍的鉴定不一定有效。

测量的效度只有程度上的差异
有效性程度。不是“全”或“无” 的，而是“很有效的”或 “不太有效的”。
1、什么是效度：信度与效度的对比

信度的理论公式 SX＝ST +SE r信= ST / SX= (SV ＋ SI ) / SX 即信度是一组测验分数真变异与总变异（实测变异）的比值。效度的理论公式 SX＝ SV ＋ SI +SE R效= SV / SX 即效度是与测验目的有关的变异（有效变异）与总变异（实测变异）的比值。
效标效度的类型：－同时效度：比如心理素质与心理健康同时测量。－预测效度：人才选拔中的运用。效标的选择：－外显、客观：智力与学习成绩－简单、省事：案例：社会适应性量表的编制。－科学、权威：比如用心理健康指标作为心理素质的效标。

效标效度的估计方法
1.相关法相关系数回归方程结构方程模型 2.分组法案例：性别对性别角色认知量表的预测 3.命中率法见下页

2.3 结构效度

术语和定义：也称构想效度、构念效度。即测验对理论上的构想或特质的测量程度。确定结构效度的基本步骤首先从某一理论出发，提出某一心理特质的假设，即构成心理特质的成分或因素，然后设计和编制测验并进行试测，最后对测验的结果采用相关或因素分析等方法分析，验证与理论假设的相符程度。案例：大学生心理素质的结构效度的获得
效度
什么是效度效度的类型影响效度的因素
1、什么是效度：真分数模型
个体而言 X＝T＋E X是观测分数，T是真分数， E是测量误差。团体而言 SX＝ST +SE 即观测分数变异数（ SX）等于真分数变异数（ ST ）加上误差分数变异数（ SE ）。这里误差分数变异数只是涉及到随机误差的变异

效度

结构效度建立过程
1. 对所欲测量的属性根据某种理论提出假定结构
2. 根据假定的结构拟定题目编制测验 3. 评价结构效度 4. 根据测验结果来验证假设结构中的各种因
素是否成立。
结构效度的检定方法
• 因素分析法 • 用相容效度确定结构效度 • 多元特质与多重方法举证
1. 相容效度
相容效度就是一个新编的尚待确定其结构的测验与另一个已知其结构的测验，他们共同测量相同结构的程度。或者说一个未经过结构效度检定的测验和一个已经经过结构效度检定的测验，两者的相似程度。
• 差异分析法
同一组被试用同一个测验的两个复本在某一学科教学或训练前后实施测验，该测验内容的有效性可以由两次测验成绩差异的显著性来加以判断。
表面效度
表面效度：是指测验在表面上使被试直觉感到的有效性程度。
注意：表面效度不是测验的真正效度。
效标关联效度
• 定义：所谓效标关联效度，是指测验分数与某一
内容效度建立过程
1. 首先，对教科书中所包括的内容和教学目标进行系统的逻辑分析。
2. 然后，对所欲测量的属性加以定义，对所欲测量的内容、范围加以界定。
3. 在此基础上，再将各部分的内容和教学目标进行分类，并用双向细目表将之表达。
保证试卷内容效度的条件
• 要确定好内容范围，并使测验的全部试题都在此范围内。
被试的抑郁得分会影响将来的学习成绩吗？
27
这是最好的时代，也是最坏的时代这是智慧的时代，也是愚蠢的时代这是笃信的时代，也是疑虑的时代这是光明的季节，也是黑暗的季节这是希望的春天，也是绝望的冬天
我们什么都有，也什么都没有我们全部会上天堂，也全部会下地狱
构想效度的争议

教育测量与评价复习高效笔记

（一）研究对象教育测量与评价the Educational Measurement and Evaluation一课程性质教育测量与评价主要是研究对教育现象进行测量和价值判断的理论方法和技术。

本门课程分为两大部分：第一教育测量与评价的基本原理与方法；第二教育测量与评价的具体应用。

（二）学科性质在课程设置和学科建设中，教育测量与评价可以看成是测量学和评价学内容的整合，而且侧重于教育测量，是综合性教育科学。

又可以看成兼容了教育统计教育测量心理测量教育评价教育评估教育督导甚至教育科学研究方法在内的学科群，所以这门学科是一门应用性的学科，但又是一门综合性的课程。

在教育学科分类中，教育测量与评价属于研究如何运用方法分析教育活动。

总之教育测量学是应用性学科，又是综合性学科。

二教学内容组织1教育测量与评价的基本概念2教育测量的质量指标3教育测验的编制与实施，包括各种题型的设计和使用试题编排测评实施和评估等4教育测量结果的整理和解释5教育评价方案的编制与实施6教育评价的方法：很多方法如诊断性评价形成性评价总结性测量与评价等等。

综合是用多种评价。

7教育评价的应用，包括课程评价（课程大纲教学设计等）学生评价（老师的评价学生自己的评价同学的评价等）教师评价等方面8教育质量评价9现代教育测量与评价的发展趋势三教学目标1了解教育测量与评价的形成和发展历史。

2掌握教育测量与评价的概念一般原理和方法。

3掌握编制测量量表的方法和步骤。

4掌握评价方案设计以及建立评价指标体系的方法和技巧。

5树立科学的先进的教育测量与评价理念。

6初步具备开展教育测量与评价的能力。

四课程学习的重要意义1教育测量与评价知识是构成现代教育技术教育管理小学教育专业学生必备知识的重要组成部分2掌握先进的教育测评理念，以促进学生的健康发展五教育测评的学科地位和作用（一）现代教育科学研究的三大领域之一教育基本理论研究教育测量与评价科学研究以及教育发展研究已成为教育科学研究的三大领域。

调查问卷效度分析

调查问卷效度分析调查问卷效度分析在进行问卷研究时，特别是问卷中有非常多的量表题时，量表设计是否合适，量表设置有效与否，如同信度一样，是非常重要的问题。

如果量表设计不合理，基于此量表的数据也会受到置疑。

接下来就具体阐述效度分析以及效度分析时的操作方法，如何解决出现的问题等。

效度分析，简单来说就是量表设计的有效性情况，其可分为三类，分别是：内容效度、结构效度和效标效度，建议研究人员使用内容效度和结构效度对问卷进行效度质量衡量，一般很少使用到效标效度。

(1)内容效度内容效度是指问卷题项对相关概念测量的适用性情况，简单来讲即题项设计合理性情况。

内容效度可以从两个方面进行说明，第一是专家判断，专家具有权威性，因此专家对问卷进行判断并得出肯定结论后也即说明问卷具有有效性，此处专家是指行业内专家，或者参考文献，也或者权威来源等。

第二为问卷前测结果，通过对问卷前测并结合结果进行题项的修正等工作以充分说明问卷的有效性。

在具体分析过程中，内容效度通常是指研究题项的设计是否具有参考文献出处，是否有经过老师(专家)的认可，以及是否得到同专业相关人员比如同学的认可等。

以及研究人员是否对问卷进行修正工作，比如对问卷进行前测后发现问题，并做出修正工作。

内容效度是通过文字性进行描述说明，而并非统计软件进行的统计方法，对于问卷研究来讲，基本上均需要进行内容效度说明。

(2)结构效度结构效度指测量题项与测量维度之间的对应关系，其测量方法有两种，一种是探索性因子分析，另外一种是验证性因子分析。

探索性因子分析是当前使用最为广泛的结构效度测量方法，此方法可以使用SPSS客户端或者在线网页版SPSSSPSSAU实现。

使用探索性因子分析进行效度验证时，应该以量表为准，对变量或者量表分别进行分析。

使用探索性因子分析进行效度验证时，首先需要对KMO值进行说明(最为简单的效度验证是直接对每个变量进行探索性因子分析，并且通过KMO值进行判断，勿需判断题项与因子对应关系情况等，此种判断方法过于简单，使用较少)，KMO值指标的常见标准是大于0.6，接着具体说明提取的因子数量，每个因子的方差解释率，总共方差解释率值，并且详细描述各个题项与因子的对应关系，如果对应关系与预期相符(专业知识预期一致)，则说明有着良好的结构效度。

自测健康评定量表(SRHMS)(Self-rated Health Measurement Scale Versionl.0)

自测健康评定量表(SRHMS)（Self-rated Health Measurement Scale Versionl.0）自测健康是指您本人对自己健康状况的主观评价和期望，自测健康评定是目前国际上比较流行的健康测量方法之一。

世界卫生组织(WHO)将健康定义为：健康不仅仅是没有疾病和虚弱，而且是生理、心理和社会上的完好状态。

个体的健康应该是生理健康、心理健康和社会健康的总和。

本量表就是让您从生理、心理和社会三个方面对自己的健康状况进行定量化测量，以便能够及时、全面、准确地了解自身的健康信息为自己的健康保护提供帮助！填表要求：本量表由48个问题组成，问的都是您过去四周内的有关情况。

每个问题下面有一个划分为10个刻度的标尺，请逐条在您认为适当的位置以“x”号在标尺上作出标记。

（请注意每个标尺上只能划上一个“x”号）例如：您的睡眠怎么样？非常差0 1 2 3 4 5 6 7 8 9 10非常好0：表示睡眠非常差；10：表示睡眠非常好；在0-10间：越靠近0表明睡眠越差，越靠近10表明睡眠越好；1．您的视力怎么样2．您的听力怎么样3．您的食欲怎么样4．您的胃肠部经常不适（如腹胀、拉肚子、便秘等）吗5．您容易感到累吗6．您的睡眠怎么样7．您的身体有不同程度的疼痛吗8．您自己穿衣服有困难吗9．您自己梳理有困难吗10．您承担日常的家务劳动有困难吗11．您能独自上街购买一般物品吗12．您自己吃饭有困难吗13．您弯腰、屈膝有困难吗14．您上下楼梯（至少一层楼梯）有困难吗15．您步行半里路有困难吗16．您步行三里路有困难吗17．您参加能量消耗较大的活动（如剧烈的体育锻炼、田间体力劳动、搬重物移动等）有困难吗18．与您的同龄人相比，从总体上说，您认为自己的身体健康状况如何19．您对未来乐观吗20．您对目前的生活状况满意吗21．您对自己有信心吗22．您对自己的日常生活环境感到安全吗23．您有幸福的感觉吗24．您感到精神紧张吗25．您感到心情不好、情绪低落吗26．您会毫无理由地感到害怕吗27．您对做过的事情经反复确认才放心吗28．与别人在一起时，您也感到孤独吗29．您感到坐立不安、心神不定吗30．您感到空虚无聊或活着没有什么意义吗31．您的记忆力怎么样32．您容易集中精力去做一件事吗33．您思考问题或处理问题的能力怎么样34．从总体上说，您认为自己的心趣健康状况如何35．对于在生活、学习和工作中发生在自己身上的不愉快事情，您能够妥善地处理好吗36．您能够较快地适应新的生活、学习和工作环境吗37．您如何评价自己在工作、学习和生活中担当的角色38．您的家庭生活和睦吗39．与您关系密切的同事、同学、邻居、亲戚或伙伴多吗40．您有可以与您分享快乐和忧伤的朋友吗41．您与您的朋友或亲戚在一起谈论问题吗42．您与亲朋好友经常保持联系（如互相探望、电话问候、通信等）吗43．您经常参加一些社会、集体活动（如党团、工会、学生会、宗教、朋友聚会、体育比赛、文娱等）吗44．在您需要帮助的时候，您在很大程度能够依靠家庭吗45．在您需要帮助的时候，您在很大程度能够依靠朋友吗46．在您遇到困难时，您主动地去寻求他人的帮助吗47．与您的同龄人相比，从总体上说，您认为您的社会功能（如人际关系、社会交往等）如何48．与您的同龄人相比，从总体上说，您认为您的健康状况如何自测健康评定级表(SRHMS)（Self-rated Health Measurement Scale Versionl.0）一、前言自测健康是个体对其健康状况的主观评价和期望，这一概念最早是由Suchman等人在1958年提出，此后，许多学者对这一概念进行了充实和完善，目前，自测健康已成为国际上比较通用的健康测量方法之一。

三类效度及关系

测验预测个体在某种情境下行为表现的有效性程度。通常是如何。而内容效度对能力倾向测验和人格测验不是很合适，求实际测验分数与效标间的关系，属于实征统计关系，因而又主要是因为测量的往往是范围难以界定的缺乏理想数量指标称为实征性效度。如果测验与外在效标间的相关越高，表示的较抽象的特质，无法考证测验项目的代表性并妨碍了信息
细目表来检视测验内容的效度。生理智力发展、学习生活环境等需要明确界定范围，用文字和
内容效度的确定方法主要是逻辑分析法，其主要步骤是：语言两种形式完整、准确地表述研究变量。（３）对研究变量做（１）明确欲测内容的范围，包括知识范围和能力要求两个方面；出准确、严格的操作定义，并选择对应、客观的观测指标。（４）（２）确定每个题目所测的内容，并与双向细目表对照以比较、避免采用单一方法或单一指标去代表或分析多维的、多层次分类与记录；（３）制定定量表，考察题目对所定义的内容范围的、多侧面的事物和活动，尽可能采用多种方法、多种指标，从的覆盖率、判断题目难度与能力要求间的差异、题目量与分数不同角度分析研究相同的理论构思。比例及题目形式对内容的适当性，对整个测验的有效性做出４三种效度之间的关系总的评价。此外，还有经验推测法及Ｃｒｏｎｂａｃｈ提出的统计分析方法。２效标关联效度
此测验的效标关联效度越高。效标关联效度主要重视那些与交流和各测验的相比较。有些测验对所测内容或行为范围

(完整版)心理测量考试复习

一、最早的智力测验-—比奈-西蒙量表P111。

比奈（Alfred Binet）法国心理学家，心理测验的鼻祖。

贡献：（1)提出了测量智力的方法，并建立了最早的相对客观、量化的度量工具。

（2）将智力测验成功地运用于教育领域,使人们看到了心理测验的应用价值，推动了心理测验的迅速发展.智龄是比奈-西蒙智力量表中使用的判断智力的术语。

比奈智力量表系列主要有比奈量表、斯坦福—比奈量表和中国比奈量表。

（一）比奈量表比奈量表是比奈和西蒙编制的，有1905年、1908年和1911年三种版本。

内容：1905年版共有30道题，题目顺序由易到难排列，通过对3岁至11岁各50名正常儿童和部分智力落后儿童以及成人测试的结果,分析确定题目的难易程度，并用不同难度的题目代表不同年龄的智力水平。

特点:①个体测验;②用智力年龄来评判结果。

不足：（1）从内容上看,该量表主要是对判断、理解和推理能力的测查,并不能涵盖智力的全部内容。

（2）从形式上看，这个量表无论是测验主持人的指导，还是被测者的回答或反应，主要都是以语言形式进行的,因而对语言能力的依赖程度较大，这对某些特殊儿童如聋哑儿童是不公平的。

（3）这个量表不能准确地表示测验总分，只能以被测者完成题目的多少来大致确定其智力水平.行为样本（behavioral sample）就是“少数有代表性的行为”P31标准化（standardization）P32是指测验编制、实施、记分和测验分数解释必须遵循严格的统一的科学程序，保证对所有被测者来说施测的内容、条件、记分过程、解释系统都相同。

①测验题目的标准化;②实施过程和记分的标准化；③选用有代表性的常模。

信度（reliability），主要是指测量结果的可靠性或一致性。

P32信度（reliability）是指测验结果的可靠性、稳定性，即测验结果是否反映了被测者的稳定的、一贯性的真实特征。

简言之，信度就是对测量一致性程度的估计.＃误差的含义和类型P1401.含义：误差—-测量中与目的无关的变因所产生的不准确、不一致的效应.2。

信度和效度名词解释

信度和效度名词解释一、信度1. 定义- 信度是指测验结果的一致性、稳定性及可靠性。

一般多以内部一致性来加以表示该测验信度的高低。

信度系数愈高即表示该测验的结果愈一致、稳定与可靠。

例如，用同一个量表对同一组被试在不同时间进行测量，如果每次测量结果都很相近，就说明这个量表的信度较高。

2. 信度的类型- 重测信度：用同一种测验，对同一组被试者，前后施测两次，再根据被试者两次测验分数计算其相关系数，即得重测信度。

它反映了测验跨时间的稳定性。

例如，在一个月内，对同一批学生使用相同的智力测验进行两次测试，两次测试结果的相关性就是重测信度。

- 复本信度：复本是内容、形式、难度等方面与原测验相似的测验。

复本信度是根据一组被试者接受两个复本测验的得分计算的相关系数。

有A、B两套英语水平测试题，它们在题型、难度等方面相似，对同一组学生先进行A卷测试，过一段时间再进行B卷测试，然后计算两次成绩的相关系数就是复本信度。

- 内部一致性信度：主要反映的是测验内部题目之间的关系，表示测验能够测量相同内容或特质的程度。

例如，在一个包含多个项目的人格测验中，内部一致性信度高意味着各个项目之间测量的是人格的同一个方面，常用的计算方法有克伦巴赫α系数等。

- 评分者信度：用于衡量不同评分者对同一组被试评分的一致性程度。

在一些主观性较强的测验中，如作文评分、面试评分等，评分者信度就非常重要。

如果不同评分者对同一篇作文或同一个面试者的评分比较接近，那么评分者信度就较高。

3. 影响信度的因素- 被试样本：被试样本的同质性（相似性）程度会影响信度。

如果被试样本的同质性高，信度可能会较低，因为他们在测验所测特质上的差异较小；反之，异质性高的被试样本可能会使信度较高。

例如，在一个只针对高智商学生的智力测验中，由于学生的智商都比较高且接近，可能会导致信度系数较低。

- 测验长度：一般来说，测验的题目数量越多，信度越高。

因为较长的测验能够更全面地测量被试的特质，减少随机误差的影响。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。