当前位置：文档之家› 心理测量学课件

心理测量学课件

心理测量学

第一章心理测量的产生和发展

第一节中国古代的心理测量

一、中国古代对心理测量的最初探索

（一）关于心理差异性的探讨

性相近，习相远——孔子

―上人、中人、下人‖的九分法

（二）关于心理可测性的探讨

权，然后知轻重；度，然后知短长。物皆然，心为甚。——孟子

（三）关于心理测量法的探讨

观察法

刘劭的―八观‖和―五视‖（五视：居，视其所安；达，视其所举；富，视其所与；穷，视其所为；贫，视其所取。）

我国古代形成具有丰富经验性的―观人术‖：

观言―口为心苗，言为心声‖

观行―欲知其人，观其所行‖

观相―长相仪表堂堂，为人不会离谱走样‖

观类―强将手下无弱兵，名师门下出高徒‖

二、中国古代心理测量所涉及的领域

（一）能力测量

世界上最早的心理（注意）测验：―一手画方，一手画圆‖（董仲舒，公元前179-104）

早期能力测量研究的专著：刘劭的《人物志》（《人类能力的研究》，J.K.Shryock ，1937 ）

早期的婴儿发展测验：周岁试儿

（二）人格测量

孔子不仅发现个体的能力差异，而且提出了个体人格差异的观点：―不得中行而与之，必也狂狷乎。狂者进取，狷者有所不为也。‖ ——《论语》

刘劭阴阳五行和形体的关系及人的行为表现将个体人格分为12种类型。——《人物志》阴阳五态之人。——《黄帝内经》

问之以是非，以观其志；穷之以词介，以观其变；咨之以计谋，以观其识；告之以祸难，以观其勇；醉之以酒，而观其性；临之以利，而观其廉；期之以事，而观其信。——诸葛亮《心书》

（三）教育测量

世界上最早的教育测量始于中国西周的奴隶制社会。《学记》中记载了西周时期具有相当系统性的教育测量制度：―比年入学，中年考校。一年视离经辨志，三年视敬业乐群，五年视博习亲师，七年视论学取友，谓之小成。九年知类通达，强立而不反，谓之大成。‖汉代在考试制度、考试类型和考试功能上都有了重大发展。考试制度改为岁考制；考试类型分为口试、策试和射试。首开笔试先河。考试功能出来人才选拔以外成为了学校教育和管理的手段之一。

第二节西方科学心理测量的产生和发展

一、西方学者对个体心理差异的研究

（一）反应时（RT）的差异——科学家对个体心理差异的最早发现

（二）工业化社会的发展对心理测量的需求

1、法国沈干（E.Seguin，1937）创立了第一所教育智力落后儿童的学校，并提出感官训练和肌肉训练等方法。

2、法国艾斯克罗尔（E.Esquirol，1939）第一次在正式文献中区分了精神异常和智力落后，并提出语言能力是测定智力水平的最可靠指标。

二、西方科学心理测量的早期探索者

在西方科学心理测量产生和发展的早期有三位心理学家为此作出了非常突出的成就，即高尔顿（F. Galton）、卡特尔（J. Cattell）和比奈（A. Binet）。

三、西方心理测量运动的发展

（一）智力测量的发展

世界上第一个智力测验——1905年B - S量表

由30个项目组成，可以测量智力的多个方面；

测量项目的排列由浅入深，使同一个量表可以测到智力高低不同的儿童。

1908年B-S量表

增加测试项目到59个；

测验项目按年龄分组，组别自三到十三岁；

计算成绩采用智力年龄表示，是第一个年龄量表。

1911年量表

删去9个旧的项目，增加4个新项目，共54个项目，并重新排序；

除4岁组为4个项目外，其他各年龄组都是5个项目；

取消了11岁和13岁组，增加了15岁和成人组。

1916年S-B量表

推孟（Terman）针对1911年量表存在：a）诊断高级心理过程的项目不多；b）没有一定的测验手续；c）有些项目位置不对等三大问题进行了修订。

总结：Binet智力测验方法的特性

1、用年龄作为准则；

2、明了心理过程有低级和高级之分；

3、测量了个体的一般智力。

智力的团体测验

产生的背景

瑞文（Raven）智力测验SPM

（二）能力倾向测验

1915年，美国Seashore编制的音乐能力测验是最早的能力倾向（特殊能力）测验。

（三）成就测验

Rice是最早的教育（成就）测验的创始人。

（四）人格测验

最早提出用科学方法测量人格的是Galton。

第一个编制人格测验的是Woodworth

四、心理测量的当代趋势

随着信息加工心理学的兴起，产生将实验法和测量法相结合的信息加工心理测验；

随着计算机技术的发展，纸笔测验逐渐被电脑程序测验所代替；

针对经典测验理论（CTT）的某些缺陷，产生了新的测量理论：项目反应理论（IRT）和概化理论（GT）

第三节现代心理测量在中国的发展

一、现代心理测量在中国1949年前的发展

清朝末年，西方心理学开始传入中国

1920年，廖世承先生和陈鹤琴先生在南京高师率先开设心理测验课程

1921年，廖世承和陈鹤琴《心理测验法》

1922年，比奈-西蒙量表由费培杰译成中文

1922年，W.A.McCall来华讲学并主持编制多种心理测验。他评价当时中国心理学家所编制的测验―至少都与美国的水平相当，有许多竟比美国的为优‖。

1931年，中国心理测验学会在南京成立，标志着心理测验的发展进入了新的时期。并随后发展到心理测量在我国的全盛时期。其中因战争有过停止。

二、现代心理测量在中国1949年后的发展

（一）1949-1978年的停滞发展时期

由于深受前苏联心理学命运的影响，在1949年后的30年间，心理测量作为禁区而无人问津。（二）1979年后的恢复发展与繁荣时期

智力测量

1979年中国心理学会天津会议决定由龚耀先教授修订W AIS-R，1982年完成。

1980年中国心理学会实验心理学专业委员会在武汉召开，决定由张厚粲教授和林传鼎教授修订WISC-R，1986年完成。

1986年龚耀先教授修订了WPPSI-R。

1985年、1989年张厚粲教授、李丹教授先后修订了瑞文标准推理测验、瑞文联合测验。

除此之外，张厚粲教授也编制了我们自己的测验（CDCC）

人格测量

1982年宋维真修订了MMPI

1983年龚耀先修订了EPQ

1986年戴忠恒等修订16PF

1990年吴文源修订了SCL-90

成就测量

1986年施良方等教授引进B.S.Bloom的教育目标分类理论，推进了教育测量的发展。

1990年代前后，张厚粲、杨志明、张敏强等教授先后对我国高考制度的改革进行了研究，推进了高考的标准化。

人才的培养和专业建设

1984年成立了中国心理学会心理测量专业委员会

引进了新的理论，编著了不同版本的教材

三、对近20年来我国心理测量发展的评价

中国心理测量要想取得国际影响力,必须在编制有深度的、本土化的量表上下功夫。

由于目前国内还没有一个专门收集整理已修订、编制量表的机构,使用者可能会在选用时觉得像大海捞针一样缺乏选择的标准,或者根本不知道有哪些量表可以适用于自己的研究和工作。

评定量表与心理测验在性质上没有绝对界限。它的使用较成套心理测验相对简单方便,但是它的标准化程度一般不如心理测验,信度和效度也没有心理测验那样经过严格考验。

一些心理测量学家断言:―心理测验必然会向着一个新的阶段——心理评价发展‖。也就是说,心理测验的结果要与其它非测验得来的信息一起加以整合考虑,才能对被测试者做出完整的、公正的心理评价。

西方心理测验应用于中国的理论研究和实践中出现的问题,归根究底,是由于文化差异的客观存在。要想解决这一根本问题,不外乎两条途径:一是消除文化差异,二是积极编制中国自己的心理测验。

绝大多数心理测验工作者编制的量表是比较规范的,但量表的使用目前还有不够严肃之处。比如滥用量表、对测验结果妄做评价、测试人员缺乏心理测验专业知识等等。

第二章心理测量学概论

一、测量、测验和考试

（一）测量（Measurement）

1、测量的定义：测量就是依据一定的法则用数字的方法对事物的某一属性进行描述的过程。由此，测量包含三个重要内容：

测量的对象——事物的属性；

测量的依据——一定的法则；

测量的结果——指派的数字。

3、测量的基本要素

任何测量都必须具备两个基本要素，即测量的参照点和测量的单位。

（1）测量的参照点——计算事物的量的起点

参照点有两种：一种是绝对的零点；一种是相对的零点。

理想的参照点是绝对零点，但心理测量中的参照点都是人定的，即认为指定的相对零点。

（2）测量的单位

理想的测量单位应当具备两个条件：一是要有确定的意义；二是要有相等的价值。

一般说来，心理测量中的参照点都是人定的，所采用的单位也都是不等值的。

4、测量的量表：

量表（Scale）：量表就是能够使事物的特征数量化，并具有确定单位和参照点的数字连续体。

根据测量的不同水平以及测量中使用的不同单位和参照点，我们可以测量量表分为四种：（1）命名量表（nominal scale）或名称量表

（2）顺序量表（ordinal scale）或位次量表

（3）等距量表（interval scale）

（4）等比量表（ratio scale）

5、心理测量

（1）定义：根据一定的法则用数字对人的行为加以确定的过程。

（2）关于心理可测性的探讨

凡物之存在必有其数量（Thorndike，1918）

凡有数量之东西都可以测量（McCall，1922）

（3）心理测量的特点（性质）

心理测量的间接性

心理测量的相对性

心理测量的客观性（实质上是要求测验标准化）

（4）心理测量的量表水平：

等级量表——等距量表

（二）测验（Test）—―一叶落而知天下秋‖

心理测验的定义：心理测验就是依据心理学的理论，使用一定的操作程序，通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特征作出推论和数量化的一种科学手段。

心理测验的实质是行为样组的客观的和标准化的测量。由此可见，心理测验具有三个要素：行为样组、标准化和客观性。

心理测验的性质：

间接性

相对性

客观性

心理测量的标准化包括以下内容：

1、测验实施的标准化

2、测验评分记分的标准化

3、分数转换和解释的标准化

二、测验的分类

（一）按照测验的功能（或者测量对象）分类

智力测验

特殊能力测验

人格测验

（二）按照测验的材料分类

文字测验

非语言或者操作性测验

（三）按照测验的性质分类

客观性测验

投射性测验

（四）按照测验的方式分类

个别测验

团体测验

（五）按照测验的要求分类

最高行为测验

典型行为测验

三、正确地对待和使用测验

一、对测验的错误看法

测验完美无缺

测验无用且有害

心理测验即智力测验

二、对测验的正确态度

测验是研究心理学的一个重要方法和作出决策的辅助工作；

测验作为一种研究手段和测量工具尚不完善；

为了更好地发挥测验的效能，必须防止测验的乱编滥用；

四、测验的功能

心理测验的基本功能是测量个体间的差异或者同一个体在不同场合下的反应。

测验在实际工作中的应用

人才选拔、人员安置、心理诊断、描述评价和心理咨询

目前我国在心理门诊主要使用三类测验

智力测验

人格测验

心理评定量表

第三章经典测验理论

第一节CTT的数学模型

一、测量误差（Error of Measurement）

（一）测量误差的定义

心理测量的误差是指在测量中与测量目的无关的变因所产生的不准确或不一致的效应。这个定义包含两层意思：

误差是由与测量无关的变因引起的；

误差是不准确或者不一致的测量结果。

关于测量准确性与一致性的关系图解

由此可见，测量误差可以分为两大类：随机误差和系统误差。

（二）测量误差的种类

随机误差，又称为可变误差、偶然误差，它是指由与测量目的无关的偶然因素引起而又不易控制的误差。它使多次测量产生了不一致的结果。

系统误差，又称为常定误差，它是指由与测量目的无关的变因引起的一种恒定而有规律的误差效应。

总之，系统误差只影响测量的准确性、不影响稳定性；随机误差则既影响准确性，也影响稳定性。

（三）测量误差的来源

1、测量工具（项目是否有代表性、项目的表现形式、项目的难度）

2、施测过程（施测场所、施测时间、主试因素、意外干扰和评分记分）

3、受测者本身（应试动机、测验焦虑、测验经验、生理变因、练习效应、反应倾向）

二、CTT的数学模型

（一）真分数和观测分数

真分数（True Score，简称T 分数）是指被试的某种特质在没有测量误差的情况下所体现的真值或客观值。或者说，它是一个测量工具在测量没有误差时所得到的纯正值。

真分数的操作定义：真分数是指经过无数次测量所得到的平均值。

观测分数（Observed Score，又称为实测分数，用X 标记）是指被试的某种特质通过测量后所得到的分数。

（二）CTT的数学模型及其假设

1、CTT的数学模型：

经典测验理论假定，观测分数（X）与真分数（T）之间是一种线性关系，并只相差一个随机误差（E）。可表示为：

X = T + E

说明：该模型暗含两个假定：

（1）人的真实水平（T）被看作是相对稳定的；

（2）观测分数（X）与真实分数（T）之间是一种线性关系。

CTT的数学模型（真分数理论）引申出的三个基本假设：

当测量次数足够多时，观测分数的平均值会接近被试的真分数，也就是说，误差分数的平均值为零：Σ（X）= T 或Σ（E）= 0 ；

真分数与误差分数之间相互独立，其相关为零：ρ（T，E）= 0 ；

各平行测验上的误差分数之间相关为零：ρ（E1，E2）= 0 。

对于一个团体中的测量而言，我们可以由经典测验理论的数学模型推导出以下数量关系式：SX2 = ST2 + SE2

ST2 = SV2 + SI2

SX2 = SV2 + SI2 + SE2

第二节信度理论

一、信度（reliability）的概述

1、信度的定义

所谓信度，就是指同一被试者在不同时间内用同一测验重复测量所得结果的一致性程度。或者说，信度是一组被试经测量后真分数的变异数（ST2）与观测分数的变异数（SX2）之比，即：

ST2 /SX2 （0＜r ≤1 ）

2、信度系数（reliability coefficient）

信度系数是指用同一被试样本所得的两组资料的相关作为测量一致性的指标。

3、信度指数（reliability index ）

信度指数是测量的实得分数与真分数的相关，即部分与整体的相关。它的平方就是信度系数。

4、标准误

用一组被试两次测量结果来代替对同一人反复施测，这样所得到的信度指标就是标准误。

SE=SX√1 – rXX

二、信度的估计方法

（一）再测信度（test-retest reliability）

1、再测信度，又称重测信度，或稳定性系数，就是指用同一个测验在间隔时间适当的情况下对同一组受测者前后两次施测的一致性程度。其大小等于受测者两次测验分数的相关系

数。

2、计算公式：皮尔逊积差相关系数

3、使用这种方法计算信度的假设是：（1）所测量的特质必须是稳定的（最基本的前提）；（2）遗忘与学习的效果等同；（3）被试在两次测量期间的学习效果没有差别。

4、主要误差来源：测验条件和受测者身心状况的改变。

（二）复本信度（Alternat-form reliability）

1、什么是平行测验（等价测验）？

测量同一特质的两个测验，如果在测验项目的数量、形式、难度、区分度、施测的指导语、时限以及所得分数的均值和方差等一样，那么这两个测验就称为平行测验（等价测验）。2、什么是复本信度？

复本信度是指两个平行的测验测量同一批受测者所得结果的一致性程度。

3、根据两次测量时间的间隔，复本信度可分为两类：

一类是连续施测，得到等值性系数；

一类是间隔一段时间施测，得到稳定性与等值性系数，又称重测复本信度。

4、为避免测验的顺序效应，实际应用时一般把受测者分为两组，然后采取AB、BA式施测。（三）分半信度（Split-half reliability）

1、分半信度就是指将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。由于它反映的是测验内部两半项目之间的一致性，因此，又称为内部一致性系数。

2、讨论：计算分半信度时如何将测验分半？

常用的方法有：

（1）奇偶分半法；

（2）难度分半法；

（3）内容分半；

（4）同时兼顾内容和难度分半。

3、计算分半信度的方法：

首先计算两个分半测验的皮尔逊积差相关系数，然后用Spearman-Brown公式进行校正。

（四）同质性信度（homogeneity reliability）

同质性信度也称为内部一致性系数，它是指测验内部所有项目间的一致性程度。

项目间的一致性包含两个含义：所有项目测的是同一特质；所有项目得分具有较高的相关。

值得说明的是，大多数的心理测验都是异质的，但又是由若干个相对同质的分测验或者分量表组成。

常用计算公式为克伦巴赫的α系数。

（五）评分者信度（Scorer reliability）

评分者信度是指多个评分者给同一批人的答卷进行评分时的一致性程度。

当评分者是两个时可以直接计算他们的相关系数；但当评分者较多时就必须采用肯德尔和谐系数进行计算。

W = ————————

例题解析

在CCTV的一次选美大赛中，六位评委对第一批出场的五位参赛的小姐进行评分，评分结果如表所示，请问这六位评委的评分标准是否一致？

三、信度与测验分数的解释

（一）解释真分数与实际分数的相关

（二）确定信度可以接受的水平

（三）解释个人分数的意义

标准误（SE=SX√1 – rXX）的两个作用：一是估计真实分数的范围；二是了解实得分数再测时可能变化得情形。

X－1.96SE＜真分数的置信区间（95%）＜X＋1.96SE

例题1：在一次智力测验中，某被试的IQ为105。已知该智力测验的标准差为15，信度系数为0.91。若对该被试重测一次智力，在正常发挥的情况下，他的智商95%的可能性还可能出现以下哪些结果？（）

A．95 B．100 C．105 D．110

（四）比较不同测验分数的差异

SEd=SX√2 – rXX- –ryy-

例题：某同学在全国计算机等级考试中理论知识得分为70分，操作技能得分为80。假设该年度的分数是采用标准分，而且两项分数的平均分都是60分，标准差是10，理论知识测验和操作技能测验的信度分别为0.80和0.84。请问，该同学的计算机操作技能是否明显优于理论知识？

四、影响信度的因素

凡是能引起随机误差的所有因素有会导致测验信度的降低，如受试者本身、主试者、测验内容、施测情境等。除此之外，还有以下因素会影响测验的信度：

1、被试样本的特性

被试团体的异质性：被试团体越是异质，两次测量的分数相关越高；

被试团体的平均水平：一般年龄较大的比年龄较小的信度高；智商较低的比智商较高的信度高。

2、项目的数量

一般说来，在一个测验中增加同质的项目可以使信度提高。

RKK = ——————

RKK 为改变后的测验的信度估计；K为改变后的长度与原来长度之比；RXX为原测验的信度。在分半信度的教正中，K=2。

计算填空：

1、假设有一个测验包括50个项目，其信度为0.83，现在给这个测验增加50个同质项目，其信度将增加到。

2、一个包含了50个项目的测验，其信度为0 .75，假若我们要把信度提高到0 .90，那么我们需要给这个测验增加个同质项目。

3、测验的难度

要使信度达到最高，能产生最广分数分布的难度水平方为合适。

4、间隔时间

求重测信度和复本信度时，两测测量的时间间隔越短，信度系数将越大。

四、信度的特殊问题

（一）速度测验的信度

其信度应该以作答速度的一致性为依据。

（二）标准参照测验的信度

其信度应该以通过人数的一致性为依据。

（三）分测验的信度

在使用有分测验的测验时，不能用总测验的信度估计分测验的信度。

（四）变迁的测量

对于探讨行为变迁的测验，其信度的稳定性反而只能说明教育或学习的失败。

第三节效度理论

一、效度（Validity）的概述

1、效度的定义

所谓效度，就是指一个测量工具能够测量出它所要测量的特质的准确性程度。

在CTT中，效度可以看作是在一列测量中，与测量目的有关的真实变异数（或者说是有效变异数，SV2）与总变异数（SX2）之比，即：

SV2 /SX2 （0＜r ≤1 ）

由此可见，效度既反映了随机误差的大小，也反映了系统误差的大小，是所有误差的综合反映。

2、效度的特点：

测验的效度是针对测验结果的，即测验结果的有效性程度；

测验的效度具有相对性。它是针对某种特定的测验目的的；

测验的效度具有连续性。测验的效度只有程度上的差异，通常一个测验不可能100%有效，也不可能100%无效。

3、效度与信度的关系

信度： ST2 /SX2 （0＜r ≤1 ）

效度： SV2 /SX2 （0＜r ≤1 ）

ST2 = SV2 + SI2

由此可见： SI2 /SX2

SI2 /SX2

信度与效度关系的表述：

（1）信度（高）是效度（高）的必要而非充分条件：

信度低，效度无法高；

效度高，信度一定不低；

效度低，信度不一定低。

（2）测验的效度受它的信度所制约；信度系数的平方根是效度系数的最高限度。

二、效度的类型

美国心理学会将效度分为三种类型：内容效度、构想效度和实证效度。

（一）内容效度（Content Validity）

1、定义：内容效度是指测验项目对其意指的有关内容或者行为范围取样的代表性程度。

2、一个测验要有内容效度必须具备两个条件：（1）要有定义完好的内容范围，即测验内容；（2）测验项目应是所界定的内容范围的代表性取样。

3、确定内容效度的方法：

专家判断法

统计分析法

再测法

经验法

4、内容效度的特点

内容效度的特定性

内容效度常与表面效度混淆

内容效度缺乏一个统一的内容指标

补充资料：表面效度与内容效度

表面效度是指测验在受测者或者采用者及其他没有受过专门训练的观察者的主观认识上觉得有效的程度。内容效度则是由有关专家经过系统的逻辑分析或计算所作出的评定。

前者考察的是项目与目的间明显的、直接的关系；后者考察的是项目与目的间的逻辑联系。

最高行为测验要求较高的表面效度，典型行为测验要求较低的表面效度。

（二）构想效度（Construct Validity）

1、定义：构想效度，也称为结构效度，是指一个测验对某种心理学理论所涉及的抽象

概念或者心理特质测得如何，或者说，它是指测验对某一理论上的概念或者特质测量的程度。

由此可见，要想建立一个构想效度的测验首先必须从某一构想的理论出发，导出基本的理论假设，据此编制测验，最后对测验结果与假设进行对照审查。举例说明

例如：编制智力测验

根据智力理论得出基本的理论假设：

智力随着年龄的增长而增长；

智商是相对稳定的；

智力与学业成就之间密切相关；

智力受遗传与环境的影响。

根据这些理论假设编制智力测验，然后对施测所得资料进行分析，如果研究结果具有以下特征，则说明具有较高的构想效度：

受测者分数随年龄的增长而全面增加；

其智商在一段时期内保持相对稳定；

智力与学业成就存在高的正相关；

同卵双生子的智力相关高于一般兄弟姐妹，一起抚养的双生子的智力相关高于分开抚养的双生子。

2、确定构想效度的方法

测验内寻找证据法主要通过研究测验内部构造来界定所测量的构想的程度。其中主要包括确定测验的内容效度、分析被试对项目的反应过程和考察测验项目的同质性。

测验间寻找证据法主要通过研究几个测验间的相互关系，找出它们的共同特质，从而确定是否具有构想效度，主要考察相容效度、区分效度、因素效度等。

效标效度的研究证明

实验法和观察法证实

3、构想效度的缺点

有些构想概念模糊，缺乏一致的定义。

确定效度时没有明确的操作步骤和程序。当证据资料无法证明假设时可能存在三种可能：

测验可能不测这种构想；

理论上的构想本身由可能错误；

实验设计造成不能对假设进行适当检验。

构想效度是累积的证据来评价的，因而没有单一的数量指标来描述有效的程度。

（三）效标效度(实证效度)

1、定义：实证效度是指一个测验对处于特定情境中的个体的行为进行预测的有效性，也就是对于我们所感兴趣的行为能够预测得怎么样。它以测验分数和效度准则（效标）之间的相关系数来表示，因此，又称为准则关联效度（Criterion-related Validity）、经验效度（Empirical Validity）或者统计效度。

2、实证效度的分类：

根据效标资料搜索的时间，实证效度可以分为：

同时效度效标资料可与测验分数同时收集。

预测效度效标资料需过段时间才能收集。

同时效度与预测效度的区别：

效标的收集时间上，前者是同时收集，后者是追踪收集；

测验的目的上，前者多用来诊断现状，后者多用来预测未来；（这是它们之间最根本的区别）与效标的关系上，前者以测验取代效标，后者以测验预测效标；

3、效标与效标测量

效标，又称为准则，是指衡量一个测验有效性的参照标准，它是用以显示测验所欲测量的特质的变量，必须是可以直接而且独立测量的我们所感兴趣的行为。

一个效标往往可以区分为观念效标和效标测量。同一个观念效标可以有多个效标测量，而且效

标测量要想较好地体现观念效标，其本身就必须有效、可靠、客观、实用。

一个好的效标测量应具备的条件：

有效性可靠性客观性——防止―效标污染‖实用性

效标的特性：

多样性复杂性特殊性时间性（近期效标和最后效标）

4、实证效度的估计方法

（1）相关法

最常用的确定实证效度的方法是求测验分数与效标（准则）分数间的相关，所得到的数量指标就称为效标系数。

计算效度系数最常用的是积差相关法，特殊情况下也可用二列相关法等。

说明：正因为相关法是将新编测验与另一个公认有效的测验同时施测同一组被试，所得分数的相关作为实证效度，因此，这种效度又称为准则关联效度。

积差相关法

当测验分数与效标分数都是连续变量时，可采用积差相关公式计算测验的效度系数。

二列相关法

当测验分数与效标分数两个常态连续变量中有一个变量被人为地分为两个类别，另一个变量仍为连续变量，就可用二列相关公式计算。

说明：效度系数本身是一个相关系数，相关系数的平方即表示一个变量的变异数由另一个变异数决定的百分比。

（2）区分法

区分法就是看预测源的分数是否可区分由效标测量所定义的团体。

通过t检验看两组测验上的平均分数是否有显著差异。如果差异显著说明测验有效，否则无效。

该方法表示效度的问题是：组间平均数差异在统计上的显著性取决于团体的大小。因此有人建议用两组分布的重叠量来表示。总的说来，两组平均数的差异在统计上显著，并不表明测验一定有效，但如果不显著，那肯定无效。

资料补充：合成法

近年来，为了配合职业选人的需要，人事心理学者发展出一种新的确定效度的方法，叫做合成法。具体步骤如下：

通过工作分析，确定一项工作的基本元素及相对权数；

分别确定每一测验与相应元素的相关，即估计测量各种元素的测验的效度；

依据每个元素的权数，将各项相关系数合成，即得到合成效度。

(3)命中率法

效度的应用——测验效度与人才选拔

一个测验用来作为人才选拔的依据时，其有效性的指标就是正确决定的比例。

一般说来，在最简单情况下，我们通常是把预测源与效标进行二分法（如下表）。

基本概念

基础率——总体中自然存在的合格人员的比率。

录取率= ————

总命中率PCT = ————

正命中率PCP = ————

第四章项目分析

项目分析通常包括两个方面内容：一是定性分析，如信度和效度的分析；另一个是定量分析，

如难度和区分度的分析。

第一节项目难度分析

一、难度的定义

（一）所谓难度是指项目的难易程度，CTT所指的难度是相对于被测对象而言的。它通常以全体被试中通过或者答对某个项目的百分比表示。

（二）难度的指标

1、难度的估计方法主要有两种，一种是主观判断法，另一种是通过率计算法。

2、在心理测量中最常用的是以受测者答对或者通过某一个项目的人数百分比作为难度指标，通过率P=R/N x100%

说明：（1）项目的难度是相对于特定的群体，相同的项目对不同的群体的难度是不同的；（2）项目越难，难度值P越小，失败率q越大（q=1-p）。

3、难度值反映的只是项目的相对难度。

讨论：人格测验有难度吗？

二、难度的计算

（一）0-1记分制的项目

P=R/N x100%

特殊情况说明：

1、当被试较多时，可采用简便方法：先将被试按测验分数从高到低进行排序，然后划出人数相等的高分组和低分组（27%），再分别求出两组在每个项目上的通过率PH和PL，以两组通过率的均值作为每个项目的难度：P= （PH+PL）/2。

2、由于选择题允许猜测，为平衡其机遇影响，吉尔福特提出了难度校正公式：CP=（KP-1）/K-1。注意：在比较被选答案数目不等的项目的难度时最适宜使用校正通过率CP。

（二）非0-1记分制的项目P=

三、难度水平的确定

（一）在测验编制过程中，分析项目难度主要为了筛选项目，项目难度水平的高低取决于测验的目的，形式以及性质：

当测验用来选人时，应比较多地选用难度值接近录取率的项目；

对于选择题而言，通过率P一般应大于概率；

无论速度测验还是难度测验，一般应防止被试得满分。

第二节区分度

一、定义

区分度又称为项目的鉴别力，是指项目对不同水平的被试反应的区分程度或者鉴别能力，在一定意义上，也就是项目的效度。

鉴别力高则要求能力高、水平高的被试得高分；能力低、水平低的被试得低分。

二、项目区分度的估计方法

（一）项目特征曲线法

项目特征曲线（item characteristic curve, ICC）描述了效标分数不同的被试在该项目上的通过率。曲线坡度越陡，鉴别力越好，预测的误差越小。它不但可以提供项目效度的形象描述，而且可以用曲线的坡度作为项目鉴别能力的指标，但使用这种指标时比较复杂，需要借助计算机完成。

（四）项目鉴别指数法

1、计算公式：D = PH – PL

高分组与低分组的得分率的差作为鉴别指数的指标，其理由是高分组若在该测验上的得分率高于低分组，则D>0，D越大，说明该项目区分两种水平的程度越高；若D<0，则反映高水平组在该项目上的得分率反而低于低水平组，说明项目有问题。

2、极端组的划分（27%规则）

三、区分度和难度的关系

第五章量表与常模

二、常模分数与常模

常模分数

常模分数就是施测常模样本被试后，将被试者的原始分数按照一定规则转换出来的导出分数。

常模

常模分数构成的分布就是通常所说的常模，它是解释心理测验分数的基础。

第六章心理测验的编制技术

第七章心理测验的使用

第一节主试的资格和测验的选择

一、主试的资格包含技术和道德两个方面。

技术方面

知识结构

专业理论和专业技能

道德方面

测验的保密和控制使用

测验中个人隐私的保护

二、测验的选择应该注意

所选测验必须适合测量的目的

所选测验必须符合心理测量学的要求

第二节测量的准备和实施

一、测量前的准备工作

1、预告测量

2、准备测验材料

3、熟悉测验指导语

4、熟悉测验的程序

二、测验中主试的职责

1、应按照指导语的要求实施测验

2、测验前不讲太多无关的话

3、主试不可给予被试任何暗示反应

4、对特殊问题要有心理准备

三、测验实施的程序

1、指导语

2、时限

3、测验的环境条件

四、被试的误差控制

1、应试技巧和练习效应

2、动机与焦虑

3、反应定势

第三节测验的评分和结果报告

一、测验的评分

1、原始分数的获得

2、原始分数的转换

二、测验结果的报告

1、测验分数的综合分析

2、报告分数的具体建议

心理测量学课件

心理测量学第一章心理测量的产生和发展第一节中国古代的心理测量一、中国古代对心理测量的最初探索（一）关于心理差异性的探讨性相近，习相远——孔子 ―上人、中人、下人‖的九分法（二）关于心理可测性的探讨权，然后知轻重；度，然后知短长。物皆然，心为甚。——孟子（三）关于心理测量法的探讨观察法刘劭的―八观‖和―五视‖（五视：居，视其所安；达，视其所举；富，视其所与；穷，视其所为；贫，视其所取。）我国古代形成具有丰富经验性的―观人术‖：观言―口为心苗，言为心声‖ 观行―欲知其人，观其所行‖ 观相―长相仪表堂堂，为人不会离谱走样‖ 观类―强将手下无弱兵，名师门下出高徒‖ 二、中国古代心理测量所涉及的领域（一）能力测量世界上最早的心理（注意）测验：―一手画方，一手画圆‖（董仲舒，公元前179-104）早期能力测量研究的专著：刘劭的《人物志》（《人类能力的研究》，J.K.Shryock ，1937 ）早期的婴儿发展测验：周岁试儿（二）人格测量孔子不仅发现个体的能力差异，而且提出了个体人格差异的观点：―不得中行而与之，必也狂狷乎。狂者进取，狷者有所不为也。‖ ——《论语》刘劭阴阳五行和形体的关系及人的行为表现将个体人格分为12种类型。——《人物志》阴阳五态之人。——《黄帝内经》问之以是非，以观其志；穷之以词介，以观其变；咨之以计谋，以观其识；告之以祸难，以观其勇；醉之以酒，而观其性；临之以利，而观其廉；期之以事，而观其信。——诸葛亮《心书》（三）教育测量世界上最早的教育测量始于中国西周的奴隶制社会。《学记》中记载了西周时期具有相当系统性的教育测量制度：―比年入学，中年考校。一年视离经辨志，三年视敬业乐群，五年视博习亲师，七年视论学取友，谓之小成。九年知类通达，强立而不反，谓之大成。‖汉代在考试制度、考试类型和考试功能上都有了重大发展。考试制度改为岁考制；考试类型分为口试、策试和射试。首开笔试先河。考试功能出来人才选拔以外成为了学校教育和管理的手段之一。第二节西方科学心理测量的产生和发展一、西方学者对个体心理差异的研究（一）反应时（RT）的差异——科学家对个体心理差异的最早发现（二）工业化社会的发展对心理测量的需求 1、法国沈干（E.Seguin，1937）创立了第一所教育智力落后儿童的学校，并提出感官训练和肌肉训练等方法。 2、法国艾斯克罗尔（E.Esquirol，1939）第一次在正式文献中区分了精神异常和智力落后，并提出语言能力是测定智力水平的最可靠指标。

学习计划博士学习计划范文3篇

博士学习计划范文3篇博士研究生教育是学历教育的最高层次,代表着一个国家的人才培养水平。本文是博士学习的计划范文，仅供参考。博士学习计划范文一：本人是工作了三年后又重新回到校园攻读博士，师生角色变换，看着既熟悉又陌生的校园，感慨万千。经历三年的社会实践，自己有了新的感悟。一方面，在三年的工作时间里更加明白自己需要什么，薄弱点在哪里，哪些方面是急需加强的;另一方面，年纪逐渐变大，孔子说三十而立，本人已然三十了，却立不起来，以前同学大多成家了或者准备成家，而自己还在求学路上。虽说每个人走的路不一样，可是，也不能脱离大多数人发展轨迹太远了。在硕士和工作期间，由于不够努力以及容易感情用事，过去五年没有努力，也没有做出什么成果。当攻读博士的第一天起，本人就告诉自己不可以像过去那样，不努力，不上进，整天浑浑噩噩，虚度年华，最终一事无成。开学典礼上李书记和几位院长殷殷教导，都要求务必确立目标，不可以虚度这宝贵的几年时间，9月12日某老师也一再强调了这个问题。因此，本人依据学校博士培养计划并结合个人实际情况，拟定博士期间的学习计划。一、整体目标 xx年是本人人生的而立之年，也将开启本人人生的新篇章。在结

合三年的工作经历和父母、老师、领导、同事的意见并经过深思熟虑之后，本人确定了人生的最终目标成为一名优秀的高校老师，并将为此奋斗终身。因此，本人选择攻读某教授的博士生，合理利用三年博士学习时间，抓住学习机会，巧用学校有利资源，在顺利完成学业的同时，深入学习管理学理论和研究方法，进一步提高英语阅读和听写能力，不断增强人文素养和社会交际能力，在发展管理学某一领域开展创新性研究，在三年的时间里发表五至六篇高档次论文保证能够顺利毕业。二、实施策略为了顺利实施计划，特拟出以下三点实施策略： (一)坚持做人为本，尊师重道，治学为先; (二)勤奋刻苦，不畏艰难，努力上进; (三)虚怀若谷，勇于学习、善于学习，多向老师、同门等等请教; (四)坚持锻炼身体，健强体魄，以完成繁重的学习科研任务。三、具体实施方案 (一)认真听课，提高专业水平在考博复习期间虽然阅读了几本书，但是还是远远不够，在即将开始的博士生活中，本人打算仔细研读《管理学研究方法》、《管理学论文写作规范》、《统计分析与SPSS的应用》、《定性和定量研究方法》、《治理理论》等等书籍，还打算选修《计量经济学》课程，为求奠定扎实的管理学基础，提高研究水平和技能，为下一步开展研究做好充实的准备。

中国科学院心理研究所

中国科学院心理研究所人力资源开发与管理在职研究生课程班招生简章中国科学院心理研究所，1956年经周恩来总理、邓小平总书记等国家领导人签字批准正式建所。中科院心理所是国家办的我国唯一的一所综合性心理学研究机构，是中国科学院重点支持的所属创新工程单位之一，也是全国第一批被批准的国家一级学科博士点和心理学博士后流动站的科研教学单位。我所自1956年开始招收研究生至今，已有四十余届毕业生。中科院心理所不仅是我国心理科学的实验研究和创新工程基地，也是我国知识传播和高层次人才培养的重要基地。 21世纪将是知识经济占主导地位的世纪，知识经济是以知识为基础、以知识为资本的经济，这种经济直接依赖于高素质人才对知识的掌握、创新和应用。因此，新世纪的竞争是人才的竞争，而人力资源是企事业发展的核心动力。为给在职人员提供学习研究生课程的机会，经上级有关教育部门批准，中国科学院心理研究所继续举办应用心理学专业—人力资源管理与开发方向的研究生课程进修班。旨在发展大学后继续教育，培养高层次的专业人才。一、招生对象及条件 1.坚持四项基本原则，表现良好的工作人员。 2.大学本科毕业工作三年以上或大专毕业工作五年以上的在职机关干部、企事业单位有关工作人员、科技人员、教师等。二、招生专业及名额 1.专业：应用心理学——人力资源开发与管理方向。 2.名额：80名。三、学制与课程设置 1.学制两年。招生形式分为周末面授班和远程教学班两种。 2.课程设置分必修课和选修课。必修课课程主讲导师基础理论普通心理学崔耀教授罗婷副教授唐卫海教授刘希平教授关梅林博士人力资源应用统计陈毅文副教授硕导禤宇明博士副教授硕导杨志博士黄四林博士心理学研究方法刘希平博士教授硕导樊春雷博士副教授孙彦博士硕导心理测量学冯伯麟教授社会心理学李岩梅博士副教授硕导曹荣博士邢淑芬博士张文彩博士宋振韶博士系统专业知识组织行为学裴利芳教授领导行为与决策管理裴利芳教授王明姬博士人力资源管理与开发任孝鹏博士副教授王明姬博士薪酬管理与期权设计于广涛博士副教授刘雪梅绩效考核与绩效管理王明姬博士心理学在人力资源管理中的应用张继明博士李锋博士企业形象设计与组织文化建设王詠博士副教授硕导熊艳芳博士人格心理学与管理迟立忠博士副教授汪亚珉博士副教授高兵博士陈祉妍副教授硕导企业人力资源变革王东晖博士副教授人力资源管理讲座马谋超教授博导实人才选拔技术冯伯麟教授

博士研究生学习计划

博士研究生学习计划篇一：、研究计划 201*年博士*年级上学期学习计划 201*年*月*日，****博士学习生活。万事开头难，但是，我也懂得良好的开端是成功的一半。为了给博士学习生活开好头，不断学习和提升自己，增强学术研究能力，特此制定本学习计划。本计划共分为两个层次：总计划和总目标；周计划和周目标。总计划和总目标明确了本学期学习和生活的总体“轮廓”，周计划和周目标则明确了以周为单位的分目标，指出了具体的执行策略。另外，制定控制的策略和方法，以确保计划和目标的实现。一、总计划和总目标 1、课程和学习目标以经济学前沿和高等数学为学习重点，以计量经济学等课程为依托，在打好基础的前提下，再次对方法论等课程进行学习，并尝试用计量方法进行学术文章的写作。（可以用计量方法完成经济学前沿课程的科研训练。）具体要求如下：经济学前沿课程完成大部分文献的阅读，明确大部分文献内涵主旨，了解经济学理论的脉络，通过科研训练掌握计量等研究方法。

高等数学课程完成老师课程要求的作业，并利用课余时间做习题巩固所学知识，尝试将所学知识与经济学前沿和计量课程中涉及的数学方法结合起来。计量经济学依据英文教材和课件完成曾卫红老师双语教学的计量经济学学习，利用计量完成经济学前沿中的科研任务。重点学习计量方法的应用。管理理论前沿主要是确保每节课都能够听懂，并能够根据老师所讲内容提出两到三个学术问题，把握与不同领域老师的沟通和交流的机会。通过该课程拓宽学术视野，了解其他学术领域的研究现状，学习研究方法的使用策略和技巧。 2、科研目标科研能力重在训练，通过不断的试错和尝试来积累经验。主要的目标包括：扭转思维方式；掌握研究方法和技巧；理顺科技管理领域的文献脉络，发现并总结可能的研究问题；进行科技论文的写作。具体措施如下：扭转思维方式通过阅读文献、参与课程学习、进行科研文献写作、与同学老师沟通交流等方式不断将发散式的思维方式转变成以问题为中心，以条件为基础的科研研究的思维方式上来。掌握研究方法和技巧重点掌握计量方法的使用，利用课程学习的机会，完成课程科研训练的学习要求；通过经济学前沿的学习，梳理关键节点文献之间的逻辑关系，并学习在其他研究领域查找关

博士的学习计划范文

博士的学习计划范文博士的学习计划范文1 20xx年xx月xx日，xxx博士学习生活。万事开头难，但是，我也懂得良好的开端是成功的一半。为了给博士学习生活开好头，不断学习和提升自己，增强学术研究能力，特此制定本学习计划。本计划共分为两个层次：总计划和总目标;周计划和周目标。总计划和总目标明确了本学期学习和生活的总体“轮廓”，周计划和周目标则明确了以周为单位的分目标，指出了具体的执行策略。另外，制定控制的策略和方法，以确保计划和目标的实现。一、总计划和总目标 1、课程和学习目标以经济学前沿和高等数学为学习重点，以计量经济学等课程为依托，在打好基础的前提下，再次对方法论等课程进行学习，并尝试用计量方法进行学术文章的写作。(可以用计量方法完成经济学前沿课程的科研训练。)具体要求如下：经济学前沿课程完成大部分文献的阅读，明确大部分文献内涵主旨，了解经

济学理论的脉络，通过科研训练掌握计量等研究方法。高等数学课程完成老师课程要求的作业，并利用课余时间做习题巩固所学知识，尝试将所学知识与经济学前沿和计量课程中涉及的数学方法结合起来。计量经济学依据英文教材和课件完成曾卫红老师双语教学的计量经济学学习，利用计量完成经济学前沿中的科研任务。重点学习计量方法的应用。管理理论前沿主要是确保每节课都能够听懂，并能够根据老师所讲内容提出两到三个学术问题，把握与不同领域老师的沟通和交流的机会。通过该课程拓宽学术视野，了解其他学术领域的研究现状，学习研究方法的使用策略和技巧。 2、科研目标科研能力重在训练，通过不断的试错和尝试来积累经验。主要的目标包括：扭转思维方式;掌握研究方法和技巧;理顺科技管理领域的文献脉络，发现并总结可能的研究问题;进行科技论文的写作。具体措施如下：扭转思维方式

文档之家

心理测量学 课件

心理测量学 课件

学习计划 博士学习计划范文3篇

中国科学院心理研究所

博士研究生学习计划

博士的学习计划范文

心理测量学课件

心理测量学课件

学习计划博士学习计划范文3篇