常模参照测验的设计与编制
- 格式:ppt
- 大小:3.64 MB
- 文档页数:34
常模参照测验:是指以学生团体测验的平均成绩作为参照标准,说明某一学生在团体中的相对位置,将学生分类排队。
重在个人与个人之间的比较,主要用于选拔或编组、编班,要求试题难度适中,尽量对所有学生都有较强的鉴别力和区分度。
常模参照测验以鉴别学生个别差异为指导思想,目的是为了测得学生在所处团体中的相对水平。
常模实际上即是该团体在测验中的平均成绩,学生成绩便是以常模为参照标准来确定的。
这一测验衡量的是学生的相对水平,故其评分属相对评价范畴。
标准参照测验又称目标参照测验,标准参照测验是用来衡量学生是否达到预期教学目标的测验。
测验将个人分数与特定的标准相比较,评价学生是否合格,而不考虑学生在团体中的相对位置,故常用绝对评分方式记分。
标准参照测验是指以体现教育教学目标的标准作业为准,看学生是否达到标准以及达到标准的程度。
它主要不是用于比较个人之间的差异。
如我国高中会考及教师自编测验。
利用它可具体了解学生对某单元的知识、技能的学习和掌握情况。
标准参照测验,它是指依据某种特定操作标准可以直接解释测量结果的测验。
操作标准一般可以通过界定个体所应该完成的任务确定。
对标准参照测验来说,他的分数解释是以界定良好的任务或行为领域为基础的,是与预先设计的特定标准相对照所确定的,有了这个条件,我们便可以从较少的有代表性的测验题目的反应情况,推断出被试的真实水平。
用目标表示领域,并且题目是该领域中行为的有代表性样本,这时目标参照测验就是标准参照测验。
标准参照测验主要用于鉴定的目的。
能力评估与传统评估的不同点之一就在于,原有学习技术系统侧重的是常模参照的评价,而能力导向的评估与认证强调的乃是基于能力标准的评估,而很多能力标准的都用一些模糊的词汇加以描述,比如“理解”“掌握”“能够”,所以在能力评估的过程中也很难把握,很难给其一个质性的评价,所以能力标准的细化描述成为能力评估有效实施的关键。
《心理测量学》复习思考题一第一章心理测量概论1.为什么说人的心理是可测的?2.同是间接测量,测人的心理与测温度有什么不同?3.心理测量量表有什么特点?4.心理测量误差的类型与来源各有哪些?4.说说标准化测验的“标准”要求有哪些?5.说说常模参照测验与标准参照测验的不同之处。
6.心理测验编制的一般步骤有哪些?7.你从心理测量发展的历史中感悟到了什么?第二章测量信度与随机误差控制1.测量信度的概念和作用是什么?2.有哪些主要的测量信度估计方法?3.测量信度的影响因素有哪些?如何进行控制?第三章测量效度与系统误差控制1.测量效度的概念和作用是什么?2.有哪些主要的效度证据采集方法?3.测量效度的影响因素有哪些?如何进行控制?第四章测验题目性能与题目编写1. 对测验题目性能分析的目的是什么?如何对测验题目性能进行分析?2. 下表是11名考生在某测验6道题目上的得分及总分情况,请计算每题的难度及区分度。
题号一二三四五六总分满分 1 25343238104379153452534102462753651433834782292584214010112 252580 5 5 3 3 3 3 101525608 5 1013195212 8 14194610133620 18 2247 38 45第五章常模参照测验的设计与编制1. 什么是常模参照测验?主要有哪些编制原则?2. 什么是标准化样本?选取标准化样本时需要注意些什么?3. 什么是常模?常模有哪些种类?如何编制?4. 常模资料的主要呈现方法有哪些?第六章标准参照测验的设计与编制1.简述标准参照测验的编制过程。
2.标准参照测验的区分度分析有几种情况,它们之间有什么关系?3.什么是分类一致性信度,如何计算?4.举例说明标准参照测验几种划界分数的设置方法。
5.试比较标准参照测验与常模参照测验效度分析的异同。
第七章测验分数的可比性与测验等值1.应用例7.1的数据使用等百分位等值方法完成下面的等值对应表。
心理测量学复习资料一.心理测量概论1、心理测量定义:依据一定的心理学理论,使用测验对人的心理品质进行定量描述的活动。
2、心理测量的特点。
①间接性——心理测量是一种间接测量,间接测量必须找准中介媒质,心理测量的中介媒质是人的外显行为,外显行为的种类众多而且复杂多变,因此,心理测量的间接测量难度更大。
②应用的普遍性----从人的发展、素质和社会行业来看,心理测量的应用具有普遍性。
③可测性----心理学的研究证明,可以通过测量人的外显行为而推测人的心理。
3、心理测量的工具是量表,测验的本质是任何测量工具都是有参照点和测量单位的数字系统。
在心理测量学中也把它叫做量表。
量表的两要素:参照点、测量单位。
4、心理测量误差的类型:①随机误差:所得值与实际值之间大小和方向都会随机变化的差异值。
②系统误差:所得值与实际值之间的那种大小和方向都不变的差异值。
5、心理测量误差控制的理论与技术概述。
目标真分数,记为V,是测量者所追求的测量值。
随机误差分数,记为E。
非目标真分数(系统误差分数),记为I。
目标真分数与非目标真分数合在一起称为真分数,记为T。
心理与教育测量学假设: T=V+I ,X=T+E,进而有:X=V+I+E。
6、CTT模型(经典测量理论)的三个假设公理。
①误差分数的平均数是零(因为误差是随机的)。
②真分数和误差分数相互独立,没有任何相关,即ρ(T,E)=0(如果有相关,那误差就不是误差了)。
③两次平行测验上的误差分数之间相关为零,即ρ(E1,E2)=0(因为误差是随机的,所以两次测量之间没有必然的联系)。
7、心理测验的分类。
按所测量的心理品质分类:①能力测验,智力测验,能力倾向测验,成就测验②人格测验,EPQ、MMPI、16PF、RIT、TAT。
按评价所参照的标准分类:①常模参照测验②标准参照测验。
按接受测量的人数分类:①个别测验②团体测验。
按测验目的分类:①描述性测验②诊断性测验③预示性测验。
按测验要求分类:①最高作为测验②典型作为测验。
《心理测量学》教学大纲一、课程基本信息课程代码:16091303课程名称:心理测量英文名称:Psychometrics课程类别:专业必修课学时:48学分: 3适用对象: 应用心理学专业大三本科生考核方式:考试先修课程:无二、课程简介《心理测量学》介绍了当今心理学研究中主要的测量方法,包括测量的信度、效度、以及测量中随机误差和系统误差的控制方法;测验的难度、区分度,以及试题难度分布的控制技术和提高试题区分度的技术;介绍了各种著名测验,除了要求了解编制原理,还要求掌握实际使用方法;本书还介绍了标准参照测验教育成就测验的技术和理论。
还引进了题库建设、测验等值、项目功能差异、评价中心技术、行为情境判断测验、内隐联想测验等较为新近或更为实用的测量理论和技术。
除了介绍经典测量理论,还介绍了发展前景更为诱人的项目反应理论和概化理论,以及认知诊断理论。
为将来准备从事心理学应用、教育考试、人员测评等工作的本科生学习使用。
Psychometrics program introduce some measure methods which are widely used in psychological research. Those methods are reliability, validity and control methods of random measurement error and systematic error; difficulty, discrimination and How to control the degree of difficulty and improve the distinction; introduced a variety of well-known tests, in addition to understand the principle, but also required to master the practical use; besides introducing classical measurement theory, also introduced a more attractive prospect item response theory and generalizability theory, and the theory of cognitive diagnosis.三、课程性质与教学目的心理测量学课程是心理学各专业共同必修的一门应用与方法课程。
浅谈标准参照与常模参照相结合的高中学业水平考试设计方法近年来,中国教育界普遍认可高中学业水平考试(High School Academic Level Examination, HALE)作为检测高中学生学习成果的重要考试,教育部也对其进行了系统的研究,发布了《高中学业水平考试综合指导意见》(Comprehensive Guidance on High School Academic Level Examinations),指导设计HALE考试的方法。
在这一系列研究的基础上,标准参照与常模参照相结合设计HALE考试的方法被提出,并且得到了广泛的应用。
本文旨在通过介绍参照设计原理、参照设计步骤以及分析设计HALE考试案例,对标准参照与常模参照相结合设计HALE考试的方法进行深入地分析,以期为设计HALE 考试提供思路与参考。
一、参照设计原理参照设计原则是指在设计测试任务时,根据能够反映学生学习成果的参照数据,从而保证测试任务的内容及格式的合理性、有效性等。
根据参照数据的来源可以分为标准参照与常模参照。
标准参照又可分为一般性参照与具体性参照,一般性参照指的是从某些通用标准及抽象原则出发,利用规范文本以及抽象原则等,为HALE设计测试任务;具体性参照指的是从某些具体的字段知识中发现一定的标准,以此标准作为考试内容的参照,并根据学科特有的学习技能,设计测试任务。
常模参照是从一定规模的学生的学习数据中发现的常模,借助高大的可信度及频繁的反馈功能,设计测试任务,以保证结果的准确性和可二、参照设计步骤参照设计HALE考试的步骤主要有以下几个:1、阶段性确定HALE考试框架。
首先应明确HALE考试的检测对象、考试范围、考试目标领域、考试内容和考试形式等。
2、根据确定的检测对象及考试目标领域,进行标准参照及常模参照。
标准参照旨在从学科知识的角度,确定学生的各级能力要求;常模参照则从学生学习达成水平的角度,确定各级别的学生测评标准。
5.常模参照测试与标准参照测试1. 常模参照性测试(横向)常模参照测试是为了显示考生语言能力的差异,每个考生的成绩只需要跟其他考生比较,确定其在全体考生中的位置。
因此常模参照性测试适用于选拔性测试,在中国比较重要的考试大都是常模参照性测试,如中考、高考、研究生入学考试等。
常模参照性测试的选拔性目的决定了其独有的特点,从命题角度而言,命题内容覆盖面宽,命题难易度离散程度较高,有助于拉开分数段;分数主要采用百分或标准分数的形式,能够报道考生在常模群体中所处的百分位置。
例如:大学英语四、六级考试如某考生四级报道总分是550分,则根据大学英语四级考试(CET-4)报道分数百分位对照表,可判断其在常模群体中的百分位是76%,表示这名考生的英语成绩优于常模群体中76%的人。
再如某考生六级报道总分是600分,则根据大学英语六级考试(CET-6)报道分数百分位对照表,可判断其在常模群体中的百分位在87%~92%之间,表示这名考生的英语成绩至少优于常模群体中87%的人,但不会优于92%的人。
看图并指出这位考生在汉语水平测试中所处的百分位置:优点:常模参照性测试的优点在于对于大多数考生来说较为公平,因为通过考试与否的标准是以与其他考生公平竞争的结果来确立的,尤其是中国学生比较习惯于这种测试模式,他们较习惯于从自我位置的确定中找到前进的目标。
缺点:(1)常模参照性测试的不足在于常模的效度往往受到受试人群的影响,常模随着受试人群的变化而变化。
(2)学生在常模参照性测试中的表现不能直接说明其在语言中的实际表现。
(3)常模参照性测试的回波作用有待商榷,在实际操作中,如果大多数学生没有通过考试,那么责任往往推卸给试卷内容,而不是首先考虑教学目标和教学质量是否出现了问题。
2. 标准参照性测试(纵向)Carrol, Cronbach, Glaser在1963年发表了三篇论文,提出了标准参照性测试的概念。
与常模参照性测试不同,标准参照性测试在考试之前就已经预先定好了衡量标准,然后根据这些标准来判断学生是否通过和不通过。