常模参照测验的设计与编制
- 格式:ppt
- 大小:3.64 MB
- 文档页数:34
常模参照测验:是指以学生团体测验的平均成绩作为参照标准,说明某一学生在团体中的相对位置,将学生分类排队。
重在个人与个人之间的比较,主要用于选拔或编组、编班,要求试题难度适中,尽量对所有学生都有较强的鉴别力和区分度。
常模参照测验以鉴别学生个别差异为指导思想,目的是为了测得学生在所处团体中的相对水平。
常模实际上即是该团体在测验中的平均成绩,学生成绩便是以常模为参照标准来确定的。
这一测验衡量的是学生的相对水平,故其评分属相对评价范畴。
标准参照测验又称目标参照测验,标准参照测验是用来衡量学生是否达到预期教学目标的测验。
测验将个人分数与特定的标准相比较,评价学生是否合格,而不考虑学生在团体中的相对位置,故常用绝对评分方式记分。
标准参照测验是指以体现教育教学目标的标准作业为准,看学生是否达到标准以及达到标准的程度。
它主要不是用于比较个人之间的差异。
如我国高中会考及教师自编测验。
利用它可具体了解学生对某单元的知识、技能的学习和掌握情况。
标准参照测验,它是指依据某种特定操作标准可以直接解释测量结果的测验。
操作标准一般可以通过界定个体所应该完成的任务确定。
对标准参照测验来说,他的分数解释是以界定良好的任务或行为领域为基础的,是与预先设计的特定标准相对照所确定的,有了这个条件,我们便可以从较少的有代表性的测验题目的反应情况,推断出被试的真实水平。
用目标表示领域,并且题目是该领域中行为的有代表性样本,这时目标参照测验就是标准参照测验。
标准参照测验主要用于鉴定的目的。
能力评估与传统评估的不同点之一就在于,原有学习技术系统侧重的是常模参照的评价,而能力导向的评估与认证强调的乃是基于能力标准的评估,而很多能力标准的都用一些模糊的词汇加以描述,比如“理解”“掌握”“能够”,所以在能力评估的过程中也很难把握,很难给其一个质性的评价,所以能力标准的细化描述成为能力评估有效实施的关键。
《心理测量学》复习思考题一第一章心理测量概论1.为什么说人的心理是可测的?2.同是间接测量,测人的心理与测温度有什么不同?3.心理测量量表有什么特点?4.心理测量误差的类型与来源各有哪些?4.说说标准化测验的“标准”要求有哪些?5.说说常模参照测验与标准参照测验的不同之处。
6.心理测验编制的一般步骤有哪些?7.你从心理测量发展的历史中感悟到了什么?第二章测量信度与随机误差控制1.测量信度的概念和作用是什么?2.有哪些主要的测量信度估计方法?3.测量信度的影响因素有哪些?如何进行控制?第三章测量效度与系统误差控制1.测量效度的概念和作用是什么?2.有哪些主要的效度证据采集方法?3.测量效度的影响因素有哪些?如何进行控制?第四章测验题目性能与题目编写1. 对测验题目性能分析的目的是什么?如何对测验题目性能进行分析?2. 下表是11名考生在某测验6道题目上的得分及总分情况,请计算每题的难度及区分度。
题号一二三四五六总分满分 1 25343238104379153452534102462753651433834782292584214010112 252580 5 5 3 3 3 3 101525608 5 1013195212 8 14194610133620 18 2247 38 45第五章常模参照测验的设计与编制1. 什么是常模参照测验?主要有哪些编制原则?2. 什么是标准化样本?选取标准化样本时需要注意些什么?3. 什么是常模?常模有哪些种类?如何编制?4. 常模资料的主要呈现方法有哪些?第六章标准参照测验的设计与编制1.简述标准参照测验的编制过程。
2.标准参照测验的区分度分析有几种情况,它们之间有什么关系?3.什么是分类一致性信度,如何计算?4.举例说明标准参照测验几种划界分数的设置方法。
5.试比较标准参照测验与常模参照测验效度分析的异同。
第七章测验分数的可比性与测验等值1.应用例7.1的数据使用等百分位等值方法完成下面的等值对应表。
心理测量学复习资料一.心理测量概论1、心理测量定义:依据一定的心理学理论,使用测验对人的心理品质进行定量描述的活动。
2、心理测量的特点。
①间接性——心理测量是一种间接测量,间接测量必须找准中介媒质,心理测量的中介媒质是人的外显行为,外显行为的种类众多而且复杂多变,因此,心理测量的间接测量难度更大。
②应用的普遍性----从人的发展、素质和社会行业来看,心理测量的应用具有普遍性。
③可测性----心理学的研究证明,可以通过测量人的外显行为而推测人的心理。
3、心理测量的工具是量表,测验的本质是任何测量工具都是有参照点和测量单位的数字系统。
在心理测量学中也把它叫做量表。
量表的两要素:参照点、测量单位。
4、心理测量误差的类型:①随机误差:所得值与实际值之间大小和方向都会随机变化的差异值。
②系统误差:所得值与实际值之间的那种大小和方向都不变的差异值。
5、心理测量误差控制的理论与技术概述。
目标真分数,记为V,是测量者所追求的测量值。
随机误差分数,记为E。
非目标真分数(系统误差分数),记为I。
目标真分数与非目标真分数合在一起称为真分数,记为T。
心理与教育测量学假设: T=V+I ,X=T+E,进而有:X=V+I+E。
6、CTT模型(经典测量理论)的三个假设公理。
①误差分数的平均数是零(因为误差是随机的)。
②真分数和误差分数相互独立,没有任何相关,即ρ(T,E)=0(如果有相关,那误差就不是误差了)。
③两次平行测验上的误差分数之间相关为零,即ρ(E1,E2)=0(因为误差是随机的,所以两次测量之间没有必然的联系)。
7、心理测验的分类。
按所测量的心理品质分类:①能力测验,智力测验,能力倾向测验,成就测验②人格测验,EPQ、MMPI、16PF、RIT、TAT。
按评价所参照的标准分类:①常模参照测验②标准参照测验。
按接受测量的人数分类:①个别测验②团体测验。
按测验目的分类:①描述性测验②诊断性测验③预示性测验。
按测验要求分类:①最高作为测验②典型作为测验。
《心理测量学》教学大纲一、课程基本信息课程代码:16091303课程名称:心理测量英文名称:Psychometrics课程类别:专业必修课学时:48学分: 3适用对象: 应用心理学专业大三本科生考核方式:考试先修课程:无二、课程简介《心理测量学》介绍了当今心理学研究中主要的测量方法,包括测量的信度、效度、以及测量中随机误差和系统误差的控制方法;测验的难度、区分度,以及试题难度分布的控制技术和提高试题区分度的技术;介绍了各种著名测验,除了要求了解编制原理,还要求掌握实际使用方法;本书还介绍了标准参照测验教育成就测验的技术和理论。
还引进了题库建设、测验等值、项目功能差异、评价中心技术、行为情境判断测验、内隐联想测验等较为新近或更为实用的测量理论和技术。
除了介绍经典测量理论,还介绍了发展前景更为诱人的项目反应理论和概化理论,以及认知诊断理论。
为将来准备从事心理学应用、教育考试、人员测评等工作的本科生学习使用。
Psychometrics program introduce some measure methods which are widely used in psychological research. Those methods are reliability, validity and control methods of random measurement error and systematic error; difficulty, discrimination and How to control the degree of difficulty and improve the distinction; introduced a variety of well-known tests, in addition to understand the principle, but also required to master the practical use; besides introducing classical measurement theory, also introduced a more attractive prospect item response theory and generalizability theory, and the theory of cognitive diagnosis.三、课程性质与教学目的心理测量学课程是心理学各专业共同必修的一门应用与方法课程。
浅谈标准参照与常模参照相结合的高中学业水平考试设计方法近年来,中国教育界普遍认可高中学业水平考试(High School Academic Level Examination, HALE)作为检测高中学生学习成果的重要考试,教育部也对其进行了系统的研究,发布了《高中学业水平考试综合指导意见》(Comprehensive Guidance on High School Academic Level Examinations),指导设计HALE考试的方法。
在这一系列研究的基础上,标准参照与常模参照相结合设计HALE考试的方法被提出,并且得到了广泛的应用。
本文旨在通过介绍参照设计原理、参照设计步骤以及分析设计HALE考试案例,对标准参照与常模参照相结合设计HALE考试的方法进行深入地分析,以期为设计HALE 考试提供思路与参考。
一、参照设计原理参照设计原则是指在设计测试任务时,根据能够反映学生学习成果的参照数据,从而保证测试任务的内容及格式的合理性、有效性等。
根据参照数据的来源可以分为标准参照与常模参照。
标准参照又可分为一般性参照与具体性参照,一般性参照指的是从某些通用标准及抽象原则出发,利用规范文本以及抽象原则等,为HALE设计测试任务;具体性参照指的是从某些具体的字段知识中发现一定的标准,以此标准作为考试内容的参照,并根据学科特有的学习技能,设计测试任务。
常模参照是从一定规模的学生的学习数据中发现的常模,借助高大的可信度及频繁的反馈功能,设计测试任务,以保证结果的准确性和可二、参照设计步骤参照设计HALE考试的步骤主要有以下几个:1、阶段性确定HALE考试框架。
首先应明确HALE考试的检测对象、考试范围、考试目标领域、考试内容和考试形式等。
2、根据确定的检测对象及考试目标领域,进行标准参照及常模参照。
标准参照旨在从学科知识的角度,确定学生的各级能力要求;常模参照则从学生学习达成水平的角度,确定各级别的学生测评标准。
5.常模参照测试与标准参照测试1. 常模参照性测试(横向)常模参照测试是为了显示考生语言能力的差异,每个考生的成绩只需要跟其他考生比较,确定其在全体考生中的位置。
因此常模参照性测试适用于选拔性测试,在中国比较重要的考试大都是常模参照性测试,如中考、高考、研究生入学考试等。
常模参照性测试的选拔性目的决定了其独有的特点,从命题角度而言,命题内容覆盖面宽,命题难易度离散程度较高,有助于拉开分数段;分数主要采用百分或标准分数的形式,能够报道考生在常模群体中所处的百分位置。
例如:大学英语四、六级考试如某考生四级报道总分是550分,则根据大学英语四级考试(CET-4)报道分数百分位对照表,可判断其在常模群体中的百分位是76%,表示这名考生的英语成绩优于常模群体中76%的人。
再如某考生六级报道总分是600分,则根据大学英语六级考试(CET-6)报道分数百分位对照表,可判断其在常模群体中的百分位在87%~92%之间,表示这名考生的英语成绩至少优于常模群体中87%的人,但不会优于92%的人。
看图并指出这位考生在汉语水平测试中所处的百分位置:优点:常模参照性测试的优点在于对于大多数考生来说较为公平,因为通过考试与否的标准是以与其他考生公平竞争的结果来确立的,尤其是中国学生比较习惯于这种测试模式,他们较习惯于从自我位置的确定中找到前进的目标。
缺点:(1)常模参照性测试的不足在于常模的效度往往受到受试人群的影响,常模随着受试人群的变化而变化。
(2)学生在常模参照性测试中的表现不能直接说明其在语言中的实际表现。
(3)常模参照性测试的回波作用有待商榷,在实际操作中,如果大多数学生没有通过考试,那么责任往往推卸给试卷内容,而不是首先考虑教学目标和教学质量是否出现了问题。
2. 标准参照性测试(纵向)Carrol, Cronbach, Glaser在1963年发表了三篇论文,提出了标准参照性测试的概念。
与常模参照性测试不同,标准参照性测试在考试之前就已经预先定好了衡量标准,然后根据这些标准来判断学生是否通过和不通过。
编制试卷六个基本步骤编制试卷的六个基本步骤:①确定实验目的②制定编题计划③确定试题形式④选编题目⑤集合成试卷⑥将测验科学化标准化⑦编写考试说明。
育;常模参照测验:是以学生群体的平均分数分布作为参照标准,检查学生们的实际上达到的程度用于学生们的相互比较检查学生团体中的相对位置。
物理教学资源:是指中学物理教学过程中,能够用于实现教学目标的各种条件的总称。
包括人力、物力与自然资源。
试题形式:1.客观题①填空②选择2.主观题常用的有计算题、作图题、实验设计等。
导入新科常见方法:①直接导入②旧知识导入③生活实例导入④直观导入⑤故事导入⑥问题导入⑦实验导入。
演示实验教学的基本要求①要有明确的目的②要明显直观③要安全可靠,确保成功④要有启发性中学物理教学原则:①科学性、教育性、艺术性相结合的原则②激发学生兴趣和探究欲望的原则③创设物理环境,突出观察、实验、探究的原则④启发思考、教给方法的原则⑤联系生活、技术、社会实际的原则STS教育:与传统科学教育目标和出发点不同。
,主要关注科学、技术与社会之间的相互作用,齐宗旨是使学生在了解科学技术及其社会价值的同时,了解科学技术发展带来的问题,作为公民能够在一定程度上参与科学技术的决策,能够应用科学技术解决个人生活和社会中的问题。
中学生的科学素养应包括以下四个方面:科学知识与技能,科学研究,科学态度,情感与价值观,对科学、技术与社会关系的认识。
科学探究过程:①提出问题②猜想与假设③制定计划与设计实验④进行试验与收集数据⑤分析与论证⑥评估齐交流与合作前概念特征:①广泛性②迁移性③顽固性④共存性⑤情境性物理教学常用的评价方法有:观察法、问卷法、成长记录法、测验法和日常非正规评价法说课内容四说、两写、两展示。
①说材料②说学生③说教法学则及依据④说教学过程写说课板书和授课板书,展示课件和实验。
5.常模参照测试与标准参照测试1. 常模参照性测试(横向)常模参照测试是为了显示考生语言能力的差异,每个考生的成绩只需要跟其他考生比较,确定其在全体考生中的位置。
因此常模参照性测试适用于选拔性测试,在中国比较重要的考试大都是常模参照性测试,如中考、高考、研究生入学考试等。
常模参照性测试的选拔性目的决定了其独有的特点,从命题角度而言,命题内容覆盖面宽,命题难易度离散程度较高,有助于拉开分数段;分数主要采用百分或标准分数的形式,能够报道考生在常模群体中所处的百分位置。
例如:大学英语四、六级考试如某考生四级报道总分是550分,则根据大学英语四级考试(CET-4)报道分数百分位对照表,可判断其在常模群体中的百分位是76%,表示这名考生的英语成绩优于常模群体中76%的人。
再如某考生六级报道总分是600分,则根据大学英语六级考试(CET-6)报道分数百分位对照表,可判断其在常模群体中的百分位在87%~92%之间,表示这名考生的英语成绩至少优于常模群体中87%的人,但不会优于92%的人。
看图并指出这位考生在汉语水平测试中所处的百分位置:优点:常模参照性测试的优点在于对于大多数考生来说较为公平,因为通过考试与否的标准是以与其他考生公平竞争的结果来确立的,尤其是中国学生比较习惯于这种测试模式,他们较习惯于从自我位置的确定中找到前进的目标。
缺点:(1)常模参照性测试的不足在于常模的效度往往受到受试人群的影响,常模随着受试人群的变化而变化。
(2)学生在常模参照性测试中的表现不能直接说明其在语言中的实际表现。
(3)常模参照性测试的回波作用有待商榷,在实际操作中,如果大多数学生没有通过考试,那么责任往往推卸给试卷内容,而不是首先考虑教学目标和教学质量是否出现了问题。
2. 标准参照性测试(纵向)Carrol, Cronbach, Glaser在1963年发表了三篇论文,提出了标准参照性测试的概念。
与常模参照性测试不同,标准参照性测试在考试之前就已经预先定好了衡量标准,然后根据这些标准来判断学生是否通过和不通过。
心理测量学复习资料心理测量学复习资料第一章心理测量概论1.心理测量与物理测量有何区别与相似点?心理测量是指依据一定的心理学理论,使用一定的操作程序,给人的能力、人格及心理健康等心理特性和行为确定出一种数量化的价值。
区别:心理测量是以人的行为和心理属性(如智力或个性)为对象的测量,测量的工具就是心理测验(如智力测验或个性测验),而确定出一种数量化的值的过程就是心理测试(智力测试或个性测试)。
物理测量一般是对事物的属性进行测量,大多直接进行,即直接测量。
心理测量则大不相同,它是一种间接的测量。
相似点:物理测量和心理测量都有直接测量和间接测量的情况,在测量时都需要工具2.智力测验与、能力倾向测验、成就测验之间有何区别?就测验的对象而言,三者本质上有重叠之处,无法加以截然区分。
成就测验和智力测验、能力倾向测验的测量对象都是认知性特质。
这三种测验都是测量个体从与环境的相互作用经验中发展出来的能力。
能力倾向、智力测验测量的也可以看做一种“成就”。
不过,如果从测验的目的、性质及所涵盖的经验范围来看,这三种测验仍有某些不同之处,不能相互取代。
大多学者认为成就测验测量的是一些特定的、限定于某一范围的能力和知识,而令两者所测验的则为一般的、较为广泛的能力。
从功能上看,成就测验是评估被试在接受一些教育或训练程序后所获得的学习成果,是对个体过去学习经验的总结;智力测验的主要目的是预测一个人在未来的教育、训练或工作经验中可能的表现,但它所做出的预测比较笼统,针对性较弱。
能力倾向测验则是对个体在不同能力因素上潜在的优劣倾向的测量,它的预测的目的性更强,试图说明个体在多种能力上的潜在优势。
在测验的技术品质上,成就测验注重内容效度,而能力倾向、智力测验则必须有较高的预测效度,否则就失去其基本价值。
3.常模参照测验与标准参照测验有何异同?常模参照测验是将被试与常模相比较,以评价被试在团体中的相对地位为目的。
标准参照测验是将被试与以绝对标准相比较,以评价被试有无达到该标准为目的。
标准参照测验和常模参照测验一、引言。
在心理学和教育学领域,测验是一种常用的评估工具,用于评估个体的能力、特质、兴趣等。
而在进行测验时,我们常常会听到“标准参照测验”和“常模参照测验”这两个术语。
那么,它们究竟有何不同?本文将对这两种测验进行介绍和比较,帮助读者更好地理解它们的含义和应用。
二、标准参照测验。
标准参照测验是一种通过与标准群体进行比较来评估个体表现的测验。
在进行标准参照测验时,我们会将个体的得分与一个代表整个群体的标准分布进行比较,从而得出个体在某个特定领域的表现水平。
这种测验的优点在于能够提供详细的个体表现信息,并且能够将个体的表现与整个群体进行比较,从而更好地评估个体的表现。
三、常模参照测验。
常模参照测验则是一种通过与同龄人进行比较来评估个体表现的测验。
在进行常模参照测验时,我们会将个体的得分与同龄人的平均得分进行比较,从而得出个体在某个特定领域的表现水平。
这种测验的优点在于能够提供个体在同龄人群中的相对表现水平,帮助我们更好地了解个体的特点和优势所在。
四、比较与应用。
在实际应用中,标准参照测验和常模参照测验各有其适用的场景。
标准参照测验更适用于对个体表现进行详细评估和与整个群体进行比较的情境,例如在选拔人才、评估学习成绩等方面。
而常模参照测验则更适用于对个体在同龄人群中的相对表现进行评估的情境,例如在学业水平评估、发展评估等方面。
五、结论。
总的来说,标准参照测验和常模参照测验在评估个体表现时各有其独特的优势和适用场景。
在实际应用中,我们需要根据具体情境和评估目的来选择合适的测验方法,以更好地评估个体的表现并提供有针对性的帮助和支持。
六、参考文献。
1. Anastasi, A., & Urbina, S. (1997). Psychological Testing. Prentice Hall.2. Reynolds, C. R., & Livingston, R. B. (2013). Mastering Modern Psychological Testing: Theory & Methods. Pearson.3. Hambleton, R. K., Merenda, P. F., & Spielberger, C. D. (2005). Adapting Educational and Psychological Tests for Cross-Cultural Assessment. Lawrence Erlbaum Associates.。