第九章:标准参照测验
- 格式:ppt
- 大小:581.00 KB
- 文档页数:3
第九章学生评价教学要求:1、了解学生评价的含义、功能、类型、方法及当代走向。
2、理解学生学业评价的含义及基本内容。
3、明确学生品德评价的含义及常用方法4、举例分析说明学生评价实施中存在的问题及对策。
教学重点:当今基础教育课程改革的评价体系教学方法:讲授法教学时数:4课时第一节学生评价概述一、学生评价与教育评价教育评价是指在一定教育价值观的指导下,依据确立的教育目标,通过使用一定的技术和方法对所实施的各种教育活动教育过程和教育结果进行科学判定的过程。
纵观教育评价理论与实践的历史发展,一般认为大致经历了古代的传统、传统近现代的科学测试和当代的科学评价三个不同时期。
学生评价是指根据一定的标准,通过使用一定的技术和方法,以学生为评价对象所进行的价值判断。
它是教育评价的重要领域之一,也是学校教育中每一位老师都必须实际操作的一项重要内容。
它既是教育评价的基础和重点,也是学校教育评价的核心。
它是教育评价中历史悠久而又永恒的话题,有了学校教育就有了对学生如何评价的问题。
因为,学生的质量既是衡量一所学校教育工作质量的标准,也是提高学校教育工作水平的根本所在和关键要素。
所以,构建合理的学生评价价格体系,有效地实施学生评价,促进学生发展,是教育的必然追求。
二、学生评价的标准为了使学生评价发挥其应有的作用,实施时首先要制定恰当的评价标准。
评价标准是在实施评价过程中进行价值判断的准则,具有显著的社会性特征,并因评价对象和要求的不同而千差万别。
学校教育工作以教育目标作为其出发点、依据和归宿,因此教育目标制约着学生评价标准必须与其相一致,它是教育目标在各个评价项目上的具体化。
我国尚未有一个独立的学生评价标准,而主要依据教育目标并依托于课程目标,将抽象的目标具体化,分成不同的阶段水平,以此作为学生评价的标准。
我国的教育目标由三个层次即国家的教育总目标、各级各类学校的培养目标、课程和教学目标所构成。
三、学生评价的类型(一)诊断性评价、形成性评价和总结性评价根据学生评价在教学活动中的不同作用可以分为诊断性评价、形成性评价和总结性评价,这是由美国教育心理学家布卢姆提出的影响较大并被广泛使用的分类法。
标准参照测验相关理论和评价指标的综述作者:刘潇来源:《科教导刊·电子版》2017年第06期摘要本文从国内近年来对于标准参照测验的一系列探索出发,对国内学者对于标准参照测验的相关理论和评价指标做的研究和陈述主要包括标准参照测验的评价指标如信效度,测验长度以及分数体系做了一个综合述评。
关键词标准参照测验评价指标分数体系中图分类号:O212 文献标识码:A1标准参照测验的定义与作用1.1标准参照测验的定义匹斯堡大学的Glaser首次提出标准参照测验,将测验分成标准参照测验和常模参照测验。
后来许多学者将内容参照、领域参照等解释为标准参照。
标准参照测验又称准则参照测验。
是一种精心编制的,在一定的行为领域上按照具体标准水平对测验结果作出直接解释的测验。
是一种与以经典测验理论为基础的与常模参照测验相对的测验类型。
1.2标准参照测验的作用了解个体在所规定的测量内容上的行为水平,其出发点是个体本身的绝对水平,而不是个体间的差异。
2标准参照测验与常模参照测验的不同常模参照测验的分数反应了一个人在所属群体中的相对位置,常模代表了某一群体的真正水平,而标准参照测验的分数标志一个人能力或知识的绝对水平,不与其他人的分数比较,标准是希望达到的目标,对个体作出是否达标或达到什么程度的判断,有很大的人为性。
3标准参照测验的评价指标3.1标准参照测验的信度估计标准参照测验的信度估计方法很多,如克龙巴赫系数或CTT中的其它信度指标。
标准参照测验一定程度上有别于常模参照测验,许多的学者对其信度估计做了很多的阐述和研究。
香港中文大学的杨志明教授用概化理论中的可靠性指数和()公式,分别针对交叉设计和嵌套设计,就标准参照性测验的整体信度和等级分数线决策信度的估计问题进行了探讨。
用数据演示的方法比较了交叉设计与嵌套设计在估计标准参照性测验整体信度方面的差异,展示了等级决策分数线决策信度的估计方法。
安徽师大的赵必华教授在《标准参照测验信度的估计方法及其验证》中列举了四种标准参照测验信度的估计方法,分别是斯旺明内森方法;惠恩方法;萨伯考维克方法;玛希尔方法。
第九章教学评价你在任何时候也不要急于给学生打不及格的分数。
请记住:成功的欢乐是一种巨大的情绪力量,它可以促进儿童好好学习的愿望。
请你注意无论如何不要使这种内在的力量消失。
缺少这种力量,教育上的巧妙措施都是无济于事的。
——苏霍姆林斯基目录第一节教学评价概述一、测验、测量与评价二、教学评价的功能三、教学评价的类型四、教学评价的一般方法五、教学评价的发展趋势第二节试题的编制一、试题编制的原则二、试题编制的程序三、客观性试题和非客观性试题第三节考试结果的统计与分析一、常模参照测验与标准参照测验二、对考试成绩的统计分析三、对试题的评析第一节教学评价概述定义:教学评价是依据教学目标对教学过程及结果进行价值判断并为教学决策服务的活动。
教学是教与学的双边活动,因此教学评价也相应包括对教师教的评价和对学生学的评价。
一.测验、测量与评价测验:用以测量个体的行为或作业的工具。
它通常由许多经过适当安排的项目(问题、任务等)构成,可以就被试对这些项目的反应计分,分数被用于评估个体的情况。
测量:运用某种准则确定人、物体或事件的数量的过程。
评价:一种根据资料对被试的行为作出价值判断的活动,是对客体满足主体需要程度的判断。
教学评价是系统地、有步骤地从量的测量(事实判断)和质的描述(价值判断)两个方面对教学活动进行判断的活动。
其中,价值判断是教学评价的本质属性,也是区别于教学测量的根本标志。
目的是对课程、教学方法及学生培养方案作出决策。
教学评价的基本内容:对学生学习结果的评价和对教师教学工作的评价,也可划分学生学业评价、课堂教学评价、教师评价。
学生评价既是教育评价的基础和重点,也是学校教育评价的核心。
在现行的学生学业评价中,测验依然居主流地位。
二、教学评价的功能(一)教育功能定向(明确的目标对学生学习效果具有直接影响作用)诊断(发现学习中的疏漏和问题,判断原因)反馈(积极评价提高自信,适度否定激励前进)改进(及时反馈有利于探求教学的问题,以求改进)强化(促使学生复习所学知识,知识深刻化、条理化)(二)管理功能选拔淘汰(为选拔新生和招录人员提供依据,选优劣汰)区别安置(对学生合理安置,科学分班编组)评定教师业绩(学生的学业成绩是评价教师工作业绩的重要依据)三、教学评价的类型1.根据评价在教学活动中的作用(功能):诊断性评价(摸底考试)、形成性评价、总结性评价(期末考试)2.根据评价所使用的方法和标准:相对性评价(常模参照评价)、绝对性评价(目标参照性评价)、个体内差异评价(学生的过去和现在进行比较)3.按照评价的主体:部评价(专业人员)、内部评价(自我评价)1.根据评价在教学活动中的作用(功能):(1)诊断性评价是指在教学活动开始之前,对评价对象的学习准备程度作出鉴定,以便采取相应的教学措施使教学计划顺利、有效实施而进行的测定性评价。
效标参照测验“效标参照测验”效标参照测验(Criterion-referenced test)是一种评估学生学习成就的方法。
它通过与特定标准或目标进行比较,确定学生在特定领域中的能力水平。
效标参照测验不同于常见的相对评价方法,如百分制和等级制,它更关注学生是否达到了特定的学习目标。
效标参照测验提供了一种全面了解学生学习成就的方式。
它不仅可以评估学生在不同学科领域的知识,还可以评估学生在不同认知层次上的能力。
例如,在语言学习中,效标参照测验可以帮助评估学生的听力、口语、阅读和写作能力。
通过了解学生在每个方面的表现,教师可以更好地了解学生的强项和弱项,并有针对性地进行教学。
效标参照测验的结果还可以用于确定教学计划和目标。
通过对学生的评估,教师可以确定学生在特定学科或技能方面的掌握程度。
这样,教师可以针对学生的需要进行教学,制定相应的教学计划和目标。
这种个性化的教学方式可以更好地满足学生的需求,提高学习效果。
此外,效标参照测验还可以激发学生的学习动力。
当学生知道自己将接受一项根据特定标准进行评估的测验时,他们会更加专注和认真地学习。
这种评估方式可以激励学生努力提高自己的学习成绩,达到或超过预期的标准。
然而,效标参照测验也存在一些挑战和限制。
首先,确定有效的评估标准是一项复杂的任务。
标准的制定需要考虑到学科特点、学生的年级和教学目标等因素。
其次,评估过程需要严谨和客观,以确保结果的准确性和可靠性。
最后,评估结果应该以一种能够被学生和家长理解的方式呈现,以便于他们了解学生的学习情况。
总之,“效标参照测验”是一种有益的评估方法,它能够提供全面了解学生学习成就的途径。
通过这种评估方式,教师可以更好地了解学生的学习状况,制定个性化的教学计划和目标。
同时,这种评估方式也能够激发学生的学习动力,促使他们更加努力地学习。
然而,我们也必须充分认识到评估过程中的挑战和限制,以确保评估结果的准确性和可靠性。
5.常模参照测试与标准参照测试1. 常模参照性测试(横向)常模参照测试是为了显示考生语言能力的差异,每个考生的成绩只需要跟其他考生比较,确定其在全体考生中的位置。
因此常模参照性测试适用于选拔性测试,在中国比较重要的考试大都是常模参照性测试,如中考、高考、研究生入学考试等。
常模参照性测试的选拔性目的决定了其独有的特点,从命题角度而言,命题内容覆盖面宽,命题难易度离散程度较高,有助于拉开分数段;分数主要采用百分或标准分数的形式,能够报道考生在常模群体中所处的百分位置。
例如:大学英语四、六级考试如某考生四级报道总分是550分,则根据大学英语四级考试(CET-4)报道分数百分位对照表,可判断其在常模群体中的百分位是76%,表示这名考生的英语成绩优于常模群体中76%的人。
再如某考生六级报道总分是600分,则根据大学英语六级考试(CET-6)报道分数百分位对照表,可判断其在常模群体中的百分位在87%~92%之间,表示这名考生的英语成绩至少优于常模群体中87%的人,但不会优于92%的人。
看图并指出这位考生在汉语水平测试中所处的百分位置:优点:常模参照性测试的优点在于对于大多数考生来说较为公平,因为通过考试与否的标准是以与其他考生公平竞争的结果来确立的,尤其是中国学生比较习惯于这种测试模式,他们较习惯于从自我位置的确定中找到前进的目标。
缺点:(1)常模参照性测试的不足在于常模的效度往往受到受试人群的影响,常模随着受试人群的变化而变化。
(2)学生在常模参照性测试中的表现不能直接说明其在语言中的实际表现。
(3)常模参照性测试的回波作用有待商榷,在实际操作中,如果大多数学生没有通过考试,那么责任往往推卸给试卷内容,而不是首先考虑教学目标和教学质量是否出现了问题。
2. 标准参照性测试(纵向)Carrol, Cronbach, Glaser在1963年发表了三篇论文,提出了标准参照性测试的概念。
与常模参照性测试不同,标准参照性测试在考试之前就已经预先定好了衡量标准,然后根据这些标准来判断学生是否通过和不通过。
教学测量与评价名词解释教学测量与评价名词解释1. 测量:根据一定的法则使用量具对事物的特征进行定量描述的过程2. 教学测量:根据一定的法则使用量具对教师教与学生学的过程进行定量描述的过程3. 常模参照测验:以常模作为评价测验分数之标准的测验4. 标准参照测验:按照具体的行为标准水平对被试的测验结果作出直接解释的测验5. 项目分析:指对特定受测者在个别测验项目上所做反应的统计特征的计算和检验6. 难度:被试完成测验项目任务所遇到的困难程度7. 区分度:测验项目对所测量的心理特征的区分能力8. 误差:测量过程中由那些与测量目的无关的变化因素所产生的一种不准确(效度)或不一定(信度)的测量效应9. 真分数:把反映被试某种心理特质真正水平的那个数值10. 标准化:指测量的编制、实施、记分以及测量分数的解释程序的一致性11. 常模:常模团体的分数分布12. 信度:测量结果的可靠性、一致性、可信性、稳定性的程度13. 复本信度:用水平测验A、B对同一组被试在最短时间内施测两次所得结果的一致性14. 效度:实际测出的心理特质与所要测量的心理特质的程度15. 构想效度:测验实际测到所要测量的理论结构或特质的程度16. 效标:衡量一个测验是否有效的外在标准,它是独立于测验并可以从实践中直接获得我们所感兴趣的行为17. 导出分数:针对原始分数进行统计处理后获得的分数18. 内容效度:测验实际测到的内容与所要测量的内容之间的吻合程度19. 导出分数:针对原始分数进行统计处理后获得的分数20. 百分等级分数:在常模团体中低于该分数的人数百分比21. 标准分数:以平均数为参照点,标准差为单位表示的分数22. T量表:<量表:能够使事物的特征数量化的数字的连续体(T量表没找到)>23.比率智商:智力年龄与实际年龄的比率24.心理年龄:被试智力发展水平的年龄25.形成性评价:通过观察、活动记录、测验、问卷调查和咨询等形式对学生的学习进展进行持续评价教育测量与评价名词解释(上)(转)2017-04-09 15:32 | #2楼1、统计:就是“统而计之”对所考察事物的量的取值在其出现的全部范围内作总体的把握,全局性的认识。