大学生教育测量与评价期末复习资料

  • 格式:docx
  • 大小:71.61 KB
  • 文档页数:18

下载文档原格式

  / 18
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

教育测量与评价

第一章教育测量与评价的学科发展

1.测量:从广义上讲,就是根据某些法则与程序,用数字对事物在量上的规定性予以正确和描述的过程。

2.测量的要素:量具、单位、参照物

3.教育测量,指针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以准确和描述的过程。

4.教育评价:是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。

5.教育测量与教育评价的实际联系与区别:

教育测量可以为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础,教育评价往往是教育测量过程的延续,是对测量结果的解释与应用,并朝着价值判断与释放教育功能的方向拓展。

6.中国是考试制度的发源地:西周选士是我国考试制度的萌生阶段

7.中国科举制度:中国古代科举考试制度对世界教育、政治、文化,尤其是考试制度产生过重大的影响。

8.教育测量学科的诞生:美国心理学家桑代克,《精神与社会测量导论》,首次较系统地介绍了教育统计方法及其编制测量的基本原理,它标志着以科学理论为指导的教育测量理论的诞生。

9历史意义:美国的“八年研究”是教育评价的催生剂。

10.泰勒在“八年研究”中提出了评价活动原理和课程编制原理,形成了“行为目标评价模式”,被称为当代教育评价之父。

第二章教育测量与评价的类型与功能

1.教育测量与评价的主要类型

⑴按测量与评价在教学中运用的时机分类:

①形成性测量与评价:是在教学过程中经常实施的,在性质上大致相当于现在的中小学单元测验。

目的:对于教师而言,可以获得教学过程中连续性的反馈,了解学生的学习效果、特点和困难等信息,作为随时修正自己教学的参考。对学生的学习,也可提供反馈信息,学生可以根据反馈结果获知自己学习后的表现情况,从而肯定或修正自己的学习方式。

②诊断性测量与评价

③终结性测量与评价:用于教学结束后在性质上相当于现在学校中所举行的期末考试。

目的:Ⅰ.在教学目标之下,检查学生一学期学业达到了什么程度,从而判断教学效果的得失。Ⅱ.根据结果,评定学生的学业成就,并将评定结果通知学生家长或记入档案。

⑵按解释测量结果和评价结果时的参照点分类:

①常模参照测量与评价

②标准参照测量与评价:也称为目标参照测量与评价,是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在多大程度上达到该标准。

(学校的教育测量与评价,主要目的是为了确定学生达到教学目标的程度,考查学生对知识技能的掌握程度,因此,一般都采用标准参照测量与评价)

③潜力参照测量与评价

⑶按测量与评价被试行为表现的性质分类:①最佳行为测量与评价②典型行为测量与评价

⑷按测量与评价的内容分类:

①智力测量与评价

②能力倾向测量与评价

③成就测量与评价:目的在于测量评价个人在接受教育或训练后的成就。

常见有两种类型:

Ⅰ.学科成就测验:旨在测量与评价被试在某一学科上的学习成就。

Ⅱ.综合成就测验:旨在评价与测量被试在多个学科或综合学科上的学习成就。综合成就既可以单个测验,也可以成套测验。 ④人格测量与评价

2.教育测量与评价的主要功能 ①实现教育判断的功能

教育测量与评价的最基本、最原始、最现实、最普遍的功能,就是实现教育判断。它包括测量评定的功能、事实判断的功能、价值判断的功能、问题诊断的功能、区分选拔的功能。 ②改进教师教学的功能 ③促进学生学习的功能 ④行使教育管理的功能

第三章 教育测量与评价的质量特性

第一节 信度

一、信度,简单的说就是测量结果的可信程度。信度指的是测量结果的稳定性程度,记为r xy 。也就

是说,如果用同一测量工具反复测量同一种特质对象,则多次测量结果间的一致性程度就叫信度。 二、信度的估计方法。

(一)重测信度:重测性都指的是用同一个量表(测验或评价表)对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。 公式 ∑∑∑--∑∑∑-∑=

2

i 2

i 2

i 2

i i i i i xy (n (n ))((n r )

)Y Y X X Y X Y X

公式中,n 为被试的数量,X i 是每个被试第一次考试分数,Y i 是每个被试第二次考试分数。

重测信度有个基本假设,那就是假设某测验所要测量的潜在特质,短期内不会随着时间推移而改变。因此重测信度的用途也在于估计测验结果(以测验分数表示)经过一段时间后是否仍然维持稳定、一致的特性,所以又称为稳定性系数。

(二)复本信度

所谓复本测验是指在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验,复本测验也称作平行测验。复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。

实施复本测验有两种方式:一种是在同一个时间连续施测,另一种是间隔一段时间后施测。前者主要可以反映出测验内容造成的误差的多少,也就是说可以反映出两个测验是否是真正的平行测验,所以这种复本信度称作等值性系数。

(三)同质性信度

同质性信度也叫内部一致性信度,它是指测验内部所有题目间的一致性程度。

1.分半信度。分半信度指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。

斯皮尔曼—布朗公式 )(hh hh xy r 1/2r r +=

公式中,xy r 为整个测验的信度系数,hh r 为两个“半测验”上得分的相关系数。 (1)弗朗那根公式

[]

2

2b 2a xy /(12r X

S S S )+-= (2)卢仑公式

2

2d xx /1r X S S -=