教育测量与评价课件(3)(第三章 教育测量与评价的质量特性)..
- 格式:ppt
- 大小:273.50 KB
- 文档页数:32
第三章教育测量与评价的质量特性教育测量与评价的质量特性是指衡量教育测量与评价方式好坏的标准和特征。
这些特性对于确保评价结果的可靠性和有效性非常重要。
本文将介绍教育测量与评价的质量特性中的11个方面,包括信度、效度、客观性、标准化、综合性、灵敏性、稳定性、可操作性、公正性、可信性和效能。
首先,信度是指测量结果的稳定性和一致性。
一个具有良好信度的测量工具,即使在不同时间和场合下使用,也能够得出相似的结果。
为了确保信度,可以采用多种方法,如测试重测法、分割半法和并行测试法。
其次,效度是指测量工具是否能够真实地反映出被测量的内容。
有效的测量工具应该能够准确地衡量被评价对象的特征和能力。
为了确保效度,可以进行内容效度分析、构造效度分析和标准效度分析等。
第三,客观性是指评价过程是否客观公正,不受个人主观意识和偏见的影响。
客观的评价应该遵循科学的评价标准和程序,避免主观判断和个人情感的干扰。
为了确保客观性,可以采用客观评分标准、标准化评分和多人评价等方法。
第四,标准化是指采用统一的评价标准和方法进行测量评价。
标准化可以提高评价结果的可比性和可靠性,并减少评价结果的误差。
为了进行标准化,可以制定统一的评价标准和评分规则,并进行培训和监督。
第五,综合性是指评价结果应该综合考虑多个评价指标和多个评价方法。
综合性评价可以更全面地了解被评价对象的特征和能力,并避免单一指标和单一方法带来的评价偏差。
为了实现综合性评价,可以采用多种评价方法和多个评价指标。
第六,灵敏性是指评价工具能够敏锐地区分不同水平的被评价对象。
灵敏性评价可以更精确地衡量被评价对象的特征和能力,并提供更有针对性的改进建议。
为了确保灵敏性,可以采用灵敏性指标和合理的评价区分度。
第七,稳定性是指评价结果在不同时间和场合下的稳定性和一致性。
稳定性评价可以确保评价结果的可靠性和可比性,并避免评价过程和评价工具的误差。
为了确保稳定性,可以进行关于测量工具的试验和验证。
(一)重测信度(test retest reliability)重测信度指的是用同一个量表(测验或评价表)对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。
(二)复本信度(alternate forms reliability)复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。
(三)同质性信度(homogeneity reliability)同质性信度也叫内部一致性信度(internal consistency reliability),它是指测验内部所有题目间的一致性程度。
1. 分半信度(split half reliability)2. 库德—理查逊信度(Kuder & Richardson reliability)3. 克龙巴赫(cronbach)α系数当测验题型较多,并非都是二分记分题时,估计测验信度可采用克龙巴赫α系数。
四、标准参照测验的信度分析1. 百分比一致性指标百分比一致性(percent agreement,简称PA)指标是指同一测验或两平行测验先后两次施测,其对被试的分类结果一致的比例。
2. κ一致性系数κ一致性系数(kappa coefficient of agreement),是指实际被评定为一致的百分比与在理论上被评定为一致的最大可能次数百分比的比率。
五、测量标准误与测验信度的关系测量标准误是指测验中所得测值偏离真分数的程度,记为SE。
显然,它与测验信度系数之间存在着必然联系,这种关系可定量地表示如下:SE=Sx1-rxx(3-15)式中,SE为测量的标准误,Sx为观察分数的标准差,rxx是测量的信度系数。
测量标准误是反映测量结果精确性和可靠性的又一指标,同时也是人们正确解释测验分数的科学依据。
六、评分者信度1. 评分者信度的含义评分者信度(scorer reliability)指的是多个评分者给同一批人的答卷进行评分的一致性程度。