细说试题的难度、区分度、信度和效度以及对高考复习的启示

  • 格式:doc
  • 大小:58.50 KB
  • 文档页数:7

下载文档原格式

  / 7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

细说试题的难度、区分度、信度和效度以及对高考复习的启示

一.试题的难度

(一)什么是难度

难度是指试题的难易程度,是评价考试的一个非常重要的一个指标。一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。

客观题难度计算公式:P(难度指数)=试题答对人数/考生人数;主观题难度计算公式:P=试题平均得分/试题满分。试卷难度计算公式:P=为平均分,K为试卷满分值。易、中、

难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。当然,在实际的评价过程中,测验的难度水平多高才合适,也还要取决于测验的目的。如果教师要对学生的知识准备状况进行一次诊断性测验,为了真实、准确地了解学生的知识掌握情况,测验难度大一点也是正常的。

(二)难度的计算

(1)客观性试题难度P(这时也称通过率)计算公式:

P=k/N(k为答对该题的人数,N为参加测验的总人数)

(2)主观性试题难度P计算公式:

P=X/M(X为试题平均得分;M为试题满分)

(3)适用于主、客观试题的计算公式:

P=(P H+P L)/2(P H、P L分别为试题针对高分组和低分组考生的难度值)

在大群体标准化中,此法较为方便。具体步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④按上面的公式计算。

例1:一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5分,这道题的难度为:

P H=20/27=0.74 P L=5/27=0.19 P=(0.74+0.19)/2=0.47

整个试卷的难度等于所有试题难度之平均值(包括主、客观试题)。

(三)试题难度的一般要求

就高考来说,难度以适中为宜,单个试题的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。

一般将难度值大于和等于0.7的试题定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试题定为难题。

命题时难度一般要按一定比例分配,如3:6:1或3:5:2,一般说来,容易题、难度系数为0.95-0.75,中档题为0.74-0.6,难题为0.59-0.20。

二.试题的区分度

(一)什么是区分度

区分度是指考试题目对考生心理特征的区分能力。区分度高的试题能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。

(二)区分度的计算

1.单个选择题目区分度的计算

将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。

计算公式为:D=P H-P L.P H和P L分别为高分组和低分组的通过率。

2整个试题的区分度计算(常用)

计算公式为:D=2(X H—X L)/W

其中D为试卷区分度,X H为27%高分组平均分,X L为27%低分组平均分,W为试卷总分。

一般也将全体考生总分从高到低排列,将总分最高的27%的考生定为高分组,总分最低的27%考生定为低分组,再分别计算各组的平均分。

如:一份满分100分的试卷,高分组平均得分90分,低分组平均得分60分,则区分度为2(90-60)/100=0.6

一道题值2分的试题,高分组平均得分1.5分,低分组平均得分0.5分,则区分度为2(1.5-0.5)/2=1

(三)试题区分度的一般要求

区分度(D)的取值范围介于-1.00至+1.00之间。通常D为正值,称为积极区分;D为负值称为消极区分;D值为0称为无区分作用。具有积极区分作用的试题,其D值越大,区分的效果越好。

试题的区分度在0.4以上表明此题的区分度很好,0.3~0.39表明此题的区分度较好,0.2~0.29表明此题的区分度不太好需要修改,0.19以下表明此题的区分度不好应淘汰。

高考的区分度一般要求在0.3以上,表示高分组的学生比低分组的学生能多得30%的分数。一般认为,区分度的数值达到了0.3,便可以接受;低于0.3的题目,区分能力就差了。

三.试题的信度

信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分数的一致性和稳定性程度。信度除了要说明成绩的真实性之外,还要说明题目涉及的内容与教学的相关程度。

信度系数愈高即表示该测验的结果愈一致、稳定与可靠。系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。反之,随机误差可能导致不致性,从而降低信度。信度可以定义为随机误差R影响测量值的程度。如果R=0,就认为测量是完全可信的,信度最高。

信度的定义

信度主要是指测量结果的可靠性、一致性和稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征。和信度相关的一个概念是效度,信度是效度的前提条件。

信度只受随机误差的影响,随机误差越大,信度越低。因此,信度可以视为测试结果受随机误差影响的程度。系统误差产生恒定效应,不影响信度。

测试信度(test reliability)也叫测试的可靠性,指的是测试结果是否稳定可靠。也就是说,测试的成绩是不是反映了受试者的实际语言水平。例如,如果同一套测试在对同一测试对象(即受试者本身没有变化)进行的数次测试中,受试者的分数忽高忽低的话,则说明该测试缺乏信度。测试的信度与测试的效度有着密切的关系。一般说来,只有信度较高的测试才能有较高的效度,但效度较高不能保证信度也一定较高。测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。试题本身是否可靠主要取决于试题的范围、数量、试题的区分度等因素;评分是否可靠则要看评分标准是否客观和准确。

测试的信度通常用一种相关系数(即两个数之间的比例关系)来表示,相关系数越大,信度则越高。当系数为1.00时,说明测试的可靠性达到最高程度;而系数是0.00时,则测试