试题的难度、区分度、信度和效度
- 格式:doc
- 大小:20.50 KB
- 文档页数:5
细说试题的难度、区分度、信度和效度以及对高考复习的启示一.试题的难度(一)什么是难度难度是指试题的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试题答对人数/考生人数;主观题难度计算公式:P=试题平均得分/试题满分。
试卷难度计算公式:P=为平均分,K为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
当然,在实际的评价过程中,测验的难度水平多高才合适,也还要取决于测验的目的。
如果教师要对学生的知识准备状况进行一次诊断性测验,为了真实、准确地了解学生的知识掌握情况,测验难度大一点也是正常的。
(二)难度的计算(1)客观性试题难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试题难度P计算公式:P=X/M(X为试题平均得分;M为试题满分)(3)适用于主、客观试题的计算公式:P=(P H+P L)/2(P H、P L分别为试题针对高分组和低分组考生的难度值)在大群体标准化中,此法较为方便。
具体步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④按上面的公式计算。
例1:一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5分,这道题的难度为:P H=20/27=0.74 P L=5/27=0.19 P=(0.74+0.19)/2=0.47整个试卷的难度等于所有试题难度之平均值(包括主、客观试题)。
(三)试题难度的一般要求就高考来说,难度以适中为宜,单个试题的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
试卷命题的难度、区分度、信度和效度 什么是试题难度系数?考试难度系数如何计算?难度系数反映试题的难易程度,即考生在一个试题或一份试卷中的失分程 度。
如满分150分的试题,考生平均得分108分,平均失分42分,则难度系数 为42/150=0.28。
难度系数的计算公式为: L=1—X/W 其中,L为难度系数,X为样本平均得分,W为试卷总分(一般为100分或150分)。
什么是试题区分度?试卷区分度计算公式是什么?试卷区分度反映试题区分不同水平受试者的程度,即考出学生的不同水平, 把优秀、一般、差三个层次的学生真正分别开。
区分度高的考试,优秀、一般、 差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或 不及格太多的考试,区分度则低如果把成绩从高往低排序,前50%的考生为高 分组,后50%为低分组,其计算公式为:D=2(X H—X L)/W 其中,D为区分度,X H为高分组平均分,X L为低分组平均分,W为试卷总 分(一般为100分或150分)。
从以上公式可以看出试题难度系数和区分度并没有直接联系,因为前者是反 映样本总体的一个参数,后者是反映样本2个部分的参数。
测试的命题质量如何,否对考生的知识程度和能力进行有效的测量,除了上面介绍的试题难度和区分度知识外,还需要对试卷做整体分析,试卷整体分析的指标主要是信度和效度。
测试信度也叫测试的可靠性,指的是测试结果是否稳定可靠。
也就是说,测试的成绩是不是反映了受试者的实际语言水平。
例如,如果同一套测试在对同一测试对象进行的数次测试中,受试者的分数忽高忽低的话,则说明该测试缺乏信度。
测试的信度与测试的效度有着密切的关系。
一般说来,只有信度较高的测试才能有较高的效度,但效度较高不能保证信度也一定较高。
测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。
试题本身是否可靠主要取决于试题的范围、数量、试题的区分度等因素;评分是否可靠则要看评分标准是否客观和准确。
细说试题的难度、区分度、信度和效度以及对高考复习的启示一.试题的难度(一)什么是难度难度是指试题的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试题答对人数/考生人数;主观题难度计算公式:P=试题平均得分/试题满分。
试卷难度计算公式:P=为平均分,K为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
当然,在实际的评价过程中,测验的难度水平多高才合适,也还要取决于测验的目的。
如果教师要对学生的知识准备状况进行一次诊断性测验,为了真实、准确地了解学生的知识掌握情况,测验难度大一点也是正常的。
(二)难度的计算(1)客观性试题难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试题难度P计算公式:P=X/M(X为试题平均得分;M为试题满分)(3)适用于主、客观试题的计算公式:P=(P H+P L)/2(P H、P L分别为试题针对高分组和低分组考生的难度值)在大群体标准化中,此法较为方便。
具体步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④按上面的公式计算。
例1:一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5分,这道题的难度为:P H=20/27=0.74 P L=5/27=0.19 P=(0.74+0.19)/2=0.47整个试卷的难度等于所有试题难度之平均值(包括主、客观试题)。
(三)试题难度的一般要求就高考来说,难度以适中为宜,单个试题的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
细说试题的难度、区分度、信度和效度以及对高考复习的启示一.试题的难度(一)什么是难度难度是指试题的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试题答对人数/考生人数;主观题难度计算公式:P=试题平均得分/试题满分。
试卷难度计算公式:P=为平均分,K为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
当然,在实际的评价过程中,测验的难度水平多高才合适,也还要取决于测验的目的。
如果教师要对学生的知识准备状况进行一次诊断性测验,为了真实、准确地了解学生的知识掌握情况,测验难度大一点也是正常的。
(二)难度的计算(1)客观性试题难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试题难度P计算公式:P=X/M(X为试题平均得分;M为试题满分)(3)适用于主、客观试题的计算公式:P=(P H+P L)/2(P H、P L分别为试题针对高分组和低分组考生的难度值)在大群体标准化中,此法较为方便。
具体步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④按上面的公式计算。
例1:一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5分,这道题的难度为:P H=20/27=0.74 P L=5/27=0.19 P=(0.74+0.19)/2=0.47整个试卷的难度等于所有试题难度之平均值(包括主、客观试题)。
(三)试题难度的一般要求就高考来说,难度以适中为宜,单个试题的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
试题评价指标通常包括以下几个方面:
1.信度:信度是衡量试题质量的指标之一,它反映了试题的可靠
性和稳定性。
一个好的试题应该在不同的时间、不同的地点和不同的条件下,对同一组考生进行测试,其结果应该保持一致。
2.效度:效度是衡量试题质量的另一个重要指标,它是指试题是
否能够准确地测试出考生所要测量的知识和能力。
一个好的试题应该具有较高的效度,即能够有效地测试出考生对于所要测量的知识和能力的掌握程度。
3.难度:难度是衡量试题难易程度的指标,它通常用试题的得分
率来表示。
难度过高或过低都会影响试题的质量,因此需要选择适当的难度水平。
4.区分度:区分度是指试题对于不同水平的考生能够区分出他们
的能力差异的程度。
一个好的试题应该具有较高的区分度,以便能够区分出不同水平的考生。
5.覆盖面:覆盖面是指试题所涉及的知识面和能力的范围。
一个
好的试题应该具有较广的覆盖面,能够测试出考生的全面知识和能力。
6.表述清晰度:表述清晰度是指试题的语言表达是否清晰、简洁、
易懂。
一个好的试题应该具有较高的表述清晰度,以便让考生能够理解并回答问题。
7.结构合理性:结构合理性是指试题的组成和排列是否合理。
一
个好的试题应该具有合理的结构,以便能够全面地测试考生的
知识和能力。
信度效度难度区分度计算公式1.重测信度:使用同样的测试工具测试同一个群体两次,计算两次测试结果之间的相关性。
公式:重测信度= 2r / 1+r其中,r为两次测试结果的相关系数。
2. 内部一致性信度:用来衡量测试工具内部各项之间的相似性,常用的是Cronbach's alpha系数。
公式:Cronbach's alpha系数= (k / (k-1)) x (1- (∑s/sT)) 其中,k为题目数,s为各题目得分方差,sT为整个试卷得分方差。
二、效度计算公式:1. 相关效度:用来衡量测试工具与其他测量工具或指标之间的相关性。
公式:相关系数r= (∑XY)/ √(∑X) x √(∑Y)其中,X为测试工具得分,Y为其他测量工具或指标得分。
2. 鉴别效度:用于确认测试工具是否能够区分不同水平的群体。
公式:鉴别指数D= (X1-X2) / SDp其中,X1为高水平群体的平均得分,X2为低水平群体的平均得分,SDp为测试工具得分标准差。
三、难度计算公式:1. 题目难度:用来衡量题目的难易程度,一般使用正确率或难度系数来表示。
公式:难度系数P= 正确人数/ 总人数2. 试卷难度:用来衡量整个测试工具的难度。
公式:试卷难度系数= ∑难度系数/ 题目数四、区分度计算公式:1. 题目区分度:用来衡量题目对不同水平群体的区分能力。
公式:题目区分度指数= (高分组正确率-低分组正确率)/ (1-低分组正确率)2. 试卷区分度:用来衡量整个测试工具对不同水平群体的区分能力。
公式:试卷区分度指数= ∑题目区分度指数/ 题目数以上是常见的信度、效度、难度和区分度计算公式,可以根据具体情况选择使用。
试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K 为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(PH +PL)/2(PH、PL分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
(二)区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。
试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(P H+P L)/2(P H、P L分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
(二)区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。
试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K 为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(PH +PL)/2(PH、PL分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
(二)区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。
什么是试题的难度、信度、区分度、区分度一.试题的难度(一)什么是难度难度是指试题的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
(二)难度的计算1.单个选择题目的难度计算单个选择题的难度通常以通过率表示,即以答对或通过该题目的人数占考生人数的百分比表示。
计算公式为:P=R/N.其中P代表题目的通过率,R为答对或通过该题目的人数,N为全体考生人数。
P值越大,题目难度越小,答对人数越多。
2.单个非选择题目的难度计算此类题目考试结果不是只有答对或答错两种,而是具有从满分到零分之间多种结果。
计算公式为:P= X/W.其中P为难度,X为考生在某一题目上的平均得分,W为该题目的满分。
3.整个试题的难度计算(常用)计算公式为:P= X/W.其中P为难度,X为样本平均得分,W为试卷总分。
如满分150分的试题,考生平均得分108分,则难度为108/150=0.72如考生人数太多时,可先将考生总分从高到低排列,然后将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生的难度值,然后求它们的平均值即可。
(三)试题难度的一般要求就高考来说,难度以适中为宜,单个试题的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
一般将难度值大于和等于0.7的试题定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试题定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2,一般说来,容易题、难度系数为0.95-0.75,中档题为0.74-0.6,难题为0.59-0.20。
二.试题的区分度(一)什么是区分度区分度是指考试题目对考生心理特征的区分能力。
区分度高的试题能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
山东教师招聘网教学测验中的信度、效度、难度和区分度
编制教学测验必须在信度、效度、难度和区分度四个指标上达到一定要求,即起码达到有效、可信,具有一定难度和区分度。
很多考生在这四个概念的理解上有些混淆,结合例子帮助大家梳理一下:
1.信度与效度:信度指的是测验结果一致、分数稳定。
比如今天用一套试卷测试小明的成绩是80分,一个星期后再用来测小明还是考80分,那么这套测验的信度就是高的。
效度指的是测验工具能够真实地测出所要测量的事物的程度。
比如老师想要测量学生的英语口语水平,但是拿了一套笔试试卷让学生作答,那么这套试题的效度就是低的;再如一个数学测验试题的文字难度太大,超过学生自身水平,那么这套测验试题的效度是低的,没有测出想要测的学生数学水平。
信度与效度可以简单的概括为“两斤白糖”,两斤是信度,白糖是效度。
如果测出来的是一斤半或者是两厘米,那就说明信度有问题。
如果测出来的是盐巴或者大米,不是我们想要的白糖,那就是效度的问题。
2.难度与区分度:难度指测验的难易程度,难度值P=答对人数/总人数×100%。
比如全班总人数为30人,一道数学应用题只有6个人答对了,那么这道测验题目的难度值=20%,P值越大难度越小,P
值越小难度越大。
区分度用来鉴别不同水平的学生,高水平者得高分,低水平者得低分。
考生在备考这个知识点的时候,只需要把这四个概念理解清楚、做好区分即可。
此外,更抽象一点的关系是:信度是效度的必要条件,即高信度不一定高效度,但高效度必定高信度。
更多教师资格证备考信息关注山东教师招聘考试网。
试卷分析:信度、效度、难度和区分度附件6、难度、区分度、信度和效度的一般说明一、难度难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。
一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。
1、难度的两种定义1)P=1-x/w其中:x为某题得分的平均分数,w为该题的满分。
这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为,最大值为1.2)P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为,最大值为1.2、难度的计算1)主观性试题的难度A、基本公式法:P=1-x/wB、极端分组法P=1-(XH+XL)/2W其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)。
2)客观性试题的难度A、基本公式法:P=1-R/N其中:R为答对人数,N为全体人数。
B极度分组法:P=1-(PH+PL)/2其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n为总人数的前27%。
PL=RL/n叫低分组通过率,RL为低分组答对人数。
二、区分度区分度是区分应试者本领水平高低的目标。
试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分。
而区分度低则反映不出不同应试者的水平差异。
试题的区分度与试题的难度直接相关。
通常来说,中等难度的试题区分度较大。
另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。
1、区分度指标的评价1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。
一般认为,区分度指数高于0.3,试题即可以被承受。
2、区分度的计算方法1)基本公式法:D=(H-L)/N其中:D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和。
试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K 为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(PH +PL)/2(PH、PL分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
(二)区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。
信度、效度、难度、区分度之间有何不同?衡量测验质量的四个指标,即信度、效度、难度、区分度,在考试中通常以客观题的形式出现,具体来说主要包括概念反选、例子反选题或判断题。
而一直以来由于知识内容有一定的相似性和关联度,考生们常常区分不清产生混淆。
因此,为了帮助考生们解决这一问题,我们就一同来梳理一下该知识点。
信度是指测验结果的稳定性或可靠性,即某一测验在多次进行后所得到的分数的稳定、一致程度。
它即包括在时间上的一致性,也包括内容和不同评分这之间的一致性。
如,在不同时间测两次相同的试卷,如果成绩基本相当,那么我们就认为测验的信度较高。
效度是指测量的正确性,即一个测验能够策略出其索要测量的东西的程度,也就是我们常说的准确度。
故而通常效度考虑的问题是:测验测量什么?测验对测量目标的策略精确性和真实性有多大?就一个测验的优劣而言,效度是一个比信度更为重要的指标。
如,我想测量初一年级的数学成绩,但是给他们做了一套小学四年纪的数学试卷,此时不能测量出我原本想要测量的东西,我们认为测验的效度不高。
难度是指测验包含的试题难易程度。
一般来说,难度可以用:“P(通过率)=通过人数/总人数”的公式来表示,可见P(通过率)值越低难度越大,两者间呈反比关系。
区分度是指测验对考生的不同水平能够区分的程度,即具有区分不同水平考生的能力。
如,一次测验之后,能够明确分清不同学生的水平,我们就认为该测验的区分度较高。
在我们明确了这四个指标的含义之后,我们会发现这四个指标都是用来衡量测验质量高低的,那么它们之间有没有什么关系呢?那当然是有的,四个指标之间既有联系又有区别,考生们既要能够区分有得了解他们之间的相互影响关系:首先是区别,重点在于信度与效度之间的区别,要明确信度是衡量测验的可信程度而非试题内容的质量,因而才会运用多次测验的方式;而效度是衡量测验的有效程度更加注重试题内容的有效性,是评价试题是否能达到预期效果。
因此,我们认为在衡量测验本身质量时,效度是比信度更重要的指标。
试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K 为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(P H+P L)/2(P H、PL分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
试卷的难度、区分度、信度和效度一.试卷的难度一什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标.一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大.客观题难度计算公式:P难度指数=试卷答对人数/考生人数;主观题难度计算公式:P =试卷平均得分/试卷满分.试卷难度计算公式:P=为平均分,K为试卷满分值.易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高.一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度.二难度的计算1客观性试卷难度P这时也称通过率计算公式:P=k/Nk为答对该题的人数,N为参加测验的总人数2主观性试卷难度P计算公式:P=X/MX为试卷平均得分;M为试卷满分3适用于主、客观试卷的计算公式:P=PH +PL/2PH、PL分别为试卷针对高分组和低分组考生的难度值步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算.三试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳.一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题.命题时难度一般要按一定比例分配,如3:6:1或3:5:2.二.试卷的区分度一什么是区分度区分度是指考试卷目对考生心理特征的区分能力.区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分.区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低.二区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度又叫鉴别指数.计算公式为:D=P H -P L .P H 和P L 分别为高分组和低分组的通过率.2.整个试卷的区分度计算常用计算公式为:D=2X H —X L /W,其中D 为试卷区分度,X H 为27%高分组平均分,X L 为27%低分组平均分,W 为试卷总分.一般也将全体考生总分从高到低排列,将总分最高的27%的考生定为高分组,总分最低的27%考生定为低分组,再分别计算各组的平均分.三试卷区分度的一般要求区分度D 的取值范围介于-1.00至+1.00之间.通常D 为正值,称为积极区分;D 为负值称为消极区分;D 值为0称为无区分作用.具有积极区分作用的试卷,其D 值越大,区分的效果越好.试卷的区分度在0.4以上表明此题的区分度很好,0.3~0.39表明此题的区分度较好,0.2~0.29表明此题的区分度不太好需要修改,0.19以下表明此题的区分度不好应淘汰,高考的区分度一般要求在0.3以上.三.试卷的信度信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分数的一致性和稳定性程度.信度除了要说明成绩的真实性之外,还要说明题目涉及的内容与教学的相关程度.信度系数愈高即表示该测验的结果愈一致、稳定与可靠.系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性.反之,随机误差可能导致不致性,从而降低信度.信度可以定义为随机误差R 影响测量值的程度.如果R=0,就认为测量是完全可信的,信度最高.信度主要是指测量结果的可靠性、一致性和稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征.和信度相关的一个概念是,信度是效度的前提条件.信度只受随机误差的影响,随机误差越大,信度越低.因此,信度可以视为测试结果受随机误差影响的程度.系统误差产生恒定效应,不影响信度.四.试卷的效度效度是指考试有效性或正确性的质量指标,即是否考了要考的内容,试卷难度、区分度是否适宜,考试最终是否达到了它的预定目的等.测试效度testvalidity 亦称测试的有效性,指一套测试对应该测试的内容所测的程度.也就是说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容.测试的效度一般可分为以下几类:1表面效度facevalidity.指测试应达到的卷面标准,即一套测试卷从表面看来是否是合适的.例如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度.表面效度是测试出受试者正常水平的一种保证因素.2内容效度contentvalidity.指测试卷是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表性和覆盖面的程度.3编制效度constructvalidity.指测试卷的诸项目对编制该测试所依据的理论的各个基本方面的反映程度.4经验效度empiricalvalidity.经验效度是一种衡量测试有效性的量度,通过把一次测试与一个或多个标准尺度相对照而得出.一般来说,对某次测试的效度进行检验时,除了要根据教学大纲的要求和观念有效性的理论对试卷的内容进行考查以外,还须采用计算相关系数的定量方法,即计算出本次试卷与另一份已被确定能正确反映受试者水平的试卷之间的相关系数.系数高则有效性大.课堂测试的效度应在0.4-0.7之间,规模较大的测试其效度应在0.7以上.五、高考题的信度、效度、难度和区分度高考的性质最主要的在两个方面:首先、高考是一种选拔性考试,高考成绩是高等学校录取新生的依据,这是高考的选拔性质.其次、高考是一种导向性考试,高考是中学教学的指挥棒,起着对中学教学的引导作用,这是高考的引导性质.高考性质的这两方面决定了高考试卷应有的信度、效度、难度和区分度,而这些是我们进行高考复习首先要清楚的,能够避免我们在复习时的盲目.。
试卷的难度、区分度、信度和效度
一.试卷的难度
(一)什么是难度
难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算
(1)客观性试卷难度P(这时也称通过率)计算公式:
P=k/N(k为答对该题的人数,N为参加测验的总人数)
(2)主观性试卷难度P计算公式:
P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:
P=(P H+P L)/2(P H、P L分别为试卷针对高分组和低分组考生的难度值)
步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求
就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度
(一)什么是区分度
区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
(二)区分度的计算
1.单个选择题目区分度的计算
将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。
计算公式为:D=P H-P L. P H和P L分别为高分组和低分组的通过率。
2.整个试卷的区分度计算(常用)
计算公式为:D=2(X H—X L)/W,其中D为试卷区分度,X H为27%高分组平均分,X L为27%低分组平均分,W 为试卷总分。
一般也将全体考生总分从高到低排列,将总分最高的27%的考生定为高分组,总分最低的27%考生定为低分组,再分别计算各组的平均分。
(三)试卷区分度的一般要求
区分度(D)的取值范围介于-1.00至+1.00之间。
通常D为正值,称为积极区分;D为负值称为消极区
分;D值为0称为无区分作用。
具有积极区分作用的试卷,其D值越大,区分的效果越好。
试卷的区分度在0.4以上表明此题的区分度很好,0.3~0.39表明此题的区分度较好,0.2~0.29表明此题的区分度不太好需要修改,0.19以下表明此题的区分度不好应淘汰,高考的区分度一般要求在
0.3以上。
三.试卷的信度
信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分数的一致性和稳定性程度。
信度除了要说明成绩的真实性之外,还要说明题目涉及的内容与教学的相关程度。
信度系数愈高即表示该测验的结果愈一致、稳定与可靠。
系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。
反之,随机误差可能导致不致性,从而降低信度。
信度可以定义为随机误差R影响测量值的程度。
如果R=0,就认为测量是完全可信的,信度最高。
信度主要是指测量结果的可靠性、一致性和稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征。
和信度相关的一个概念是,信度是效度的前提条件。
信度只受随机误差的影响,随机误差越大,信度越低。
因此,信度可以视为测试结果受随机误差影响的程度。
系统误差产生恒定效应,不影响信度。
四.试卷的效度
效度是指考试有效性或正确性的质量指标,即是否考了要考的内容,试卷难度、区分度是否适宜,考试最终是否达到了它的预定目的等。
测试效度(test validity)亦称测试的有效性,指一套测试对应该测试的内容所测的程度。
也就是
说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。
测试的效度一般可分为以下几类:
1)表面效度(face validity)。
指测试应达到的卷面标准,即一套测试卷从表面看来是否是合适的。
例如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度。
表面效度是测试出受试者正常水平的一种保证因素。
2)内容效度(content validity)。
指测试卷是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表性和覆盖面的程度。
3)编制效度(construct validity)。
指测试卷的诸项目对编制该测试所依据的理论的各个基本方面的反映程度。
4)经验效度(empirical validity)。
经验效度是一种衡量测试有效性的量度,通过把一次测试与一个或多个标准尺度相对照而得出。
一般来说,对某次测试的效度进行检验时,除了要根据教学大纲的要求和观念有效性的理论对试卷的内容进行考查以外,还须采用计算相关系数的定量方法,即计算出本次试卷与另一份已被确定能正确反映受试者水平的试卷之间的相关系数。
系数高则有效性大。
课堂测试的效度应在0.4-0.7之间,规模较大的测试其效度应在0.7以上。
五、高考题的信度、效度、难度和区分度
高考的性质最主要的在两个方面:首先、高考是一种选拔性考试,高考成绩是高等学校录取新生的依据,这是高考的选拔性质。
其次、高考是一种导向性考试,高考是中学教学的指挥棒,起着对中学教学的
引导作用,这是高考的引导性质。
高考性质的这两方面决定了高考试卷应有的信度、效度、难度和区分度,而这些是我们进行高考复习首先要清楚的,能够避免我们在复习时的盲目。