难度与区分度分析 42页PPT文档
- 格式:ppt
- 大小:1.05 MB
- 文档页数:42
第三节难度和区分度一个测验的信度和效度在很大程度上取决于该测验的题目参数(难度和区分度),编制和筛选具有适当参数的题目是改善测验信度和效度的前提。
在通常情况下只要讨论常模参照测验中题目的难度和区分度。
一、难度受测团体中被试者在答案范围内回答题目的程度称为难度。
一般用难度指数p表示题目的难度。
1.题目难度的计算当题目的评分为多值时,受测者的得分可能是x(x=1,2,…,n,n为该题满分数)。
所谓难度指数(有时也称得分率),就是该题平由此可见,平均分越高,p值越大,题目的难度越小;平均分越低,p值越小,题目的难度越大。
当题目为二值评分(即0、1评分)时,上式可变形为其中,N是答题人数,R是答对人数。
这种难度指数也称为通过率,一般用于是非题或多项选择题。
由通过率可知,答对人数越多,p值越大,题目的难度越小;答对人数越少,p值越小,题目的难度越大。
形式为多选一的选择题有多个可能的答案供受测者选择。
选择正确答案的人数可能会受猜测机遇的影响,可供选择的答案越少,这种机遇的影响就越大。
对此,可以用公式对难度指数p进行校正。
其中,C是校正后的难度指数,p是校正前的难度指数,k是每个p题目可供选择的答案数。
2.题目难度的等距量表在进行测量时,用来表示一些对象和事件的某些特征的指标称作量表。
根据不同的单位和参照点,从低级到高级,从模糊到精确,可以用不同的量表表示。
用平均得分比率或答对人数比率表示难度,仅说明事物含有某种属性的多少,它是无相等单位,不具有等距性和可加性的顺序量表。
这种量表只能表示事物间的大小、次序关系,不能反映两个比率间的数量差异。
我们可以把这种量表转换成不仅有大小关系,而且有相等单位和规定参照点的等距量表,使其能表示题目之间难度差异的大小。
美国教育测验服务处(ETS)采用的难度指数为Δ=13+4Z,其中,Δ是正态化的等距难度指数,13是平均数,4是标准差,Z是标准正态曲线下的面积(即p值)所对应的值。
信度效度难度区分度分析在教育测量和评估领域,信度、效度、难度和区分度是四个非常重要的概念。
它们对于衡量测试的质量、评估学生的学习成果以及改进教学方法都具有至关重要的意义。
接下来,让我们逐一深入探讨这四个概念。
信度,简单来说,就是指测试结果的稳定性和可靠性。
如果我们对同一批学生在相同的条件下进行多次相同的测试,得到的结果应该是相近的。
就好比用同一把尺子去测量一个物体的长度,每次测量的结果都应该差不多。
信度主要包括重测信度、复本信度和内部一致性信度等。
重测信度是在不同时间对同一批被试进行重复测量。
比如,今天对一群学生进行了一次数学测验,一周后再用相同的测验对他们进行测试,如果两次测试的成绩相近,说明这个测验的重测信度较好。
然而,重测可能会受到记忆、练习等因素的影响。
复本信度则是使用两个平行的测验(即内容、形式、难度等方面都相似)对同一批被试进行测量。
如果两个测验的结果一致性高,就表明复本信度良好。
但要编制两个高质量的平行测验并非易事。
内部一致性信度通常通过计算测验内部各个项目之间的相关程度来衡量。
例如,一份试卷中的各个题目,如果它们在测量同一个知识点或能力方面表现出较高的一致性,那么这份试卷的内部一致性信度就比较高。
常用的计算方法有克朗巴赫α系数等。
效度是指测试能够准确测量出所要测量的东西的程度。
好比射箭要射中靶心,测验也要准确测量到我们期望测量的内容。
效度主要包括内容效度、结构效度和效标关联效度。
内容效度关注的是测验内容是否涵盖了所要考查的知识和技能范围。
比如,一场语文考试如果能够全面考查学生的字词、语法、阅读理解和写作能力,那么它在内容效度方面就表现较好。
为了确保内容效度,出题者需要对教学大纲和课程目标有清晰的理解。
结构效度考察的是测验是否能够反映出所假设的理论结构或心理特质。
比如,一个智力测验是否真正测量了智力的各个方面,而不仅仅是某些表面的表现。
这需要通过复杂的统计分析和理论研究来验证。
效标关联效度则是将测验结果与一个外在的标准进行比较。
难度和区分度以便考后对试题质量进行分析。
要求填写客观准确。
这样组卷的优点不仅在于对考题的能力有卷时发给同学填写。
填写时,让学生了解表2,所要求,避免了选题盲目性和随意性,更重要的即清楚试卷的能力分布。
然后填人自己解答情是它作为教学过程一个重要的窗口,可以有效况(详见表3说明)。
填此表的过程,也是学生地对教学进行监控。
自我能力了解的一个过程。
表3是学生数学试卷能力调查表,教师评在教育改革浪潮强有力的撞击下,必须进行改革!1999年的高考命题变知识立意为能力立意。
从考后综合情况分析,是一次成功的实践。
首先,它突出了能力的考查。
比如:第(1)题考查观察抽象、概括能力,第(5)题考查推理能力,第(18)题考查符号语言的转换能力,很多题目对创新意识、概括、推理以及语言转换进行考核,从结构上看,完全体现了能力体系。
就是(22)题应用题,也充分注重了阅读理解,分析提取,变实际问题为数学语言,然后通过概括整理,通过推理运算得到解决的能力考查。
九九高考命题以能力立意组卷,打破了传统命题方式的栓桔,为开拓学生的能力,迈出了非常可喜的一步。
二、数学能力的划分命题工作必须着眼于能力!这就对我们认识数学能力提出了较高的要求。
八十年代中期高考为走出高分低能的怪圈,响亮地提出了出活题、考能力、锐意进取的口号。
从那时起,对数学能力的探索、界定便纷纷出台,各种划分层出不穷。
譬如,有人把数学能分为:1、认识能力;2、思维能力;3、应用能力;4、现代能力。
而每一能力下又分为若干能力,如思维能力又分为:分析能力,判断能力,批判能力,创造能力四个方面。
现代能力划分为:社交能力、信息能力、竞争应变能力、审美鉴赏能力以及抗挫进取能力五个方面。
最有权威性的是数学教学大纲把能力分为1、运算能力;2、逻辑思维能力;3、空间想象能力;4、分析解决问题力〔‘1。
这些对能力的探索与界定,都是极富有见解的。
为了我们能较为准确地以能力立意进行数学命题,根据数学知识的特点,以及数学问题的能力界定,兼顾知识对能力的要求与解决问题所需要的能力,较为准确方便起见,我们把能力分为:1、运算能力;2、抽象能力;3、概括能力;4、推理能力;5、语言转换能力;6、空间想象能力这六个方面。
关于“难度”与“区分度”的一点解释前一阶段,在参加继续教育培训课程——《有效学业评价——思想品德命题问题诊断与分析》的交流时,几位老师谈到了衡量试卷质量的四个系数标准:难度、区分度、信度和效度。
这几个系数大多数同行应该在大学阶段都学习过,但因为使用频次过低,我真的说不清楚了,特别是对“难度”和“区分度”,我想很多同行可能与我有相同的感受。
在交流的当时,我感觉我们的思维多少都有点混乱。
那时那刻,我深深地感悟到:看了不一定会了,会了不一定得了,得了不一定永久了!这几天,特意查了查关于“难度”和“区分度”的资料,在此与同行们共享。
一、难度1.“难度系数”反映试题的难易程度,“难度系数”也可以理解成“容易度系数”。
2.难度一般用字母P表示,P越大表示试题越简单,P越小表示试题越难。
试题要有梯度,因此各试题的难度应有不同,这是命制试题时要加以特别考虑的。
一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度指数最好掌握在0.5左右,高于0.7和低于0.3的试题不能太多。
3.难度系数计算公式为:P=平均分÷满分值例:第1小题选择题满分是4分,全班50名学生中有20名学生答对,则第1小题的难度计算:平均分=4×20÷50=1.6,P=平均分÷满分值=1.6÷4=0.44.注意:(1)难度水平的确定是为了筛选题目。
平时测验难度要利于学生的学习,但一定的难度能增加区分度,这对全面了解、掌握学生学习情况有十分重要的作用。
(2)难度水平的确定要考虑及格率,防止损伤学困生的自尊心。
(3)难度水平的确定要考虑对分数分布的影响,一般以偏正态分布为前提,有时偏正态分布更能激发学生的学习积极性。
二、区分度1.区分度是指试题对被试者情况的分辨能力的大小,主要用于评价以选拔为目的的选题。
2.试卷区分度反映试题区分不同水平受试者的程度,即考出学生的不同水平,把优秀、一般、差三个层次的学生真正分别开。
关于“难度”与“区分度”的一点解释关于“难度”与“区分度”的一点解释前一阶段,在参加继续教育培训课程——《有效学业评价——思想品德命题问题诊断与分析》的交流时,几位老师谈到了衡量试卷质量的四个系数标准:难度、区分度、信度和效度。
这几个系数大多数同行应该在大学阶段都学习过,但因为使用频次过低,我真的说不清楚了,特别是对“难度”和“区分度”,我想很多同行可能与我有相同的感受。
在交流的当时,我感觉我们的思维多少都有点混乱。
那时那刻,我深深地感悟到:看了不一定会了,会了不一定得了,得了不一定永久了!这几天,特意查了查关于“难度”和“区分度”的资料,在此与同行们共享。
一、难度1.“难度系数”反映试题的难易程度,“难度系数”也可以理解成“容易度系数”。
2.难度一般用字母P表示,P越大表示试题越简单,P越小表示试题越难。
试题要有梯度,因此各试题的难度应有不同,这是命制试题时要加以特别考虑的。
一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度指数最好掌握在0.5左右,高于0.7和低于0.3的试题不能太多。
3.难度系数计算公式为:P=平均分÷满分值例:第1小题选择题满分是4分,全班50名学生中有20名学生答对,则第1小题的难度计算:平均分=4×20÷50=1.6,P=平均分÷满分值=1.6÷4=0.44.注意:(1)难度水平的确定是为了筛选题目。
平时测验难度要利于学生的学习,但一定的难度能增加区分度,这对全面了解、掌握学生学习情况有十分重要的作用。
(2)难度水平的确定要考虑及格率,防止损伤学困生的自尊心。
(3)难度水平的确定要考虑对分数分布的影响,一般以偏正态分布为前提,有时偏正态分布更能激发学生的学习积极性。
二、区分度1.区分度是指试题对被试者情况的分辨能力的大小,主要用于评价以选拔为目的的选题。
2.试卷区分度反映试题区分不同水平受试者的程度,即考出学生的不同水平,把优秀、一般、差三个层次的学生真正分别开。