项目反应理论在计算机自适应测试中的应用

格式：pdf
大小：235.12 KB
文档页数：2

下载文档原格式

项目反应理论在计算机自适应题库建设中的应用

一
测验开始
个题目进行测试，直到用户的能力值趋于稳定。程序流程学生能力值采用最大似然估计法来进行估算，是采用牛
● 是
／
＼
见图３。
首次测试？根据历史记录确定能力初值
顿迭代法求出能力参数。虑到运算量和运算时间的因素，考迭代次数限定为３０次，后的能力值＋—ｏ＜００，前ｌｋ．１则迭０
是否满足终止条件？
ｃ２ｃ＋［ｏ［ｏ（［［ｏ－）（－［ｏ）（－）／／－［ｏｃ，］ｊ＝ｊａ，ｌａ，ｕｉｃ，］ｐＰｐｃ，１ｐ／Ｐ（ｃ，［ｏ）２ｉｉ］］ｉｉ１Ｐ１ｉ１ｉ；
ｌ
ｌ笙型
ｌ
设，且过于理想化，导致了它存在一些重大缺陷：如真分数和观测分数之间存在线性关系不符合事实、被试者能力值的估计严重依赖于试题的难度、项目统计量严重依赖于被试样本等。为了克服以上这些缺陷，现代测量理论引进了项目反应理论，并且越来越多的用在各种考试系统中。项目反应理论又称潜在特质理论或项目特征曲线，它假设被试者有一种潜在特质，这种潜在特质可以
）
３结束语
在本题库中，选题的策略采取的是最大信息量（ｉｅ信息函数）的方法。采取这种方法的好处就是Ｆｓｒｈ被试者的能力值估计最为准确。但是它过于依赖区分度日的大小，ａ值值越大，试题被抽出的概率也就越大，当试题库系统经过一段时间的运行就会造成某些题目的曝光率过高。这不仅造成了题库的使用效率下降，同时对题目的保密性也造成了很大的威胁。为了解决曝光率的问题，今后可以考虑将题库按照ａ的值

[心理测验]IRT理论（ItemResponseTheory）

IRT理论（Item Response Theory）IRT理论概述IRT理论即项目反应理论(Item Response Theory, IRT)，又称题目反应理论、潜在特质理论（Item Response Theory）是一系列心理统计学模型的总称。

IRT是用来分析考试成绩或者问卷调查数据的数学模型。

这些模型的目标是来确定的潜在心理特征(latent trait）是否可以通过测试题被反应出来，以及测试题和被测试者之间的互动关系。

目前广泛应用在心理和教育测量领域。

项目反应理论的意义在于可以指导项目筛选和测验编制。

项目反应理论假设被试有一种“潜在特质”，潜在特质是在观察分析测验反应基础上提出的一种统计构想，在测验中，潜在特质一般是指潜在的能力，并经常用测验总分作为这种潜力的估算。

项目反应理论认为被试在测验项目的反应和成绩与他们的潜在特质有特殊的关系。

通过项目反应理论建立的项目参数具有恒久性的特点，意味着不同测量量表的分数可以统一。

项目反应理论通过项目反应曲线综合各种项目分析的资料，使我们综合直观地看出项目难度、鉴别度等项目分析的特征，从而起到指导项目筛选和编制测验比较分数等作用。

项目反应理论的特点(1)独立性。

被试特质水平不依赖于被试样本的代表性；被试水平参数不依赖于测验项目组；项目特征参数不依赖于所测被试组的参数不变测验项目组。

(2)项目理论中被试水平和项目难度可以直接比较；(3)正视了测量误差和项目性能是否与被试水平相关这一事实；(4)提供了计算机化自适应测验这一策略；(5) 从计量学角度提出了自己的新观点与新技术。

历史发展IRT理论发端于20世纪50年代，它同时被丹麦统计学家Georg Rasch和美国心理统计学家Frederic M. Lord在各自的国家发展起来。

尽管采取的研究方法不同，但是他们的结果却非常相似。

F. Lord在1951年从普林斯顿大学毕业时的博士论文《A Theory of Test Scores》被认为是IRT 理论的开端之作。

计算机自适应考试系统分析与设计

内阻三、形成思路ｌ明确电路设计基本原则。－
解析：第一步，根据题意的要求要测量的是电阻的阻值，所提供的器材既有伏特表又有安培表，是电源电动势只有３约为伏特但Ｖ，表量程的１，差太大，以确定测电阻的方案为安安法；／误５所第二步，由于电流表Ａ，内阻已知，考虑可以用来测电得
２１１目反应理论的概念．．项项目反应理论是在针对经典测量理论的局限性的基础上提出来的。目反应理论又称为潜在特质理论。在特质是指项潜被试某种相对比较稳定的、配其对应的测验作出反应．使支并反应表现出一致性的内在特征 …。特质（力）项目（题）能和试是项目反应理论的核心概念。项目反应理论认为被试对某项目的正确反映概率与其能力之间遵循一定的函数关系．这样的函数关系可以用项目反应模型来表示。２１２目反应模型．．项在众多的项目反应模型中．具代表性的是伯恩鲍姆提最
Ｃ电压表Ｖ（程１Ｖ，阻约为１Ｋｆ）．量５内０￣
图１４
Ｄ电阻箱Ｒ（值为０９９．ｎ）．阻－９９９Ｅ电阻箱Ｒ（．，阻值范围为０９９ —９．Ｑ）Ｆ滑动变阻器Ｒ（大阻值为１Ｑ）．最０Ｇ滑动变阻器Ｒ（大阻值为ｌ０１．最Ｏ（）Ｈ电源Ｅ电动势３最大允许电流２０．（Ｖ，０ｍＡ）Ｉ刀单掷开关Ｓ导线若干．单、（）果让你设计测量电ＭＲ阻值的实验电路，求电表１如要的读数从零开始变化，选择合适的元件，答题卷相应的方请在框中画出电路图．求图中的元件用题中相应的字母标注出来。要

《计算机基础》自适应计算机辅助考试系统的设计

发挥教师与计算机媒体技术的双重作
用．找到教师与计算机多媒体技术的最佳结合点．以实现教学目标。上完每堂
课，师都应该从授课情况、生理解接教学
操纵机器，像播音员一样坐在电脑前播
分析试卷利用计算机的计算功能，以根据试卷的统计可数据，算考试的有关指标，行试卷分析。计算的指标一般包计进习题答案制作成网页．为网站资源的组作成部分．帮助学生学习。此系统具有两以大功能：１提供《程图学习题集》点、（）工重难点习题详细解答的动态过程；２为《（）工程图学习题集》点、点习题提供 “ 维重难三模型 ” 在线帮助。系统利用网页制作工的
（）体功能一总
目前主要应用于《算机基础》考试练习，自动阅卷，时计课能及反馈结果。不但可以节省大量的人力，高评卷的效率和准确提
性，且可以使学生及时纠错。而
积极性最高，验效度也就最好。基于这样的考虑．算机自适测计
应测验应运而生。自适应计算机辅助考试系统利用高速、效、高
难度、分度等）试题，效区的有

基于项目反应理论的Web考试系统的研究

ＺＮｉ－ｎＥＧＱｎｓｇｇｏ
（Ｐｌｅｈｉ，ａ孕伽５１８，ｈａｎⅡ ｏｔｎＱｌｈ１４３Ｃｉ）ｙｃｃｎｎＡｓ￣：ｈａｅｔｄｃｓｔｅｓｏｓｅｒＩＴｉｄｔｌａａｚｓｔｐｃｆｎｏｔｓ幽ｂｔｒＴｉｐｐｒｎｏｕｅｅｉｍｒｐｎｅｔｏｙ（Ｒ）ｅｉｎｌｅｅａｈａｏｆｈ唧ｓｉｒｈｔｅｈｎａ．ｙｈｐｉｉｉｃｍｕｒｅａａｔｅｎｏｐｔｉｄｐｖｅｚｉ
维普资讯
２０年第８０６期
曾青松：于项目基反应理论的Ｗｂｅ考试系统的研究
维普资讯
２０Ｏ６年第８期
文章编号：０－４５２０）８０１－３１６２７（０６０－０６００
计算机与现代化ＪＵＮＩＹＸＡＤＩＵＩＡＪＳＵＩＮＡＨＡ
总第１２３期
基于项目反应理论的Ｗｅｂ考试系统的研究
ｔｓ８ｅｌｓｔｅｓｕｔｒｎｈｔｏｏｏｙ０ｅｉｎｎｂｅａｎｔｎｓｓｍ．Ｉｆｕｅｎｄｓｕｓｎｆｏｅａｅｉｎｔｎｅｔ，ｗｌａｔｃｕｅａｄｔｅｍｅｄｌｇｆｄｓｇｉｇＷｅｘｍｉａｉｙｔｓｈｒｈｏｅｔｏｓｓｏｉｃｓｉｓｏｖｒｌｄｓａｏｃｏｌｇｉ
ａｄｓｖｒｐｒａｈｓｆｅｉｔｓｒｍｄｔａｅｎｅａａｐｃｅ、ｌｅｆａｂｓ．ｅｌｏ０，ｇｉｍｏＩａ
Ｋｅｒｓｉｍｓｏｓｅｒ；Ｗｅｘｍｉａｏ；ｋｏｌｄｅｄｔａｅｏｕｅｄｐｉｅｔｓｙｗｏｄ：ｔｒｐｎｅｔｏｙｅｅｈｂｅａｎｔｎｎｗｅｇａｂｓ；ｃｍｐｔｒａａｔｔｉａｖｅ

基于项目反应理论的计算机自适应题库系统IRTCABS的研究

中国科学技术大学博士学位论文基于项目反应理论的计算机自适应题库系统IRT-CABS的研究姓名：***申请学位级别：博士专业：信号与信息处理指导教师：***20040801摘要摘要近年来，项目反应理论（ＩｔｅｍＲｅｓｐｏｎｓｅＴｈｅｏｒｙ，简称ＩＲＴ）是心理与教育测量非常活跃的研究领域，并正迅速成为主要的测量理论之一。

项目反应理论是在批评经典测量理论（ＣｌａｓｓｉｃａｌＴｅｓｔＴｈｅｏｒｙ，简称ｃＴＴ）的局限性的基础上发展起来的，随着统计方法的完善和计算机的普及，项目反应理论很快被应用于各类大规模考试和计算机辅助测验（ｃｏｍｐｕｔｅｒｂａｓｅｄＴｅｓｔｉｎｇ，简称ｃＢＴ）。

尽管有坚实的理论基础，项目反应理论在具体实现应用中仍存在许多有待进一步研究和探讨的问题。

在以往的工作中，大部分的研究和应用都是基于经典测量理论的题库研究与实现。

本文首先分析了项目反应理论目前没有实用化的原因，较为系统地讨论了项目反应理论模型，探讨了它与经典测量理沦模型相区别的一些性质与独有的特性。

在实现算法上，本文研究了基于项目反应理论ＩＲＴ的组卷模型和组卷算法，并提出了一种基于自适应遗传算法的智能组卷算法，该算法利用遗传算法的思想，引用惩罚函数的方法自适应地调整适应度函数，不仅避免了遗传算法中经常出现的“早熟现象”，而且有效地解决了智能组卷中的约束优化问题，具有很好的性能和实用性。

本文探讨了ＩＲＴ智能组卷中包含半结构化或非结构化的决策问题，是…个复杂的建模过程，提出一个组卷决策支持系统，具有灵活的、动态的环境，帮助测验专家完成复杂的决策过程。

本文详细地探讨了基于ＩＲＴ智能组卷的模型管理系统（ＭＭＳ）的设计。

本文进一步研究构建了基于项目反应理论的计算机自适应题库系统，提出一种用整数规划方法来设计题库，使得白适应测验中的曝光问题得以充分解决，并且为自适应测验题库减少了编写题目的开销。

本文还研究建立计算机自适应题库系统中的评估模型，通过评估项目反应模型中的存在参数（能力参数和项目参数）进行估计以校准题库，该模型包括学生模型ｓＭ—ＢＩＮ、实例模型ＥＭ—ＢＩＮ和任务模型，可以评估学生在测验表现中知识的不确定性。

计算机自适应测验的测试流程与测试技术

研究与应用方面也有长足的进步，早在２纪８０世Ｏ
笔就可以进行，计算机自适应测验必须借助计算机
才能进行，这是计算机自适应测验的一个弱点，但随着计算机（特别是笔记本计算机）的广泛普及，这一弱点将被逐渐克服。相对于每一个考生来说，难度适中的试题才最
主要以经典测量理论为基础。（）２测量技术不同。由于测量理论基础不一样，这两类测验的项目分析、测
测验是教育测量与评价的主要手段。随着现代测量技术的发展，计算机自适应测验（ｏｐｔｉｄＣｍｕｒｅｅｚ
ＡｄｐｉｅｔＣＴ）作为一种新型的测验方式逐渐ａｔｅＴｓ，Ａｖ应用于教育测量与评价中。美国的许多大型入学和
年代后期，漆书青就进行了计算机自适应测验方面的早期尝试；１０年全国大学英语四六级考试也［０８１２初步尝试了计算机自适应测验；０２台湾地区国２０年民中学学生的基本学力测验开始采用计算机自适应测验的方式。本文详细介绍计算机自适应测验这种
新型测验方式的基本思想、试流程与测试技术。测（）算机自适应测验的基本概念、一计基本思想
目
Ｅ与技术 ● 论
鳆宙
垦与洋价
自适应测验（因材施测的测验方式）即织多次测验，考生
可根据自己的情况选择其中的一次或多次测验；４（）
是１０年Ｂｎｔ９８ｉ所编制的智力测验，ｅ即根据儿童的年龄来安排不同测验项目。０２世纪６年代末期，Ｏ美

项目反应理论与自适应测验学时

第五讲项目反应理论与自适应测验（4学时）一、教学目标1、能阐述经典测验理论的不足，以及项目反应理论发展和应用的背景。

2、掌握项目反应理论的基本原理。

①能解释逻辑斯蒂模型中被试能力参数与项目参数的物理意义以及两者间的关系。

②能阐述项目信息函数的定义及计算方法，会解释项目信息函数的物理意义。

③能运用一定的统计方法对被试能力参数和项目参数做出适当估计。

④能定性地表述项目反应理论的基本原理。

3、掌握基于项目反应理论的计算机自适应测验的实现方法。

①能说出一个典型的计算机自适应测验系统的基本构成及功能。

②能说明设计一个典型的计算机自适应测验系统需要解决的基本问题。

③学会运用自适应测验的基本流程和算法。

④能定性阐述自适应测验的优点。

4、了解项目反应理论和自适应测验的实际应用的情况。

二、教学方法与教学媒体1、教学方法：以讲授法为主，着重介绍项目反应理论的基本原理及其在自适应测验中应用的基本思路和方法。

本次课结束后，让学生在课后进行自适应测验系统设计实践，并写出设计报告，然后用1-2学时组织学生就项目反应理论实际应用中的相关问题进行讨论，以培养学生的实践能力。

2、教学媒体：用黑板与讲授同步地展示讲授的内容要点，用Microsoft Excel作为工具讨论项目反应模型及其相关参数的物理意义，用PowerPoint展示结束总结的内容要点和实践任务要求。

三、教学重点、难点重点：项目反应模型及参数估算方法；自适应测验的施测程序及算法。

难点：被试能力参数和项目参数的估算方法；项目信息函数的定义及意义。

四、教学内容与过程整个教学过程分为引入、展开、结束三个阶段进行。

（一）引入阶段：首先分析经典测验的局限性，由此引出如何提高测验的精度和效率的问题，在此基础上提出自适应测验的基本思路及其理论基础，从而引出本节课的学习内容。

然后以框图形式向学生预告本节课学习内容的基本结构和要求。

1、经典测验的局限性及自适应测验的提出经典测验的特点是：所有被试不论能力水平高低都使用相同的测试项目进行测试。

项目反应理论研究综述

苏昭刘燕
（江西科技学院信息工程学院，江西南昌３３００９８）
摘要：项目反应理论是一种现代心理与教育测量理论，在美国、英国等发达国家已被广泛而深入地运用于计算机化自适应测验之中。首先介绍了项目反应理论的核心概念；接着对项目反应理论模型进行了分类；然后对典型项目反应理论模型进行了精要论述；最后指出了当前项目反应理论研究的热点及趋势。关键词：潜在特质理论项目特征曲线项目反应理论模型计算机化自适应测验
它的物质存在。因此，称为潜在特质（ＬａｔｅｎｔＴｒａｉｔ）
正确反应概率Ｐ（）等于０．５时，所对应的潜在特质０值，而
心理测量学家致力于从测量学的角度探清其结构和性项目区分度ａ则为曲线在拐点ｂ处的切线斜率的函数，斜率质并使之数量化，然后希望能够测量个体在这些特质变量
中图分类号：ＴＰ８０２ｑ－．７
文献标识码：Ａ
文章编号：１２３（２０１３）０２－０４５－０４
１项目反应理论核心概念
为一个潜在分量。
１．２项目特征曲线
项目反应理论（ＩｔｅｍＲｅｓｐｏｎｓｅＴｈｅｏｒｙ，ＩＲＴ），也称项项目特征曲线（ＩｔｅｍＣｈａｒａｃｔｅｒｉｓｔｉｃＣｕｒｖｅ，ＩＣＣ）是指被

基于项目反应理论的计算机自适应测试研究

引入相应的物理量．
第３０卷第２期
Ｖｏ１．３０ＮＯ．２
周口师范学院学报
ＪｏｕｒｎａｌｏｆＺｈｏｕｋｏｕＮｏｒｍａｌＵｎｉｖｅｒｓｉｔｙ
２Ｏ１３年３月
Ｍａｒ．２０１３
基于项目反应理论的计算机自适应测试研究
某次测试的整体测量精度… 一测试信息函数
个项目？如何结束？
被试能力参数与项目参数的估算方法
图１自适应测试系统的关键过程
２项目反应模型
测试过程分三步：（１）给出测试项目（试题）；（２）测试者完成测试项目；（３）根据测试结果判断测试者能力．显然，测试结果与被试者的能力和测试
过程中的设计与考虑．
如何做到淘Ｉ试项目对被被试能力参数与项目参数的关系一一项目反应模型
试能力的自适应？
二二［
测试项目对被试能力的分辨能力一项目信息函数
一
如何开始？如何选择下
水平低的考生来说无法作答，难度小的题目对于水平高的考生测不出其真实水平，只有题目难度与考
述呢？这里可以建立相应的数学模型来描述三者的关系，即项目反应模型（ＩＲＴ）．ＩＲＴ反映了测试者实际能力与项目参数以及
理论之上的，在测验实施过程中自适应测试能够根据考生特点调节试题数量和难易程度，更好地反映

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

，
课程建设的逐步完善，对每门课程过程中所使用的特定被试组的；了时间。的考试必须规范化、系统化、科学（）当存在着测量相同特质２（）可比性强：２由于特定的实化和智能化。试题库在教学实践中的大的题库时，被试特质发展水平施方式与记分方式，ＣＴ终的分Ａ最
一
现代教育思想和教学手段的不断变优点如下：
革，计算机题库系统越来越受到重（１当存在大的被试总体行了测验的评分，两个过程合二为）视。随着教学的改革进一步深入和时，题目参数估计是独立于标准化且测验长度减少了，因此节约
测评的优点。
为项目（即每次选出的考题）的选择是根据被试的能力水平定身度量而成的，因而被试所做的每一个题目
的难度都是与其能力相匹配的。从试是在不限时的条件下进行的，如其测验思路中我们不难看出ＣＴＡ考
有两个独特的优势：是教学管理的估计就独立于所施测的试题组；一数可转化为可相互比较以及解释的上的，主要是试题库的高效、经（）能够提供每个被试能力量尺，因此可同时应用于常模参照３济、灵活和保密的特点；二是教育水平精确性的统计量；测验和标准参照测验。测量上的，主要表现在试题库能生（）用统计估计和与之相联４（）准确率高：过ＣＴ，３通Ａ￣验０成高质量、能预控和等值可比的试系的标准误差的概念来取代平行形得出的被试分数值可以反映出被试卷。依据这两个特点，在教学中引式的信度概念。
试的新突破。本文介绍了计算机自高能力和低能力被试的反应拟合适应测试的背景，以及项目反应理同一条项目特征函数曲线，同一论的特点，项目反应理论在自适应条ＩＣ对应的项目参数是唯一的Ｃ所考试系统中的应用、及自适应考试［］（）限时性，即ＩＴ求测２；４非Ｒ要
立起来的教育测量工具。二、项目反应理论的概述估计学受测者的能力，动态从题库
一
任务。另外在传统考试中容易出
中抽取符合受测者能力的题目进行现考生可以投机取巧的机会，也项目反应理论（Ｒ）四大测试。ＩＴ以存在人为干预行为，造成有些人只强假设为基础：（）１测试的潜在能三、项目反应理论在自适应考是为了考试而考试。通过ＣＴ可Ａ就力单维性，即ＩＴＪ的仅是被试试系统中的应用Ｒ￣试］以较客观地得出考试人的真正水１Ａ考试的优点、ＣＴ平，避免了传统考试带来的负面作格意义上的单维性，它所要求的单计算机化自适应测验的编制正用。因为目前ＣＴ统仍处于试验Ａ系维性是指所有影响被试反应的因素是ＩＴ论成功地获得重要应用的阶段中，人们正在进一步探索中。Ｒ理中只有１因子占主导地位，该因个个实际表现。ＣＴ一概念最早特别是一个ＣＴＡ这Ａ系统是否有效，很
关键词பைடு நூலகம்：项目反应理论；计算被试对某些项目未作反应，则可认试的众多优点：机自适应测试为是他的能力不足。（１）测验效率高：实践表
一
、
计算机自适应测试的背景
介绍随着计算机技术的飞速发展、
它的最大优点是：题目参数是明，ＣＴ，只需相当于纸笔测验Ａ￣验０不变的，即不因参考人员不同而造半的施测时问和约为４％的长０
一
成题目参数发生改变。具体说来，
度，便可达到与纸笔测验同样的精度。因为在测验实施过程的同时进
入了试题库。通常题库是按照一定建立在项目反映论基础上的自的实际水平。正因为ＣＴ以上优点，才越Ａ的
的教育测量理论，利用计算机技术适应考试和学习支持系统，跟踪学来越受到教育系统的重视，在当今在计算机系统中实现的某个学科题生的学习状况，帮助学生指定学习社会里人人都需要终身受教育，而目的集合，它是严格遵循教育测量和复习计划，能够不断的根据题目终身教育制度需要有自学习和自测理论，在精确的数学模型基础上建各方面的信息和受测者的答题情况验系统。ＣＴ统正好可以完成这Ａ系
ｘｌ
ｘｌｃ
Ａ
Ｍ
；
项目反应理论在计算机自适应测试中的应用
文 ◎ 王丹危韧勇（南大学软件学院中湖南长沙）
Ａ与摘要：项目反应理论ＩＴ（ｔｍ是说，Ｉ中的这些参数具有不变然不同。ＣＴ传统的测验相比，ＲＩｅＲＴＲｐｒｅｈｏＹ以强假设为基性，它们不随被试的样本而变化；ｅｏＴｅｒ）Ｓｔｓ测验思想也发生了巨大的变革：它础，具有经典测试理论（Ｔ）没（）ＣＴ所３同一项目的特征函数曲线（Ｃ）通过给每一个被试建立一个个人化Ｉｅ的测验来达到更为准确的测量。因有的众多优点，是计算机自适应测参数唯一性，即同一个测试项目，