智能试题库系统【开题报告】

  • 格式:doc
  • 大小:138.50 KB
  • 文档页数:7

下载文档原格式

  / 7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

毕业设计开题报告

计算机工程

智能试题库系统的设计与实现

一、选题的背景与意义

随着计算机技术的发展,计算机辅助教育作为一门新兴的综合学科,越来越受到广大教育工作者的重视。在计算机辅助教育的研究中,组卷算法是评价考试系统好坏的一个主要因素,一个良好的组卷算法对于准确地检验学生学习成绩和教师教学效果起着非常重要的作用。

组卷算法是按照一定的要求,由计算机自动地从试题库中选择试题,组成符合总分、总时间要求和试题题型、试题数量、知识点、难度等约束条件要求的试卷。由于组卷要求生成的试卷能最大程度地满足用户的不同需要,并具有随机性、合理性。

因此如何设计一个算法从试题库中既快又好地抽出一组最符合考试要求的试卷,是本文研究的目的。

本系统设计以减轻教师在出题、组卷、测试过程中的负担为目标, 帮助教师尽可能方便、快速、准确地按照教材大纲、教学方法和教学风格,组织和建立试题库,及根据不同测评面的要求,有效地生成有针对性的测评试卷。本系统出题方便、规范,能形成海量题库管理环境,并能通过随机组卷防止泄题和作弊,教师在短时间内可以按自己的要求完成一套考试组卷,在数秒以内可以完成一套试卷答案,节省了教师的时间。

目前的组卷算法大致可以分为三类:

1. 随机选取法:根据状态空间的控制指标,由计算机随机的抽取一道试题放入试题库,此过程不断重复,直到组卷完毕,或已无法从题库中抽取满足控制指标的试题为止。该方法结构简单,对于单道题的抽取运行速度较快,但是对于整个组卷过程来说组卷成功率低,即使组卷成功,花费时间也令人难以忍受。尤其是当题库中各状态类型平均出题量较低时,组卷往往以失败而告终。

2. 回溯试探法:这是将随机选取法产生的每一状态类型纪录下来,当搜索失败时释放上次纪录的状态类型,然后再依据一定的规律(正是这种规律破坏了选取试题的随机性)变换一种新的状态类型进行试探,通过不断的回溯试探直到试卷生成完毕或退回出发点为止,这种有条件的深度优先算法,对于状态类型和出题量都较少的题库系统而言,

组卷成功率较好,但是在实际到一个应用时发现这种算法对内存的占用量很大,程序结构相对比较复杂,而且选取试题缺乏随机性,组卷时间长,后两点是用户无法接受的,因此它也不是一种很好的用来自动组卷的算法。

3. 遗传算法:模拟自然界自然选择遗传机制进行搜索寻优的方法,通过模拟生物在染色体层面的各种遗传优化作用而设计人工寻优方法,GA本质上是一个群体迭代过程,从一个随机的初始群体出发,依据优胜劣汰原则.通过竞争、选择、繁衍、变异等遗传操作,产生性能更优的下一代群体。直到满足环境约束酌优良体或合乎具体的应用准则为止。

分析上述两种算法的优缺点,不难发现,在限制条件状态空间的控制下,随机选取法有时能够抽取出一组令用户满意的试题。只不过由于它随机选取试题的范围太大,无法确定目前条件下哪些区域能够抽取合适的试题,反而可能在那些已经证明是无法抽取合适试题的区域内反复选题,进行大量的无效操作进入死循环,最终导致组卷失败。回溯试探法组卷成功率高,但它是以牺牲大量的时间为代价的,对于现今越来越流行的考生网上随机即时调题的考试过程来说,它已不符合要求。因此,必须结合以上两种方法寻找一种新的改进算法,这种算法要具有全局寻优和收敛速度快的特点。遗传算法(Genetic Algorithms)以其具有自适应全局寻优和智能搜索技术,并且收敛性好的特性能很好的满足自动考试组卷的要求。

二、研究的基本内容与拟解决的主要问题:

研究的基本内容:

1,搭建一个基于web的基本构架。

2,完成登录界面,管理界面,出题界面。

3,完成与题库的数据库连接。找到合适的出题算法

4,出题要求满足用户的特殊要求。如试卷的增加删减,难度的选择,题型的选择等等。5,完成与嵌入word的接口。

拟解决的主要问题为:

1、建立基于web的智能组卷系统,如登录界面,管理界面,出题界面。寻找到最

合适的出题算法。

2、组卷要求实现个性化选择:如难度的选择,题型的选择,分数的设定,试卷的

增减等。

3、尝试完成组卷系统与Word相嵌入,实现试题与答案的排版。

三、研究的方法与技术路线:

1、本系统的功能:根据教师的要求,组成最接近要求的试卷。其中包括用户功能的管理,试卷的增减,试题的增减,答案的修改,难度分数的设置,重复利用率的设定等。系统基于Web,让教师可以随时登陆,且具有最新的试题库。

2、系统功能结构图如下:

3、试题库智能组卷的遗传算法:

(1)遗传算法的基本思想

大自然的生物进化中, 一个生物群体要经过交配、变异、自然选择的过程, 形成下一代群体, 如此循环下去, 不断进化, 最后生存下来的总是最优的。将这种思想运用到算法中去, 就形成了遗传算法, 它的基本结构可描述为:

随机初始化种群p ( 0) ={ x 1, x2,…, x n} ; t = 0;计算p ( 0) 中个体的适应值;

while( 不满足终止准则) do

{ 根据个体的适应值及选择策略从p ( t ) 中选择生成下一代的父体p ( t ) ;

执行杂交、变异和再来生成新的种群p ( t + 1) ;

计算p ( t + 1) 中个体的适应值;

t = t + 1}

在设计遗传算法时, 通常按以下步骤进行:

a 确定编码方案: 遗传算法求解问题, 一般不是直接在问题的解空间上, 而是利用解的某种编码表示。

b 确定适应函数: 适应值是对解的质量的一种度量, 解的适应值是演化过程中进行选择的依据。

c 选择策略的确定: 优胜劣汰的选择机制使得适应值好的解有较高的存活概率。

d 控制参数的选取: 控制参数主要包括种群规模, 算法执行的最大代数, 执行不同的遗传操作的概率及一些辅助性的控制参数。

e 算子的设计: 主要有杂交、变异和再生。

f 确定算法的终止准则。

(2)试题组成中相关因素及遗传算法

a相关因素

一套试卷的构成需要涉及很多因素, 试题的章节、题型、难度、区分度、时间等多个项目。在试卷中每一道试题包含着诸多属性, 其中与组卷有关的属性有如下6 项:

①章节: 试题内容所属的篇章。

②题型: 试题的题型, 一般有判断题、填空题、选择题、问答题、改错题、证明题、计算题等。

③难度系数: 教学内容按要求可分为3 个层次: 了解、熟悉、掌握。相应题目的难度系数:

NDXS = 1- ( 平均分/ 该题满分)

④区分度: 试题对考生的水平鉴别和区分程度的指标。

⑤分数: 该试题的分数。

⑥时间: 完成该题需要时间的估计值。

b 数学模型

一道试题是由上面所述的6个因素所决定的, 也就是一个6 维向量( x 1, x 2, …, x6) ( xi 是第i 个属性) 可以

确定一道试题, 对于一套有n 道试题的试卷, 实际上就是决定一个n 6 矩阵x 1, 1 x 1, 2 … x 1, 6

x 2, 1 x 2, 2 … x 2, 6

s= …………

xn, 1 xn, 2 … xn, 6

这是一个问题求解中的目标状态矩阵, 由上面的分析可以得出, 目标状态矩阵应满足如下约束条件:

①: NDXS( 难度系数) =∑

=

n

i1x i, 3/ 总分( 用户给出)

②: time ( 时间)= ∑

=

n

i1x i, 6( 用户给出)