编制测验的一般程序
- 格式:docx
- 大小:231.62 KB
- 文档页数:10
测验编制的一般程序1、测验编制的一般程序:测验项目的分析(测验的对象、用途和目标)、测量的编写(搜集资料、命题原则和编制要领)、测验的编排和组织(合成测验、测验的预试、信度与效度的考察、常模制订、编写指导手册)。
2、测验的目标的三种情况:工作分析;对特定概念下定义;确定测验的具体内容。
3、搜集资料题目的来源:已出版的标准测验、理论和专家的经验、临床观察和记录。
4、命题原则内容方面:符合测试目的;内容取样有代表性;题目之间的内容相互独立。
文字方面:使用准确的当代语言;语句简明扼要;最好使一句话说明一个概念。
理解方面:题目内容不要超出受测团体知识水平和推理能力;题目不可令人费解。
社会敏感性方面:假定受测者具有某种行为;命题时假定规范不一致;指出该行为虽违规,但常见。
5、选择题的编制要领:题干所提的问题必须准确,尽量使用简单词语;选项切忌冗长,要简明扼要;每道题只给一个正确答案,其他属诱答;各选项长度应相等,尽量不要有长有短;避免题干用词与选项和词一致;选项最好用同一形式。
6、是非题的编制要领:内容以有意义概念、事实或基本原则为基础,不要照抄原文;每道题只能包含一个概念;尽量避免否定的叙述,最好直接采用肯定的叙述;表达意见的题目,最好说明意见的来源和根据;是非题的数目应有适当比例,基本相等,且要随机排列。
7、简答题的编制要领:最好采用问句形式;如果是填充形式,空格不宜太对;每道题应只有一个正确答案,且答案要简短而具体。
8、操作题的编制要领:明确所要测量的目标,并将其操作化;尽量选择逼真度较高的项目;指导语简明扼要;制订评分标准,确定记分方法。
9、测题的排列:并列直进式和混合螺旋式。
第七节心理测验的使用1、主测者的资格:在技术上要求具备一定的知识结构、心理测验专业理论和相应的专业技能;在道德上要求恪守职业道德,测验保密与控制使用和隐私保护。
2、测验选择:适合测量的目的和符合心理测量学要求。
3、测验前的准备工作:预告测验、准备测验材料、熟悉测验指导语、熟悉测验的具体程序。
级别:先知成绩测验的编制2004年9月12日成绩测验的编制一般按以下程序进行:(一)确定测验目的编制测验,首先要明确测验目的,不同的测验目的决定不同的测验种类和题型。
评价学生对一门学科是否达到了教学大纲的基本要求,可以采取团体笔试的方式;进行诸如高考一类的选拔式的考试,可采用建立常模的标准化考试;检查学生学科知识的掌握,理解能力、判断能力和推理能力的发展可以选用客观性试题;考核学生的材料组织能力,则宜选用非客观性的试题。
确定了测评的目的,才能确定测验的形式和试题的类型。
(二)明确测验的范围和内容测验的内容是教学内容的抽样,全面地反映教学内容。
当测验的目的确定后,首先考虑的是测验要测什么,测到什么程度即测验的范围和内容,这时既要考虑使测验所要测量的知识、技能和能力有所反映(涉及到教学目标),又要划定测验的内容(涉及到测验内容的覆盖面、代表性),还要确定各部分测验内容的权重和分值(涉及到各部分内容所占的比重)。
这些工作以前主要是依据对教学大纲和教科书的理解来构思,现在很多教师都在尝试用“双向细目表”的方法来进行设计。
所谓“双向细目表”,实际上就是教材内容和学习结果两个维度,其中一维反映教学的内容,另一维反映学生的学习水平。
目前在“学习水平”这一维,普遍采用布卢姆等人关于认知领域教育目标的分类,即把学习结果或认知水平分为“知识、理解、应用、分析、综合、评价”六种水平。
教材内容这一维则根据具体学科内容加以确定。
表以小学自然常识测验的双向细目表为例作一说明。
表9-1小学自然常识测验编题双向细目表知识理解应用分析综合评价合计生物世界3 5 6 3 2 1 2 0资源利用2 3 3 1 1 0 1 0动力机械 2 3 4 2 0 1 1 2物质、能量5 6 8 3 2 1 2 5气象 2 4 3 2 2 0 1 3宇宙 2 5 4 1 0 0 1 2地球2 2 2 1 1 0 8合计18 28 30 13 8 3 100上表有三点要说明:(1)学科教材内容即知识目标,一般按教材的章节记入,但必须是讲述过或要求学生自学并列入考试范围的内容。
测验编制的一般程序考试试题及答案解析一、单选题(本大题7小题.每题1.0分,共7.0分。
请从以下每一道考题下面备选答案中选择一个最佳答案,并在答题卡上将相应题号的相应字母所属的方框涂黑。
)第1题在编制测验过程中,目标分析的主要目的是( )。
A 确定测验的对象B 拟定测验的计划C 确定测验的用途D 确定测验的具体内容【正确答案】:D【本题分数】:1.0分【答案解析】[解析] 目标分析是指对测验目标加以分析,将其目标转换成可操作的术语。
即确定测验的具体内容的过程。
第2题测验编制的一般程序不一定需要( )。
A 测验的目标分析B 测验的编写C 制定常模D 测验的编排和组织【正确答案】:C【本题分数】:1.0分【答案解析】[解析] 按照参照标准的不同,测验可以分为常模参照测验和目标参照测验。
制定常模是常模参照测验的程序,但目标参照测验则不需要制定常模。
第3题在拟定测验编制计划时,通常需要制定一个( )。
A 单向细目表B 双向细目表C 三向细目表D 四向细目表【正确答案】:B【本题分数】:1.0分【答案解析】[解析] 拟定测验编制计划通常就是制定双向细目表的过程。
双向细目表是一个由测量的内容材料维度和行为目标维度所构成的表格,它能帮助测验的编制者决定应该选择哪些方面的题目以及各题目所占的比例。
第4题编制简答题的原则不包括( )。
A 将其操作化B 宜用问句形式C 填充形式的空格不宜太多D 每题应只有一个正确答案【正确答案】:A【本题分数】:1.0分【答案解析】[解析] 操作化是编制操作题的原则之一。
第5题心理测验的目标是指编制的测验是测什么的,即用来测量什么样的( )或行为特征。
A 心理对象B 心理用途C 心理动机D 心理变量【正确答案】:D。
测验编制步骤:8步1、目得、对象2、确定结构、确定测验结构,①根据理论、智力测验有几个因素;人格特质,一个特质就是一个维度。
②因子分析,大致有个设想,初步构思,先就是探索,验证,样本不一样,好得测验要做几次。
首先检查共同度,低于0、5或0、3得题目去除,与其她项目之间得共同成分。
认知能力有两种,斯皮尔曼理论。
G因素与S因素,好得0、5以上。
碎石图拐点因素负荷,各因子负荷分数,能区分、旋转后也不能把负荷集中,去掉、如两个因子上都就是0。
4,结构不明确,某一题目属于谁不确定、题目多时做验证性因素分析A、首先做单维检验,一个维度属于一个ξ,如12道题,B、4个一加,4个一加,原始分相加,变成三个指标,指标太少,验证性因素分析做不出来。
项目超过100个,旋转不出来,探索性因素分析旋转不出来。
③分配权重:30分常识60分词汇满分相差很大,通过转换成量表分,变成Z分,转换成量表10分制。
麦卡锡幼儿量表分多得每个维度转换成30分左右。
有得分测验重要得,权重较大。
3、记分方法4、常模:用到什么地方,抽样如何抽A、一种瞧成就是正态分布,知道S与就可以。
转化为Z分。
B、非正态数据,根据常模样本频数分布确定,累积百分数,您得分数一边就是分数,以下就是百分之多少。
累积百分比算出来了,某一分数对应P,累积百分率多少。
根据常模样本确定每一点得累积百分数。
常模样本分数分布,例如:艾森克一般T20~80分最多90分,一般做到80分艾森克远远超出80分,偏态、5、设计项目:数据与资料,与测验相关理论、相关测验。
A、很多测验相互参考,很多人格测验用MMPI题目,有些就是参考,有些就是搬过来,16PF没有效度量表,187道题,有些被试在人才招聘时都选好得答案,用其它测验效度量表加进去,MMPI或艾森克测谎量表,20个题目,分散开,统计时就是单独一个量表。
题目量要大,准备用50道,编100道,最好多一倍,有得就是1:1、5,至少要多1/2得题目,便于淘汰。
一、确定测验目的一)测量对象在编制测验前首先要明确测量对象,也就是该测验编成后要用于何种团体。
惟独对受测者的年龄、智力水平、文化背景以及阅读水平等做到心中有数,编制测验时才干有的放矢。
二)测量目标所编的测验用来测量什么,是测能力、人格,还是学业成就,也是必须首先考虑的问题。
非但要明确测量的目标,还要对测量目标加以分析,将此目标转换成可操作的术语,即将目标具体化。
如美国著名测验学家瑟斯顿通过因素分析,将智力分解为七种基本心理能力:语文理解──阅读时了解文字意义的能力;语词流畅──正确迅速拼字与敏捷联想词义的能力;数字运算──正确而迅速使用数字解答算术问题的能力;空间关系──运用感觉器官及知觉经验正确判断空间方位及各种关系的能力;机械记忆──用重复感知的方法记住事物的能力;知觉速度──迅速而正确地观察与辨别事物的能力;普通推理──根据已知条件推出新判断的能力。
瑟斯顿根据上述七种因素于年编成为了“基本心理能力测验”。
三)测验用途所编出的测验是要对被试做描述,还是做诊断,抑或者是选拔和预示,这一点也是在测验编制前就应明确的。
目的不同,编制测验时的取材范围以及试题难度等也不尽相同。
二、拟定编制计划编制计划,实际上就是对测验的总体设计,指出测验的内容结构和项目形式等,以及对每一个内容、目标的相对重视程度。
不同的测验有不同的编制计划。
例如成就测验的编制计划通常是一张双维细目表,其中一个维度是内容,就是某一学科教材中的各个课题,另一维度是在教学中要达到的行为目标。
美国心理学家布卢姆最早提出教育目标的分类问题。
他把学习的心理活动分成认知、精神运动和情感三个领域,又把认知领域具体分为知识、理解、应用、分析、综合、评价六个层次。
在布卢姆等人编的《教育目标的分类》一书中,为每个认知层次提供了许多题目范例。
后来人们普通就依据布鲁姆的认知性行为目标编拟学科试题,以测量学生的学习结果。
表是一个小学高年级自然常识测验的编制计划。
表中的数字代表每一类题目所占的百分比,这些比例反映着每一个内容及目标的相对重要性。
测验计划有两个用途。
①在编制阶段,测验计划指出应该编多少和编哪些种类的项目;项目编好后,可将项目的实际分布情况与测验计划对照,以确定测验项目是否恰当地代表了所要测量的领域,核对重要方面的内容是否有遗漏。
②在记分时可按表中百分比确定每类项目的分数。
三、设计测试项目一)搜集有关资料测验计划编好后,就要搜集有关资料作为设计项目的依据。
一个测验的好坏和测验材料的选择适当与否有密切关系,为此要注意以下几个问题。
资料要丰富制人格测验,搜集的资料应包括:人格的主要理论,用于描述人格的术语,临床观察的资料,以及其他人格测验的项目等。
资料要有普遍性所选择的材料对测验对象要尽可能公平,即被试都有相等的学习机会。
譬如,编制标准化的学科成就测验时,要以统一的教学大纲和统编教材作为题目来源,不能只考虑个别教师的意见,要考虑大多数教师和专家的意见。
在编制智力测验时则要尽量避免特殊知识经验和文化水平的影响。
二) 选择项目形式测验编制者还必须确定测验内容的表现方式,是纸笔测验还是操作测验;是只要被试认出正确答案,还是需要他自己做出正确答案。
在大多数情况下,任何内容都可以用几种形式呈现,问题是如何选择“最优的”表现方式。
在一个测验中,可以采用一种题型,也可以采用几种题型。
在选择项目形式时,要考虑以下几点。
测验的目的和材料的性质如果要考查学生对概念和原理的记忆,宜用简答题;要考查对事物的辨别和判断的能力,宜用选择题;要考查综合运用知识的能力,宜用论文题。
接受测验的团体的特点如对幼儿宜用口头测验,对于文盲或者识字不多的人不宜采用要求读和写的项目,而对有言语缺陷的人如聋哑、口吃则要尽量采用操作项目。
各种实际因素譬如,当被试人数过多,测验时间和经费又有限时,宜用选择题进行团体纸笔测验,而人数少,时间充裕,又有某些实验仪器和设备时,则可用操作测验。
廖世承、陈鹤琴先生几十年前曾经提出以下几条选择测验形式的原则:使被试者容易明了测验做法;在做测验时不会弄错;做法简明、省时;计分省时省力;经济。
三) 编写和修订项目制订项目的过程包括写出、编辑、预试和修改等一系列过程。
在获得一个令人满意的项目之前,这些步骤是不断重复的。
在这个过程中,编制者和有关方面专家要对项目反复审查修订,改正意义不明确的词语,取销一些重复的和不合用的项目。
然后将初步选定的项目汇集起来组成一个豫备测验。
编写项目要注意以下几个问题:①项目的范围要与测验计划相一致;②项目的数量要比最后所需的数目多一倍至几倍,以备筛选和编制复本;③项目的难度必须符合测验目的的需要;④项目的说明必须清晰。
四、项目的试测和分析初步筛选出的项目虽然在内容和形式上符合要求,但是否具有适当的难度与鉴别作用,必须通过实践来检验,也就是要通过预测进行项目分析,为进一步筛选项目提供客观依据。
一) 试测项目性能之优劣,不能仅凭测验编制者主观臆测来决定,必须将初步筛选出的项目组合成一种或者几种豫备测验,经过实际的试测而获得客观性资料。
预测应注意以下几个问题。
①预测对象应取自将来正式测验准备应用的群体。
例如,对于一个成就测验来说,进行预测的学生必须和以后的测验对象属于同一个年级,并且具有相同的课程背景,取样时应注意其代表性,人数不必太多,亦不可过少。
②预测的实施过程与情境应力求与将来正式测试时的情况相近似。
③预测的时限可稍宽一些,最好使每一个被试都能将项目做完,以搜集较充分的反应资料,使统计分析的结果更为可靠。
④在预测过程中,应随时记录被试的反应情形,如在不同时限内普通被试所完成的题数、题意不清之处及其他有关问题。
预测的目的在于获得被试对项目如何反应的资料,它既能提供哪些项目意义不清、容易引起误解等质量方面的信息,又能提供关于项目好坏的数量指标,而且通过预测还可以发现一些原来想不到的情况,如检验时限多长合适,在施测过程中还有哪些条件需要进一步控制等。
二) 项目分析对项目的分析包括质的分析和量的分析两个方面。
前者是从内容取样的适当性、题目的思想性以及表达是否清晰等方面加以分析,后者是对预测结果进行统计分析,确定项目的难度、区分度、备选答案的适宜性等。
编制一套测验,只依据一次预测的结果所作的项目分析是不够的。
由于预测的被试样本可能会有取样误差,故由此得到的项目分析结果未必彻底可靠。
为了检验所选出的项目的性能是否真正符合要求,有时需选取来自同一总体的另一样本再测一次,并根据结果进行第二次项目分析,看两次分析结果是否一致。
如果某个项目的测试结果先后相差较大,说明该项目的性能值得怀疑。
这种在两个独立样本中进行项目分析的过程叫做复核。
五、合成测验经过试测和项目分析,对各个项目的性能已有可靠的资料作为评价的根据,下一步就可以选出性能优良的项目,加以适当的编排,组合成测验。
一) 项目的选择在选择项目时,非但要考虑项目分析所提供的资料,还要考虑测验的目的、性质与功能。
最好的项目,就是只测定所需要的特征,并能对该特征加以有效区分的难度合适的项目。
普通说来,项目的区分度越高越好,这是选择项目的一条重要标准。
特殊是对于选拔测验,此标准尤其重要。
选择项目的另一个指标是难度。
难度多大为合适并无一个绝对标准,而要根据测验目的来确定。
有的要求难一些,有的则要求容易一些,有的可不考虑难度。
就是同一张试卷,题目难度也可以不同,只要整个测验的难度分布符合要求即可。
根据项目分析资料选出的项目,还要与测验计划再次对照,看看材料内容以及所测量的行为目标是否与计划相符,必要时加以适当调整。
此外项目的数量还必须适合于所限定的时间。
二) 项目的编排项目选出之后,必须根据测验的目的与性质,并考虑被试作答时的心理反应,加以合理安排。
在测验开头应该有一两个十分容易的项目,以使被试熟悉作答程序,解除紧张情绪,建立信心,进入测验情境。
对项目的总的编排原则是由易到难,这样可以避免被试在难题上担搁时间太多,而影响对后面问题的解答。
在测验最后可有少数难度较大的项目,以测出被试的最高水平。
下面是两种常见的罗列方式。
并列直进式此种方式是将整个测验按项目内容或者形式分为若干分测验,属同一分测验的项目,则依其难度由易到难罗列。
混合螺旋式此种方式是先将各类项目依难度分成若干不同的层次,再将不同性质的项目予以组合,作交叉式的罗列,其难度则渐次上升。
此种罗列的优点是,被试对各类项目循序作答,从而维持作答的兴趣。
三)编造复本为增加实际的效用,一种测验有时需要有两个以上的等值型,称做复本,复本越多,使用起来愈便利。
例如,我们要用测验来考察一班学生在一学期中的进步,必须测量两次,一次在开学初,一次在学期末,两次结果的差别代表一学期中成绩的提高。
如果测验惟独一份,用两次就难免有练习的影响,两次测验结果的差异不能彻底代表进步的大小。
要是这个测验有几个复本替换使用,就可以免掉这种艰难。
测验的各份复本必须等值,所谓等值需符合下列几个条件:①各份测验测量的是同一种心理特质;②各份测验包含相同的内容范围,但题目不应有重复;③各份测验题型相同,题目数量相等,并且有大体相同的难度分布。
只要有足够数量的题目,编造复本的手续是很简单的。
先将所有合用的题目按难度罗列,其次序为、、、、、……如果要分成两个等值的测验本,可采用下面的分法:本:、、、、、、、、、……本:、、、、、、、、、……如果要分成三个等值的测验本,可采用下面的分法:A本:、、、、、、、……B本:、、、、、、、……C本:、、、、、、、……采用上面的分法可使复本之间在难度上基本相等,从而获得大体相同的分数分布。
复本编好后,应该再试测一次,以判定各本究竟是否等值。
六、测验使用的标准化一套好的题目并不一定是一个好的测验。
对于测验的基本要求是准确、可靠。
为了减少误差,就要控制无关因素对测验目的的影响。
这个控制的过程,称做标准化,包括测验编制的标准化和测验使用的标准化两方面。
制作过程的标准化可保证量具本身符合要求,而使用过程的标准化可保证操作规范,使用得当。
测验使用的标准化又可分为施测过程标准化、评分计分标准化、分数解释标准化三个环节。
(一)施测过程尽管对于所有的被试使用了相同的题目,如果在施测时各行其是,所得的分数便不能进行比较。
为了使测验条件相同,必须有统一的指导语和时间限制。
指导语给被试的指导语属于测验刺激的一部份,它的内容通常包括对测验目的的说明和被试应该如何反应的指示包括如何选择反应、记录反应以及时限等。
对于纸笔测验来说,这些指示普通印在测验的开始部份,也可以印在此外一张纸上。
要求简单明确,不引起误解。
如果题目形式对被试是生疏的,还应该有一些例题。
指导语会直接影响被试的反应态度与方法。
有人以不同的指导语对几组被试实施同一个能力测验,结果表明,将该测验说成“智力测验”的一组,成绩较高;将该测验说成“日常测验”的一组,成绩较低。