基于项目反应理论的大学英语分级测试试题分析
- 格式:doc
- 大小:14.50 KB
- 文档页数:3
大学英语试题分布分析及答案一、听力理解(共20分)1. A) 4. C) 7. B) 10. A)2. B) 5. A) 8. C) 11. B)3. C) 6. B) 9. A) 12. C)二、阅读理解(共30分)13. D) 14. B) 15. A) 16. D) 17. C) 18. B) 19. A) 20. C) 21. B) 22. D) 23. C) 24. A) 25. B) 26. D) 27. A) 28. C) 29. D) 30. A) 31. B) 32. C) 33. A) 34. D) 35. B)三、词汇与结构(共20分)36. had been 37. that 38. to 39. where 40. which41. has been 42. what 43. on 44. it 45. how46. to 47. was 48. in 49. to 50. as四、完形填空(共15分)51. C) 52. B) 53. A) 54. D) 55. C) 56. B) 57. A) 58. D) 59. C) 60. B)61. D) 62. A) 63. B) 64. C) 65. A)五、翻译(共15分)66. 他不仅是一位伟大的科学家,而且是一位杰出的作家。
67. 由于天气恶劣,我们不得不推迟了出发。
68. 他没有意识到自己的错误,这让我们感到惊讶。
69. 她决定放弃工作,去国外学习。
70. 这个项目的成功归功于团队的共同努力。
【试题分析】一、听力理解本部分考查学生对英语听力材料的理解能力。
共20题,每题1分,满分20分。
包括短对话、长对话和短文理解三种题型。
1. 短对话:共10题,每题1分。
主要考查学生对日常英语对话的理解能力。
通过听对话,学生需要从四个选项中选择正确答案。
2. 长对话:共5题,每题1分。
主要考查学生对较长英语对话的理解能力。
通过听对话,学生需要从四个选项中选择正确答案。
①项目反应理论在大学英语词汇试题质量分析中的应用———基于等组设计的研究王天剑(贵州财经大学 外语学院,贵州 贵阳 550025) 摘要:基于项目反应理论中的等组等值原理,对贵州省某高校一次大学英语课程考试中的A、B试卷词汇题进行等值和质量分析。
研究数据包括235份试卷的答题结果,其中A卷120份,B卷115份。
采用软件SPSS 15和BILOGMG3.3进行数据分析。
结果显示,两套试卷的词汇题总体上区别度较高,猜测度较低,信息总量较高,但试题有些偏难,个别项目区别度和信息量不符合测量要求。
研究结果对试题质量评价具有一定启示。
关键词:项目反应理论;等组等值;词汇;分析中图分类号:G44文献标识码:A文章编号1009-1513-(2020)02-0068-05一、引言及文献综述在很多高校,大学英语是公共基础必修课,考试频繁且参加人数众多。
传统考试一般采用统一试卷,但随着通讯技术发展,作弊越来越容易。
为防范作弊,不少考试同时采用多种平行试卷(如A 卷、B卷、C卷等)。
但是,平行试卷在参数上容易出现差别,参数的差别,会导致不同试卷考生成绩无法比较。
本研究采用项目反应理论(IRT)的等值原理,对同一次考试平行试卷上的词汇题进行参数和质量分析IRT也称潜特质理论或潜特质模型,是一种关于建模的理论。
它借助一种单调上升的项目特征函数,描述个人在教育心理测量中的表现,与潜特质(某种能力)、项目参数(难度、区别度和猜测度)等变量之间的关系(Umobong,2017)[1]。
IRT于上世纪50与60年代萌芽于国外,从70年代至今,一直在应用中发展。
该理论的产生与经典测量理论(CTT)的局限性有关(Guler等,2014;Kohli等, 2015;Awopeju等2016)[2-4]。
在CTT框架下,个人能力估计对项目具有依赖性,项目难度估计对考生样本具有依赖性。
在特定条件满足时,IRT可以通过校准算法,使项目难度估计不受样本影响,个人能力估计不受试题影响(Kean等,2014;Yu等, 2014)[5,6]。
英语学科能力及其表现研究王蔷;胡亚琳【摘要】提升学生的英语学科能力是发展学生核心素养的关键所在.基于"学习理解、应用实践、迁移创新"的导向,解构英语学科能力的九大关键要素,建立英语学科能力表现指标体系,并利用项目反应理论下的Rasch模型开发了学科能力测试工具,应用于L市十年级学生大规模抽样测试,经过数据分析划分出五个层次的学生能力表现水平.研究表明,学生英语学科关键能力各要素的发展水平差异显著,揭示了学生学科能力的薄弱项,为诊断英语教学的问题提供了丰富、细致的实证依据.此外,L市十个区的学生学科能力表现水平分布不均衡现象明显,间接反映出区际间教育质量的差异.【期刊名称】《教育学报》【年(卷),期】2017(013)002【总页数】10页(P61-70)【关键词】英语学科能力;核心素养;能力表现;Rasch模型【作者】王蔷;胡亚琳【作者单位】北京师范大学未来教育高精尖创新中心外国语言文学学院,北京100875;北京师范大学未来教育高精尖创新中心外国语言文学学院,北京 100875【正文语种】中文【中图分类】G633.5当前,我国基础教育课程改革迈入全面深化阶段,新时代背景下的学校教育正面临着发展学生核心素养、落实立德树人根本任务的重大挑战。
核心素养,即学生应具备的适应终身发展和社会发展需要的必备品格与关键能力;研究构建学生发展核心素养体系,既要厘清相关品格、能力等构成要素,也应明确学生在完成不同学段、不同年级、不同学科的学习内容后应该达到的表现水平。
[1]学科能力,作为学生智力、能力与特定学科有机结合的产物,[2]正是其核心素养的关键能力在特定学科中的具体体现。
可见,学生发展核心素养的关键之一在于提升学科能力,围绕学生核心素养的研究与实践亟待在相应学段具体学科的教育教学中构建能够细化落地的能力表现指标体系。
我国基础教育英语课程自第八次课改起,以培养学生的综合语言运用能力为总体目标,力求推动英语教育从“知识本位”向“能力本位”转变,15年来取得了显著成绩,但也暴露出一些问题:传统教学理念尚未得到根本转变,教师关注教仍多于关注学;内容教学多呈碎片化状态,缺乏整合,难以促成学生能力的系统发展;忽视对主题情境的创设和对主题意义的深层探究,导致学生思维培养缺失等。
基于项目反应理论的题库构建及其有效性检验*——以“现代教育技术”公共课为例王玥常淑娟[通讯作者]韩晓玲陆宏(山东师范大学教育学部,山东济南250014)摘要:题库是考试实践中不可或缺的要素,如何构建具有良好试题内容和试题参数的题库一直是教育评价领域关注的焦点。
文章以师范生的“现代教育技术”公共课为例,通过探讨基于项目反应理论的题库构建,论述了试题编制的原则、试题的等值设计、试题参数的估计方法以及如何利用信息函数进行题库质量的评价。
最后,文章指出了题库构建中尚存的不足和未来研究方向。
关键词:项目反应理论;题库;“现代教育技术”公共课;IRT模型;试题编制【中图分类号】G40-057 【文献标识码】A 【论文编号】1009—8097(2019)10—0041—07 【DOI】10.3969/j.issn.1009-8097.2019.10.006题库是指按照一定的教育测量理论在计算机系统中实现某个学科试题的集合,是严格遵循教育测量理论,在精确的数学模型基础上建立起来的教育测量工具[1]。
《国家中长期教育改革和发展规划纲要(2010-2020年)》明确提出,要“完善国家考试科目试题库”[2]。
在考试的实践化操作中,无论是计算机智能化组卷,还是计算机自适应测验,都离不开题库,题库对心理与教育测量的进一步科学化、现代化起到了极大的推动作用。
一国内外相关研究20世纪60年代中期,英国首先使用“题库”(Item Bank)一词。
20世纪末期,国外开始由专门的研究机构负责题库的建设,如美国教育考试服务中心(Educational Testing Service,ETS)、美国大学入学考试(American College Test,ACT)、英国剑桥评价(Cambridge Assessment,CA)等。
在这些机构里,题库不仅是试题的管理平台,而且是命题过程的平台,涉及题目编辑、试测、计算试题参数、等值、参数检验、统计学检验等一系列过程[3]。
英语四级真题试卷解析English: The English CET-4 exam is a test designed to assess the English proficiency of college students in China. It consists of four sections: listening, reading, writing, and translation. The listening section includes various short dialogues and longer passages to test students' ability to comprehend spoken English. The reading section typically includes multiple-choice questions, cloze tests, and reading comprehension passages to evaluate students' reading comprehension skills. The writing section usually requires students to write short essays on given topics to demonstrate their ability to express ideas clearly and coherently in English. The translation section tests students' ability to accurately translate between Chinese and English, assessing their understanding of both languages' grammar and vocabulary. Overall, the English CET-4 exam aims to assess students' overall English language proficiency and their ability to effectively communicate in English.中文翻译: 英语四级考试是一项旨在评估中国大学生英语水平的考试。
高等学校英语应用能力考试B级试卷分析与答题技巧高等学校英语应用能力考试B级试卷分析与答题技巧:无论参加什么样的考试,掌握考试的题型和答题技巧都是非常必要的。
考生要在日常的英语学习中加强基础知识的积累和词汇量的扩充,同时扩大知识面,提高综合运用语言的能力。
考生做到有备而考,这样才能在考试中取得理想成绩。
一、综述全国高等学校英语应用能力考试(Practical English Test for Colleges,简称PRETCO)是教育部批准实施的面向高职高专层次全国性教学考试,本考试以《高职高专教育英语课程教学基本要求》(以下简称《基本要求》)为依据,既测试语言知识,又测试语言技能;既测试一般性语言内容,又测试与涉外业务有关的应用性内容。
考试分为A级和B级,A级覆盖《基本要求》的全部内容,需要掌握3400个英语单词,以及由这些词构成的常用词组;B级要求略低,需要掌握2500个英语单词,以及由这些单词构成的常用词组。
由于此种考试的权威性,及其注重考查学生对英语的实际应用能力,很多高等职业院校以此作为检测学生在校的2—3年的间内英语学习的水平和灵活应用的程度。
现把其中的B级试卷作为例子,将此种考试的试卷分析和答题技巧进行分析和总结。
二、试卷分析全国高等学校英语应用能力考试(B级)目的是考核考生的语言知识、语言技能和使用英语处理有关一般业务和涉外交际的基本能力,其性质是教学—水平考试。
考试方式为笔试,包括五个部分:听力理解、语汇用法和语法结构、阅读理解、翻译(英译汉)和写作(或汉译英)。
考试范围限于《基本要求》B级所规定的全部内容。
1.测试项目、内容、题型与时间分配。
第一部分:听力理解(Listening Comprehensive)。
测试考生理解所听问题并作出恰当回答的能力、理解简短对话的能力和听写词语的能力。
听力材料的语速为每分钟100词。
听力材料以日常交际和简单的业务交际内容为主。
词汇限于《基本要求》的“词汇表”中B级2500词的范围,交际内容涉及《基本要求》中的“交际范围表”所列的B级规定的范围。
基于项目反应理论的大学英语分级测试试题分析
作者:何立新
来源:《文理导航》2013年第21期
【摘要】本文以项目反应理论为依据,运用BILOG-MG V3.0分析软件对大学英语分级测试的试题(项目)进行了分析研究,通过标刻难度、区分度、能力参数等各项目参数,为科学建立大学英语分级测试题库提供数据,奠定基础。
【关键词】大学英语;分级测试;项目反应理论;试题分析
一、引言
大学英语教学是高等教育的一个有机组成部分,大学英语课程是大学生的一门必修的基础课程。
大学英语实行分级教学不仅体现了《大学英语课程教学要求》“分类指导,因材施教”的原则,对于整体提高大学英语教学质量也起到了积极促进作用。
因此,大学英语试题建设显得尤为重要。
试题是题库建设的最基本元素,它的优劣直接影响大学英语试题题库的质量。
所以,建立起对大学英语试题的科学完整的评价体系十分必要。
二、理论研究
客观、准确地评价大学英语试题,科学的对其进行分析。
其关键点在于要有科学的理论依据。
在教育心理测量领域中,应用比较多的有经典测验理论和项目反应理论。
经典测验理论(简称CTT)是最早的也是最实用的测验理论。
也称为真分数理论,即被试的真分数是观测分数(或说测量实得分数)的数学期望值。
真分数模型是以弱假设为基础的,即这些假设很容易验证并易被大多数测验数据资料所满足。
经典测验理论的假设内涵主要是以真实分数模式为理论架构,依据弱势假设,使用简单,可操作性强,应用较广。
基于经典测验理论统计分析得到的各项指标,依赖于特定的被试样本,所求得的参数会受到不同样本组能力水平的影响。
经典测验理论无法建立考生得分与测验题目参数之间的函数关系,即考生能力的估计会由于测验的改变而改变。
项目反应理论(简称IRT)是建立在潜在特质理论的基础上的。
其主要观点是:在认知测验中,潜在特质指所要测的内在能力。
定量地估计个体在每一种特质上的位置是心理测量的任务。
反之,也可用所估计到的特质的量去预测和解释个体在相应情境中将会产生的行为反应。
项目反应理论的最大特点是它找到了一条题目特征曲线(简称ICC)并且以多种数学表达式(即数学模型)来描述它和逼近它。
不同的数学模型对曲线有不同程度的逼近,也含有个数
不同的参数。
题目特征曲线的数学模型一般都包含两方面的参数:(1)对测验题目的特征进行刻画的题目参数;(2)对考生的特征进行刻画的潜在特质或称能力参数。
根据这些参数值,我们可以对题目质量作出评价,可按需要选取高质量的题目。
又可以预言考生个体在任一测验题目上的反应,从而估计出考生个体的各种潜在特质的量数,即考生完成测验题目时所具有的能力或特质。
从理论上说,有效地解决了经典测验理论中无法建立考生得分与测验题目参数之间的函数关系问题。
项目反应理论的优势表现在:题目难易度的估计不因样本不同而不同。
项目反应理论的题目参数估计是独立于考生样本组的。
考生能力的估计不因测验的改变而改变。
项目反应理论在提供题目参数的同时,提供了每一个考生在完成题目时的能力参数。
测量误差的估计因考生程度不同而不同。
为多种形式测验的实施提供了更为完美的理论和方法。
在题目分析和估计学生能力的同时,可以得到题目信息函数和测验信息函数两个统计量。
所以,本文尝试用项目反应理论来对大学英语分级测试试题进行分析研究,探讨每个具体英语分级试题(项目)能否客观准确地反应出学生的真实能力水平。
进而发现命制英语分级试题的规律和标准,为更好地开展大学英语分级教学提供切实可行的方法。
三、实验研究
本研究选取的实验对象来源于某大学2010级的大学英语分级测试试题。
研究人员运用BILOG-W分析软件对试题进行项目反应分析。
此分析内容包括试题的难度、区分度、项目以及能力参数的估计,对试题的难度进行标定,分为难中易三个等级。
参与实际测试的是2010级2534名学生参加的大学英语分级考试。
我们从中随机抽取样本容量为200的被试者数据并通过项目反应理论中的BILOG-MG V3.0软件对作答结果的分析来对分级考试中试题进行分析和分类。
BILOG软件运用期望后验法(EAP)和贝叶斯(Bayes)估计法进行考生的能力估计。
试题总容量为86,均采用0、1计分法。
其中合格数为75,10道试题通过分析被列为不合格试题,75道试题的平均难度为6.16。
本文对试题分为难、中、易三个程度。
难度值区间为(0,10),从试题难度平均值来看难题较多,适合作为分级考试的试题。
同时试题的平均区分度为0.5112,能够较好的区分被试者的能力水平。
所有项目都在相应的能力区域产生一定的信息量。
四、结论
以上研究结果表明只有经过科学、客观的分析和筛选的试题才能真正反映出学生的能力特征和能力差异,才能为下一步建立大学英语分级测试题库奠定坚实的基础,进而促进大学英语教学,使学生能力得到全面发展。
【参考文献】
[1]何立新.英语语言测试理论与应用[M].北京:中国社会出版社,2005.12
[2]教育部高等教育司.大学英语课程教学要求[M].外语教学与研究出版社,2007:1
[3]于向英.教育测量与统计[M].郑州:郑州大学出版社,2004.1
[4]张权.语言测试中的项目分析与等值技术[M].北京:高等教育出版社,2004:2
[5]朱靖华.基于项目反应理论的计算机自适应考试系统的研究[D].长沙:湖南大学,2008。