语言测试的信度和效度及其关系
- 格式:doc
- 大小:24.50 KB
- 文档页数:9
试题设计的五个标准分别是:效度,信度,区分度,实用性,及影响。
一.效度是指测量的有效性,也就是看考试是否考查了想要考查的内容。
二.信度是指考试结果准确,稳定,可靠的程度。
这要求有不同的评卷人阅卷,所得分数大致相同;同一评卷人在不同的时间阅卷,分数大致相同。
三.区分度就是可以进行比较。
四.实用性是指要便于使用。
试题清晰,醒目,措辞简洁,避免拼法错误或遗漏,尽量少涉及各种器材设备。
五.影响分为积极和消极两种。
积极影响:帮助学生发现问题,积极督促。
消极影响:会造成考什么学什么的结果。
试题要体现新一轮基础教育课程改革的基本理念,落实《英语课程标准》所确立的考试指导思想。
考试要有利于全面贯彻国家教育方针,推进素质教育;有利于体现九年义务教育的性质,全面提高教育质量;有利于英语课程改革,提高英语教学质量, 培养学生的创新精神和实践能力,减轻学生过重的课业负担,促进学生生动活泼、主动学习。
英语试题要落实知识与能力、过程与方法、情感态度与价值观三维课程目标,要依据《英语课程标准》来确定考查内容和标准,既重视考查学生对英语基础知识与基本技能的掌握情况,更重视考查学生在具体情境中综合运用语言的能力,考试内容不应与任何教材的具体内容直接挂钩。
在试卷设计上要遵循教育测量的基本原理,坚持以交际语言测试为主,分离测试、综合测试等多种测试并存,力求在语篇层次上,在尽可能真实情景中,以互动的形式测试学生的综合语言运用能力;不仅要关注试卷信度,更要注重试卷的效度;在力求试卷结构简约的同时,确保考查内容的覆盖面,杜绝繁、偏、旧试题,科学控制题量和难度。
要坚持“以能力立意为主、知识立意为辅”的原则,根据语言实际使用情形命题,适当增大主观性、开放性试题的比重,尽可能避免命制以词或句为语言单位的试题,不应在脱离语境的情况下单独考查微观语言知识。
在选择语言素材时,要充分考虑学生的实际生活和身心发展水平、地域以及文化差异,选用真实、地道、形式多样的语言素材。
1、信度即测量结果的稳定性或可靠性,指用同一种方法对同一个对象进行重复测量,所得结果与之前测量结果相一致的程度,即测试方法不受随机误差干扰的程度。
包括同质性信度、分半信度、复本信度、重测信度、评分者信度等。
2、效度即准确性和真实性,指测量工具或手段能够准确测所需测量的事物的程度。
例如,某问卷调查医生的工作负荷,则效度指该问卷能否准确地、真实地调查出医生的工作负荷。
效度和研究目标有关。
包括内容效度、效标关联效度、结构效度等。
信度和效度的关系:
信度与效度见的关系并非对称的,其中信度是效度的前提和基础,效度是信度的目的和归宿。
任何测量,只有做到两者的辩证统一才会具有科学性。
信度是效度的基础。
测量要有效度必须有信度,没有信度就没有效度。
一项测量如果信度低,则效度也低,因为若测量不能稳定地测量所需测量的对象,就不能有效地说明测量对象;如果信度高,效度可能高也可能低。
一项测量如果效度高,则信度一定高;但是,如果效度低,信度可能高也可能低。
值得注意的是,信度与效度二者缺一则测量无效。
语言测试的信度与效度之间的关系
李翌豪
【期刊名称】《江苏师范大学学报:哲学社会科学版》
【年(卷),期】2016(042)005
【摘要】测试的信度和效度是用来衡量一门考试是否有效和可靠的两个关键因素,任何测试的开发与评估都应当把二者纳入到重点考虑范围之内。
然而,一些研究者
对于测试信度的定义往往过于理论化,甚至把其成立的基础建立在某些理想化的客
观条件之上;同时他们在测量信度时所采取的过于机械化的统计方法,也导致了其结
果不能准确地反映出试题的客观稳定性。
考虑到信度与效度之间不可避免的逆反关系,为了满足语言测试的首要目的,测试的开发者应当首先给予效度最大限度的重视。
由于“套题”中包含了复杂的“题内相关性”,所以它并不利于测试在数据上达到
令人信服的“可靠性系数”值;但如果以此为依据就盲目地将其排除在外,我们就忽
略了其在考查被测能力方面的作用,从而忽视了对测试整体效度的把握。
【总页数】5页(P88-92)
【作者】李翌豪
【作者单位】江苏师范大学外国语学院,江苏徐州221116
【正文语种】中文
【中图分类】H08
【相关文献】
1.论信度与效度关系下语言测试的取向
2.语言测试的信度与效度之间的关系
3.对外汉语听力题型和语言测试信度、效度的关系研究
4.语言测试信度、效度和医学英语题型关系研究
5.对外汉语听力题型和语言测试信度、效度的关系研究
因版权原因,仅展示原文概要,查看原文内容请购买。
信度和效度概念
信度是衡量测量工具的一个属性,指的是测量工具能够稳定且准确地测量同一现象的能力。
一个具有较高信度的测量工具,其测量结果在多次应用时应该是一致的。
效度是衡量测量工具测量所针对的概念或现象的准确性的属性。
一个具有较高效度的测量工具,应该能够准确地反映出实际研究对象的特征或变化,而不是产生误导或无效的测量结果。
信度和效度都是评价测量工具质量的重要指标,它们在研究设计和数据分析中至关重要。
高信度的测量工具可以提供可靠和一致的测量结果,而高效度的测量工具可以确保测量结果与研究对象的实际情况相关联。
- 200-校园英语 /语言测试中的效度与信度西南科技大学/邹微 杨纾凡【摘要】语言测试是检验学生语言习得效果最直接的手段,是语言教学的有机组成部分。
本文旨在对语言测试的信度和效度进行分类阐释,并分析影响语言测试信度与效度的主要因素,同时,对二者的关系进行分析,以期为考题设计者命制考题提供借鉴和参考,使语言测试真正服务于语言教学。
【关键词】语言测试 语言教学 信度 效度一、引言随着语言教学的不断推进,语言测试逐渐从应用语言学中分离出来,成为一门独立的学科。
Bachman 曾说“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。
”测试是检验学生学习效果最直接的方式,有效、可靠的测试,其结果能够帮助教师了解学生的学习水平,是因材施教的一个重要参照。
同时,测试也是评估教师教学效果的重要手段之一,为教师下一步教学计划的制定、教学方法的调整、教学重难点、目标的明确提供了依据。
评估一项测试的指标主要有“信度、效度、区分度和实用性,其中以信度和效度最为重要。
”二、效度效度,简而言之就是测试的有效性,是指该测试是否测试出命题人想要检测的内容、达到命题人预期的测试目的。
它是测试最基本的出发点。
“波尔斯基和梅西克视效度为外语测试的主要问题,其范畴包括内容效度、标准相关效度、构卷效度和表面效度等。
”1.内容效度。
内容效度,是指试题的内容是否考查了出题人想要考查的语言技能及语言要素等。
如,一个专项的语法考试,出题人需按照教学大纲的要求,大纲里规定有哪些语法是必考,那么出题人在出题的时候就必须考虑到这些语法点,考题的内容必须要覆盖大纲里规定的所有必考点,这样的考试才能算的上是有内容效度的。
内容效度是衡量测试效度的一把重要的尺子,在教学过程中,通过内容效度较高的测试,教师能更好地制定教学计划,了解教学的重难点,进而明确语言教学的方向。
2.标准相关效度。
标准相关效度指的是“测试与某一个独立并且相当可靠的学生能力测量工具”之间的关联程度。
2000年3月第8卷 第1期 西安外国语学院学报Journal of Xi'an F oreign Languages University M ar.2000Vol.8N o.1谈语言测试的信度与效度赵成发(复旦大学大学英语教学部上海200433)中图分类号:H0 文献标识码:A 文章编号:1008-4703(2000)01-0011-05 信度与效度原是计量学中的两个重要概念,20世纪30年代被引入语言测试领域。
60年代,以La-do等为代表的结构主义测试学家对这两个概念进行了系统的阐述和论证,标志着语言测试已形成科学的体系,成为一门独立的学科。
可以说,语言测试理论及实践上的发展和纷争都是以信度与效度为主线进行的,信度与效度是语言测试永恒的主题。
一、信度与效度的概念语言测试的信度是指测试结果的可靠程度。
语言测试信度的高低主要说明的是测试结果在多大程度上反映了受试者真实的语言行为。
影响信度的因素很多,它们存在于语言测试的每个环节中。
对试卷本身来说主要是样本的大小(size of sample)和区及各种组织之间的横向协作与联合。
这样一来,新亚欧大陆桥就不仅成为一条国际性贸易大通道,而且会成为一条经济、科技等多种领域使用和东西方文化交流的桥梁。
第二,充分发挥连云港市的桥头堡作用。
我国长江三角洲经济区的形成和迅速发展,有两个至关重要的因素,一是有黄金水道之称的长江,一是有中心城市上海的辐射作用。
上海凭着沿江与沿海交汇点独特的地理优势,率先发展起来,从而带动长江三角洲区域经济的发展。
陇兰经济带有一个协作与联合的纽带新亚欧大陆桥还不够,还必须有一个能像上海一样发挥作用的中心城市。
连云港作为沿线与沿海的交汇点,其地理位置的优势不亚于上海,完全可以把连云港市建设成为新亚欧大陆桥沿线省区共有的出口产品加工区,外贸基地和窗口。
连云港市也将对大陆桥沿线省区产生新的、更大的渗透力。
进一步增强新亚欧大陆桥东桥头堡和陇兰经济带的龙头地位。
信度效度指标
信度和效度是测试评估的重要指标,它们评估了测试结果的可靠性和准确性。
信度是指测试结果的稳定性和一致性,即在同样的测试条件下,测试结果应该是相似的。
常用的信度指标包括测试重测信度、内部一致性信度和整体信度。
其中,测试重测信度通常使用相关系数来衡量,内部一致性信度则使用Cronbach's alpha系数来衡量。
效度则评估了测试结果与实际情况之间的关系,即测试结果是否确实反映了被测对象的特征或者行为。
常用的效度指标包括构效效度、判别效度和内容效度。
其中,构效效度通常使用因子分析来衡量,判别效度则使用同质性检验来衡量,内容效度则使用专家评估或者内部一致性信度来衡量。
综上所述,信度和效度是测试评估的两个重要指标,它们的合理使用可以确保测试结果的可靠性和准确性,从而提高测试评估的效果。
- 1 -。
【什么是信度】信度指测验结果的一致性、稳定性及可靠性,一般多以内部一致性来加以表示该测验信度的高低。
信度系数愈高即表示该测验的结果愈一致、稳定与可靠。
系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。
反之,随机误差可能导致不致性,从而降低信度。
信度可以定义为随机误差R影响测量值的程度。
如果R=0,就认为测量是完全可信的,信度最高。
【什么是效度】效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。
效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。
效度分为三种类型:内容效度、准则效度和结构效度。
【信度和效度的关系和区别】(1) 信度低,效度不可能高。
因为如果测量的数据不准确,也并不能有效地说明所研究的对象。
(2) 信度高,效度未必高。
例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。
(3) 效度低,信度很可能高。
例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。
(4) 效度高,信度也必然高。
相关试题:判断题:效度高,信度就高,反之亦然。
答案:×。
中公专家解析:信度是指测验结果的稳定性或可靠性,即某一测验在多次施测后所得到的分数的稳定、一致程度。
效度是指测量的正确性,即一个测验能够测量出其所要测量的东西的程度。
信度是效度的必要不充分条件。
所以效度高,信度一定高。
但是反过来信度高,效度不一定高。
什么是测试的信度和效度,如何保证测试的信度和效度什么是测试的信度和效度,如何保证测试的信度和效度。
并编写小学六年级第一学期期末读写测试题,并在试题前附上该试题内容与目标的双向细目表。
测试信度也叫测试的可靠性,指的是测试结果是否稳定可靠。
也就是说,测试的成绩是不是反映了受试者的实际语言水平。
例如,如果同一套测试在对同一测试对象(即受试者本身没有变化)进行的数次测试中,受试者的分数忽高忽低的话,则说明该测试缺乏信度。
测试的信度与测试的效度有着密切的关系。
一般说来,只有信度较高的测试才能有较高的效度,但效度较高不能保证信度也一定较高。
测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。
试题本身是否可靠主要取决于试题的范围、数量、试题的区分度等因素;评分是否可靠则要看评分标准是否客观和准确。
1.所谓测验的信度,即可靠性,它是测量反映被测特征的真实程度的指标,有人称之为测验的准确性,也有人把信度作为测验结果的稳定性和一致性指标。
2.测验的效度是指心理测验的有效性,即测验得到的是不是所要测定的心理行为与行为特征,也就是测验结果是否体现测验所预期效果的程度。
上学期六年级期末英语检测题一(选词填空:sky, twin,fun,take,tourists,well,use,happy,meets,same 1(The traffic lights are the in every country.2. the No.12 bus.3.I think it’s to walk on the moon.4.I’m to have a new pen pal.5.He helps the bank use their money .6.I’m going to the .7.He many other little water drops.8.She often helps find their way.9.My sister Ann likes drawing pictures.10.Are you going to any books?二,组合句子:1.put,into,I,a,some,pot,seeds.2.motor,she,work,goes,by,cycle,to3.about,something,me,tell,you4.my,with,I’m,supermarket,mom,going,the,to5.for,mminutes,walk,three,east三,选择;( )1.First,put the in the soil.A.sproutB.seedsC.plant( )2.Her mother is .A.a cleanerB.a teacher.C.an actress( )3.My pen pal likes .A.drawing picturesB.riding a bikeC.collecting stamps( )4.I want to buy .A.a lookB.a pair of shoesC.some apples( )5.The park is the cinema.A.in front ofB.next toC.near( )6.I usually go to school .A.on footB.by busC.by bike 四,把下列单词按要求进行变化:1,come (现在分词)2.do(第三人称单数)3.policeman(复数)4.dive(现在分词)5.family(复数)6.teach(第三人称单数)7.sing (名词 )8.write (名词)9.teach (名词)10.watch (第三人称单数)11.go (第三人称单数)12.live(第三人称单数)13.ride(ing 形式 )14.dive(ing形式)15.play(ing形式)16.make (ing形式)五,按要求变化下列句型:1.The cloud comes from the vapour(对画线部分提问)the cloud come from? 2.She is my aunt. (对画线部分提问)she?3.He can go with us.(变为一般疑问句)go with us?4.I’m going to buy an English book tomorrow. (对画线部分提问) are you going to ?5.It is far from our school.(变为否定句) It far from our school. 六,选词填空:a,an,do,does,teach,by,to,riding,be,read 1.Her mother is ateacher.She math. 2.I’m going to a doctor. 3.Is your auntaccountant?Yes,she is. 4.Does Amy go to school bike?Yes,she does. 5.My brother likes a bike.6.Is he policeman?No,he isn’t.7. he like collecting stamp?Yes,he does.8.My father usually newspaper after lunch.9.They are going to their homework this afternoon.10.Sarah’s mother goes work by bus. 七.找朋友:( )1.How can I get to the zoo? ( )2.What do you do?( )3.Is she an artist/( )4.What are you going to do this afternoon?( )5.What does she do?( )6.Does he like diving?( )7.What’s your hobby?( )8.Where does your mother work?( )9.Where does the cloud come from?( )10Are they going to play chess next Sunday?A.It comes fro m the vapour.B.I’m a teacher.C.I’m going to buy an English book.D.I like collecting stamps.E.No,she isn’t.She’s a TV reporter.F.Yes,they are.G.Yes,hedoes. H.You can ride a bike there. I.My mother works in a factory. J.He is a driver. 八,改错:1.How can he water become vapour?2,What does she likes do?3,he goes to Canada by plane.4,I’m go to the cinema tomorrow.5,She likes watches TV.九.连词成句:1.rain,does,come,where,from,the,2.brother,bed,goes,10:00,to,at,my3.to,does,go,your,mother,how,work4.he,violin,the,like,playing5.we,do,should,then,what?十.填空:1.Mr White usually (go)to work by car.2.I (visit)my frandpa next week.3.The children like (swim)4. you (do)your homework now?5.What Mike’s father (do)? ________________ 5. Was Mike at homelast night ,_________________________________________________________________ 三、用括号内所给的单词(名词、代词、形容词或动词)的适当形式填空(在每条横线上不一定只写一个单词):(10分)1. Look at those __________ (child). They _________ ( swim) in the swimming pool.2. What language __________________yoursister____________ (learn) next year? 3. Foshan __________(have) a___________(long) history(历史) than Zhongshan. 4. They_______________(not play) badminton last Saturday morning They just__________(stay)at home.5. Can I _________(take) a message for ___________ (he)?四、选择正确的答案,把正确答案的字母编号写在括号内:(15分) 1. )1.This _______ Mrs. White speaking.A. amB. areC. isD. be( ) 2.Class begins at 8.00. It’s 8.15 now. You are________.A. busyB. differentC. lateD. fine( ) 3.I think Hangzhou is _____________ city in China. A. beautiful B. more beautiful C. most beautiful D. the most beautiful( ) 4What’s the matter _________ her?A. inB. toC. onD. with( ) 5. A: Did he see the doctor?B: No,_____________.A. he isn’tB. he doesn’tC. he didn’tD. he don’t ( ) 6. A:________ will he come back?B: At lunch time.A. HowB. WhenC. WhereD. What( ) 7.A: I can’t go to school today because I don’t feel very well.A. Thank you.B. Goodbye.C. You are welcome.D. I’m sorry to hear that.( ) 8. Canberry is the capital of ____________? A. Australia B.Japan C. New Zealand D. America ( ) 9. Mrs. Webb likes______________ Guangzhou dimsum very much. A. eat B. eats C. eating D. is eating ( ) 10._____________ you like to go shopping with me?A. DoB. AreC. DidD. Would 五、写出对话所缺的单词(每个空格填写一个单词,包括缩写形式):(10分)(I)A: W_______ are you going to Hong Kong?B: The day a________ tomorrow.A: How are you going to g_________ there?B: B_________ train.A: How long are you going to s_______ there? B: About two w________.(II)Mrs. White: Good evening. I called you this afternoon.Mrs. Webb: Sorry, I _________ at the market.Mrs. White: I’m __________ a party at home. Would you like to come? Mrs. Webb: I’d l__________ to. Thank _______ very much. 六、阅读对话,根据对话填写句子所缺单词(每个空格填写一个单词,包括缩写形式)(5分)This was the first day of the new term.Mr. Chen: Good morning, class. Welcome back to school. Pupils: Good morning, Mr. Chen.Mr. Chen: You all look happy today. Could you tell me what you didon your summer holiday?Jiamin: I stayed at my uncle’s farm and had a lot of fruit. Mr. Chen: Wow! That sounds great. Did you like the life on the farm? Pupils: Yes, I did. The air(空气) was better than here in Guangzhou. Mr. Chen: What about you, Xiaoling?Xiaoling: I went to the Disney Land in Tokyo.Mr. Chen: That’s interesting. Did you speak Japanese in Tokyo? Xiaoling: Yes, only a little. Some Japanese understand English. So sometimes I spoke English.Mr. Chen: Excellent! Thank you. Let’s have our new English lesson now. 1. The pupils _________happy today.2. Xiaoling travelled in ____________ on the summer holiday.3. Jiamin __________ a lot of fruit on his uncle’s farm.4. Xiaoling can speak a little ____________.5. The pupils are ____________ an English lesson.七、写出不少于五个句子,描述你昨天的活动。
信度和效度的关系口诀
信度与效度可以简单的概括为“两斤白糖”,两斤是信度,白糖是效度.如果测出来的是一斤半或者是两厘米,那就说明信度有问题.如果测出来的是盐巴或者大米,不是我们想要的白糖,那就是效度的问题.
信度分类:
1、重测信度:同一个量表在不同时间测量结果的一致性程度.如果一个今天称是两斤,但是明天称就成了一斤半,那说明信度不高.
2、折半信度.把测量项目用一定的方法分成两半,分别加以测量,得到结果的相关性.把两斤分为两个一斤,如果分别测出来是1斤和一斤半,说明折半信度有问题.
3、评定者间信度:不同的评定者使用相同工具,所得结果的一致程度.几个人用相同的称分别称,如果全部都是或者接近两斤,说明评定者信度高.
4、复本信度.多个测量工具之间的相关性.如果用这个牌子的称是两斤,用另外一个同样牌子的称也是两斤,说明复本信度较高.
效度分类:
1、表面效度.经验观察测量的结果就是要测量的指标.看上去像白糖,我们主观认为就是白糖,当然也可能是洗衣粉或者盐巴.
2、内容效度.相关行业专业的检验结果.邀请相关权威专家的评定是不是白糖.
3、结构效度.测量工具的测量属性如何.从白糖的味道、颜色、化学结构等各个方面做全方位的测量评价和论证.。
信度和效度的关系口诀1、信度即测量结果的稳定性或可靠性,指用同一种方法对同一个对象进行重复测量,所得结果与之前测量结果相一致的程度,即测试方法不受随机误差干扰的程度。
包括同质性信度、分半信度、复本信度、重测信度、评分者信度等。
2、效度即准确性和真实性,指测量工具或手段能够准确测所需测量的事物的程度。
例如,某问卷调查医生的工作负荷,则效度指该问卷能否准确地、真实地调查出医生的工作负荷。
效度和研究目标有关。
包括内容效度、效标关联效度、结构效度等。
信度和效度的关系信度与效度见的关系并非对称的,其中信度是效度的前提和基础,效度是信度的目的和归宿。
任何测量,只有做到两者的辩证统一才会具有科学性。
信度是效度的基础。
测量要有效度必须有信度,没有信度就没有效度。
一项测量如果信度低,则效度也低,因为若测量不能稳定地测量所需测量的对象,就不能有效地说明测量对象;如果信度高,效度可能高也可能低。
一项测量如果效度高,则信度一定高;但是,如果效度低,信度可能高也可能低。
值得注意的是,信度与效度二者缺一则测量无效。
效度指测验的正确性和有效性,即测验能够测到被测量对象的真实水平的程度。
通俗讲就是,效度指,一个测验能够测得出想要测量的东西。
比如,我想测大家的身高,用卷尺测出身高,这就是效度高。
但是,我用体重计测大家的身高,这就是效度低、没效度。
【测验的信度】信度指测验的可靠性和多次测量结果的一致性程度。
一个好的测验,测出的数据必须稳定、可靠,多次测量结果要保持一致,这样才让人信服。
否则就不可信。
通俗讲,信度就是一次测量很可靠,再测一次,再测10次,结果都是差不多的。
比如,我用试卷测大家的心理学成绩,今天测大家考90分,明天测、后天测,还是90分,这就说明我这份试卷的信度高。
信度和效度的关系和区别(实用版)编制人:__________________审核人:__________________审批人:__________________编制单位:__________________编制时间:____年____月____日序言下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!并且,本店铺为大家提供各种类型的实用资料,如职业道德、时事政治、政治理论、专业基础、说课稿集、教资面试、综合素质、教案模板、考试题库、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor.I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!In addition, this shop provides you with various types of practical materials, such as professional ethics, current affairs and politics, political theory, professional foundation, lecture collections, teaching interviews, comprehensive qualities, lesson plan templates, exam question banks, other materials, etc. Learn about different data formats and writing methods, so stay tuned!信度和效度的关系和区别信度是什么?效度是什么?信度和效度的关系和区别是怎样的呢?下面本店铺为大家一一介绍:【什么是信度】信度指测验结果的一致性、稳定性及可靠性,一般多以内部一致性来加以表示该测验信度的高低。
科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION我们知道 , 测试是教与学的向导 , 而为了让它发挥出向导的作用 , 一份好的试卷是必不可少的 , 而且是至关重要的 . 一般情况下 , 我们判断一份试卷的好坏的主要标准是:是否有信度、效度、区分度、实用性、全面性、公正性及后期效应。
其中, 以信度和效度最为重要。
一、语言测试的信度语言测试的信度, 又叫可靠性, 是指考试结果的可靠性和稳定性。
即看学生的分数是否稳定, 如果同一个学生做同一套试卷 , 做的几次的结果都是一致的 , 那么我们说这次考试是有信度的; 反之 , 如果分数忽高忽低就说明信度不高 , 那么表明考试的信度不高。
信度可以分为复测的效度、判卷的效度和每一个测试项目的效度。
同一学生不管考多少次, 所得的分数都是一样, 那么就说这个分数有复测的可靠性。
影响分数的一个很重要的因素就是判卷人, 在判卷过程中, 不同的判卷人对同一试卷也会做出不同的反映; 同一个人在不同的时间对同一试卷给的分数也是不一样的。
试卷不仅要达到其整体的可靠性, 而且每一题都必须能达到这个标准, 那才是一份有信度的试卷。
与能力无关却又会影响试卷信度评判的因素有很多,例如:1. 考试条件差, 天气热、考场周围太吵闹等。
2. 考试条件不一样。
同一个学生在安静与吵闹的环境中做同一份试卷,其结果不一样。
3. 监考施策。
不同的老师对考生的松与严, 看见考生作弊或违纪不勒令禁止。
4. 题目要求不清, 学生根本无法弄清题义, 也就无法真实的反映考生的水平。
5. 保密工作做的不好, 泄题事件发生。
6. 评分。
主观测试的评分常常因评卷人而异, 难以达到较高的信度; 客观试卷的评分不受评卷人的影响因此信度较高。
7. 样品数量太小, 样本不足。
8. 身体及心理状态不好等等, 这些因素都会影响到信度。
因此, 为了提高信度, 我们必须对症下药, 采取各种措施。
例如:提供统一规范的考试环境、规范监考、题目必须做到明了易懂等等。
通常, 用来检测信度最常用的有三种方法:1. 考后复测法。
在考试后再让学生做同一套试卷, 如果几次考试的结果是一致的, 这份试卷就是有信度的。
但是在实际操作过程中, 学生在不断的学习提高, 而且记忆因素也会影响复测的结果,因此用这一方法很难检测考试的信度。
2. 平行测试法。
设计试卷时, 设计两份难度一样的试卷, 在不同的时间给学生做, 如果结果一致, 则有效。
但是, 在设计试卷时我们无法确信两套试卷在难度及内容上是否完全相同,因此操作起来很困难。
这种方法常用在补考试题的设计中。
3. 分半法。
设计一套试题让学生做, 然后把结果分为奇数和偶数题进行分析评判, 并算出它们之间的相关性。
二、语言测试的效度效度, 即有效性, 是指试题是否考了出题者想考的内容或多大程度上考了出题者想考的内容。
效度是语言测试的最重要的一个指标, 或者说是语言测试的基本出发点, 效度不高的测试是没有意义的。
效度可分为以下五种:1. 表面效度。
表面效度就是说, 一套试卷看起来是否合适, 像不像一套试卷。
具有表面效度的测试容易引起人的兴趣。
Alan Davies 曾说, 表面信度是可以达到的, 但却不是必要的, 表面的但却又是有用的。
他可以让别人相信试卷是有效的。
2. 内容效度。
内容效度是指是否符合大纲的要求, 是否与测试目的有关。
例如:老师教了一个学期想看看学生对于所教内容掌握得如何, 但是在选题时, 所出的题目与学生学的内容无关, 则这套试卷没内容效度。
在有内容效度的测试中考查的语言要素和技能都能有所体现。
成绩测试和诊断测试尤其要注意符合教学内容。
3. 同期效度。
同期效度就是一次测试的结果与另一次时间相近的有效测试的结果相比较,或同教师对学生的评估相比较而得出的系数。
4. 预测效度。
它是指试卷结果是否, 或者在多大程度上可以预测将来的考试成绩。
5. 结构效度。
即从理论上说, 试卷的各个部分是否出的有道理。
结构效度测试是说一套测试要以一定的语言学习理论为依据。
Alan Davies 在论述语言测试的信度时说,信度的种类与运用有关。
例如:成绩考试既要表面效度又要内容效度; 能力测试要有表面效度、结构效度和内容效度特别依靠内容效度; 水平测试必须要有表面效度、预测效度和同期效度。
语言测试的种类不同, 对各种效度的要求也就不同。
语言潜能测试多基于某种语言行为理论和语言学习理论, 因此重视编制效度。
水平测试强调共时效度和预示效度。
成绩测试和诊断测试要受教学大纲的限制, 因此首先要看内容效度。
提高效度的常用方法有:明确考试的目的、决定与目的相反的考试内容、决定考试的方法以及增加考试的信度四种。
三、信度和效度的关系通常, 我们把信度和效度看成是不同的, 但是却在测试中两者又是具有相互联系的特征。
尽管效度是最重要的特征, 但是信度却是效度必不可少的条件。
但在涉及到测试的方法时, 两者的差异就变的模糊了。
Campbell , Lyle F. Bachman 和 Fiske 都曾对信度和效度的关系做过经典的论述。
Lyle F. Bachman 认为:在研究影响分数的因素时, 信度和效度是互为补充的两个方面。
信度回答的是引起考试结果不一致的原因有多少是由测量误差所引起的; 然而, 效度则是找出考试结果中那些导致有效的不一致的因素, 即考试结果有多少是由考生的某种特殊语言能力的程度而引起的。
因此, 我们可以说信度是考查考试结果哪些是由想考的内容以外的因素引起的, 效度则是看考试结果的差异哪些是由语言能力所引起的。
信度和效度有密切的联系, 但它们的关系是单方面的。
效度是信度的前提, 但有信度的试卷可能是高效度的, 也可能是效度较低的, 即效度较高不能保证信度也一定较高。
一项测试有信度 , 它的效度有可能高 , 也有可能低; 但是如果一项测试没有信度, 则这次测试必然是无效的。
信度差效度就差, 但效度差不一定信度就差。
信度是效度必不可少的条件, 试卷如果没有信度根本不可能对测试进行(下转第 214页语言测试的信度和效度及其关系曹桂花(孝感学院外国语学院湖北孝感 432000【摘要】语言测试是对语言教学的评价。
通过对语言知识或语言技能及语言能力的测试, 老师可以了解教学效果, 了解到学生对知识的掌握程度, 看到他们的进步与不足, 有利于教学的调整。
要达到这个目的, 就必须有好的试卷, 我们一般从信度、效度、区分度、实用性、全面性、公正性及后期效应来对试卷进行评价。
本文讨论了其中极其重要的两个标准信度和效度以及它们之间的关系。
【关键词】语言测试; 信度; 效度The relationship between validity and reliability of language testingCao Gui-hua(school of foreign language, Xiaogan University【 Abstract 】 Language testing is a way to value the language teaching. From language testing, the teachers can know whether the students master what they have taught, the students ’ weaknesses and strengths and improvement, which is helpful to the language teaching. To achieve this purpose a well-designed paper is needed. Usually, we think good qualities of good test include:validity, reliability, discrimination, practicality, and backwash effect. This paper is mainly validity and reliability and the relationship of these two.【 Key words 】 language testing ; validity ; and reliability○ 高校讲坛○182科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION(上接第 182页有效的解释。
例如:我们希望对学生进行一次期中测试, 检查一下学生半学期以来对所学知识的掌握程度。
假如试卷本身设计得不合理, 有些题目好学生不会做而基础较差的学生却做得出来, 或者由于外界的条件较差, 非常吵闹, 气温很高, 或者评卷人的主观评卷等, 都会影响测试的信度, 那么的测试结果就根本达不到检测学生的目的, 因为评判的条件没有达到, 此次测试就是无效的了, 也无从判断试卷本身的效度。
只有我们确信测试是有效的了之后, 对效度做出判断才是有意义的。
在确信了测试是有效的之后, 我们才可能从内容、结构共时、预测和表面等几个方面来判断测试是否达到了考试的目的,即是否考了想考内容。
又如, 我们想了解学生的写作能力, 可是给他们考的题型却是多项选择题、听力和阅读, 根本没有设计写作的题型。
这样的考试虽然是有效的, 但却偏离了考试的初衷, 因此不能很好的检测学生的写作能力, 因此此次考试无效的。
反之, 我们确信试卷的效度很低, 即没考想考的内容, 那么我们说其信度可能高也可能低, 因为影响信度的因素主要是我们上文提到, 与效度没有多大关系。
需要指出的是, 高效度和高信度是测试者的目标, 但是这只是一种理想, 一项测试既有高信度, 又有高效度是不可能的。
四、结论语言测试的信度及效率问题一直是语言测试专家关注的问题, 也是教师所关心的。
了解了测试中的信度和效度这两个最重要的标准及其关系后, 试卷的设计者在设计试卷时一定要注意试题的本身的科学性, 紧扣考试的目的; 而监考者在测试的过程中也应尽量减少来自于外界的影响测试的效度和信度的因素,以期测试能更好的服务于教学。
【参考文献】[1]李筱菊 . 语言测试科学与艺术 [M]. 湖南教育出版社 ,1997.[2]刘润清, 韩宝成 . 语言测试和它的方法 [M]. 外研社 ,2000.[3]Davies, Alan. 1990. Principles of Language Testing . Oxford:Basil Blackwell.[4]Bachman, Lyle F. 1990. Fundamental Consideration in Language Testing . Oxford University Press.[5]Bachman, L. F. &Adrian S. Palmer . 1996. Language Testing in Practice. Oxford University Press.作者简介:曹桂花(1979— , 女, 湖北荆州人, 孝感学院外国语学院讲师, 英语语言文学硕士。