语言测试中的构念效度研究
- 格式:doc
- 大小:24.00 KB
- 文档页数:2
语言测试中结构效度的实现【语言学研究】沈阳师范大学学报(社会科学版)Journal of Shenyang Normal University(Social Science Edition)2012年第1期第36卷(总第169期)№1,2012Vol.36General,№169语言测试中结构效度的实现马蓉(辽宁省文化艺术职工大学基础部,辽宁沈阳110180)[摘要]作为一门独立学科,语言测试是检验和评估教学效果和学习效果的重要手段。
结构效度是实现语言测试目的的基础,决定了测试的目的和收集证据检验测试的有效性。
而针对不同的受试者测试会有所倾向,产生测试偏见,影响结构效度的实现。
科学性的语言测试要求测试者在测试始终合理有效的规避测试偏见,实现结构效度,使语言测试更科学。
[关键词]语言测试;结构效度;测试偏见[中图分类号]H0-0[文献标识码]A[文章编号]1674-5450(2012)01-0117-02[收稿日期]2011-11-10[作者简介]马蓉(1977-),女,辽宁沈阳人,辽宁省文化艺术职工大学讲师,教育学硕士。
语言测试是检验语言水平和能力的重要途径,既受测试信度、效度和区分度的影响,也与受试者个人的特征密切相关。
而效度即是考查测试者想要测量的内容,是实现测试的重要方面。
在构建测试效度时应避免受试者个人特征对测试表现的影响,也就是避免测试偏见,才能测试出受试者语言能力的真实水平。
一、语言测试中的结构效度(一)结构效度的概念Lyle F.Bachman 在他的Language Testing in Practice (《语言测试实践》)一书中指出:所谓结构效度,从属于对语言测试分数所作的解释的意义性和合理性,这就意味着对测试分数的解释就是对受试者语言能力的评估[1]。
Bachman 认为通过结构效度,我们不仅可以评估想要测量的受试者的语言能力,还可以通过对测试分数的解释来判断测试所采用的目标语使用语域是否合理。
知识文库 第14期64 语言测试中的构念效度研究王天予1.引言在考虑到语言测试发展、解释和使用时首要考虑的就是效度。
那么什么是构念效度?如何更好地理解构念效度?该效度与其他效度的不同之处是什么?2.构念及构念效度 2.1构念要想理解什么是构念效度,首先要明白什么是构念(construct)。
从心理学的角度来看,构念指的是人类头脑中存在的一种特质、水平、能力或技巧(Brown,2000:9)。
在教育测量领域,构念就是一种能力(Wiley,2002),“指成功完成特定任务所要求的人类特征”。
Ebel 和Frisbie(1991:108)将构念解释为“有关人类行为某一方面的心理构建或理论概念,是既不能够直接测量也不能够直接观察的。
”构念效度是指某个心理测验在多大程度上正确地验证编制测验的理论构想。
《标准》(APA,1999)将构念视为一个测验拟测的概念或特征。
这是从广义上将构念来指测验所涉及测量的概念或特征。
实际上,构念的选择对考试内容、考试方式和分数意义的解释息息相关,是效度研究的基础,也对考试的设计和评价起着重要的作用。
2.2 构念效度如何更好的理解构念效度呢?在教育测量领域,上述讨论的内容效度、准则关联效度和构念效度这三种类型效度都是作为整体构念效度的不同方面。
语言测试者认为这种把构念效度作为整体观点是一种新的发展。
理论界对构念的定义有不同的看法,因此,通过识别他们是如何解释应答一致性来定义构念(Messick 1981) 。
Loevinger(1957:636)最早提出要把构念效度作为整体效度来看待。
在80 年代, 这一观点逐渐得到人们的认同: 构念效度不再作为效度的一种证据,而应包括内容和标准证据、信度及其它与理论验证有关的方法 (Messick 1975, 1980, 1988, 1989; Anastasi 1986)。
其中影响最大的是 Messick 的“效度整体观”。
Messick (1988,1989)进一步丰富了效度理论,对测试的解释和使用提供了证据基础。
英语语言测试中效度的测量与估计沈阳师范大学大学外语教学部 许亚楠一、效度的基本概念(一)效度的定义及分类不同的语言测试学家对于效度这一概念的界定也不尽相同。
巴奇曼在《语言测试要略》中认为,“效度是对实证证据和理论原理在多大程度上支持基于测试的推断和行为的充分性和适当性的综合评价判断”。
换句话说,效度其实就是指一项测试中测量结果的准确性和有效性的程度,即测量是否达到了预期的目的。
效度通常可以分为构念效度、内容效度、预测效度、表面效度以及方法效度五种。
构念效度是指我们对于根据测试成绩对评价测试结果的解释是否是恰当且有意义的,即在多大程度上可以说一次测试成绩能够反映考生具备所考查的语言能力。
内容效度是指测试内容反映测试目的以及能够达到预期考查效果的程度。
预测效度是指测试结果能够在某种程度上预测出学生在未来学习中的表现和成就。
表面效度指的是一项测试能够测量出它想要测量的内容,这一概念其实和内容效度是有交叉的。
方法效度则一般用来评价测试方式与测试目标之间的关系。
(二)影响测试效度的因素测试效度的高低受到许多方面因素的影响,主要包括测验组成、测验实施、被试主观状态、效度效标和样本选择五个方面。
测验的效度与测验的取材和长度、测试题的难度、区分度及其编排方式等密切相关。
要想保证测验效度,主试应该适当控制测验环境,例如场地、材料、考试说明、考试时间等。
另外,被试对测验的态度、情感以及自身的身体健康状况都会影响测验结果的准确性和有效性,同时选择合适的效标也是估计效度所要依据的条件。
最后在样本选择上要尽可能地增加样本容量以减少测量误差,使所得的测量结果处于相对稳定的状态。
(三)提高效度的方法测试者可以通过控制系统误差、精心编制量表、妥善组织测验、扩充样本容量、增加测验长度等方法来有效提高测试效度。
效度的高低主要受到没有校准仪器、测试题目和指导语具有暗示性、答案有明显的组型等系统误差的影响,所以必须严格控制这些干扰因素。
浅析语言测试中信度与效度两者之间的关系语言测试在语言教学中处于中心地位,是从属于应用语言学这一学科的。
在过去语言测试在应用语言学中处于边缘地位,而在长达三十多年的发展中,语言测试现已发展成为一个相对独立的学科,已经在学术上占有了一席之地。
通过语言测试教育者可以及时发现学习者学习上存在的不足之处并在日后的教学过程中加以正确引导,也可以衡量教学任务和教学大纲的执行情况,但是这些都是基于科学的语言测试能够得到良好的反馈情况,反之,如果是一套不科学的语言测试就很可能对学习者做出错误的判断从而影响学习效率,所以科学的语言测试无论是对受教育者还是对教育者来说都是非常重要的。
一套设计比较科学的测试应该是具有信度,效度,难度和区分度四点特征,信度与效度是难度和区分度的基础,同时也是语言测试的两大根本要求,只有正确认识了信度与效度两者之间的关系才能寻找出一个科学的方法使得语言测试更加科学准确。
信度指的是测量的一致性,一个实验或测试的信度指它在重复测量时产生同样结果的程度,也就是说测量的稳定性是否一致。
影响信度的因素很多,其不仅存在于考试过程中的各个环节,也存在于阅卷的过程中,如试卷中的试题长度偏长,项目种类多,那么测试的信度就会提高,反之则会降低,考试分数集中于某一点或某一个区域时信度也会有所降低;考试期间考生时间充裕那么估算能力考试的信度也相对较高等等,这些都是存在于考试过程中各个环节的部分举例,在阅卷过程中阅卷者自身的信度和阅卷者之间的信度等问题也是影响信度的因素之一,如在评阅主观性的题目时(作文,口语等),阅卷者在评分时就具有很大的主观色彩,而不同的阅卷者掌握的主观的评分标准在评阅主观性试题时,不容易取得一致,也会使得测试的信度不稳定。
效度指的是我们所获的证据在多大程度上支持我们根据分数所做出的推断,也就是考试是否检测到了它所要检测的东西,是否达到了它的预定目标。
效度共分为三种不同的类型,其不同类型的效度测试有各自不同的测试着重面,内容效度测试的目的是为了了解测试者在一些实际环境中是如何运作的,如果测试的样本能够充分代表总体,那么测试在内容上就是有效的,反之效度则不高;预测效度和共时效度都是属于与标准有关的效度,预测效度是标志测试者将来能力的标准,如通过摸底考试分班,共时效度是指一个测试结果与另一个同时使用的标准的结果的关系;构想效度是指要考察一个测试者在多大程度上和我们根据某一理论所作出的预测是否一致,也就是说验证的是我们所做的假设是否有效。
语言测试构念效度研究2005年的英语专业八级考试是根据2004年新的八级考试大纲设计和施测的第一次考试,考试的性质、构念领域、任务要求、分数权重等都发生了较大变化。
作为全国唯一的测量英语专业学生高年级英语水平的大规模考试,这些变化对个人、团体和社会将产生重大影响。
测试界认为,越是高风险考试,越要对考试的技术和应用方面进行评价,对考试的效度验证要求越高。
因此,运用先进的效度理念、分析技术和行业规范对我国的八级考试进行研究,不仅有理论价值,也具有现实意义。
在对测验的评价中,效度是最重要的考虑因素。
然而,在过去近一个世纪以来,效度的概念从多类效度发展到统一构念效度。
与效度概念发展相联系,效度验证的范式和方法也产生了变化。
因此,全面和准确地理解效度,具有十分重要具有理论意义。
而掌握效度验证的科学方法具有运用价值。
本研究的目的有二:一是对统一效度概念从本体论、认识论、方法论视角进行较全面的评述,旨在为八级考试效度验证提供一个理论和方法框架;二是在统一效度概念下,对八级考试的客观试题从实证的角度进行效度验证。
验证的问题包括四个:八级考试客观试题的测量学属性如何?客观题目实际测量的维度与考试设计的理念是否一致?客观试题分数的意义在不同的群体中是否具有类似的解释?新增加的人文知识分测验在是否存在考试偏差? 针对两个目的,采用两种研究方法。
对构念效度的理论和方法讨论采用文献综述方式;针对八级考试客观题目的效度验证是用定量的方式提供解释依据。
构念一致性问题是本研究中关于分数解释的切入点,解决的是测验所测量的构念在不同背景的考生的意义是否具有可比性问题。
当一个测验在一个组别(群体)中所测量的假设特质(或者心理构念)与另一组别相同,或者当一个测验在测量相同的特质而测量的准确程度相似时,构念具有可比性。
构念一致属于分数结构和效度概化问题。
它与考试偏差分析一起,为分数的可解释性和考试公正提供依据。
本研究的对象是446所大学参加2005年TEM 8考试的96696名考生。
第六章语言测试的效度研究本章将研究所有语言测试中最重要的问题:效度问题。
效度是测试评估中最重要的指标。
一项测试如果从设计目的角度讲不是有效的,那么测试分数的推断和解释自然不会准确(Alderson et al. 1995:170)。
Messick(1992:89指出,众多测试设计者承认其有义务提供证明测量结果富有价值的效度证据,但遗憾的是很少有人真正这样去做。
Hughes,Porter以及Weir认为提供令人满意的效度证据是任何严肃测试必不可少的条件。
第一节效度的概念效度是教育和心理测量学中的一个概念,由来已久。
Kelly(1927:14)指出“效度问题就是一项测试是否真正测量了它声称所要测量的东西”。
Lado(1961:321)提出了这样的问题:“一项测试测量了它应该测量的东西了么?如果是,那它就是有效的。
” 上述是对效度进行的概括性或普遍定义。
下面我们从不同维度解读效度概念。
Henning(1987:89)对效度的理解偏重测试的设计目的,该定义为:一般来说,效度是指一项测试或测试一部分测量它声称测量内容的合适性(appropriateness)。
测试有效是指它测量了它应该测量的东西。
当效度用来描述一项测试时,它应该与“for”连用。
任何一项测试只有针对特定的目的才有效。
该定义突出了测试研发和使用的目的性。
测试使用最普遍的问题之一就是测试误用,即测试不是本着最初的设计目的而得以运用,当然这并不是说一项测试不能有效于多个目的,无论它出于何种目的被运用,其有效性证据必须要建立并加以呈现。
我们不能简单地说“该测试有效”,而应回答下面的问题“你是怎么知道该测试有效的?”以及“该测试有效性体现在哪里?”Henning的定义中还考虑到了效度的程度问题:测试相对其设计目的或多或少是有效的,即效度不是一个“要么有要么无”的概念,而是一个相对概念(Alderson et al. 1995:170)。
Weir认为效度存在于测试分数的解释中,而非测试本身。
1.构念效度的定义1.构念效度就是测验能够测量到所欲测量的心理特质程度2.心理学的许多特质都是假设的人的属性和理论概念(理论构念),如智力、创造力、焦虑、自我效能感等。
只能通过观察行为(测验项目)间接推论其存在。
3.构念效度就是指测验分数在多大程度上测量或解释了某种理论构念。
1.创造力是人对一定刺激产生大量的独创性反应的能力,主要表现为流畅性、灵活性、变通性。
(提出构念,并给出构念的结构框架)2.创造力随着年龄的增加而增加。
创造力与智力相关不高,与学习成绩只有微不足道的相关。
(提出与该构念相关的理论假设)3.计算创造力测验分数与年龄、智力测验等的相关系数。
(收集数据对理论假设进行验证)3.构念效度的验证方法1.测验内方法:通过研究测验内部构造(如测验内容、对测验题目的反应以及题目之间和分测验之间的关系)来研究测验的构念效度)2.测验间方法:同时考虑几个测验的相互关系,聚合效度、区分效度、因素分析(内部结构)3.多元特质多重方法矩阵:综合运用聚合效度和区分效度考察构念效度。
4.效标关联效度:求新编测验与以知的测量同一特质具有较高构念效度的测验的相关,也可以称作相容效度。
(1)测验内方法1.内容效度方法:测验内容效度的双向细目表就是对测验目标做了类似理论结构的解释,因此一个测验具有较高的内容效度可以作为构念效度高的证据。
2.被试反应方法:一个测验测量什么目标,有没有测到,可以采用个别测验的方式,让被试边想边做边说,了解其思维操作过程,可以核实测验是否真正测到了想要测量的东西,如数学推理测验借此可以了解被试的推理过程。
3.同质性系数方法:通过考察克伦巴赫系数判断测验时单一特质还是多维特质,进而考察与特质(构念)吻合程度。
(2)测验间方法聚合效度:如果两个测验是测量同一特质的,即使使用不同的方法进行测量,它们之间的相关也是比较高的,又称求同效度、收敛效度。
区分效度:如果两个测验测量的是不同的特质,即使使用相同的方法进行测量,他们之间的相关也应该是低的,又称求异效度、判别效度。
语言学习潜能测试构念的研究卜杰民(浙江广厦建设职业技术学院经贸外国语学院,浙江东阳 322100)*摘 要:语言学习潜能测试构念(L a n g u a g eL e a r n i n g Po t e n t i a lT e s tC o n s t r u c t )是语言学习潜能测试试卷编制的语言学和认知科学的基础㊂文章界定了语言学习潜能测试构念的概念,建立了语言学习潜能测试构念的分类框架,论述了其因子的表征,进行了因子表的结构效度验证㊂文章是对语言学习潜能测试构念所进行的理论探索,以为语言学习潜能测试试卷的编制提供一种理论架构㊂关键词:语言学习潜能;语言能力;学习能力;测试构念;结构效度验证d o i :10.3969/j.i s s n .2095-5642.2020.06.011中图分类号:H 08 文献标志码:A 文章编号:2095-5642(2020)06-0071-10语言学习潜能(L a n g u a g eL e a r n i n g Po t e n t i a l )是指学习者为完成语言学习任务所具有的潜在或者可能的能力㊂它是语言能力(L a n g u a g eA p t i t u d e )和学习能力(L e a r n i n g A pt i t u d e )的综合㊂语言学习潜能在第二语言习得中起着至关重要的作用,是因为语言学习潜能既是第二语言习得的个体差异变量之一[1],也是预测第二语言习得的学习结果的因素之一[2],同时具有语言学习普适性的属性[3]㊂国内外学者从不同的角度从以下几个方面对语言学习潜能进行了研究,相关研究文献包括:语言学习潜能测量结果和学习结果的相关数达0.50[4]㊁语言学习潜能和第二语言语法水平的相关性[5-7]㊁语言学习潜能和语言知识的相关性[8]㊁语言学习潜能在外显学习和内隐学习条件下的作用[9-14]㊁语言学习潜能对第二语言习得的影响[15]㊁语言学习潜能研究范式[16]及语言学习潜能和学习任务之间关系的实证研究[17]㊂这些研究文献主要回答了以下四个问题:(1)语言学习潜能和语言知识的相关性问题;(2)语言学习潜能在不同的教学环境和学习任务中的作用问题;(3)语言学习潜能对语言学习水平的预测性问题;(4)语言学习潜能的研究范式问题㊂这些相关研究文献奠定了语言学习潜能测试理论建构的基础㊂语言学习潜能测试旨在测试学习者的语言学习潜能,或者说测试学习者的语言能力倾向,其理论建构的核心问题是语言学习潜能测试构念概念的建构㊁因子表征和因子表的结构效度验证㊂为了简洁之便,语言学习潜能测试构念这个术语取其英文单词首字母,下文通称L L P T C ㊂有鉴于L L P T C 理论建构的核心问题,本研究探讨三个问题:(1)概念的建构;(2)因子的表征;(3)因子表的结构效度验证㊂概念的建构旨在解决L L P T C 范畴的问题,其因子表征旨在解决L L P T C 范畴在语言学层面和认知层面的构成成分表征的问题,因子表的结构效度验证旨在解决L L P T C 因子有效性的问题㊂在汉语语境下研究中国语言学习者L L P T C 概念的建构㊁因子的表征和结构效度验证,必须要了解第二语言习得的语言学习能力模块㊂17*收稿日期:2019-12-30基金项目:浙江省教育考试2018年度研究课题 基于多元智力理论的学生语言学习潜能动态评估研究与实践 (2018Z J K S 229)部分研究成果 作者简介:卜杰民(1962 ),男,浙江东阳人,副教授,硕士,研究方向:语言学和语言习得㊂成都师范学院学报2020年6月一㊁语言学习能力模块语言学习能力(潜能)与第二语言习得有着相互联系㊂S k e h a n[18]把语言能力进行了分解,分为听觉加工模块㊁语言加工模块和记忆模块㊂听觉加工模块对应语音编码能力,语言加工模块对应语法感知力和语言归纳能力,记忆模块对应记忆(即时记忆和延时记忆)能力和检索能力㊂在此基础上S k e h a n[19]把这些语言学习能力模块和信息处理过程进行了对应:(1)语音编码能力与输入加工相联系;(2)语言分析能力与中间处理相联系;(3)作为检索的记忆与输出和流利相联系㊂Dör n y e i与S k e h a n[2]对语言习得加工步骤和语言学习能力模块的联系进行了细化,具体情况见表1㊂表1二语习得步骤与语言学习能力模块联系表二语习得加工步骤相应的语言学习能力模块语言输入的加工策略注意力的控制,工作记忆注意语音编码能力,工作记忆语言结构的识别语音编码能力,工作记忆,语法感知力,归纳性语言学习能力语言结构重构和操纵语法感知力,归纳性语言学习能力语言结构的控制自动化,融合记忆语言结构的融合组块能力,检索记忆表1中所列出的语言学习能力模块反映语言学习者的语言学习潜能㊂从语言学的层面来看,语言学习潜能是一种与生俱有的天资,固存于人们的大脑中,体现为语言学习者大脑中的语言学习能力的初始状态,具体表现为以下潜在的能力:(1)能够说出或理解以前未接触到的㊁合乎语法的语句;(2)能够辨析有歧义的语句;(3)能够判别表面形式相同而实际语义不同,或者表面形式不同而实际语义相似的语句;(4)听㊁说㊁读㊁写㊁译等语言技能㊂语言学习潜能具有三个特点:(1)对于语言习得而言,语言学习潜能具有普适性属性;(2)对于语言学习者而言,语言学习潜能具有个体差异性属性;(3)对于语言测试而言,语言学习潜能具有可测性属性㊂从心理学的层面来看,语言学习潜能以心理特质的形式存在于人们的大脑中㊂心理特质指的是心理活动进行时所表现出来的稳定特点㊁反映意识倾向,体现心理活动的独特性㊂语言学习潜能就是这样一种语言学习方面的心理特质,体现语言学习的能力倾向㊂但是如何测试这种语言学习潜能心理特质呢?语言学习潜能心理特质的测试可以通过测试构念这个概念来加以体现,测试构念可以通过因子表征的方法来加以实现㊂下面先讨论L L P T C概念的建构㊂二㊁L L P T C概念的建构测试构念(T e s tC o n s t r u c t)是一个心理测量学的概念,指的是人们所具有的某种心理特质通过间接的方式所表现出来的测试点[20]㊂测试构念奠定了语言学习潜能测试的基础,在心理学层面测试构念以心理构念(P s y c h o l o g i c a l C o n s t r u c t)的方式体现㊂这种心理构念根据G a r d n e r多元智力理论的理解,不是单一的而是多维度的心理构念,是语言潜能和学习潜能的综合体现,其测试构念(测试点)可以用范畴的方式表征㊂此处的范畴(C a t e g o r y)是指反映语言学习潜能本质属性和普遍联系的基本概念㊂但是测试构念如何以范畴的方式表征呢?在现实世界里,其范畴的表征要通过范畴化(C a t e g o r i z a t i o n)的过程来实现㊂所谓L L P T C范畴化是指认知主体对其范畴进行分类的过程,是构建L L P T C范畴的基础㊂综合C h o m s k y的语言天赋论理论[21]和G a r d n e r的多元智力理论[22],L L P T C范畴可以分解为L L P T C知识范畴(L L P T CK n o w l e d g eC a t e g o r y)和L L P T C认知范畴(L L P T CC o g n i t i v eC a t e g o r y)㊂知识范畴对应于表1中的语音编码能力㊁语法感知力和相应的语言学习能力模块,属于C h o m s k y界定的语言能力范畴;认知范27第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究畴对应于表1中的工作记忆和归纳性语言学习能力,属于G a r d n e r界定的智力范畴㊂L L P T C范畴的二分法较好地体现了语言学习潜能的本质属性,是建立L L P T C分类框架的一种途径㊂L L P T C知识范畴折射语言学习者的语言能力倾向测试点类型,体现他们的语言学习潜能在语言学层面的测试构成要素,反映他们在未来语言学习前的大脑中语言习得(学习)机制中语言能力的初始状态㊂其知识范畴包括语音辨析能力(P h o n e t i cR e c o g n i t i o n)㊁语素辨析能力(M o r p h e m eR e c o g n i t i o n)㊁语法感知力能力(G r a mm a t i c a l S e n s i t i v i t y)和语义辨析能力(S e m a n t i cA n a l y s i s),分别对应语音学/音系学㊁语素学㊁句法学和语义学范畴㊂语音辨析能力是指识别不同语音的能力,它以语音符号联想能力为特征,在语音和代表它们的符号之间建立联想;语素辨析能力是指识别构成最小意义单位语素的能力;语法感知力能力是指把语言形式与其特定的语境分离,从语言材料中推断出语言规则的能力;语义辨析能力是指分辨词的意义和词与词意义之间逻辑关系的能力㊂L L P T C认知范畴体现语言学习者的语言学习元认知能力,反映他们在未来语言学习前的大脑中语言习得(学习)机制中学习能力的初始状态,包括配对联想能力(P a i r e d A s s o c i a t i o n)㊁归纳分析能力(I n d u c t i v e A n a l y s i s)和记忆能力(M e m o r y)㊂配对联想能力是指把刺激和反应联系在一起的能力,迅速而有效地学习语音和意义之间联系的能力[23]㊂归纳分析能力是指根据已知语言材料推断㊁归纳及支配一组语言材料规则的能力㊂记忆能力是指保存语音和意义之间联系和语言规则的能力㊂L L P T C知识范畴和L L P T C认知范畴共同构成L L P T C范畴㊂它们两者之间的关系是:认知范畴是知识范畴的认知基础,知识范畴是认知范畴的加工对象,认知范畴蕴含知识范畴,知识范畴表征认知范畴㊂知识范畴构成L L P T C语言因子,其加工对象和表征属性反映语言因子的属性;认知范畴构成L L P T C学习因子,其认知基础和蕴含属性反映学习因子的属性㊂L L P T C的分类框架及关系如图1所示㊂图1 L L P T C分类框架及关系图在理解了L L P T C分类框架和它们之间关系的基础上,下面讨论在测试中实现这种分类框架的方法,即研究L L P T C因子的表征㊂三、L L P T C因子的表征所谓L L P T C因子(L L P T CF a c t o r)指的是其范畴的构成成分㊂如图1所示,L L P T C知识范畴相对应的有四个组成成分,分别是语音辨析㊁语素辨析㊁语法感知力和语义辨析㊂这四个组成成分体现了大的L L P T C语言学属性,称为L L P T C共同语言因子(L L P T CC o mm o nL a n g u a g eF a c t o r)㊂L L P T C认知范畴相对应的有三个组成成分,分别是配对联想㊁归纳分析和记忆㊂这三个组成成分包含了大的L L P T C认知学习属性,称为L L P T C共同学习因子(L L P T C C o mm o n L e a r n i n g F a c t o r)㊂L L P T C的因子表征就是把L L P T C共同因子((L L P T CC o mm o nF a c t o r)所代表的L L P T C大范畴分解成具有测试可操作性的L L P T C 特殊因子(L L P T CS p e c i f i cF a c t o r)所代表的L L P T C小范畴,形成语言学习潜能测试点㊂L L P T C各个因子形成一个因子表,如表2所示㊂37成都师范学院学报2020年6月表2 L L P T C因子表L L P T C共同因子L L P T C特殊因子表征信息L L P T C 共同语言因子语音辨析语素辨析语法感知力语义辨析语音符号根据所听到的语音辨识音节符号语音分辨根据所听到的句子辨识所含的单词重音辨识根据所听到的单词语音辨识重音相异的单词语素分析辨识名词构词㊁动词构词㊁形容词构词和副词构词句子中的单词根据例示辨识单词在句子中的语法功能词汇同义词㊁近义词辨析词语类比辨识词语之间的逻辑语义关系L L P T C 共同学习因子配对联想拼写提示根据意义把语音和符号联系在一起归纳分析语言分析分析语言规则,翻译句子记忆词汇记忆根据提示记忆词汇如表2所示,共同因子由其所属的各特殊因子组合而成㊂具体讲就是:共同因子表征由其所属的各特殊因子共同的抽象属性,特殊因子不但表征其所属的共同因子的抽象属性,而且还表征其本身的具体属性㊂换句话讲共同因子是各个特殊因子所共有的因子,是对某个集合成员所有因子的概括,特殊因子是共同因子所概括的某个集合成员中的一个因子㊂表2所示的因子表体现其范畴结构,反映其本质属性㊂共同因子和特殊因子构成L L P T C结构效度验证的对象㊂结构效度验证就是看看在多大程度上这些因子能够测试出所要测试的语言学习潜能㊂下面讨论L L P T C因子表的结构效度验证的问题㊂四、L L P T C因子表的结构效度验证(一)结构效度验证的理论假设L L P T C因子表的结构效度验证采用因子分析法(F a c t o rA n a l y s i s)㊂因子分析法所依据的原理是检验表2所示的L L P T C因子表中特殊因子在其所属共同因子下的聚合效应(C o n v e r g e n tE f f e c t)及各个共同因子间的区分效应(D i s c r i m i n a n tE f f e c t)㊂如果能够证明L L P T C因子表具有较好的聚合效应和区分效应,则说明L L P T C因子表具有较好的结构效度㊂聚合效应反映因子表中特殊因子在其所属共同因子下相互紧密联系的程度,其相互紧密联系的目的是保证共同因子所属的特殊因子都具有其共同因子的属性㊂其紧密联系的程度用特征值(E i g e n v a l u e)㊁因子负荷((F a c t o rL o a d i n g)和共同性(C o mm u n a l i t y)三个指标来度量㊂(1)特征值指的是共同因子解释其所属特殊因子的程度㊂特征值越大,说明共同因子解释其特殊因子的程度越高㊂(2)因子负荷指的是共同因子和其所属各个特殊因子之间的相关系数㊂因子负荷越大,说明共同因子和特殊因子的相关程度越高㊂(3)共同47第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究性指的是特殊因子能被共同因子解释的程度㊂共同性越大,说明特殊因子能被共同因子解释的程度越高㊂区分效应反映因子表中各个共同因子之间互不重复㊁相对独立的程度,其相对独立的目的是保证不同的共同因子具有不同的属性㊂(二)结构效度验证的方法L L P T C因子表的聚合效应验证是通过特征值㊁因子负荷㊁共同性的统计值和其相应参数临界值的比较来进行的㊂L L P T C因子表的聚合效应验证的参数临界值是[24]:(1)特殊值达到可接受值1.0或者1.0以上;(2)因子负荷达到可接受值0.3或者0.3以上;(3)共同性达到可接受值0.7或者0.7以上㊂如果L L P T C因子分析的统计值满足以上三个条件,则可以推断:(1)共同因子解释其所属特殊因子的程度较高;(2)共同因子与其所属的特殊因子有较高的相关程度;(3)特殊因子被共同因子解释的程度较高㊂由此证明本研究的L L P T C因子表中共同因子和其所属的特殊因子具有较好的聚合效应㊂较好的区分效应通过采用因子分析中的直角旋转法(O r t h o g o n a lR o t a t i o n)来达到㊂直角旋转的作用是使各个L L P T C共同因子相对独立,以保证每个共同因子在解释L L P T C因子表结构效度中起到应该起的独特作用㊂(三)结构效度验证的任务L L P T C因子表的结构效度验证的任务是:(1)检验L L P T C因子的特征值;(2)检验L L P T C因子的因子负荷;(3)检验L L P T C因子的共同性㊂(四)结构效度验证的被试本研究的被试为某高校在新生入学时从参加语言学习潜能测试的全体大一新生中随机抽取的120名学生,其中,有60名男生和60名女生㊂之所以从全体测试新生中随机抽取120名学生,是因为全体大一新生能够保证:(1)有足量的被试;(2)有异质的被试(即含有语言水平和认知水平高㊁中㊁低的被试)㊂足量的被试保证随机抽取的测试样本量足够大,能够保证数据检验有统计意义;异质的被试作为一个整体样本反映自然状态下所测试的语言学习者的语言能力和认知能力初始状态分布的情况,即含有语言能力和认知能力高中低的被试并按正态分布,保证随机抽取的测试样本是反映自然状态的真实样本㊂本研究的被试满足这两个条件,因此L L P T C因子表的结构效度的数据检验具有统计意义,从而保证了本研究的信度和效度㊂(五)测试样卷结构信息和样题信息本研究的测试样卷分七个大部分㊁十个小部分㊂每一个小部分10道题,共100道题;每题1分,总分100分㊂七个大部分对应七个测试构念共同因子,十个小部分对应十个测试构念特殊因子㊂样卷结构信息和样题信息如附录所示㊂(六)数据收集与分析运用语言学习潜能测试样卷,在大一新生入学时在全体大一新生中进行语言学习潜能测试,其性质是诊断性的,其目的是了解学生的语言学习潜能,以便开展分层分类教学㊂同时利用该测试数据进行本研究的L L P T C因子表的结构效度验证㊂测试时间为120分钟㊂在测试开始前,参加语言学习潜能测试的全体大一新生进行随机抽取编号㊂随机抽取编号的目的是为了便于评分结束后的随机抽取样本试卷㊂在测试时要求每位学生在试卷上填上姓名㊁性别㊁年龄和编号㊂测试结束后,教师按照评分规则评分,统计出每位学生试卷上的每一小部分的分数㊂评分结束后,随机抽取120份答卷(60份男生答卷㊁60份女生答卷),形成被试样本试卷,以备数据录入分析㊂因为数据是以分数的方式呈现,所以所分析的L L P T C因子表是定距测量,满足因子分析的前提条件㊂数据录入分两部分进行㊂第一部分录入被试样本试卷每位被试的姓名㊁性别㊁年龄和编号㊂第二部分录入每位被试答卷的每一小部分成绩,它们分别对应于语音符号㊁语音分辩㊁重音辨识㊁语素㊁句子中的单词㊁词汇㊁词语类比㊁拼写提示㊁语言分析和词汇记忆的分数㊂这十个分数变量对应十个L L P T C特殊因子,如表2所示㊂前三个特殊因子对应第一个L L P T C共同因子 语音辨析;第四个特殊因子对应第二个L L P T C共同因子 语素辨析;第五个特殊因子对应第三个L L P T C共同因子 语法感知力;第六个和第七个特殊57成都师范学院学报2020年6月因子对应第四个L L P T C共同因子 语义辨析;第八个特殊因子对应第五个L L P T C共同因子 配对联想;第九个特殊因子对应第六个L L P T C共同因子 归纳分析;第十个特殊因子对应第七个L L P T C共同因子 记忆㊂前四个共同因子表征被试语言学习潜能的语言(知识)属性特征,后三个共同因子体现被试语言学习潜能的学习(认知)属性特征,被试的语言(知识)属性特征和学习(认知)属性特征共同勾画出其语言学习潜能特征㊂数据录入完毕后,运用S P S S统计软件对已录入的数据进行验证性因子分析(C o n f i r m a t o r y F a c t o rA-n a l y s i s),其因子旋转选择V a r i m a x旋转,计算出相关系数㊂五㊁结果与讨论(一)KMO测度和B a r t l e t t球体检验在作因子分析以前,先进行KMO测度和B a r t l e t t球体检验,以检查数据是否适用于因子分析,结果见表3㊂表3 KMO测度和B a r t l e t t球体检验表KMO测度值(K a i s e r-M e y e r-O l k i n M e a s u r eO f S a m p l i n g A d e q u a c y)0.897B a r t l e t t球体检验值(B a r t l e t t sT e s tO fA p p r o x.C h i-S q u a r eS p h e r i c i t y)677.638方差值(d f.)9显著水平值(S i g.)0.000注:显著水平值(S i g.)ʈ0.000<0.05,数据具有统计意义㊂表3列出了KMO测度值㊂KMO测度值表明全部变量的方差比例,也就是说该方差比例可能是由潜在的因子造成的㊂一般来说,KMO测度值越高(接近于1.0),表明变量间的共同因子越多,数据越适合用因子分析㊂KMO测度值的可接受值为0.7[24]㊂表3所示的KMO测度值为0.897,大于0.7可接受值,数据适合做因子分析㊂表3也列出了B a r t l e t t球体检验值㊂B a r t l e t t球体检验值说明相关矩阵是否为单位矩阵㊂如果是单位矩阵,不适宜用因子分析㊂如果显著水平值(S i g.)大(>0.05),说明变量间相关性低,相关矩阵是单位矩阵,不适宜用因子分析[24];如果显著水平值(S i g.)小(<0.05),说明变量间相关性高,相关矩阵不是单位矩阵,适合用因子分析[24]㊂表3所示的B a r t l e t t球体检验中,显著水平值(S i g.)ʈ0.000<0.05,表明变量间有显著的关系,变量间存在着共同因子,适合用因子分析㊂(二)特征值㊁因子负荷和共同性的检验表4列出了因子的特征值㊂特征值是所有特殊因子值在某一共同因子上的负荷值的平方总和,解释的是相关矩阵中的方差,可接受值是1.0,特征值越大,共同因子解释其特殊因子的程度越高㊂表4因子的特征值㊁解释方差和累计方差表L L P T C共同因子标签(L a b e l)特征值(E i g e n v a l u e)方差(V a r i a n c e)累计方差(C u m u l a t i v eV a r i a n c e)L L P T C 共同语言因子因子1语音辨析2.5327.05158.065因子2语素辨析2.2115.38252.194因子3语法感知力3.7212.45650.183因子4语义辨析2.4518.57554.02367第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究(接上表)L L P T C 共同因子标签(L a b e l)特征值(E i ge n v a l u e )方差(V a r i a n c e )累计方差(C u m u l a t i v eV a r i a n c e)L L P T C共同学习因子因子5配对联想2.1425.75357.564因子6归纳分析2.0811.07850.056因子7记忆2.2612.64750.195表5列出了因子负荷和共同性㊂因子负荷反映特殊因子和共同因子之间的相关程度,解释的是特殊因子值对共同因子的贡献率,可接受值是0.3,因子负荷越大,相关程度越高㊂共同性是每个特殊因子值在每个共同因子上的负荷值的平方总和,从共同性的大小可以判断特殊因子和共同因子之间的关联程度,可接受值是0.7,共同性越大,特殊因子能被共同因子解释的程度越高㊂表5 因子负荷和共同性表L L P T C 共同因子L L P T C 特殊因子因子负荷(F a c t o rL o a d i n g)共同性(C o mm u n a l i t y)L L P T C共同语言因子语音辨析语素辨析语法感知力语义辨析语音符号0.8050.704语音分辩0.8240.852重音辨识0.8360.736语素0.7420.719句子中的单词0.8680.758词汇0.8560.795词语类比0.7230.703L L P T C共同学习因子配对联想拼写提示0.7010.767归纳分析语言分析0.8470.824记忆词汇记忆0.8710.875从表4和表5可以看出,各因子的特征值介于2.08-3.72之间,各因子的因子负荷介于0.701-0.871之间,各因子的共同性介于0.703-0.875之间,都大于可接受值,L L P T C 因子表具有较好的聚合效应㊂较好的区分效应通过V a r i m a x 旋转得到了保证㊂因此可以得出结论:本研究的L L P T C 因子表具有较好的结构效度㊂六、结语本研究梳理了语言学习潜能相关研究文献,界定了L L P T C 的概念,研究了L L P T C 的分类框架和L L P T C 因子的表征,进行了L L P T C 因子表的结构效度验证㊂本研究成果为语言学习潜能测试试卷的编制提供了一种理论架构和命题依据㊂把该研究成果大规模地应用到语言学习潜能测试工作中去,还需要建设试题库,保证有足量试题以供抽题㊂只有做好了这项工作,才能成功地实施语言学习潜能测试工作,取得它应该有的效果㊂77成都师范学院学报2020年6月附录T h e I n f o r m a t i o n f o rL a n g u a g eL e a r n i n g P o t e n t i a l S a m p l eT e s tP a p e r(语言学习潜能测试样卷结构信息和样题信息)P a r t I.P h o n e t i cR e c o g n i t i o n(语音辨析)S e c t i o nA.P h o n e t i cS c r i p t(语音符号)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h eb e s t a n s w e r.A.b e e kB.b e e vC.b u tD.b u vS e c t i o nB.S o u n dD i s c r i m i n a t i o n(语音分辩)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h eb e s t a n s w e r.A.r i n g e rB.h a n g e rC.f i n g e rD.s i n g e rS e c t i o nC.S t r e s sP a t t e r n I d e n t i f i c a t i o n(重音辨识)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h e s t r e s sw h i c h i s d i f f e r e n t f r o mt h e o t h e r t h r e e o n e s A.N a v y B.A r m y C.B u r g e r D.R e p l a c eP a r t I I.M o r p h e m eR e c o g n i t i o n(语素辨析)S e c t i o nA.M o r p h o l o g y(语素)D i r e c t i o n s:A c c o r d i n g t ot h es e n t e n c e m e a n i n g f i l l i nt h eb l a n k w i t ht h e p r o p e rf o r m o f t h e w o r d m a r k e dA,B,Ca n dD.1.T h e f a i l u r e h i mf r o mk e e p i n g o n t r y i n g a n d a t l a s t h eb e c a m e a r e a l f a i l u r e.A.e n c o u r a g e dB.c o u r a g eC.d i s c o u r a g e dD.c o u r a g e o u sP a r t I I I.G r a m m a t i c a l S e n s i t i v i t y(语法感知力)S e c t i o nA.W o r d s i nS e n t e n c e s(句子中的单词)D i r e c t i o n s:C h o o s e t h eb e s t a n s w e r t h a t h a s t h e s a m e g r a mm a t i c a l f u n c t i o na s t h e c u ew o r d(提示词).1.J O H Nt o o ka l o n g w a l k i n t h ew o o d s.T h e c u ew o r dC h i l d r e n i nb l u e j e a n sw e r e s i n g i n g a n dd a n c i n g i n t h e p a r k.A B C DP a r t I V.S e m a n t i cA n a l y s i s(语义辨析)S e c t i o nA.V o c a b u l a r y(词汇)D i r e c t i o n s:C h o o s e t h eb e s t a n s w e r t h a t h a s t h e s a m em e a n i n g a s t h e c u ew o r d(提示词).1.p r o l o n g e d(t h e c u ew o r d)A.p r o m p tB.d e c r e a s e dC.d i f f i c u l tD.e x t e n d e dS e c t i o nB.W o r dA n a l o g y(词语类比)D i r e c t i o n s:A c c o r d i n g t o t h e s e m a n t i c r e l a t i o n s b e t w e e n t h e c u ew o r d s(提示词)c h o o s e t h e b e s t a n s w e r.1.m o u n t:h o r s e::t r a i n(t h e c u ew o r d s)A.s t a b l eB.s h o eC.r i d eD.b o a r dP a r tV.P a i r e dA s s o c i a t i o n(配对联想)S e c t i o nA.S p e l l i n g C u e(拼写提示)D i r e c t i o n s:A c c o r d i n g t o t h em e a n i n g o f t h e c u ew o r d(提示词)p r o n o u n c e db y t h e d i s g u i s e dw o r d(伪装词)c h o o s e t h eb e s t a n s w e rw h i c hh a s t h e s a m em e a n i n g a s t h e c u ew o r d.1.r e s t r n t(t h e c u ew o r d/t h e d i s g u i s e dw o r d)A.f o o dB.s e l f-c o n t r o lC.s l e e pD.s p a c e e x p l o r e r87第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究P a r tV I.I n d u c t i v eA n a l y s i s(归纳分析)S e c t i o nA.L a n g u a g eA n a l y s i s(语言分析)D i r e c t i o n s:A n a l y s e t h e l a n g u a g e r u l e s f o r t h e c u es e n t e n c e(提示句)a n d t r a n s l a t e t h es e n t e n c e i n t oE n g l i s h.提示句 T h e c u e s e n t e n c e汉语E n g l i s h一个英俊的男孩喜欢一条跑着的狗㊂Ah a n d s o m eb o y l i k e s a r u n n i n g d o g.T h e l a n g u a g e r u l e s(语言规则)汉语E n g l i s h男孩,一个男孩b o y,ab o y狗,一条狗d o g,ad o g英俊的,跑着的h a n d s o m e,r u n n i n gT h e s e n t e n c e t ob e t r a n s l a t e d(翻译句子)汉语一条英俊的狗喜欢一个跑着的男孩㊂E n g l i s h t r a n s l a t i o n.P a r tV I I.M e m o r y(记忆)S e c t i o nA.V o c a b u l a r y M e m o r y(词汇记忆)D i r e c t i o n s:F i r s t l o o k a t t h eE n g l i s hw o r d s,t o g e t h e rw i t h t h e i rC h i n e s e e q u i v a l e n t s,a n d t h e n c h o o s e t h eb e s t a n s w e r a c c o r d i n g t o t h e c u ew o r d(提示词).汉语E n g l i s h桔子汁j u i c e公牛o x儿子s o n1.公牛(t h e c u ew o r d)A.a n i m a lB.s t i c kC.j u m pD.o x参考文献:[1] C O C H R A NJL,M C C A L L UM RR,B E L LSM.T h r e eA s:H o wd o a t t r i b u t i o n s,a t t i t u d e s,a n d a p t i t u d e c o n t r i b u t e t of o r e ig n l a n g u a g e l e a r n i n g[J].F o r e i g nL a n g u a g eA n n a l s,2010,43:566-582.[2] DÖR N Y E I Z,S K E HA NP.I n d i v i d u a l d i f f e r e n c e s i n s e c o n d l a n g u a g e l e a r n i n g[C]//D o u g h t y CJ.T h eH a n d b o o ko f s e c-o n d l a n g u a g e a c q u i s i t i o n.O x f o r d:B l a c k w e l l,2003:589-63.[3] C A R R O L LJB.I m p l i c a t i o n s o f a p t i t u d e t e s t r e s e a r c h a n d p s y c h o l i n g u i s t i c t h e o r y f o r f o r e i g n l a n g u a g e t e a c h i n g[J].I n t e r-n a t i o n a l j o u r n a l o f p s y c h o l i n g u i s t i c s,1973(2):5-l4.[4] S K E HA NP.I n d i v i d u a l d i f f e r e n c e s i n s e c o n d l a n g u a g e l e a r n i n g[J].S t u d i e s i n s e c o n d l a n g u a g e a c q u i s i t i o n:275-298.[5] A B R A HAM S S O N N,H Y L T E N S T AM K.T h e r o b u s t n e s s o f a p t i t u d e e f f e c t s i nn e a r-n a t i v e s e c o n d l a n g u a g e a c q u i s i t i o n[J].S t u d i e s i n s e c o n d l a n g u a g e a c q u i s i t i o n,2008,30(4):481-509.97成都师范学院学报2020年6月[6] D E K E Y S E RR,A L F I-S HA B T A YI,R A V I DD.C r o s s-l i n g u i s t i c e v i d e n c e f o r t h e n a t u r e o f a g e e f f e c t s i n s e c o n d l a n g u a g ea c q u i s i t i o n[J].A p p l i e d p s y c h o l i n g u i s t i c s,2010,31(3):413-438.[7] G R A N E N A G.A g ed i f f e r e n c e s a n dc o g n i t i v e a p t i t u d e s f o r i m p l i c i t a n de x p l i c i t l e a r n i n g i nu l t i m a t e s e c o n d l a n g u a g ea t-t a i n m e n t[D].U n p u b l i s h e dP h Dd i s s e r t a t i o n,M a r y l a n d:U n i v e r s i t y o fM a r y l a n d,2012.[8] G R A N E N A G,L O N G M.A g e o f o n s e t,l e n g t h o f r e s i d e n c e,l a n g u a g e a p t i t u d e,a n du l t i m a t eL2a t t a i n m e n t i n t h r e e l i n-g u i s t i c d o m a i n s[J].S e c o n d l a n g u a g e r e s e a r c h,2013,29(3):311-343.[9] E R L AM R.L a n g u a g e a p t i t u d e a n d i t s r e l a t i o n s h i p t o i n s t r u c t i o n a l e f f e c t i v e n e s s i n s e c o n d l a n g u a g e a c q u i s i t i o n[J].L a n-g u a g e t e a c h i n g r e s e a r c h,2005,9(2):147-171.[10] S H E E N Y.T h e e f f e c t o f f o c u s e dw r i t t e n c o r r e c t i v e f e e d b a c k a n d l a n g u a g e a p t i t u d e o nE S L l e a r n e r s a c q u i s i t i o no f a r t i-c l e s[J].T E S O L q u a r t e r l y,2007,41(2):255-283.[11] HWU F,S U N S.T h ea p t i t u d e t r e a t m e n t i n t e r a c t i o ne f f e c t so nt h e l e a r n i n g o f g r a mm a r r u l e s[J].S y s t e m,2012,40(4):505-521.[12] V A N P A T T E N B,B O R S TS.T h e r o l e s o f e x p l i c i t i n f o r m a t i o n a n d g r a m m a t i c a l s e n s i t i v i t y i n p r o c e s s i n g i n s t r u c t i o n:n o m i n a-t i v e a c c u s a t i v e c a s em a r k i n g a n dw o r d o r d e r i nG e r m a nL2[J].F o r e i g n l a n g u a g e a n n a l s,2012,45(1):92-109. [13] V A NP A T T E NB,B O R S TS.T h e r o l e s o f e x p l i c i t i n f o r m a t i o n a n d g r a mm a t i c a l s e n s i t i v i t y i n t h e p r o c e s s i n g o f c l i t i c d i-r e c t o b j e c t p r o n o u n s a n dw o r do r d e r i nS p a n i s hL2[J].H i s p a n i a,2012,95(2):270-284.[14] Y I L MA ZY.R e l a t i v e e f f e c t s o f e x p l i c i t a n d i m p l i c i t f e e d b a c k:t h e r o l e o fw o r k i n g m e m o r y c a p a c i t y a n d l a n g u a g e a n a l y t-i c a b i l i t y[J].A p p l i e d l i n g u i s t i c s,2013,34(3):344-368.[15]戴运财.语言学能对二语习得的影响[J].外语教学与研究,2006(6):451-459.[16]戴运财,蔡金亭.二语习得中的语言学能研究:回顾㊁现状㊁思考与展望[J].外国语,2008(5):80-89.[17]顾伟勤.重谈语言学能 外语学习中个体差异的一个重要构成[J],中国外语,2008(6):62-67.[18] S K E HA NP.Ac o g n i t i v e a p p r o a c h t o l a n g u a g e l e a r n i n g[M].O x f o r d:O x f o r dU n i v e r s i t y P r e s s,l998.[19] S K E HA NP.T h e o r i s i n g a n du p d a t i n g a p t i t u d e[C]//R O B I N S O NP.I n d i v i d u a l d i f f e r e n c e s i n i n s t r u c t e d l a n g u a g e l e a r n-i n g.P h i l a d e l p h i a:J o h nB e n j a m i n sP u b l i s h i n g C o m p a n y,2002:69-94.[20] C R O N B A C H LJ,M E E H LPE.C o n s t r u c t v a l i d i t y i n p s y c h o l o g i c a l t e s t s[J].P s y c h o l o g i c a l b u l l e t i n,1955(52):281-302.[21] C HOM S K Y N.A s p e c t s o f t h e t h e o r y o f s y n t a x[M].C a m b r i d g e:M I TP r e s s,1965.[22] G A R D N E R H.F r a m e s o fm i n d:t h e t h e o r y o fm u l t i p l e i n t e l l i g e n c e s[M].N e w Y o r k:B a s i cB o o k s,1983.[23] V I C O R Y AC,A S H E RJ J.T h e p a i r e d a s s o c i a t e t a s k a s a p r e d i c t o r o f f o r e i g n l a n g u a g e f l u e n c y[J].T h e j o u r n a l o f p s y-c h o l o g y,1966(64):29-32.[24]秦晓晴.外语教学研究中的定量数据分析[M].武汉:华中科技大学出版社,2003.O nL a n g u a g eL e a r n i n g P o t e n t i a l T e s t C o n s t r u c tB UJ i e m i n(F o r e i g nL a n g u a g e sS c h o o l,Z h e j i a n g G u a n g s h aC o l l e g eO fA p p l i e dC o n s t r u c t i o n,D o n g y a n g,Z h e j i a n g322100,C h i n a)A b s t r a c t:L a n g u a g eL e a r n i n g P o t e n t i a l T e s t C o n s t r u c t(h e r e i n a f t e r r e f e r r e d t o a sL L P T C)i s t h e b a s i s o f l i n g u i s t i c s a n d c o g n i t i v e s c i e n c e o f t h e c o m p i l a t i o no f l a n g u a g e l e a r n i n gp o t e n t i a l t e s t p a p e r.T h i s p a p e r d e f i n e s t h e c o n c e p t o fL L P T C,e s t a b l i s h e s t h e f r a m e w o r kf o r t h ec l a s s i f i c a t i o no fL L P T C,d i s c u s s e s t h e r e p r e s e n t a t i o no fL L P T Cf a c t o r s a n d p e r f o r m s t h e v e r i f i c a t i o no f t h e s t r u c t u r ev a l i d i t y o fL L P T Cf a c t o r s. T h i s p a p e r i s a t h e o r e t i c a l e x p l o r a t i o n o f L L P T C,a n d p r o v i d e s a t h e o r e t i c a l f r a m e w o r k f o r t h e c o m p i l a t i o n o f l a n g u a g e l e a r n i n gp o t e n t i a l t e s t p a p e r.K e y w o r d s:l a n g u a g e l e a r n i n g p o t e n t i a l;l a n g u a g e a p t i t u d e;l e a r n i n g a p t i t u d e;t e s t c o n s t r u c t;v e r i f i c a-t i o no f s t r u c t u r e v a l i d i t y(责任编辑:赵华责任校对:罗布) 08。
交际语言能力模型的构念效度研究
随着智能机器人技术得到快速发展,社交技能逐渐成为研究的热点。
而社交交际中的交际语言能力是机器人的重要组成部分,可以帮助机器人更好的介入到社会中。
因此,研究人员努力设计和开发出交际语言能力模型。
交际语言能力模型是一种可用于提高机器人的话语表达技能的模型。
它主要涉及话语表达的表示形式,提供机器人语言表达的工具,为机器人提供情感和关系技术等。
它把机器人话语表达技能拆分成几个独立和有系统连接的领域,以期更深入地认识机器人交际语言能力。
传统的交际语言能力模型一般包括:意义建构、表达策略、语用能力和情绪交际能力。
模型的有效性是人们关注的重要问题。
因此,开展模型效度研究是确定模型的有效性的有效方法,很多研究者提出了构念效度的概念,其中的思想就是以构思的形式,来研究交际语言能力模型的有效性。
构念效度是社会科学研究中的一种评估方法,它专注于表达模型概念能力的有效性。
构念效度研究的关键是构建一个有效的模型,以估计模型的有效性,并从内在意义出发,详细地分析交际语言能力模型的可用性。
构念效度研究流程主要包括:阐述模型的范围,遴选适当的评测方法,将模型融入到实际的语言表达活动中,根据评估结果调整模型,并且重新评估它。
构念效度能够帮助研究者对机器人交际语言能力模型进行有效的评估,从而有助于更好地提高机器人语言能力。
未来,希望能有更多的研究者带入更广泛的研究,以提供更完整、更有效的交际语言能力模型。
浅析《人文英语3》的语言测试与评估王宇本文是以国家开放大学(以下简称“国开”)为非英语专业开设的公共英语课程《人文英语3》(以下简称《人3》的期末考核为基础, 试从“构念”、“任务特征”和“效度研究”三个维度对其进行结构分析与评价,论述了语言评估与测试在非英语专业英语教学中的重要作用,并探讨合理设置《人3》科目测试目标和内容的基本思路。
引言近年来,在外语教学领域的专家与学者们越来越关注语言评估与测试的研究。
其中,英语语言测试是对英语语言教学效果、英语学习者英语各方面能力的测量和评估,是英语教学中一个不可分割的环节。
广大英语教师已经意识到语言测试与评估是英语专业教学和非英语专业教学的重要组成部分。
它不仅是衡量外语教学成效和提高教学质量的重要手段,而且是为教学服务的。
因此为了更好地服务于成人学生群体,国家开放大学(以下简称国开)针对他们学习的实际需求,在公共英语课程的语言评估测试中,进行了改革与创新,推出《人文英语》等系列课程。
其中《人3》是为人文类非英语专业(专升本)第一学期开设的全新公共英语课程。
通过学习本课程,学生应能熟练使用其中的2000个左右词汇,包括在职场中常用的词汇和短语,以及在相关职业活动中最基本的英语词语及表达方式,能在涉及法学、社会工作、汉语言、教育等相关专业的商务环境中进行基本交流;使他们提升在人文情境中使用英语进行交际的实际能力。
1 语言测试与评估的理论语言测试(主要指外语测试)是多种学科的结合体,是一门成熟的跨学科的综合性学科。
(李华田,补爱华:2003)众所周知,教学成评估相辅相成。
韩宝成教授认为对基于任务的教学进行评估既应包括形成性的,又要包括终结性的:既有过程评估,又有结果评估,但核心是对学生的学习成绩做出评价,由此便产生了基于任务的语言测试。
时至今日,由Bachman教授所提出的交际语言模式已经对语言测试的发展产生了深远的影响。
也就是说,大量的语言测试与评估的研究不断地证明,语言测试的设置更加需要全面的考虑。
语言测试中的构念效度研究
1.引言
在考虑到语言测试发展、解释和使用时首要考虑的就是效度。
那么什么是构念效度?如何更好地理解构念效度?该效度与其他效度的不同之处是什么?
2.构念及构念效度
2.1构念
要想理解什么是构念效度,首先要明白什么是构念(construct)。
从心理学的角度来看,构念指的是人类头脑中存在的一种特质、水平、能力或技巧(Brown,2000:9)。
在教育测量领域,构念就是一种能力(Wiley,2002),“指成功完成特定任务所要求的人类特征”。
Ebel和Frisbie(1991:108)将构念解释为“有关人类行为某一方面的心理构建或理论概念,是既不能够直接测量也不能够直接观察的。
”构念效度是指某个心理测验在多大程度上正确地验证编制测验的理论构想。
《标准》(APA,1999)將构念视为一个测验拟测的概念或特征。
这是从广义上将构念来指测验所涉及测量的概念或特征。
实际上,构念的选择对考试内容、考试方式和分数意义的解释息息相关,是效度研究的基础,也对考试的设计和评价起着重要的作用。
2.2 构念效度
如何更好的理解构念效度呢?在教育测量领域,上述讨论的内容效度、准则关联效度和构念效度这三种类型效度都是作为整体构念效度的不同方面。
语言测试者认为这种把构念效度作为整体观点是一种新的发展。
理论界对构念的定义有不同的看法,因此,通过识别他们是如何解释应答一致性来定义构念(Messick 1981)。
Loevinger(1957:636)最早提出要把构念效度作为整体效度来看待。
在80 年代,这一观点逐渐得到人们的认同:构念效度不再作为效度的一种证据,而应包括内容和标准证据、信度及其它与理论验证有关的方法(Messick 1975,1980,1988,1989;Anastasi 1986)。
其中影响最大的是Messick 的“效度整体观”。
Messick(1988,1989)进一步丰富了效度理论,对测试的解释和使用提供了证据基础。
图表1呈现的就是Messick效度观。
根据图表可以看出效度的证据基础既包括测试分数的解释还包括测试分数的使用。
对于测试解释的证据基础涉及到构念效度实证研究,而这个构念效度是作为在理论语境中与其他构念存在隐含的关系。
对于测试使用中的证据基础既包含了与构念效度也包含了相关性/实用性。
效度的后果基础涉及到对测试分数的解释和使用。
对于测试解释的后果基础要对价值意义作出判断,也就是这个隐含关系是好是坏,是可取还是不可取等。
而对于测试使用中的后果基础涉及到对社会后果的判断,这种价值语境涉及测试使用的隐含后果与实际应用在
测试中的影响。
概括起来,Messick 对效度理论的贡献主要表现在:(1)明确了效验的对象是测试分数的解释和使用,而不是测试本身(Davies,2003);(2)确立了构念的核心地位,加强了对构念效度作为效度整体概念的一致认识(Alderson & Banerjee,2001;Davies,2003);(3)把效度的涵盖范围由分数意义扩展到相关性和使用(relevance and utility)、价值意义及社会后果(Shepard,1993)。
构念效度是效度的最本质内容,内容效度和效标关联效度都是用来服务和支持构念效度的(刘万伦,2006 :108)。
美国心理学会、美国教育研究学会和国家教育测量协会1999年出版的《教育与心理测验的标准和指南》中,已经用构念效度来统一定义效度。
构念效度不仅是决定考什么和怎么考,而且回答为什么这样考,而且是检验语言测试质量的重要参照依据。
就是考试中的试题是否考了相关的内容,测试结果与测试要求是否相关、指向是否完全一致,测试是否对教与学发挥积极推进作用等。
构念效度的重要性更体现在出该测试是否有用的问题(缪学,2010:39)。
语言学家Bachman L. F. &A. Palmer认为,构念效度是指依据考试成绩所做的一切结果和解释是否有意义的问题(Bachman L. F. &A. Palmer,1996)。
也就是说一次考试成绩是否考查了学生的语言能力,就是要看我们的构念效度如何。
构念效度的建立是一个过程,在这个过程中,测试设计者首先提出关于能力或特质(trait)的理论假设即所谓构念,然后对构念进行操作性定义并根据构念编制和实施测试,最后对测试结果进行分析,检验测试结果与构念的一致性程度。
3.结语
当前把效度作为一个统一概念使用,效度是衡量语言测试的重要标准之一。
涉及到我们对测试分数解释和使用是否适当和正确。
构念效度研究又处于效度研究的核心地位,也是测验代表语言学习基本理论程度的指标。
构念效度验证研究测试所测量的能力,为测试提供理论基础。