当前位置:文档之家› 基于项目反应理论的测验编制方法研究

基于项目反应理论的测验编制方法研究

基于项目反应理论的测验编制方法研究
基于项目反应理论的测验编制方法研究

考试研究2006年10月第2卷第4期ExaminationsResearchOct.2006Vol.2,No.4

基于项目反应理论的

测验编制方法研究

戴海琦【摘要】本文在简单介绍项目反应理论的基础上,从计量分析的角度,深入探讨了应用项目反应理论编制各种测验的一般步骤;探讨了项目反应理论题库建设方法及基于题库的测验编制方法;探讨了标准参照测验合格分数线的划分方法。

【关键词】项目反应理论测验编制题库合格分数线

作者简介戴海琦,教授,江西师范大学教育学院。江西南昌,330027。

一、项目反应理论简介

现代测验的编制必须有科学的理论指导。从测验计量角度来看,指导当前测验编制的实用理论唯有经典测验理论与项目反应理论两种。作为一种科学的测验理论,经典测验理论以其发展早、成熟早的优势,在测验编制指导上占据了主要地位,为测验的发展作出了巨大贡献,并且至今还在起着重要的作用。可预见的是在今后一段时期内,经典测验理论将还会继续为测验编制作贡献。但是,由于历史的原因,经典测验理论的理论体系与计量模型上确实也存在一些先天不足。随着社会的进步和科学的发展,测验实践已对测验的品质和性能提出了更高、更多的要求,经典测验理论在面对这些新要求时已显得力不从心。此时,应运而生的是项目反应理论。项目反应理论以31

《考试研究》第2卷第4期

其更系统的理论体系、更严谨的逻辑体系和更完整的计量体系受到测量理论工作者和实践工作者的欢迎。项目反应理论成为许多大规模测验和特殊类型测验的主要指导理论,特别是那些需要精确计量的测验更不能没有项目反应理论的指导。

项目反应理论(ItemResponseTheory,IRT)于20世纪50年代初正式创立。

美国学者洛德和丹麦学者拉希各自独立的工作均为项目反应理论的创立作出了重大贡献。1959年,伯思鲍姆给出了项目反应理论的logistic模型,打开了IRT实际应用的大门。1969年日本学者塞米吉玛给出的多维评分模型突破了IRT仅用于双值评分试题的限制,90年代以后,可实用的多维测量模型的出现消除了人们头脑中IRT只能用于单维品质测量的印象。目前,IRT最成功也是最多的应用主要在三个方面,其一是用于指导需要精确计量的,规模较大的一些教育考试的编制;其二是用于指导具有个性化特征的计算机化自适应测验的编制,其三是将测量与认知科学结合,起分析认知特征、诊断认知结构的作用。IRT应用的成功,除了依赖于自身理论的不断发展和各种实用模型的开发,还依赖于用于估计各种模型参数的计算机软件的成功开发,著名的如BILOG、WINMLOG、WIMPASC等等。

项目反应理论的一个重要思想是:测量所测的是人的潜在的心理品质,称其为潜在特质。这种潜在特质可能是一维的,也可能是多维的,测量人的潜在特质用的工具是一个一个的测验项目。具有特定潜在特质的被试在特定项目上正确作答的概率应该是可估计的,而且可以料定的是,随着个体潜在特质水平的增长,其在此项目上正确作答的概率也会增大。如果所测潜在特质是一维的,那么,在项目上正确作答的概率相对于被试潜在特质水平的变化将形成一条S形曲线。这条S形曲线是中心对称的(参见附图1)。

曲线的形态和位置完全是由测验项目的特征所决定的。测验项目越难,曲线的位置越向右移,项目越容易,曲线的位置越向左移。项目对被试的区分能力越强,曲线中心点的斜率越大、曲线越陡,项目对被试的区分能力越弱,曲线中心点的斜率越小,曲线越趋平缓。我们记这一维潜在特质为θ,记随θ而变的概率为P(θ)。理论上θ的值阈是正、负无穷的。随着θ趋向于正无穷,则32

基于项目反应理论的测验编制方法研究

P(θ)趋向于1,即曲线以P(θ)=1为上渐近线。随着θ趋向于负无穷,P(θ)有可能趋

向于0,

也有可能趋向于一接近0的正数。如果P(θ)不趋于0,这就意味着,潜在特质水平再低的被试,在该测验项目上也有一定的正确作答的可能性,在项目反应理论中这个值通常记为C,被称为伪机遇水平,类似于经典测量理论中的猜测度,有时也就简单地称其为猜测度。在项目反应理论中将S形曲线的中心对应的θ值记为b,曲线在θ轴上的位置也就由曲线中心点位置所确定。前面说过,曲线在θ轴方向上的位置实际上是该项目难度的反映,因此b值被

定义为项目的难度,

b值越大,曲线越靠右,项目越难,b值越小,曲线靠左,项目越易。如果一个被试的潜在特质水平θ恰等于难度b,那么该被试在此项目上正确作答的概率应为P(θ=b)=(1+C)/2。前面还说到,测验项目对被试的区分能力越强,曲线中心点的斜率越大,因此,项目反应理论将过曲线中心点的切线的斜率作为项目的区分度,记为α(实际中α等于切线正切值乘以常数

2π!)。读者可以看到,

曲线在中心点附近越陡峭,潜在特质水平θ处于中心点附近的被试,其正确作答该项目的概率变化越显著,即θ只要有很小的变

化,

P(θ)就有较大的变化。所以根据P(θ)的变化,就可以将被试水平高低有效地加以区分。为了准确地再现项目难度b、区分度α、猜测度C与被试能力θ的

图1三参数S

形曲线33

《考试研究》第2卷第4期

关系,研究者找了许多函数去拟合这条S形曲线,其中既精确又实用的一个就是著名的Logistic函数,其表达式如下:

P(θ)=c+(1-c)/{1+exp[-1.7α(θ-b)]}(1)

式1被称作一维潜在特质的三参数Logistic模型。通常称其为项目特征函数。如果测验项目无猜测作答正确的可能,则C参数为0,模型变为双参数Logistic模型。如果所有测验项目的区分能力相同,也即S形曲线中心点切线斜率均相等,则可固定α为1,模型成了单参数Logistic模型。Logistic单、双、三参数模型均用于双值记分题的作答概率的刻画,是项目反应理论最基础的模型。经过近半个世纪的努力,项目反应理论的模型现在已经很多了,既有用于双值记分题的模型,又有用于多值记分题的模型;既有用于一维潜在特质的模型,又有用于多维潜在特质的模型。同时还开发出许多用于各种特殊形式测验数据的模型。从一定意义上说,应用项目反应理论指导测验编制实质上是在项目反应理论的思想方法指导下,应用某个合适的模型去分析、筛选项目,去组合编制试卷,以达到精确测量被试某种潜在特质的目的。

由于项目反应理论体系的科学性,应用项目反应理论指导测验编制具备以下五个主要优点:

(一)项目反应理论中被试潜在特质水平量表与项目难度量表是同一量表。这就给组卷时针对被试水平选择相应难度项目提供了极大的便利。

(二)项目反应理论中,在已知个体特质水平和项目参数的情况下,可以应用模型估计该被试的作答行为(估出正确作答概率),进而可以估计个体在测验上的作答真分数。这为宏观调整试卷结构提供了计量依据。

(三)项目反应理论中,根据其所定义的项目信息函数和测验信息函数,可以估计各项目及总测验对被试施测的测量误差。这为组拼测验提供了精确的计量指标。

(四)项目反应理论的项目参数估计独立于被试群体,这个优点使得项目反应理论能将在不同群体上施测所估的项目参数统一于同一系统,为建设大型题库提供了方便。

(五)项目反应理论的被试特质水平参数估计独立于测验项目的组合,34

基于项目反应理论的测验编制方法研究

既不受所测具体项目的影响,也不受测题数量的影响。这为编制个性化的自

适应测验提供了保障。

二、项目反应理论指导测验编制的一般步骤

项目反应理论测验编制与经典测验理论的测验编制从测验目标、测验

内容、测验能力层次等方面的心理学、教育学分析来说,基本上是相同的,因

此以下重在研究测验编制各步骤中计量分析的理论与技术。

(一)测验设计

应用项目反应理论编制测验时,测验设计必须着重考虑的一点是选择

哪一个测验模型。模型选择的原则是既能适合测验的需要又尽量简化。选择

模型首先要分析测验所测潜在特质的维度,是单维的还是多维的。如果确有

证据证明所测潜在特质是单维的,则可以选择单维模型。如果有证据证明所

测潜在特质是多维的,模型选择还有两种方法:其一是选择一个多维模型,

同时精确计量所测特质的各个维度;其二是将整个测验分成若干个一维的

分测验,这也是经典测验中遇到这类测验时的常用方法,则每个分测验还是

可以分别用单维模型拟合它。分析测验所测潜在心理特质维度的方法,除了

从心理学、教育学理论作结构分析外,还可以应用因素分析的方法。如果因

素分析结果仅有一个因素,则单维性就得到了保障。在实际检验时,根据实

测数据求出各项目间的两两相关,构成相关矩阵,然后在相关矩阵基础上估

出约相关矩阵,求出其第一和第二特征根。有学者认为,若两特征根之比在5

以上,即可认为测验是单维的,不必再往下分析。否则可做完因素分析,据因

素分析结果数据组配分测验,以保证各分测验的一维性。

确定了选择单维模型还是多维模型后,要考虑的是选择双值记分模型

还是多值记分模型。这完全是依据测验中所使用的题型决定的。如果所有试

题都是双值记分题,则可选用相对比较简单的双值记分模型;如果测验中试

题都是多值记分的,则应选择多值记分模型;如果是两种题型混用的,则可

以统一选择多值记分模型,将双值记分题看作多值记分题的特例。模型选择

还需考虑的问题是选择参数模型。如果认为测验中所有项目均不存在猜测

作对可能,则可选双参数模型,如果进一步认为测验中所有项目的区分能力

35

《考试研究》第2卷第4期

是相等的,或是要求它们相等,则可以选择单参数模型。显然,模型参数越少,计算处理越简单。项目反应理论中还有许多适合各种特殊测验的模型,比如专门计时的模型,既计分又计时的模型,还有简单机械重复只记错误次数的模型等。测验编制者必须根据自己的需要选择合适的模型。一般的教育心理测验普遍使用的还是单维双值记分模型和单维多值记分模型,它们不像多维模型那么复杂,数据处理相对比较简单,而且基本上能满足一般教育与心理测验的需要。

(二)项目参数估计与项目筛选

编制测验必须有基本材料,测验项目是测验的主要材料。项目的质量直接影响测验的质量,因此在组编测验之前必须对测验项目的质量有非常清晰的了解。测验项目质量既要从定性角度分析,又要从定量角度分析。定性角度主要考虑项目的题型、内容科学性和内容属性、测量的能力层次等等,这些要求与经典测量理论的分析要求基本是一致的,我们这里主要讲项目的定量分析。无论是经典测验理论还是项目反应理论,项目的定量分析都是先根据需要估出反映项目质量的各种性能参数,一般包括项目难度、项目区分度和项目猜测度三项指标。这些参数的估计在两种理论中是完全不同的。

经典测验理论主要是应用矩阵法各自独立估算的,而在项目反应理论中却是根据所选择的模型应用极大似然法估计的。为了精确估计项目参数,研究者在算法上作了很多研究,最新的算法是应用EM算法的边缘极大似然估计方法了。当然,一般的测验骗制并不需要都去亲自开发项目参数估计软件,而只要根据自己的需要去选择合适的商业软件即可。如果模型只是单维双值记分模型,可以选用BlLOG、MicroCAT,如果模型是单维多值记分模型,可以选用WINMLOG、WINPARSC。如果不使用外文版软件,可以选用笔者所在江西师大现代教育与心理测量研究开发中心在WINDOWS平台上开发的ANOTE软件。该软件可解决以上两种模型的参数估计问题。

完成了项目参数的估计,就可以在此基础上分析项目质量,筛选测验项目。项目难度是项目筛选的参考指标,难度值的高低并不是单个项目取舍的依据。应该考虑的是,作为所选测验项目整体,其构成的难度分布与测验所36

基于项目反应理论的测验编制方法研究

要求的难度分布是否拟合,就以此作为取舍的原则,如果某些必需的难度水平上出现断层,则还要考虑再增加项目。项目区分度和项目猜测度都是单个项目取舍的指标。一般来说,项目猜测度越小,项目质量越好,因此要保留项目猜测度较小的项目,最大一般不应超过0.25。项目区分度原则上应该是越高越好。一个项目的区分度到0.5以下就可以考虑删除。当然,区分度高低还与命题技术有关,如果总体上区分度均不高,则也不过分苛求。在项目反应理论指导下作项目筛选还要注意在参数估计中未能正常收敛的那些项目,一般来说,这样的项目只占少数,但都是质量较差的项目,必须舍弃。

(三)测验组卷与测量质量调查

对测验项目从定性与定量两个角度逐一作了质量分析之后,应该按测验编制计划将项目组拼成合乎要求的试卷,这也有定性和定量两方面的要求。定性要求主要包括题型比例、内容比例、能力层次比例等方面,这些要求与做法也与经典测验理论的要求是基本一致的。定量方面的要求最主要的就是测验的信度要高,也可以说是测量的精度要高。无论是经典理论还是项目反应理论都要求测验有高信度、高精度、低误差。但在做法上两种测验理论却不相同,相比较而言,项目反应理论的方法操作性更强,也更为精细准确。项目反应理论为达到精确计量测量误差的目的,给出了一个测验项目信息函数的概念,并给出了一个测验项目信息函数的计算公式如下:Ii(θ)=Pi′(θ)/[Pi(θ)?(1-Pi(θ)](2)其中Ii(θ)表示第I个项目的信息函数。Pi(θ)为双值记分题的项目特征函数,式中分子部分为Pi(θ)的导数。如果是多值记分题,则项目信息函数为:

Ii(θ)=

ij=0

!Pij′(θ)=0Pij′(θ)Pij(θ)(3)其中Pij(θ)为项目I的第j等级的运算特征函数。项目信息量的大小总体上

由项目的区分度和猜测度决定,同时它也是潜在特质水平θ的函数。这意味着

不仅不同的项目有不同的信息量,而且同一项目对不同特质水平被试施测

也有不同的信息量。在双值记分模型中,每项目都在难度值点附近取得最大

信息量值。项目反应理论认为项目信息函数是可加的,故而可以求得测验信

37

《考试研究》第2卷第4期

息函数如下:

!Ii=Ii(θ)(4)I(θ)=

j=0

其中I(θ)表测验信息函数,n为测验的项目数。项目反应理论进一步提出,测验施用于被试后所产生的测量标准误差可由下式求出:

ME(θ)=1/I(!)(5)同样可见的是,在项目反应理论中,测量误差也是被试潜在特质水平θ的函数,其值完全由测验信息函数I(θ)决定。I(θ)越大,测量标准误差越小,测验精度越高。而I(θ)是由所有项目的Ii(θ)累加而成的。因此,在项目反应理论的测验组卷之后,可以通过计算测验信息函数I(θ)对所组测验的质量进行调查。如果对于某个θ区间上的信息量不满意,则可以通过调整测验项目结构来解决。当然,如果对整个测验在θ全阈所提供的信息量都不满意,则改善的方法就不是调整全卷项目组合结构了。这时的可选方法有两个,一个是加大全卷题量,此方法有效但有限,因为还要考虑对被试的疲劳影响;另一个方法是修改提高项目质量。具体地说就是要努力提高每个项目的区分度,降低每个项目的猜测度,这与经典理论的方法是一样的。测验质量调查在操作上还可依据信息函数描出信息函数曲线,直观地加以考查,增加或删除一个项目的效果,都可以在信息函数曲线图上形象地得到反映。这给实际应用信息函数指标组编测验提供了极大方便。

三、项目反应理论题库建设与测验编制

(一)项目反应理论题库建设的意义

在应用项目反应理论指导测验编制的一般步骤中我们看到,在完成项目分析后要按组卷计划组拼试卷,如果觉得组拼出的试卷质量不满意,那就需要调整全卷项目结构,这意味着手头必须有一定量的已知各方面性能(包括项目参数)的项目,否则是不可能有目的地调整的。这还仅仅是编一份测验。如果我们主持的是一项大型测验,经常需要命制多份同类试卷,甚至是规格平行的多份试卷,那么,靠每次临时命题、临时施测估计参数、分析项目质量再来组拼试卷就会疲于奔命,而且效果也不好。在这种情况下,我们建38

基于项目反应理论的测验编制方法研究

议应该建设一个以项目反应理论为指导的题库。建设一个项目反应理论的

题库,除了能在命制一般试卷时有充足的各种规格的项目供调用外,还能完

成经常性的命题组卷任务,能保证各次所组试卷的平行性。另外,有了题库,

还能实现测验编制中的某些特殊要求,如准确划定目标参照测验的合格分

数线,实施计算机化自适应测验等。

(二)项目反应理论题库建设的基本要求

为不同测验类型建设的题库应该有不同的要求,同时也有一些共同的

基本要求。优质的项目反应理论的题库,应满足以下一些基本要求:其一,题

库要有足够的题量。当然,题量的大小还与题库使用的频率有关,与各试卷

允许的项目重复率有关,但一般来说,一个题库的题量不能低于1000题。其二,题库中试题不仅要在题型分布、内容分布、能力层次分布和难度分布上

都是均匀的(或者符合组卷要求的),而且在这四维联合分布上也是均匀的(或

者符合组卷要求的)。这显然是一项非常细致的工作。其三,所有入库试题性

能参数齐全、同一参数所用数字系统的参照系统一,整个题库层次结构清楚,存储和调用都非常方便。其四,题库应该有足够的安全性,保密措施健全。其五,要建成一个可经常维护的动态题库,以保证及时剔除陈旧项目,修

订或增加新项目,保持整个题库的适时性和适用性。

(三)项目参数等值方法

以上所列题库建设各条基本要求在经典理论题库中也是必备条件,但

其保证措施却与经典理论库题不同。特别注意第三条中“同一参数所用数字

系统的参照系统一”这一要求的含义。严格讲,在不同被试群体上所估计的

项目参数其参照系是不一致的。要建设一个大型题库,项目测试很难都在同

一被试群体施测,应用了不同被试群体,则其参照系就会有差异。为解决这

一问题经典测验理论就要求每一被试样本都是总体的随机样本,同时要保

证对总体的充分代表性。这样,经典理论就认为,在不同群体样本上,所估参

数的参照系“自然”是一致的。理论上如此,但实际上差异还是存在的。因此,

经典理论题库中题目参数参照系的统一性始终是一个难以完全解决的问题。

在项目反应理论中,这一目标可以通过实现项目参数的等值转换来完成。

39

《考试研究》第2卷第4期

项目参数等值就是在等值设计的基础上,应用统计方法实现将某一参数系统向另一参数系统转换的过程。所以实现项目参数等值的第一步工作就是要做好等值设计。项目参数等值设计采用的是锚测验非等组设计,具体做法是在两份待等值的试卷中安排四分之一左右的相同项目,称为锚题,两份试卷分别施测于不同被试群体后,分别估计项目参数。这时,这一批作为锚题的项目就拥有两套不同的项目参数,并分别定义在不同的参数系统上。应该注意的是,各个项目虽有不同参数,仅仅是表现的形式不同而已,本质上都是对同一项目相同性能的反映。因此,两套参数之间肯定存在着某种“关系”。项目参数等值的第二步工作就是寻找隐藏在两套参数之间的这一“关系”。研究发现,在不同被试群体上估出的不同参数系统之间存在着一种线性关系,具有一对线性转换系数A与B。这一关系可以表述如下:

b1=Ab2+Ba1=a2/Ac1=c2!1=A!2+!

###

##

##"

######

#$

B(6)

其中a、b、c、θ的脚标1与2分别代表两套不同的参数。项目参数等值最主要的工作就是估出A与B这一对系数。在已知同一批项目(锚题)两套参数的条件下求取转换关系系数A与B的方法有好几种,最理想的一种方法称为项目特征曲线等值法。其基本原理是:对一个被试用一批项目(锚题)进行测量,用不同的参数系统表达,其累计得分概率,也即其真分数是相等的,即应有:

ni%P1j(!1)=ni

%P2j(!2)(7)其中n为锚题题数,P1j(θ1)和P2j(θ2)是不同参数系统下表述的项目得分概率,也即所用项目反应模型。应用式6的关系式代换其中某些参数,由于随机误差原因,等式两边也会稍有误差,这时可在误差最小的原则之下估出关系参数A和B。这一过程在常用IRT软件均有专用功能模块、一般测验编制者只要应用软件的这一功能即可完成这一步工作。求出关系系数A和B后,其他项40

基于项目反应理论的测验编制方法研究

目(即非锚题)均可应用这一关系完成从第2系统向第1系统的转换,从而完成

统一参数的任务。如果建设大型题库,参数的等值还需在更宏观的层面上统

筹设计,才能达到全库项目参数系统统一的整体目标。

(四)基于项目反应理论题库的测验编制

在建起项目反应理论大型题库的基础上编制测验,形式上已成了按测

验编制计划从题库中调用符合要求的项目组拼合格试卷的过程。这一过程

可以由组卷者启动题库管理模块中的检索功能,由组卷者逐项选题,不断与

计划比较、调整,最后组成符合要求的试卷。要注意的是,组卷计划常常是多

目标要求的,比如有题型比例要求,有内容比例要求,有难度比例要求,还有

能力层次比例要求等,这些都是组卷中常要的用来维护测验信度或效度的

指标。在项目反应理论中还有具体的测验信息量(即测验误差量)要求。在由

人工组卷时,这些目标将由人来统筹兼顾,最终组成合乎要求的试卷。在题

库基础上组卷时,这一过程多数已被作为题库的附加功能开发成软件模块,

即计算机自动组卷功能块。计算机自动组卷模块的编制原理由简单到复杂

也是各不相同的。简单的犹如模仿单题检索,其过程中人的干预较多。复杂

的采用线性规划模型,求取多目标统筹兼顾的最优解,组成最优试卷。在这

里我们不想详细介绍具体的组卷模型,因为从一定程度上说,这已是数学模

型和计算机技术问题了。我们在这里还是得说测验的计量学问题。我们在介

绍项目反应理论一般的测验编制方法时曾经说过,测验编制者在编制测验

时要计算所编测验的测验信息函数,对于不满意的地方,比如说在某个特质

水平区间上信息量太低,测量精度达不到要求,则可以调整或修改入选项目,以增加信息量。在题库基础上组拼测验试卷时这一过程依然需要,但是

形式有所变化。在题库基础上组拼项目反应理论测验试卷时,组卷者更多的

是预先对整个测验的测验信息函数提出一个设想,给出一条希望要达到的

测验信息函数曲线,然后将其作为组卷目标之一输入计算机,由计算机自动

执行。这一“希望要达到的测验信息函数”在项目反应理论中被称为测验目

标信息函数。在计算机组卷过程中,每选入一个测验项目,就要计算所有已

入选项目的信息函数总量,并将其与目标信息函数比较,测验信息量离目标

41

《考试研究》第2卷第4期

信息量差得最远的特质水平区间,将是选取下一项目首先关注的区间,具体做法是,在题库中选取在该区间有最大信息量的项目加入试卷,以便能够以最少的项目满足目标信息函数的“目标”要求。在计算机自动组卷中,目标信息函数也作为目标之一被组卷过程统筹兼顾。但是这个目标必须被预先设置好,或者说被预先设计好。设计测验目标信息函数的依据是什么呢?宏观上说是依据测验的性质:如果所编是一常模参照测验,则要使测验在所有特质水平上都有同样高的测量精度,因而测验目标信息函数的曲线几乎呈一均匀分布;如果是一选拔测验,要求测验在选拔点附近有最高的测量精度,则测验目标信息函数应该在选拔点附近有高峰值,而其他远离选拔点的特质水平区间上则不必苛求。从微观上说,设计者就是要根据测验的性质,对各个特质水平区间上的测量精度提出具体要求,然后按公式5逆求在该区间上的信息量,这就是目标信息函数在该点的值。若是希望在某个θ值点上测量标准误差不要大于0.2,则在该点的目标信息量就应是25以上。这一要求已相当于经典测验理论要求测验的信度达到0.96的水平了。

项目反应理论在题库基础上组卷,由于可以预先设计测验目标信息函数,组卷中又能精确计量“目标”的达到与否,则可以保证最终组成的试卷的测量精度在所有特质水平区间上都是合乎组卷者要求的,这是项目反应理论在题库基础上组卷的一大优点。

四、目标参照性测验合格分数线划分技术

目标参照性测验编制有许多特殊要求,最重要的是测验内容领域的界定和合格标准的确定问题。关于测验内容领域的界定,无论是经典测量理论还是项目反应理论方法都是一样的。关于合格标准的确定,在项目反应理论中有其特殊的方法。合格标准的确定从形式上看就是要划定一条合格分数线。通常我们希望所划合格分数线应该具备以下几条性质:其一,所划合格分数线是准确的,即所划分数线确实能将合格者与不合格者准确分开。其二,所划合格分数线是稳定的,即对于同一测验的不同备份,所划合格分数线是稳定的。其三,测验在所划定的合格分数线附近有较高的测量精度,以减少误判。其四,所划分数线最好能符合社会习惯。例如,我国百分制试卷通42

基于项目反应理论的测验编制方法研究

常认可的合格线为60分。在经典测验理论中有许多划合格分数线的方法,但常感计量不太精确,要同时满足四个条件也很困难。在项目反应理论中,在有题库的基础上,给所编目标参照性测验划分数线有其独特的方法,结果会比经典理论方法更令人满意。下面以所建为二值记分题库为例,在此基础上编制目标参照性测验,介绍划定合格分数线的方法。

设所建题库共有N个项目,每个项目的参数均已知,所用模型为P(θ)。请学科专家判定,作为该学科的一个合格者,如果作答所有N个项目,其最低的正确作答比例应为多少?若专家最终所设所定合格比例为π,根据下式,估计与π所对应的θ值,记为θ:

1N

i=1

!Pi(θ)-π0=0(8)

这个θ实际上是专家所认定的潜在特质水平合格值。对于从该题库中组

编的任何一份含有N个项目的试卷,其合格分数线F0由下式求得:F0=

i=1

!Pi(θ0)(9)由上式可以看到,从该题库中组编的任何一份试卷,由于入选项目的性

能不同,其合格分数线F0可都不相同,但其对应的潜在特质水平值都是一样的,而且都对应于全题库的特质水平合格值,因此都是准确的和稳定的。如

果要控制在合格分数线附近有理想的精度,则只要在组卷过程中将那些在

合格线θ点附近有最大信息量的项目选入,累加至目标信息量即可。这样既保

证了测量精度,又有较短的测验长度。如果还想使所求的F0符合某个预定值,

比如百分之六十的比例,则可以通过调整入选项目的难度使式9计算的结果

向预定比例逼近。这样就能使所得合格分数线同时满足前述四个条件。当然,组编目标参照测验还有一些其他条件需要满足,但上述计量过程一般不

会与其他要求的条件构成绝对矛盾,也就是说,一般都是可以通过统筹调整

而同时满足的。

43

《考试研究》第2卷第4期

参考文献:

[1]漆书青、戴海琦:《项目反应理论及其应用研究》,江西高校出版社,1992年12月。

[2]漆书青、戴海琦、丁树良:《现代教育与心理测量学原理》,高等教育出版社,2002年8月。

[3]WimJ.VanderLinden&RonaldK.hambleton:《HandbookofModernItemResponseTheory》1995.[4]MichaelJ.Kolen&RobertL.Brennan:《TestEquating》1995.

StudyonTestDevelopingMethodBased

ontheItemResponseTheory

DaiHaiqi

JiangxiNormalUniversity,330027

Abstract:Onthebasisofbriefintroductionoftheitemresponsetheory,thearti-cledeeplydiscussesthegeneralstepsofapplyingtheitemresponsetheorytodevelopvarioustests,andthemethodofitembankestablishmentfromtheviewoftheitemresponsetheory,themethodoftestdevelopingmethodbasedonitembank.Finally,thearticlediscusseshowtosetthequalifiedscoreincriteria-refer-encetest.

Keywords:itemresponsetheorytestdevelopingitembankqualifiedscore44

语言测试理论

语言测试理论(Language Assessment) 定义(definition) Anastasi (1982)认为“测试实质上是对受试者的某种能力所做的客观的标准化测量”。Carroll 则认为测试是一套程序,旨在诱发受试者的行为反应, 并以此推导出他的相关特征(a procedure designed to elicit certain behavior from which one can make inferences about certain characteristics of an individual)。 二、英语语言测试理论 (一)英语语言测试类型 Hughes(1989:9-19)依据测试目的、测试方法和方式、测试题型、测试成绩判别标准和判卷标准进行分类, 将英语测试分为五大类。 1.依据测试目的进行分类 ( 1 )水平测试(proficiency test) 语言水平测试是为了测试人们语言能力而设计的。( 2 )学业成绩测试(achievement test)学业成绩测试是用来考查被试在学习英语某一阶段或最终阶段的成功程度。 (3)诊断测试(diagnostic test): 诊断测试是用来鉴别学生的优势和不足之处,用来确定什么样的教学是必要的。(4)能力测试(aptitude test) 能力测试不以任何教学大纲为基础,目的在于检验测试者是否具备了学习某种语言的潜力。 2.依据测试方法和方式进行分类 (1)直接测试(direct testing) 直接考察学生某一方面语言能力的测试称为直接测试。 (2)间接测试(indirect testing) 间接测试即通过测试某一技能所具备某种能力来发现学生这方面的语言能力。 3.依据测试题型进行分类:分散点测试指每次只测试一个项目的测试,每道试题只测试某一特定的语法结构等,属于间接测试。 4.依据测试成绩判别标准进行分类 (1)常模参考型测试(norm-referenced testing) (2)标准参考型测试(criterion-referenced testing) 以某种特定的语言能力标准作为判别标准的测试称为标准参考测试。 5.依据判卷标准进行分类 (1)客观测试(objective testing) (2)主观测试(subjective testing) Proceeding from or taking place within a person's mind such as to be unaffected by the external world. (二)测试基本要素:效度 效度是一个单一而又整体的概念(a single, unitary concept) 是指测试的内容及其方式是否符合测试的目的和要求。即测试所能取得某些目标的有效程度。一项测试只有能够准确测试它所希望测试的内容才具有效度。 1.内容效度(content validity) 内容效度指测试内容。包括所要测试的语言技能、语言结构等方面有代表性的要素 2.标准效度(criterion-related validity)作为对比的其他测试结果就成了检验现有测试的效度标准。 标准效度主要包括同期效度(concurrent validity)和预测效度(predictive validity)

IDDQ测试原理及方法

电流测试 1 电流测试简介 功能测试是基于逻辑电平的故障检测,逻辑电平值通过测量原始输出的电压来 确定,因此功能测试实际上是电压测试。电压测试对于检测固定型故障特别是双极型工艺中的固定型故障是有效的,但对于检测CMOS 工艺中的其他类型故障则显得 有些不足,而这些故障类型在CMOS 电路测试中是常见的对于较大电路,电压测试 由于测试图形的生成相当复杂且较长,因而电流测试方法被提出来电流测试的测试集相当短,这种测试方式对于固定型故障也有效。 CMOS 电路具有低功耗的优点,静态条件下由泄漏电流引起的功耗可以忽略,仅 表示,Q 代表静态 在转换期间电路从电源消耗较大的电流。电源电压用V DD (quiescent) ,则IDDQ 可用来表示MOS电路静态时从电源获取的电流,对此电 流的测试称为IDDQ 测试,这是一种应用前景广泛的测试。 IDDQ 测试概念的提出时间并不很长,但自半导体器件问世以来,基于电流的测量一直是测试元器件的一种方法,这种方法即所谓的IDDQ 测试,用在常见的短接 故障检测中。自从Wanlsaa 于1961 年提出CMOS 概念, 1968 年RCA 制造出第一 块CMOS IC 和1974 年制造出第一块MOS 微处理器以来,科研人员一直研究CMOS 电路的测试,而静态电流测试则作为一项主要的参数测量1975 年Nelson 提出了IDDQ 测试的概念和报告,1981 年M.W Levi 首次发表了关于VLSI CMOS 的测试论文,这就是IDDQ 测试研究的开端。其后,IDDQ 测试用来检测分析各种DM0S 缺陷,包括桥接故障和固定型故障1988 年W.Maly 首次发表了关于电流测试的论文, Levi, Malaiya, C.Crapuchettes, M.Patyra , A .Welbers 和S.Roy 等也率先进 行了片内电流测试的研究开发工作,这些研究奠定了IDDQ 测试的基础、1981 年Philips semiconductor 开始在SRAM 产品测试中采用片内IDDQ 检测单元,其后 许多公司把片内IDDQ 检测单元用在ASIC产品中,但早期的IDDQ 测试基本上只为政府、军工资助的部门或项目所应用。 直到20 世纪80 年代后期,半导体厂商认识到IDDQ 测试是检测芯片物理缺陷 的有效方法,IDDQ 测试才被普遍应用, CAD 工具也开始集成此项功能。目前,IDDQ 测试也逐渐与其他DFT结构,例如扫描路径测试、内建自测试、存储器测试等,结合在一起应用。20 世纪80 年代,电流测量基本上是基于片外测量电路的,80 年代末片上电流传感器的理论和设计方法得以提出,随后这方面所开展的理论 和方法研究纷纷出现,IEEE Technical Committee on Test Technology 于1994 年成立一个称做QTAG ( Quality Test Action Group ) 的技术组织,其任务是研 究片上电流传感器的标准化问题,但该组织得出了电流传感器不经济的结论,因此,1996 年结束标准化研究工作,目前电流传感器的研究主要针对高速片外传感器。 IDDQ 测试是源于物理缺陷的测试,也是可靠性测试的一部分1996 年SRC (Semiconductor Research Corporation )认定IDDQ 测试是20 世纪90 年代到 21 世纪主要的测试方法之一。IDDQ 测试已成为IC 测试和CAD 工具中一个重要内容,许多Verilog/HDL 模拟工具包含IDDQ 测试生成和故障覆盖率分析的功能。 IDDQ 测试引起重视主要是测试成本非常低和能从根本上找出电路的问题(缺陷)所在。例如,在电压测试中,要把测试覆盖率从80%提高10% ,测试图形一般要

软件测试基本流程及要求

软件测试基本流程与要求(提纲) 1目标 制定完整且具体的测试路线和流程,为快速、高效和高质量的软件测试提供基础流程框架。 最终目标是实现软件测试规范化,标准化。 2测试流程说明

3测试需求分析 测试需求是整个测试过程的基础;确定测试对象以及测试工作的范围和作用。用来确定整个测试工作(如安排时间表、测试设计等)并作为测试覆盖的基础。而且被确定的测试需求项必须是可核实的。即,它们必须有一个可观察、可评测的结果。无法核实的需求不是测试需求。所以我现在的理解是测试需求是一个比较大的概念,它是在整个测试计划文档中体现出来的,不是类似的一个用例或者其他. ·测试需求是制订测试计划的基本依据,确定了测试需求能够为测试计划提供客观依据; ·测试需求是设计测试用例的指导,确定了要测什么、测哪些方面后才能有针对性的设计测试用例; ·测试需求是计算测试覆盖的分母,没有测试需求就无法有效地进行测试覆盖; 3.1测试方法与规范 3.1.1测试方法 随着软件技术发展,项目类型越来越多样化。根据项目类型应选用针对性强的测试方法,合适的测试方法可以让我们事半功倍。以下是针对目前项目工程可以参考的测试方法: ?β测试(beta测试)--非程序员、测试人员 β测试,英文是Beta testing。又称Beta测试,用户验收测试(UAT)。

β测试是软件的多个用户在一个或多个用户的实际使用环境下进行的测试。开发者通常不在测试现场,Beta测试不能由程序员或测试员完成。 当开发和测试根本完成时所做的测试,而最终的错误和问题需要在最终发行前找到。这种测试一般由最终用户或其他人员完成,不能由程序员或测试员完成。?α测试(Alpha测试)--非程序员、测试人员 α测试,英文是Alpha testing。又称Alpha测试. Alpha测试是由一个用户在开发环境下进行的测试,也可以是公司内部的用户在模拟实际操作环境下进行的受控测试,Alpha测试不能由该系统的程序员或测试员完成。 在系统开发接近完成时对应用系统的测试;测试后,仍然会有少量的设计变更。这种测试一般由最终用户或其他人员来完成,不能由程序员或测试员完成。?兼容性测试--测试人员 兼容性测试是指测试软件是否可以成功移植到指定的硬件或者软件环境中,例如在B/S项目中各个不同浏览器之间的测试。 ?用户界面测试-UI测试--测试人员 用户界面测试,英文是User interface testing。又称UI测试。 用户界面,英文是User interface。是指软件中的可见外观及其底层与用户交互的部分(菜单、对话框、窗口和其它控件)。 用户界面测试是指测试用户界面的风格是否满足客户要求,文字是否正确,页面是否美观,文字,图片组合是否完美,操作是否友好等等。UI 测试的目标是确保用户界面会通过测试对象的功能来为用户提供相应的访问或浏览功能。确保用户界面符合公司或行业的标准。包括用户友好性、人性化、易操作性测试。

测试流程及测试理论方法

测试流程及测试理论方法 一、测试流程 1.软件开发流程: 需求分析—>概要设计—>详细设计—>编码开发—>测试—>维护 2.测试流程为: 单元测试/集成测试—>系统测试/自动化测试—>性能测试—>验收测试 3.目标: 3.1制定完整且具体的测试路线和流程,为快速、高效和高质量的 软件测试提供基础流程框架。 3.2最终目标是实现软件测试规范化、标准化、自动化。 4.测试流程说明: 5.测试需求分析 测试需求是整个测试过程的基础;确定测试对象以及测试工作的范围和作用。用来确定整个测试工作(如安排时间表、测试设计等)并作为测试覆盖的基础。而且被确定的测试需求项必须是可核实的。即,它们必须有一个可观察、可评测的结果。无法核实的需求不是测试需求。所以我现在的理解是测试需求是一个比较大的概念,它是在整个测试计划文档中体现出来的,不是类似的一个用例或者其他. ·测试需求是制订测试计划的基本依据,确定了测试需求能够为测试计划提供客观依据;

·测试需求是设计测试用例的指导,确定了要测什么、测哪些方面后才能有针对性的设计测试用例; ·测试需求是计算测试覆盖的分母,没有测试需求就无法有效地进行测试覆盖。 5.1测试方法与规范 5.1.1测试方法 随着软件技术发展,项目类型越来越多样化。根据项目类型应选用针对性强的测试方法,合适的测试方法可以让我们事半功倍。以下是针对目前项目工程可以参考的测试方法: ?β测试(beta测试)--非程序员、测试人员 β测试,英文是Betatesting。又称Beta测试,用户验收测试(UAT)。 β测试是的多个用户在一个或多个用户的实际使用环境下进行的测试。开发者通常不在测试现场,Beta测试不能由程序员或测试员完成。 当开发和测试根本完成时所做的测试,而最终的错误和问题需要在最终发行前找到。这种测试一般由最终用户或其他人员完成,不能由程序员或测试员完成。 ?α测试()--非程序员、测试人员 α测试,英文是Alphatesting。又称Alpha测试. Alpha测试是由一个用户在开发环境下进行的测试,也可以是公司内部的用户在模拟实际操作环境下进行的受控测试,Alpha测试不能由该系统的程序员或测试员完成。

(完整word版)英语测试理论及方法课程教学大纲.docx

《英语测试理论及方法》课程教学大纲 课程编码: 30615027学分:2总学时:36 说明 [ 课程性质 ] 《英语测试理论及方法》为英语专业的专业选修课。 [ 教学目的 ] 通过对考试流程中主要环节的介绍和演示,让学生了解语言测试的基本理论及具体操作 方法,以便使他们在未来教学实践中提高命题水平和考试质量。 [ 教学任务 ] 在介绍国内外语言测试领域最新理论研究及实践的基础上,结合我国英语教学实际及学 习特点,让学生了解语言测试流程中的诸多环节,如考试的宏观,微观功能,考试总体设计,掌握单项语言能力 /技能的测试方法,包括命题,施考,考试分析及考试信息反馈。 [ 教学内容 ] 英语测试概述、考试功能及其类别、考试要素、考试规范的制定、测试评估手段及其功 能、阅读测试、写作测试、听力测试、口语测试、试卷设计与施考事项、考试成绩反馈、考 试成绩分析 (1) 、考试成绩分析 (2) 、 [ 教学原则和方法] 教学原则:本教材使用主要体现以人为本的思路,采取启发式教育方法,鼓励学生积极思考,在学习过程中发现和解决问题。 教学方法:讲授与讨论实践相结合。 [ 先修课程要求] 语言学基本理论 [ 学时分配 ] 本课程在第七学期开设,共一学期,每周 2 学时,共36 学时。 序号内容 1英语测试概述、考 试功能及其类别 2考试要素、 考试规范的制定 3测试评估手段及其功 能、阅读测试 4写作测试、听力测试5口语测试、试卷设计 与施考事项 学时安排 理论课时实验课时习题课时上机课时小计426 426 426 426 426

6考试成绩反馈、考试426成绩分析 (1) 、 (2) 总计241236 [ 教材及必要参考书] 教材 :邹申参考书 :武尊民杨任明《简明英语测试教程》高等教育出版社, 2000《英语测试的理论与实践》外语教学与研究出版社 年。 , 2002年。 大纲内容 第一部分英语测试概述 [ 教学目的和要求] 教学目的:了解语言测试的基本理论及近些年测试方面的发展动态,在教学中正确,恰当地使用测试。 教学要求:掌握语言测试的基本理论。 [ 内容提要 ] 第一节 一、四种英语语言测试法 二、近 20 年的发展动态 三、当代国内外大规模考试一览 [ 教学重点与难点问题] 教学重点:四种英语语言测试法 教学难点:语言测试的基本理论 [ 复习思考题 ] 1.英语测试领域里是否有不同的语言测试法? 2.在过去 20 年中英语语言测试界所关注的热点有那些? 第二部分考试功能及其类别 [ 教学目的和要求] 教学目的:关注考试广义上的作用和意义。 教学要求:掌握考试的功能及其分类。 [ 内容提要 ] 第一节 一、测量、考试与评估 二、考试功能 三、考试类别 [ 教学重点与难点问题] 教学重点:考试的功能及其分类 教学难点:考试的功能 [ 复习思考题 ] 1.教学过程中为什么要考试? 2.除了教学外考试,还有其它用途吗?

测试的基本理论和方法

【转】浅谈软件测试的基本理论与方法 随着软件应用领域越来越广泛,其质量的优劣也日益受到人们的重视。质量保证能力的强弱直接影响着软件业的发展与生存。软件测试是一个成熟软件企业的重要组成部分,它是软件生命周期中一项非常重要且非常复杂的工作,对软件可靠性保证具有极其重要的意义。 在软件的测试过程中,应该应用各种测试方法,以保证产品有一个较高较稳定的质量。根据不同的生产过程进行不同的测试,包括黑盒测试、cc霜白盒测试、携程网酒店预定功能测试、系统测试、压力测试、安装/卸载测试、兼容性测试、α 测试、β 测试等。 软件测试是整个软件开发过程中一段非常重要的阶段,在测试过程中如能按照测试的基本过程来进行测试,软件的质量能有所保障。 我做了一个半月的测试,就现在的感觉而言,其实做测试必开发却是是轻松了一点,不是那么的累脑子,但是测试也是很深的一门学问,针对于不同的公司,产品不一样,所要求的测试的技术也不一样。有的公司测试很轻松,但是有的公司测试也是经常加班熬通宵的 1软件测试基础 信息技术的飞速发展,使软件产品应用到社会的各个领域,软件产品的质量自然成为人们共同关注的焦点。不论软件的生产者还是软件的使用者,均生存在竞争的环境中,软件开发商为了占有市场,必须把产品质量作为企业的重要目标之一,以免在激烈的竞争中被淘汰出局。用户为了保证自己业务的顺利完成,当然希看选用优质的软件。质量不佳的软件产品不仅会使开发商的维护难度和用户的使用本钱大幅增加,还可能产生其他的责任风险,造成公司信誉下降,继而冲击股票市场。在一些关键应用(如民航订票系统、银行结算系统、证券交易系统、自动飞行控制软件、军事防御、核电站安全控制系统等) 中使用质量有问题的软件,还可能造成灾难性的后果。 软件危机曾经是软件界甚至整个计算机界最热门的话题。为了解决这场危机,软件从业职员、专家和学者做出了大量的努力。现在人们已经逐步熟悉到所谓的软件危机实际上仅是一种状况,那就是软件中有错误,正是这些错误导致了软件开发在本钱、进度和质量上的失控。有错是软件的属性,而且是无法改变的,由于软件是由人来完成的,所有由人做的工作都不会是完美无缺的。问题在于我们如何避免错误的产生和消除已经产生的错误,使程序中的错误密度达到尽可能低的程度。 1.1软件测试的概念 软件测试是为了发现错误而执行程序的过程。或者说,软件测试是根据软件开发各阶段的规格说明和程序的内部结构而精心设计一批测试用例(即输进数据及其预期的输出结果),并利用这些测试用例去运行程序,以发现程序错误的过程。

编制试卷的六个基本步骤

编制试卷的六个基本步骤: ①确定实验目的②制定编题计划③确定试题形式④选编题目⑤集合成试卷⑥将测验科学化标准化⑦编写考试说明。 育 ;常模参照测验: 是以学生群体的平均分数分布作为参照标准,检查学生们的实际上达到的程度用于学生们的相互比较检查学生团体中的相对位置。 物理教学资源: 是指中学物理教学过程中,能够用于实现教学目标的各种条件的总称。包括人力、物力与自然资源。 试题形式: 1.客观题①填空②选择(填空:再生式客观试题,选择:再认识客观试题) 2.主观题常用的有计算题、作图题、实验设计等。 导入新科常见方法 :①直接导入②旧知识导入③生活实例导入④直观导入⑤故事导入⑥问题导入⑦实验导入。演示实验教学的基本要求 ①要有明确的目的 ②要明显直观(a.要实现象要明显b。仪器简单,过程明了c.多种感官并用,提高感知效率)③要安全可靠,确保成功(a.做好充分准备工作b.确保安全c.正确对待演示中的失误,切忌弄虚作假)④要有启发性 中学物理教学原则: ①科学性、教育性、艺术性相结合的原则 ②激发学生兴趣和探究欲望的原则 ③创设物理环境,突出观察、实验、探究的原则 ④启发思考、教给方法的原则 ⑤联系生活、技术、社会实际的原则 STS教育: 与传统科学教育目标和出发点不同。,主要关注科学、技术与社会之间的相互作用,齐宗旨是使学生在了解科学技术及其社会价值的同时,了解科学技术发展带来的问题,作为公民能够在一定程度上参与科学技术的决策,能够应用科学技术解决个人生活和社会中的问题。中学生的科学素养应包括以下四个方面: 科学知识与技能,科学研究(过程、方法与能力),科学态度,情感与价值观,对科学、技术与社会关系的认识。 科学探究过程: ①提出问题②猜想与假设③制定计划与设计实验④进行试验与收集数据⑤分析与论证⑥评估齐交流与合作 前概念特征 :①广泛性②迁移性③顽固性④共存性⑤情境性 物理教学常用的评价方法有 :观察法、问卷法、成长记录法、测验法和日常非正规评价法 说课内容四说、两写、两展示。①说材料②说学生③说教法学则及依据④说教学过程 写说课板书和授课板书,展示课件和实验

角度测量的原理及其方法

角度测量的原理及其方法 角度测量原理 一、水平角测量原理 地面上两条直线之间的夹角在水平面上的投影称为水平角。如图 3-1所示,A、B、O为地面上的任意点,通OA和OB直线各作一垂 直面,并把OA和OB分别投影到水平投影面上,其投影线Oa和Ob 的夹角∠aOb,就是∠AOB的水平角β。 如果在角顶O上安置一个带有水平刻度盘的测角仪器,其度盘 中心O′在通过测站O点的铅垂线上,设OA和OB两条方向线在水 平刻度盘上的投影读数为a1和b1,则水平角β为: β= b1 - a1(3-1) 二、竖直角测量原理 在同一竖直面内视线和水平线之间的夹角称为竖直角或称垂直 角。如图3-2所示,视线在水平线之上称为仰角,符号为正;视线在 水平线之下称为俯角,符号为负。

图3-1 水平角测量原理图图3-2 竖直角测 量原理图 如果在测站点O上安置一个带有竖直刻度盘的测角仪器,其竖盘中心通过水平视线,设照准目标点A时视线的读数为n,水平视线的读数为m,则竖直角α为: α= n - m (3-2) 光学经纬仪 一、DJ6级光学经纬仪的构造 它主要由照准部(包括望远镜、竖直度盘、水准器、读数设备)、水平度盘、基座三部分组成。现将各组成部分分别介绍如下:1.望远镜 望远镜的构造和水准仪望远镜构造基本相同,是用来照准远方目标。它和横轴固连在一起放在支架上,并要求望远镜视准轴垂直于横轴,当横轴水平时,望远镜绕横轴旋转的视准面是一个铅垂面。为了控制望远镜的俯仰程度,在照准部外壳上还设置有一套望远镜制动和

微动螺旋。在照准部外壳上还设置有一套水平制动和微动螺旋,以控制水平方向的转动。当拧紧望远镜或照准部的制动螺旋后,转动微动螺旋,望远镜或照准部才能作微小的转动。 2.水平度盘 水平度盘是用光学玻璃制成圆盘,在盘上按顺时针方向从0°到360°刻有等角度的分划线。相邻两刻划线的格值有1°或30′两种。度盘固定在轴套上,轴套套在轴座上。水平度盘和照准部两者之间的转动关系,由离合器扳手或度盘变换手轮控制。 3.读数设备 我国制造的DJ6型光学经纬仪采用分微尺读数设备,它把度盘和分微尺的影像,通过一系列透镜的放大和棱镜的折射,反映到读数显微镜内进行读数。在读数显微镜内就能看到水平度盘和分微尺影像,如图3-4所示。度盘上两分划线所对的圆心角,称为度盘分划值。 在读数显微镜内所见到的长刻划线和大号数字是度盘分划线及其注记,短刻划线和小号数字是分微尺的分划线及其注记。分微尺的长度等于度盘1°的分划长度,分微尺分成6大格,每大格又分成10,每小格格值为1′,可估读到0.1′。分微尺的0°分划线是其指标线,它所指度盘上的位置与度盘分划线所截的分微尺长度就是分微尺读数值。为了直接读出小数值,使分微尺注数增大方向与度盘注数方向相反。读数时,以在分微尺上的度盘分划线为准读取度数,而后读取该度盘分划线与分微尺指标线之间的分微尺读数的分数,并估读

《语言测试》课程教学大纲

《语言测试》课程教学大纲 总学时:学分: 理论学时:实验学时: 面向专业:商务英语课程代码: 先开课程:基础英语课程性质:必修课 执笔人:韩小敏审定人:于文杰、王竹青、王玉环 第一部分:理论教学部分 一、说明 1、课程的性质、地位和任务 本课程系为商务英语三年级学生第六学期所开设的一门主干课程,其教学目的在于系统地讲授英语专业四级考试相关的知识,帮助学生顺利通过英语专业四级考试。本课程根据英语专业四级考试的大纲要求,进行相关训练和模拟测试,全面检查学生是否达到四级考试大纲所规定的各项要求。在教学中,通过讲解英语专业四级考试的相关题型以及各个题型的答题技巧,详细解析历年真题和模拟试题,全面提高学生运用各项英语基本技能的能力,如听写文章环节中,学生的理解和书写能力、拼写熟练程度以及标点符号的正确运用;听力理解环节中,学生能听懂英文材料和英语新闻,理解中心大意,抓住主要论点或情节,并根据所听材料进行揣测和分析的能力;完形填空环节中,学生理解短文的意思和结构,补全短文的能力;语法及词汇环节中,学生对语法结构和词语用法的把握能力;阅读理解环节中,学生能掌握所读材料的主旨和大意、了解说明主旨和大意的事实和细节、既理解字面的意思,也能根据所读材料进行一定的判断和推论、既理解个别句子的意义,也理解上下文的逻辑关系的能力;写作环节中,学生能准确理解题目要求,清楚表达思想,严密论证,基本不犯语言错误的能力等等。教学过程中,在提高学生的综合能力的同时,也要注意学生的各项单项技能以及应试能力和技巧的提高,从而帮助学生顺利通过英语专业四级考试。 、课程教学和教改基本要求 语言测试课程的目的在于帮助学生提高应试能力,因此教学材料以历年真题和相关模拟试题为主,教学方式为学生课下做练习、模拟测试,老师课堂上讲解应试技巧和模拟试题解析。 课程的基本要求: 本课程要求讲解深透,融会贯通,理论结合实践,对英语专业四级考试要求有全面的领会和掌

静载检测技术基础理论考试(师)B

2011年江苏省地基基础工程检测技术培训班 静载检测技术基础理论考试(检测工程师)B (满分120分,时间100分钟) 姓名考试号得分 身份证号单位 第一部分客观题部分 一、单选题(每题2分) 1.《江苏省建设工程质量检测行业职业道德准则》第十条:制度公开、。 A.数据公开 B.接受监督 C.人员公开 D.收费公开 2.弦式钢筋计的可测频率范围应大于桩在最大加载时的频率的倍。A.1 B.1.2 C.1.5 D.2 3.试桩与基准桩之间的中心距离应符合。 A.≥2d且>2.0m B.≥4d且>2.0m C.≥2d且>1.0m D.≥1d且>2.0m 4.快速维持荷载法每级荷载的持载时间最少为 h。 A.1 B.1.5 C.2 D.3 5.《建筑基桩检测技术规范》JGJ106-2003规定:为设计提供单桩竖向抗拔承载数据的灌注桩施工时应进行。 A.低应变检测 B.抗压试验 C.超声波检测 D.成孔质量检测 6.单桩竖向抗拔静载试验,在桩身埋设应变式传感器,目的是确定桩身开裂荷载。如出现下列情形,则证明开始开裂。 A. 某一测试断面应变不变,相邻测试断面应变突然增大 B.某一测试断面应变不变,相邻测试断面应变突然减小 C.某一测试断面应变突然增大,相邻测试断面应变也随之增大 D.某一测试断面应变突然增大,相邻测试断面应变可能变小 7.在单桩水平静载试验测量桩身应力或应变中,埋设传感器的纵剖面与受力方向之间的夹角不得大于10°。这是因为。 A.为了保证各测试断面的应力最大值及相应弯矩的测量精度

B.为了便于传感器安装和仪器接收 C.为了保证各检测数据能参加平均,不会出现无效数据 D.以上均不正确 8.地基浅层平板载荷试验采用的是0.5 m2园形承压板,它的有效影响深度约为 m。 A.0.5~0.8 B.1.1~1.5 C.1.5~2.0 D.2.0~2.5 9.岩基载荷试验采用圆形刚性承压板,面积为 m2。 A.1.0 B.0.5 C.0.1 D.0.07 10.压力恒定时,液压千斤顶的出力只与有关。 A.压力 B.压强 C.活塞面积 D.活塞行程 11.检测工程师应是中级以上职称,且持有检测技术培训合格证书。下列不属于其职责范畴的是。 A、负责检测方案的实施; B、检测过程的质量控制; C、检测报告的签发; D、检测数据的分析并编写、审核报告。12.竖向承载水泥土的强度为天的无侧限抗压强度。 A.28; B.30; C.60; D.90 13.进行桩身内力测试,测定土层摩擦力,传感器埋设断面距桩顶和桩底的距离。 A.不宜小于1 倍桩径; B.不宜小于2 倍桩径; C.不宜小于1 m; D.不宜小于0.5m。 14.地基土浅层平板试验时,当压板面积为0.25~0.50m2,承载力特征值可取所对应的荷载,但其值不应大于最大加载量的一半。 A.s/b=0.01~0.015; B.s/b=0.08; C.s/b=0.08~0.012; D.s/b=0.015。 15.静载荷试验,每级荷载在维持过程中的变化幅度不得超过的±10%。A.本级荷载 B.分级荷载 C.分析荷载 D.特征值16.当单桩水平承载力按桩身强度控制时,取水平临界荷载统计值的倍为单桩水承载力特征值。 A.0.5; B.0.8; C.0.9; D.1.0。 17.如果有5根试桩承载力的极差超过平均值的30%,且低值承载力并非偶然的施工质量造成,则按规范要求极限承载力统计值取值。 A.舍去最高值,取4根桩极限承载力的平均值; B.舍去最低值,取4根桩极限承载力的平均值; C.依次舍去最高值后取平均值,直至满足极差不超过平均值的30%; D.以上均不正确。

测验编制步骤

测验编制步骤:8步 1、目的、对象 2、确定结构、确定测验结构, ①根据理论、智力测验有几个因素;人格特质,一个特质是一个维度。 ②因子分析,大致有个设想,初步构思,先是探索,验证,样本不一样,好的 测验要做几次。 首先检查共同度,低于0.5或0.3的题目去除,与其他项目之间的共同成分。 认知能力有两种,斯皮尔曼理论。G因素和S因素,好的0.5以上。 碎石图拐点 因素负荷,各因子负荷分数,能区分、旋转后也不能把负荷集中,去掉。 如两个因子上都是0.4,结构不明确,某一题目属于谁不确定。 题目多时做验证性因素分析 A、首先做单维检验,一个维度属于一个ξ,如12道题, B、4个一加,4个一加,原始分相加,变成三个指标,指标太少,验证性因 素分析做不出来。

项目超过100个,旋转不出来,探索性因素分析旋转不出来。 ③分配权重:30分常识 60分词汇满分相差很大,通过转 换成量表分,变成Z分,转换成量表10分制。 麦卡锡幼儿量表分多的1/2 少的1.5 每个维度转换成30分左右。 有的分测验重要的,权重较大。 3、记分方法 4、常模:用到什么地方,抽样如何抽 A、一种看成是正态分布,知道S和X就可以。转化为Z分。 B、非正态数据,根据常模样本频数分布确定,累积百分数,你的分数一边是分数,以下是百分之多少。 累积百分比算出来了,某一分数对应P,累积百分率多少。 根据常模样本确定每一点的累积百分数。 常模样本分数分布,例如:艾森克 一般T 20~80分

最多90分,一般做到80分 艾森克远远超出80分,偏态。 5、设计项目:数据与资料,与测验相关理论、相关测验。 A、很多测验相互参考,很多人格测验用MMPI题目,有些是参考,有些是搬过来,16PF没有效度量表,187道题,有些被试在人才招聘时都选好的答案,用其它测验效度量表加进去,MMPI或艾森克测谎量表,20个题目,分散开,统计时是单独一个量表。 题目量要大,准备用50道,编100道,最好多一倍,有的是1:1.5,至少要多1/2的题目,便于淘汰。 B、试测:试测样本一般100~200个大样本就行。 目的:* 题目表述学生有无问题,语言方面,可以访谈一下,理解有无困难,定性的,有些项目是否意义有不同理解删掉 * 定量分析,难度,每个选项选的频率,5个选项,1或2个选项几乎是零,项目不合格,不低于5%,最理想的选项分布是正态 的,能力测验,正确答案多、其他错的少一些,但有一选项无人选,删掉。 * 难度:0.5的高些,两边少些,都有,总体难度平均

档案学理论基础-测试-2

试卷提交时间:2014-04-26 17:09:12.883 试卷得分:82.0 1、题型:判断题分值:1 纸张在东汉年间正式发明,从此随着造纸工艺的不断改进与成熟,纸张逐步取代了以往的竹简、木牍等,成为文书和档案的载体。 正确 错误 答案正确 2、题型:判断题分值:1 档案作为存贮和传播知识的原始记录,它在传播知识功能方面,由于受原本、原稿的限制,因而高于其它文献。 正确 错误 答案正确 3、题型:判断题分值:1 1956年3月,国务院常务会议通过了《关于加强国家档案工作的决定》,对档案工作的一系列重大问题作了明确的规定:一是划定了国家全部档案的范围,在中国历史上第一次明确提出了档案是国家的历史财富;二是明确了档案工作的任务,即“在统一管理国家档案的原则下建立国家档案制度,科学地管理档案,以便于国家机关和科学研究工作的利用”;三是确立了档案工作的基本原则;四是提出了加强档案工作的基本任务。 正确 错误 答案正确 4、题型:判断题分值:1 电子文件的管理不遵循来源原则。 正确 错误

答案正确 5、题型:判断题分值:1 档案信息开发利用的客体是社会上各种档案信息的利用者。 正确 错误 答案正确 6、题型:判断题分值:1 档案鉴定不包括对档案真伪的鉴定。 正确 错误 答案正确 7、题型:判断题分值:1 全宗是一个独立的机关、组织或人物在社会活动中形成的档案有机整体。 正确 错误 答案正确 8、题型:判断题分值:1 档案在一定条件下可以转化为情报。 正确 错误 答案正确 9、题型:判断题分值:1 档案价值的形成必须以主体对档案的需要为前提,并与相应的客体结合才能成为可能,而主体需要又是多样的,复杂的,处在不断变化和发展之中。必须站在更高的层次上,用系统的观点和方法去研究档案的价值,促进档案价值的实现。

指南《语言》测试题

《3—6岁儿童学习与发展》语言领域测试卷 一、填空(每空3分,共48分) 1、语言是交流和思维的工具。幼儿期是语言发展,特别是发展的重要时期。P17 2、幼儿的语言能力是在和的过程中发展起来的。P17 3、应为幼儿创设、的语言交往环境,鼓励和支持幼儿与成人、同伴交流,让幼儿想说、、并能得到积极。P17 4、应为幼儿提供丰富、适宜的低幼读物,经常和幼儿一起看图书、,丰富其语言能力,培养阅读兴趣和良好的阅读,进一步拓展学习经验。P17 5、健康领域在(三)生活习惯与生活能力中,制定了三个目标。分别是:(1)具有良好的生活习惯与习惯;(2)具有基本的生活能力;(3)具有基本的安全知识和自我能力。 6、在语言领域“阅读与书写准备”中,有以下三个子目标:(1)喜欢听故事,看图书;(2)具有初步的能力;(3)具有的愿望和初步技能。P24 二、判断(每题4分,共16分) 1、3—4岁幼儿在听不懂或有疑问时能主动提问。()P18 2、幼儿的语言学习应在生活情境和阅读活动中引导幼儿自然而然的产生对文字的兴趣。()P18 3、通过虚线画出的图形轮廓连成实线等游戏,促进手眼协调,同时帮助幼儿学习由上至下和由右至左的运笔技能。( )P27 4、在培养幼儿具有初步的阅读理解能力时要求:3—4岁的幼儿会看画面,能根据画面说出图中有什么,发生了什么事等。()P24 三、选择:(每题四分,共28分) 1、激发幼儿的阅读兴趣,培养阅读习惯可以()(单选)P17 A、经常抽时间与幼儿一起看图书、讲故事。 B、让幼儿背诵一定数量的诗歌、童谣。 C、幼儿阅读中遇到问题时,立即告诉幼儿答案。 D、为幼儿提供一定数量的、有趣的童话书。 2、()岁幼儿会正确书写自己的名字,写画时姿势正确。(单选)P26 A、3-4岁 B、4-5岁 C、5-6岁 3、()岁幼儿懂得按次序轮流讲话,不随意打断别人。P21

软件测试的基本方法和测试理论

动态黑盒测试 不深入代码细节的软件测试方法。常被称为行为测试,因为测试的是软件在使用过程中的实际行为。 首先,从产品说明书获知测试对象的软件的输入和应该得到的输出。 接下来,开始定义测试案例。测试案例:指进行实验用的输入,以及测试软件用的程序。 选择测试案例是软件测试员最重要的任务。不正确的选择可能导致测试量过大或者过小,甚至测试目标不对。准确评估风险,把不可穷近的可能性减少到可以控制的范围是成功的诀窍。 测试基本方法:通过测试vs 失败测试 通过测试:确认软件至少能做什么,而不考验其能力。 失败测试:纯粹为了破坏软件而设计和执行的测试案例,也称为迫使出错测试。蓄意攻击软件的薄弱环节。 在设计和执行测试案例时,总是首先进行通过测试。在破坏性试验之前看看软件基本功能是否实现是很重要的,否则在正常使用软件时就会奇怪为什么有那么多的软件缺陷。 常见的测试案例就是设法迫使软件出现错误提示信息。产品说明书可能会给出这样的功能要求,针对这个问题的测试可能是通过测试也可能是失败测试。可能两者都是。不用去刻意区分,重要的是找到软件缺陷! 选择测试案例:等价分配 等价分配:是指分步骤地把过多(无限)的测试案例减小到同样有效的小范围的过程。也称等价划分。 等价分配技术提供了一个选择哪些数值、舍弃哪些数值的系统方法。 等价类别或者等价区间是指测试相同目标或者暴露相同软件缺陷的一组测试案例。在寻找等价区间时,想办法把软件的相似输入、输出、操作分成组。这些组就是等价区间。 等价分配的目的是把可能的测试案例组合缩减到仍然足以测试软件的控制范围。因为选择了不完全测试,就要冒一定的风险。如果为了减少测试案例的数量过度进行等价分配,测试的风险就会增加。另外,等价区间的划分没有一定的标准,只要足以覆盖测试对象就行了。 数据测试 软件由数据(包括键盘输入、鼠标单击、磁盘文件、打印输出等等)和程序(可执行

计算机基础理论试题

一、单项选择 1.“32位微型计算机”中的32指的是()。 A)微机型号 B)机器字长 C)内存容量 D)存储单位 2.“A”的ASCII码值为65,则()的ASCII码值为69。 A)B B)E C)G D)H 3.CD-ROM是()。 A)一次写入光盘B)只读光盘 C)可改写光盘D)AB二种 4.1个字节可以存放()个标点符号。 A)1 B)2 C)3 D)4 5.2个字节表示()二进制位。 A)16位B)32位C)8位D)4位6.CAD是计算机主要应用领域之一,它的含义是()。 A)计算机辅助教育B)计算机辅助测试 C)计算机辅助设计D)计算机辅助管理 7.c语言是计算机的()语言。 A)机器B)高级C)低级D)汇编8.把二进制数100110转换成相应的十进制数是()。 A)39 B)36 C)38 D)37 9.编译程序的功能是()。 A)对源程序边扫描边翻译执行 B)将高级语言编写的源程序翻译成目标程序 C)解释执行汇编语言程序 D)将汇编语言编写的源程序翻译成机器语言程序 10.表示磁盘存储容量的基本单位是()。 A)位B)字节C)字D)双字11.操作系统是计算机系统中最重要的()软件之一。

A)实用B)应用C)系统D)用户12.操作系统型病毒的特点是()。 A)当系统引导时就装入内存B)破坏性不大 C)有免疫性D)没有传染性 13.处理音频信息的多媒体功能卡是()。 A)软盘控制卡B)硬盘控制卡C)视频卡D)声卡14.串行口的信息传送方式是()传送。 A)一位接一位的依次 B)二位接二位的依次 C)8位(一个字节)同时 D)以上都可以 15.磁带、磁盘、半导体存储器和()属于存储信息的实体。 A)数字B)声音C)图像D)光盘16.磁盘驱动器是()设备。 A)输入B)输出C)输入和输出D)显示17.打印机是一种()。 A)输出设备B)输入设备C)存储器D)运算器18.第四代计算机使用的逻辑器件是()。 A)继电器B)电子管 C)中小规模集成电路D)大规模和超大规模集成电路19.断电不会使存储数据丢失的存储器是()。 A)RAM B)SRAM C)ROM D)DRAM 20.对于负数,将()的最低位加1即可求得其补码。 A)原码B)二进制码C)反码D)补码 21.多媒体计算机系统包括多媒体计算机软件系统和()。 A)音响设备B)显示设备 C)多媒体计算机硬件系统D)打印机 22.高密度软盘每面有()个磁道。 A)80 B)79 C)40 D)39 23.汉字的机内码两个字节的高位是()。

软件测试基本理论

【下载本文档,可以自由复制内容或自由编辑修改内容,更多精彩文章,期待你的好评和关注,我将一如既往为您服务】 软件测试基本概念 1、软件=程序+文档,软件测试=程序测试+文档测试。 “程序”是指能够实现某种功能的指令的集合,“文档”是指软件在开发、使用和维护过程中产生的图文集合。; 2、软件的分类 按功能分:系统软件、应用软件 按技术架构分:单机版软件、C/S结构软件(C是指客户端,S指服务器端)、B/S 结构软件(B是指浏览器) 按照用户划分:产品软件、项目软件 按开发规模划分:小型、中型、大型 3、BUG的定义:软件的BUG指的是软件中(包括程序和文档)不符合用户需求的问题。常见的软件BUG分三种类型:完全没有实现的功能;基本实现了用户需求的功能;实现了用户不需要的功能。 4、测试环境=软件+网络+硬件。搭建环境:真实、干净、无毒、独立 5、软件环境的分类:软件开发环境软件生产运行环境 6、测试用例:指在测试执行之前设计的一套详细的测试方案,包括测试环境、测试步骤、测试数据和与其结果!测试用例=输入+输出+测试环境。测试用例有两个模板,word 和excel,前者适合性能测试,后者适合功能测试。 软件测试分类

1、黑盒测试:指的是把被测的软件看作是一个黑盒子,我们不去关心盒子里面的结构是什么样子的,只关心软件的输入数据和输出结果 白盒测试:指的是把盒子盖打开,去研究里面的源代码和程序结构。 2、静态测试:是指不实际运行被测软件,而只是静态的检查程序代码、界面或文档中可能存在的错误的过程。 动态测试:是指实际运行被测程序,输入相应的测试数据,检查实际输出结果和预期结果是否相符的过程,所以我们判断一个测试属于动态测试还是静态测试,唯一的标准就是看是否运行程序。 注:同一个测试,既有可能属于黑盒测试,也有可能属于动态测试;既有可能属于静态测试,也有可能属于白盒测试。他们之间也有可能交叉。 3、单元测试:编译运行程序——静态测试——动态测试 集成测试:是单元测试的下一个阶段,是指将通过测试的单元模块组装成系统或子系统,再进行测试,重点测试不同模块的接口部分。 4、系统测试:指的是将整个软件系统看作1个整体进行测试,包括对功能、性能,以及软件所运行的软硬件环境进行测试。 5、验收测试:指的是在系统测试的后期,以用户测试为主,或有测试人员等质量保障人员 共同参与的测试,它也是软件正式交给用户使用的最后一道工序. 验收测试又分为α测试和β测试,其实α测试指的是由用户、测试人员、开发人员等共同参与的内部测试,而β测试指的是内侧后的公测,即完全交给最终用户测试。 功能测试:是黑盒测试的一方面,它检查实际软件的功能是否符合用户的需求。功能测试又可以细分为很多种:逻辑功能测试、界面测试、易用性测试、安装测试、兼容性测试等。

飞针测试原理

飞针测试机原理 三句离不开本行,今天给大家介绍下各种测试机的测试原理,我们公司代理的是日本的MICROCRAFT公司生产的EMMA飞针测试机,就是正常检测一块PCB板的开,短路情况. 飞针测试的开路测试原理和针床的测试原理是相同的,通过两根探针同时接触网络的端点进行通电,所获得的电阻与设定的开路电阻比较,从而判断开路与否。 但短路测试原理与针床的测试原理是不同的。由于测试探针有限(通常为4∽32根探针),同时接触板面的点数非常小(相应4∽32点),若采用电阻测量法,测量所有网络间的电阻值,那么对具有N个网络的PCB而言,就要进行N2/2次测试,加上探针移动速度有限,一般为10点/秒到50点/秒,不同的测试方法有:充/放电时间(Charge/discharge rise time)法、电感测量(Field measurement)法、电容测量(Capacitance measurement)法、相位差(Phase difference)和相邻网(Adjacency)法、自适应测试(Adaptive measuring)法等等。 1.1充/放电时间法 每个网络的充/放电时间(也称网络值,net value)是一定的。如果有网络值相等,它们之间有可能短路,仅需在网络值相等的网络测量短路即可。它的测试步骤是,首件板:全开路测试→全短路测试→网络值学习;第二块以后板:全开路测试→网络值测试,在怀疑有短路的地方再用电阻法测试。这种测试方法的优点是测试结果准确,可靠性高;缺点是首件板测试时间长,返测次数多,测试效率不高。最有代表性的是MANIA公司的SPEEDY机。 1.2电感测量法

相关主题
文本预览
相关文档 最新文档