当前位置:文档之家› 谈原始分、标准分及标准分的转换

谈原始分、标准分及标准分的转换

谈原始分、标准分及标准分的转换
谈原始分、标准分及标准分的转换

谈原始分、标准分及标准分的转换

高考自从1977年恢复以来,不断改革、完善,其中标准化考试就是重要内容之一按照国家教委的要求,将逐步在全国范围内推广实施标准化考试.标准化考试是个系统化的过程,包括试题编制的标准化,施测过程的标准化,评分计分的标准化,分数合成及分数解释的标准化等过程,其中分数的标准化最为考生及家长所关注,由子高考的“指挥棒”作用,也会带动其它考试模拟标准化考试,采用标准分记分,并作为评定学生及学校教育教学工作的重要依据,这也将为更广大学生、教育工作者所关注。

一、原始分数

欲知什么是标准分为什么要实施标准分计分还得从什么是原始分说起。

所谓的原始分数就是指在一次考试后,从试卷的卷面上直接得到的分数。原始分数,我们是那样的熟悉,就连幼儿园的小朋友见了90分、100分都非常高兴,可是我们审视

一下原始分制度发现有许多的不足。

1.没有绝对的参照点,或说没有绝对的零点。生活中我们经常买菜、量衣,买菜用秤、量衣用尺,都是以“没有”为计量起点的,即没有一点点重里,没有一点点长度为称量的起始点来进行度量的,那么没有一点重量或长度为计数起始点就是绝对零点。

在教育测量(考试)中,难以寻找到学生成绩等精神特性的绝对零点。如某生数学80分,语文85分,很难找到这两科的绝对零点,因而也就难以比较他哪科学得更好,很可能他的数学成绩处在班级前几名,而语文成绩刚达到班级的平均水平。但作为心理现象(学习结果)的考试,还是有一个参照点来反映学生掌握知识,学习能力的基点的,这个参照点就是零分,但零分并不是绝对的零点,这是一种人为所确定的参照点,因而它是个相对的参照点。恰似我们测量陆地高度时选定海平面为测量高度的参照起始点(零点)一样,零分并不意味着学生一点知识也没有掌握。

考试中出现零分是山命题者所确定的标准决定的,即是由测量难度决定的,因而零分也是相对的。不同科(次)的考试由于难度不同也就有了不同水平的零点,这种因参照

点不同,使得不同科(次)考试分数无法比较.

2.原始分数不具等值性(等距性)。一般的考试原始分数都是以一分为单位的,但这一分单位的意义在不同的科(次)考试中是不同的。“一分”与物理学中的温度概念的“一度”是不同的,每一度的变化对于确定了的物质吸收或放出的热量是一定的(即比热是个常数),但一分值单位所指的内容就难以确定了,同是一分,在试题难度小,分数偏高的学科中的价值较低;而在难度大,分数偏低的学科中的价值较高。说得通俗一些,前面的分数显得“毛”,而后面的分数显得“实”,这样同是一分在不同的科(次)考试

中的意义就不同了。

同是一分值,它在不同科(次)考试中受试题的难易度、区分度及由此而引起的参照点不同和考生的素质状况影响,其一分值单位的意义就不同,反映学生掌握知识,运用知识能力的原始分数就不具有等值性。再就是通过考试所得的分数并不能全面反映一个人的能力水平,由此我们进一步地认识到,在同一次考试中相同的分数差异,并不能说明有相等的能力差异;不同的考生在两次考试中成绩提高幅度(分数)相同,也不能表

明他们提高的能力相同。

3.具有不确定性。任何测量都有误差,而考试作为一种教育测量,有误差更不可避免,也更难以控制。引起误差的主要原因有命题、考试过程中的环境,考试者的行为,被试者的动机及评分等环节。在原始分数制度下,任何一个环节出现误差都会影响分数的准确性,因此,原始分数只能是真实分数的最佳估计,而不是其确切的真实分数。我们不能说60分就一定强于59分.总之,在原始分数制度下,我们不能把分数视为一个

点,而应看作是一个带状区间。

4.具有孤立性。单就某一原始分数,我们无法确切地解释被试的行为。如某生数学考试成绩为80分。仅凭这个孤立的分数我们无法得知该生的数学学习状况,即无法知道与其它学科或与其它同学的相比,他的成绩是高还是低,然而我们却习惯地认为80分,学得不错;俗语说水涨船高,水落船降,如果该生所在集体平均分为90分或50分,

我们能做出同样的评价吗

从上面的分析我们可以看到原始分数有许多缺点,由于原始分数使用久远,以其作为评价学生的学习结果及评价教师的教育教学工作已成为习惯,但习惯了的并不表明其就是科学的。我们还可稍作一下具体的分析。

如“同一学科的两次考试的成绩或同一次考试的不同学科的成绩的比较”,在现实生活中是人们常犯的错误。任何比较都有前提,前提条件基本相同具有可比性,否则就不具可比性。分数比较的条件是参照点相同,单位分值具有等距性,然而不同科(次)的考试命题受主、客观因素的影响,参照点、单位分值难以保持一致,因此不同科(次)考

试分数无法比较是显而易见的。

在现实生活中,人们牢记了“没有比较就没有鉴别”这条真理,却忽视了比较的前提条件。据报道青海省的某小学的一个班在一次38人参加的语文、数学考试中,两科及格人数均为13人,其中夏斐同学这两科成绩分别为79、82,而夏斐的母亲却认为其子学习成绩不好而将其毒打致死。也许该生以往考试都是99或100分,这次突然降至79、82,令这位母亲感到“滑坡”太大这样如何才能成龙成凤呢我们分析一下,由于这次考试采用的是外地试卷,使得与以往的考试由任课教师自己出题的参照点不同,每分值不等值,也就是说此次考试与以往考试不具备可比的条件,而这位母亲却硬性比较,结果酿成了这代悲剧。如果这位母亲能把夏斐的这次考试成绩放在全班中去比较,38人参考,竟有25人之多不及格,由此可见夏斐同学是属于上等生之列,那么我们相信这位母亲是绝对不会将夏斐毒打致死的。这是无知的悲哀,也是原始分数的缺点所致的

结果。

再如“学校按学生各种总成绩进行排名次,各种升学考试也是依总分来决定取舍,”这更是不易被人们觉查的常犯的错误。不同科命题把握的标准不同,其参照点水平不同,每分值不等值,因而不同科目的分数不具可加性,其道理如尽人所知的“美元、日元和人民币不能相加”一样,然而却人为地将各科总分相加,其结果对学生、家长和老师都会产生不良的影响,该取上的没取上,不该录的反而录上了。如1984年高考理科数学题较难(平均分36. 6分),考生分数普遍较低,这样数学在总分中所占比例便相对小些,由于其分数较低,数学这一工具学科的价值在其它科的高分(尽管其价值很低,但分数较高)合成的总分中被淹没了,我们现今的招生政策是凭着总分决定取舍的,那么与数学相近、相关的专业就难录到理想的学生,这从根本上违背了“择优录取”的原则。上述以原始分数来评价学生乃至老师的种种做法是不公正、不公平、也是不科学的,也表

明实施标准化考试采用标准分记分的必要。

二、标准分数

标准分数又简称标准分,它是以一个群体考生的平均分为常膜,以标准差为单位构成的,即是以原始分与平均分之差(离差)除以标准差的商。其意义表示某人的原始分数

在一个群体中所处的相对位置的一个量数。

标准分的计算公式为:

式中Z为某考生的标准分数,x为该生的原始分数,为全体考生的原始分数的平

均数。

采用标准分后,能克服原始分数的许多缺点,标准分数的特点是:

1.标准分给出了个体在总体中的位置,离差()大体反映了考生分数在总体中的位置,但离差还需用统一尺度“标准差”来衡盆,这样离差与标准差之比,就全面地反映了个体在总体中的位置。如果Z>0,则考生分数在平均分之上;如果Z<O,其成绩在平均分数之下;如果Z=0,考生成绩处在总体平均分的水平。

2.原始分数(X)转换成标准分数(Z)是线性转换,那么标准分的分布形状与原始分的分布形状是相似的。当原始分的分布是正态分布时,标准分的分布也是正态分布的。

3.在标准分数组中,都是以平均数为零,标准差为1的。这对于任何一个由原始分数转换来的标准分数组都是成立的。这样通过标准分转换将不同科(次)考试成绩调整到同参照点,同一分值单位,也就是说标准分具有相同参照点和等距性,这是其最大的优点,因而可以对考生的考试得分进行比较,各种成绩也具有可加性(合总分)。

实施标准化考试后,引起误差的各个环节能够得到最大限度的控制,那么采用标准分数纪分,由于标准分的上述特点,就改变了原始分数的不客观性,避免了从原始分数

出发主观意断的错误。因此利用标准分可以比较同一人在不同考试中的分数;可以比较不同的人在同一次考试或不同次考试中的分数,同一人各科成绩可以相加等等。

总之,标准分克服了原始分数诸多的不足,它能公平、公正、客观、科学地对待群体中的每一成员,特别是在选拔性的考试中为确保“择优录取”提供了可靠依据。

三、标准分数转换方法

标准分数是以平均分为常膜,以标准差为单位构成的。那么什么是平均分呢

1.平均分在统计学里又称平均数,平均数的表示方式有多种,在标准分转换中所用

的平均数是算术平均数,其公式为:

平均数计算中要求总体中的每位考生的分数都参加计算。它反映了总体水平的集中趋势,但未能反映出考生之问的差异。考查某生原始分数(x1)与总体平均分((R)的差值可以大致判断这位考生在总体中的位置。如果,则表明该考生在中等以下;如果,则该考生在中等以下;如果,那么该考生就处于

中等水平。

就目前看,教师向家长提供的成绩单上除标明某科的得分之外,只有很少数标上该科全班(年级)的平均分,但这也是很可贵的了,因为他们已经看出原始分数具有某些不

足了。

平均分数受两个极端值(最高分、最低分)及介于两个极端值之间分数的分布趋势的影响,从而影响了平均数的代表性,因此仅仅通过离差(X,-X)评价考生是不全面的,比如某学生的语文、数学都是80分,考生所在总体两科的平均分均为65分,通过离差计算这两科都比平均分高出15分,但难以对该生的两科成绩作同样的评价,假如总体数学

成绩分布的比较分散,而语文成绩分布的比较集中,那么数学的平均分的代表性就比较小,语文的平均分的代表性就较强。那么该生语文成绩在总体中处的位置要比数学分在总体中的位置靠前,也就是说该生语文比数学学得好。可见总体中考生分数的分散程度

还影响考生在总体中的位置。

2.标准差在统计学中用以反映群体内个体之间数据分散程度常用标准差。标准差是

指离差的平方之算术平均数的算术平方根,其公式为:

标准差反映了在总体内,考生分数分散的程度,或说分数离中的趋势。平均分代表总体的平均水平,只有在全体成员都一致时才可靠,如果不一致,可靠性就会受到影响。平均分代表总体的平均水平的代表性的可靠性程度大小可以通过标准差反映出来。标准差越大,考生分数分散的程度就越大,平均分的代表性就越小,反之,标准差越小,考生分数分散的程度就越小,平均分代表总体的平均水平的可靠性就大。

有了平均分、标准差这两个参数,再评价学生的各科成绩就较全面些,但仍无法定量反映各科成绩的差别,如将平均分、标准差统一到标准分中,则能较好地解决这一问

题。

3.标准分(Z)它是原始分数(x1)与平均分()之差与标准差(s)的商,其公式为:

标准分数综合地反映了原始分对平均分的相对位置和总体分数的离中趋势。还就前

面某学生数学、语文的例子:

数学、语文成绩在总体中比平均分(零分)分明高出1. 5, 3个标准差。这样我们可以

肯定地说语文比数学的成绩好。

有了标准分制度,对于任何一个总体的原始分数转换成标准分数后都具有的特性。那么在总体中由标准分构成的次数分布曲线就是以平均数为零、标准差为1的标准正态分布。在标准正态分布中,标准分与所对应的分布次数(百分数)是一一对应着的,通过标准正态分布表即可查到标准分其相应的百分数.如某选拔性考试中,甲、乙两人的标准分分别为1. 0、1. 5,那么相应所占的百分位数就分别为89. 13 %, 93. 32%。就甲来说有84. 13%的考生不如甲,如果录取率在20%的话,那么,该生自

然在录取之列。

实施标准分化考试,用标准正态分布理论把握分段内的人数,或根据招生数确定相应分段,指导招生工作并为招生提供预见性。至此我们看到了标准分的优点,这也正是即将在全国高考中实施标准化考试采用标准分制的目的所在。

由于标准分数带有小数、负值,计算起来很不便利,也不合乎人们表示分数的习惯,为克服这些不足,将标准分通过线性转换成另一种度量形式来表示分数,一般形式为:T

= KZ+C。

据广东省高考标准化考试试验结果,选用K=100 ,C=500,来转化标准分,即T=100·Z

+500。

由于是线性转换,故T分数仍是标准分数,只不过把平均分提到500,标准差扩大到100的正态分布。如某年高考平均分为500,标准差为100,全体考生成绩呈正态分布。某生总分600,而当年录取率为20,问该生能否被录取首先求出该生的标准分

然后从正态分布表中查出标准分为1所对应的百分位数为%,即全体考生中有89.

13%的人成绩低于他,自然在20%之列。

上面介绍的都是总体呈正态分布的条件下进行的。当原始分数不呈正态分布时,通过线性转换而成的标准分也将不呈正态分布,但这并不影响标准分在总体中的位置,只是标准分与所对应的分布次数不具有确定的规律,因此不宜通过标准正态分布表查相应的百分位数。对于原始分数不呈正态分布的,可以通过非线性转换变成正态分布。

参考文献:

(1) 国家教委学生司主编:标准化考试简介,高教出版社,1986年版。

(2) 叶佩华等:教育统计学,人民教育出版社,1983年版。

(3) 杨丽敏等:教育测量学,教育科学出版社,1999年版。

相关主题
文本预览
相关文档 最新文档