当前位置:文档之家› 操作篇 09_等级相关系数的计算与检验

操作篇 09_等级相关系数的计算与检验

操作篇 09_等级相关系数的计算与检验
操作篇 09_等级相关系数的计算与检验

计算机辅助英语教学与研究(操作篇)

浙江师范大学外语学院夏建新

第9讲用Excel计算等级相关系数

目次

9.1 等级相关的概念 (1)

9.2 适用条件与计算公式 (1)

9.3 操作练习 (1)

9.4 课堂练习 (3)

9.5 积差相关与等级相关比较 (4)

9.6 肯德尔和谐系数的计算 (5)

9.7 Task 9 (6)

9.1 等级相关的概念

等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。主要包括斯皮尔曼(Spearman)二列等级相关及肯德尔和谐系数(the Kandall Coefficient of Concordance)多列等级相关。

9.2 适用条件与计算公式

z当测量到的数据不是等距或等比数据,而是具有等级顺序的测量数据;

z(或)得到的数据是等距或等比的测量数据,但其所来自的总体分布不是正态的;

z(或)样本容量不一定大于50(或30)

在无法满足积差相关系数的适用条件时,只要满足上述三个条件中的任何一个,都可以计算其等级相关系数。由于该系数并不要求总体是否呈正态分布,也不要求N>50(或N>30),所以应用范围较广。

斯皮尔曼等级相关系数r R的计算公式为:

在该式中,D = (Rx – Ry),它表示对偶等级之差。

9.3 操作练习

计算下表的相关系数。

学号学习潜能自学能力

199901 71 7

199902 68 7

199903 84 2

199904 64 9

199905 76 5

199906 69 8

199907 90 3

199908 71 8

199909 66 10

199910 71 6

(注:自学能力是按能力高低从小往大的数字打的,即数值越小,说明自学能力越强)

步骤一:先用Excel中的“排序”工具对“学习潜能”进行等级赋值,操作步骤如下所示:

数据→ 排序 → 主要关键字 → 学习潜能 → 递减 → 有标题行→ 确定

结果如下:

学号 学习潜能自学能力

19990790 3

19990384 2

19990576 5

19990171 7

19990871 8

19991071 6

19990669 8

19990268 7

19990966 10

19990464 9

然后对“学习潜能”进行赋值,结果如下:

序号学号学习潜能等级1 自学能力

1 19990790 1 3

2 19990384 2 2

3 19990576 3 5

5 19990171 5 7

4 19990871

5 8

6 19991071 5 6

7 19990669 7 8

8 19990268 8 7

9 19990966 9 10

10 19990464 10 9

说明:因4、5、6号三位学生的“学习潜能”分相等,其赋值取三者的平均等级5(计算方法为名次的总和除以同名次人数,即(4+5+6)/3=5)。

步骤二:按步骤一中所述方法对“自学能力”进行排序和赋值(考虑到“自学能力”的数值越小,等级越高,排序时应该选“递增”)。结果如下:

序号学号学习潜能等级1自学能力等级2

2 19990

3 8

4 2 2 1

1 199907 90 1 3 2

3 199905 76 3 5 3

6 199910 71 5 6 4

5 199901 71 5 7 5.5

8 199902 68 8 7 5.5

4 199908 71

5 8 7.5

7 199906 69 7 8 7.5

10 199904 64 10 9 9

199909 66 9 10 10

9

步骤三:算出等级差数与差数平方。在Excel表中的G2单元格中输入:=D2-F2,得数为-1。用填充柄工具完成等级差数的计算;在H2单元格中输入:=G2*G2,得数为1,用填充柄工具完成差数平方的计算。结果如下:

等级差数 差数平方

-1 1

1 1

0 0

-2.5 6.25

-0.5 0.25

1 1

-0.5 0.25

2.5 6.25

-1 1

1 1

步骤四:算出差数平方之和。用Σ工具或在某单元格输入=sum(H2:H11),得数为18。

步骤五:把差数平方和代入公式中进行计算。在Excel中可输入=1-(6*18)/(10*(10*10-1)),得数为0.890909。

步骤六:进行显著性检验。由于样本数n=10,用t检验。在Excel中输入:=0.890909*SQRT(10-2)/SQRT(1-0.890909*0.890909),得数为5.548155。

注意:为简便起见,上述有些数值可以直接用单元格代号代入计算公式。

步骤七:统计决断。查t值表,得t(8)0.01=3.355。我们算出的数值大于该t值,可以判定学生的学习潜能与自学能力的相关系数有显著差异,即这两者有高度的正相关。

9.4 课堂练习

以下是10个学生的数学和物理分数,请计算数学与物理的相关系数。

学号数学成绩物理成绩

20020186 70

20020268 65

20020372 82

20020490 92

20020564 68

20020661 60

20020794 93

20020886 92

20020966 76

20021070 76

9.5 积差相关与等级相关比较

例:两位英语教师(x, y)分别给20个学生的英语作文打分,用相关系数原理说明两者打分的一致性程度。

作文编号教师X 教师Y

1 17 17

2 1

3 14

3 8 12

4 1

5 17

5 15 16

6 7 7

7 10 14

8 12 10

9 11 15

10 14 13

11 15 15

12 12 15

13 10 7

14 18 16

15 15 12

16 16 16

17 10 16

18 10 10

19 19 15

20 9 8

用积差相关系数原理计算,r=0.67

注:除了“操作篇 08”所示的显著性检验方法,还可查积差相关系数检验表来进行检验。这里所查的α=0.05双尾临界值为0.444,单尾临界为0.378(自由度不用减)。结论:相关显著。

用等级相关系数原理计算,r=0.69

查等级相关系数表,α=0.05双尾临界值为0.447,单尾临界为0.380(自由度不用减)。相关显著。

之所以等级相关系数高于积差相关系数,是因为等级赋值时会出现一些并列等级,这样计算出来的相关系数会略高于积差相关系数。所以,如果能用积差相关原理计算的,尽量用积差相关公式,这样可以精确些。

9.6 肯德尔和谐系数的计算

适用情况:用于描述或检验几个评估者对一组被评者的等级评定的一致性程度,或同一评估者对同一组被评者前后几次评定结果的一致性程度。

当多个(两个以上)变量以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度(即相关)的量,称为肯德尔和谐系数。它常用来表示几个评定者对同一组学生学习成绩等级评定的一致性程度,或同一个评定者对同一组学生的学习成绩用等级先后评定多次之间的一致性程度。

公式如下:

)(121/)(3222n n K n

R R w r ??∑∑=

其中R 为某一学生得到的4个等级分之和;K 为评定者的人数。

例:4位教师对6个学生作文竞赛的名次排列次序如下表。问评定的一致性程度如何(α=0.01)?

评定者

(2)

R (3) R 2 (4) 学生 n=6 (1) 1 2 3 4

1

3 4 2 1 10 100 2

4 3 1 3 11 121 3

2 1

3

4 10 100 4

6 5 6 5 22 484 5

1 2 4 2 9 81 6

5 6 5 6 22 484 总和

84 1370

在Excel 中,输入

=(G10-POWER(F10,2)/6)/(1/12*POWER(4,2)*(POWER(6,3)-6))

得数:0.692857

检验方式为卡方检验,公式:

w r m n )1(2

?=χ

则:x 2 = 4×(6-1) ×0.692857=13.85714

查卡方分布表,df=6-1=5的卡方临界值是15.09,结论是没有显著相关。

(这类检验用SPSS做更方便)

9.7 Task 9

a. 两位教师以评定等级的形式对某班级15名学生的英语口语能力进行独立打分,结果如下:

学生序号教师A教师B

1 11 15

2 2 1

3 5 7

4 1

5 12

5 9 6

6 10 10

7 1 3

8 4 5

9 13 13

10 3 2

11 8 9

12 7 8

13 6 4

14 12 14

15 14 11

请计算两组等级之间的等级相关系数,并对之进行假设检验(α=0.01,双尾)

b. 自建一学生成绩或某两个项目(如德育与英语、学习动机与英语成绩、家庭条件与学习成绩、父母关心程度与学习动机,等等)的评比等级数据库,对其进行等级相关系数的计算

和显著性检验,并简要说明之。

(a、b任选其一)

相关性分析(相关系数)

相关系数是变量之间相关程度的指标。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值一般介于-1~1之间。相关系数不是等距度量值,而只是一个顺序数据。计算相关系数一般需大样本. 相关系数又称皮(尔生)氏积矩相关系数,说明两个现象之间相关关系密切程度的统计分析指标。 相关系数用希腊字母γ表示,γ值的范围在-1和+1之间。 γ>0为正相关,γ<0为负相关。γ=0表示不相关; γ的绝对值越大,相关程度越高。 两个现象之间的相关程度,一般划分为四级: 如两者呈正相关,r呈正值,r=1时为完全正相关;如两者呈负相关则r呈负值,而r=-1时为完全负相关。完全正相关或负相关时,所有图点都在直线回归线上;点子的分布在直线回归线上下越离散,r的绝对值越小。当例数相等时,相关系数的绝对值越接近1,相关越密切;越接近于0,相关越不密切。当r=0时,说明X和Y两个变量之间无直线关系。 相关系数的计算公式为<见参考资料>. 其中xi为自变量的标志值;i=1,2,…n;■为自变量的平均值, 为因变量数列的标志值;■为因变量数列的平均值。 为自变量数列的项数。对于单变量分组表的资料,相关系数的计算公式<见参考资料>. 其中fi为权数,即自变量每组的次数。在使用具有统计功能的电子计算机时,可以用一种简捷的方法计算相关系数,其公式<见参考资料>. 使用这种计算方法时,当计算机在输入x、y数据之后,可以直接得出n、■、∑xi、∑yi、∑■、∑xiy1、γ等数值,不必再列计算表。 简单相关系数: 又叫相关系数或线性相关系数。它一般用字母r 表示。它是用来度量定量变量间的线性相关关系。 复相关系数: 又叫多重相关系数

如何用SPSS求相关系数

参见: [1] 衷克定数据统计分析与实践—SPSS for Windows[M].北京:高等教育出版社,2005.4:195— [2] 试验设计与SPSS应用[M].北京,化学工业出版社,王颉著,2006.10:141— 多元相关与偏相关 如何用SPSS求相关系数 1 用列联分析中,计算lamabda相关系数,在分析——描述分析——列联分析 2 首先看两个变量是否是正态分布,如果是,则在analyze-correlate-bivariate中选择 pearson相关系数,否则要选spearman相关系数或Kendall相关系数。如果显著相关,输出结果会有*号显示,只要sig的P值大于0.05就是显著相关。如果是负值则是负相关。 在SPSS软件相关分析中,pearson(皮尔逊), kendall(肯德尔)和spearman(斯伯曼/斯皮尔曼)三种相关分析方法有什么异同 两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述. Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。 Kendall's tau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格; 计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据; 计算Kendall秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。 计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,宜用spearman或kendall相关 Pearson 相关复选项积差相关计算连续变量或是等间距测度的变量间的相关分析Kendall 复选项等级相关计算分类变量间的秩相关,适用于合并等级资料 Spearman 复选项等级相关计算斯皮尔曼相关,适用于连续等级资料 注: 1若非等间距测度的连续变量因为分布不明-可用等级相关/也可用Pearson 相关,对于完全等级离散变量必用等级相关 2当资料不服从双变量正态分布或总体分布型未知或原始数据是用等级表示时,宜用Spearman 或Kendall相关。 3 若不恰当用了Kendall 等级相关分析则可能得出相关系数偏小的结论。则若不恰当使用,可能得相关系数偏小或偏大结论而考察不到不同变量间存在的密切关系。对一般情况默认数据服从正态分布的,故用Pearson分析方法。 在SPSS里进入Correlate-》Bivariate,在变量下面Correlation Coefficients复选框组里有3个选项:

SPSS中的相关分析及假设检验

相关分析及假设检验 spss 1.概念 变量之间相关,但是又不能由一个或几个变量值去完全和唯一确定另一个变量值的这种关系称为相关关系。相关关系是普遍存在的,函数关系仅仅是相关关系的特例。事物之间有相关关系,不一定是因果关系,也可能仅是伴随关系,但是事物之间有因果关系,则两者必然相关。 相关分析用于分析两个随机变量的关系,可以检验两个变量之间的相关度或多个变量两两之间的相关程度,也可以检验 两组变量之间的相关程度 偏相关分析是指在控制了其他变量的效应以后,对两个变量相关程度的分析。、 2.皮尔逊积差相关系数pearson product-moment correlation coefficient 变量之间的相关程度由相关系数来度量,pearson相关系数是应用最广的一种。它用于检验连续型变量之间的线性相关程度 2.1前提假设 1)正态分布皮尔逊积差相关只适用于双元正态分布的变量,即两个变量都是正态分布,注意只有pearson要求正态分布 如果正态分布的前提不满足,两变量间的关系可能属于非线性相关 2)样本独立样本必须来自总体的随机样本,而且样本必须相互独立 3)替换极值变量中的极端值如极值、离群值对相关系数的影响较大,最好加以删除或代之以均值或中数 2.2相关分析的前提假设检验 一般情况下是对是否满足正态分布进行检验,对于正态分布的检验有好几种方法,总的可分为非参数检验和图形检验法 1)非参数检验法 spss中的1-sample K-S检验,检验样本数据是否服从某种特定的分布,方法有三种 a. Asymptotic only 是一种基于渐进分布的显著性水平的检验指标,通常显著性水平小于0.05则认为显著,适用于大样本。如果 样本过小或分布不好,该指标的适用性会降低 b.Monte Carlo 精确显著性水平的无偏估计,适用于样本过大无法使用渐进方法估计显著性水平的情况,可以不必依赖渐近方法的假设前提 c.Exact 精确计算观测结果的概率值,通常小于0.05即被认为显著,表明横变量和列变量之间存在相关,同时允许用户键入每次检验的最长 时间显著,可以键入1到9999999999之间的数字,但只要一次检验超过指定时间的30分钟,就应该用monte carlo 假设是服从某种分布 所以如果计算出的值比如Asymp. Sig 小于0.05,那么拒绝原假设,说明样本为非正态分布,否则值越大越服从某种分布 单样本K-S首先计算每一阶段实际值与观察值的差异值,再计算每一阶段差异值的绝对值Z,即K-S的Z值,Z值越大,样本服从理论分布的可能性越小 还有一个是2 -sample Kolmogorov—Smirnov用于检验2个样本的分布是相同的假设 2)图形法 spss中graph a.Q-Q正态检验图

相关系数临界值表

附表二:相关系数临界值表 (表中是自由度) n -2 0.10 0.05 0.02 0.01 0.001 n -2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 60 70 80 90 100 0.987 69 0.900 00 0.805 4 0.729 3 0.669 4 0.621 5 0.582 2 0.549 4 0.521 4 0.497 3 0.476 2 0.457 5 0.440 9 0.425 9 0.412 4 0.400 0 0.388 7 0.378 3 0.368 7 0.359 8 0.323 3 0.296 0 0.274 6 0.257 3 0.242 8 0.230 6 0.210 8 0.195 4 0.182 9 0.172 6 0.163 8 0.099 692 0.950 00 0.878 3 0.811 4 0.754 5 0.706 7 0.666 4 0.631 9 0.602 1 0.576 0 0.552 9 0.532 4 0.513 9 0.497 3 0.482 1 0.468 3 0.455 5 0.443 8 0.432 9 0.422 7 0.380 9 0.349 4 0.324 6 0.304 4 0.287 5 0.273 2 0.250 0 0.231 9 0.217 2 0.205 0 0.194 6 0.999 507 0.980 00 0.934 33 0.882 2 0.832 9 0.788 7 0.749 8 0.715 5 0.685 1 0.658 1 0.633 9 0.612 0 0.592 3 0.574 2 0.557 7 0.542 5 0.528 5 0.515 5 0.503 4 0.492 1 0.445 1 0.409 3 0.381 0 0.357 8 0.338 4 0.321 8 0.294 8 0.273 7 0.256 5 0.242 2 0.230 1 0.999 877 0.990 00 0.958 73 0.917 20 0.874 5 0.834 3 0.797 7 0.764 6 0.734 8 0.707 9 0.683 5 0.661 4 0.641 1 0.622 6 0.605 5 0.589 7 0.575 1 0.561 4 0.548 7 0.536 8 0.486 9 0.448 7 0.418 2 0.393 2 0.372 1 0.354 1 0.324 8 0.301 7 0.283 0 0.267 3 0.254 0 0.999 998 8 0.999 00 0.991 16 0.974 06 0.950 74 0.924 93 0.898 2 0.872 1 0.847 1 0.823 3 0.801 0 0.780 0 0.760 3 0.742 0 0.724 6 0.708 4 0.693 2 0.678 7 0.665 2 0.652 4 0.597 4 0.554 1 0.518 9 0.489 6 0.464 8 0.443 3 0.407 8 0.379 9 0.356 8 0.337 5 0.321 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 60 70 80 90 100

相关系数检验表

自由度自由度n -m -10.10 0.05 0.01 n -m -10.10 0.05 0.01 10.987690.996920.999882010.018230.010910.0028820.900000.950000.990002020.050680.043320.0258130.805380.878340.958742030.068740.066150.0518940.729300.811400.917202040.079150.080690.0725350.669440.754490.874532050.085730.090380.0880760.621490.706730.834342060.090190.097180.0998670.582210.666380.797682070.093370.102170.1089880.549360.631900.764592080.095730.105950.1161890.521400.602070.734792090.097520.108880.12197100.497260.575980.707892100.098910.111200.12670110.476160.552940.683532110.100010.113070.13062120.457500.532410.661382120.100890.114600.13390130.440860.513980.641142130.101600.115860.13667140.425900.497310.622592140.102170.116900.13903150.412360.482150.605512150.102640.117770.14106160.400030.468280.589712160.103020.118500.14281170.388730.455530.575072170.103320.119110.14432180.378340.443760.561442180.103560.119620.14564190.368740.432860.548712190.103760.120060.14679200.359830.422710.536802200.103910.120420.14780210.351530.413250.525622210.104020.120720.14869220.343780.404390.515102220.104100.120970.14946230.336520.396070.505182230.104160.121170.15015240.329700.388240.495812240.104190.121340.15075250.323280.380860.486932250.104200.121470.15127260.317220.373890.478512260.104190.121570.15173270.311490.367280.470512270.104170.121640.15214280.306060.361010.462892280.104130.121690.15249290.300900.355050.455632290.104080.121720.15279300.295990.349370.448702300.104020.121730.15306310.291320.343960.442072310.103950.121730.15328320.286860.338790.435732320.103870.121700.15348330.282590.333840.429652330.103780.121670.15364340.278520.329110.423812340.103680.121620.15377350.274610.324570.418212350.103580.121560.15388360.270860.320220.412822360.103470.121490.15396370.267270.316030.407642370.103360.121410.15403380.263810.312010.402642380.103240.121320.15407390.260480.308130.397822390.103120.121220.15409400.257280.304400.393172400.103000.121120.15410410.254190.300790.388682410.102870.121010.1541042 0.251210.297320.38434242 0.102740.120900.15408 显著性水平(a ) 显著性水平(a ) 相关系数检验临界值表

操作篇 09_等级相关系数的计算与检验

计算机辅助英语教学与研究(操作篇) 浙江师范大学外语学院夏建新 第9讲用Excel计算等级相关系数 目次 9.1 等级相关的概念 (1) 9.2 适用条件与计算公式 (1) 9.3 操作练习 (1) 9.4 课堂练习 (3) 9.5 积差相关与等级相关比较 (4) 9.6 肯德尔和谐系数的计算 (5) 9.7 Task 9 (6)

9.1 等级相关的概念 等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。主要包括斯皮尔曼(Spearman)二列等级相关及肯德尔和谐系数(the Kandall Coefficient of Concordance)多列等级相关。 9.2 适用条件与计算公式 z当测量到的数据不是等距或等比数据,而是具有等级顺序的测量数据; z(或)得到的数据是等距或等比的测量数据,但其所来自的总体分布不是正态的; z(或)样本容量不一定大于50(或30) 在无法满足积差相关系数的适用条件时,只要满足上述三个条件中的任何一个,都可以计算其等级相关系数。由于该系数并不要求总体是否呈正态分布,也不要求N>50(或N>30),所以应用范围较广。 斯皮尔曼等级相关系数r R的计算公式为: 在该式中,D = (Rx – Ry),它表示对偶等级之差。 9.3 操作练习 计算下表的相关系数。 学号学习潜能自学能力 199901 71 7 199902 68 7 199903 84 2 199904 64 9 199905 76 5 199906 69 8 199907 90 3 199908 71 8

199909 66 10 199910 71 6 (注:自学能力是按能力高低从小往大的数字打的,即数值越小,说明自学能力越强) 步骤一:先用Excel中的“排序”工具对“学习潜能”进行等级赋值,操作步骤如下所示: 数据→ 排序 → 主要关键字 → 学习潜能 → 递减 → 有标题行→ 确定 结果如下: 学号 学习潜能自学能力 19990790 3 19990384 2 19990576 5 19990171 7 19990871 8 19991071 6 19990669 8 19990268 7 19990966 10 19990464 9 然后对“学习潜能”进行赋值,结果如下: 序号学号学习潜能等级1 自学能力 1 19990790 1 3 2 19990384 2 2 3 19990576 3 5 5 19990171 5 7 4 19990871 5 8 6 19991071 5 6 7 19990669 7 8 8 19990268 8 7 9 19990966 9 10 10 19990464 10 9 说明:因4、5、6号三位学生的“学习潜能”分相等,其赋值取三者的平均等级5(计算方法为名次的总和除以同名次人数,即(4+5+6)/3=5)。 步骤二:按步骤一中所述方法对“自学能力”进行排序和赋值(考虑到“自学能力”的数值越小,等级越高,排序时应该选“递增”)。结果如下: 序号学号学习潜能等级1自学能力等级2 2 19990 3 8 4 2 2 1 1 199907 90 1 3 2 3 199905 76 3 5 3 6 199910 71 5 6 4 5 199901 71 5 7 5.5 8 199902 68 8 7 5.5 4 199908 71 5 8 7.5

第六章相关系数检验

第六章 相关系数检验 一般来说,在回归模型的基本假设中,有一个假设条件是最为重要的,这就是假设变量之间在概率意义上存在线性关系;亦即)(i Y E =i X βα+或)(i E μ=0。这里的“概率意义”,虽说与确定意义有差别,但由于概率意义的前提必须承认规律的存在;故我认为,这里的“线性关系”与确定意义下的“线性关系”并无根本性的区别。因此,我们可以说,概率意义上的线性关系仍是一般意义上的线性思路或方法,只是分析的条件有所放松而已。 现在我们要问,在建立回归模型时,这个假设条件成立吗?显然需要进行检验,需要建立一种检验方法。 6·1、建立相关系数检验方法的基本思路 实际上,建立相关系数检验方法的基本思路是较为简单和清晰的。其基本思路是:建立一种方法(2R ),希望此方法在测定被解释变量Y 的总的变化中,推出回归直线能够解释的部分有多大;即通过两者之比的大小,来推断回归模型效果的好坏。下面简要介绍其方法的建立过程: 首先,我们有 Y 的总的变化可表示为 : Y Y y i i -= 回归直线能够解释的部分: Y Y y i i -=?? 由此我们可以得到,回归直线没有(或不能)解释的部分为:i i i Y Y e ?-= 因而我们有 Y 的总的变差=∑∑∑++=+=)?2?()?(2 2 22 i i i i i i i e e y y e y y 其中,)(?)?(?)?)(?(?2 22∑∑∑∑∑∑∑- =-=-=i i i i i i i i i i i i i i x x y x y x x y x x y x e y βββββ =0 (注意:i i i i x X Y Y y X Y X Y ββαβαβαβα???????,??,??=---=-=∴+=∴-= ,另外 i i i i i i i x y y y Y Y e β???-=-=-=)。 所以,我们最终有 Y 的总的变差==∑∑∑∑+=++=+=)?()?2?()?(2 2 2 2 22 i i i i i i i i i e y e e y y e y y 亦即, Y 的总的变差=回归直线能够解释的部分部分+回归直线不能够解释的部分

线性相关系数的计算

Spss电脑实验-第六节(3)线性相关系数的计算 https://www.doczj.com/doc/0617108223.html,更新时间:2006-1-19 21:11:30 关注指数:7992 Ⅲ.线性相关系数的计算 1. 线性相关的概念 如果各统计指标是定量数据,要了解它们间的关系密切程度,可用线性相关分析。 例如:大家都知道的糖尿病病人,它靠胰岛素来治疗。现测量20 名糖尿病病人(以ID 来编号)血中的血糖值(y)、胰岛素值(x1)和生长激素值(x2)。我们即可分析 y、x1 和x2 间的两两/ 双变量间的线性关系。数据见下面的程序文件CorreRegre2.sps 的例*2。 2. 线性相关计算的所用命令 用SPSS Analyze 菜单中的子菜单Correlate,其中的Bivariate 对话框即可计算两两/ 双变量间的线性相关系数r 及其显著性。这是通常最常见、最常用的情况。 本例所用程序文件名为CorreRegre2.sps 中的例*2。(例*2 中还有用于偏相关系数与距离相关系数的计算命令,详后)。 ---------------------------------------------------------------- *2. Prof. Zhang Weng-Tong: SPSS 11, P.273-277:. DATA LIST FREE /ID y x1 x2. BEGIN DATA. 1 12.21 15.20 9.51 2 14.54 16.70 11.43 3 12.27 11.90 7.53 4 12.04 14.00 12.17 5 7.88 19.80 2.33 6 11.10 16.20 13.52 7 10.43 17.00 10.07 8 13.32 10.30 18.89 9 19.59 5.90 13.14 10 9.05 18.70 9.63 11 6.44 25.10 5.10 12 9.49 16.40 4.53 13 10.16 22.00 2.16 14 8.38 23.10 4.26 15 8.49 23.20 3.42 16 7.71 25.00 7.34 17 11.38 16.80 12.75 18 10.82 11.20 10.88 19 12.49 13.70 11.06 20 9.21 24.40 9.16 END DATA. CORRELATIONS /VARIABLES=y x1 x2 /PRINT=TWOTAIL NOSIG. NONPAR CORR /VARIABLES=y x1 x2 /PRINT=SPEARMAN TWOTAIL NOSIG.

常用相关分析方法及其计算

二、常用相关分析方法及其计算 在教育与心理研究实践中,常用的相关分析方法有积差相关法、等级相关法、质量相关法,分述如下。 (一)积差相关系数 1. 积差相关系数又称积矩相关系数,是英国统计学家皮尔逊(Pearson )提出的一种计算相关系数的方法,故也称皮尔逊相关。这是一种求直线相关的基本方法。 积差相关系数记作XY r ,其计算公式为 ∑∑∑===----= n i i n i i n i i i XY Y y X x Y y X x r 1 2 1 2 1 ) ()() )(( (2-20) 式中i x 、i y 、X 、Y 、n 的意义均同前所述。 若记X x x i -=,Y y y i -=,则(2-20)式成为 Y X XY S nS xy r ∑= (2-21) 式中n xy ∑称为协方差,n xy ∑的绝对值大小直观地反映了两列变量的一致性程 度。然而,由于X 变量与Y 变量具有不同测量单位,不能直接用它们的协方差 n xy ∑来表示两列变量的一致性,所以将各变量的离均差分别用各自的标准差 除,使之成为没有实际单位的标准分数,然后再求其协方差。即: ∑∑?= = )()(1Y X Y X XY S y S x n S nS xy r

Y X Z Z n ∑?= 1 (2-22) 这样,两列具有不同测两单位的变量的一致性就可以测量计算。 计算积差相关系数要求变量符合以下条件:(1)两列变量都是等距的或等比的测量数据;(2)两列变量所来自的总体必须是正态的或近似正态的对称单峰分布;(3)两列变量必须具备一一对应关系。 2. 积差相关系数的计算 利用公式 (2-20)计算相关系数,应先求两列变量各自的平均数与标准差,再求离中差的乘积之和。在统计实践中,为方便使用数据库的数据格式,并利于计算机计算,一般会将(2-20)式改写为利用原始数据直接计算XY r 的公式。即: ∑∑∑∑∑∑∑---= 2 22 2 ) () (i i i i i i i i XY y y n x x n y x y x n r (2-23) (二)等级相关 在教育与心理研究实践中,只要条件许可,人们都乐于使用积差相关系数来度量两列变量之间的相关程度,但有时我们得到的数据不能满足积差相关系数的计算条件,此时就应使用其他相关系数。 等级相关也是一种相关分析方法。当测量得到的数据不是等距或等比数据,而是具有等级顺序的测量数据,或者得到的数据是等距或等比的测量数据,但其所来自的总体分布不是正态的,出现上述两种情况中的任何一种,都不能计算积差相关系数。这时要求两列变量或多列变量的相关,就要用等级相关的方法。 1. 斯皮尔曼(Spearman)等级相关 斯皮尔曼等级相关系数用R r 表示,它适用于两列具有等级顺序的测量数据,或总体为非正态的等距、等比数据。

相关系数显著性检验表完整版

附表11(1)相关系数界值表 P(2): 0.50 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 P(1): 0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 1 0.707 0.951 0.988 0.997 1.000 1.000 1.000 1.000 1.000 2 0.500 0.800 0.900 0.950 0.980 0.990 0.995 0.998 0.999 3 0.40 4 0.687 0.80 5 0.878 0.934 0.959 0.974 0.98 6 0.991 4 0.347 0.603 0.729 0.811 0.882 0.917 0.942 0.963 0.974 5 0.309 0.551 0.669 0.755 0.833 0.875 0.90 6 0.935 0.951 6 0.281 0.50 7 0.621 0.707 0.789 0.834 0.870 0.905 0.925 7 0.260 0.472 0.582 0.666 0.750 0.798 0.836 0.875 0.898 8 0.242 0.443 0.549 0.632 0.715 0.765 0.805 0.847 0.872 9 0.228 0.419 0.521 0.602 0.685 0.735 0.776 0.820 0.847 10 0.216 0.398 0.497 0.576 0.658 0.708 0.750 0.795 0.823 11 0.206 0.380 0.476 0.553 0.634 0.684 0.726 0.772 0.801 12 0.197 0.365 0.457 0.532 0.612 0.661 0.703 0.750 0.780 13 0.189 0.351 0.441 0.514 0.592 0.641 0.683 0.730 0.760 14 0.182 0.338 0.426 0.497 0.574 0.623 0.664 0.711 0.742 15 0.176 0.327 0.412 0.482 0.558 0.606 0.647 0.694 0.725 16 0.170 0.317 0.400 0.468 0.542 0.590 0.631 0.678 0.708 17 0.165 0.308 0.389 0.456 0.529 0.575 0.616 0.622 0.693 18 0.160 0.299 0.378 0.444 0.515 0.561 0.602 0.648 0.679 19 0.156 0.291 0.369 0.433 0.503 0.549 0.589 0.635 0.665 20 0.152 0.284 0.360 0.423 0.492 0.537 0.576 0.622 0.652 21 0.148 0.277 0.352 0.413 0.482 0.526 0.565 0.610 0.640 22 0.145 0.271 0.344 0.404 0.472 0.515 0.554 0.599 0.629 23 0.141 0.265 0.337 0.396 0.462 0.505 0.543 0.588 0.618 24 0.138 0.260 0.330 0.388 0.453 0.496 0.534 0.578 0.607 25 0.136 0.255 0.323 0.381 0.445 0.487 0.524 0.568 0.597 26 0.133 0.250 0.317 0.374 0.437 0.479 0.515 0.559 0.588 27 0.131 0.245 0.311 0.367 0.430 0.471 0.507 0.550 0.579 28 0.128 0.241 0.306 0.361 0.423 0.463 0.499 0.541 0.570 29 0.126 0.237 0.301 0.355 0.416 0.456 0.491 0.533 0.562 30 0.124 0.233 0.296 0.349 0.409 0.449 0.484 0.526 0.554 31 0.122 0.229 0.291 0.344 0.403 0.442 0.477 0.518 0.546 32 0.120 0.226 0.287 0.339 0.397 0.436 0.470 0.511 0.539 33 0.118 0.222 0.283 0.334 0.392 0.430 0.464 0.504 0.532 34 0.116 0.219 0.279 0.329 0.386 0.424 0.458 0.498 0.525 35 0.115 0.216 0.275 0.325 0.381 0.418 0.452 0.492 0.519 36 0.113 0.213 0.271 0.320 0.376 0.413 0.446 0.486 0.513 37 0.111 0.210 0.267 0.316 0.371 0.408 0.441 0.480 0.507 38 0.110 0.207 0.264 0.312 0.367 0.403 0.435 0.474 0.501 39 0.108 0.204 0.261 0.308 0.362 0.398 0.430 0.469 0.495 40 0.107 0.202 0.257 0.304 0.358 0.393 0.425 0.463 0.490 41 0.106 0.199 0.254 0.301 0.354 0.389 0.420 0.458 0.484 42 0.104 0.197 0.251 0.297 0.350 0.384 0.416 0.453 0.479 43 0.103 0.195 0.248 0.294 0.346 0.380 0.411 0.449 0.474

皮尔逊相关系数

简单相关系数又称皮尔逊相关系数,它描述了两个定距变量间联系的紧密程度。样本的简单相关系数一般用r表示,计算公式为: 其中n 为样本量,分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度。r的取值在-1与+1之间,若r>0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r<0,表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。r 的绝对值越大表明相关性越强,要注意的是这里并不存在因果关系。若r=0,表明两个变量间不是线性相关,但有可能是其他方式的相关(比如曲线方式) 利用样本相关系数推断总体中两个变量是否相关,可以用t 统计量对总体相关系数为0的原假设进行检验。若t 检验显著,则拒绝原假设,即两个变量是线性相关的;若t 检验不显著,则不能拒绝原假设,即两个变量不是线性相关的 皮尔逊相关系数又称“皮尔逊积矩相关系数”,对两个定距变量(例如,年龄和身高)的关系强度的测量,简写τ。这一测量也可用作对显著性的一种检验,其方法是检验解消假设:总体中的τ值为0。若样本τ实际上不等于0,则解消假设可加否定,从而我们可以满意地看到,这两个变量不是无关的,在统计显著性层次上它们是有关的。例如,若我们有一个较大的样本,并发现一个高的样本值τ(例如,90),那么我们不妨否定这一解消假设:这个样本是来自一个其真正的τ值为0的总体,因为假若真正的总体值是0,我们就不可能单纯碰巧取得一个如此高的样本。τ的变化从-1(全负关系),通过0(无关系或无关性),到+1(全正关系)。从直线关系和曲线关系之间的关系来说,τ是对直线关系的一种测量。对τ有两个主要的解释:(1)τ2=所解释的方差额。(2)τ测量围绕回归线散布的程度,也就是说,它告诉我们,我们用回归线可预测的准确程度有多大。 1、建立数据库 2、按analyze-----correlate------bivarizte顺序单击菜单项,展开一个对话框,在correlation coefficients中就有Pearson相关系数的选项 简单相关系数又称皮尔逊相关系数,它描述了两个定距变量间联系的紧密程度。样本的简单相关系数一般用r表示,计算公式为:其中n 为样本量,分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度。r的取值在-1与+1之间,若r>0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r<0,表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。r 的绝对值越大表明相关性越强,要注意的是这里并不存在因果关系。若r=0,表明两个变量间不是线性相关,但有可能是其他方式的相关(比如曲线方式)。利用样本相关系数推断总体中两个变量是否相关,可以用t 统计量对总体相关系数为0的原假设进行检验。若t 检验显著,则拒绝原假设,即两个变量是线性相关的;若t 检验不显著,则不能拒绝原假设,即两个变量不是线性相关的。单尾检验及双尾检验的判断:假定鱼缸里只有2条金鱼,这时恰巧要检验雌雄,就用双尾检验,但若此时不检验,缓几天再检,当池子里的鱼有3或5条时检验,需用单尾检验法,方可检验完毕! 答案不错,终于明白了·就是说,两条金鱼的时候,他们是雌是雄都有可能,所以是不存在线性关系的,因此要用双尾检验;如果过几天有了小金鱼,说明这两条金鱼一

SAS讲义 第三十课Spearman等级相关分析

第三十课 Spearman 等级相关分析 一、 秩相关的Spearman 等级相关分析 前面介绍了使用非参数方法比较总体的位置或刻度参数,我们同样也可以用非参数方法比较两总体之间相关问题。秩相关(rank correlation )又称等级相关,它是一种分析i x 和i y 等级间是否相关的方法。适用于某些不能准确地测量指标值而只能以严重程度、名次先后、反映大小等定出的等级资料,也适用于某些不呈正态分布或难于判断分布的资料。 设i R 和i Q 分别为i x 和i y 各自在变量X 和变量Y 中的秩,如果变量X 与变量Y 之间存在着正相关,那么X 与Y 应当是同时增加或减少,这种现象当然会反映在(i x ,i y )相应的秩(i R ,i Q )上。反之,若(i R ,i Q )具有同步性,那么(i x ,i y )的变化也具有同步性。因此 ∑∑==-==n i n i i i i Q R d d 1 1 22 )( (30.1) 具有较小的数值。如果变量X 与变量Y 之间存在着负相关,那么X 与Y 中一个增加时,另一个在减小,d 具有较大的数值。既然由(i x ,i y )构成的样本相关系数反映了X 与Y 之间相关与否的信息,那么在参数相关系数的公式),(Y X r 中以i R 和i Q 分别代替i x 和i y ,不是同样地反映了这种信息吗?基于这种想法,Charles Spearman 秩相关系数),(Q R r s 应运而生: ∑∑∑∑∑∑∑---- = 2 2)1 ()1()1 )(1(),(i i i i i i i i s Q n Q R n R Q n Q R n R Q R r (30.2) ),(Q R r s 与),(Y X r 形式上完全一致,但在),(Q R r s 中的秩,不管X 与Y 取值如何,总是只 取1到n 之间的数值,因此它不涉及X 与Y 总体其他的内在性质,例如秩相关不需要总体具有有限两阶矩的要求。由于 2 ) 1(211 1 += +++==∑∑==n n n Q R n i i n i i 6 ) 12)(1(212221 21 2++= +++==∑∑==n n n n Q R n i i n i i 因此公式(30.2)可以化简为

相关系数计算公式

相关系数计算公式 相关系数计算公式 Statistical correlation coefficient Due to the statistical correlation coefficient used more frequently, so here is the use of a few articles introduce these coefficients. The correlation coefficient: a study of two things (in the data we call the degree of correlation between the variables). If there are two variables: X, Y, correlation coefficient obtained by the meaning can be understood as follows: (1), when the correlation coefficient is 0, X and Y two variable relationship. (2), when the value of X increases (decreases), Y value increases (decreases), the two variables are positive correlation, correlation coefficient between 0 and 1. (3), when the value of X increases (decreases), the value of Y decreases (increases), two variables are negatively correlated, the correlation coefficient between -1.00 and 0. The absolute value of the correlation coefficient is bigger, stronger correlations, the correlation coefficient is close to 1 or -1, the higher degree of correlation, the correlation coefficient is close to 0 and the correlation is weak. The related strength normally through the following range of judgment variables: The correlation coefficient 0.8-1.0 strong correlation 0.6-0.8 strong correlation

常用相关分析方法及其计算

二、常用相关分析方法及其计算 在教育与心理研究实践中,常用的相关分析方法有积差相关法、等级相关法、质量相关法,分述如下。 (一)积差相关系数 1. 积差相关系数又称积矩相关系数,是英国统计学家皮尔逊(Pearson )提出的一种计算相关系数的方法,故也称皮尔逊相关。这是一种求直线相关的基本方法。 积差相关系数记作XY r ,其计算公式为 ∑∑∑===----=n i i n i i n i i i XY Y y X x Y y X x r 12121 )()())(((2-20) 式中i x 、i y 、X 、Y 、n 的意义均同前所述。 若记X x x i -=,Y y y i -=,则(2-20)式成为 Y X XY S nS xy r ∑=(2-21) 式中n xy ∑称为协方差,n xy ∑的绝对值大小直观地反映了两列变量的一致性程度。然而,由于X 变量与Y 变量具有不同测量单位,不能直接用它们的协方差n xy ∑来表示两列变量的一致性,所以将各变量的离均差分别用各自的标准差除,使之成为没有实际单位的标准分数,然后再求其协方差。即: Y X Z Z n ∑?=1(2-22) 这样,两列具有不同测两单位的变量的一致性就可以测量计算。 计算积差相关系数要求变量符合以下条件:(1)两列变量都是等距的或等比的测量数据;(2)两列变量所来自的总体必须是正态的或近似正态的对称单峰分布;(3)两列变量必须具备一一对应关系。 2. 积差相关系数的计算 利用公式(2-20)计算相关系数,应先求两列变量各自的平均数与标准差,再求离中差的乘积之和。在统计实践中,为方便使用数据库的数据格式,并利于计算机计算,一般会将(2-20)式改写为利用原始数据直接计算XY r 的公式。即:

相关主题
文本预览
相关文档 最新文档