第五章 相关关系
- 格式:doc
- 大小:242.50 KB
- 文档页数:13
现代心理与教育统计学(张厚粲)课后习题答案第一章绪论(略)第二章统计图表(略)第三章集中量数4、平均数约为36.14;中位数约为36.635、总平均数为91.726、平均联想速度为5.27、平均增加率约为11%;10年后的毕业人数约有3180人8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7第四章差异量数5、标准差约为1.37;平均数约为1.196、标准差为26.3;四分位差为16.037、5cm组的差异比10cm组的离散程度大8、各班成绩的总标准差是6.039、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76第五章相关关系5、应该用肯德尔W系数。
6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。
7、这两列变量的等级相关系数为0.97。
8、上表中成绩与性别有很强的相关,相关系数为0.83。
9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。
10、测验成绩与教师评定之间有一致性,相关系数为0.87。
11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。
12、肯德尔一致性叙述为0.31。
第六章概率分布4、抽得男生的概率是0.355、出现相同点数的概率是0.1676、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.167、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.1858、两个正面,两个反面的概率p=6/16=0.375;四个正面的概率p=1/16=0.0625;三个反面的概率p=4/16=0.25;四个正面或三个反面的概率p=0.3125;连续掷两次无一正面的概率p=0.18759、二项分布的平均数是5,标准差是210、(1)Z≥1.5,P=0.5-0.43=0.07(2)Z≤1.5,P=0.5-0.43=0.07(3)-1.5≤Z≤1.5,p=0.43+0.43=0.86(4)p=0.78,Z=0.77,Y=0.30(5)p=0.23,Z=0.61,Y=0.33(6)1.85≤Z≤2.10,p=0.482—0.467=0.01511、(1)P=0.35,Z=1.04(2)P=0.05,Z=0.13(3)P=0.15,Z=-0.39(4)P=0.077,Z=-0.19(5)P=0.406,Z=-1.3212、(1)P=0.36,Z=-1.08(2)P=0.12,Z=0.31(3)P=0.125,Z=-0.32(4)P=0.082,Z=-0.21(5)P=0.229,Z=0.6113、各等级人数为23,136,341,341,136,2314、T分数为:73.3、68.5、64.8、60.8、57、53.3、48.5、46.4、38.2、29.515、三次6点向上的概率为0.054,三次以上6点向上的概率为0.06316、回答对33道题才能说是真会不是猜测17、答对5至10到题的概率是0.002,无法确定答对题数的平均数18、说对了5个才能说看清了而不是猜对的19、答对5题的概率是0.015;至少答对8题的概率为0.1220、至少10人被录取的概率为0.1821、(1)t0.05=2.060,t0.01=2.784(2)t0.05=2.021,t0.01=2.704(3)t0.05=2.048,t0.01=2.76322、(1)χ20.05=43.8,χ20.0,1=50.9(2)χ20.05=7.43,χ20.0,1=10.923、(1)F0.05=2.31,F0.01=3.03(2)F0.05=6.18,F0.01=12.5324、Z值为3,大于Z的概率是0.0013525、大于该平均数以上的概率为0.0826、χ2以上的概率为0.1;χ2以下的概率为0.927、χ2是20.16,小于该χ2值以下概率是0.8628、χ2值是12.32,大于这个χ2值的概率是0.2129、χ2值是15.92,大于这个χ2值的概率是0.0730、两方差之比比小于F0.05第七章参数估计5、该科测验的真实分数在78.55—83.45之间,估计正确的概率为95%,错误概率为5%。
第五章种内与种间关系1、种内关系:种群内部的个体与个体之间的关系称为种内关系。
2、种间关系:同一生境中的所有不同物种之间的关系称为种间关系。
一、种内关系:1、密度效应:在一定时间内,当种群的个体数目增加时,就必定会出现邻接个体之间的相互影响,称为密度效应或邻接效应。
反应在个体产量和死亡率上。
2、密度效应基本规律:(1)最后产量恒值法则:在一定范围内,当条件相同时,不管一个种群的密度如何,最后产量差不多总是一样的。
(2)—3/2自疏法则3、决定动物婚配制度的主要生态因素可能是资源的分布,主要是食物和营巢地在空间和时间上的分布情况。
4、婚配制度的类型:(1)一雄多雌制;(2)一雌多雄制;(3)单配偶制5、领域是指由个体、家庭或其他社群单位所占据的、并积极保卫不让同种其他成员侵入的空间。
以威胁或直接进攻驱赶入侵者等,称为领域行为。
6、领域性原理:(1)领域面积随领域占有者的体重而扩大;(2)领域面积受食物品质的影响;(3)领域行为和面积往往随生活史,尤其是繁殖季节而变化。
7、社会等级:是指动物种群中各个动物的地位具有一定顺序的等级现象。
8、社会等级和领域性这两类重要的社会性行为,与种群调节有密切联系。
二、种间关系:(一)种间竞争1、种间竞争:是指具有相似要求的物种,为了争夺空间和资源,而产生的一种直接或间接抑制对方的现象。
2、高斯假说(竞争排斥原理):在一个稳定的环境内,两个以上受资源限制的但具有相同资源利用方式的种,不能长期共存在一起,也即完全的竞争者不能共存。
3、Lotka-Volterra模型:(1)(2)(3)(4)4、生态位理论:(1)生态位:主要指在自然生态系统中一个种群在时间、空间上的位置及其与相关种群之间的功能关系。
(2)生态位的发展阶段:空间生态位——>营养生态位——>n-组生态位5、竞争排斥原理与生态位应用到自然生物群落,有以下要点:(1)一个稳定的群落中占据了相同生态位的两个物种,其中一个终究要灭亡;(2)一个稳定的群落中,由于各种群在群落中具有各自的生态位,种群间能避免直接的竞争。
第五章相关分析与回归分析相关分析(Correlation Analysis)和回归分析(Regression Analysis)都是统计学中常用的数据分析方法,用于研究两个或多个变量之间的关系。
相关分析主要用于衡量变量之间的线性关系强度和方向,回归分析则是基于相关分析的基础上建立数学模型来预测或解释因变量的方法。
相关分析是一种用于研究两个变量之间关系强度和方向的统计方法。
相关系数是用来衡量两个变量之间相关关系强度的指标,其取值范围为[-1,1]。
当相关系数为正时,表示两个变量呈正相关,即随着一个变量增加,另一个变量也增加;当相关系数为负时,表示两个变量呈负相关,即随着一个变量增加,另一个变量减少;当相关系数接近于0时,表示两个变量之间关系弱或不存在。
常用的相关系数有皮尔逊相关系数(Pearson correlation coefficient)、斯皮尔曼相关系数(Spearman’s rank correlati on coefficient)和肯德尔相关系数(Kendall’s rank correlation coefficient)等。
皮尔逊相关系数适用于两个变量均为连续型的情况,斯皮尔曼和肯德尔相关系数则适用于至少一个变量为顺序型或等距型的情况。
回归分析是一种建立数学模型来预测或解释因变量的方法。
在回归分析中,通常将一个或多个自变量与一个因变量建立数学关系,然后通过该关系来预测或解释因变量。
回归分析可以分为简单回归分析和多元回归分析两种。
简单回归分析是指只有一个自变量和一个因变量之间的分析。
该方法主要用于研究一个自变量对因变量的影响,通过拟合一条直线来描述自变量和因变量之间的线性关系。
简单回归分析的核心是最小二乘法,即通过最小化误差平方和来确定最佳拟合直线。
多元回归分析是指有多个自变量和一个因变量之间的分析。
该方法主要用于研究多个自变量对因变量的影响,并建立一个多元线性回归模型来描述它们之间的关系。
第五章相关与回归分析一、单项选择题1.下列不属于相关关系的是()。
A.居民收入和商品销售量B.居民收入和银行储蓄额C.个人受教育程度与收入D.物体下落速度与下落时间2.若两个变量之间存在线性负相关关系,则二者之间的线性判定系数的值域为()。
A.(-1,0)B.(0,1)C.大于1D.无法确知3.直线回归方程yˆ=50+2.6x中,2.6表示()。
A.x=0时y的均值为2.6B.x=1时y的均值为2.6C.x每增加一个单位y总的增加2.6个单位D.x每增加一个单位y平均增加2.6个单位4.在回归分析中,剩余离差平方和越大,说明变量之间()。
A.相关程度越低B.相关程度越高C.回归方程拟合效果越好D.因变量变化中由自变量变化而引起的比重越大5.下列关系中属于负相关的有()。
A.居民收入与精神文化支出B.合理范围内的施肥量与农产量C.居民收入与消费支出D.产量与单位产品成本6.若回归直线方程中的回归系数b为负数,则()。
A.γ为0B.γ为负数C.γ为正数D.γ的符号无法确定7.当γ=0.8时,下列说法正确的是( )。
A.80%的点都密集在一条直线的周围B.两变量为高度正线性相关C.两变量线性密切程度是γ= 0.4时的两倍D.80%的点高度相关8.在直线回归方程yˆ=a+b x中,系数a表示()。
A. x变动一个单位时y的平均变动量B. x变动一个单位时y的变动总量C. 当x=0时y的平均值D. y变动一个单位时x的平均变动量9.已知x与y之间存在负相关关系,指出下列哪一个回归方程肯定是错误的()。
A. yˆ= 300-1.82xB.yˆ=-20-0.82xC. yˆ=-150+0.75xD.yˆ= 87-0.32x10.由同一资料计算的相关系数γ与回归系数b之间的关系是()。
A.γ大b也大B.γ小b也小C.γ与b符号相反D.γ与b同符号11.在总离差平方和中,如果回归平方和所占比重大,剩余平方和所占比重小,则两变量之间()。
第五章相关分析第一节相关的意义一、相关的概念相关分析是分析事物之间相互联系的一种手段。
1、从性质角度考虑事物间的联系因果关系:一种现象是另一种现象的因,而另一种现象是这种现象的果。
努力学习是学习成绩好的因,学习成绩好是努力学习的果。
共变关系:表面看来有联系的两种事物都与第三种现象有关,这两种事物间的关系就是共变关系。
如春天出生的婴儿与春天栽种的小树,就其高度而言,表面上看来都在增长,好像有关,其实这二者都是受时间因素的影响,它们本身之间并没有直接的关系。
相关关系:两类现象在发展变化的方向及大小方面存在一定的关系。
如:学生入学成绩与进校一年后的学业成绩;各种成绩之间;中学成绩与大学成绩;智商与学业成绩;教育投资与教育带来的发展;自我价值感与学业成绩、经济条件;运动员的赛前焦虑与比赛成绩、临近比赛的时间;动机强度与工作效率等之间的关系都属于相关关系。
2、相关的种类(1)方向上——正相关、负相关和零相关正相关指一列变量由大而小或由小而大变化时,另一列变量亦由大而小或由小而大的变化,即两列变量是同方向变化的,属“同增共减”的关系。
负相关指一列变量由大而小或由小而大的变化,另一列变量却反由小而大或由大而小的变化,即两列变量的变化方向是相反的,属“此增彼减”的关系。
零相关又称无相关,是一列变量由大而小或由小而大变化时,另一列变量则或大或小的变化,即两列变量的变化看不出一定的趋势,甚至毫无关系。
(2)形状——直线相关和曲线相关直线相关指两列变量中的一列变量在增加时,另一列变量随之而增加;或一列变量在增加,另一列变量却相应地减少,形成一种直线关系。
两列变量的变化在坐标轴上绘制散点图时形成的是长轴或椭圆形图形。
曲线相关指两列相伴随变化的变量,未能形成直线关系。
两列变量的变化莫测在坐标轴上绘制散点图时形成的是成弯月状或曲线形图形。
(3)相关程度——完全相关、强相关、弱相关和无相关完全相关指两列变量的关系是一一对应、完全确定的关系。
在坐标轴上描绘两列变量时会形成一条直线。
强相关又称高度相关,即当一列变量变化时,与之相应的另一列变量增大(或减少)的可能性非常大。
在坐标图上则表现为散点图较为集中在某条直线的周围。
弱相关又称低度相关,即当一列变量变化时,与之相对应的另一列变量增大(或减少)的可能性较小。
在坐标图表现出散点比较分散地分布在某条直线的周围。
无相关则是当一列变量变动时,相对应的另一列变量可能有变动,也可能无变动,而且毫无规律。
二、相关系数概念:相关系数是变量之间相关程度的指标。
样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值一般介于-1~1之间。
相关系数不是等距度量值,而只是一个顺序数据。
计算相关系数一般需大样本。
首先,要从逻辑上判断事物之间是否真正存在关系。
因为相关系数是由样本数据计算而来的,即使所考察的两列变量确无任何关系,我们也可以通过概率得到强的正相关或是强的负相关。
其次,要注意随着样本容量的增大,达到相关显著的相关系数值会变得越来越小。
对于相关系数,我们不仅要问是否显著,还要问有多大,而决定其大小的是测定系数。
测定系数是相关系数的平方(即2r),用以说明二列变量的变异中一方能由另一方解释部分的多少。
一般来说,相关系数在0.3以下为低相关,这时的r只有理论意义而无实际意义;相关系数在0.4~0.6之间为中等相关,这时的r既有有理论意义也有实际意义;相关系数在0.7以上为高相关,这时的r理论意义与实际意义都很大。
第三,要在一定的时空间范围内解释相关系数。
此外,应注意不同类型的数据其相关的计算方法不同。
第二节积差相关一、概念及适用范围积差相关,是计算两个变量线性相关的一种方法,由英国统计学家皮尔逊提出,因此也称为皮尔逊(Pearson)相关。
要使用积差相关必须同时具备如下几个条件:①两个变量都是由测量获得的连续性数据,即等距或等比数据。
②两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称分布,当然样本并不一定要正态。
③必须是成对的数据,而且每对数据之间是相互独立的,即各自互不影响,本条件是难以检验的。
④两个变量之间呈线性关系。
一般用描绘散点图的方式来观察,最好是先各自转化为Z 分数,单位会统一些。
二、积差相关系数的计算方法1、积差相关的基本公式称为X 与Y 的协方差,S X ,S Y 分别是两列变量的标准差。
2、根据原始数据计算公式例5-1:有5名学生的身高(公分)与体重(公斤)的测量结果如下表第2栏所示。
试问身高与体重有无关系?表 5名学生身高和体重的测查结果第1栏第2栏 第3栏 第4栏 第5栏 第6栏 学生 编号实测记分 离差记分积差标准记分标准积差身高体重X dY dY X d d X Z Y Z Y X Z Z XY XX -YY -()()Y Y X X --XX S d YY S d YYX X S d S d ⋅1 170 72 03 0 0 1.5 0.00 2 165 69 -5 0 0 -0.41 0 0.00 3 150 66 -20 -3 60 1.63 -1.5 2.44 4 180 70 10 1 10 0.82 0.5 0.41 5185 68 15 -1 -15 1.22 -0.5 -0.61 ∑85034555——2.24第1步,计算两列变量各自的平均数和标准差1705850==X ,695345==Y ;25.1257502===∑NdS XX ,25202===∑NdS YY第2步,求成对变量的离差X d 和Y d ,将实测记分转换为离差记分。
第3步,将成对变量的离差相乘,称为积差[即()()Y Y X X --]。
积差的平均数称协方差(covariance ),记为()Y X COV ,,即()()2222∑∑∑∑∑∑∑-∙--=Y Y N X X N YX XY N r yx S NS xyr ∑=()()()11555,==--=∑NY Y X X Y X COV第4步,将离差记分转换为标准记分。
第5步,将两列变量的标准记分再相乘称标准积差,标准积差的平均数就是积差相关系数的基本公式,即NZ Zr YXXY ∑=可见,积差相关系数实际上就是成对变量标准积差的算术平均数。
例子的积差相关系数为45.0524.2==XY r三、相关系数的合并在实际应用中,常常需要将来自同一总体的几个样本的相关系数合并得到一个整体的相关系数,合并的步骤是:①r i ->Z i ,即先将各样本的相关系数r 转化为Fisher Z 分数(查附表8); ②求平均的Z 分数:()()∑∑--=33iii n Zn Z ,其中n i 为每个样本的容量;③Z->R ,即用附表8再将平均的Z 分数转化为平均的相关系数。
第三节 等级相关一、等级相关的意义等级相关是根据等级资料来研究变量之间相互关系的方法,其资料一是研究中所收集的数据本身就是等级评定的资料,二是研究中所收集的数据原本为等距或比率变量的资料,因不满足积差相关的使用条件需要将基而转化为等级性资料进行分析的情形。
等级相关使用条件较积差相关更为宽松和灵活,可以用于多列等级或顺序变量,也可以用于成对变量值少于30的情形,还可以用于两列变量总体分布为非正态时。
二、等级相关的计算方法等级相关法因变量个数的多少而有用于分析两列变量相互关系的斯皮尔曼等级相关和用于分析多列变量相互关系的肯德尔和谐系数。
(一)斯皮尔曼等级相关斯皮尔曼等级相关(Spearman’s rank correlation )是根据两列变量的成对等级差数计算相关系数,又叫“等级差数法”,用符号ρr 或S r 表示。
在进行计算之间,必须将原来的数据转化为连续编号的等级数据,这里的等级数据必须是从1到N 排列,若有相同的数据,则平分共同应该占据的等级。
1、无相同等级时的计算公式其中,D 为各对顺序数据之差,N 为数据对数。
例5-2:现有10人的视、听两种感觉道的反应时(单位:毫秒),数据见下表。
问视、听反应时是否具有一致性?表5-7 等级相关系数计算说明()16122--=∑N N D r R 听反应时 视反应时 被试XY RXRYR R Y X D -=D2R XRY1 172 179 7 5 2 4 35 2 140 162 2 2 0 04 3 152 1535 1 4 16 5 4 187 1898 8 0 0 64 5 139 181 1 6-5 25 6 6 195 220 910 -1 1 90 7 212 210 10 9 1 1 90 8 164 182 6 7 -1 1 42 9 149 178 4 4 0 0 16 10 146 170 3 3 0 0 9 ∑555548361()()()()()()。
相关系数为人的视听反应时的等级答:这或者已知解:根据表中的计算,71.01071.011011010361411031141371.01104861161361,48,10102222=⎥⎦⎤⎢⎣⎡+-+⨯⨯-=⎥⎥⎦⎤⎢⎢⎣⎡+-+∙-==-⨯-=--====∑∑∑∑N N N N NN R R r N D r R R D Y X R R Y X2、有相同等级情况需要运用矫正公式,见教材P126例5-3:表5-9是10名学生的数学和语文考试成绩,问数学和语文成绩是否相关? 解:表5-9 出现相同等级时计算等级相关系数的步骤表解二、肯德尔W 系数肯德尔(Kendall)W 系数又称和谐系数,是表示多列等级变量相关程度的一种方法。
适用这种方法的数据资料一般是采用等级评定的方法收集的,即让K 个评委(被试)评定N 件事物,或1个评委(被试)先后K 次评定N 件事物。
等级评定法每个评价者对N 件事物排()()()。
相关,相关系数为答:数学与语文成绩有84.084.00.162136808222680822805.2121012825.01210125.225.0121312125.01212222223323322221010322==⨯∙-+=∙∙-+==--=--==--=--==+=-+-==-=∑∑∑∑∑∑∑∑∑∑∑yx Dyx rC N y C NxC C RCYX YXN N语文 数学 学生X Y RXRYR R Y X D -= D21 59 47 4.5 6 -1.5 2.252 35 40 10 10 0 03 59 42 4.5 8 -3.5 12.254 57 556 3.5 2.5 6.25 5 50 497 5 2 4 6 71 63 1 1 0 0 7 62 55 3 3.5 -0.5 0.258 47 42 8 8 0 09 43 42 9 8 1 1 10 68 57 2 2 0 0N=10∑=262D出一个等级顺序,最小的等级序数为1 ,最大的为N ,若并列等级时,则平分共同应该占据的等级。