两个变量的线性相关_课件
- 格式:ppt
- 大小:1.41 MB
- 文档页数:61
2.3变量间的相关关系2.3.1变量之间的相关关系2.3.2两个变量的线性相关1.变量间的相关关系 (1)相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.(2)散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形叫做散点图.(3)正相关与负相关①正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.②负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.2.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程. (3)最小二乘法:求线性回归方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.其中,b ^是线性回归方程的斜率,a ^是线性回归方程在y 轴上的截距.1.下列两个变量具有相关关系的是( ) A .角度和它的余弦值 B .圆的半径和该圆的面积 C .正n 边形的边数和它的内角和 D .居民的收入与存款D [A 、B 、C 中两变量是确定的函数关系.]2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为( )A .y ^=1.5x +2 B .y ^=-1.5x +2 C .y ^=1.5x -2 D .y ^=-1.5x -2B [由散点图知,变量x ,y 之间负相关,回归直线在y 轴上的截距为正数,故只有B 选项符合.]3.5位学生的数学成绩和物理成绩如下表:A .是函数关系B .是相关关系,但相关性很弱C .具有较好的相关关系,且是正相关D .具有较好的相关关系,且是负相关C [数学成绩x 和物理成绩y 的散点图如图所示.从图上可以看出数学成绩和物理成绩具有较好的相关关系,且成正相关.] 4.设有一个回归方程为y ^=2-1.5x ,则变量x 每增加1个单位时,y 平均减少________个单位.1.5 [因为y ^=2-1.5x ,所以变量x 每增加1个单位时,y 1-y 2=[2-1.5(x +1)]-(2-1.5x )=-1.5,所以y 平均减少1.5个单位.](2)判断y与x是否具有线性相关关系.[解](1)散点图如图所示.(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.相关关系的判断方法(1)两个变量x和y具有相关关系的判断方法①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;②表格、关系式法:结合表格或关系式进行判断;③经验法:借助积累的经验进行分析判断.(2)判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.1.下列关系中,属于相关关系的是________(填序号).①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③出租车费与行驶的里程;④降雪量与交通事故的发生率之间的关系.②④[在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.]1.任意两个统计数据是否均可以作出散点图? [提示] 任意两个统计数据均可以作出散点图. 2.任何一组数据都可以由最小二乘法得出回归方程吗?[提示] 用最小二乘法求回归方程的前提是先判断所给数据具有线性相关关系,否则求回归方程是无意义的.3.回归系数b ^的含义是什么?[提示] (1)b ^代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数.(2)当b ^>0时,两个变量呈正相关关系,含义为:x 每增加一个单位,y 平均增加b ^个单位数;当b ^<0时,两个变量呈负相关关系,含义为:x 每增加一个单位,y 平均减少b ^个单位数.【例2】 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下: 零件数x (个) 10 20 30 40 50 60 70 80 90 100 加工时间y (分)626875818995102108115122(2)如果y 与x 具有线性相关关系,求y 关于x 的回归直线方程.思路点拨:画散点图→确定相关关系→求回归直线系数→写回归直线方程. [解] (1)画散点图如下:由上图可知y与x具有线性相关关系.(2)列表、计算:i 1 2 3 4 5 6 7 8 9 10 x i10 20 30 40 50 60 70 80 90 100 y i62 68 75 81 89 95 102 108 115 122x i y i620 1 360 2 250 3 240 4 450 5 700 7 140 8 6401035012200 a^=y-b^x=91.7-0.668×55=54.96.即所求的回归直线方程为:y^=0.668x+54.96.求回归直线方程的步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)(5)代入公式计算b ^,a ^,公式为(6)写出回归直线方程y ^=b ^x +a ^.2.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x 2 4 5 6 8y30 40 60 50 70(1)画出散点图;(2)求回归方程.[解](1)散点图如图所示.(2)列出下表,并用科学计算器进行有关计算.i 1 2 3 4 5x i 2 4 5 6 8y i30 40 60 50 70x i y i 60 160 300 300 560 x 2i416253664x =5,y =50,∑5i =1 x 2i =145,∑5i =1i i y i =1 380于是可得,b ^===6.5,a ^=y -b ^x =50-6.5×5=17.5. 于是所求的回归方程是y ^=6.5x +17.5.回归方程的应用学生 A B C D E 总成绩x 428 383 421 364 362 数学成绩y 7865716461(2)求y 对x 的线性回归方程(结果保留到小数点后3位数字); (3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩. [解] (1)散点图如图所示:(2)由题中数据计算可得 x =391.6,y=67.8,∑5i =1x 2i =770654,∑5i =1x i y i =133 548.代入公式得b ^=133 548-5×391.6×67.8770 654-5×391.62≈0.204,a ^=67.8-0.204×391.6≈-12.086,所以y 对x 的线性回归方程为y ^=-12.086+0.204x .(3)由(2)得当总成绩为450分时,y ^=-12.086+0.204×450≈80,即这个学生的数学成绩大约为80分.利用线性回归方程解题的常见思路及注意点(1)利用回归直线过样本点的中心,可以求参数问题,参数可涉及回归方程或样本点数据.(2)利用回归方程中系数b ^的意义,分析实际问题.(3)利用回归直线进行预测,此时需关注两点;①所得的值只是一个估计值,不是精确值;②变量x 与y 成线性相关关系时,线性回归方程才有意义,否则即使求出线性回归方程也是毫无意义的,用其估计和预测的量也是不可信的.3.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i =184,∑10i =1x 2i =720.(1)求月储蓄y (千元)关于月收入x (千元)的线性回归方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. [解] (1)由题意知n =10,x =1n ∑10i =1x i =110×80=8,y =1n ∑n i =1y i =110×20=2,又∑ni =1x 2i -n x 2=720-10×82=80,∑10i =1x i y i -n x y =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^y =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)将x =7代入线性回归方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元).1.判断变量之间有无相关关系,简便可行的方法就是绘制散点图.根据散点图,可看出两个变量是否具有相关关系,是否线性相关,是正相关还是负相关.2.求回归直线的方程时应注意的问题(1)知道x 与y 呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验.如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a ^,b ^的值时,要先算出b ^,然后才能算出a ^.3.利用回归方程,我们可以进行估计和预测.若回归方程为y ^=b ^x +a ^,则x=x 0处的估计值为y ^0=b ^x 0+a ^.1.判断下列结论的正误(正确的打“√”,错误的打“×”) (1)相关关系是两个变量之间的一种确定的关系. ( ) (2)回归直线方程一定过样本中心点.( )(3)选取一组数据的部分点得到的回归方程与由整组数据得到的回归方程一定相同.( )[★答案★] (1)× (2)√ (3)×2.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( )A .不能小于0B .不能大于0C .不能等于0D .只能小于0C [当b ^=0时,不具有相关关系,b ^可以大于0,也可以小于0.]3.若施化肥量x (千克/亩)与水稻产量y (千克/亩)的回归方程为y ^=5x +250,当施化肥量为80千克/亩时,预计水稻产量为亩产________千克左右.650 [当x =80时,y ^=400+250=650.]4.2019年元旦前夕,某市统计局统计了该市2018年10户家庭的年收入和年饮食支出的统计资料如下表:年饮食支出y (万元) 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3如果已知y 与x 是线性相关的,求回归方程.(参考数据:∑10i =1x i y i =117.7,∑10i =1x 2i =406)[解] 依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98, 又∵∑10i =1x i y i =117.7,∑10i =1x 2i =406,∴b ^=≈0.17,a ^=y -b ^ x =0.81,∴y ^=0.17x +0.81. ∴所求的回归方程为y ^=0.17x +0.81.。