人教版高中数学必修三 第四章 线性回归方程 Word版含解析
- 格式:doc
- 大小:478.50 KB
- 文档页数:13
线性回归方程
1.线性回归方程
【概念】
线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析.如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析.变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认为关于的回归函数的类型为线性函数.
【实例解析】
例:对于线性回归方程푦=1.5푥+45,푥1∈{1,7,5,13,19},则푦=
解:푥=1+7+5+13+19
5
=
9,因为回归直线必过样本中心(푥,푦),
所以푦=1.5×9+45=13.5+45=58.5.
故答案为:58.5.
方法就是根据线性回归直线必过样本中心(푥,푦),求出푥,代入即可求푦.这里面可以看出线性规划这类题解题方法比较套路化,需要熟记公式.
【考点点评】
这类题记住公式就可以了,也是高考中一个比较重要的点.
1/ 1。
新教材高中数学新人教B版选择性必修第二册:4.3 统计模型4.3.1一元线性回归模型第1课时相关关系与回归直线方程学习任务核心素养1.了解变量间的相关关系.(易混点)2.会根据散点图判断数据是否具有相关关系.(重点)3.了解最小二乘法的思想,会求回归直线方程,掌握回归方程的性质.(重点、难点)1.通过回归直线方程及相关关系的学习,体会数学建模与直观想象的素养.2.借助回归直线方程的求法,培养数学运算的素养.你知道“名师出高徒”的意思吗?——高明的师傅很可能教出技艺高的徒弟,比喻学识丰富的人对于培养人才的重要.也就是说,高水平的老师往往能教出高水平的学生.问题:那么老师的水平与学生的水平之间具有怎样的关系呢?这种关系是确定的吗?该关系与函数关系相同吗?[提示]老师的水平与学生的水平之间具有相关性,一般而言,高水平的老师教出高水平的学生的可能性更大;但两者之间虽然具有相关性,却不具备确定性,这种关系是不确定的.不相同.知识点1相关关系如果两个变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性,像这样两个变量之间的关系,统计学上称为相关关系.1.函数关系是相关关系吗?[提示]不是.函数关系中两个变量之间是一种确定关系.1.下列两个变量中,具有相关关系的是()A.正方体的体积与棱长B.匀速行驶的汽车的行驶路程与时间C .人的身高与体重D .人的身高与视力C [A 选项中,正方体的体积与棱长是函数关系,不是相关关系; B 选项中,匀速行驶的汽车的行驶路程与时间是函数关系,不是相关关系;C 选项中,人的身高会影响体重,但不是唯一因素,所以人的身高与体重是相关关系;D 选项中,人的身高与视力无任何关系.] 知识点2 线性相关 (1)散点图一般地,如果收集到了变量x 和变量y 的n 对数据(简称为成对数据),如下表所示.序号i123 … n变量x x 1 x 2 x 3 … x n 变量y y 1 y 2 y 3 … y n则在平面直角坐标系xOy 中描出点(x i ,y i ),i =1,2,3,…,n ,就可以得到这n 对数据的散点图.(2)线性相关:如果由变量的成对数据、散点图或直观经验可知,变量x 与变量y 之间的关系可以近似地用一次函数来刻画,则称x 与y 线性相关.(3)正相关和负相关若x 与y 线性相关,如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关;如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关.2.下列两个变量具有正相关关系的是( )A .正方形的面积与边长B .吸烟与健康C .数学成绩与物理成绩D .汽车的重量与汽车每消耗1 L 汽油所行驶的平均路程C [正方形的面积与边长是函数关系,A 错误;吸烟与健康具有负相关关系,B 错误;汽车越重,每消耗1 L 汽油所行驶的平均路程越短,所以汽车的重量与汽车每消耗1 L 汽油所行驶的平均路程具有负相关关系,D 错误;数学成绩越好,物理成绩也会越好,所以数学成绩与物理成绩具有正相关关系,C 正确.]知识点3 回归直线方程一般地,已知变量x 与y 的n 对成对数据(x i ,y i ),i =1,2,3,…,n .任意给定一个一次函数y =bx +a ,对每一个已知的x i ,由直线方程可以得到一个估计值y ^i =bx i +a ,如果一次函数y ^=b ^x +a ^能使(y 1-y ^1)2+(y 2-y ^2)2+…+(y n -y ^n )2=∑n i =1(y i -y ^i )2取得最小值,则y ^=b ^x +a ^称为y关于x 的回归直线方程(对应的直线称为回归直线).因为是使得平方和最小,所以其中涉及的方法称为最小二乘法.其中,回归系数b ^=∑ni =1 (x i -x -)(y i -y -)∑ni =1(x i -x -)2=∑ni =1x i y i -n x -y -∑n i =1x 2i -n x-2, a ^=y --b ^x -..x -=1n (x 1+x 2+…+x n )=1n ∑ni =1x i ;y -=1n (y 1+y 2+…+y n )=1n ∑ni =1y i .提醒:回归直线方程y ^=b ^x +a ^中x 的系数是b ^,表示直线的斜率,注意与《选择性必修第一册》中的一次函数的关系式或直线方程y =ax +b 进行区分.3.思考辨析(正确的打“√”,错误的打“×”)(1)相关关系是两个变量之间的一种确定的关系. ( ) (2)回归直线方程一定过样本中心点.( )(3)选取一组数据的部分点得到的回归方程与由整组数据得到的回归方程一定相同.( ) (4)根据回归直线方程得到的结论一定是可靠的. ( )[答案] (1)× (2)√ (3)× (4)× 知识点4 回归直线方程:y ^=b ^x +a ^的性质 (1)回归直线一定过点(x -,y -). (2)回归系数b ^的实际意义: ①b ^是回归方程的斜率;②当x 增大一个单位时,y ^增大b ^个单位.2.y 与x 正负相关的充要条件分别是什么?[提示] 当b ^>0时,y 与x 正相关,反之也成立,同理b ^<0是y 与x 负相关的充要条件.4.已知回归直线的斜率的估计值是 1.23,且过定点(4,5),则线性回归方程是________.y ^=1.23x +0.08 [回归直线的斜率的估计值为1.23, 即b ^=1.23,又回归直线过定点(4,5), ∴a ^=5-1.23×4=0.08, ∴y ^=1.23x +0.08.]类型1变量间相关关系的判断【例1】(1)下列关系中,属于相关关系的是________.(填序号)①扇形的半径与面积之间的关系;②农作物的产量与施肥量之间的关系;③出租车费与行驶的里程;④降雪量与交通事故的发生率之间的关系.(2)某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元).x 24568y 3040605070①画出散点图;②从散点图中判断销售金额与广告费支出成什么样的关系?(1)②④[在①中,扇形的半径与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.](2)[解]①以x对应的数据为横坐标,以y对应的数据为纵坐标,所作的散点图如图所示.②从图中可以发现广告费支出与销售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系.两个变量是否相关的两种判断方法1.根据实际经验:借助积累的经验进行分析判断.2.利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[跟进训练]1. 在下列所示的四个图中,每个图的两个变量具有相关关系的图是( )(1) (2) (3) (4)A .(1)(2)B .(1)(3)C .(2)(4)D .(2)(3)D [图(1)的两个变量具有函数关系;图(2)(3)的两个变量具有相关关系;图(4)的两个变量之间既不是函数关系,也不是相关关系.]类型2 求回归直线方程【例2】 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据.x34 56y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5) [解] (1)由题设所给数据,可得散点图如图.(2)由对照数据,计算得: ∑4i =1x 2i =86,x -=3+4+5+64=4.5, y -=2.5+3+4+4.54=3.5,已知∑4i =1x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为 b ^=∑4i =1x i y i -4x - y-∑4i =1x 2i -4x-2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y --b ^x -=3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).求回归方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n ). (2)作出散点图,确定x ,y 具有线性相关关系. (3)计算x -,y -,∑ni =1x 2i ,∑ni =1x i y i .(4)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑ni =1x i y i -n x -y-∑n i =1x 2i-n x-2,a ^=y --b ^x -.(5)写出回归方程y ^= b ^x +a ^.[跟进训练]2.某研究机构对某校学生的记忆力x 和判断力y 进行统计分析,得下表数据:x 6 8 10 12 y 2 356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归直线方程. [解] (1)散点图如图所示.(2)x -=6+8+10+124=9,y -=2+3+5+64=4,∑n i =1(x i -x -)(y i -y -)=(-3)×(-2)+(-1)×(-1)+1×1+3×2=14,∑ni =1(x i -x -)2=(-3)2+(-1)2+1+32=20,所以b ^=1420=0.7,所以a ^=y --b ^x -=4-0.7×9=-2.3,故回归直线方程为y ^=0.7x -2.3. 类型3 回归直线方程的性质及应用假设y 与x 具有相关关系,而且回归直线方程为y ^=b ^x +a ^. 1.回归直线方程的单调性由哪个参数决定? [提示] b ^.2.该方程必过哪个定点? [提示] (x -,y -).【例3】 (多选题)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点中心(x -,y -)C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg ABC [当x =170时,y ^=0.85×170-85.71=58.79, 体重的估计值为58.79 kg ,故D 错误,ABC 均正确.]1.相关关系的正、负相关类同于函数的增、减性,与其斜率有关,必要时可画散点图以增强直观性.2.由回归方程得出的函数值不一定是准确值,只是个估计值.[跟进训练]3.(1)根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( )x345678y 4.0 2.5 -0.5 0.5 -2.0 -3.0A .a ^>0,b ^>0 B .a ^>0,b ^<0 C .a ^<0,b ^>0D .a ^<0,b ^<0(2)某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表.气温(℃)18 13 10 -1用电量(度) 24 34 3864由表中数据得线性回归方程y ^=b ^x +a ^中b ^=-2,预测当气温为-4 ℃时,用电量的度数约为________度.(1)B (2)68 [(1)画出散点图,知a ^>0,b ^<0.(2)x -=10,y -=40,回归方程过点(x -,y -), ∴40=-2×10+a ^. ∴a ^=60.∴y ^=-2x +60. 令x =-4,∴y ^=(-2)×(-4)+60=68.]1.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是( )① ② ③ ④A .①②B .①③C .②③D .③④ B [①③中的点分布在一条直线附近,适合线性回归模型.]2.由变量x 与y 相对应的一组数据(1,y 1),(5,y 2),(7,y 3),(13,y 4),(19,y 5)得到的线性回归方程为y ^=2x +45,则y -=( )A .135B .90C .67D .63D [∵x -=15(1+5+7+13+19)=9,y -=2x -+45,∴y -=2×9+45=63,故选D .]3.工人工资y (元)与劳动生产率x (千元)的相关关系的回归方程为y ^=50+80x ,下列判断正确的是( )A .劳动生产率为1 000元时,工人工资为130元B .劳动生产率提高1 000元时,工人工资平均提高80元C .劳动生产率提高1 000元时,工人工资平均提高130元D .当月工资为250元时,劳动生产率为2 000元B [因为回归直线的斜率为80,所以x 每增加1,y 平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.]4.某地区近10年居民的年收入x 与年支出y 之间的关系大致符合y ^=0.8x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元.12.1 [将x =15代入y ^=0.8x +0.1,得y ^=12.1.]5.如图是一组数据(x ,y )的散点图,经最小二乘法计算,y 与x 之间的线性回归方程为y ^=b ^x +1,则b ^=________.0.8 [x -=0+1+3+44=2,y -=0.9+1.9+3.2+4.44=2.6,将(2,2.6)的坐标代入y ^=b ^x +1,解得b ^=0.8.]回顾本节内容,自我完成以下问题: 1.相关关系与函数关系有何区别与联系? [提示] 分类函数关系相关关系特征变量之间的关系具有确定性,当一个变量确定后,另一个变量就确定了变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性区别是确定性关系,还是因果关系.例如,圆的半径由1增大到2,其面积必然由π增大到4π是一种不确定性关系.例如,吸烟不一定患肺癌,但吸烟多的人患肺癌的风险会大幅度增加.相关关系不一定是因果关系,也可能是伴随关系联系函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.二者在一定条件下可以相互转化,对于具有线性相关关系的两个变量来说,当求得其回归直线方程后,可以用一种确定性的关系对这两个变量间的取值进行评估 2.回归直线方程与直线方程有何区别?[提示] 回归直线方程中y 的上方加记号“^”是与实际值y 相区别,因为回归直线方程中的“y ^”的值是通过统计大量数据所得到的一个预测值,它具有随机性,因而对于每一个具体的实际值而言,y ^的值只是比较接近,但存在一定的误差,即y =y ^+e (其中e 为随机变量),预测值y ^与实际值y 的接近程度由随机变量e 的标准差决定.直线方程中y 与x 的关系是确定的,给x 一个值,y 有唯一确定的值与之对应。
自主广场我夯基 我达标1.相关关系与函数关系的区别是_________.思路解析:考查函数关系和相关关系的含义.答案:函数关系是两个变量之间有完全确定的关系,而相关关系是两个变量之间并没有严格的确定关系,当一个变量变化时,另一变量的取值有一定的随机性 2.线性回归方程y=bx+a 过定点__________.思路解析:考查线性回归方程的意义,及点与直线的位置关系的判断.由线性回归直线方程的推导过程不难发现直线恒过定点(x ,y ).答案:(x ,y )3.工人工资(元)依劳动生产率(千元)变化的回归方程为y ˆ=50+80x ,下列判断正确的是( ) A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资大约提高80元C .劳动生产率提高1 000元时,工资提高大约130元D .当月工资250元时,劳动生产率为2 000元思路解析:考查了直线斜率的实际意义,即k=.x x y y xy1212∆∆==--横坐标的增量纵坐标的增量答案: B4.设有一个直线回归方程为yˆ=2-1.5x ,则变量x 增加一个单位( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位C .y 平均减少1.5个单位D .y 平均减少2个单位思路解析:考查了直线斜率的实际意义,即k=.x x y y xy1212∆∆==--横坐标的增量纵坐标的增量答案: C5.下列两个变量之间的关系不是函数关系的是( )A .角度和它的余弦值B .正方形边长和面积C .正n 边形的边数和它的内角和D .人的年龄和身高思路解析:本题主要考查相关关系的概念.由函数的定义可知A 、B 、C 三项中的两个变量间的关系均为函数关系,故答案为D.答案: D 6.已知样本容量为11,计算得∑=111i ix=510,∑=111i iy=214,∑=1112i ix=36 750,∑=1112i iy=5422,∑=111i ii yx =13 910,则y 对x 的回归方程为__________.思路解析:考查线性回归方程的求法.在回归方程中b=. x b ,x x n y x y x n ni i n i i ni i n i i n i i i -=--∑∑∑∑∑=====y a )())((2112111答案:y=5.34+0.3x7.部分国家13岁学生数学测验平均分数见下表.试作出该数据的散点图,并由图判断是否存在回归直线.若有,试求出直线方程.思路解析:考查了用回归直线方程进行拟合的一般步骤.用回归直线方程进行拟合的一般步骤为:作出散点图;判断散点是不是在一条直线的附近;若散点在一条直线的附近,利用公式求出回归直线方程.答案:(图略)存在回归直线方程,回归直线方程是y=0.313 3x+0.900 1.我综合 我发展8.一个工厂在某年每月产品的总成本y(万元)与该月产量x(万件)之间的一组数据如下:试作出该数据的散点图,并求总成本y 与月产量x 之间的回归直线方程. 思路解析:考查了回归直线方程的求法. 答案:(图略)回归直线方程是y ˆ=1.215x +0.974.9.对于线性相关系数r ,叙述正确的是( )A .|r|∈(0,+∞),|r|越大,相关程度越大;反之,相关程度越小B .r ∈(-∞,+∞),r 越大,相关程度越大;反之,相关程度越小C .|r|≤1,且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小D .以上说法都不对思路解析:考查了线性相关程度的判断方法.|r|≤1,且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小.答案: C我创新 我超越10.改革开放以来,我国高等教育事业有了迅速发展.这里我们得到了某省从1990~2000年18~24岁的青年人每年考入大学的百分比,我们把农村、乡镇和城市分开统计.为了便于计算,把1990年编号为0,1991年编号为1,…,2000年编号为10.如果把每年考入大学的百分比作为因变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线:城市yˆ=9.50+2.84x,乡镇yˆ=6.76+2.32x,农村yˆ=1.80+0.42x.(1)在同一坐标系内作出三条回归直线.(2)对于农村青年来讲,系数等于0.42意味着什么?(3)在这一阶段,三个组哪一个的大学入学率年增长最快?(4)请查阅我国人口分布的有关资料,选择一个在高等教育发展上有代表性的省,以这个省的大学入学率作为样本,说明我国在1991~2000年10年间大学入学率的总体发展情况.思路解析:考查了直线方程的画法,直线斜率的实际意义及解决问题和分析问题的能力.答案:(1)图略.(2)对于农村青年来讲,系数等于0.42意味着考入大学的百分比增长较慢.(3)城市组.(4)略.。
重点列表:重点 名称重要指数 重点1 相关关系的判断 ★★★★ 重点2 线性回归方程有关概念 ★★★ 重点3散点图★★★★重点详解:1.变量间的相关关系常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是________;与函数关系不同,相关关系是一种________关系,带有随机性. 2.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有____________,这条直线叫________.(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为________;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为________.※ (3)相关系数r =∑∑∑===----nj jn i ini iiy yx x y y x x 12121)()())((,当r >0时,表示两个变量正相关;当r <0时,表示两个变量负相关.r 的绝对值越接近________,表示两个变量的线性相关性越强;r 的绝对值越接近________,表示两个变量的线性相关性越弱.通常当r 的绝对值大于0.75时,认为两个变量具有很强的线性相关关系. 3.回归直线方程 (1)通过求Q =∑=--ni i ix y12)(βα的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做____________.该式取最小值时的α,β的值即分别为,.(2)两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为a x b yˆˆˆ+=,则 ⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.ˆˆ,)())((ˆ1221121x b y axn xy x n yx x x y y x x b ni ini ii n i i ni i i【答案】1.相关关系 非确定性2.(1)线性相关关系 回归直线 (2)正相关 负相关 (3)1 0 3.最小二乘法重点1:相关关系的判断 【要点解读】在研究两个变量之间是否存在某种关系时,必须从散点图入手.对于散点图,可以做出如下判断:(1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.(2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系. (3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. 【考向1】确定性关系与随机关系【例题】下列变量之间的关系不是..相关关系的是( ) A .已知二次函数y =ax 2+bx +c ,其中a ,c 是已知常数,取b 为自变量,因变量是这个函数的判别式Δ=b 2-4ac B .光照时间和果树亩产量 C .降雪量和交通事故发生率 D .每亩施用肥料量和粮食亩产量解:由函数关系和相关关系的定义可知,A中Δ=b2-4ac,因为a,c是已知常数,b为自变量,所以给定一个b的值,就有唯一确定的Δ与之对应,所以Δ与b之间是一种确定的关系,是函数关系.B,C,D中两个变量之间的关系都是相关关系.故选A.【评析】要注意函数关系与相关关系的区别:函数关系是确定性关系,而相关关系是随机的、不确定的.重点2:线性回归方程有关概念【要点解读】样本中心点一定在回归直线上【考向1】样本中心点【例题】为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人得到的试验数据中,变量x的平均值都等于s,变量y的平均值都等于t,那么下列说法正确的是( ) A.直线l1和l2一定有公共点(s,t)B.直线l1和l2相交,但交点不一定是(s,t)C.必有直线l1∥l2D.直线l1和l2必定重合【评析】回归方程一定通过样本点的中心(,y);中心相同的样本点的回归方程不一定相同.【考向2】线性回归直线的理解【例题】由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)得到回归直线方程ax byˆˆˆ+=,那么下面说法错误..的是( )A.直线ax byˆˆˆ+=必经过点(,y)B.直线ax byˆˆˆ+=至少经过点(x1,y1),(x2,y2),…,(x n,y n)中的一个点C.直线ax byˆˆˆ+=的斜率=∑∑==--niiniiix nxy x nyx1221D .直线a x b y ˆˆˆ+=和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑=+-ni ii a x b y 12)]ˆˆ([是该坐标平面上所有直线与这些点的偏差中最小的重点3:散点图 【要点解读】根据散点图可以直观判断正负相关以及数据所对应的函数模型 【考向1】正相关与负相关【例题】(1)对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( )图1图2A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解:由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关,故选C.【评析】点分布在从左下角到右上角的区域时,两个变量的相关关系为正相关;点分布在从左上角到右下角的区域时,两个变量的相关关系为负相关.(2)下面是一块田的水稻产量与施化肥量的一组观测数据(单位:kg): 施化肥量15 20 25 30 35 40 45 水稻产量 320 330 360 410 460 470 480 (Ⅰ)将上述数据制成散点图;(Ⅱ)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗? 解:(Ⅰ)散点图如下:(Ⅱ)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大.图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长,不会一直随化肥施用量的增加而增长.【评析】任何一组数据(二元数据)都可以作出散点图,散点图可以直观地观察两个变量间的关系.【考向2】散点图的画法及相关关系识别【例题】(1)从左至右,观察下列三个散点图,变量x与y的关系依次为________(正相关记作①;负相关记作②;不相关记作③).(2)科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计:年平均气温12.51 12.84 12.84 13.69 13.33 12.74 13.05年降748 542 507 813 574 701 432雨量(Ⅰ)试画出散点图;(Ⅱ)判断两个变量是否具有线性相关关系.解:(Ⅰ)作出散点图如图所示.(Ⅱ)由散点图可知,各点并不在一条直线附近,所以两个变量不具有线性相关关系.难点列表:求线性回归直线方程的步骤(1)用散点图或进行相关性检验判断两个变量是否具有线性相关关系;(2)求系数b ^:公式有两种形式,b ^=∑ni =1(x i -x -)(y i -y -)∑n i =1(x i -x -)2=∑n i =1x i y i -nx - y-∑ni =1x 2i -nx-2,根据题目具体情况灵活选用;(3)求a ^:a ^=y --b ^x -; (4)写出回归直线方程.说明:当数据较复杂时,题目一般会给出部分中间结果,观察这些中间结果可确定选用公式的哪种形式求b ^.难点1:求回归方程及用回归方程进行估计 【要点解读】(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则无意义.(2)根据回归方程进行的估计仅是一个预测值,而不是真实发生的值.(3)用最小二乘法求回归方程,关键在于正确求出系数,,由于,的计算量大,计算时应仔细小心,分层进行(最好列出表格),避免因计算而产生错误. 【考向1】求线性回归方程【例题】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程;(3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考值3×2.5+4×3+5×4+6×4.5=66.5)解:(1)散点图如下:(2)由系数公式可知,=4.5,y=3.5,=66.5-4×4.5×3.586-4×4.52=0.7,=3.5-0.7×4.5=0.35,所以线性回归方程为yˆ=0.7x+0.35.(3)x=100时,yˆ=0.7x+0.35=70.35,所以预测生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤.【评析】牢记求线性回归方程的步骤:(1)列表;(2)计算,y,∑=niiiyx1,∑=niix12;(3)代入公式求,再利用xbyaˆˆ-=求,(4)写出回归方程.【考向2】利用线性回归方程进行预测【例题】从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单位:千元)的数据资料,算得∑=101iix=80, ∑=101iiy=20,∑=101iiiyx=184,∑=1012iix=720.(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y=bx+a中,b=∑∑==--niiniiix nxy x nyx1221,xbya-=,其中,y为样本平均值,线性回归方程也可写为y^=b^x+a^.解:(1)由题意知n=10,=1n ∑=ni ix 1=8010=8, y =1n ∑=ni i y 1=2010=2,又∑=ni ix12- n 2 =720 -10×82=80,∑=ni ii y x 1-n y x =184-10×8×2=24,由此得b =2480=0.3,a =y -b =2-0.3×8=-0.4,故所求回归方程为y =0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元). 难点2:非线性相关转化为线性相关 【要点解读】通过观察散点图,分析其函数模型,然后转化成线性相关 【考向1】非线性相关转化为线性相关【例题】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+β u 的斜率和截距的最小二乘估计分别为β^=解题指导] 切入点:回归分析中对散点图的理解,回归方程的求法和应用;关键点:通过换元把非线性回归方程转化为线性回归方程求解.解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.c ^=y -d^ w =563-68×6.8=100.6, 所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.【趁热打铁】1.两个变量成负相关关系时,散点图的特征是( ) A .点分布在从左下角到右上角的区域B .散点图在某方形区域内C .散点图在某圆形区域内D .点分布在从左上角到右下角的区域2.对于给定的两个变量的统计数据,下列说法正确的是( ) A .都可以分析出两个变量的关系B .都可以用一条直线通过近似表示两者关系来估计总体的均值C .都可以作出散点图D .都可以用确定的表达式表示两者的关系 3.下列命题:①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线把非确定性问题转化为确定性问题进行研究. 其中正确的命题为( )A .①③④B .②④⑤C .③④⑤D .②③⑤4.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 35.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.零件数x 10 20 30 40 50 加工时间y (min)62&758189A .67B .68C .69D .706.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( )A .r 2<r 1<0B .0<r 2<r 1C .r 2<0<r 1D .r 2=r 17.某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,得到售价x (元)和销售量y (件)之间的一组数据如下表:yˆ=-3.2x +a ,则a =______.8.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.9.假设关于某种设备的使用年限x (年)与所支出的维修费用y (万元)有如下统计资料:已知∑=512i ix=90,∑=51i ii y x =112.3.(1)求,y ;(2)如果x 与y 具有线性相关关系,求出线性回归方程; (3)估计使用年限为10年时,维修费用约是多少?10.某班主任为了对本班学生的月考成绩进行分析,决定从全班25名女同学,15名男同学中随机抽取一个容量为8的样本进行分析.(1)如果按性别比例分层抽样,应选男女生各多少人; (2)随机抽取8位同学的数学、物理分数对应如表:性相关性,求出线性回归方程(系数精确到0.01);如果不具有线性相关性,请说明理由.第四章1解:正确的只有D选项.故选D.2解:任两个变量均可作出散点图,从散点图上看有相关关系的才具有分析的价值,无相关关系的则作不出什么结论.故选C.4解:由相关系数定义及散点图所表达含义可知r2<r4<0<r3<r1,故选A.5解:=15×(10+20+30+40+50)=30,由于y^=0.67x+54.9必过点(,y),∴y=0.67×30+54.9=75,因此图表中的模糊数据为75×5-(62+75+81+89)=68.故选B.6解:对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关;对于变量V与U而言,V随U的增大而减小,故V与U负相关,故r2<0<r1.故选C.7解:价格的平均数=9+9.5+10+10.5+115=10,销售量的平均数y=11+10+8+6+55=8,由yˆ=-3.2x+a知b=-3.2,所以a=y-b=8+3.2×10=40.故填40.8解:根据题中所提供的信息,可知父亲与儿子的身高的对应数据可列表如下:父亲的身高(x) 173 170 176儿子的身高(y) 170 176 182=173,y=176,∴=∑∑==---3121)())((iiiiixxyyxx=3×6(-3)2+32=1,=y-=176-173=3.∴回归直线方程为yˆ=x+3,从而可预测他孙子的身高为182+3=185(cm).故填185.10解:(1)按性别比例分层抽样,应选男生15×840=3(人),选女生25×840=5(人).(2)以数学成绩x 为横坐标,物理成绩y 为纵坐标作散点图如图所示.从散点图可以看出这些点大致分布在一条直线附近,并且在逐步上升,故物理与数学成绩线性正相关.设y 与x 的线性回归方程是yˆ=bx +a ,根据所给的数据,可以计算出≈0.65,≈34.5, 所以y 与x 的回归方程是yˆ=0.65x +34.5.。
6.4线性回归方程案例探究在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?分析:凭我们的学习经验可知,物理成绩确实与数学成绩有一定的关系,但除此以外,还存在其他影响物理成绩的因素.例如,是否喜欢物理,用在物理学习上的时间等等.在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示.例如,圆的面积S与半径r 之间就是确定性函数关系,可以用函数S=πr2表示.一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.例如,人的体重与身高有关.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.自学导引1.在实际问题中,变量之间的常见关系有两类:一类是确定性关系,另一类是相关关系.2.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.3.请你说出确定性关系与相关关系的相同点和不同点.答案:相同点:均是指两个变量的关系.不同点:相关关系是一种非确定的关系.确定性关系是自变量与函数值之间的关系,可以用一个函数表示.这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.这种关系不能用一个确定的函数来表示.4.你是否还能举出一些现实生活中存在的相关关系的问题?答案:例如,商品销售收入与广告支出经费之间的关系;粮食产量与施肥量之间的关系;人体的脂肪含量与年龄之间的关系,等等.5.将n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.6.(1)当两个变量成正相关时,散点图有什么特点?(2)当两个变量成负相关时,散点图又有什么特点?答案:(1)散点图中的点散布在从左下角到右上角的区域.(2)散点图中的点散布在从左上角到右下角的区域.7.对于散点图可以作出如下判断:(1)当所有的样本点都落在某一函数曲线上,变量之间具有函数关系;(2)当所有的样本点都落在某一函数曲线附近,变量之间具有相关关系;(3)当所有的样本点都落在某一直线附近,变量之间具有线性相关关系.8.回归直线是怎样定义的?答案:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.疑难剖析【例1】 下表是某地年降雨量与年平均气温的统计数据,判断两变量有相关关系吗?求回归直线方程有意义吗?思路分析:用回归直线进行拟合两变量关系的一般步骤为: (1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,以公式求出a, b ,并写出线性回归方程.解:以x 轴为年平均气温,y 轴为年降雨量可得相应的散点图:因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没有必要用回归直线进行拟合,用公式求得的回归方程也是没有意义的.思维启示:要判断两个变量是否具有线性相关关系,可先作出散点图,再观察散点是否在一条直线附近,如果是,则二者具有线性相关关系;否则,二者不具有线性相关关系. 思维陷阱:解此题的第(2)小问时不要盲目地去求回归方程.观察两相关变量得如下数据:求两变量间的回归方程.错解:求线性回归直线方程的步骤: 第一步:列表x i ,y i ,x i y i ; 第二步:计算x ,y,∑=ni ix12,∑=ni iy12,∑=ni ii yx 1;第三步:代入公式计算b, a 的值; 第四步:写出回归直线方程.列表:计算得:x =0, y =0∑=1012i ix=110,∑=1012i iy=310,∑=101i ii yx =110∴b=1010110010110)(101021012101=*-*-=--∑∑==x x yx yx i i i iia=y -b x =0-1*0=0故所求回归直线方程为yˆ=x. 正解:作两个变量的散点图(图略),从散点图中看出,点不在某条直线附近,分散得很开.因此,变量x 和y 不具有线性相关关系,也就不存在线性回归方程.【例2】 某班学生每周用于数学学习的时间x (单位:h )与数学成绩y (单位:分)之间有如下数据:某同学每周用于数学学习的时间为18小时,试预测该生数学成绩. 思路分析:首先应该利用表中数据通过计算去判断数学学习的时间x 与数学成绩y 是否具有线性相关关系.若有,则可求出回归方程;然后在方程中令x=18,可求出该生数学成绩.解:因为学习时间与学习成绩之间具有线性相关关系.利用科学计算器计算到如下表所示的数据:于是可得b=53.34.1544.545)(101021012101≈=--∑∑==x xyx yx i ii iia=y -b x =74.9-3.53×17.4≈13.5 故所求回归直线方程为y=3.53x+13.5当x=18时,yˆ=3.53×18+13.5=77.04≈77 故该同学预计可得77分左右.思维启示:两个有线性相关关系的变量间的关系可以用线性回归方程来表示,而对总体的预测可依据回归直线方程进行.【例3】 一般说,一个人的身高越高,他的手就越大.为了调查这一问题,对10名高三男生的身高与右手一揸长测量得如下数据:(单位:cm )(1)依据上述数据制作散点图,发现两者有何相关关系吗? (2)如果近似成线性关系,求线性回归方程.(3)如果一个学生身高185 cm ,估计他的右手一揸长.思路分析:首先作出散点图;利用散点图去判断两变量是否具有线性关系;若具有线性关系,再利用公式求出方程;最后利用方程去解答第三小问.解:(1)散点图如下:可见,身高与右手一揸长之间的总体趋势成一条直线,即他们线性相关.(2)设线性回归方程为yˆ=bx+a 由上述数据计算可得x =174.8, y =21.7∑=1012i ix=305 730,∑=101i ii yx =37 986∴b=21012101)(1010x xyx yx i ii ii--∑∑===303.08.174107303057.218.17410986372≈⨯-⨯⨯- a=y -b x =-31.264∴方程为yˆ=0.303x-31.264. (3)当x=185时, yˆ=24.79. 思维启示:先作出散点图,若两变量具有线性关系,再利用公式求出方程.拓展迁移【拓展点1】 如果你想作一个反对抽烟的电视公益广告的播放次数与看电视的中学生戒烟率的数据散点图,作为x 轴的变量为__________. 答案:播放次数【拓展点2】 有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第一列表示此种食品所含热量的百分比,第二列数据表示由一些美食家以百分制给出的对此种食品口味的评价.(1)求出回归直线方程;(2)关于两个变量之间的关系,得出的结论是什么?答案:(1) yˆ=1.565x+37.827 (2)由回归方程知道,食品所含热量越大,口味记录越好,反之亦然.【拓展点3】 某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:(1)作出散点图;(2)如果y与x之间具有线性相关关系,求回归方程;(3)估计尿汞含量为9毫克/升时消光系数.答案:(1)散点图略.(2)由散点图可知y与x线性相关.设回归方程为yˆ=bx+A.计算可得回归方程为yˆ=36.95x-11.3.(3)当x=9时,yˆ=36.95×9-11.3=321.25≈321。
2018版高中数学专题03 线性回归方程及其应用分项汇编(含解析)新人教A版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高中数学专题03 线性回归方程及其应用分项汇编(含解析)新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高中数学专题03 线性回归方程及其应用分项汇编(含解析)新人教A版必修3的全部内容。
专题03 线性回归方程及其应用一、选择题1.【北京101中学2016-2017学年下学期高二年级期中考试】一位母亲记录了自己儿子3~9岁的身高数据(略),由此建立的身高与年龄的回归模型为y=7。
19x+73。
93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A. 身高一定是145。
83cmB。
身高在145.83cm以上C. 身高在145。
83cm左右D。
身高在145.83cm以下【答案】C【解析】由回归模型可得y=7。
1910x+73.93=145.83,所以预测这个孩子10岁时的身高在145.83cm左右.2.【吉林省辽源市田家炳高级中学2017—2018学年高二下学期3月月考】有位同学家开了个小卖部,他为了研究气温对热饮销售的影响,经过统计得到一天所卖的热饮杯数(y)与当天气温(x℃)之间的线性关系,其回归方程为ˆy=-2。
35x+147.77.如果某天气温为2℃,则该小卖部大约能卖出热饮的杯数是( )A。
140 B. 143 C. 152 D。
156【答案】B点睛:本题主要考查的知识点是线性回归方程的应用,即根据所给的或者是做出的线性回归方程,预报y 的值,这是一些解答题目中经常会出现的一个问题,是一个基础题。
重点列表:重点详解:1.变量间的相关关系常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是________;与函数关系不同,相关关系是一种________关系,带有随机性. 2.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有____________,这条直线叫________.(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为________;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为________.※ (3)相关系数r =∑∑∑===----nj jn i ini iiy yx x y y x x 12121)()())((,当r >0时,表示两个变量正相关;当r <0时,表示两个变量负相关.r 的绝对值越接近________,表示两个变量的线性相关性越强;r 的绝对值越接近________,表示两个变量的线性相关性越弱.通常当r 的绝对值大于0.75时,认为两个变量具有很强的线性相关关系. 3.回归直线方程 (1)通过求Q =∑=--ni i ix y12)(βα的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做____________.该式取最小值时的α,β的值即分别为,.(2)两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为a x b yˆˆˆ+=,则 ⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.ˆˆ,)())((ˆ1221121x b y axn xy x n yx x x y y x x b ni ini ii n i i ni i i【答案】1.相关关系 非确定性2.(1)线性相关关系 回归直线 (2)正相关 负相关 (3)1 0 3.最小二乘法重点1:相关关系的判断 【要点解读】在研究两个变量之间是否存在某种关系时,必须从散点图入手.对于散点图,可以做出如下判断:(1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.(2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系. (3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. 【考向1】确定性关系与随机关系【例题】下列变量之间的关系不是..相关关系的是( ) A .已知二次函数y =ax 2+bx +c ,其中a ,c 是已知常数,取b 为自变量,因变量是这个函数的判别式Δ=b 2-4ac B .光照时间和果树亩产量 C .降雪量和交通事故发生率 D .每亩施用肥料量和粮食亩产量解:由函数关系和相关关系的定义可知,A 中Δ=b 2-4ac ,因为a ,c 是已知常数,b 为自变量,所以给定一个b 的值,就有唯一确定的Δ与之对应,所以Δ与b 之间是一种确定的关系,是函数关系.B ,C ,D 中两个变量之间的关系都是相关关系.故选A .【评析】要注意函数关系与相关关系的区别:函数关系是确定性关系,而相关关系是随机的、不确定的.重点2:线性回归方程有关概念 【要点解读】样本中心点一定在回归直线上 【考向1】样本中心点【例题】为了考查两个变量x 和y 之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1,l 2,已知两人得到的试验数据中,变量x 的平均值都等于s ,变量y 的平均值都等于t ,那么下列说法正确的是( ) A .直线l 1和l 2一定有公共点(s ,t ) B .直线l 1和l 2相交,但交点不一定是(s ,t ) C .必有直线l 1∥l 2 D .直线l 1和l 2必定重合【评析】回归方程一定通过样本点的中心(,y );中心相同的样本点的回归方程不一定相同. 【考向2】线性回归直线的理解【例题】由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到回归直线方程a x b yˆˆˆ+=,那么下面说法错误..的是( ) A .直线a x b yˆˆˆ+=必经过点(,y ) B .直线a x b yˆˆˆ+=至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点 C .直线a x b yˆˆˆ+=的斜率=∑∑==--ni ini ii xn xy x n yx 1221D .直线a x b y ˆˆˆ+=和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑=+-ni ii a x b y 12)]ˆˆ([是该坐标平面上所有直线与这些点的偏差中最小的重点3:散点图 【要点解读】根据散点图可以直观判断正负相关以及数据所对应的函数模型 【考向1】正相关与负相关【例题】(1)对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( )图1图2A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解:由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关,故选C.【评析】点分布在从左下角到右上角的区域时,两个变量的相关关系为正相关;点分布在从左上角到右下角的区域时,两个变量的相关关系为负相关. (2)下面是一块田的水稻产量与施化肥量的一组观测数据(单位:kg): 施化肥量15 20 25 30 35 40 45 水稻产量 320 330 360 410 460 470 480 (Ⅰ)将上述数据制成散点图;(Ⅱ)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗? 解:(Ⅰ)散点图如下:(Ⅱ)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大.图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长,不会一直随化肥施用量的增加而增长.【评析】任何一组数据(二元数据)都可以作出散点图,散点图可以直观地观察两个变量间的关系.【考向2】散点图的画法及相关关系识别【例题】(1)从左至右,观察下列三个散点图,变量x与y的关系依次为________(正相关记作①;负相关记作②;不相关记作③).(2)科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计:(Ⅰ)试画出散点图;(Ⅱ)判断两个变量是否具有线性相关关系.解:(Ⅰ)作出散点图如图所示.(Ⅱ)由散点图可知,各点并不在一条直线附近,所以两个变量不具有线性相关关系.难点列表:求线性回归直线方程的步骤(1)用散点图或进行相关性检验判断两个变量是否具有线性相关关系;(2)求系数b ^:公式有两种形式,b ^=∑ni =1(x i -x -)(y i -y -)∑n i =1(x i -x -)2=∑ni =1x i y i -nx - y-∑ni =1x 2i -nx -2,根据题目具体情况灵活选用;(3)求a ^:a ^=y --b ^x -; (4)写出回归直线方程.说明:当数据较复杂时,题目一般会给出部分中间结果,观察这些中间结果可确定选用公式的哪种形式求b ^.难点1:求回归方程及用回归方程进行估计 【要点解读】(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则无意义.(2)根据回归方程进行的估计仅是一个预测值,而不是真实发生的值.(3)用最小二乘法求回归方程,关键在于正确求出系数,,由于,的计算量大,计算时应仔细小心,分层进行(最好列出表格),避免因计算而产生错误. 【考向1】求线性回归方程【例题】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程;(3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考值3×2.5+4×3+5×4+6×4.5=66.5) 解:(1)散点图如下:(2)由系数公式可知,=4.5,y =3.5, =66.5-4×4.5×3.586-4×4.52=0.7, =3.5-0.7×4.5=0.35,所以线性回归方程为yˆ=0.7x +0.35. (3)x =100时,yˆ=0.7x +0.35=70.35,所以预测生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤.【评析】牢记求线性回归方程的步骤:(1)列表;(2)计算,y ,∑=ni i i y x 1,∑=ni i x 12;(3)代入公式求,再利用x b y aˆˆ-=求,(4)写出回归方程. 【考向2】利用线性回归方程进行预测【例题】从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑=101i ix=80,∑=101i iy=20,∑=101i ii y x =184,∑=1012i ix=720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y =bx +a 中,b =∑∑==--ni ini iixn xy x n yx 1221,x b y a -=,其中,y 为样本平均值,线性回归方程也可写为y ^=b ^x +a ^.解:(1)由题意知n =10,=1n ∑=ni ix1=8010=8, y =1n∑=ni i y 1=2010=2,又∑=ni ix12- n 2 =720 -10×82=80,∑=ni ii y x 1-n y x =184-10×8×2=24,由此得b =2480=0.3,a =y -b =2-0.3×8=-0.4, 故所求回归方程为y =0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元). 难点2:非线性相关转化为线性相关 【要点解读】通过观察散点图,分析其函数模型,然后转化成线性相关 【考向1】非线性相关转化为线性相关【例题】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+β u 的斜率和截距的最小二乘估计分别为β^=解题指导] 切入点:回归分析中对散点图的理解,回归方程的求法和应用;关键点:通过换元把非线性回归方程转化为线性回归方程求解.解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型. (2)令w =x ,先建立y 关于w 的线性回归方程.c ^=y -d^ w =563-68×6.8=100.6, 所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.【趁热打铁】1.两个变量成负相关关系时,散点图的特征是( ) A .点分布在从左下角到右上角的区域 B .散点图在某方形区域内 C .散点图在某圆形区域内D .点分布在从左上角到右下角的区域2.对于给定的两个变量的统计数据,下列说法正确的是( ) A .都可以分析出两个变量的关系B .都可以用一条直线通过近似表示两者关系来估计总体的均值C .都可以作出散点图D .都可以用确定的表达式表示两者的关系 3.下列命题:①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线把非确定性问题转化为确定性问题进行研究. 其中正确的命题为( )A .①③④B .②④⑤C .③④⑤D .②③⑤4.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 35.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.A .67B .68C .69D .706.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( ) A .r 2<r 1<0 B .0<r 2<r 1 C .r 2<0<r 1D .r 2=r 17.某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,得到售价x (元)和销售量y (件)之间的一组数据如下表:yˆ=-3.2x +a ,则a =______.8.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.9.假设关于某种设备的使用年限x (年)与所支出的维修费用y (万元)有如下统计资料:已知∑=512i ix=90,∑=51i ii y x =112.3.(1)求,y ;(2)如果x 与y 具有线性相关关系,求出线性回归方程; (3)估计使用年限为10年时,维修费用约是多少?10.某班主任为了对本班学生的月考成绩进行分析,决定从全班25名女同学,15名男同学中随机抽取一个容量为8的样本进行分析.(1)如果按性别比例分层抽样,应选男女生各多少人; (2)随机抽取8位同学的数学、物理分数对应如表:相关性,求出线性回归方程(系数精确到0.01);如果不具有线性相关性,请说明理由.第四章1解:正确的只有D 选项.故选D.2解:任两个变量均可作出散点图,从散点图上看有相关关系的才具有分析的价值,无相关关系的则作不出什么结论.故选C.4解:由相关系数定义及散点图所表达含义可知r 2<r 4<0<r 3<r 1,故选A.5解:=15×(10+20+30+40+50)=30,由于y ^=0.67x +54.9必过点(,y ),∴y =0.67×30+54.9=75,因此图表中的模糊数据为75×5-(62+75+81+89)=68.故选B.6解:对于变量Y 与X 而言,Y 随X 的增大而增大,故Y 与X 正相关;对于变量V 与U 而言,V 随U 的增大而减小,故V 与U 负相关,故r 2<0<r 1.故选C. 7解:价格的平均数=9+9.5+10+10.5+115=10,销售量的平均数y =11+10+8+6+55=8,由yˆ=-3.2x +a 知b =-3.2,所以a =y -b =8+3.2×10=40.故填40. 8解:根据题中所提供的信息,可知父亲与儿子的身高的对应数据可列表如下:=173,y =176,∴=∑∑==---3121)())((i ii i ix xy y x x=3×6(-3)2+32=1,=y -=176-173=3. ∴回归直线方程为yˆ=x +3,从而可预测他孙子的身高为182+3=185(cm).故填185.10解:(1)按性别比例分层抽样,应选男生15×840=3(人),选女生25×840=5(人).(2)以数学成绩x为横坐标,物理成绩y为纵坐标作散点图如图所示.从散点图可以看出这些点大致分布在一条直线附近,并且在逐步上升,故物理与数学成绩线性正相关.设y与x的线性回归方程是yˆ=bx+a,根据所给的数据,可以计算出≈0.65,≈34.5,所以y与x的回归方程是yˆ=0.65x+34.5.。