高中数学 第2章 统计 2_4 线性回归方程(2)教案 苏教版必修31
- 格式:doc
- 大小:573.50 KB
- 文档页数:9
2.4线性回归方程案例探究在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?分析:凭我们的学习经验可知,物理成绩确实与数学成绩有一定的关系,但除此以外,还存在其他影响物理成绩的因素.例如,是否喜欢物理,用在物理学习上的时间等等.在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示.例如,圆的面积S与半径r之间就是确定性函数关系,可以用函数S=πr2表示.一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.例如,人的体重与身高有关.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.自学导引1.在实际问题中,变量之间的常见关系有两类:一类是确定性关系,另一类是相关关系.2.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.3.请你说出确定性关系与相关关系的相同点和不同点.答案:相同点:均是指两个变量的关系.不同点:相关关系是一种非确定的关系.确定性关系是自变量与函数值之间的关系,可以用一个函数表示.这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.这种关系不能用一个确定的函数来表示.4.你是否还能举出一些现实生活中存在的相关关系的问题?答案:例如,商品销售收入与广告支出经费之间的关系;粮食产量与施肥量之间的关系;人体的脂肪含量与年龄之间的关系,等等.5.将n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.6.(1)当两个变量成正相关时,散点图有什么特点?(2)当两个变量成负相关时,散点图又有什么特点?答案:(1)散点图中的点散布在从左下角到右上角的区域.(2)散点图中的点散布在从左上角到右下角的区域.7.对于散点图可以作出如下判断:(1)当所有的样本点都落在某一函数曲线上,变量之间具有函数关系;(2)当所有的样本点都落在某一函数曲线附近,变量之间具有相关关系;(3)当所有的样本点都落在某一直线附近,变量之间具有线性相关关系.8.回归直线是怎样定义的?答案:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.疑难剖析【例1】下表是某地年降雨量与年平均气温的统计数据,判断两变量有相关关系吗?求回归直线方程有意义吗?1年平均气温(℃) 12.51 12.84 12.84 13.69 13.33 12.74 13.05 年降雨量(mm )748542507813574701432思路分析:用回归直线进行拟合两变量关系的一般步骤为: (1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,以公式求出 a, b ,并写出线性回归方程. 解:以 x 轴为年平均气温,y 轴为年降雨量可得相应的散点图:因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没有必要用回归直 线进行拟合,用公式求得的回归方程也是没有意义的.思维启示:要判断两个变量是否具有线性相关关系,可先作出散点图,再观察散点是否在 一条直线附近,如果是,则二者具有线性相关关系;否则,二者不具有线性相关关系.思维陷阱:解此题的第(2)小问时不要盲目地去求回归方程. 观察两相关变量得如下数据:x - - - - - 5 3 4 2 11 2 3 4 5 y - - - - - 1 5 3 7 99 7 5 3 1求两变量间的回归方程.错解:求线性回归直线方程的步骤: 第一步:列表 x i ,y i ,x i y i ;n 第二步:计算 x ,y ,i 1n 2 ,xii 1n 2 ,yii 1x i yi; 第三步:代入公式计算 b, a 的值; 第四步:写出回归直线方程. 列表:i123456789102x i -1 -2 -3 -4 -5 5 3 4 2 1 y i -9 -7 -5 -3 -1 1 5 3 7 9 x i y i 914 15 12 5 5 15 12 14 9计算得: x =0, y =010 i 110 x=110,2i i 110 y=310,2 ii 1x =110 i yi10x y10x yi i110100 ∴b=11i1011010x10(x )22i i 1a=y -b x =0-1*0=0故所求回归直线方程为 y ˆ =x.正解:作两个变量的散点图(图略),从散点图中看出,点不在某条直线附近,分散得很 开.因此,变量 x 和 y 不具有线性相关关系,也就不存在线性回归方程.【例 2】 某班学生每周用于数学学习的时间 x (单位:h )与数学成绩 y (单位:分)之间 有如下数据:x 24 15 23 19 16 11 20 16 17 13 y92 79 97 89 64 47 83 68 71 59某同学每周用于数学学习的时间为 18小时,试预测该生数学成绩.思路分析:首先应该利用表中数据通过计算去判断数学学习的时间 x 与数学成绩 y 是否具 有线性相关关系.若有,则可求出回归方程;然后在方程中令 x=18,可求出该生数学成绩.解:因为学习时间与学习成绩之间具有线性相关关系.利用科学计算器计算到如下表所示 的数据:i12345678910x i 24 15 23 19 16 11 20 16 17 13 y i 92 79 97 89 64 47 83 68 71 59 x i y i 2 208 1 185 2 231 1 691 1 204 517 1 660 1 088 1 207 767x =17.4, y =74.910 10x=3 182,2ii 1i 110y=58 375,x=13 578i y2 2i ii 1310x y10x yi ii545.4于是可得b= 3.53110154.4x10(x)22ii 1a=y-b x=74.9-3.53×17.4≈13.5故所求回归直线方程为y=3.53x+13.5当x=18时,yˆ=3.53×18+13.5=77.04≈77故该同学预计可得77分左右.思维启示:两个有线性相关关系的变量间的关系可以用线性回归方程来表示,而对总体的预测可依据回归直线方程进行.【例3】一般说,一个人的身高越高,他的手就越大.为了调查这一问题,对10名高三男生的身高与右手一揸长测量得如下数据:(单位:cm)身高168 170 171 172 174 176 178 178 180 181一揸长19.0 20.0 21.0 21.5 21.0 22.0 24.0 23.0 22.5 23.0(1)依据上述数据制作散点图,发现两者有何相关关系吗?(2)如果近似成线性关系,求线性回归方程.(3)如果一个学生身高185 cm,估计他的右手一揸长.思路分析:首先作出散点图;利用散点图去判断两变量是否具有线性关系;若具有线性关系,再利用公式求出方程;最后利用方程去解答第三小问.解:(1)散点图如下:可见,身高与右手一揸长之间的总体趋势成一条直线,即他们线性相关.(2)设线性回归方程为yˆ=bx+a由上述数据计算可得x=174.8, y=21.710i 110x=305 730,2ii 1x i y=37 986i4∴b=10x y 10x yi i37 986 10174.821.7i 1 20.303=730 10 174.810305x 10(x)22ii 1a=y-b x=-31.264∴方程为yˆ=0.303x-31.264.(3)当x=185时, yˆ=24.79.思维启示:先作出散点图,若两变量具有线性关系,再利用公式求出方程.拓展迁移【拓展点1】如果你想作一个反对抽烟的电视公益广告的播放次数与看电视的中学生戒烟率的数据散点图,作为x轴的变量为__________.答案:播放次数【拓展点2】有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第一列表示此种食品所含热量的百分比,第二列数据表示由一些美食家以百分制给出的对此种食品口味的评价.品牌所含热量的百分比口味记录A 25 89B 34 89C 20 80D 19 78E 26 75F 20 71G 19 65H 24 62I 19 60J 13 52(1)求出回归直线方程;(2)关于两个变量之间的关系,得出的结论是什么?答案:(1)yˆ=1.565x+37.827(2)由回归方程知道,食品所含热量越大,口味记录越好,反之亦然.【拓展点3】某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:尿汞含量x 2 4 6 8 10消光系数y 64 138 205 285 3605(1)作出散点图;(2)如果y与x之间具有线性相关关系,求回归方程;(3)估计尿汞含量为9毫克/升时消光系数.答案:(1)散点图略.(2)由散点图可知y与x线性相关.设回归方程为yˆ=bx+A.计算可得回归方程为yˆ=36.95x-11.3.(3)当x=9时,yˆ=36.95×9-11.3=321.25≈3216。
2019-2020年高中数学 2.4线性回归方程第2课时教案 苏教版必修3【学习导航】学习要求1.进一步了解非确定性关系中两个变量的统计方法;2.进一步掌握回归直线方程的求解方法. 【课堂互动】自学评价1.相关关系: 当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系 .2.回归分析: 对具有相关关系的两个变量进行统计分析的方法 .3. 求线性回归方程的步骤:(1)x y (2)x y x y (3)i i i i 计算平均数、,计算与的积,求,计算,,∑∑∑x y i i 22(4)将上述有关结果代入公式,求,写出回归直线方程.【精典范例】例1一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由如下一组数据:【解】1)画出散点图:x2)设回归直线方程,利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 121221211212,计算a ,b ,得b ≈1.215, a=≈0.974, ∴回归直线方程为:例2((1)画出上表的散点图;(2)求出回归直线度且画出图形.【解】(1)图略(2)1(45424648423558403950)44.5010x =+++++++++= 1(6.53 6.309.527.50 6.99 5.909.49 6.20 6.558.72)10y =+++++++++= 设回归直线方程为,则10110221100.17510i ii i i x y x y b xx ==-==-∑∑,=所以所求回归直线的方程为追踪训练(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程,并在散点图中加上回归直线.【解】(1)散点图(略)网](2)55115,545,109,116,23.2,i i i i n x x y y =======∑∑ 5521160952,12952i i i i i xx y ====∑∑ 25129525451160.1962,23.20.1962109 1.8166560952545b a ⨯-⨯=≈=-⨯≈⨯- 所以,线性回归方程为.2、一个工厂在某年里每月产品的总成本y(单位:万元)与月产量x( 单位:万件)之间有如下一组数据:(2)求出月总成本与月产量x 之间的线性回归方程。
2.4线性回归方程庖丁巧解牛知识·巧学一、有关关系变量之间的常有关系:一类是确立性函数关系,变量之间的关系能够用函数表示. 如正方形的边长l 与面积S 之间就是确立性函数关系,能够用函数S=l 2表示;一类是有关关系,变量之间有必定的联系,但不可以完整用函数来表达. 如人的体重y 与身高 x 有关 . 一般来说,身高越高,体重越重,但不可以用一个函数来严格地表示身高与体重之间的关系 .在现实生活中存在着大批的有关关系,怎样判断和描绘有关关系,统计学发挥着特别重要的作用 . 变量之间的有关关系带有不确立性,这需要经过采集大批的数据,对数据进行统计剖析,发现规律,才能作出科学的判断.辨析比较函数关系与有关关系的差别与联系同样点:二者均是指两个变量间的关系;不一样点:①函数关系是一种确立性关系,自变量的任一取值,因变量都有独一确立的值与之对应;有关关系是非确立性关系,因变量的取值拥有必定的随机性;②函数关系是因果关系,而有关关系不必定是因果关系,也可能是陪伴关系;③有关关系的剖析方向及方法,因为有关关系的不确立性,在找寻变量间有关性的过程中,统计发挥侧重要的作用,而函数关系则能够经过函数的性质来进行研究.二、线性回归剖析对拥有有关关系的两个变量进行统计剖析的方法叫回归剖析.平常地讲,回归剖析就是找寻有关关系中非确立性关系的某种确立性.1. 散点图我们把表示拥有有关关系的两个变量x、 y 的一组数据(x n,y n)( n=1,2, 3,)对应的一些点(即样本点)画在座标系内,获得的图形叫做散点图.如:某地农业技术指导站的技术员,经过在 7 块并排大小同样的试验田长进行施化肥量对水稻产量影响的试验,获得以下表所示的一组数据:(单位:千克)施化肥量x15202530354045水稻产量y330345365405445450455察看表中数据,大概上跟着施化肥量的增添,水稻的产量也在增添. 不过表中二者之间的关系表现得不是很切实,需要对数据进行剖析. 为此我们能够作统计图表,以便对二者有一个直观的印象和判断. 除上述的统计图表外,我们还能够用另一种统计图——散点图来剖析.以 x 轴表示施肥量,y 轴表示水稻产量,可得散点图如图2-4-1 :图 2-4-1从散点图能够看出两变量确实存在必定关系,大概上跟着施化肥量的增添,水稻的产量也在增添 . 可见散点图能直观形象地反应各对数据的亲密程度.注意:假如对于两个变量统计数据的散点图体现如图2-4-2 的形状,则这两个变量之间不拥有有关关系. 如学生的身高与学生的数学成绩就没有有关关系.图 2-4-2可见利用散点图能够判断变量之间有无有关关系. 所以在研究两个变量之间能否存在某种关系时,一定从散点图下手 .学法一得画出散点图,能够作出以下判断:①假如全部的样本点都落在某一函数曲线上,就用该函数来描绘变量之间的关系,即说明变量之间拥有函数关系 .②假如全部的样本点都落在某一函数曲线邻近,则说明变量之间拥有有关关系.③假如全部的样本点都落在某向来线邻近,则变量之间拥有线性有关关系.2. 最小二乘法一般地 , 设有 n 个察看数据以下:x x1x2x3x ny y1y2y3y n设有向来线方程?,y =bx+aQ(a,b)是直线 ?=bx+a与各散点在垂直方向( 纵轴方向 ) 上的距离的平方和, 想法取 a,b的值 , y使 Q(a,b)达到最小值 . 这类方法叫做最小平方法( 又称最小二乘法 ). 此中点 Q=(y1-bx 1-a) 2+(y 22-a)2n n-a)2获得最小值时,就称 ?=bx+a为这n对数据的线性回归方程,该方-bx++(y-bx y程所表示的直线称为回归直线 .上述式子睁开后,是一个对于 a 或 b 的二次函数,应用配方法,可求出使 Q为最小值时n n nn x i y i(x i )(y i )b i 1i 1i1,n n的 a、 b 的值,即n x i2(x i ) 2( * )i 1i1a y bx.此中 x =1n xi, y 1 n y i. n i 1n i1求线性回归方程的步骤:计算均匀数x , y ;计算x i与y i的积,求∑x i y i;计算∑x i2;将结果代入公式求a;用 b= y -a x求 b;写出回归方程.深入升华求有关变量的回归直线的意义:回归直线方程在现实生活与生产中有宽泛的应用 . 应用回归直线方程能够把非确立性问题转变成确立性问题, 把“无序”变成“有序”,并对状况进行估测、增补. 所以,学过回归直线方程此后,应能踊跃应用回归直线方程解决一些有关的实质问题,去进一步领会回归直线的应用价值 .三、有关系数与有关性查验进行回归剖析,往常先进行有关性查验. 若能确立两个变量拥有线性有关性,则再去求其线性回归方程,不然所求方程毫无心义.给定( x i ,y i )( i=1 , 2,3, , n ),只需 x , x ,x , , x 不全相等,就能求出一1 2 3n条回归直线,可它有无心义就是一个大问题. 因为依据散点图看数据点能否大概在向来线附近主观性太强,为此能够利用样真有关系数目化的查验法.样真有关系数:n( x ix)( y iy)r=i 1叫做变量 y 与 x 之间的样真有关系数(简称有关系数),用nnx)2y) 2( x i( y ii 1i 1它来权衡它们之间的线性有关程度 .|r| ≤1,且|r| 越靠近于 1,有关程度越大; |r|越靠近于 0,有关程度越小 .统计学以为,有关变量的有关系数r ∈[ -1 , -0.75 ]时,两变量负有关很强;r ∈[ 0.75 , 1]时,两变量正有关很强;r ∈( -0.75 , -0.3 ]或[ 0.3 , 0.75 )时,两变量有关性一般; r ∈[ -0.25 , 0.25 ]时,两变量有关很弱 .学法一得 在实质操作中经常利用计算器计算出有关系数和线性回归方程.典题·热题知识点一 线性有关关系例 1 以下两个变量之间的关系哪个不是函数关系()A. 角度和它的余弦值B.正方形边长和面积 C.正 n 边形的边数和它的内角和D.人的年纪和身高思路剖析: 函数关系是一种确立的关系,而有关关系是一种非确立性关系,即有关关系是非随机变量与随机变量之间的关系 .答案: D方法概括 判断有关关系与函数关系要看两个有关变量能否有确立的关系式.知识点二 求出回归直线例 2 一个车间为了规定工时定额,需要确立加工部件所花销的时间. 为此进行了 10 次试验,测得数据以下:部件个数 x (个) 10 20 30 40 50 60 70 80 90 100加工时间 y (分)626875818995102108115122请判断 y 与 x 能否拥有线性有关关系,假如 y 与 x 拥有线性有关关系,求线性回归方程.思路剖析: 依据求线性回归的方法与步骤 .解:在直角坐标系中画出数据的散点图, 直观判断散点在一条直线邻近,故拥有线性有关关系. 由测得的数据表可知:x =55, y =91.7 ,10210210x i =38 500 ,y i =87 777 ,x i y i =55 950 ,i 1i 1i 110x i y i10x y55950 105591.7∴b=i1≈0.668.10238500105522x i10 xi1a= y -b x =91.7- 0.668 ×55≈54.96 ,所以,所求线性回归方程为y?=bx+a=0.668x+54.96.巧解提示先依据散点图判断两个变量能否拥有有关关系,而后计算出各项的值代入公式.例 3 某医院用光电比色计查验尿汞时,得尿汞含量(mg/L)与消光系数以下表:尿汞含量 x246810消光系数 y64138205285360(1)用统计方法判断尿汞含量x 与消光系数 y 能否有关 .(2)求出回归直线方程 .(3)能展望尿汞含量为 5 mg/L 时的消光系数吗?思路剖析:据题意需作回归剖析,先画出其散点图,看其能否呈直线形. 再借助现代技术手段,求出回归直线方程. 依据题意,对实质问题进行展望.解:( 1)画出其散点图(如图2-4-3 ),察看散点图,能够发现 5 个样本点都落在一条直线邻近,所以变量x、 y 属于线性有关 .图 2-4-3(2)因为尿汞含量x 与消光系数y 线性有关,所以能够利用公式求出回归方程的系数. 再利用计算器可求得回归方程y? =36.95x-11.3.(3)当x=5 时,y? =36.95×5- 11.3≈173.可知尿汞含量为 5 mg/L时的消光系数约为173.方法概括求线性回归方程的步骤:(1)计算均匀数 x 、 y ;(2)计算 x i与 y i的积,求∑x i y i;(3)22i i 计算∑x ,∑y ;(4)将上述有关结果代入公式,求b、 a,写出回归直线方程 .问题·研究思想方法研究问题用最小二乘法预计获得的直线与用两点式求出的直线方程一致吗?研究过程:事实上设两点(x1,y1),( x2,y2),设所求回归直线方程是y=bx+a.22nn(x ix)( y iy) x i y inx ybi 1i 1 ,nn2(x x)2x i 2nx ,i 1i 1a ybx( x 1 x 1x 2)( y 1 y 1y 2) (x 2x 1x 2)( y 2y 1y2)得 b=2222(x 1x 1x2)2(x 2x 1x2 )222 x 12 x 2 ? y 1 y 2x 2 x 1 ? y 2 2 y 1y 2 y 122( x 1x 2 )2 ( x 2 x 1 ) 2x 2 x 144a=y12 y 2 x 1 x2?y2y 1 y 1 x 2 x 1 y 22x 2x 1 x 2 x 1即回归直线方程为y= y 2y 1 y 1x 2 x 1 y 2 . 而由( x 1, y 1),( x 2, y 2)两点确立的直线x 2x 1 x 2 x 1方程为y y 1x x 1y 2 y 1y 1x 2 x 1 y 2.y 2y 1 x 2x 1 , 变形为 y=x 1 xx 1x 2x 2研究结论: 用最小二乘法预计获得的直线与用两点式求出的直线方程是一致的 .。
2.4线性回归方程(1)教学目标(1)通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;(2)在两个变量具有线性相关关系时,会在散点较长中作出线性直线,会用线性回归方程进行预测;(3)知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解(线性)相关系数的定义.教学重点散点图的画法,回归直线方程的求解方法.教学难点回归直线方程的求解方法.教学过程一、问题情境1.情境:客观事物是相互联系的过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度所以说,函数关系存在着一种确定性关系但还存在着另一种非确定性关系——相关关系2.问题:某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的气温/0C 26 18 13 10 4 1-杯数20 24 34 38 50 64-C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?如果某天的气温是5二、学生活动为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.选择怎样的直线近似地表示热茶销量与气温之间的关系?我们有多种思考方案:(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线;(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;………………怎样的直线最好呢?三、建构数学1.最小平方法:=+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近。
线性回归方程第2课时【学习导航】学习要求1.进一步了解非确定性关系中两个变量的统计方法;2.进一步掌握回归直线方程的求解方法.【课堂互动】自学评价1.相关关系: 当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系 .2.回归分析: 对具有相关关系的两个变量进行统计分析的方法 .3. 求线性回归方程的步骤:(1)x y (2)x y x y (3)i i i i 计算平均数、,计算与的积,求,计算,,∑∑∑x y i i 22(4)将上述有关结果代入公式,求,b a ,写出回归直线方程.【精典范例】例1一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由如下一组数据:(1)画出散点图;(2)求月总成本y 与月产量x 之间的回归直线方程.1)画出散点图:x2)设回归直线方程a bx y+=ˆ, 利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 121221211212,计算a ,b ,得b ≈1.215, a=x b y -≈0.974,∴回归直线方程为:974.0215.1ˆ+=x y例2 已知10只狗的血球体积及红血球数的测量值如下:x ((1)画出上表的散点图;(2)求出回归直线度且画出图形. 【解】(1)图略 (2)1(45424648423558403950)44.5010x =+++++++++= 1(6.53 6.309.527.50 6.99 5.909.49 6.20 6.558.72)10y =+++++++++=7.37 设回归直线方程为 y bx a =+,则10110221100.17510i ii ii x y x yb xx==-==-∑∑,a y bx =-=0.418-所以所求回归直线的方程为 0.1750.148y x =-追踪训练(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程,并在散点图中加上回归直线. 【解】(1)散点图(略)网](2)55115,545,109,116,23.2,ii i i n xx y y =======∑∑5521160952,12952ii i i i xx y ====∑∑25129525451160.1962,23.20.1962109 1.8166560952545b a ⨯-⨯=≈=-⨯≈⨯-所以,线性回归方程为0.1962 1.8166y x =+.2、一个工厂在某年里每月产品的总成本y(单位:万元)与月产量x( 单位:万件)之间有如下一(2) 求出月总成本yˆ与月产量x 之间的线性回归方程。
2.4 线性回归方程1.理解线性回归的基本思想和方法,体会变量之间的相关关系.(难点)2.会画出数据的散点图,并会通过散点图判断这组数据是否具有线性关系.(重点) 3.会求数据的线性回归方程,并根据线性回归方程做出合理的判断.(重点、难点)[基础·初探]教材整理1 变量间的关系阅读教材P 74的内容,并完成下面的问题.1.变量间的关系关系.确定性函数表示,是一种函数函数关系:变量之间的关系可以用(1)来表达.函数,但不能完全用一定的联系相关关系:变量之间有(2)2.散点图横坐的取值作为x 是否有相关关系,常将y 与x 统计数表中,为了更清楚地看出从一个,这样的图形…),1,2,3=i )(i y ,i x (,在直角坐标系中描点纵坐标的相应取值作为y ,将标叫做散点图.判断正误:(1)相关关系是一种不确定关系,而函数关系是一种确定关系.( )(2)商品的销售收入与广告支出经费是函数关系.( )(3)散点图越集中,则相关关系越强.( )【解析】 (1)√.由函数关系及相关关系的定义知正确.(2)×.是相关关系,而不是确定关系,故错误.(3)×.只有当散点图呈规律性分布时才具有相关关系.故错误.【答案】 (1)√ (2)× (3)×教材整理2 线性回归方程阅读教材P 75~P 76“例1”上边的内容,并完成下列问题.1.线性相关关系拟合a +bx =y ^,我们用直线一条直线的附近如果散点图中点的分布从整体上看大致在叫做线性相关关系.相关关系近似表示的a +bx =y ^散点图中的这些点,像这样能用直线 2.线性回归方程设有n 对观察数据如下:=y ^时,就称最小值取得2)a -n bx -n y (+…+2)a -2bx -2y (+2)a -1bx -1y(=Q 使b ,a 当bx +a 为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.3.用回归直线进行数据拟合的一般步骤附近;一条直线是否在散点作出散点图,判断(1)(2)如果散点在一条直线附近,用公式⎩⎪⎨⎪⎧b =∑i =1nxiyi -∑i =1nx∑i =1nyn ∑i =1n x2i -∑i =1n xa =y --b x-或求出a ,b ,并写出线性回归方程.填空:(1)有一个线性回归方程为y ^=2-1.5x ,则变量x 增加一个单位时,y 平均________1.5个单位.(填“增加”或“减少”)【解析】 ∵b =-1.5,∴x 每增加一个单位时y 减少1.5个单位.【答案】 减少(2)过(3,10),(7,20),(11,24)三点的回归直线方程是________.【解析】 代入系数公式得b =1.75,a =5.75.代入直线方程.求得y ^=5.75+1.75x .。
2.4 线性回归方程学 习 目 标核 心 素 养1.了解两个变量之间的相关关系并与函数关系比较. 2.会作散点图,并利用散点图判断两个变量之间是否具有线性相关关系.3.能根据给出的线性回归方程系数公式建立线性回归方程,并能由回归方程对总体进行预测、估计.(重点、难点)通过对已有数量的分析、运算培养学生数据分析、数学运算的核心素养.1.变量之间的两类常见关系在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示.另一类是相关关系,变量之间有一定的联系,但不能完全用函数表示.2.相关关系的分类相关关系分线性相关和非线性相关两种. 3.线性回归方程系数公式能用直线方程y ^=bx +a 近似表示的相关关系叫做线性相关关系,该方程叫线性回归方程.给出一组数据(x 1,y 1),(x 2,y 2),…, (x n ,y n ),线性回归方程中的系数a ,b 满足⎩⎪⎨⎪⎧b =n ∑i =1n x i y i -⎝ ⎛⎭⎪⎪⎫∑i =1n x i ⎝ ⎛⎭⎪⎪⎫∑i =1n y i n ∑i =1nx 2i -⎝ ⎛⎭⎪⎪⎫∑i =1n x i2,a =y -b x .上式还可以表示为⎩⎪⎨⎪⎧b =∑i =1nx i y i-n x -y -∑i =1n x 2i -n x 2=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2,a =y -b x .1.有下列关系:①人的年龄与其拥有的财富之间的关系; ②曲线上点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系; ⑤学生与其学号之间的关系. 其中具有相关关系的是________. ①③④ [②⑤为确定关系不是相关关系.]2.下面四个散点图中点的分布状态,直观上判断两个变量之间具有线性相关关系的是________.③ [散点图①中的点无规律的分布,范围很广,表明两个变量之间的相关程度很小;②中所有的点都在同一条直线上,是函数关系;③中点的分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;④中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系,故填③.]3.工人工资y (元)依劳动生产率x (千元)变化的线性回归方程为y ^=50+80x ,下列判断正确的是________.①劳动生产率为1 000元时,工资为130元; ②劳动生产率提高1 000元时,工资提高80元; ③劳动生产率提高1 000元时,工资提高130元; ④当月工资为250元时,劳动生产率为2 000元.② [回归直线斜率为80,所以x 每增加1,y ^增加80,即劳动生产率提高1 000元时,工资提高80元.]4.下表是广告费用与销售额之间的一组数据:广告费用(千元) 1 4 6 10 14 销售额(千元)1944405253销售额y (千元)与广告费用x (千元)之间有线性相关关系,回归方程为y ^=2.3x +a (a 为常数),现要使销售额达到6万元,估计广告费用约为________千元.15 [x =7,y =41.6,则a =y -2.3x =41.6-2.3×7=25.5. 当y =6万元=60千元时,60=2.3x +25.5,解得x =15(千元).]变量间相关关系的判断【例1】 在下列两个变量的关系中,具有相关关系的是________. ①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故发生率之间的关系.②④[两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系.]1.函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.准确理解变量间的相关关系是解答本题的关键.要准确区分两个变量间的相关关系和函数关系,事实上,现实生活中相关关系是处处存在的,从某种意义上讲,函数关系可以看作一种理想的关系模型,而相关关系是一种普遍的关系.两者区别的关键点是“确定性”还是“不确定性”.1.下列两个变量中具有相关关系的是________(填写相应的序号).①正方体的棱长和体积;②单产为常数时,土地面积和总产量;③日照时间与水稻的亩产量.③[正方体的棱长x和体积V存在着函数关系V=x3;单产为常数a公斤/亩,土地面积x(亩)和总产量y(公斤)之间也存在着函数关系y=ax.日照时间长,则水稻的亩产量高,这只是相关关系,应选③.]2.下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.其中正确的命题为________.③④⑤[两个变量不一定是相关关系,也可能是确定性关系,故①错误;圆的周长与该圆的半径具有函数关系,故②错误;③④⑤都正确.]散点图的画法及应用学生A B C D E学科数学8075706560物理7066686462利用散点图判断它们是否具有线性相关关系?如果有线性相关关系,是正相关还是负相关?思路点拨:本题涉及两个变量(数学成绩与物理成绩),以x轴表示数学成绩、y轴表示物理成绩,可得相应的散点图,再观察散点图得出结论.[解] 把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在平面直角坐标系中描点(x i,y i)(i=1,2,…,5).从图中可以直观地看出数学成绩和物理成绩具有线性相关关系,且当数学成绩减小时,物理成绩也由大变小,即它们正相关.1.判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.如果变量的对应点分布没有规律,我们就可以认为这两个变量不具有相关关系.2.正相关、负相关线性相关关系又分为正相关和负相关.正相关是指两个变量具有相同的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变大.从散点图上看,因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域.负相关是指两个变量具有相反的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变小.从散点图上看,因变量随自变量的增大而减小,图中的点分布在左上角到右下角的区域.提醒:画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.3.如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?思路点拨:观察图中点的分布情况作出判断.从散点图上看,点的分布散乱无规律,故不具有相关关系.[解] 不具有相关关系,因为散点散乱地分布在坐标平面内,不呈线形.4.有个男孩的年龄与身高的统计数据如下:思路点拨:描点(1,78),(2,87),(3,98),(4,108),(5,115),(6,120).观察点的分布,作出判断.[解] 作出散点图如图:由图可见,具有线性相关关系,且是正相关.线性回归方程的求法及应用【例3】 某产品的广告支出x (单位:万元)与销售收入y (单位:万元)之间有下表所对应的数据.广告支出x /万元 1 2 3 4 销售收入y /万元12284256(1)画出表中数据的散点图;(2)求出y 对x 的回归直线方程y ^=bx +a ,并解释b 的意义; (3)若广告费为9万元,则销售收入约为多少万元? 思路点拨:画散点图→列表处理数据→计算x ,y ,n ∑i =14x 2i ,∑i =14x i y i →计算b →计算a →线性回归方程→销售收入[解] (1)散点图如图.(2)观察散点图可知各点大致分布在一条直线附近,列出下列表格,以便计算回归系数a ,B .序号 xyx 2y 2xy1 1 12 1 144 12 2 2 28 4 784 563 3 42 9 1 764 126 4 4 56 16 3 136 224 ∑10138305 828418于是x =52,y =692,∑i =14x 2i =30,∑i =14y 2i =5 828,∑i =14x i y i =418,代入公式得,b =∑i =14x i y i -4xy∑i =14x 2i -4x 2=418-4×52×69230-4×⎝ ⎛⎭⎪⎫522=735,a =y -b x =692-735×52=-2.故y 对x 的回归直线方程为y ^=735x -2,其中回归系数b =735,它的意义是:广告支出每增加1万元,销售收入y 平均增加735万元.(3)当x =9万元时,y ^=735×9-2=129.4(万元),即若广告费为9万元,则销售收入约为129.4万元. 1.求样本数据的线性回归方程,可按下列步骤进行: 第一步,计算平均数x ,y ;第二步,求和∑i =1nx i y i ,∑i =1nx 2i ;第三步,计算b =∑i =1n (x i -x )(y i -y)∑i =1n(x i -x)2=∑i =1nx i y i -n xy∑i =1nx 2i -n x 2,a =y -b x ;第四步,写出线性回归方程y ^=bx +A .2.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.提醒:(1)对一组数据进行线性回归分析时,应先画出其散点图,判断变量之间是否线性相关,再由系数a ,b 的计算公式,计算出a ,b ,由于计算量较大,在计算时应借助计算器,仔细计算,以防出现错误.(2)为了方便,常制表对应算出x i y i ,x 2i ,以便于求和.(3)研究变量间的相关关系,求得回归直线方程能帮助我们发现事物发展的一些规律,估计、预测某些数据,为我们的判断和决策提供依据.5.如图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1-7分别对应年份2012-2018.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2018年我国生活垃圾无害化处理量.参考数据:∑ 7i =1y i =9.32,∑7i =1t i y i =40.17,∑ 7i =1(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 (t i -t )(y i -y )∑ ni =1(t i -t )2∑ ni =1(y i -y )2,回归方程y ^=a +bt 中斜率和截距的最小二乘估计公式分别为b =∑ ni =1 (t i -t )(y i -y )∑ ni =1(t i -t )2,a =y --b t . 思路点拨:(1)利用相关系数的大小――→确定y 与t 的线性相关程度 (2)求出回归方程→利用方程进行估计[解] (1)由折线图中的数据和附注中的参考数据得 t =4,∑ 7i =1(t i -t )2=28,∑ 7i =1(y i -y )2=0.55,∑ 7i =1(t i -t )(y i -y )=∑ 7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89,∴r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当大,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b =∑ 7i =1(t i -t )(y i -y )∑ 7i =1 (t i -t )2=2.8928≈0.103. a =y -b t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2020年我国生活垃圾无害化处理量约为1.82亿吨.1.本节课的重点是会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系,能根据给出的线性回归方程系数公式建立线性回归方程.难点是了解相关关系、线性相关、回归直线的概念.2.本节课要掌握以下几类问题 (1)准确区分相关关系与函数关系.(2)会利用散点图判断两个变量间的相关关系. (3)掌握用线性回归方程估计总体的一般步骤.1.在如图所示的四个散点图中,两个变量具有相关性的是( ) A .①②B .①④C .②③D .②④D [由图可知①中变量间是一次函数关系,不是相关关系;②中的所有点在一条直线附近波动,是线性相关的;③中的点杂乱无章,没有什么关系;④中的所有点在某条曲线附近波动,是非线性相关的.故两个变量具有相关性的是②④.]2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号有( ) A .①③ B .①④ C .②③D .②④B [由正、负相关性的定义知①④一定不正确.]3.某工厂生产某种产品的产量x (吨)与相应的生产能耗y (吨标准煤)有如下几组样本数据:的斜率为0.7,则这组样本数据的线性回归方程是________.y ^=0.7x +0.35 [∵x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∴a =y -b x =3.5-0.7×4.5=0.35. ∴线性回归方程为y ^=0.7x +0.35.]4.2019年元旦前夕,某市统计局统计了该市2018年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出.(参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)思路点拨:按照求线性回归方程的一般步骤,求出线性回归方程,再根据回归方程作出预测.[解] (1)依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98,又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b =∑i =110x i y i -10xy∑i =110x 2i -10x 2≈0.17,a =y -b x =0.81,∴y ^=0.17x +0.81.∴所求的线性回归方程为y ^=0.17x +0.81. (2)当x =9时,y ^=0.17×9+0.81=2.34(万元),可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.。
2.4 线性回归方程互动课堂疏导引导在实际问题中,变量之间常见关系有两类:一类是确定性函数关系;另一类是变量间有一定联系,但不能完全用函数来表达,它们关系带有随机性,我们说这两个变量具有相关关系.疑难疏引〔1〕对相关关系理解应当注意以下几点:其一是相关关系与函数关系不同,因为函数关系是一种非常确定关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间关系.而函数关系可以看成是两个非随机变量之间关系.因此,不能把相关关系等同于函数关系.其二是函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋大小与阅读能力有很强相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们阅读能力会提高,而且由于长大,脚也变大.其三是在现实生活中存在着大量相关关系,如何判断与描述相关关系,统计学发挥着非常重要作用.变量之间相关关系带有不确定性,这需要通过收集大量数据,对数据进展统计分析,发现规律,才能作出科学判断.〔2〕在考虑相关关系中两个量关系时,为了对变量之间关系有一个大致了解,我们通常将变量所对应点描出来,这些点就组成了具有相关关系变量之间一组数据图形,通常称这种图为变量之间散点图.根据散点图中变量对应点离散程度,我们也可以准确地判断两个变量是否具有相关关系.散点图中变量对应点如果分布在某条直线周围,我们就可以得出结论,这两个变量具有相关关系.如果变量对应点分布没有规律,我们就可以得出结论:这两个变量不具有相关关系.案例1 以下关系中,带有随机性相关关系是____________.①正方形边长与面积之间关系②水稻产量与施肥量之间关系③人身高与年龄之间关系④降雪量与交通事故发生率之间关系【探究】两变量之间关系有两种:函数关系与带有随机性相关关系.①正方形边长与面积之间关系是函数关系.②水稻产量与施肥量之间不是严格函数关系,但是具有相关性,因而是相关关系.③人身高与年龄之间关系既不是函数关系,也不是相关关系,因为人年龄到达一定时期身高就不发生明显变化了,因而他们不具相关关系.④降雪量与交通事故发生率之间具有相关关系.答案:②④规律总结准确理解变量间相关关系是解答此题关键.要准确区分两变量间相关关系与函数关系,事实上,现实生活中相关关系是到处存在,从某种意义上讲,函数关系可以看作一种理想关系模型,而相关关系是一种普遍关系.两者区别关键点是“确定性〞还是“随机性〞.案例2 5个学生数学与物理成绩如下表:画出散点图,并判断它们是否有相关关系.【探究】涉及两个变量:数学成绩与物理成绩,可以以数学成绩为自变量,考察因变量物理成绩变化趋势.以x轴表示数学成绩,y轴表示物理成绩,可得相应散点图.由散点图〔上图〕可见,两者之间具有相关关系.规律总结判断变量之间有无相关关系,一种常用简便可行方法是绘散点图,散点图是由数据点分布构成,是分析研究两个变量相关关系重要手段.从散点图中,如果发现点分布从整体上看大致在一条直线附近,那么这两个变量是线性相关.2.最小二乘法〔最小平方法〕、线性回归方程〔1〕线性相关关系如果散点图中,相应于具有相关关系两个变量所有观察值数据点分布在一条直线附近,我们称这两个变量之间具有线性相关关系.也就是说能用直线方程yˆ=bx+a近似表示相关关系叫线性相关关系.〔2〕最小二乘法〔最小平方法〕如果n个点:(x1,y1),(x2,y2),…,(x n,y n),可以用下面表达式来刻画这些点与直线y=a+bx接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[y n -(a+bx n )]2.使得上式到达最小值直线yˆ=bx+a 就是我们所要求直线,这种方法称为最小二乘法. 〔3〕线性回归方程记线性回归方程为yˆ=bx+a,那么系数a 、b 满足: b=⎪⎪⎪⎩⎪⎪⎪⎨⎧==--=∑∑∑∑∑=====.,)()()(1212111x b y a x x n y x y x n b n i n i i i n i ni i n i i i i (※)疑难疏引 〔1〕我们知道,回归直线是与数据点最接近直线,反映贴近程度数据是:离差平方与,即总离差Q=∑=ni 1(y i -a-bx i )2.这样,回归直线就是所有直线中Q 取最小值那一条.这样使“离差平方与为最小〞方法,叫做最小二乘法.〔最小平方法〕〔2〕利用最小二乘法求回归系数a 、b 时,是将离差平方与Q 转化为关于a 或b 二次函数,利用二次函数知识求得.〔3〕借助散点图,可以直观地看出两个变量之间是否具有相关关系.用最小二乘法思想建立回归直线方程,能定量地描述两个变量关系.回归系数a 与b,刻画了两个变量之间变化趋势.利用回归直线,可以对问题进展预测,由一个变量变化去推测另一个变量变化. 〔4〕求线性回归方程一般步骤:①根据两组数据计算x ,y ,∑=n i 1x i ,∑=n i 1y i ,∑=n i 12ix ,∑=ni 1∑=ni 1x i y i ;②代入〔*〕计算求a 、b 值;③代入yˆ=a+bx. 一般情况下,求线性回归方程可借助计算器与计算机来完成. 另外,回归系数可简化为:b=,a=y -b x ,这里x=n1∑=ni 1x i ,y=n1∑=ni 1y i案例3 某产品广告支出x 与销售收入y 〔单位:万元〕之间有下表所对应数据.〔1〕画出表中数据散点图; 〔2〕求出y 对x 回归直线方程;〔3〕假设广告费为9万元,那么销售收入约为多少万元?【探究】只有散点图大致表现为线性时,求回归直线方程才有实际意义.【解析】(1)散点图如下:〔2〕观察散点图可知各点大致分布在一条直线附近,列出以下表格,以备计算a 、b.于是x =125,y =269,∑=41i 2i x =30,∑=41i 2i y =5 828,∑=41i xy i =418,代入公式得:b==, a=y -b x =×25=-2.故y 对x 回归直线方程为yˆ=573x-2,其中回归系数b=573,它意义是:广告支出每增加1万元,销售收入y 平均增加573万元.(3)当x=9万元时,yˆ=573×9-2=129.4万元. 即广告费为9万元,那么销售收入为129.4万元.规律总结 〔1〕对一组数据进展线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a 、b 计算公式,算出a 、b,由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误. 〔2〕在利用公式:b=,a=y -b x 来计算回归系数时,为了方便常制表对应出x i y i , 2i x ,以利于求与.〔3〕研究变量间相关关系,求得回归直线方程能帮助发现事物开展一些规律,补充积累资料缺乏,估计预测某些数据,为我们判断与决策提供依据. 活学巧用1.以下两变量中具有相关关系是〔〕解析:选C.此题主要考察变量间相关性,其中A,B均为函数关系,D 那么无相关关系.答案:C2.以下各关系中不属于相关关系是〔〕解析:球外表积与体积之间是函数关系,不属于相关关系,选B.答案:B3.以下关系属于负相关是〔〕解析:吸烟有害安康,因此,吸烟与安康之间关系属于负相关.答案:C4.以下两个变量之间关系哪个不是函数关系〔〕解析:期中考试数学成绩与复习时间投入量是相关关系而不是函数关系.答案:D5.“名师出高徒〞可以解释为教师水平越高,学生水平也越高.那么,教师水平与学生水平成什么相关关系?你能举出更多描述生活中两个变量相关关系成语吗?解析:“名师出高徒〞意思是说有名教师一定能教出高明徒弟,通常情况下,高水平教师有很大趋势教出高水平学生,所以,教师水平与学生水平成正相关关系,生活中这样成语很多,如“龙生龙,凤生凤,老鼠孩子会打洞〞 .6.现随机抽取某校10名学生在入学考试中数学成绩x与入学后第一次数学成绩y,数据如下:问这10名学生两次数学考试成绩是否具有相关关系?解析:应用散点图分析.两次数学考试成绩散点图如以下图所示.由散点图可以看出两个变量对应点集中在一条直线周围,且y随x变大而变大,具有正相关关系.因此,这10名学生两次数学考试成绩具有相关关系.7.变量y与x之间回归方程〔〕解析:回归直线是与数据点最贴近直线,y与x之间回归方程,反映了y与x之间真实关系到达最大限度吻合.答案:Dyˆ=2-1.5x,当变量x增加一个单位时〔〕解析:'ˆy=2-1.5(x+1)=2-1.5x-1.5=yˆ-1.5.答案:Cyˆ=a+bx必定过〔〕A.〔0,0〕点B.〔x,0〕点C.〔0, y〕点D.〔x,y〕点解析:回归直线函数a、b有公式a=y-b x,即y=a+b x∴直线yˆ=a+bx必定过〔x,y〕点.10.回归直线方程系数a,b 最小二乘估计a,b,使函数Q 〔a,b 〕最小,Q 函数指〔 〕 A.∑=ni 1(y i -a-bx i )2B.∑=ni 1|y i -a-bx i |C.(y i -a-bx i )2D.|y i -a-bx i |解析:Q=(y 1-bx 1-a)2+(y 2-bx 2-a)2+…+(y n -bx n -a)2=∑=ni 1(y i -bx i -a)2.答案:A11.观测两相关变量得如下数据: x y -1 -9 -2 -7 -3 -5 -4 -3 -5 -1 5 1 3 5 4 3 2 7 1 9那么两变量间回归直线方程是〔 〕 A.y=21x-1 B.y=x C.y=2x+31解析:由线性回归方程系数求解公式, 易得b==1,a=y -b x =0. ∴线性回归方程为y=x. 答案:B12.以下是某地搜集到新房屋销售价格y 与房屋面积x 数据:(1)画出数据对应散点图;〔2〕求线性回归方程,并在散点图中加上回归直线; 〔3〕据〔2〕结果估计当房屋面积为150 m 2时销售价格. 解析:〔1〕数据对应散点图如以下图所示:(2)x =51∑=51i x i =109,∑=51i (x i -x )2=1 570,y =23.2,∑=51i (x i -x )(y i -y )=311.2.设所求回归直线方程为y ˆ=bx+a,那么 bˆ==≈0.198 2, aˆ=y -b x =23.2-109×0.198 2≈1.596 2. 故所求回归直线方程为yˆ=-0.198 2x+1.596 2. (3)据(2),当x=150 m 2时,销售价格估计值为:yˆ=0.198第 11 页2×150+1.596 2=31.326 2(万元).13.为研究某市家庭年平均收入与年平均生活支出关系,该市统计调查队随机调查了10个家庭,得数据如下:求回归直线方程. 解析:列表故可求得x =10=1.72,y =10=1.42, ∑=ni 12ix =32.88,∑=n i 121y =22.7,∑=ni 1x i y i =27.17.∴b=0.833,a=-0.013.∴回归直线方程为y=0.833x-0.013.。
2.4 线性回归方程第2课时导入新课在上一节课中问题1:将汽油以均匀的速度注入桶里,注入的时间t与注入的油量y如下表:从表里数据得出油量y与时间t之间的函数关系式为y=2x(x≥0).并且在直角坐标系里很容易作出它们的图象,我们知道各点在同一条直线上.再看下面的问题(即上一节课的练习2):某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表:请大家动手作出热茶销售量与气温的坐标图,说说它的特点,能得到什么规律?分析:该图中所有点不像第一个问题中函数关系的图象对应的点在同一条直线上,但是分布也是很有规律,它们散布在从左上角到右下角的区域,因此,可以得到规律是随着气温的增加,热茶卖出的杯数在减少.但究竟以什么样的方式在减少呢?这就是今天要继续学习的内容——线性回归方程.推进新课新知探究以横坐标x表示气温,纵坐标y表示热茶销量,建立平面直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到上图,今后我们称这样的图为散点图.1.散点图(scatterplot):表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.在本图中这些点散布的位置也是值得注意的,它们散布在从左上角到右下角的区域,对于这种相关关系,我们称它为负相关.如果点散布在从左下角到右上角的区域.对于这种相关关系,我们称它为正相关.请学生举例:两个变量之间是正相关的关系.例如:某小卖部卖的冷饮销售量与气温之间的关系.再看上节课的练习 1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:如果作出散点图如右图,它是散布在从左下角到右上角的区域,也是正相关的关系.回到解热茶销售量与气温之间的关系的散点图来,从图中可以得到规律是随着气温的增加,热饮的销售量在减少,究竟以什么样的方式减少呢?分析:分布情况是在从左上角到右下角的区域的某条直线附近摆动.能画出这条直线吗?请大家一起想一想,该怎么办,才能作出这条直线呢?请大家设计方案,可以互相讨论.方案1:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,达到一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程.分析:这个想法很好,但是操作起来有一定难度,因为我们画符合条件的直线不能直接画出.还有什么新的办法能解决这个问题?方案2:在图中选取两点画直线,使得直线两侧的点的个数基本相同.分析:画直线时使得直线两侧的点的个数基本相同的直线能画无数多条,这样符合条件的直线就不唯一了,再仔细考虑一下,我们究竟应当怎样作出.方案 3:在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距,将这两个平均数作为回归直线方程的斜率和截距.分析:如果有6个散点,按照方案3的办法,将要作15条直线,这样计算15条直线的斜率和截距分别求出的计算量是一个很大的工程,由此可见,该方案不具有可行性,那么怎样才能作出 “从整体上看各点与此直线距离最小”的直线呢?用方程y ˆ=bx+a 的直线拟合散点图中的点,应使得该直线与散点图中的点最接近,那么,怎样衡量yˆ=bx+a 与图中的点最接近程度呢? 我们将表中给出的自变量x 的六个值代入直线方程,得到相应的六个yˆ的值: 26b+a,18b+a,13b+a,10b+a,4b+a,-b+a.这六个数值与表中相应的六个yˆ的实际值应该越接近越好.所以,我们用类似于估计总体平均数时的思想,考虑离差平方和Q(a,b)=(26b+a-20)2+(18b+a-24)2+(13b+a-34)2+(10b+a-38)2+(4b+a-50)2+(-b+a-64)2=1 286b 2+6a 2+140ab-3 280b-460a+10 172.Q(a,b)是直线yˆ=bx+a 与各个散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线yˆ=bx+a 与图中6个点的接近程度,所以,设法取a ,b 的值,使Q(a,b)达到最小值.先把a 看作是常数,那么Q 是关于b 的二次函数.用配方法可得,当b=-128623820140⨯-a 时,Q 取得最小值.同理,把b 看作是常数,那么Q 是关于a 的二次函数.用配方法可得,当a=-12460140-b 时,Q 取得最小值.因此,当b=-128623820140⨯-a ,-12460140-b 时, Q 取得最小值,由此解得b≈-1.647 7,a≈57.556 8.所以所求的直线方程为yˆ=-1.647 7x+57.556 8.像这样能用直线方程yˆ=bx+a 近似表示的相关关系叫做线性相关关系. 人们经过长期的实践与研究,已经得出了从数量关系的角度来计算回归直线方程的斜率与截距的一般公式为: ⎪⎪⎪⎩⎪⎪⎪⎨⎧-=---=∑∑==xb y a x x y y x x b n i i n i i i 11)())((, 从而得到回归直线方程为y ˆ=bx+a. 下面我们一起来探究一下这个公式. 设已经得到具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),设所求的回归直线方程为yˆ=bx+a ,其中a ,b 是待定的系数,当变量x 取x 1,x 2,…,x n 时,可以得到i yˆ=bx i +a(i=1,2,…,n).它与实际收集到的y i 之间的偏差是y i -i yˆ=y i -(bx i +a)(i=1,2,3,4,…,n).这样用这n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.但是,由于y i -i yˆ=y i -(bx i +a)(i=1,2,3,4,…,n)的值可正可负,可以相互抵消,而且若取其绝对值,考虑用∑=n i 1=|y i -Y i |来代替,但是,由于它含有绝对值运算不太方便,因此我们可以模仿方差的计算方法取其偏差的平方最小值. 表示n 个点与相应直线在整体上的接近程度.即Q=(y 1-bx 1-a)2+(y 2-bx 2-a)2+…+(y n -bx n -a)2来刻画n 个点与回归直线在整体上的偏差.这样,问题,就归结为:当a ,b 取什么值时,Q 的取值最小,即总体偏差最小?上述式子展开后,是一个关于a 、b 的二次三项式,应用配方法,可求出使Q 为最小值时的a 、b 的值.即Q=na 2+∑=n i 1=1x i 2b 2+∑=n i 1=1y i 2-2∑=n i 1=1bx i y i +2∑=n i 1=1abx i -2∑=n i 1=1ay i . (*)上述式子展开后,是一个关于a 、b 的二次三项式,我们可以把(*)式看成以a 为变量的二次三项式,应用配方法可得,当 (1)时,Q 取得最大值;因为(1)式中还含有变量a ,我们无法求出b 的数值,那么我们如何求出斜率b 与截距a 的一般公式为: 从而得到回归直线方程为yˆ=bx+a 呢? 我们还可以把(*)式看成以b 为变量的二次三项式,应用配方法可得,当a= (2) 时,Q 取得最大值.观察(1)、(2)两个式子,因为(1)、(2)两个式子中都是含有a 、b 的二元一次方程,我们可以由(1)(2)解得:从而得到相应的直线叫做回归直线yˆ=bx+a,对两个变量所进行的上述统计分析叫做回归分析.这种求出斜率b与截距a的方法叫做最小平方法(method of least square)(又称最小二乘法).说明:一元线性回归分析也是研究两个变量的线性相关性,但比相关分析的应用更为广泛,它不仅可以说明两个变量是否一起变化,还可以计算出预测方程以预计这两个变量是如何一起变化的.预测方程的形式为:yˆ=bx+a ,通常叫作回归方程.y 叫做因变量,x 叫做自变量,其中a 是常数项,b 叫一元回归系数.1.对回归直线方程只要求会运用它进行具体计算a、b,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.3.求回归直线方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.应用示例例1 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:根据上述数据,人体脂肪含量和年龄之间有怎样的关系?分析:上节课已给出此问题,并作了回答但没有说明理由,这次补充完整.解:观察表中的数据,大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.为了确定这一关系的细节,我们需要进行数据分析.我们假设人的年龄影响体内脂肪含量,于是,按照习惯,以x轴表示年龄,以y轴表示脂肪含量,得到相应的散点图.从散点图我们可以看出,年龄越大,体内脂肪含量越高,图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.经计算可得到回归直线的回归方程为yˆ=0.577x-0.448. 点评:使前后产生较强的联系性,使学生意识到学数学等于师生在共同编导连续剧,每节课都应参与,不然会掉队.例 2 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,请说明理由.分析:一般地,用回归直线进行拟合的一般步骤为:(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式求出a,b. 解:在直角坐标系中作出所给数据的散点图,并写出线性回归方程.从散点图我们可以直观判断散点在某条直线附近,这说明两个变量是相关关系.计算相应的数据之和为:∑=n i i x1=95+110+112+120+129+135+150+180=1 031, ∑=n i i x1=6.2+7.5+7.7+8.5+8.7+9.8+10.2+13=71.6, ∑=n i i x12=137 835, ∑=n i i x1x i y i =9 611.7,代入公式(*)计算得b≈0.077 4,a=-1.024 1,所以,所求的线性回归方程为yˆ=0.774x-1.024 1.点评:要知道:在并不具有相关关系的情况下,对应的线性回归方程虽然也可以求出,但它并无实际意义,同时也要注意,在散点图中显示线性相关的一组数据不一定具有相关关系.这部分内容会在选修1-2中再次有所体现.例3 一般地,(x,y)的n组观察数据:若它的回归直线方程为yˆ=a+bx,则直线yˆ=a+bx恒过的定点是什么?分析:如果没有前面的推导背景,此题有点困难,但由于黑板上的板书还在,所以有学生能发现结论.解:由线性回归方程的推导,可知方程的系数a,b满足条件:,a=y-b x.由此不难发现,点(x,y)的坐标满足直线yˆ=a+bx的方程.所以,由点与直线的位置关系可得点(x,y)在直线yˆ=a+bx上,即直线yˆ=a+bx恒过点(x,y).这里x=, y=.点评:刚推导过线性回归方程,所以此题比较适合趁热打铁,可提前做例1;此结论在以后的解题中经常出现,因此可以让学生记忆.例4 工人工资(元)以劳动生产率(千元)变化的回归方程yˆ=50+80x,下列判断正确的是()A.劳动生产率为1 000元时,工资为130元B.劳动生产率提高1 000元时,工资大约提高80元C.劳动生产率提高1 000元时,工资提高大约130元D.当月工资250元时,劳动生产率为2 000元分析:满足回归方程是指:工人工资(元)以劳动生产率(千元)之间具有相关关系,但不是确定的函数关系,所以选项A用的肯定语气是错的,其他的选项通过函数关系式的代入发现,只有选项B是正确的.答案:B点评:体会回归方程的应用.知能训练1.线性回归方程yˆ=kx+a所表示的直线使得()A.散点图中的点到直线的距离之和最小B.散点图中的点到直线的距离的平方和最小C.散点图中的点与直线相同横坐标处对应的纵坐标的距离之和最小D.散点图中的点与直线相同横坐标处对应的纵坐标的距离的平方和最小2.如果有一组成对数据,求出回归直线的方程是y=2.0x+10,那么()A.这条回归直线总是有意义的B.这条回归直线总是可以用来预测y值C.在散点图中的点都在这条直线附近时,这条回归直线才有意义D.x=10时,y的预测值为20,说明在x=10时,y的值一定等于20解答:1.D 2.C课堂小结(让学生进行小结,谈谈体会,帮助他们回顾反思、归纳概括.)1. 变量间相关关系的散点图以及正相关和负相关;2. 如何利用“最小二乘法”思想求直线的回归方程;3. 学会用回归思想考察现实生活中变量之间的相关关系.作业课本习题2.4 1、2、3.设计感想通过对气温和热饮销量的关系散点图的分析,引入描述两个变量之间关系的线性回归方程(模型),使学生通过探索用多种方法确定线性回归直线,学会类比寻求新的突破方法,体会最小二乘法的思想,掌握计算回归方程的斜率与截距的方法,求出回归直线方程.通过典型的求解,强化回归思想的建立,理解回归直线与观测数据的关系. 通过引导学生感受生活中实际问题转化为数学问题,学会类比寻求新的突破方法,体会最小二乘法的思想,培养学生的创新精神,不断收取信息,学会用统计知识对实际问题进行数学分析.本节课在理解最小二乘法的时候所用时间较多,在推导线性回归方程时,计算量特别大,所以费时也较多,建议分一点内容到上一节课协调一下.习题详解习题2.41.(1)散点图如下:(2)线性回归方程为yˆ=5.2x+24.2.(1)散点图如下:(2)根据散点图,这些点在一条直线的附近,x与y具有线性相关关系,线性回归方程为yˆ=0.305 21x+9.990 32.3.(1)散点图如下:4.略.。