陕西省宁强县天津高级中学高二数学《相关性及最小二乘估计》学案1
- 格式:doc
- 大小:227.50 KB
- 文档页数:3
考纲定位重难突破1.会作散点图,并利用散点图直观认识变量间的相关关系.2.知道最小二乘法的思想,能够根据给出的线性回归系数公式建立线性回归方程.重点:作散点图,会建立线性回归方程.难点:准确理解变量的相关关系并求线性回归方程.授课提示:对应学生用书第16页[自主梳理]1.散点图在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.2.变量之间的相关关系从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.若两个变量x和y 的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的,而若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.3.最小二乘法与线性回归方程如果有n个点(x1,y1),(x2,y2),…,(x n,y n),可以用下面的表达式来刻画这些点与直线y=a +bx的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[y n-(a+bx n)]2使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.说明:线性回归方程y=a+bx中,b=x1y1+x2y2+…+x n y n-nx-y-x21+x22+…+x2n-nx-2(其中x-=x1+x2+…+x nn,y-=y1+y2+…+y nn);a=y--bx-__.[双基自测]1.下列两个变量之间的关系是相关关系的是()A.正方体的棱长与体积B.单位圆中圆心角的度数与所对弧长C.单位面积的产量为常数时,土地面积与总产量D.日照时间与水稻的亩产量解析:选项A,B,C均为函数关系,日照时间与水稻的亩产量有一定的关系,日照时间长,水稻的亩产量就高,但这种情况也不是绝对的,二者是相关关系.答案:D2.已知x,y之间的一组数据如下:x 01234 5y 135579则y关于xA.(2,2)B.(1,3)C.(2.5,5)D.(4,6)解析:因为x -=0+1+2+3+4+56=2.5,y -=1+3+5+5+7+96=5,所以y 关于x 的回归直线必经过样本点的中心(2.5,5).故选C.答案:C3.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的线性回归方程:y =0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元. 解析:由y =0.254x +0.321知,当x 增加1万元时,年饮食支出y 增加0.254万元. 答案:0.254授课提示:对应学生用书第16页探究一 变量之间的相关关系的判断[编号 1 2 3 4 5 6 7 8 9 身高/cm 165 157 155 175 168 157 178 160 163 体重/kg 52 44 45 55 54 47 6250 53[解析] 法一:根据经验可知,人的身高和体重之间存在相关关系.法二:观察表格数据可知,人的体重随着身高的增高而增加,因此人的身高和体重之间存在相关关系.法三:以x 轴表示身高,以y 轴表示体重,得到相应的散点图如图所示.我们会发现,随着身高的增高,体重基本上呈增加的趋势.所以体重与身高之间存在相关关系.两个变量x 和y 相关关系的确定方法(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断.(2)如果发现点的分布从整体上看大致在一条线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.1.某化妆品公司2013~2018年的年利润x (单位:百万元)与年广告支出y (单位:百万元)的统年份 2013 2014 2015 2016 2017 2018 利润x 12.2 14.6 16.2 18.4 20.4 22.3 支出y 0.62 0.74 0.81 0.89 1.00 1.11根据统计资料,可知( )A .利润的中位数是16.2,x 与y 有正相关关系B .利润的中位数是17.3,x 与y 有正相关关系C .利润的中位数是17.3,x 与y 有负相关关系D .利润的中位数是18.4,x 与y 有负相关关系解析:年利润的6个数据的中间两个为16.2,18.4,则中位数为17.3;又x 增加时,y 也随之增加,因此x 与y 成正相关.故选B. 答案:B探究二 求线性回归方程[典例2] 关于人体的脂肪含量(百分比)和年龄关系的研究中,得到如下一组数:年龄x 23 27 39 41 45 49 50 53 脂肪y 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6(1)判断它们是否有相关关系,若有相关关系,请作一条拟合直线; (2)用最小二乘法求出年龄关于脂肪的线性回归方程.[解析] (1)以x 轴表示年龄,y 轴表示脂肪含量(百分比)画出散点图,如图.进一步观察,发现上图中的点分布在一条直线附近,这说明这一正相关可以用这一直线来逼近,根据图中分析,人体的脂肪含量(百分比)和年龄具有相关关系. (2)设回归直线为y =bx +a , 那么结合题中数据,可得x -=40.875,y -=23.25,∑8i =1x i y i =8 092.8,∑8i =1x 2i =14 195, 则b =∑8i =1x i y i -8x - y -∑8i =1x 2i -8x -2,=8 092.8-8×40.875×23.2514 195-8×40.8752≈0.591 2, a =y --bx -=23.25-0.591 2×40.875=-0.915 3, 所以所求的线性回归方程是y =0.591 2x -0.915 3.(1)最小二乘法的适用条件:两个变量必须具有线性相关性,若题目没有说明相关性,必须对两个变量进行相关性检验. (2)注意事项:①利用求回归方程的步骤求线性回归方程的方法实质是一种待定系数法.②计算a ,b 的值时,用列表法理清计算思路,减少计算失误.同时,计算时,尽量使用计算机或科学计算器.2.某研究机构对中学生记忆能力x 和识图能力y 进行统计分析,得到如下数据:记忆能力x 4 6 8 10 识图能力y 3 * 6 85.5.(1)经过分析,知道记忆能力x 和识图能力y 之间具有线性相关关系,请用最小二乘法求出y 关于x 的线性回归方程y =bx +a ;(2)已知某一学生记忆能力值为12,请预测他的识图能力值.解析:(1)设丢失的数据为m ,依题意,得3+m +6+84=5.5,解得m =5,即丢失的数据值是5.由表中的数据,得x -=4+6+8+104=7,y -=5.5,∑4i =1x i y i =4×3+6×5+8×6+10×8=170, ∑4i =1x 2i =42+62+82+102=216, b =∑4i =1x i y i -4x -y -∑4i =1x 2i -4x -2=170-4×7×5.5216-4×72=0.8,a =y --bx -=5.5-0.8×7=-0.1, 所以所求线性回归方程为y =0.8x -0.1.(2)由(1),得当x =12时,y =0.8×12-0.1=9.5, 即预测他的识图能力值是9.5.探究三 线性回归方程的应用[典例3] 某5名学生的总成绩和数学成绩(单位:分)如下表所示:学生 A B C D E 总成绩(x ) 482 383 421 364 362 数学成绩(y ) 78 65 71 64 61(1)作出散点图;(2)求数学成绩y 对总成绩x 的线性回归方程;(3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩. [解析] (1)散点图如图所示:(2)列表如下:i 12 3 4 5 x i 482 383 421 364 362 y i 78 65 71 64 61 x i y i37 596 24 895 29 891 23 296 22 082x -=2 0125,y -=3395,∑5i =1x 2i =819 794,∑5i =1x i y i =137 760. b =∑5i =1x i y i -5x - y -∑5i =1x 2i -5x -2=137 760-5×2 0125×3395819 794-5×(2 0125)2≈0.132,a =y --bx -≈3395-0.132×2 0125≈14.683.所以线性回归方程为y =0.132x +14.683. (3)当x =450时,y ≈74,即当一个学生的总成绩为450分时,他的数学成绩约为74分.回归方程的应用体现在以下几个方面:(1)描述两变量之间的依赖关系:利用线性回归方程可定量地描述两个变量间的依赖关系. (2)利用回归方程可以进行预测,把预报因子(相当于随机变量x )代入回归方程对预报量(相当于因变量y )进行估计,即可得到个体y 值的允许区间.(3)利用回归方程进行统计控制,规定y 值的变化,通过控制x 的范围来实现统计控制的目标.3x (单位:m 2)的数据:x 115 110 80 135 105 y 44.8 41.6 38.4 49.2 42(1)画出散点图; (2)求线性回归方程;(3)根据(2)的结果估计当房屋面积为150 m 2时的销售价格. 解析:(1)散点图如图所示.(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求线性回归方程.由表中的数据,得x -=109,y -=43.2,∑5i =1x 2i =60 975,∑5i =1x i y i =23 852.则b =∑5i =1x i y i -5x -y -∑5i =1x 2i -5x -2=23 852-5×109×43.260 975-5×1092=3081 570≈0.196,a =y --bx -≈43.2-0.196×109=21.836. 故所求线性回归方程为y =0.196x +21.836.(3)根据上面求得的回归方程知,当房屋面积为150 m 2时,销售价格的估计值为0.196×150+21.836=51.236(万元).利用线性回归方程对总体进行预测[典例] (本题满分12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =bx +a ;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? [规范解答] (1)散点图,如图所示.①………………………………………………………………………………………2分 (2)由题意,得∑ni =1x i y i =3×2.5+4×3+5×4+6×4.5=66.5, x -=3+4+5+64=4.5,y -=2.5+3+4+4.54=3.5,∑ni =1x 2i =32+42+52+62=86,………………………………………………………6分所以b =66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,②………………………………………………………………………………………8分 a =y --bx -=3.5-0.7×4.5=0.35,…………………………………………………9分 故线性回归方程为y =0.7x +0.35. ………………………………………………10分(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,………………………………………………………………………11分 故耗能约降低了90-70.35=19.65(吨标准煤).③……………………………………………………………………………………12分[规范与警示]①处散点图的画法中,纵、横坐标的刻度选取要适当.②处计算量较大易出错,失分点.③处由回归方程计算的该值只是一个预测值,是实际问题的一个估计值,因此最后应进行回答.用线性回归方程预测的一般步骤为:(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式求a、b并写出线性回归方程;(3)根据线性回归方程对总体进行预测.[随堂训练]对应学生用书第18页1.根据如下样本数据x 345678y 4.0 2.5-0.50.5-2.0-3.0A.a>0,b>0B.a>0,b<0C.a<0,b>0 D.a<0,b<0解析:画出散点图,知a>0,b<0.答案:B2.下图各选项中的两个变量具有相关关系的是()解析:选项A、C中变量x与变量y之间是确定的函数关系,选项D中,点不在某条直线附近波动,因此两变量非线性相关,而点也不在某条曲线附近波动,故两变量不具有相关关系.选项B中所有点都在某条直线附近波动,故选B.答案:B3.已知高三学生高考成绩y(单位:分)与高三期间有效复习时间x(单位:天)正相关,且回归直线方程是y=3x+50.若期望甲同学高考成绩不低于500分,那么他的有效复习时间应不低于________天.解析:由3x+50≥500,得x≥150.答案:1504.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x 2 4 5 6 8 y 30 40 60 50 70(1)画出散点图;(2)如果x 与y 具有线性相关关系,求线性回归方程,并说明b 的意义. 解析:(1)散点图如图所示.(2)由散点图知x 与y 具有线性相关关系.x -=5,y -=50,∑5i =1x i y i =1 380,∑5i =1x 2i =145, 所以b =∑5i =1x i y i -5x -y -∑5i =1x 2i -5x -2=1 380-5×5×50145-5×52=6.5,a =y --bx -=50-6.5×5=17.5. 所求线性回归方程为y =6.5x +17.5.b 表示广告费每增加100万元,销售额平均增加650万元.。
8 最小二乘估计[核心必知]1.回归直线如果两个变量散点图中点的分布从整体上看大致在一条直线附近,那么称这两个变量之间具有线性相关关系,这条直线叫作回归直线.2.最小二乘法求线性回归方程y=bx+a时,使得样本数据的点到它的距离的平方和最小的方法叫作最小二乘法.其中a,b的值由以下公式给出:错误!a,b是线性回归方程的系数.[问题思考]1.任给一组数据,我们都可以由最小二乘法得出线性回归方程吗?提示:用最小二乘法求回归直线的方程的前提是先判断所给数据具有线性相关关系(可利用散点图判断).否则求出的线性回归方程是无意义的.2.线性回归方程是否经过一定点?提示:线性回归方程恒过定点(错误!,错误!).讲一讲1.下表是某旅游区游客数量与平均气温的对比表:[尝试解答] 错误!=错误!=错误!,错误!=错误!=错误!,x21+x错误!+…+x错误!=1+16+100+169+324+676=1 286,x1y1+x2y2+…+x6y6=-20+96+340+13×38+18×50+26×64=3 474。
b=错误!=错误!≈1。
68,a=错误!-b错误!≈18.73,即所求的线性回归方程为y=1.68x+18。
73。
求线性回归方程的步骤(1)画出散点图,判断其具有相关关系;(2)计算错误!,错误!,错误!x错误!=x错误!+x错误!+…+x错误!,错误!x i y i=x1y1+x2y2+…+x n y n.(3)代入公式b=错误!,a=错误!-b错误!;(4)写出线性回归方程y=bx+a。
练一练1.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:已知记忆力x和判断力y是线性相关的,求线性回归方程.解:错误!=错误!=9,错误!=错误!=4,a=错误!-b错误!=4-0。
7×9=-2.3。
则所求的线性回归方程为y=0.7x-2。
3.讲一讲2。
某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求线性回归方程;(3)预测当广告费支出为7百万元时的销售额.[尝试解答] (1)(2)从散点图可以发现,y与x具有线性相关关系,利用计算器求得:错误!=5,错误!=50,错误!x错误!=145,错误!x i y i=1 380,设回归方程为y=bx+a,则b=错误!=错误!=6.5,a=错误!-b错误!=50-6.5×5=17。
使用说明:1、认真阅读课本79-80页内容,理解圆的一般方程;2、阅读课本并结合例3和例4并训练完成第1、2、3、4题;3、结合前面训练题并阅读课本,思考交流完成合作探究题型。
学习目标:1、通过1、2、3、4题掌握圆的一般方程及二元二次方程表示圆的条件;2、通过5、6、7题掌握方程与曲线的关系及圆方程的求法。
3、通过8、9、10、11题巩固基本知识。
重 点:二元二次方程表示圆的条件。
难 点:圆的一般方程方程的求法。
复习回顾:1、圆的标准方程: ,圆心 ,半径 。
2、点与圆的位置关系:① ② ③知识梳理:1、圆的标准方程展开,写成二元二次方程的一般形式为 。
2、圆的一般方程的定义:当 时,称二元二次方程 为圆的一般方程。
其特点:① ② ③ 。
3、方程022=++++F Ey Dx y x 表示的图形 方程 条件图形 022=++++F Ey Dx y x不表示任何图形表示 表示以 为圆心,以为半径的圆 ◆效果检测◆【★】1、圆036422=--++y x y x 的圆心和半径分别为 , 。
【★】2、若方程052422=++-+k y x y x 表示圆,则k 的取值范围是 。
【★★】3、经过点)4,0()0,2()0,0(B A O ,,的圆的一般方程是 。
【★★】4、如果圆的方程为02222=++++k y kx y x ,那么当圆面积最大时,圆心坐标为 。
二、合作探究【★★】5、已知方程0)1(0)1(222222=-++=-+y x x y x x和,则它们的图形分别是什么?【★★】6、已知圆过两点)3,1(),1,3(-B A ,且它的圆心在直线023=--y x 上,求圆的方程。
【★★★】7、已知圆过点)2,3(),4,1(-B A ,且圆心到直线AB 的距离为10,求圆的方程。
三、课堂检测◆巩固练习◆【★】8、课本80页练习1。
【★★】9、方程0222=++-+m y x y x 表示一个圆,则m 取值范围为 。
(3)什么是线性相关?(4)观察下面人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?(5)什么叫作回归直线?(6)如何求回归直线的方程?什么是最小二乘法?活动:学生回顾,再思考或讨论,教师及时提示指导.讨论结果:(1)建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫作散点图.(2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.(4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.(5)从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.(6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线.那么,我们应当如何具体求出这个回归方程呢?引出:最小二乘法.实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式⎪⎪⎩⎪⎪⎨⎧+++=+++=-=-++-++=.,,.,21212222212211nyyyynxxxxx byax nxxxy x nyxyxyxbnnnnnΛΛΛΛ其中①这样得到的直线方程y=a+bx称为线性回归方程,a,b是线性回归方程的系数.推导以上公式的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理.假设我们已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n),且所求回归方程是y=a+bx,其中a、b是待定参数.当变量x取x i(i=1,2,…,n)时可以得到y=a+bx i(i=1,2,…,n),它与实际收集到的y i之间的偏差是y i-y=y i-(a+bx i)(i=1,2,…,n).这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(y i-y)可正可负,为了避免相互抵消,可以考虑用∑=-niiyy1||来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(y n-bx n-a)2②来刻画n个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b取什么值时Q最小,即总体偏差最小.经过数学上求最小值的运算,a,b的值由公式①给出.通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法.应用示例例1 某小卖部6天卖出热茶的杯数(y)与当天气温(x)之间是线性相关的.数据如下表:气温(x i)/℃26 18 13 10 4 -1 杯数20 24 34 38 50 64(1)试用最小二乘法求出线性回归方程.(2)如果某天的气温是-3 ℃,请预测这天可能会卖出热茶多少杯.例1 给出施化肥量对水稻产量影响的试验数据:施化肥量x 15 20 25 30 35 40 45水稻产量y 330 345 365 405 445 450 455(1)画出上表的散点图;(2)求出回归直线的方程.知能训练1.下列两个变量之间的关系哪个不是函数关系()A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高2.三点(3,10),(7,20),(11,24)的线性回归方程是()。
陕飞二中2021高考数学第2讲相关性、最小二乘估计与统计案例训练高考要求:1.考察利用散点图判断变量之间的关系.2.考察线性回归方程的计算或者回归分析的思想与方法的应用问题.3.考察HY性检验的根本思想及应用.考向一、线性相关关系的判断1.以下两个变量之间的关系是相关关系的是( ).A.正方体的棱长与体积B.单位面积的产量为常数时,土地面积与总产量C.时间是与水稻的亩产量D.电压一定时,电流与电阻答案 C3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为yx -85.71,那么以下结论中不正确的选项是( ). A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .假设该大学某女生身高增加1 cm ,那么其体重约增加0.85 kgD .假设该大学某女生身高为170 cm ,那么可断定其体重必为58.79 kg 答案 D4、为了评价某个电视栏目的HY 效果,在HY 前后分别从居民点抽取了100位居民进展调查,经过计算χ2≈0.99,根据这一数据分析,以下说法正确的选项是( ).A .有99%的人认为该栏目优秀B .有99%的人认为该栏目是否优秀与HY 有关系C .有99%的把握认为电视栏目是否优秀与HY 有关系D .没有理由认为电视栏目是否优秀与HY 有关系 答案 D5、调查了某地假设干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的线性回归方程:yx ,家庭年收入每增加1万元,年饮食支出平均增加________万元.6、某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y =bx +a 中的b ,据此模型预报广告费用为6万元时销售额为( ).万元 B .万元万元 D .万元 答案 B7、在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,假设所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,那么这组样本数据的样本相关系数为( ). A .-1 B .0 C.12 D .1答案 D 8、以下说法:①、将一组数据中的每个数据都加上或者减去同一个常数后,方差恒不变; ②、设有一个回归方程y =3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③、线性回归方程y =bx +a 必过(x -,y -);④、在一个2×2列联表中,由计算得χ2,那么有99%以上的把握认为这两个变量间有关系.其中错误的个数是( ).A .0B .1C .2D .3 考向五、 线性回归方程及其应用9、某工厂为了对新研发的一种产品进展合理定价,将该产品按事先拟定的价格进展试销,得到如下数据:(1)求回归直线方程y =bx +a ,其中b =-20,a =y --b x -;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的本钱是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-本钱) 解、1〕、回归直线方程为y =-20x +250. (2)、 L =x (-20x +250)-4(-20x +250)=-20()x -8.252x ,L 获得最大值. ,工厂可获得最大利润.10、下表提供了某厂节能降耗技术改造后消费甲产品过程中记录的产量x (吨)与相应的消费能耗y (吨HY 煤)的几组对照数据.x 3 4 5 6 y34(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =bx +a ; (3)该厂技改前消费100吨甲产品的消费能耗为90吨HY 煤.试根据(2)求出的线性回归方程,预测消费100吨甲产品的消费能耗比技改前降低多少吨HY 煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)考向六、 HY 性检验的根本思想及应用11、在调查男女乘客是否晕机的事件中,男乘客晕机为28人,不晕机的也是28人,而女乘客晕机为28人,不晕机的为56人. (1)、根据以上数据建立一个2×2的列联表; (2)、能否有95%的把握认为晕机与性别有关系? 解 (1)、2×2列联表如下:(2)、χ2=140×〔28×56-28×28〕56×84×56×84=359≈>3.841.所以有95%的把握认为晕机与性别有关系四季寄语情感寄语在纷繁的人群中/牵手走过岁月/就像走过夏季/拥挤的海滩在我居住的江南/已是春暖花开季节/采几片云彩/轻捧一掬清泉/飘送几片绿叶/用我的心/盛着寄给/北国的你不要想摆脱冬季/看/冰雪覆盖的世界/美好的这样完整/如我对你的祝福/完整地这样美好挡也挡不住的春意/像挡也挡不住的/想你的心情/它总在杨柳枝头/泄露我的秘密往事的怀念/爬上琴弦/化作绵绵秋雨/零零落落我诚挚的情怀/如夏日老树下的绿荫/斑斑驳驳虽只是一个小小的祝福/却化做了/夏季夜空/万点星辰中的一颗对你的思念/温暖了/我这些个漫长的/冬日从春到夏,从秋到冬......只要你的帘轻动,就是我的思念在你窗上走过.在那个无花果成熟的季节,我才真正领悟了你不能表达的缄默.我又错过了一个花期/只要你知道无花也是春天/我是你三月芳草地燕子声声里,相思又一年朋友,愿你心中,没有秋寒.一到冬天,就想起/那年我们一起去吃的糖葫芦/那味道又酸又甜/就像......爱情.谢谢你/在我孤独时刻/拜访我这冬日陋室只要有个窗子/就拥有了四季/拥有了世界愿你:俏丽如三春之桃,清素若九秋之菊没有你在身边,我的生活永远是冬天!让我们穿越秋天/一起去领略那收获的喜悦!在冬天里,心中要装着春天;而在春天,却不能忘记冬天的寒冷.落红不是无情物,化作春泥更护花.愿是只燕,衔着春光,翩翩向你窗.请紧紧把握现在/让我们把一种期翼/或者是一种愿望/种进大地/明春/它就会萌生绿色的叶片.此刻又是久违的秋季/又是你钟爱的季节/于是/秋风秋雨秋云秋月/都化作你的笑颜身影/在我的心底落落起起.此刻已是秋季/你可体验到/收获怀念的感觉/和秋雨一样真实动人.一条柳枝/愿是你生活的主题/常绿常新/在每一个春季雨声蝉鸣叶落风啸/又一个匆匆四季/在这冬末春初/向遥远的你/问安!又是夏季/时常有暴雨雷鸣/此刻/你可以把我当作大雨伞/直至雨过天晴/留给你一个/彩虹的夏季!。
宁强县天津高级中学2015届高二第一学期期中考试(理科)数学模拟试题命题、制卷、校对 :王 波 考试时间:120分钟 总分:150分第Ⅰ卷 (选择题 共50分)一、 选择题:(本大题共10小题,每小题5分,共50分。
在每小题给出的四个选项中,只有一项是符合题目要求的。
)1.集合:解一元二次不等式+求交并补运算如:设集合A={x|1<x <4},集合B ={x|2x -2x-3≤0}, 则A ∩(C R B )=( )A .(1,4)B .(3,4)C .(1,3)D .(1,2)∪(3,4) 2. 由前几项归纳通项公式或求某一项如:数列1,1,2,3,,8,13,21,……中的的值是( )A .4B .5C .6D .7 3.解三角形:正、余弦定理及其应用(求边角、判断解得个数)如:在ABC ∆中,0120,3,33===A b a ,则B的值为( )A.030 B.045 C.060 D.090 4.线性规划:求线性目标函数的最值或非线性目标函数的几何意义如:设变量x , y 满足约束条件360,20,30,x y y x y ≥--≤+-⎧-≤⎪⎨⎪⎩则目标函数z = y -2x 的最小值为( )A . -7B .-4C . 1D . 25.等差或等比数列:基本量的计算或性质的应用如:设{}n a 为递减等比数列,121211,10a a a a +=⋅=,则1210lg lg lg a a a ++⋅⋅⋅+=( )A .35-B .35C .55-D .5512 0.51ab在下列表格中,每格填上一个数字后,使每一横行成等差..数列,每一纵列成等比..数列,则a b c ++的值为( )A .1B .2C .3D .4 6. 基本不等式求最值如:设R y x ∈,,且4=+y x ,则yx55+的最小值是( ) A . 9B . 25C . 50D . 162已知0,0x y >>,若26x y xy ++=,则xy 的最大值为 已知正实数,x y 满足1x y +=,若1ax y+的最小值为9,则正数a = 小李从甲地到乙地往返的时速分别为a 和b (a b <),其全程的平均时速为v ,则( )A.a v <<v =v <<2a b + D.2a bv += 7.判断三角形形状:边角互化如:设△ABC 的内角A , B , C 所对的边分别为a , b , c , 若cos cos sin b C c B a A +=, 则△ABC 的形状为( )A . 锐角三角形B . 直角三角形C .钝角三角形D . 不确定8. 不等式:命题成立的个数或比较大小 如:活页卷P102第2题,P105页第5题 9.递推公式:求通项或求项的值 如:在数列{}n a 中,112()2,2()n n n a n a a a n ++⎧==⎨⎩为奇数为偶数,则5a =( )A .22B .20C .18D .1610.创新题:如:已知数列{a n }满足:a n =log n+1(n+2)(n∈N *),定义使a 1•a 2•a 3…a k 为整数的数k (k∈N *)叫做企盼数,则区间[1,2013]内所有的企盼数的和为( )A .1001B .2026C .2030D .2048“等差比数列”.下列是对“等差比数列”的判断: ①k 不可能为0②等差数列一定是等差比数列 ③等比数列一定是等差比数列 ④若a n =-3n +2,则数列{a n }是等差比数列; 其中正确的判断是( )A .①②B .②③C .③④D .①④n个连续自然数按规律排成下表:根据规律,从2010到2012箭头的方向依次为( ) A.B.C.D.第Ⅱ卷 (非选择题 共100分)二、填空题:(本大题共5小题,每小题5分,共25分.) 11.解三角形(面积、外接圆)或可行域的面积 12.最值或求参数的取值范围如:设0,0>>b a ,若3是a9与b27的等比中项,则ba 32+的最小值是 已知310<<x ,则)31(x x -取最大值时x 的值是 已知1,1x y >>,且11ln ,,ln 44x y 成等比数列,则xy 的最小值为已知不等式210x ax ++≥对任意10,2x ⎛⎤∈ ⎥⎝⎦恒成立,则a 的最小值是若函数()f x =R ,则a 的取值范围为13.等差或等比数列前n 项和的性质0 1234567 8 9 (10)11如:等差数列{a n }和{b n }的前n 项和分别为S n 与Tn ,对任意*n N ∈,都有nn T S =132+n n,则55b a 等于 设n S 为等比数列{a n }的前n 项和,若846S S =,则128SS = 14.线性规划的应用题如:某企业生产甲、乙两种产品,已知生产每吨甲产品要用3t 原料A ,2t 天然气B ;生产每吨乙产 品要用1t 原料A ,3t 天然气B ,销售每吨甲产品可获得利润5万元,销售每吨乙产品可获得利润3万元。
[航向标·学习目标]1.在探索多种方法确定线性回归直线的过程中,体会最小二乘的思想方法. 2.能根据给出的线性回归方程系数公式建立线性回归方程.[读教材·自主学习]1.最小二乘法:如果有n 个点:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用下面的表达式来刻画这些点与直线y =a +bx 的接近程度:□01[y 1-(a +bx 1)]+[y 2-(a +bx 2)]+…+[y n -(a +bx n )]. 使得上式达到最小值的直线y =a +bx 就是我们所要求的直线,这种方法称为□02最小二乘法. 2.线性回归方程:如果用x -表示x 1+x 2+…+x n n ,用y -表示y 1+y 2+…+y n n ,则可以求得b =(x 1-x -)(y 1-y -)+(x 2-x -)(y 2-y -)+…+(x n -x -)(y n -y -)(x 1-x -)2+(x 2-x -)2+…+(x n-x -)2=□03x 1y 1+x 2y 2+…+x n y n -n x -y-x 21+x 22+…+x 2n-n x-2.a =y --b x -.这样得到的直线方程称为线性回归方程,a ,b 是线性回归方程的系数.[看名师·疑难剖析]1.求线性回归方程的步骤 (1)列表x i ,y i ,x i y i .(2)计算x -,y -,∑i =1nx 2i ,∑i =1nx i y i .(3)代入公式b=∑i=1nx i y i-n x-y-∑i=1nx2i-n x-2,a=y--b x-求出b,a.(4)写出直线方程:y^=bx+a.2.线性回归方程系数公式的推导过程首先将[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[y n-(a+bx n)]2化成关于未知数a的一元二次多项式形式:na2+2n(b x--y-)a+[(y1-bx1)2+(y2-bx2)2+…+(y n-bx n)2]=n[a+(b x--y-)]2-n(b x--y-)2+[(y1-bx1)2+(y2-bx2)2+…+(y n-bx n)2]因此当a=y--b x-时,上式取得最小值,将这个关系代入上式,整理成关于未知数b的一元二次多项式的形式:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[y n-(a+bx n)]2=[(y1-y-)-b(x1-x-)]2+[(y2-y-)-b(x2-x-)]2+…+[(y n-y-)-b(x n-x-)]2=b2[(x1-x-)2+(x2-x-)2+…+(x n-x-)2]-2b[(x1-x-)(y1-y-)+(x2-x-)(y2-y-)+…+(x n-x-)(y n-y-)]+[(y1-y-)2+(y2-y-)2+…+(y n-y-)2],因此,当b =(x1-x-)(y1-y-)+(x2-x-)(y2-y-)+…+(x n-x-)(y n-y-)(x1-x-)2+(x2-x-)2+…+(x n-x-)2=x1y1+x2y2+…+x n y n-n x-y-x21+x22+…+x2n-n x-2=∑i=1nx i y i-n x-y-∑i=1nx2i-n x-2时点(x1,y1)(x2,y2)…(x n,y n)与直线y=a+bx最接近(注意并不是点到直线距离之和最小).a,b的意义是:以a为基数,x每增加一个单位,y相应的平均增加b个单位.考点一线性回归方程的概念例1设有一个线性回归方程为y=4-2x,则变量x增加2个单位时() A.y平均增加1.5个单位B.y平均减少1.5个单位C.y平均增加4个单位D.y平均减少4个单位[解析]该题考查线性回归方程的两个变量之间的线性关系问题.由回归直线方程y=4-2x,知斜率为-2,所以变量x每增加1个单位,y平均减少2个单位,故当变量x增加2个单位时,y平均减少4个单位,所以选D.[答案] D类题通法根据线性回归方程可获得对两个变量之间整体关系的了解,对于已知的变量x,可以相应估计出变量y的值.[变式训练1]工人月工资(元)依劳动生产率(千元)变化的线性回归方程为y =50+80x,下列判断正确的是()A.劳动生产率为1000元时,工资为130元B.劳动生产率提高1000元时,工资平均提高80元C.劳动生产率提高1000元时,工资平均提高130元D.当月工资为210元时,劳动生产率为2000元答案 B解析线性回归方程y=a+bx中b的意义是当x增加一个单位时,y的值平均变化b个单位,这是一个平均变化率.线性回归方程只能用于预测变量的值.考点二求线性回归方程例2每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压强度y(单位:kg/cm2)之间的关系有如下数据:[分析]由题目可获取以下主要信息:①两变量具有线性相关关系;②由两变量的对应数据求回归直线方程.解答本题要先列出相应的表格,有了表格中的那些相关数据,回归方程中的系数就都容易求出了.[解] 列表如下:∴b =182943-12×205×72.6518600-12×2052=434714300≈0.304,a =y --b x -=72.6-0.304×205=10.28. 于是所求的回归方程是y ^=0.304x +10.28. 类题通法用公式求回归方程的一般步骤是: ①列表x i ,y i ,x i y i .②计算x -,y -,∑i =1nx 2i ,∑i =1ny 2i ,∑i =1nx i y i .③代入公式计算b 、a 的值. ④写出回归直线方程.[变式训练2]为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x(cm)174176176176178儿子身高y(cm)175175176177177 A.y=x-1B.y=x+1C.y=88+12x D.y=176答案 C解析本题考查线性回归方程的求法.设y对x的线性回归方程为y=bx+a,因为b=-2×(-1)+0×(-1)+0×0+0×1+2×1(-2)2+22=12,a=176-12×176=88,所以y对x的线性回归方程为y=12x+88.选C.规范答题线性相关关系的判断及线性回归方程的求解[例](12分)假设关于某设备使用年限x(年)和所支出的维修费用y(万元)有如下统计资料:x 2345 6y 2.2 3.8 5.5 6.57.0(1)若线性相关,用最小二乘法求出y关于x的线性回归方程;(2)试根据(1)求出的线性回归方程,预测使用年限为10年时,维修费用是多少?(一)精妙思路点拨(二)分层规范细解(1)散点图①如图所示:·2分由散点图可知,两变量之间具有相关关系,且为线性相关关系.4分下面用最小二乘法求线性回归方程:列表,计算i 1234 5x i2345 6y i 2.2 3.8 5.5 6.57.0x i y i 4.411.422.032.542.0x2i49162536∴线性回归方程为y=1.23x+0.08.10分(2)把x=10代入(1)中所求得的线性回归方程得:y=1.23×10+0.08=12.38,11分即使用年限为10年时,维修费用约是12.38万元③.12分(三)来自一线的报告通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:(注:此处的①②③见分层规范细解过程)(四)类题练笔掌握以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积x(m2)80105110115135 销售价格y(万元)18.42221.624.829.2(2)求线性回归方程,并在散点图中加上回归直线;(3)试预测90 m2的房屋,销售价格是多少?(精确到0.01)解(1)根据表中所列数据可得散点图如下:由图可见两者之间是线性相关的. (2)列表,计算:i 1 2 3 4 5 x i 80 105 110 115 135 y i 18.4 22 21.6 24.8 29.2 x i y i 1472 2310 2376 2852 3942 x 2i640011025121001322518225x -=109,y -=23.2,∑i =15x 2i =60975,∑i =15x i y i =12952故可求得:b =∑i =15x i y i -5x -y -∑i =15x 2i -5x -2=12952-5×109×23.260975-5×1092≈0.1962,a =y --b x -=23.2-0.1962×109=1.8142,所以,线性回归方程为y =0.1962x +1.8142,回归直线如(1)中图. (3)把x =90代入上述回归方程y =0.1962x +1.8142,即y =0.1962×90+1.8142≈19.47,即这种90 m 2的房屋,销售价格约是19.47万元.(五)解题设问画出散点图的作用是什么?________. 答案 判断数据是否线性相关1.设有一个回归方程为y ^=2-1.5x ,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减小1.5个单位 D .y 平均减少2个单位答案 C解析 由相关系数的意义可知C 正确.2.线性回归方程表示的直线y =a +bx 必定过( ) A .(0,0)点 B .(x -,0)点 C .(0,y -)点 D .(x -,y -)点 答案 D3.试验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的线性回归方程为( )A .y =x +1B .y =x +2C .y =2x +1D .y =x -1 答案 A解析 作散点图,利用最小二乘法求线性回归方程.4.施化肥量x kg 与水稻产量y kg 在一定范围内线性相关,若线性回归方程为y =5x +250,当施化肥量为80 kg 时,预计水稻的产量为________.答案 650 kg解析 将x 的值代入线性回归方程即可.5.假设学生在七年级和八年级的数学成绩是线性相关的,若10个学生七年级(x )和八年级(y )数学分数如下:x 74 71 72 68 76 73 67 70 65 74 y76757170767965776272解因为x-=71,∑i=110x2i=50520,y-=72.3,∑i=110x i y i=51467,所以b=51467-10×71×72.350520-10×712≈1.2182,a=72.3-1.2182×71=-14.192.回归直线方程是y^=1.2182x-14.192.一、选择题1.过三点(3,10),(7,20),(11,24)的线性回归直线方程是()A.y=1.75-5.75x B.y=-1.75+5.75xC.y=5.75+1.75x D.y=5.75-1.75x答案 C解析根据求线性回归方程的方法,利用公式可得到答案.2.抽测10只某种白炽灯的使用寿命x,结果如下(单位:h):1067,919,1196,785,t,936,918,1156,920,918,若x-=997,则t大约是()A.1120 B.1124 C.1155 D.1128答案 C3.在线性回归方程中,b表示()A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均变化量D.当y增加一个单位时,x的平均变化量答案 C解析本题主要考查线性回归方程中a,b的含义.4.由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)得到线性回归方程y=bx +a,那么下列说法中错误的是()A.直线y=bx+a必经过点(x-,y-)B .直线y =bx +a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点C .直线y =bx +a 的斜率为b =∑i =1nx i y i -n x -y -∑i =1nx 2i -n x -2D .直线y =bx +a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差的平方和∑i =1n[y i -(bx i +a )]2是该坐标平面上所有直线与这些点的偏差的平方和中最小的答案 B解析 理解线性回归方程的真正含义.因为y -=b x -+a ,其中x -=1n (x 1+x 2+…+x n ),y -=1n (y 1+y 2+…+y n ),显然回归直线经过点(x -,y -).故A 是正确的.回归直线最能近似刻画点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的变化趋势,但并不一定经过某些点.故B 是错误的.对于C 、D 只需了解相应概念便会得出正确结论.5.下列叙述中:①变量间关系有函数关系,还有相关关系; ②回归函数即用函数关系近似地描述相互关系; ③∑ni =1x i=x 1+x 2+…+x n ; ④线性回归方程y ^=bx +a 中,b =∑ni =1(x i -x -)(y i -y -)∑ni =1 (x i -x -)2,a =y --b x -; ⑤线性回归方程一定可以近似地表示所有相关关系. 其中正确的有( ) A .①②③ B .①②④⑤ C .①②③④ D .③④⑤答案 C解析 利用直接法逐个判断可知,①②③④正确,而⑤线性回归方程可以近似地表示具有线性相关关系,而不能表示其他相关关系.6.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成份含量x 之间的相关关系,现取了8对观察值,计算得:∑8i =1x i =52,∑8i =1y i =228,∑8i =1x 2i=478,∑8i =1x i y i=1849,则y 与x 的回归方程是( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+22.47x D.y ^=11.47-2.62x 答案 A解析 把题目所给的数据代入公式分别求系数a 和b 即可. 二、填空题7.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.答案 0.254解析 本小题主要考查了利用回归直线方程,对数据进行估计.以x +1代x ,得0.254(x +1)+0.321,与0.254x +0.321相减可得,年饮食支出平均增加0.254万元.8.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如下:则x -=________,y =________,∑i =1x 2i =________,∑i =1x i y i=________,回归方程为________.答案 6.5 8 327 396 y ^=1.4x +0.571解析 根据公式代入即可求得,也可以利用计算器求得,x -=6.5,y -=8,∑6i =1x 2i =327,∑6i =1x i y i=396,回归方程为y ^=1.4x +0.571. 9.假设学生在初中的英语成绩和高一英语成绩是线性相关的.现有10名学生的初中英语成绩(x )和高一英语成绩(y )如下:答案 1.2182解析求斜率即求回归方程中的b,按照公式进行即可,即需要依次计算出x-=71,∑10i=1x2i=50520,y-=72.3,∑10i=1x i y i=51467,所以b=51467-10×71×72.350520-10×712≈1.2182,所以斜率为1.2182.三、解答题10.在10年期间,一城市居民的年收入与某种商品的销售额有如下数据:(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的线性回归方程.解(1)散点图如图.(2)由图可知,y与x线性相关,列表计算如下:所以b =15202.9-10×37.97×39.114663.67-10×37.972≈1.447,a =39.1-1.447×37.97≈-15.843,因此,所求线性回归方程为y =1.447x -15.843.11.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:时间 周一 周二 周三 周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克/立方米)7880848890(2)若周六同一时段车流量是200万辆,试根据(1)求出的线性回归方程,预测此时PM2.5的浓度为多少?解 (1)由条件可知,x -=15 i =15x i =5405=108,y -=15∑i =15y i =4205=84,∑i =15(x i -x -)(y i -y -)=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144, ∑i =15(x i -x -)2=(-8)2+(-6)2+02+62+82=200, b =∑i =15(x i -x -)(y i -y -)∑i =15(x i -x -)2=144200=0.72,a =y --b x -=84-0.72×108=6.24, 故y 关于x 的线性回归方程为y ^=0.72x +6.24. (2)当x =200时,y ^=0.72×200+6.24=150.24.所以可以预测此时PM2.5的浓度约为150.24微克/立方米. 12.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y =bx +a ; (2)利用(1)中所求出的直线方程预测该地2020年的粮食需求量.解 本题考查回归分析的基本思想及其初步应用、回归直线的意义和求法、数据处理的基本方法和能力,考查运用统计知识解决简单实际应用问题的能力.(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程.为此对数据预处理如下:对预处理后的数据,容易算得x -=0,y -=3.2,b =(-4)×(-21)+(-2)×(-11)+2×19+4×2942+22+22+42=26040=6.5, a =y --b x -=3.2.由上述计算结果,知所求回归直线方程为y ^-257=b (x -2014)+a =6.5(x -2014)+3.2,即y ^=6.5(x -2014)+260.2. ①(2)利用直线方程①,可预测2020年的粮食需求量为6.5×(2020-2014)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨).(未写近似值不扣分)13.日常生活中,某些东西所含的热量比较高,对我们的身体有一定的影响,下表给出了不同类型八种饼干的数据,第一列数据表示八种饼干各含热量的百分比,第二列数据表示顾客对八种饼干所给予分数(百分制).(1)(2)关于两个变量之间的关系,你能得出什么结论?(3)为什么人们更喜欢吃位于回归直线上方的饼干而不是下方的饼干? 解 (1)先把数据列成表:由上表分别计算x ,y 的平均数得x -=1878,y -=6098,代入公式⎩⎪⎨⎪⎧b =∑ni =1x i y i -n x -y -∑n i =1x 2i -n x - 2,a =y --b x -,得b =14426-8×1878×60984555-8×⎝ ⎛⎭⎪⎫18782=190.625183.875≈1.037, a =6098-1.036710×1878=76.125-24.2331≈51.9. 则回归直线方程y ^=1.037x +51.9.(2)回归直线方程y ^=1.037x +51.9中的回归系数b =1.037,它的意义是热量比每增加一个百分比,口味记录平均增加1.037分.(3)因为饼干所含有的热量百分比相同时,人们的满意率比较高;并且满意率相同时,位于回归直线上方的饼干所含热量百分比较低,人们比较喜欢吃热量百分比较低的食品.所以人们喜欢吃位于回归直线上方的饼干.。
2020高中数学复习学案 第9章 算法初步、统计与统计案例 4相关性、最小二乘估计与统计案例【要点梳理·夯实知识基础】1.相关性 (1)线性相关:若两个变量x 和y 的散点图中,所有点看上去都在 一条直线 附近波动,则称变量间是线性相关的.(2)非线性相关:若所有点看上去都在 某条曲线(不是一条直线) 附近波动,则称此相关为非线性相关的.2.最小二乘估计 (1)最小二乘法:如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n )可以用下面的表达式来刻画这些点与直线y =a +bx 的接近程度: [y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2 .使得上式达到 最小值 的直线y =a +bx 就是我们所要求的直线,这种方法称为最小二乘法.(2)线性回归方程:假设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),如果用x -表示x 1+x 2+…+x nn ,用y -表示y 1+y 2+…+y n n,则可以求得b =(x 1-x -)(y 1-y -)+(x 2-x -)(y 2-y -)+…+(x n -x -)(y n -y -)(x 1-x -)2+(x 2-x -)2+…+(x n-x -)2=x 1y 1+x 2y 2+…+x n y n -n x - y -x 21+x 22+…+x 2n-n x-2a =y --b x -.这样得到的直线方程y=a+bx称为线性回归方程,a、b是线性回归方程的系数.3.相关系数r(1)r=ni=1x i y i-n x-y-ni=1x2i-n x-2ni=1y2i-n y-2(2)当r>0时,称两个变量正相关;当r<0时,称两个变量负相关;当r=0时,称两个变量线性不相关.4.独立性检验独立性检验的相关概念(1)分类变量可用变量的不同“值”表示个体所属的不同类别的变量称为分类变量(2)2×2列联表假设有两个分类变量A和B,它们的值域分别为{A1,A2}和{B1,B2},其样本频数列联表(称为2×2列联表)为B1B2合计A1 a b a+bA2 c d c+d总计a+c b+d a+b+c+d(3)独立性检验利用随机变量=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.【学练结合】[思考辨析]判断下列说法是否正确,正确的在它后面的括号里打“√”,错误的打“×”.(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()(2)通过回归直线方程y=bx+a可以估计预报变量的取值和变化趋势.()(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.()(4)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.()答案:(1)√(2)√(3)×(4)√[小题查验]1.下列两个变量之间的关系是相关关系的是()A.正方体的棱长与体积B.单位面积的产量为常数时,土地面积与总产量C.日照时间与水稻的亩产量D.电压一定时,电流与电阻解析:C[A、B、D中两个变量间的关系都是确定的,所以是函数关系;C 中的两个变量间是相关关系,对于日照时间一定的水稻,仍可以有不同的亩产量,故选C.]2.(教材改编)为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力()A.回归分析B.均值与方差C.独立性检验D.概率解析:C[“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.]3.已知x、y取值如表:画散点图分析可知:y与x线性相关,且求得回归方程为y=x+1,则m的值(精确到0.1)为()A.1.5 B.1.6C.1.7 D.1.8解析:C [由题意知,x -=0+1+4+5+65=3.2,将x -=3.2代入回归方程yx +1可得y -=4.2,则4m =6.7,解得m =1.675,则精确到0.1后m 的值为1.7,故选C.]4.下面是一个2×2列联表则表中a ,b 处的值分别为 ________ .解析:因为a +21=73,所以a =52.又因为a +2=b ,所以b =54. 答案:52,545.自2018年起,我国将每年的农历的秋分设为“中国农民丰收节”.某农业主管部门调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到回归直线方程:y 0.254x +0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均约增加 ________ 万元.解析:由题意知回归直线的斜率为0.254,故家庭年收入每增加1万元,年饮食支出平均约增加0.254万元.答案:0.254【考点探究·突破重点难点】考点一 相关关系的判断(自主练透)[题组集训]1.下列四个散点图中,变量x 与y 之间具有负的线性相关关系的是( )解析:D[观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.]2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y与x负相关且y-2.756x+7.325;②y与x负相关且y=3.476x+5.648;③y与x正相关且y=-1.226x-6.578;④y与x正相关且y=8.967x+8.163.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④[思路引导]线性回归方程y=bx+a中,回归系数b的正、负说明两个变量成正、负相关关系.解析:B[根据题意,依次分析四个结论:对于①,线性回归方程符合负相关的特征,此结论正确;对于②,由线性回归方程知,y与x的关系是正相关,此结论错误;对于③,由线性回归方程知,y与x的关系是负相关,此结论错误;对于④,线性回归方程符合正相关的特征,此结论正确.故选B.]【解题反思】判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.(3)线性回归方程中:b>0时,正相关;b<0时,负相关.考点二回归方程的求法及回归分析(师生共研)[典例]如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008~2014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.【解题方法指导】1.回归直线方程中系数的两种求法(1)利用公式,求出回归系数b,a.(2)待定系数法:利用回归直线过样本点中心求系数.2.回归分析的两种策略(1)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.(2)利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数b.3.选择、填空中选一组数据的线性回归直线方程的方法(1)过定点(x-,y-),验证.(2)正、负相关看b^的符号.(3)代入数据看误差大小.[跟踪训练]基于移动互联网技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,带给人们新的出行体验.某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司最近六个月内的市场占有率进行了统计,结果如下表:月份2017.82017.92017.102017.112017.122018.1 月份代码x 12345 6市场占有111316152021 率y(%)(1)请在给出的坐标纸中作出散点图,并用相关系数说明能否用线性回归模型拟合市场占有率y与月份代码x之间的关系;(2)求y关于x的线性回归方程,并预测该公司2018年2月份的市场占有率.解:(1)作出散点图如下:∴两变量之间具有较强的线性相关关系,故可用线性回归模型拟合市场占有率y与月份代码x之间的关系.考点三独立性检验(师生共研)[典例](2018·全国Ⅲ卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m 不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(≥k)0.0500.0100.001k 3.841 6.63510.828[解](1)第二种生产方式的效率更高.理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟,因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80分钟;用第二种生产方式的工人完成生产任务所需平均时间低于80分钟.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.)(2)由茎叶图知,m=80.得2×2列联表为超过m 不超过m第一种生产方式15520第二种生产方式51520202040(3)=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=40(152-52)220×20×20×20=10>6.635.所以有99%的把握认为两种生产方式的效率有差异.【解题规律总结】利用统计量进行独立性检验的步骤(1)根据数据列出2×2列联表;(2)根据公式计算找观测值k;(3)比较观测值k与临界值表中相应的检验水平,作出统计推断.[跟踪训练]2018年是倡仪“一带一路”五周年,相关话题在网络上引起了网友们的高度关注,为此,21财经APP联合UC推出“一带一路”大数据微报告,在全国抽取的7亿网民(其中30%为高学历)中有2亿人(其中70%为高学历)对此关注.(1)根据以上统计数据填写下面2×2列联表;(2)根据列联表,用独立性检验的方法分析,能否有99%的把握认为“一带一路”的关注度与学历有关系?高学历网民非高学历网民总计 关注 不关注 总计附参考公式:=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d . P (≥k0)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001K 00.455 0.7081.3232.0722.7063.8415.0246.6357.87910.828解:(1)高学历网民 非高学历网民 总计 关注 1.4×108 0.6×108 2×108 不关注 0.7×108 4.3×108 5×108 总计2.1×1084.9×1087×108(2)=7×108×(1.4×108×4.3×108-0.6×108×0.7×108)22.1×108×4.9×108×2×108×5×108≈2.13×108,因为2.13×108>6.635,所以有99%的把握认为“一带一路”的关注度与学历有关系.2020高中数学复习学案 第9章 算法初步、统计与统计案例 4相关性、最小二乘估计与统计案例检测一、选择题1.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( D ) A .①② B .②③ C .③④D .①④解析:正相关指的是y 随x 的增大而增大,负相关指的是y 随x 的增大而减小,故不正确的为①④. 2.下列说法错误的是( B )A .自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在线性回归分析中,相关系数r 的值越大,变量间的相关性越强C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好 解析:根据相关关系的概念知A 正确;当r >0时,r 越大,相关性越强,当r <0时,r 越大,相当性越弱,故B 不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好,二是R 2越大,拟合效果越好,所以R 2为0.98的模型比R 2为0.80的模型拟合的效果好,C 、D 正确,故选B.3.为了解某商品销售量y (件)与其单价x (元)的关系,统计了(x ,y )的10组值,并画成散点图如图,则其回归方程可能是( B )A.y ^=-10x -198 B.y ^=-10x +198 C.y ^=10x +198D.y ^=10x -198解析:由图象可知回归直线方程的斜率小于零,截距大于零,故选B. 4.若一函数模型为y =ax 2+bx +c (a ≠0),为将y 转化为t 的回归直线方程,需作变换t =( C ) A .x 2 B .(x +a )2 C.⎝ ⎛⎭⎪⎫x +b 2a 2 D .以上都不对解析:y 关于t 的回归直线方程,实际上就是y 关于t 的一次函数.因为y =a ⎝ ⎛⎭⎪⎫x +b 2a 2+4ac -b 24a ,所以可知选项C 正确. 5.广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如表(单位:万元)由表可得回归方程为y =10.2x +a ,据此模拟,预测广告费为10万元时的销售额约为( C )A .101.2B .108.8C .111.2D .118.2解析:由题意得:x =4,y =50,∴50=4×10.2+a ^,解得a ^=9.2,∴回归直线方程为y ^=10.2x +9.2,∴当x =10时,y ^=10.2×10+9.2=111.2,故选C. 6.某考察团对10个城市的职工人均工资x (千元)与居民人均消费y (千元)进行调查统计,得出y 与x 具有线性相关关系,且回归方程为y ^=0.6x +1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( D ) A .66% B .67% C .79%D .84%解析:因为y 与x 具有线性相关关系,满足回归方程y ^=0.6x +1.2,该城市职工人均工资为x =5,所以可以估计该城市的职工人均消费水平y =0.6×5+1.2=4.2,所以可以估计该城市人均消费额占人均工资收入的百分比为4.25=84%. 7.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K 2=(a +b )(c +d )(a +c )(b +d ),得K 2=100×(45×22-20×13)265×35×58×42≈9.616.参照下表,A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C .有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关”解析:∵K 2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”. 二、填空题8.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表:由表中数据得线性回归直线方程y =b x +a 中的b =-2,预测当气温为-4 ℃时,用电量为68度.解析:回归直线过点(x ,y ), 根据题意得x =18+13+10+(-1)4=10,y =24+34+38+644=40,将(10,40)代入y ^=-2x +a ^,解得a ^=60,则y ^=-2x +60,当x =-4时,y ^=(-2)×(-4)+60=68,即当气温为-4 ℃时,用电量约为68度.9.为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的2×2列联表如下:生产能手非生产能手总计25周岁以上25356025周岁以下103040 总计3565100解析:由2×2列联表可知,K2=100×(25×30-10×35)2≈2.93,40×60×35×65因为2.93>2.706,所以有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.三、解答题10.某公司为了了解广告投入对销售收益的影响,在若干地区各投入万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.(1)根据频率分布直方图计算图中各小长方形的宽度;(2)估计该公司投入万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入x(单位:万元)1234 5栏,并计算y 关于x 的线性回归方程.解:(1)设各小长方形的宽度为m ,由频率分布直方图中各小长方形面积总和为1,可知(0.08+0.1+0.14+0.12+0.04+0.02)·m =0.5m =1,故m =2.(2)由(1)知,各分组依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],其中点值分别为1,3,5,7,9,11,对应的频率分别为0.16,0.20, 0.28, 0.24,0.08,0.04,故可估计平均值为1×0.16+3×0.2+5×0.28+7×0.24+9×0.08+11×0.04=5.(3)空白栏中填5. 由题意可知,x =1+2+3+4+55=3,y =2+3+2+5+75=3.8,∑i =15x i y i =1×2+2×3+3×2+4×5+5×7=69,∑i =15x 2i =12+22+32+42+52=55. 根据公式可求得b ^=69-5×3×3.855-5×32=1210=1.2,a ^=3.8-1.2×3=0.2,即线性回归方程为y ^=1.2x +0.2.11.已知某产品连续4个月的广告费用为x i (i =1,2,3,4)千元,销售额为y i (i =1,2,3,4)万元,经过对这些数据的处理,得到如下数据信息:①x 1+x 2+x 3+x 4=18,y 1+y 2+y 3+y 4=14;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y ^=b ^x +a ^中的b ^=0.8(用最小二乘法求得).那么,当广告费用为6千元时,可预测销售额约为( B ) A .3.5万元 B .4.7万元 C .4.9万元D .6.5万元解析:依题意得x =4.5,y =3.5,由回归直线必过样本中心点得a =3.5-0.8×4.5=-0.1.当x =6时,y ^=0.8×6-0.1=4.7.12.近代统计学的发展起源于二十世纪初,它是在概率论的基础上发展起来的,统计性质的工作则可以追溯到远古的“结绳记事”和《二十四史》中大量的关于我国人口、钱粮、水文、天文、地震等资料的记录.近几年,雾霾来袭,对某市该年11月份的天气情况进行统计,结果如下表:表一日期12345678910 天气晴霾霾阴霾霾阴霾霾霾日期11121314151617181920 天气阴晴霾霾霾霾霾霾阴晴日期21222324252627282930 天气霾霾晴霾晴霾霾霾晴霾一个调查机构对比以上两年11月份(该年不限行30天、次年限行30天,共60天)的调查结果:表二不限行限行总计没有雾霾a有雾霾b总计303060(1)概率;(2)请用统计学原理计算,若没有90%的把握认为雾霾与限行有关系,则限行时有多少天没有雾霾?P(K2≥k0)0.1000.0500.0100.001k0 2.706 3.841 6.63510.828解:(a)a=10,b=20,所求概率P=630=15.(2)设限行时有x天没有雾霾,则有雾霾的天数为30-x,由题意得K2的观测值k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)≤3,代入数据化简得21x2-440x+1 500≤0,x∈[0,30],x∈N*,即(7x-30)(3x-50)≤0,解得307≤x≤503,所以5≤x≤16,且x∈N*,所以若没有90%的把握认为雾霾与限行有关系,则限行时有5~16天没有雾霾.尖子生小题库——供重点班学生使用,普通班学生慎用13.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x (万元)和销售量y (万台)的数据如下:(2)若用y =c +d x 模型拟合y 与x 的关系,可得回归方程y ^=1.63+0.99x ,经计算线性回归模型和该模型的R 2分别约为0.75和0.88,请用R 2说明选择哪个回归模型更好;(3)已知利润z 与x ,y 的关系为z =200y -x .根据(2)的结果回答下列问题: ①广告费x =20时,销售量及利润的预报值是多少? ②广告费x 为何值时,利润的预报值最大?(精确到0.01)参考公式:回归直线y ^=a ^+b ^x 的斜率和截距的最小二乘估计分别为b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b ^x .参考数据:5≈2.24.解:(1)∵x =8,y =4.2,∑i =17x i y i =279.4,∑i =17x 2i =708,∴b ^=∑i =17x i y i -7x y∑i =17x 2i -7x 2=279.4-7×8×4.2708-7×82=0.17,a ^=y -b ^x =4.2-0.17×8=2.84, ∴y 关于x 的线性回归方程为y ^=0.17x +2.84.(2)∵0.75<0.88且R 2越大,反映残差平方和越小,模型的拟合效果越好,∴选用y ^=1.63+0.99x 更好.(3)由(2)知,①当x =20时,销售量的预报值y ^=1.63+0.9920≈6.07(万台),利润的预报值z=200×(1.63+0.9920)-20≈1 193.04(万元).②z=200(1.63+0.99x)-x=-x+198x+326=-(x)2+198x+326=-(x-99)2+10 127,∴当x=99,即x=9 801时,利润的预报值最大,故广告费为9 801万元时,利润的预报值最大.。