北师大版选修1-2高中数学第1章《统计案例》1.1回归分析与相关系数习题导学案
- 格式:doc
- 大小:131.00 KB
- 文档页数:3
探究案学始于疑----我思考,我收获二、合作探究(大约15分钟,包括小组讨论与展示)探究一:相关性检验例1:假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如右上表的统计资料。
用散点图及相关系数两种方法判断y 与x 的相关性(参考数据:5521190,112.3i i i i i xx y ====∑∑)探究二:线性回归分析例2:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据。
(1)试对x 与Y 是否线性相关进行相关性检验; (2)求出线性回归直线方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技使用年限x 2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0 x 3 4 5 6 y 2.5 3 4 4.5改前降低多少吨标准煤?【探究小结】.利用散点图可粗略判断两个变量是否具有相关关系,但在作图时,由于存在误差,有时又很难说这些点是不是分布在一条直线附近,此时就必须利用样本相关系数对其进行相关性检验。
【当堂检测】(大约10分钟)1. 变量X 与Y 相对应的一组数据为(10,1)(11.3,2)(11.8,3)(12.5,4)(13,5);变量U 与V 相对应的一组数据为(10,5)(11.3,4)(11.8,3)(12.5,2)(13,1),1r 表示变量X 与Y 之间的线性相关系数,2r 表示变量U 与V 之间的线性相关系数,则( )A.012<<r r B.120r r << C.120r r <<D.12r r = ★★2某商店经营一批进价为每件4元的商品,在市场调查时得到,此商品的销售价格x 与日销售量y 之间的一组数据满足:5522116.57()5()26i i i i X Y X X Y Y ====-=-=∑∑,,,,()51()11i i i X X Y Y =--=-∑ 则x,y 之间的相关系数为 ;当销售价格x 定为(取整数) 时,日利润最大。
回归分析题目击破
一、基本概念
函数关系是一种确定关系,而相关关系是一种非确定关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
例下列变量之间的关系是相关关系的是.
()正方形的边长与面积之间的关系;
()水稻产量与施肥量之间的关系;
()人的身高与年龄之间的关系;
()降雪量与交通事故发生率之间的关系.
分析两变量之间的关系有两种:函数关系和带有随机性的相关关系.
解析()是函数关系;()不是严格的函数关系,但是具有相关性,因而是相关关系;()既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;()降雪量与交通事故发生率之间具有相关关系.
答案()()
点评该例主要考查对变量相关关系概念的掌握.
二、线性回归方程
设与是具有相关关系的两个变量,且相应于个观测值的个点大致分布在一条直线的附近,这条直线就叫作回归直线.
例假设关于某设备的使用年限(年)和所支出的维修费用(万元)有如下的统计资料:
使用年限
维修费用
若由资料知对呈线性相关关系,试求:
()回归方程=+;
()估计使用年限年时,维修费用是多少?
分析因为对呈线性相关关系,所以可以用线性相关的方法解决问题.
解()制表
合计
=,=,=,=
于是有==,
=-=-×=.
∴回归方程为=+.
()当=时,=×+=(万元),。
庐山区一中高效课堂导学案北师大版数学选修1-2 第一章 统计案例 §1回归分析§1.1.1 回归分析(总第1课时)主编:查道强 审核:柯愈勇 审批:【预习案】学习目标:1、知识与技能:通过对统计案例的探究,会对两个随机变量进行线性回归分析。
2、过程与方法:学生通过实例分析学习最小二乘法,及其求解回归方程。
3、情感态度与价值观:(1)进一步树立数形结合的思想。
(2)进一步体会构建模型的作用。
教学重点:散点图的画法,回归直线方程的求解方法。
教学难点:回归直线方程的求解方法。
使用说明&学法指导:1、用15分钟左右时间,阅读探究课本P1-P6的内容,熟记基础知识,自主高效学习,提升自己的阅读理解能力。
2、完成教材助读设置的问题,然后结合课本的基础知识例题,完成预习自测题。
3、将预习中不能解决的问题标记出来,并写到后面“我的疑问”处。
(一)相关知识——知识储备,学以致用请同学们回顾前面所学知识对下面的问题做出回答:问题1:现实生活中两个变量间的关系有哪些呢?问题2:相关关系与函数关系有怎样的不同?问题3:对于线性相关的两个变量用什么方法来刻划之间的关系呢?问题4:你知道最小二乘法吗?(二)教材助读——精心阅读,仔细思考1、必修课程中,我们已经会用最小二乘法求变量之间的线性回归方程。
假设样本点为112233(,),(,),(,),(,)n n x y x y x y x y …,,设线性回归方程为 ,我们的想法就是要求a,b ,使这n 个点与直线 的“距离”平方之和 。
2、在统计中,我们使用 表示一组数据123,,,,n x x x x …的平均值,即 。
为了简化表示,我们引进求和符号,记作 。
3、1()n ii x x =-=∑ 。
1()ni i y y =-=∑ 。
4、____________________________________xx xy yy l l l ===5、线性回归方程y a bx =+,其中b=a=(三)预习自测——自我检测,自我完善自测题体现一定的基础性,又有一定的思维含量,只有“细心才对,思考才会”。
........试题试卷 第一章 统计案例§1.1.1回归分析预习案【学习目标】1. 理解并掌握用回归分析处理两个变量之间的不确定关系的统计方法。
2. 了解回归分析的意义。
3. 以极度的热情,自动自发、如痴如醉,投入到学习中,充分享受学习的快乐。
【使用说明与学法指导】1. 课前(前一天晚自习)自学课本并完成导学案,要求限时完成,书写规范;2. 带“★”的C 层可以选做,带“★★”的B,C 层可以选做.3. 自主探究先行一步,遇到难以理解的地方先做好标记,然后再通过小组讨论解决,如果小组不能解决的问题第二天在课堂上讨论解决。
一、预习自学: 基础知识梳理 问题导引知识点一:两个变量的关系与回归分析函数关系是一种 关系,而相关关系是一种 关系。
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
知识点二:线性回归方程1.求线性回归直线方程的步骤:(1) 作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图,从散点图中我们可以看出样本点是否呈条状分布,来判断两个量是否具有线性相关关系;(2) 求回归系数a ,b ,其中∑∑∑∑====--=---=n i i n i i i n i i n i i i xn x y x n y x x xy y x x b 121121)())((,x b y a -= (3) 写出回归直线方程a bx y +=,并用回归直线方程进行预测。
2. 回归直线a bx y +=过点),(y x ,这个点称为样本的中心.【预习自测】(大约10分钟,包括预习自学)1. 设有一个回归方程为22.5y x ∧=-,当变量x 增加一个单位时,( ) A 、y 平均增加2.5个单位 B 、y 平均增加2个单位C 、y 平均减少2.5个单位D 、y 平均减少2个单位2. 在一次试验中,测得),(y x 的四组数据值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的线性回归方程为 ( ) A.1+=x y B.2+=x y C.12+=x y D.1-=x y3.为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )A. 1l 与2l 一定平行B. 1l 与2l 相交于点),(y xC.1l 与2l 重合D. 无法判断1l 和2l 是否相交【我的疑惑】(将在预习中不能理解的问题写下来,供课堂上处理)1.2.3.。
新课程标准数学选修1—2第一章课后习题解答第一章统计案例1.1回归分析的基本思想及其初步应用练习(P8)1、画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.说明:学生在对常用的函数图象比较了解的情况下,通过观察散点图可以判断两个变量的关系更近似于哪种函数.2、分析残差可以帮助我们解决以下两个问题:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.(2)分析残差图可以发现模型选择是否合适.说明:分析残差是回归诊断的一部分,可以帮助我们发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等. 本题只要求学生能回答上面两点即可,主要让学生体会残差和残差图可以用于判断模型的拟合效果.3、(1)解释变量和预报变量的关系式线性函数关系.R=.(2)21说明:如果所有的样本点都在一条直线上,建立的线性回归模型一定是该直线,所以每个=+,没有随机误差项,是严样本点的残差均为0,残差平方和也为0,即此时的模型为y bx aR=.格的一次函数关系. 通过计算可得21习题1.1 (P9)1、(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈线性关系.y表示GDP值,t表示年份. 根据截距和斜率的最小二乘计算公式,得(2)用tˆ14292537.729a≈-,ˆ7191.969b≈从而得线性回归方程ˆ7191.96914292537.729=-.y t残差计算结果见下表.GDP 值与年份线性拟合残差表(年实际GDP 值为117251.9,所以预报与实际相差4275.540-.(4)上面建立的回归方程的20.974R =,说明年份能够解释约97%的GDP 值变化,因此所建立的模型能够很好地刻画GDP 和年份的关系.说明:关于2003年的GDP 值的来源,不同的渠道可能会有所不同.2、说明:本题的结果与具体的数据有关,所以答案不唯一.3、由表中数据得散点图如下:从散点图中可以看出,震级x 与大于或等于该震级的地震数N 之间不呈线性相关关系,随着x 的减少,所考察的地震数N 近似地以指数形式增长. 做变换lg y N =,得到的数据如下表所示.x 和y 的散点图如下:从这个散点图中可以看出x 和y 之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系. 根据截距和斜率的最小二乘计算公式,得ˆ 6.704a≈,ˆ0.741b ≈-, 故线性回归方程为 ˆ0.741 6.704y x =-+. 20.997R ≈,说明x 可以解释y 的99.7%的变化.因此,可以用回归方程 0.741 6.704ˆ10x N-+= 描述x 和N 之间的关系. 1.2独立性检验的基本思想及其初步应用练习(P15)列联表的条形图如图所示.由图及表直观判断,好像“成绩优秀与班级有关系”. 因为2K 的观测值0.653 6.635k ≈<,由教科书中表1-11克重,在犯错误的概率不超过0.01的前提下,不能认为“成绩与班级有关系”.说明:(1)教师应要求学生画出等高条形图后,从图形上判断两个分类变量之间是否有关系. 这里通过图形的直观感觉的结果可能会出错.(2)本题与例题不同,本题计算得到的2K 的观测值比较小,所以没有理由说明“成绩优秀与班级有关系”. 这与反证法也有类似的地方,在使用反证法证明结论时,假设结论不成立的条件下如果没有推出矛盾,并不能说明结论成立也不能说明结论不成立. 在独立性检验中,没有推出小概率事件发生类似于反证法中没有推出矛盾.习题1.2 (P16)1、假设“服药与患病之间没有关系”,则2K 的值应该比较小;如果2K 的值很大,则说明很可能“服药与患病之间没有关系”. 由列联表中数据可得2K 的观测值 6.110 5.024k ≈>,而由教科书表1-11,得2( 5.024)0.025P K ≥≈,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”. 又因为服药群体中患病的频率0.182小于没有服药群体中患病的频率0.400,所以“服药与患病之间关系”可以解释为药物对于疾病有预防作用. 因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.说明:仿照例1,学生很容易完成此题,但希望学生能理解独立性检验在这里的具体含义,即“服药与患病之间关系”可以解释为“药物对于疾病有预防作用”.2、如果“性别与读营养说明之间没有关系”,由题目中所给数据计算,得2K 的观测值为8.416k ≈,而由教科书中表1-11知2(7.879)0.005P K ≥≈,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”.3、说明:需要收集数据,所有没有统一答案. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.4、说明:需要从媒体上收集数据,学生关心的问题不同,收集的数据会不同. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.第一章 复习参考题A 组(P19)根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.由最小二乘法的计算公式,得 2095141.503a ≈-,1110.903b ≈,则线性回归方程为 ˆ1110.9032095141.503yx =-. 由2R 的计算公式,得 20.994R ≈,明线性回归模型对数据的拟合效果很好.根据回归方程,,预计2003年末中国人口总数约为129997万人,而实际情况为129227万人,预测误差为770万人;预计2004年末中国人口总数约为131108万人,而实际情况为129988万人,预测误差为1120万人.说明:数据来源为《中国统计年鉴》(2003). 由于人数为整数,所以预测的数据经过四舍五入的取整运算.2、(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:由于散点图中的样本点基本上在一个带形区域内分布,猜想销售总额与利润之间呈现线性相关关系.(2)由最小二乘法的计算公式,得 ˆ1334.5a≈,ˆ0.026b ≈, 则线性回归方程为 ˆ0.0261334.5yx =+ 其残差值计算结果见下表:(3)对于(2)中所建立的线性回归方程,20.457R ≈,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系. 说明:此题也可以建立对数模型或二次回归模型等,只要计算和分析合理,就算正确.3、由所给数据计算得2K 的观测值为 3.689k ≈,而由教科书中表1-11知2( 2.706)0.10P K ≥=所以在犯错误的概率不超过0.10的前提下认为“婴儿的性别与出生的时间有关系”.第一章 复习参考题B 组(P19)1、因为 21(,)()ni i i Q a b y a bx ==--∑21(()())n i i i y bx y bx a y bx ==--+--+∑ 2211()()n n i i i i y bx y bx a y bx ===--++-+∑∑12()()ni i i y bx y bx a y bx =---+-+∑ 并且221()()n i a y bx n a y bx =-+=-+∑,12()()n i i i y bx y bx a y bx =--+-+∑ 1()(())ni i i a y bx y bx ny nbx ==-+--+∑ ()()0a y b x n y n b xn y n b x=-+--+= 所以 221(,)()()ni i i Q a b y bx y bx n a y bx ==--++-+∑.考察上面的等式,等号右边的求和号中不包含a ,而另外一项非负,所以ˆa和ˆb 必然使得等号右边的最后一项达到最小值,即 ˆˆ0ay bx -+=, 即ˆˆy a bx =+. 2、总偏差平方和21()n i i y y =-∑表示总的效应,即因变量的变化效应;残差平方和21ˆ()ni i y y =-∑表示随机误差的效应,即随机误差的变化效应;回归平方和21ˆ()ni yy =-∑表示表示变量的效应,即自变量的变化效应. 等式 222111ˆˆ()()()n n n i ii i i y y y y y y ===-=-+-∑∑∑ 表示因变量的变化总效应等于随机误差的变化效应与自变量的变化效应之和.3、说明:该题主要是考察学生应用回归分析模型解决实际问题的能力,解答应该包括如何获取数据,如何根据散点图寻找合适的模型去拟合数据,以及所得结果的解释三方面的内容.。
1回归分析回归分析1.线性回归方程设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),线性回归方程为y =a +bx . 则l xx =∑i =1n(x i -x -)2=∑i =1nx 2i -n x 2,l xy =∑i =1n (x i -x -)(y i -y -)=∑i =1nx i y i -n x - y -,l yy =∑i =1n (y i -y -)2=∑i =1ny 2i -n y -2,b =l xy l xx=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b x -.2.相关系数计算r =l xyl xx l yy=∑i =1nx i -xy i -y∑i =1nx i -x2∑i =1ny i -y2=∑i=1nx iy i -n x y∑i=1nx2i-n x2∑i=1ny2i-n y2性质范围r∈[-1,1]线性相关程度(1)|r|越大,线性相关程度越高;(2)|r|越接近于0,线性相关程度越低;(3)当r>0时,两个变量正相关;(4)当r<0时,两个变量负相关;(5)当r=0时,两个变量线性不相关1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线y=a+bx过点(x,y),其中x=1n∑i=1nx i,y=1n∑i=1ny i.3.相关系数的绝对值越接近于1,相关性越强;相关系数越接近于0,相关性越弱.线性回归方程[例1] )有如下的统计资料:使用年限x/年2345 6维修费用y/万元 2.2 3.8 5.5 6.57.0若y对x(1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程;(3)预测使用年限为10年时,维修费用是多少.[思路点拨] 先利用散点图分析设备使用年限与所支出的维修费用是否线性相关,若相关再利用线性回归模型求解.[精解详析] (1)作出散点图如图所示.(2)由表知,x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+75=5,∑i =15x i y i =2×2.2+3×3.8+4×5.5+5×6.5+6×7=112.3,∑i =15x 2i =22+32+42+52+62=90, 所以b =∑i =15x i y i -n x y∑i =15x 2i -n x 2=112.3-5×4×590-5×42=1.23, a =y -b x =5-1.23×4=0.08.所以线性回归方程为y =1.23x +0.08.(3)根据(2)中的线性回归方程,可预测使用年限为10年时,维修费用约为y =1.23×10+0.08=12.38万元.[一点通] 求回归直线方程的基本步骤:1.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.4解析:选A 依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5)代入A,B得A正确.2.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:y=0.254x+0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x+1代x,得y=0.254(x+1)+0.321,与y=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2543.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据x 681012y 235 6(1)(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.解:(1)散点图如图:(2)∑i=1nx i y i=6×2+8×3+10×5+12×6=158,x=6+8+10+124=9,y=2+3+5+64=4,∑i=1nx2i=62+82+102+122=344.b=158-4×9×4344-4×92=1420=0.7,a=y-b^x=4-0.7×9=-2.3,故线性回归方程为y=0.7x-2.3.(3)由(2)中线性回归方程知,当x=9时,y=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.相关系数[例2] 关于两个变量x和y的7组数据如下表所示:x 21232527293235y 711212466115325试判断x与y之间是否有线性相关关系.[思路点拨] 首先求出r的值,再判断相关关系.[精解详析] x-=17×(21+23+25+27+29+32+35)≈27.4,y-=17×(7+11+21+24+66+115+325)≈81.3,∑i=17x2i=212+232+252+272+292+322+352=5 414,∑i=17x i y i=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,∑i=17y2i=72+112+212+242+662+1152+3252=124 393,∴r=∑i=17x i y i-7x-y-∑i=17x2i-7x-2∑i=17y2i-7y-2=18 542-7×27.4×81.35 414-7×27.42×124 393-7×81.32≈0.837 5.由于r≈0.837 5与1比较接近,∴x与y具有线性相关关系.[一点通] 回归分析是定义在具有相关关系的两个变量的基础上的,对于相关关系不明确的两个变量,可先作散点图,由图粗略地分析它们是否具有相关关系,在此基础上,求其回归方程,并作回归分析.4.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:①n =7,r =0.953 3;②n =15,r =0.301 2; ③n =17,r =0.499 1;④n =3,r =0.995 0. 则变量y 和x 线性相关程度最高的两组是( ) A .①和② B .①和④ C .②和④D .③和④解析:选B 相关系数r 的绝对值越大,变量x ,y 的线性相关程度越高,故选B. 5.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:选A 观察散点图可知r 1>0,r 3>0,r 2<0,r 4<0,根据散点的分散程度反映出的相关性的强弱,可知r 2<r 4<0<r 3<r 1.6.在研究硝酸钠的可溶性程度时,在不同的温度(单位:℃)下观测它在水中的溶解度,得观测结果如下:温度x 0 10 20 50 70 溶解度y66.776.085.0112.3128.0解:∑5i =1x i =150,∑5i =1y i =468,∑5i =1x 2i =7 900,∑5i =1y 2i =46 445.18, x =30,y =93.6,∑5i =1x i y i =17 035, r =∑5i =1x i y i -5x y∑5i =1x 2i -5x 2∑5i =1y 2i -5y2=17 035-5×30×93.67 900-5×302×46 445.18-5×93.62≈0.999 6.可线性化的回归分析问题[例3] 为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:时间x/天12345 6繁殖个数y 612254995190(1)作出这些数据的散点图;(2)求y与x之间的回归方程.[思路点拨] 作出数据的散点图,选择合适的函数模型转化为线性模型.[精解详析] (1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y=c1e c2x图像的周围,于是令z=ln y,则x 12345 6z 1.79 2.48 3.22 3.89 4.55 5.25则有y=e0.69x+1.112.[一点通] 可线性化的回归方程的求解步骤:7.下列数据x,y符合哪一种函数模型( )x 12345678910y 2 2.693 3.38 3.6 3.84 4.08 4.2 4.3x B.y=2e xA.y=2+3。
高中数学 第1章《统计案例》1.2.1条件概率与独立事件习题导学案北师大版选修1-2 学习目标 1.理解条件概率和独立事件的概念. 2.会计算简单的条件概率和独立事件同时发生的概率.学习过程一、基础过关3. 某地一农业科技实验站,对一批新水稻种子进行试验,已知这批水稻种子的发芽率为0.8,出芽后的幼苗成活率为0.9,在这批水稻种子中,随机地抽取一粒,则这粒水稻种子能成长为幼苗的概率为( ) A .0.02B .0.08C .0.18D .0.724. 甲,乙,丙3人投篮,投进的概率分别是13,25,12.现3人各投篮1次,求3人都没有投进的概率为( ) A.115 B.215 C.15D.110 5. 如图,已知电路中4个开关闭合的概率都是12,且是互相独立的,灯亮 的概率为 ( )A.316B.34C.1316D.146. 设某种动物由出生算起活到20岁的概率为0.8,活到25岁的概率为0.4,现有一个20岁的这种动物,则它能活到25岁的概率是________.二、能力提升7. 在甲盒内的200个螺杆中有160个是A 型,在乙盒内的240个螺母中有180个是A 型.若从甲、乙两盒内各取一个,则能配在A 型螺栓的概率为________.8. 甲袋中有8个白球,4个红球;乙袋中有6个白球,6个红球,从每袋中任取一个球,则取得同色球的概率为________.9. 抛掷红、蓝两颗骰子,设事件A 为“蓝色骰子的点数为3或6”,事件B 为“两颗骰子的点数之和大于8”.(1)求P (A ),P (B ),P (AB );(2)当已知蓝色骰子的点数为3或6时,问两颗骰子的点数之和大于8的概率为多少?10.某种电路开关闭合后,会出现红灯或绿灯闪烁,已知开关第一次闭合后出现红灯的概率是12,两次闭合都出现红灯的概率为16.求在第一次闭合出现红灯的条件下第二次出现红灯的概率.。
高中数学 第一章 统计案例 1.1.2 相关系数同步测控 北师大版选修1-2我夯基 我达标1.下列结论正确的是( ) ①函数关系是一种确定性关系 ②相关关系是一种非确定性关系③回归关系是具有函数关系的两个变量进行统计分析的一种方法④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法A.①②B.①②③C.①②④D.①②③④ 解析:理解有关概念. 答案:C2.已知回归直线的斜率的估计值是 1.23,样本的平均值为x =4,y =5,则回归直线的方程是( )A.y=1.23x+4B.y=1.23x+5C.y=1.23x+0.08D.y=0.08x+1.23解析:回归直线都过点(x ,y ),即(4,5)点斜率为1.23.答案:C3.若回归直线方程中的回归系数b=0,则相关系数r 等于( )A.1B.-1C.0D.无法确定 解析:∵b=xxxy l l =0,∴l xy =0.而r=yyxx xy l l l =0.答案:C4.回归分析中,相关系数|r|值越大,则误差Q(a,b)应…( )A.越小B.越大C.可能大也可能小D.以上都不对解析:Q(a,b)=l yy (1-r 2)>0,∴|r|越大,Q(a,b)越小. 答案:A5.对于相关系数r,下列说法正确的是( ) A.|r|越大,相关程度越小 B.|r|越小,相关程度越大C.|r|越大,相关程度越小,|r|越小,相关程度越大D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小解析:Q(a,b)=l yy (1-r 2)>0,∴|r|≤1,|r|越接近于1,Q(a,b)越接近于0,相关程度越大. 答案:D则两个变量线性相关程度( )A.很强B.很弱C.无相关D.不确定解析:∑=51i ix=75,∑=51i iy=543,∑=512i ix=1 375,∑=51i ii yx =8 285,∑=512i iy=59 051,x =15,y =108.6,r=∑∑∑===---5122251251)(5)(55i i i i i iiy y x x yx yx =226.10855905115513756.1081558285⨯-⨯⨯-⨯⨯-=0.982 6,相关程度很强. 答案:A7.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中溶解度,得观测结果如下:则回归直线的线性相关系数为______________. 解析:∑=51i ix=150,∑=51i iy=468,∑=512i ix=7 900,∑=512i iy=46 471.9,x =30,y =93.6,∑=51i i i y x =17 035,r=∑∑∑===---5122512251)(5)(55i i i i i iiy y x x yx yx =226.9359.46471305790006.9330517035⨯-⨯⨯-⨯⨯-=0.9946.答案:0.994 68.|r|越接近于1,相关性越______________.解析:Q(a,b)=l yy (1-r 2)>0,|r|越接近于1,Q(a,b)越接近于0,相关性越大. 答案:大我综合 我发展则回归方程为______________,相关系数为______________. 解析:∑=81i i x =1 322,∑=81i i y =436,∑=812i i x =218 774,∑=812i i y =24 116,∑=81i ixy i =72 315,x =165.25,y =54.5,b=228128125.16582187745.5425.165872315)(88⨯-⨯⨯-=--∑∑==x xyx yx i ii ii=5.313266=0.848, a=y -b x =54.5-0.848×165.25=-85.632, ∴回归方程为y=-85.632+0.848x,r=2812812281)(8)(88y yx xyx yx i ii ii ii---∑∑∑====225.5482411625.16582187745.5425.165872315⨯-⨯⨯-⨯⨯-=0.803.答案:y=-85.632+0.848x 0.80310.一家工厂对职工进行技能检查,收集数据如下:两变量的回归方程为______________,相关系数r=______________. 解析:∑=81i ix=360,∑=81i iy=370,∑=81i ix2=20 400,∑=81i iy2=20 040,∑=81i ixy i =20 080,x =45,y =46.25,b=281281)(88x xyx yx i ii ii∑∑==--=24582040025.4645820080⨯-⨯⨯-=42003430=0.816 7,a=y -b x =46.25-0.816 7×45=9.5,∴回归方程为y=9.5+0.816 7x,r=2812812281)(8)(88y yx xyx yx i ii ii ii---∑∑∑====2225.468200404582040025.4645820080⨯-⨯⨯-⨯⨯-=0.9782.答案:y=9.5+0.816 7x 0.978 211.假定某企业的某种产品产量与单位成本数据如下:(2)指出产量每增加1 000件时,单位成本下降多少?(3)假定产量为6 000件时,单位成本是多少?单位成本为70元时,产量应为多少? 解析:根据有关公式计算. 解:(1)∑=61i ix=21,∑=61i iy=426,∑=612i ix=79,∑=612i iy=30 268,∑=61i ii yx =1 481,x =3.5,y =71,b=∑∑==--612261)(66i ii iix xyx yx =25.3679715.361481⨯-⨯⨯-=5.510-=-1.818, a=y -b x =71+1.818×3.5=77.363, ∴回归方程为y=77.363-1.818x,r=∑∑∑===---6122261261)(6)(66i ii ii iiy yx xyx yx =22716302685.3679715.361481⨯-⨯⨯-⨯⨯-=225.510⨯-=1110-=-0.91. (2)产量每增加1 000件时,单位成本下降1.818元. (3)当x=6时,y=66.455元;当y=70时,x=4.05(千件)=4 050(件).答:产量为6 000件时,单位成本是66.455元/件,单位成本为70元时,产量应为4 050件. 12.炼铝厂测得所产铸模用的铝的硬度x 与抗张强度y 的数据如下:求y 对x 的线性回归方程及相关系数r. 解析:将数据代入公式计算. 解:∑=101i ix=670,∑=101i iy=3 150,∑=1012i ix=46 004,∑=1012i iy=1 000 120,∑=101i ii yx =213 232,x =67,y =315,b=∑∑==--10122101)(1010i ii iix xyx yx =26710460043156710213232⨯-⨯⨯- =11142182=1.958 7,a=y -b x =315-1.958 7×67=183.767 1, y 对x 的线性回归方程为y=183.767 1+1.958 7x,r=∑∑∑===---1012221012101)(10)(1010i i i i i iiy y x x yx yx =223151010001206710460043156710213232⨯-⨯⨯-⨯⨯-=787011142182⨯=0.737.13.电梯的使用年限x 和所支出的维修费用y(万元)如下,若使用年限x 和所支出的维修费用若由资料知y 对x 呈线性相关关系,试求:(1)线性回归方程y=bx+a 的回归系数a 、b; (2)估计使用年限为10年时,维修费用是多少? (3)求线性相关系数r. 解析:代入公式计算. 解:列表:∴x =4,y =5, (1)b=103.1245905453.1122=⨯-⨯⨯-=1.23, a=y -b x =5-1.23×4=0.08.∴回归直线方程为y=1.23x+0.08.(2)当x=10时,y=1.23×10+0.08=12.38(万元),估计使用10年时,维修费用是12.38万元. (3)r=225578.14045905453.112⨯-⨯⨯-⨯⨯-=78.15103.12⨯=0.979,x 、y 有很强的线性关系.14.某工厂前10个月份的产量与生产费用如下表: (1)求回归直线方程;(2)估计当生产200千件时的生产费用;(3)计算x 与y 的相关系数. 解析:根据公式计算. 解:(1)∑=101i ix=778,∑=101i iy=1 657,∴x =77.8,y =165.7,∑=1012i ix=71 062,∑=1012i iy=277 119,∑=101i ii yx =133 100,b=∑∑==--10122101)(1010i ii iix xyx yx =28.7710710627.1658.7710133100⨯-⨯⨯-=6.105334.4185=0.4, a=y -b x =165.7-0.4×77.8=134.787. ∴回归方程为y=134.787+0.4x.(2)当x=200时,y=214.787(千元),(3)r=∑∑∑===---1012210122101)(10)(1010i ii ii iiy yx xyx yx =227.165102771198.7710710627.1658.7710133100⨯-⨯⨯-⨯⨯-=1.25546.105334.4185⨯=0.81,x 、y 之间有较强的线性关系.我创新 我超越15.为了研究三月下旬的平均气温x(单位:℃)与四月二十号前棉花害虫化蛹高峰日y 的关系,(1)根据规律推断,该地区2006年三月下旬平均气温为27 ℃,试估计2006年四月化蛹高峰日为哪一天?(2)对变量x 、y 进行相关性检验. 解析:根据公式计算.解:(1)x =61(24.4+29.5+…+28.9)≈29.12,y =61(19+6+…+8)=7.5,∑=612i i x =24.42+…+28.92=5 125.01,∑=612i iy=192+…+82=563,∑=61i ii yx =24.4×19+…+28.9×8=1 222,∴b=212.29601.512512.295.761222⨯-⨯⨯-≈-2.379,a=y -b x =7.5+2.379×29.12=76.77.回归直线方程为y=-2.379x+76.77,当x=27时,y=-2.379×27+76.77=12.537,据此估计该地区2006年4月12日或13日为化蛹高峰日.(2)r=∑∑∑===---6161222261])(6][)(6[6i i i i i iiy y x x yx yx =-0.966,由于|r|接近于1,∴y 与x 存在很强的线性相关关系.求y 与x 的线性回归方程,并检验回归方程中的显著性. 解析:x 、y 有明显的线性关系,可根据公式求方程. 解:由已知数据x =71∑=71i ix ≈0.543,y =71×145.2≈20.74,∑=712i ix=2.595,∑=712i iy=3094.72,∑=71i ii yx =85.45.∴b≈2)543.0(7959.274.20543.0745.85⨯-⨯⨯-≈12.45.∴a=20.74-12.45×0.543≈13.98. 回归直线方程为y=13.98+12.45x.利用相关系数检验是否显著,∑=71i i i y x -7x y =85.45-7×0.543×20.74≈6.62,∑=712i i x -72x =2.595-7×(0.543)2≈0.531,∑=712i i y -72y =3 094.72-7×(20.74)2=83.687.∴r=687.83531.062.6⨯≈0.993.由于r 接近于1,故钢线碳含量对电阻的效应线性相关关系显著.。
2019-2020学年高中数学第1章《统计案例》1.1.1回归分析(2)导学案北师大版选修1-2学习目标1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;2. 了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.3. 会用相关指数,残差图评价回归效果.学习过程一、课前准备复习1:用相关系数r可衡量两个变量之间关系.r>0, 相关,r<0 相关;r越接近于1,两个变量的线性相关关系,它们的散点图越接近;r>,两个变量有关系.复习2:评价回归效果的三个统计量:总偏差平方和;残差平方和;回归平方和.二、新课导学※学习探究探究任务:如何评价回归效果?新知:1、评价回归效果的三个统计量(1)总偏差平方和:(2)残差平方和:(3)回归平方和:2、相关指数:2R表示对的贡献,公式为:2R=2R的值越大,说明残差平方和,说明模型拟合效果 .3、残差分析:通过来判断拟合效果.通常借助图实现.残差图:横坐标表示,纵坐标表示 .残差点比较均匀地落在的区的区域中,说明选用的模型,带状区域的宽度越,说明拟合精度越,回归方程的预报精度越 .※ 典型例题 例1关于x 与y 有如下数据:x 24 5 6 8 y30 40 60 50 70 为了对x 、y 两个变量进行统计分析,现有以下两种线性模型: 6.517.5y x =+,717y x =+,试比较哪一个模型拟合的效果更好?※ 动手试试练1. 某班5名学生的数学和物理成绩如下表:学生 学科A B C D E 数学成绩(x )88 76 75 64 62 物理成绩(y ) 78 65 70 62 60(导学案第1页例1)(4)求学生A,B,C,D,E 的物理成绩的实际成绩和回归直线方程预报成绩的差2i i e y y =-.并作出残差图评价拟合效果.学习评价※ 自我评价 你完成本节导学案的情况为( ).A. 很好B. 较好C. 一般D. 较差※ 当堂检测(时量:5分钟 满分:10分)计分:1. 两个变量 y 与x 的回归模型中,分别选择了 4 个不同模型,它们的相关指数 2R 如下 ,其中拟合效果最好的模型是( ).A. 模型 1 的相关指数2R 为 0.98B. 模型 2 的相关指数2R 为 0.80C. 模型 3 的相关指数2R 为 0.50D. 模型 4 的相关指数2R 为 0.252. 在回归分析中,残差图中纵坐标为( ).A. 残差B. 样本编号C. xD. n e3. 通过12,,,n e e e 来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分工称为( ).A.回归分析B.独立性检验分析C.残差分析D. 散点图分析4.2R 越接近1,回归的效果 .5. 在研究身高与体重的关系时,求得相关指数2R = ,可以叙述为“身高解释了69%的体重变化,而随机误差贡献了剩余 ”所以身高对体重的效应比随机误差的 .课后作业练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y bx a =+; x 3 4 5 6 y 2.5 3 4 4.5(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?⨯+⨯+⨯+⨯=)(参考数值3 2.543546 4.566.5(4)求相关指数评价模型.。
高中数学第1章《统计案例》1.1回归分析与相关系数习题导学案
北师大版选修1-2
学习目标
1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;
2. 了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.
3. 会用相关指数,残差图评价回归效果.
学习过程
一、基础过关
1.下列变量之间的关系是函数关系的是( ) A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac
B.光照时间和果树亩产量
C.降雪量和交通事故发生率
D.每亩施用肥料量和粮食产量
2.在以下四个散点图中,
其中适用于作线性回归的散点图为( )
A.①② B.①③ C.②③ D.③④
3.下列变量中,属于负相关的是( ) A.收入增加,储蓄额增加
B.产量增加,生产费用增加
C.收入增加,支出增加
D.价格下降,消费增加
4.已知对一组观察值(x i,y i)作出散点图后确定具有线性相关关系,若对于y=bx+a,求得b=
0.51,x=61.75,y=38.14,则线性回归方程为( )
A.y=0.51x+6.65 B.y=6.65x+0.51
C.y=0.51x+42.30 D.y=42.30x+0.51
5.对于回归分析,下列说法错误的是( ) A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定
B.线性相关系数可以是正的,也可以是负的
C.回归分析中,如果r2=1,说明x与y之间完全相关
D.样本相关系数r∈(-1,1)
6.下表是x和y之间的一组数据,则y关于x的回归方程必过( )
x 123 4
y 1357
A.点(2,3) B.点(1.5,4)
C.点(2.5,4) D.点(2.5,5)
7.若线性回归方程中的回归系数b=0,则相关系数r=________.
二、能力提升
8.某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:
尿汞含量x 246810
消光系数y 64138205285360
若y与x具有线性相关关系,则线性回归方程是____________________.
9.若施化肥量x(kg)与小麦产量y(kg)之间的线性回归方程为y=250+4x,当施化肥量为50 kg 时,预计小麦产量为________ kg.
10.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下:
零件的个数x/个234 5
加工的时间y/小时 2.534 4.5
若加工时间y与零件个数x之间有较好的相关关系.
(1)求加工时间与零件个数的线性回归方程;
(2)试预报加工10个零件需要的时间.
11.在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为:
1 2 3 4 5 价格x 1.4 1.6 1.8 2 2.2 需求量y
12
10
7
5
3
已知∑5
i =1x i y i =62,∑5
i =1x 2
i =16.6. (1)画出散点图;
(2)求出y 对x 的线性回归方程;
(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t).。