高中数学必修三变量之间的相关关系(必修3优秀课件)
- 格式:ppt
- 大小:2.13 MB
- 文档页数:8
变量间的相关关系知识集结知识元变量之间的相关关系知识讲解1、变量之间的相关关系两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系.当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系.相关关系是一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系.2、线性相关和非线性相关:两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系.3、两个变量相关关系与函数关系的区别和联系(1)相同点:两者均是两个变量之间的关系.(2)不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例题精讲变量之间的相关关系例1.用线性回归模型求得甲、乙、丙3组不同的数据的线性相关系数分别为0.81,-0.98,0.63,其中___(填甲、乙、丙中的一个)组数据的线性相关性最强.例2.如图所示,有A,B,C,D,E,5组数据,去掉___组数据后,剩下的4组数据具有较强的线性相关关系.(请用A、B、C、D、E作答)例3.对两个变量的相关系数r,有下列说法:(1)|r|越大,相关程度越大;(2)|r|越小,相关程度越大;(3)|r|趋近于0时,没有非线性相关系数;(4)|r|越接近于1时,线性相关程度越强,其中正确的是_________.例4.下列两个变量之间的关系是相关关系的是___.①正方体的棱长和体积;②单位圆中圆心角的度数和所对弧长;③单产为常数时,土地面积和总产量;④日照时间与水稻的亩产量.两个变量的线性相关知识讲解1.散点图【知识点的知识】1.散点图的概念:在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.2.曲线拟合的概念:从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这种近似的过程称为曲线拟合.3.正相关和负相关:(1)正相关:对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到右上角的区域内.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散布在从左上角到右下角的区域.3、注意:画散点图的关键是以成对的一组数据,分别为此点的横、纵坐标,在平面直角坐标系中把其找出来,其横纵坐标的单位长度的选取可以不同,应考虑数据分布的特征,散点图只是形象的描述点的分布,如果点的分布大致呈一种集中趋势,则两个变量可以初步判断具有相关关系,如图中数据大致分布在一条直线附近,则表示的关系是线性相关,如果两个变量统计数据的散点图呈现如下图所示的情况,则两个变量之间不具备相关关系,例如学生的身高和学生的英语成绩就没有相关关系.4、散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反映变量统计关系的一种图形.特点是能直观表现出影响因素和预测对象之间的总体关系趋势.优点是能通过直观醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系.散点图不仅可传递变量间关系类型的信息,也能反映变量间关系的明确程度.2.线性回归方程【概念】线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析.如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析.变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认为关于的回归函数的类型为线性函数.【实例解析】例:对于线性回归方程,则=解:,因为回归直线必过样本中心(),所以.故答案为:58.5.方法就是根据线性回归直线必过样本中心(),求出,代入即可求.这里面可以看出线性规划这类题解题方法比较套路化,需要熟记公式.【考点点评】这类题记住公式就可以了,也是高考中一个比较重要的点.3.最小二乘法【概念】最小二乘法(又称最小平方法)是一种数学优化技术.它通过最小化误差的平方和寻找数据的最佳函数匹配.利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小.最小二乘法还可用于曲线拟合.其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达.【例题解析】例:关于x与y有如表数据:请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程为y=0.7x+0.35.解:∵由题意知,,∴=0.7∴要求的线性回归方程是y=0.7x+0.35,故答案为:y=0.7x+0.35.集体步骤就是先做出x,y的平均数,代入的公式,利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果.【考点解析】最小二乘法一般在线性拟合中应用的比较多,主要是一种方法,能够熟记如何操作就可以了,剩下的就是计算要认真.例题精讲两个变量的线性相关例1.'2018年9月17日,世界公众科学素质促进大会在北京召开,国家主席习近平向大会致贺信中指出,科学技术是第一生产力,创新是引领发展的第一动力某企业积极响应国家“科技创新”的号召,大力研发新产品,为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据{x i,y i)(i=1,2,3,4,5,6),如表(1)求出p的值;(2)已知变量x,y具有线性相关关系,求产品销量y(件)关于试销单价:x(百元)的线性国归方程y=bx+a(计算结果精确到整数位);(3)用表示用正确的线性回归方程得到的与x对应的产品销的估计值当销售数据(x i,y i)的残差的绝对值|y i-y|<1时,则将销售数据称为一个“有效数据”现从这6组销售数中任取2组,求抽取的2组销售数据都是“有效数据”的概率.参考公式及数据=y i=80,=1606,=91,,'例2.'某地种植常规稻α和杂交稻β,常规稻α的亩产稳定为485公斤,今年单价为3.70元/公斤,估计明年单价不变的可能性为10%,变为3.90元/公斤的可能性为70%,变为4.00的可能性为20%.统计杂交稻β的亩产数据,得到亩产的频率分布直方图如图①.统计近10年杂交稻β的单价(单位:元/公斤)与种植亩数(单位:万亩)的关系,得到的10组数据记为(x i,y i)(i=1,2,..10),并得到散点图如图②.(1)根据以上数据估计明年常规稻α的单价平均值;(2)在频率分布直方图中,各组的取值按中间值来计算,求杂交稻β的亩产平均值;以频率作为概率,预计将来三年中至少有二年,杂交稻β的亩产超过795公斤的概率;(3)①判断杂交稻β的单价y(单位:元/公斤)与种植亩数x(单位:万亩)是否线性相关?若相关,试根据以下的参考数据求出y关于x的线性回归方程;②调查得知明年此地杂交稻β的种植亩数预计为2万亩.若在常规稻α和杂交稻β中选择,明年种植哪种水稻收入更高?统计参考数据:=1.60,=2.82,(x i)(y i)=-0.52,(x i)2=0.65,附:线性回归方程=bx+a,b=.'当堂练习单选题练习1.用模型y=ce kx拟合一组数据时,为了求出回归方程,设z=lny,其变换后得到线性回归方程z=0.3x+2,则c=()A.e2B.e4C.2D.4练习2.根据最小二乘法由一组样本点(x i,y i)(其中i=1,2,…,300),求得的回归方程是=x+,则下列说法正确的是()A.至少有一个样本点落在回归直线=x+上B.若所有样本点都在回归直线=x+上,则变量间的相关系数为1C.对所有的解释变量x i(i=1,2….300).bx i+的值一定与y i有误差D.若回归直线=x+的斜率b>0,则变量x与y正相关练习3.已知一组数据点(x1,y1),(x2,y2),(x3,y3),…,(x7,y7),用最小二乘法得到其线性回归方程为,若数据x1,x2,x3,…x7的平均数为1,则=()A.2B.11C.12D.14练习4.根据如下样本数据得到的回归直线方程为=bx+a,则()A.a>0,b>0B.a>0,b<0C.a<0,b<0D.a<0,b>0练习5.下列表格所示的五个散点数据,用最小二乘法得出y与x的线性回归直线方程为,则表格中m的值应为()A.8.3B.8.2C.8.1D.8练习6.一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下根据上表可得回归方程,则实数a的值为()A.37.3B.38C.39D.39.5练习1.如图所示,有A,B,C,D,E,5组数据,去掉___组数据后,剩下的4组数据具有较强的线性相关关系.(请用A、B、C、D、E作答)练习2.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中是相关关系的为_____.练习3.对两个变量的相关系数r,有下列说法:(1)|r|越大,相关程度越大;(2)|r|越小,相关程度越大;(3)|r|趋近于0时,没有非线性相关系数;(4)|r|越接近于1时,线性相关程度越强,其中正确的是_________.练习4.下列两个变量之间的关系是相关关系的是___.①正方体的棱长和体积;②单位圆中圆心角的度数和所对弧长;③单产为常数时,土地面积和总产量;④日照时间与水稻的亩产量.练习1.'2013年以来精准扶贫政策的落实,使我国扶贫工作有了新进展,贫困发生率由2012年底的10.2%下降到2018年底的1.4%,创造了人类减贫史上的中国奇迹.“贫困发生率”是指低于贫困线的人口占全体人口的比例,2012年至2018年我国贫困发生率的数据如表:(1)从表中所给的7个贫困发生率数据中心任选两个,求两个都低于5%的概率;(2)设年份代码x=t-2015,利用线性回归方程,分析2012年至2018年贫困发生率y与年份代码x的相关情况,并预测2019年贫困发生率.'练习2.'某企业为确定下一年投入某种产品的研发费用,需了解年研发费用x(单位:千万元)对年销售量y(单位:千万件)的影响,统计了近10年投入的年研发费用x i与年销售量y i(i=1,2…,10)的数据,得到散点图如图所示.(1)利用散点图判断y=a+bx和y=c∙x d(其中c,d均为大于0的常数)哪一个更适合作为年销售量y和年研发费用x的回归方程类型(只要给出判断即可,不必说明理由);(2)对数据作出如下处理,令u i=lnx i,v i=lny i,得到相关统计量的值如表:根据第(1)问的判断结果及表中数据,求y关于x的回归方程;(3)已知企业年利润z(单位:千万元)与x,y的关系为z=18y-x(其中e≈2.71828),根据第(2)问的结果判断,要使得该企业下一年的年利润最大,预计下一年应投入多少研发费用?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线=+的斜率和截距的最小二乘估计分别为=,=.'基于移动互联技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,带给人们新的出行体验,某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司最近六个月内的市场占有率进行了统计,设月份代码为x,市场占有率为y(%),得结果如表(1)观察数据看出,可用线性回归模型拟合y与x的关系,请用相关系数加以说明(精确到0.001):(2)求y关于x的线性回归方程,并预测该公司2019年4月份的市场占有率;(3)根据调研数据,公司决定再采购一批单车扩大市场,现有采购成本分别为1000元/辆和800元/辆的甲,乙两款车型报年限各不相同.考虑到公司的经济效益,该公司决定先对两款单车各100辆行科学模拟测试,得到两款单车使用寿命表如下经测算,平均每辆单车每年可以为公司带来收入500元,不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整数年,且用频率估计每单车使用寿命的概率,以每辆单车产生利润的期望值为决策依据.如果你是该公司的负责人,你会选择采购哪款车型?参考数据(x i)2=17.5,(y i)2=76,(x i)(y i)=35,≈36.5参考公式:相关系数r=回归方程=x中斜率和截距的最小二乘估计公式分别为=,=近期,某公交公司与银行开展云闪付乘车支付活动,吸引了众多乘客使用这种支付方式.某线路公交车准备用20天时间开展推广活动,他们组织有关工作人员,对活动的前七天使用云闪付支付的人次数据做了初步处理,设第x天使用云闪付支付的人次为y,得到如图所示的散点图.由统计图表可知,可用函数y=a∙b x拟合y与x的关系(1)求y关于x的回归方程;(2)预测推广期内第几天起使用云闪付支付的人次将超过10000人次.附:①参考数据表中v i=lgy i,=lgy i②参考公式:对于一组数据(u1,v1),(u2,v2)…,(u n,v n),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β=,α=-β.'习近平总书记在十九大报告中指出,必须树立和践行“绿水青山就是金山银山”的生态文明发展理念,某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起,第x的高度为ycm,测得一些数据图如下表所示作出这组数的散点图如图.(1)请根据散点图判断,y=ax+b与y=c+d中哪一个更适宜作为幼苗高度y关于时间x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测第144天这株幼苗的高度(结果保留1位小数)附:=,参考数据:'某老小区建成时间较早,没有集中供暖,随着人们生活水平的日益提高热力公司决定在此小区加装暖气该小区的物业公司统计了近五年(截止2018年年底)小区居民有意向加装暖气的户数,得到如下数据(Ⅰ)若有意向加装暖气的户数y与年份编号x满足线性相关关系求y与x的线性回归方程并预测截至2019年年底,该小区有多少户居民有意向加装暖气;(Ⅱ)2018年年底郑州市民生工程决定对老旧小区加装暖气进行补贴,该小区分到120个名额物业公司决定在2019年度采用网络竞拍的方式分配名额,竞拍方案如下:①截至2018年年底已登记在册的居民拥有竞拍资格;②每户至多申请一个名额,由户主在竞拍网站上提出申请并给出每平方米的心理期望报价;③根据物价部门的规定,每平方米的初装价格不得超过300元;④申请阶段截止后,将所有申请居民的报价自高到低排列,排在前120位的业主以其报价成交;⑤若最后出现并列的报价,则认为申请时问在前的居民得到名额,为预测本次竞拍的成交最低价,物业公司随机抽取了有竞拍资格的50位居民进行调查统计了他们的拟报竞价,得到如图所示的频率分布直方图:(1)求所抽取的居民中拟报竞价不低于成本价180元的人数;(2)如果所有符合条件的居民均参与竞拍,请你利用样本估计总体的思想预测至少需要报价多少元才能获得名额(结果取整数)参考公式对于一组数据(x1,y1),(x2,y2),(x3,y3),…(x n,y n),其回归直线=x+的斜率和截距的最小二乘估计分别为,=,=-。