高中数学第3章统计案例章末高效整合课件
- 格式:ppt
- 大小:631.51 KB
- 文档页数:48
高中数学第3章统计案例章末复习课讲义新人教B 版选修231016448[自我校对] ①回归分析 ②相互独立事件的概率 ③χ2公式 ④判断两变量的线性相关回归分析问题建立回归模型的步骤(1)确定研究对象,明确变量x ,y .(2)画出变量的散点图,观察它们之间的关系(如是否存在线性相关关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线性相关关系,则选用回归直线方程y ^=b ^x +a ^).(4)按一定规则估计回归方程中的参数(如最小二乘法). (5)得出回归方程.另外,回归直线方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归直线方程的适用范围,否则没有实用价值.【例1】 假设一个人从出生到死亡,在每个生日那天都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录: 年龄/周岁3456789身高/cm90.897.6104.2110.9115.7122.0128.5年龄/周岁10111213141516 身高/cm134.2140.8147.6154.2160.9167.6173.0(2)求出这些数据的线性回归方程;(3)对于这个例子,你如何解释回归系数的含义?(4)解释一下回归系数与每年平均增长的身高之间的联系.【精彩点拨】(1)作出散点图,确定两个变量是否线性相关;(2)求出a,b,写出线性回归方程;(3)回归系数即b的值,是一个单位变化量;(4)根据线性回归方程可找出其规律.【解】(1)数据的散点图如下:(2)用y表示身高,x表示年龄,因为x-=114×(3+4+5+…+16)=9.5,y-=114×(90.8+97.6+…+173.0)=132,b^=∑i=114x i y i-14x-y-∑i=114x2i-14x-2≈18 993-14×9.5×1321 491-14×9.52≈6.316,a^=y--b x-=71.998,所以数据的线性回归方程为y=6.316x+71.998.(3)在该例中,回归系数6.316表示该人在一年中增加的高度.(4)回归系数与每年平均增长的身高之间近似相等.1.假定小麦基本苗数x与成熟期有效穗Y之间存在相关关系,今测得5组数据如下:x 15.025.830.036.644.4Y 39.442.942.943.149.2(1)(2)求Y与x之间的回归方程,对于基本苗数56.7预报有效穗.【解】(1)散点图如下.(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用回归方程刻画它们之间的关系.设回归方程为y^=b^x+a^,x=30.36,y=43.5,∑i=15x2i=5 101.56,∑i=15y2i=9 511.43.x y=1 320.66,y2=1 892.25,x2=921.729 6,∑i=15x i y i=6 746.76.由b^=∑i=15x i y i-5x y∑i=15x2i-5x2≈0.29,a^=y-b^x=43.5-0.29×30.36≈34.70.故所求的线性回归方程为y^=34.70+0.29x.当x=56.7时,y^=34.70+0.29×56.7=51.143.估计成熟期有效穗约为51.143.独立性检验独立性检验的基本思想类似于反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下,我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值很大,则在一定程度上说明假设不合理,根据随机变量χ2的含义,可以通过P (χ2>6.635)≈0.01来评价假设不合理的程度,由实际计算出χ2>6.635说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表.(2)根据公式χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2计算χ2的值.(3)比较χ2与临界值的大小关系并作统计推断.【例2】 在某校高三年级一次全年级的大型考试中数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系较大?物理优秀 化学优秀 总分优秀 数学优秀 228 225 267 数学非优秀14315699【精彩点拨】 分别列出数学与物理,数学与化学,数学与总分优秀的2×2列联表,求k 的值.由观测值分析,得出结论.【解】 (1)列出数学与物理优秀的2×2列联表如下:物理优秀 物理非优秀合计 数学优秀 228 132 360 数学非优秀 143 737 880 合计3718691 240n 11=122122n 1+=360,n 2+=880,n +1=371,n +2=869,n =1 240. 代入公式χ2=n (n 11n 22-n 12n 21)2(n 1+n 2+n +1n +2),得χ21=1 240×(228×737-132×143)2360×869×371×880≈270.114 3.(2)列出数学与化学优秀的2×2列联表如下:化学优秀 化学非优秀合计 数学优秀 225 135 360 数学非优秀 156 724 880 合计3818591 240n 11n 12n 21n 22n 1+=360,n 2+=880,n +1=381,n +2=859,n =1 240.代入公式,得χ22=1 240×(225×724-135×156)2360×880×381×859≈240.611 2.(3)列出数学与总分优秀的2×2列联表如下:总分优秀 总分非优秀合计 数学优秀 267 93 360 数学非优秀 99 781 880 合计3668741 240n 11122122n 1+=360,n 2+=880,n +1=366,n +2=874,n =1 240.代入公式,得χ23=1 240×(267×781-93×99)2360×880×366×874≈486.122 5.由上面计算可知数学成绩优秀与物理、化学、总分优秀都有关系,由计算分别得到χ2的统计量都大于临界值6.635,由此说明有99%的把握认为数学优秀与物理、化学、总分优秀都有关系,但与总分优秀关系最大,与物理次之.2.某推销商为某保健药品做广告,在广告中宣传:“在服用该药品的105人中有100人未患A 疾病”.经调查发现,在不服用该药品的418人中仅有18人患A 疾病.请用所学知识分析该药品对预防A 疾病是否有效.【解】 将问题中的数据写成如下2×2列联表:患A 疾病不患A 疾病合计 服用该药品 5 100 105 不服用该药品18 400 418 合计23500523将上述数据代入公式χ2=11221221n 1+n 2+n +1n +2中,计算可得χ2≈0.041 4,因为0.041 4<3.841,故没有充分理由认为该保健药品对预防A 疾病有效.转化与化归思想在回归分析中的应用回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.【例3】 某商店各个时期的商品流通率Y (%)与对应商品零售额x (万元)资料如下:x 9.5 11.5 13.5 15.5 17.5 y64.643.22.8x 19.5 21.5 23.5 25.5 27.5 y2.52.42.32.22.1率Y 决定于商品的零售额x ,体现着经营规模效益,假定它们之间存在关系式:y =a +b x.试根据上表数据,求出a 与b 的估计值,并估计商品零售额为30万元时的商品流通率.【解】 设u =1x,则y =a +bu ,得下表数据:u 0.105 3 0.087 0 0.074 1 0.064 5 0.057 1 y64.64 3.22.8u 0.051 3 0.046 5 0.042 6 0.039 2 0.036 4 y2.52.42.32.22.1y ^=-0.187 5+56.25 u .所以所求的回归方程为y ^=-0.187 5+56.25x.当x =30时,y =1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.3.在某化学实验中,测得如下表所示的6对数据,其中x (单位:min)表示化学反应进行的时间,Y (单位:mg)表示未转化物质的质量.x /min 1 2 3 4 5 6Y /mg 39.8 32.225.4 20.3 16.2 13.3x(2)估计化学反应进行到10 min 时未转化物质的质量(精确到0.1).【解】 (1)在y =cd x两边取自然对数,令ln y =z ,ln c =a ,ln d =b ,则z =a +bx .由已知数据,得x i 1 2 3 4 5 6y i 39.832.225.420.316.213.3z i3.684 3.472 3.235 3.011 2.785 2.588由公式得a ≈3.905 5,b ≈-0.221 9,则线性回归方程为z =3.905 5-0.221 9x .而ln c =3.905 5,ln d =-0.221 9,故c ≈49.675,d ≈0.801,所以c ,d 的估计值分别为49.675,0.801. (2)当x =10时,由(1)所得公式可得y ≈5.4(mg).1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元) 8.2 8.6 10.0 11.3 11.9 支出y (万元)6.27.58.08.59.8根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元【解析】 由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4,∴当x =15时,y ^=0.76×15+0.4=11.8(万元). 【答案】 B2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量【解析】 A 中,a =6,b =14,c =10,d =22,a +b =20,c +d =32,a +c =16,b +d =36,n =52,χ2=52×(6×22-14×10)220×32×16×36=131 440.B 中,a =4,b =16,c =12,d =20,a +b =20,c +d =32,a +c =16,b +d =36,n =52, χ2=52×(4×20-16×12)220×32×16×36=637360.C 中,a =8,b =12,c =8,d =24,a +b =20,c +d =32,a +c =16,b +d =36,n =52, χ2=52×(8×24-12×8)220×32×16×36=1310.D 中,a =14,b =6,c =2,d =30,a +b =20,c +d =32,a +c =16,b +d =36,n =52, χ2=52×(14×30-6×2)220×32×16×36=3 757160.∵131 440<1310<637360<3 757160, ∴与性别有关联的可能性最大的变量是阅读量. 【答案】 D3.如图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.附注:参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 (t i -t )(y i -y )∑ni =1 (t i -t )2∑ni =1(y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑ni =1(t i -t )(y i -y )∑ni =1(t i -t )2,a ^=y --b ^t .【解】 (1)由折线图中的数据和附注中的参考数据得t =4, ∑7i =1(t i -t )2=28,∑7i =1 (y i -y )2=0.55,∑7i =1(t i -t )(y i -y )=∑7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89,∴r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当大,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑7i =1(t i -t )(y i -y )∑7i =1(t i -t )2=2.8928≈0.103. a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2019年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2019年我国生活垃圾无害化处理量约为1.82亿吨.4.某地区2011年至2017年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(2)利用(1)中的回归方程,分析2011年至2017年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:b ^=∑ni =1(t i -t )(y i -y -)∑ni =1(t i -t )2,a ^=y --b ^t .【解】 (1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y -=17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑7i =1(t i -t )2=9+4+1+0+1+4+9=28,∑7i =1(t i -t )(y i -y -)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑7i =1(t i -t )(y i -y -)∑7i =1(t i -t )2=1428=0.5, a ^=y --b ^t =4.3-0.5×4=2.3,所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2011年至2017年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2019年的年份代号t =9代入(1)中的回归方程,得y^=0.5×9+2.3=6.8,故预测该地区2019年农村居民家庭人均纯收入为6.8千元.- 1 -。