人教版高中数学选修2-3统计案例2
- 格式:doc
- 大小:127.50 KB
- 文档页数:10
1.相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.2.线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^,a^其中,b 是回归方程的斜率,a是在y轴上的截距.4.样本相关系数r=∑i=1nx i-x y i-y∑i=1nx i-x2∑i=1ny i-y2,用它来衡量两个变量间的线性相关关系.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.5.线性回归模型(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差.(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.注意(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.考向一相关关系的判断例1.下列选项中,两个变量具有相关关系的是( )A.正方形的面积与周长B.匀速行驶车辆的行驶路程与时间C.人的身高与体重D.人的身高与视力答案:C例2.对变量x、y有观测数据(x i,y i)(i =1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C.由题图1可知,各点整体呈递减趋势,x与y负相关,由题图2可知,各点整体呈递增趋势,u与v正相关.例3.下面哪些变量是相关关系( ).A.出租车车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁块的大小与质量解析A,B,D都是函数关系,其中A一般是分段函数,只有C是相关关系.答案C例4.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据的线性相关性最大.解析:因为A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.答案:D例5.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i、v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( ).A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.答案C例6.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.球的体积与半径之间的关系C.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程D.一个家庭的收入与支出解析:选C.A、D中的两个变量属于线性正相关,B中两个变量是函数关系.例7.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):棉花产量y3334536540544545455(1)(2)判断是否具有相关关系.[审题视点] (1)用x轴表示化肥施用量,y轴表示棉花产量,逐一画点.(2)根据散点图,分析两个变量是否存在相关关系.解(1)散点图如图所示(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.例8. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).解析从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.答案否考向二线性回归方程例9.对有线性相关关系的两个变量建立的回归直线方程y^=a+bx中,回归系数b( )A.不能小于0 B.不能大于0C.不能等于0 D.只能小于0解析:选C.∵b=0时,r=0,这时不具有线性相关关系,但b能大于0也能小于0.例10.已知回归方程y^=4.4x+838.19,则可估计x与y的增长速度之比约为________.解析:x与y的增长速度之比即为回归方程的斜率的倒数14.4=1044=522.答案:5 22例11.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( ).A.y^=-10x+200 B.y^=10x+200 C.y^=-10x-200 D.y^=10x-200解析因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数,再排除C,故选A.答案A例12.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[审题视点] (2)问利用公式求a^、b^,即可求出线性回归方程.(3)问将x=100代入回归直线方程即可.解(1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得:∑i =14x 2i =86, x =3+4+5+64= 4.5(吨),y =2.5+3+4+4.54=3.5(吨). 已知∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为:b^=∑i=14x i y i-4x·y∑i=14x2i-4x2=66.5-4×4.5×3.586-4×4.52=0.7,a^=y-b^x=3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y^=0.7x+0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.例13.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x的线性回归方程为( ).A.y=x-1 B.y=x+1C.y=88+12x D.y=176解析由题意得x=174+176+176+176+1785=176(cm),y=175+175+176+177+1775=176(cm),由于(x,y)一定满足线性回归方程,经验证知选C.答案C例14.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)回归直线方程y^=bx+a;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:x=0,y=3.2,b=26040=6.5,a=y-b x=3.2.由上述计算结果,知所求回归直线方程为y -257=b(x-2 006)+a=6.5(x-2 006)+3.2,即y^=6.5(x-2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).例15.下列有关回归直线方程y^=bx+a 的叙述正确的是( )①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①② B.②③C.③④ D.①④解析:选D.y^=bx+a表示y^与x之间的函数关系,而不是y与x之间的函数关系;但它反映的关系最接近y与x之间的真实关系,故选D.例16.设有一个回归方程y^=3-5x,变量x增加一个单位时( )A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位解析:选B.∵-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.例17.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不.正确的是( ) A.由样本数据得到的回归方程y^=b^x+a^必过样本中心(x,y)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r=-0.9362,则变量y 和x 之间具有线性相关关系解析:选C.C 中应为R 2越大拟合效果越好.例18.已知回归方程y ^=2x +1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是( )A .0.01B .0.02C .0.03D .0.04解析:选C.当x =2时,y ^=5,当x =3时,y ^=7,当x =4时,y ^=9.∴e ^1=4.9-5=-0.1,e ^2=7.1-7=0.1, e ^3=9.1-9=0.1.∴ i =13e ^i 2=(-0.1)2+(0.1)2+(0.1)2=0.03. 例19.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②回归方程y^=bx+a必过点(x,y);③曲线上的点与该点的坐标之间具有相关关系;④在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是90%.其中错误的是________.解析:①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.答案:③④例20.在2009年十一国庆8天黄金周期间,某市物价部门,对本市五个商场销售的某商品的一天销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:价格x 99.5110.511销售量y 1110865yx具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.解析:由数据表可得x=10,y=8,离差x-x:-1,-0.5,0,0.5,1;离差y-y:3,2,0,-2,-3.∴b^=-1×3-0.5×2-0.5×2-1×3 1+0.25+0+0.25+1=-3.2,a^=y-b^x=40,∴回归直线方程为y^=-3.2x+40.答案:y^=-3.2x+40例21.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:身高(cm)14315615917216517117716116416体重(kg)41496179686974696854的身高和体重之间是否有相关关系.解:以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日期12月1日12月2日12月3日12月4日12月5日温差x(℃)101113128发芽数y(颗)2325302616组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程y^=b^x +a^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?解:(1)设抽到不相邻2组数据为事件A,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻2组数据的情况有4种,所以P(A)=1-410=35.(2)由数据求得,x=12,y=27,由公式求得.b^=52,a^=y-b^x=-3.所以y关于x的线性回归方程为y^=52x-3.(3)当x=10时,y^=52×10-3=22,|22-23|<2;当x=8时,y^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的.。
第三章统计案例
本章综述
本章的主要内容是回归直线方程的分析及其相关性检验,独立性检验两部分.重点是回归分析的初步应用,难点是独立性检验的应用.
数理统计学是研究、收集、分析数据,并对所研究的问题作出结论的科学和艺术.小到日常生活,大到国计民生,我们都能发现统计的影子,如研究生活习惯对健康的影响;环境与国家发展的关系;吸烟与肺癌的关系等.解决这些问题,不能仅凭主观意愿作出结论,需要通过数据进行分析.本章是在学习过抽样、样本估计总体、相互独立事件同时发生的概率、线性回归等基本知识的基础上提出来的,所以在学习本章知识前要先对这些内容进行系统的复习回顾.以此为出发点学习新的内容.同时要注重对案例的分析,体会理解概念的实际意义,突出统计中处理问题的基本思想、方法,并多动手,结合实例解决一些实际问题,加深对相关知识的认识和理解.
随着高考改革的进行,试题中必然会愈来愈多地设置实践性和动手能力强的题目,而统计内容具有很好的现实背景和较强的实践性,因而会成为今后高考的热点之一.。
人教版高中选修2-3第三章统计案例教学设计一、教学背景本教学设计面向人教版高中数学选修2-3第三章《统计》的教学内容,本章节主要讲解相关的统计知识,包括频率分布、分组、频率分布直方图、累计频率分布、等分点、统计标准差等等。
本教学设计针对高中学生特点,通过设计案例,激发学生的学习兴趣,增强学生的统计知识复习和巩固的效果,提高学生的学习兴趣和学习效果,通过实际案例让学生更好地理解理论知识,拓宽学生的思维维度,提高他们的综合应用能力。
二、教学目标1.了解和掌握统计的相关概念和方法2.掌握构造频数分布表、频数分布图、累计频数分布表、累计频数分布图的方法3.熟练应用统计方法解决实际问题4.培养数据分析和解决问题的能力三、教学内容1.频数分布•频数分布表•频数分布图2.累计频数分布•累计频数分布表•累计频数分布图3.等分点及等分位数4.统计标准差本教学设计采用讲授、案例分析和问答等教学方法相结合。
教师通过针对教学目标讲解知识点,设计相关案例进行分析,让学生参与案例分析过程中,深入了解教学重点。
教师根据学生的学习情况提问,引导学生思考,提高学生的思维能力和综合应用能力。
五、课程安排第一节课:频数分布1.讲解概念,构造表格2.讲解构造频数分布图方法3.讲解统计数据分析第二节课:累计频数分布1.讲解累计频数分布概念2.构造累计频数分布表3.构造累计频数分布图4.讲解累计数据分析第三节课:等分点及等分位数1.讲解概念2.讲解求解方法3.应用案例分析第四节课: 统计标准差1.讲解概念2.讲解求解方法3.应用案例分析通过本教学设计的教学实践,学生们以案例为基础,通过讲述来了解和掌握统计的相关概念和方法、熟练应用统计方法解决实际问题、培养数据分析和解决问题的能力。
教学效果良好,学生积极参与,学习效果明显。
值得注意的是,案例的选择要与学生相关,注重实用性,让学生通过教学理论知识的学习能够得到运用和提升。
在教学过程中,要注重学生的积极性,充分发挥案例分析的效果,让学生通过实例了解和理解知识点,提高学习效率和兴趣。
概率与统计学问点:1、随机变量:假如随机试验可能出现的结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而改变,那么这样的变量叫做随机变量. 随机变量常用大写字母X 、Y 等或希腊字母 ξ、η等表示。
2、离散型随机变量:在上面的射击、产品检验等例子中,对于随机变量X 可能取的值,我们可以按肯定次序一一列出,这样的随机变量叫做离散型随机变量.3、离散型随机变量的分布列:一般的,设离散型随机变量X 可能取的值为x 1,x 2,..... ,x i ,......,x n X 取每一个值 x i (i=1,2,......)的概率P(ξ=x i )=P i ,则称表为离散型随机变量X 的概率分布,简称分布列4、分布列性质① p i ≥0, i =1,2, … ;② p 1 + p 2 +…+p n = 1.5、二项分布:假如随机变量X 的分布列为:其中0<p<1,q=1-p ,则称离散型随机变量X 听从参数p 的二点分布6、超几何分布:一般地, 设总数为N 件的两类物品,其中一类有M 件,从全部物品中任取n(n ≤N)件,这n 件中所含这类物品件数X 是一个离散型随机变量,则它取值为k 时的概率为,其中,且 7、条件概率:对随意事务A 和事务B ,在已知事务A 发生的条件下事务B 发生的概率,叫做条件概率.记作P(B|A),读作A 发生的条件下B 的概率8、公式:9、相互独立事务:事务A(或B)是否发生对事务B(或A)发生的概率没有影响,这样的两个事务叫做相互独立事务。
10、n 次独立重复事务:在同等条件下进行的,各次之间相互独立的一种试验11、二项分布: 设在n 次独立重复试验中某个事务A 发生的次数,A 发生次数ξ是一个随机变量.假如在一次试验中某事务发生的概率是p ,事务A 不发生的概率为q=1-p ,那么在n 次独立重复试验中 (其中 k=0,1, ……,n ,q=1-p )于是可得随机变量ξ的概率分布如下:这样的随机变量ξ听从二项分布,记作ξ~B(n ,p) ,其中n ,p 为参数12、数学期望:一般地,若离散型随机变量ξ的概率分布为 则称 E ξ=x1p1+x2p2+…+xnpn +…为ξ的数学期望或平均数、均值,数学期望又简称为期()(0,1,2,,)k n k M N M n N C C P X k k m C --==={}min ,m M n =*,,,,n N M N n M N N ∈≤≤.0)(,)()()|(>=A P A P AB P A B P )()()(B P A P B A P ⋅=⋅)(k P =ξkn k k n q p C -=望.是离散型随机变量。
第三章统计案例
本章解说
知识概要
在现实生活中,我们经常会遇到类似下面的问题:肺癌是严重威胁人类生命的一种疾病,吸烟与患肺癌有关系吗?
肥胖是影响人类健康的一个重要因素,身高与体重之间是否存在线性相关关系?等等. 为了回答这些问题,必须明确问题涉及的对象(总体)是什么,用怎样的量来描述要解决的问题,并确定获取变量值(数据)的方法.然后用恰当的方法分析数据,以得到最可靠的结论.
在必修模块中,我们学习过关于抽样,用样本估计总体,线性回归等基础知识.本章中,我们将在此基础上,通过对典型案例的讨论,进一步讨论线性回归分析方法及其应用,并初步了解独立性检验的基本思想,认识统计方法在决策中的作用.
1.本章的主要内容有随机误差、残差、残差分析、列联表及独立性检验等概念.
2.用残差分析、判断线性回归模型的拟合效果.
3.建立回归模型的基本步骤.
4.通过对典型案例的研究,了解回归的基本思想、方法及初步应用.
5.通过对典型案例的研究,了解独立性检验的基本思想、方法及初步应用.
6.根据题目所给的列联表判断结论的可能性.
学法指导
1.在实际问题中,经常会面临需要推断的问题.比如研制出一种新药,需要推断此药是否有效?有人怀疑吸烟的人更易患肺癌,那么吸烟是否与患肺癌有关呢?等等.在对类似的问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的推断.
2.统计方法是可能犯错误的:不管是回归分析还是独立性检验,得出的结论都可能犯错误,好的统计方法就是要尽量降低犯错误的概率,比如在推断吸烟与患肺癌是否有关时,通过收集数据、整理分析数据得到“吸烟与患肺癌有关”的结论,而且这个结论出错的概率在0.01以下.实际上,这是统计思维与确定性思维差异的反应.。
⼈教A版⾼中数学选修2-3全册同步练习及单元检测含答案⼈教版⾼中数学选修2~3 全册章节同步检测试题⽬录第1章《计数原理》同步练习 1.1测试1第1章《计数原理》同步练习 1.1测试2第1章《计数原理》同步练习 1.1测试3第1章《计数原理》同步练习 1.2排列与组合第1章《计数原理》同步练习 1.3⼆项式定理第1章《计数原理》测试(1)第1章《计数原理》测试(2)第2章同步练习 2.1离散型随机变量及其分布列第2章同步练习 2.2⼆项分布及其应⽤第2章测试(1)第2章测试(2)第2章测试(3)第3章练习 3.1回归分析的基本思想及其初步应⽤第3章练习 3.2独⽴性检验的基本思想及其初步应⽤第3章《统计案例》测试(1)第3章《统计案例》测试(2)第3章《统计案例》测试(3)1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题1.⼀件⼯作可以⽤2种⽅法完成,有3⼈会⽤第1种⽅法完成,另外5⼈会⽤第2种⽅法完成,从中选出1⼈来完成这件⼯作,不同选法的种数是()A.8 B.15C.16 D.30答案:A2.从甲地去⼄地有3班⽕车,从⼄地去丙地有2班轮船,则从甲地去丙地可选择的旅⾏⽅式有()A.5种B.6种C.7种D.8种答案:B3.如图所⽰为⼀电路图,从A 到B 共有()条不同的线路可通电()A.1 B.2 C.3 D.4答案:D4.由数字0,1,2,3,4可组成⽆重复数字的两位数的个数是()A.25 B.20 C.16 D.12答案:C5.李芳有4件不同颜⾊的衬⾐,3件不同花样的裙⼦,另有两套不同样式的连⾐裙.“五⼀”节需选择⼀套服装参加歌舞演出,则李芳有()种不同的选择⽅式()A.24 B.14 C.10 D.9答案:B 6.设A ,B 是两个⾮空集合,定义{}()A B a b a A b B *=∈∈,,|,若{}{}0121234P Q ==,,,,,,,则P *Q 中元素的个数是()A.4 B.7 C.12 D.16答案:C⼆、填空题7.商店⾥有15种上⾐,18种裤⼦,某⼈要买⼀件上⾐或⼀条裤⼦,共有种不同的选法;要买上⾐,裤⼦各⼀件,共有种不同的选法.答案:33,2708.⼗字路⼝来往的车辆,如果不允许回头,共有种⾏车路线.答案:129.已知{}{}0341278a b ∈∈,,,,,,,则⽅程22()()25x a y b -+-=表⽰不同的圆的个数是.答案:1210.多项式123124534()()()()a a a b b a a b b ++++++··展开后共有项.答案:1011.如图,从A →C ,有种不同⾛法.答案:612.将三封信投⼊4个邮箱,不同的投法有种.答案:34三、解答题 13.⼀个⼝袋内装有5个⼩球,另⼀个⼝袋内装有4个⼩球,所有这些⼩球的颜⾊互不相同.(1)从两个⼝袋内任取⼀个⼩球,有多少种不同的取法?(2)从两个⼝袋内各取⼀个⼩球,有多少种不同的取法?解:(1)549N =+=种;(2)5420N =?=种.14.某校学⽣会由⾼⼀年级5⼈,⾼⼆年级6⼈,⾼三年级4⼈组成.(1)选其中1⼈为学⽣会主席,有多少种不同的选法?(2)若每年级选1⼈为校学⽣会常委,有多少种不同的选法?(3)若要选出不同年级的两⼈参加市⾥组织的活动,有多少种不同的选法?解:(1)56415N =++=种;(2)564120N =??=种;(3)56644574N =?+?+?=种15.已知集合{}321012()M P a b =---,,,,,,,是平⾯上的点,a b M ∈,.(1)()P a b ,可表⽰平⾯上多少个不同的点?(2)()P a b ,可表⽰多少个坐标轴上的点?解:(1)完成这件事分为两个步骤:a 的取法有6种,b 的取法也有6种,∴P 点个数为N =6×6=36(个);(2)根据分类加法计数原理,分为三类:①x 轴上(不含原点)有5个点;②y 轴上(不含原点)有5个点;③既在x 轴,⼜在y 轴上的点,即原点也适合,∴共有N =5+5+1=11(个).1. 1分类加法计数原理与分步乘法计数原理测试题⼀、选择题 1.从集合{ 0,1,2,3,4,5,6}中任取两个互不相等的数a ,b 组成复数a bi +,其中虚数有() A .30个 B .42个 C .36个 D .35个答案:C2.把10个苹果分成三堆,要求每堆⾄少1个,⾄多5个,则不同的分法共有() A .4种 B .5种 C .6种 D .7种答案:A3.如图,⽤4种不同的颜⾊涂⼊图中的矩形A ,B ,C ,D 中,要求相邻的矩形涂⾊不同,则不同的涂法有() A .72种 B .48种 C .24种 D .12种答案:A4.教学⼤楼共有五层,每层均有两个楼梯,由⼀层到五层的⾛法有() A .10种 B .52种C.25种D.42种答案:D5.已知集合{}{}023A B x x ab a b A ===∈,,,,,|,则B 的⼦集的个数是()A.4 B.8 C.16 D.15答案:C6.三边长均为正整数,且最⼤边长为11的三⾓形的个数为()A.25 B.26 C.36 D.37答案:C⼆、填空题7.平⾯内有7个点,其中有5个点在⼀条直线上,此外⽆三点共线,经过这7个点可连成不同直线的条数是.答案:128.圆周上有2n 个等分点(1n >),以其中三个点为顶点的直⾓三⾓形的个数为.答案:2(1)n n -9.电⼦计算机的输⼊纸带每排有8个穿孔位置,每个穿孔位置可穿孔或不穿孔,则每排可产⽣种不同的信息.答案:25610.椭圆221x y m n+=的焦点在y 轴上,且{}{}123451234567m n ∈∈,,,,,,,,,,,,则这样的椭圆的个数为.答案:20 11.已知集合{}123A ,,ü,且A 中⾄少有⼀个奇数,则满⾜条件的集合A 分别是.答案:{}{}{}{}{}13122313,,,,,,,12.整数630的正约数(包括1和630)共有个.答案:24三、解答题 13.⽤0,1,2,3,4,5六个数字组成⽆重复数字的四位数,⽐3410⼤的四位数有多少个?解:本题可以从⾼位到低位进⾏分类.(1)千位数字⽐3⼤.(2)千位数字为3:①百位数字⽐4⼤;②百位数字为4: 1°⼗位数字⽐1⼤;2°⼗位数字为1→个位数字⽐0⼤.所以⽐3410⼤的四位数共有2×5×4×3+4×3+2×3+2=140(个).14.有红、黄、蓝三种颜⾊旗⼦各(3)n n >⾯,任取其中三⾯,升上旗杆组成纵列信号,可以有多少种不同的信号?若所升旗⼦中不允许有三⾯相同颜⾊的旗⼦,可以有多少种不同的信号?若所升旗⼦颜⾊各不相同,有多少种不同的信号?解: 1N =3×3×3=27种; 227324N =-=种; 33216N =??= 种.15.某出版社的7名⼯⼈中,有3⼈只会排版,2⼈只会印刷,还有2⼈既会排版⼜会印刷,现从7⼈中安排2⼈排版,2⼈印刷,有⼏种不同的安排⽅法.解:⾸先分类的标准要正确,可以选择“只会排版”、“只会印刷”、“既会排版⼜会印刷”中的⼀个作为分类的标准.下⾯选择“既会排版⼜会印刷”作为分类的标准,按照被选出的⼈数,可将问题分为三类:第⼀类:2⼈全不被选出,即从只会排版的3⼈中选2⼈,有3种选法;只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有3×1=3种选法.第⼆类:2⼈中被选出⼀⼈,有2种选法.若此⼈去排版,则再从会排版的3⼈中选1⼈,有3种选法,只会印刷的2⼈全被选出,有1种选法,由分步计数原理知共有2×3×1=6种选法;若此⼈去印刷,则再从会印刷的2⼈中选1⼈,有2种选法,从会排版的3⼈中选2⼈,有3种选法,由分步计数原理知共有2×3×2=12种选法;再由分类计数原理知共有6+12=18种选法.第三类:2⼈全被选出,同理共有16种选法.所以共有3+18+16=37种选法.1. 1 分类加法计数原理与分步乘法计数原理综合卷⼀.选择题:1.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种2.⼀个三层书架,分别放置语⽂书12本,数学书14本,英语书11本,从中取出语⽂、数学、英语各⼀本,则不同的取法共有()(A ) 37种(B ) 1848种(C ) 3种(D ) 6种3.某商业⼤厦有东南西3个⼤门,楼内东西两侧各有2个楼梯,从楼外到⼆楼的不同⾛法种数是()(A ) 5 (B )7 (C )10 (D )124.⽤1、2、3、4四个数字可以排成不含重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个5.⽤1、2、3、4四个数字可排成必须含有重复数字的四位数有()(A )265个(B )232个(C )128个(D )24个6.3科⽼师都布置了作业,在同⼀时刻4名学⽣都做作业的可能情况有()(A )43种(B )34种(C )4×3×2种(D ) 1×2×3种7.把4张同样的参观券分给5个代表,每⼈最多分⼀张,参观券全部分完,则不同的分法共有()(A )120种(B )1024种(C )625种(D )5种8.已知集合M={l ,-2,3},N={-4,5,6,7},从两个集合中各取⼀个元素作为点的坐标,则这样的坐标在直⾓坐标系中可表⽰第⼀、⼆象限内不同的点的个数是()(A )18 (B )17 (C )16 (D )109.三边长均为整数,且最⼤边为11的三⾓形的个数为()(A )25 (B )36 (C )26 (D )3710.如图,某城市中,M 、N 两地有整齐的道路⽹,若规定只能向东或向北两个⽅向沿途中路线前进,则从M 到N 不同的⾛法共有()(A )25 (B )15 (C)13 (D )10 ⼆.填空题:11.某书店有不同年级的语⽂、数学、英语练习册各10本,买其中⼀种有种⽅法;买其中两种有种⽅法.12.⼤⼩不等的两个正⽅形玩具,分别在各⾯上标有数字1,2,3,4,5,6,则向上的⾯标着的两个数字之积不少于20的情形有种.13.从1,2,3,4,7,9中任取不相同的两个数,分别作为对数的底数和真数,可得到个不同的对数值.14.在连结正⼋边形的三个顶点组成的三⾓形中,与正⼋边形有公共边的有个.15.某班宣传⼩组要出⼀期向英雄学习的专刊,现有红、黄、⽩、绿、蓝五种颜⾊的粉笔供选⽤,要求在⿊板中A 、B 、C 、D 每⼀部分只写⼀种颜⾊,如图所⽰,相邻两块颜⾊不同,则不同颜⾊的书写⽅法共有种.三.解答题:16.现由某校⾼⼀年级四个班学⽣34⼈,其中⼀、⼆、三、四班分别为7⼈、8⼈、9⼈、10⼈,他们⾃愿组成数学课外⼩组.(1)选其中⼀⼈为负责⼈,有多少种不同的选法?(2)每班选⼀名组长,有多少种不同的选法?(3)推选⼆⼈做中⼼发⾔,这⼆⼈需来⾃不同的班级,有多少种不同的选法?17.4名同学分别报名参加⾜球队,蓝球队、乒乓球队,每⼈限报其中⼀个运动队,不同的报名⽅法有⼏种?[探究与提⾼]1.甲、⼄两个正整数的最⼤公约数为60,求甲、⼄两数的公约数共有多个?2.从{-3,-2,-1,0,l,2,3}中,任取3个不同的数作为抛物线⽅程y=ax2+bx+c(a≠0)的系数,如果抛物线过原点,且顶点在第⼀象限,这样的抛物线共有多少条?3.电视台在“欢乐今宵”节⽬中拿出两个信箱,其中存放着先后两次竞猜中成绩优秀的群众来信,甲信箱中有30封,⼄信箱中有20封.现由主持⼈抽奖确定幸运观众,若先确定⼀名幸运之星,再从两信箱中各确定⼀名幸运伙伴,有多少种不同的结果?综合卷1.A 2.B 3.D 4.D 5.B 6.B 7.D 8.B 9.B 10.B11.30;300 12.513.17 14.40 15.1801. 2排列与组合1、排列综合卷1.90×9l ×92×……×100=()(A )10100A (B )11100A (C )12100A (D )11101A 2.下列各式中与排列数mn A 相等的是()(A )!(1)!-+n n m (B )n(n -1)(n -2)……(n -m) (C )11m n nA n m --+ (D )111m n n A A --3.若 n ∈N 且 n<20,则(27-n )(28-n)……(34-n)等于()(A )827n A - (B )2734nn A -- (C )734n A - (D )834n A -4.若S=123100123100A A A A ++++,则S 的个位数字是()(A )0 (B )3 (C )5 (D )85.⽤1,2,3,4,5这五个数字组成没有重复数字的三位数,其中偶数共有()(A )24个(B )30个(C )40个(D )60个6.从0,l ,3,5,7,9中任取两个数做除法,可得到不同的商共有()(A )20个(B )19个(C )25个(D )30个7.甲、⼄、丙、丁四种不同的种⼦,在三块不同⼟地上试种,其中种⼦甲必须试种,那么不同的试种⽅法共有()(A )12种(B )18种(C )24种(D )96种8.某天上午要排语⽂、数学、体育、计算机四节课,其中体育不排在第⼀节,那么这天上午课程表的不同排法共有()(A )6种(B )9种(C )18种(D )24种9.有四位司机、四个售票员组成四个⼩组,每组有⼀位司机和⼀位售票员,则不同的分组⽅案共有()(A )88A 种(B )48A 种(C )44A ·44A 种(D )44A 种10.有4位学⽣和3位⽼师站在⼀排拍照,任何两位⽼师不站在⼀起的不同排法共有()(A )(4!)2种(B )4!·3!种(C )34A ·4!种(D )3 5A ·4!种11.把5件不同的商品在货架上排成⼀排,其中a ,b 两种必须排在⼀起,⽽c ,d 两种不能排在⼀起,则不同排法共有()(A )12种(B )20种(C )24种(D )48种⼆.填空题::12.6个⼈站⼀排,甲不在排头,共有种不同排法.13.6个⼈站⼀排,甲不在排头,⼄不在排尾,共有种不同排法.14.五男⼆⼥排成⼀排,若男⽣甲必须排在排头或排尾,⼆⼥必须排在⼀起,不同的排法共有种.15.将红、黄、蓝、⽩、⿊5种颜⾊的⼩球,分别放⼊红、黄、蓝、⽩、⿊5种颜⾊的⼝袋中,但红⼝袋不能装⼊红球,则有种不同的放法.16.(1)有5本不同的书,从中选3本送给3名同学,每⼈各⼀本,共有种不同的送法;(2)有5种不同的书,要买3本送给3名同学,每⼈各⼀本,共有种不同的送法.三、解答题:17.⼀场晚会有5个唱歌节⽬和3个舞蹈节⽬,要求排出⼀个节⽬单(1)前4个节⽬中要有舞蹈,有多少种排法?(2)3个舞蹈节⽬要排在⼀起,有多少种排法?(3)3个舞蹈节⽬彼此要隔开,有多少种排法?18.三个⼥⽣和五个男⽣排成⼀排.(1)如果⼥⽣必须全排在⼀起,有多少种不同的排法?(2)如果⼥⽣必须全分开,有多少种不同的排法?(3)如果两端都不能排⼥⽣,有多少种不同的排法?(4)如果两端不能都排⼥⽣,有多少种不同的排法?(5)如果三个⼥⽣站在前排,五个男⽣站在后排,有多少种不同的排法?综合卷1.B 2.D 3.D 4.C 5.A 6.B 7.B 8.C 9.D 10.D 11.C12.600 13.504 14.480 15.9616.(1) 60;(2) 12517.(1) 37440;(2) 4320;(3) 1440018.(1) 4320;(2) 14400;(3) 14400;(4) 36000;(5) 7202、组合综合卷⼀、选择题:1.下列等式不正确的是()(A )!!()!mn n C m n m =- (B )11mm n n m C C n m++=- (C )1111m m n n m C C n +++=+ (D )11m m n n C C ++= 2.下列等式不正确的是()(A )m n m n n C C -= (B )11m m mm m m C C C -++=(C )123455555552C C C C C ++++= (D )11 111m m m m n n n n C C C C --+--=++3.⽅程2551616x x x C C --=的解共有()(A )1个(B )2个(C )3个(D )4个4.若372345n n n C A ---=,则n 的值是()(A )11 (B )12 (C )13 (D )145.已知7781n n n C C C +-=,那么n 的值是()(A )12 (B )13 (C )14 (D )15 6.从5名男⽣中挑选3⼈,4名⼥⽣中挑选2⼈,组成⼀个⼩组,不同的挑选⽅法共有()(A )3254C C 种(B ) 3254C C 55A 种(C ) 3254A A 种(D ) 3254A A 55A 种7.从4个男⽣,3个⼥⽣中挑选4⼈参加智⼒竞赛,要求⾄少有⼀个⼥⽣参加的选法共有()(A )12种(B )34种(C )35种(D )340种8.平⾯上有7个点,除某三点在⼀直线上外,再⽆其它三点共线,若过其中两点作⼀直线,则可作成不同的直线()(A )18条(B )19条(C )20条(D )21条9.在9件产品中,有⼀级品4件,⼆级品3件,三级品2件,现抽取4个检查,⾄少有两件⼀级品的抽法共有()(A )60种(B )81种(C )100种(D )126种10.某电⼦元件电路有⼀个由三节电阻串联组成的回路,共有6个焊点,若其中某⼀焊点脱落,电路就不通.现今回路不通,焊点脱落情况的可能有()(A )5种(B )6种(C )63种(D )64种⼆.填空题:11.若11m m n n C xC --=,则x= .12.三名教师教六个班的课,每⼈教两个班,分配⽅案共有种。
第三章统计案例(综合训练1)一、学习要求1.通过典型案例的探究,了解统计学中对两个变量统计分析的思想方法和步骤;2.能综合运用概率、统计的知识解决有关问题。
二、问题探究■合作探究例1.【10新课标(文19)】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要40 30不需要160 270(1)估计该地区老年人中,需要志愿者提供帮助的老年人比例;(2)能否有的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:0.050 0.010 0.0013.841 6.635 10.828。
【解析】(1)样本中,该地区的老年人需要志愿者提供帮助的有:403070+=(人),∴估计该地区老年人中,需要志愿者提供帮助的老年人比例为:707 50050=。
(2)根据表中数据,得到:,∵,∴有的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关。
(3)根据(2)的结论可知,地区的老年人是否需要志愿者提供帮助与性别有关,所以可按性别进行分层抽样调查,从而能更好地估计该地区的老年人中需要志愿者提供帮助的老年人的比例。
■自主探究1.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查,得到了如下的列联表:喜爱打篮球不喜爱打篮球合计男生 5女生10合计50已知在全部50人中随机抽取1人,抽到喜爱打篮球的学生的概率为。
(Ⅰ)补充完整上面的列联表,并判断是否有的把握认为喜爱打篮球与性别有关?(Ⅱ)若采用分层抽样的方法从喜爱打篮球的学生中随机抽取3人,则男生和女生抽取的人数分别是多少?解:(Ⅰ)这50人中喜爱打篮球的人数为:(人)。
列联表补充如下:喜爱打篮球不喜爱打篮球合计男生20 5 25女生10 15 25合计30 20 50,∵,∴有的把握认为喜爱打篮球与性别有关。
一、选择题1.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==2.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 4.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .45.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040506070根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位 B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系) 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.19.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:男生 女生 合计 喜欢抖音上课 10不喜欢抖音上课8合计 30已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付 支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++.24.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > , 2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
整合提升知识网络知识回顾1.独立性检验的含义及操作过程若事件A 与B 独立,即P(AB)=P(A)-P(B) 统计假设H 0∶P(AB)=P(A)-P(B)根据概率的统计定义,上述H 0用频率来估计.2.φ2=2121221122211)(++++-n n n n n n n n n①若φ2值较大,则拒绝H 0,即A 、B 有关.②当φ2>3.841时,有95%的把握说A 、B 有关; 当φ2>6.635时,有99%的把握说A 、B 有关;当φ2≤2.706时,没有充分的证据显示A 与B 有关系. 3.回归方程的确定x b y aˆˆ-= ∑∑==---=ni ini i ix xy y x xb121)())((ˆ4.相关系数r r=∑∑∑----22)()())((y y x x y y x x iii i5.r 的性质|r|≤1且|r|越接近于1,线性相关程度越强;|r|越接近于0,线性相关性越弱. 典例精讲【例1】每立方米混凝土的水泥用量x(单位: kg)与28天后混凝土的抗压强度(单位: kg/cm 2)之间的关系有如下数据:(2)如果y 与x 之间具有线性相关关系,求回归直线方程.r=)6.721294.64572)(20512518600(6.722051218294322⨯-⨯-⨯⨯-≈0.999,查得r 0.05=0.576,因r >r 0.05,说明变量y 与x 之间具有显著的线性相关关系. (2)b=2205125186006.7220512182⨯-⨯⨯-=143004347≈0.304,a=y -b x =72.6-0.304×205=10.28.于是所求的线性回归方程是yˆ=0.304x+10.28. 温馨提示求回归直线方程和相关系数,通常是用计算器来完成的.在有的较专门的计算器中,可通过直接按键得出回归直线方程的系数和相关系数.(1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?b=∑∑∑=====-51512513.112,905i i i i ii iiy x xyx yx =103.1245905453.1122=⨯-⨯⨯-=1.23 a=y -b x =5-1.23×4=0.08.∴回归直线方程为yˆ=1.23x+0.08. (2)当x=10时,yˆ=1.23x×10+0.08=12.38 (万元) 即估计用10年时维修费约为12.38万元.温馨提示知道x 与y 呈线性相关关系,就无需进行相关性检验.否则,应首先进行相关性检验,若两个变量不具备相关关系,或者说,它们之间相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.【例3】从某地成年男子中随机抽取n 人,测得平均身高x =172 cm,标准差S x =7.6 cm,平均体重y =72 kg,标准差S y =15.2 kg,相关系数r=yyxx xy l l l =0.5.求由身高估计平均体重的回归方程yˆ=β0+β1x,以及由体重估计平均身高的回归方程x ˆ=+y. 解:∵S x =n l xx,S y =nl yy ,∴nl xy =n l xx ·nl yy =0.5×7.6×15.2=57.76. ∴βˆ=26.776.57=nl n l xx xy=1, βˆ0=y -x βˆ1=72-172×1=-100, ∴由身高估计平均体重的回归方程为yˆ=x-100.由x,y 位置的对称性,得=26.776.57=nl n l xx xy=0.25. ∴aˆ=x -b y ˆ=172-72×0.25=154, ∴由体重估计平均身高的回归方程为xˆ=0.25y+154. 温馨提示为了进行相关性检验,通常将有关数据列成表格,然后借助于计算器算出各个量,为求回归直线方程扫清障碍.【例4】一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数(2)求月总成本y 与月产量x 之间的回归直线方程. 解:(1)画出的散点图如下图所示.于是可得∑∑==--=121i 221211212ˆx x y x yx b i i ii=2)125.18(12808.298475.2125.1812243.54⨯-⨯⨯-≈1.215aˆ=y -x b ˆ=2.847 5-1.215×125.18≈0.974. 因此所求的回归直线方程是yˆ=1.215x+0.974. 温馨提示掌握一定的计算机程序是解决计算题的法宝.(1)画出散点图; (2)求回归直线方程. 解析:(1)散点图如下图所示计算相关系数,得 r=)50513500)(55145(5055138022⨯-⨯-⨯⨯-≈0.92.查表得r0.05=0.878,因为r >r 0.05,说明变量y 与x 存在着显著的线性相关关系. 设其回归方程为=+x.bˆ=2251251551455505138055⨯-⨯-=--∑∑==xx yx yx i i i ii =6.5.aˆ=y-x bˆ=50-6.5×5=17.5.于是所求的回归方程为yˆ=6.5x+17.5.温馨提示在线性回归分析中,应先进行相关性检验,再求线性回归方程.。
第三章统计案例1.最小二乘法对于一组数据(x i ,y i ),i =1,2,…,n ,如果它们线性相关,则线性回归方程为y ^=b ^x +a ^,其中b ^=2.2×2列联表 2×2列联表如表所示:其中n =a +b +c +d 为样本容量. 3.K 2检验 常用随机变量K 2=n (ad -b c )2(a +b )(c +d )(a +c )(b +d )来检验两个变量是否有关系.1.回归分析的两个关注点(1)回归分析是建立在两个具有相关性的变量之间的一种模拟分析,因此先判断其是否具有相关性.(2)并非只有线性相关关系,还可能存在非线性相关关系. 2.独立性检验的两个注意点(1)通过独立性检验得到的结论未必正确,它只是对一种可靠性的预测. (2)2×2列联表中,当数据a ,b ,c ,d 都不小于5时,才可以用K 2检验.主题1 回归分析某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(1)根据散点图判断,y=a+bx与y=c+d x哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:且知x与y具有线性相关关系,求出y关于x的回归直线方程,并说明拟合效果的好坏.主题2独立性检验某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数大于等于70的人,饮食以肉类为主.)(1)根据茎叶图,帮助这位同学说明其30位亲属的饮食习惯;(2)根据以上数据完成如表所示的2×2列联表.(3)能否在犯错误的概率不超过0.01的前提下认为“其亲属的饮食习惯与年龄有关”?在考查黄烟是否经过药物处理与发生青花病的关系时,得到如下数据:在试验的470株黄烟中,经过药物处理的黄烟有25株发生青花病,60株没有发生青花病;未经过药物处理的有185株发生青花病,200株没有发生青花病.试推断经过药物处理跟发生青花病是否有关系.[A 基础达标]1.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A .由样本数据得到的回归方程y ^=b ^x +a ^必过样本点的中心(x ,y ) B .残差平方和越小的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D .若变量y 和x 之间的相关系数r =-0.936 2,则变量y 与x 之间具有线性相关关系 2.下列说法中正确的有:( ) ①若r >0,则x 增大时,y 也相应增大; ②若r <0,则x 增大时,y 也相应增大;③若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上. A .①② B .②③ C .①③D .①②③3.若两个变量的残差平方和是325, i =1n(y i -y ―)2=923,则随机误差对预报变量的贡献率约为( ) A .64.8% B .60% C .35.2%D .40%4.有下列数据下列四个函数中,模拟效果最好的为( ) A .y =3×2x -1 B .y =log 2x C .y =3xD .y =x 25.通过随机询问100名性别不同的小学生是否爱吃零食,得到如下的列联表:由K 2=n (ad -b c )(a +b )(c +d )(a +c )(b +d ),计算得K 2=100(10×30-20×40)250×50×30×70≈4.762.参照附表,得到的正确结论为( )A .在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”B .在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”C .有97.5%以上的把握认为“是否爱吃零食与性别有关”D .有97.5%以上的把握认为“是否爱吃零食与性别无关”6.某种活性细胞的存活率y (%)与存放温度x (℃)之间有如下几组样本数据:经测算,上述样本数据具有线性相关关系,且回归直线的斜率为-3.2.则当存放温度为6 ℃时,该种细胞的存活率的预报值为________%. 6时,y ^=-3.2×6+53.2=34.7.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y =3e 2x +1的图象附近,则可通过转换得到的线性回归方程为________.8.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:根据列联表数据,求得K 2=________(保留3位有效数字),根据下表,在犯错误的概率不超过________的前提下认为患慢性气管炎与吸烟有关. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).9.某学校高三年级有学生1 000名,经调查,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B 类同学),现用分层抽样方法(按A 类、B 类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 c m 作为达标的标准,对抽取的100名学生,得到以下列联表:(1)完成上表;(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K 2的观测值精确到0.001)?10.某城市理论预测2011年到2015年人口总数与年份的关系如表所示:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)据此估计2018年该城市人口总数.[B 能力提升]11.(2018·河南洛阳3月模拟)某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东、西部各5个城市,得到观看该节目的人数的统计数据(单位:千人),并画出如下茎叶图,其中一个数字被污损.(1)求东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数的概率;(2)该节目的播出极大地激发了观众对成语知识学习积累的热情,现从观看节目的观众中随机统计了4位观众学习成语知识的周均时间(单位:小时)与年龄(单位:岁),并制作了如下对照表:根据表中数据,试求线性回归方程y ^=b ^x +a ^,并预测年龄为60岁的观众周均学习成语知识的时间.12.(选做题)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如下茎叶图.根据医学知识,我们认为此项指标大于40为偏高,反之即为正常.(1)依据上述样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系?(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X的分布列及数学期望.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d,——★ 参 考 答 案 ★——主题1 回归分析解:(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.c ^=y ―-d ^w ―=563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程. (3)回归分析.画残差图或计算R 2,进行残差分析. (4)实际应用.依据求得的回归方程解决问题.解:x ―=15×(14+16+18+20+22)=18,y ―=15×(12+10+7+5+3)=7.4,所以a ^=7.4+1.15×18=28.1,所以y 对x 的回归直线方程为y ^=-1.15x +28.1. 列出残差表为主题2 独立性检验解:(1)30位亲属中50岁以上的人饮食多以蔬菜为主,50岁以下的人饮食多以肉类为主.(2)2×2列联表如表所示:(3)随机变量K 2的观测值k =30×(4×2-8×16)212×18×20×10=10>6.635,所以在犯错误的概率不超过0.01的前提下认为“其亲属的饮食习惯与年龄有关”.独立性检验问题的求解策略(1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性.(2)K 2统计量法:通过公式 K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )先计算观测值k ,再与临界值表作比较,最后得出结论.解:由已知,得2×2列联表如下:提出假设H 0:经过药物处理跟发生青花病无关系. 根据列联表中的数据,可以求得随机变量K 2的观测值为 k =470×(25×200-185×60)2210×260×85×385≈9.788.因为当H 0成立时,K 2≥7.879的概率约为0.005,而此时K 2的观测值k ≈9.788>7.879, 所以在犯错误的概率不超过0.005的前提下认为经过药物处理跟发生青花病是有关系的.[A 基础达标]1.C[[解析]]R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C. 2.C[[解析]]若r >0,表示两个相关变量正相关,x 增大时,y 也相应增大,故①正确,r <0,表示两个变量负相关,x 增大时,y 相应减小,故②错误.|r |越接近1,表示两个变量相关性越高,|r |=1表示两个变量有确定的关系(即函数关系),故③正确. 3.C[[解析]]由题意可知随机误差对预报变量的贡献率约为325923≈0.352. 4.A[[解析]]分别把x =1,2,3,代入求值,求最接近y 的值,即为模拟效果最好,故选A. 5.A[[解析]]因为K 2≈4.762>3.841,P (K 2>3.841)=0.05.所以在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”,故选A. 6.34[[解析]]设回归直线方程为y ^=-3.2x +a ^,因为x ―=1,y ―=50,则a ^=y ―+3.2x ―=53.2.当x =6时,y ^=-3.2×6+53.2=34. 7.u =1+ln 3+2x (其中u =ln y ) [[解析]]由y =3e 2x +1, 得ln y =ln (3e 2x +1), 即ln y =ln 3+2x +1,令u =ln y ,v =x ,则线性回归方程为u =1+ln 3+2v . 8.22.2 0.001 [[解析]]K 2的观测值k =100×(20×55-20×5)240×60×25×75≈22.2>10.828.所以在犯错误的概率不超过0.001的前提下认为患慢性气管炎与吸烟有关. 9.解:(1)填写列联表如下:(2)由列联表中的数据,得K 2的观测值为 k =100×(40×15-35×10)275×25×50×50≈1.333<3.841.所以不能在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系. 10.解:(1)散点图如图:(2)因为x ―=0+1+2+3+45=2,y ―=5+7+8+11+195=10,a ^=y -b ^x =3.6;所以线性回归方程为y ^=3.2x +3.6. (3)令x =7,则y ^=3.2×7+3.6=26.即估计2018年该城市人口总数为26十万.[B 能力提升]11.解:(1)设被污损的数字为a ,则a 有10种情况. 由88+89+90+91+92>83+83+87+90+a +99,得a <8,所以有8种情况使得东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数, 所求概率为810=45.a ^=y -b ^x =3.5-7100×35=2120.所以y ^=7100x +2120.当x =60时,y ^=5.25.即预测年龄为60岁的观众周均学习成语知识的时间为5.25小时. 12.解:(1)由茎叶图可得2×2列联表:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=40×(16×8-4×12)220×20×28×12≈1.905<6.635,所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系. (2)由样本数据可知,男性正常的概率为45,女性正常的概率为35.此项血液指标为正常的人数X 的可能取值为0,1,2,3,4, P (X =0)=(1-45)2(1-35)2=4625,P (X =1)=C 1245(1-45)(1-35)2+(1-45)2C 1235(1-35)=44625, P (X =2)=⎝⎛⎭⎫452⎝⎛⎭⎫1-352+C 1245⎝⎛⎭⎫1-45C 1235·⎝⎛⎭⎫1-35+⎝⎛⎭⎫1-452⎝⎛⎭⎫352=169625, P (X =3)=C 1245⎝⎛⎭⎫1-45⎝⎛⎭⎫352+⎝⎛⎭⎫452C 1235·⎝⎛⎭⎫1-35=264625, P (X =4)=⎝⎛⎭⎫452⎝⎛⎭⎫352=144625,所以X 的分布列为所以E (X )=0×4625+1×44625+2×169625+3×264625+4×144625=2.8,即此项血液指标为正常的人数X 的数学期望为2.8.。
人教版高中选修2-3第三章统计案例课程设计课程目标本课程旨在帮助学生通过现实统计案例的学习,加深对统计学知识的理解,并学会运用统计方法进行数据分析和推断。
具体课程目标包括:1.了解统计学的基本概念和方法,包括描述性统计和推论统计;2.掌握常见的统计方法和工具,如样本调查、假设检验等;3.学会运用统计方法进行数据分析和推断,并能通过数据可视化工具呈现分析结果;4.能够阅读与理解统计报告、统计学术论文等。
课程内容Part 1 统计学基础概念和方法本部分主要介绍统计学的基本概念和方法,包括数据类型、数据的中心趋势和离散程度等内容。
1.1 数据类型•定义:介绍数据的种类,包括定量数据和定性数据。
•实战练习:举例区分不同类型的数据。
1.2 中心趋势和离散程度•定义:介绍数据的中心趋势和离散程度的计算方法,如均值、中位数、众数、方差、标准差等。
•实战练习:利用给定数据计算中心趋势和离散程度,并对结果进行分析。
Part 2 统计方法和工具本部分主要介绍统计方法和工具,包括样本调查、假设检验等内容。
2.1 样本调查•定义:介绍样本调查的基本概念和实现方法,如随机抽样、分层抽样等。
•实战练习:通过样本调查,进行数据收集和分析,并进行推断。
2.2 假设检验•定义:介绍假设检验的基本概念和实现方法,如单样本t检验、双样本t检验、卡方检验等。
•实战练习:通过假设检验讨论问题,并进行数据分析和推断。
Part 3 统计案例分析本部分主要包括一些实际应用统计学的案例,包括医疗保健、环境污染等内容。
3.1 医疗保健案例•定义:介绍医疗保健案例的背景和数据收集方法。
•实战练习:通过医疗保健案例,进行数据分析和推断,讨论如何优化医疗保健服务。
3.2 环境污染案例•定义:介绍环境污染案例的背景和数据收集方法。
•实战练习:通过环境污染案例,进行数据分析和推断,讨论如何加强环保管理。
课程作业本课程作业旨在让学生将所学的统计知识运用到实际问题中,并通过数据分析和可视化工具呈现结果。
1.相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.2.线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^,a^其中,b是回归方程的斜率,a是在y轴上的截距.4.样本相关系数r=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2∑i=1n(y i-y)2,用它来衡量两个变量间的线性相关关系.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.5.线性回归模型(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差.(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.注意(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.考向一相关关系的判断例1.下列选项中,两个变量具有相关关系的是( )A.正方形的面积与周长B.匀速行驶车辆的行驶路程与时间C.人的身高与体重D.人的身高与视力答案:C例2.对变量x、y有观测数据(x i,y i)(i =1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C.由题图1可知,各点整体呈递减趋势,x与y负相关,由题图2可知,各点整体呈递增趋势,u与v正相关.例3.下面哪些变量是相关关系().A.出租车车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁块的大小与质量解析A,B,D都是函数关系,其中A一般是分段函数,只有C是相关关系.答案 C例4.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据的线性相关性最大.解析:因为A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.答案:D例5.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v 有观测数据(u i、v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断().A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.答案 C例6.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.球的体积与半径之间的关系C.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程D.一个家庭的收入与支出解析:选C.A、D中的两个变量属于线性正相关,B中两个变量是函数关系.例7.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):(1)画出散点图;(2)判断是否具有相关关系.[审题视点] (1)用x 轴表示化肥施用量,y 轴表示棉花产量,逐一画点.(2)根据散点图,分析两个变量是否存在相关关系.解 (1)散点图如图所示(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.例8. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).解析从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.答案否考向二线性回归方程例9.对有线性相关关系的两个变量建立的回归直线方程y^=a+bx中,回归系数b( )A.不能小于0 B.不能大于0C.不能等于0 D.只能小于0解析:选C.∵b=0时,r=0,这时不具有线性相关关系,但b能大于0也能小于0.例10.已知回归方程y^=4.4x+838.19,则可估计x与y的增长速度之比约为________.解析:x与y的增长速度之比即为回归方程的斜率的倒数14.4=1044=522.答案:5 22例11.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是().A.y^=-10x+200 B.y^=10x+200 C.y^=-10x-200 D.y^=10x-200 解析因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数,再排除C,故选A.答案 A例12.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[审题视点] (2)问利用公式求a ^、b ^,即可求出线性回归方程.(3)问将x =100代入回归直线方程即可. 解 (1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得:i =14x 2i =86,x =3+4+5+64= 4.5(吨),y =2.5+3+4+4.54=3.5(吨). 已知∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为:b ^=∑i =14x i y i -4x ·y ∑i =14x 2i -4x 2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.例13.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x的线性回归方程为().A.y=x-1 B.y=x+1C.y=88+12x D.y=176解析由题意得x=174+176+176+176+1785=176(cm),y=175+175+176+177+1775=176(cm),由于(x,y)一定满足线性回归方程,经验证知选C.答案 C例14.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y^=bx+a;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:对预处理后的数据,容易算得,x=0,y=3.2,b=26040=6.5,a=y-b x=3.2.由上述计算结果,知所求回归直线方程为y -257=b(x-2 006)+a=6.5(x-2 006)+3.2,即y^=6.5(x-2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).例15.下列有关回归直线方程y^=bx+a 的叙述正确的是( )①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①② B.②③C.③④ D.①④解析:选D.y^=bx+a表示y^与x之间的函数关系,而不是y与x之间的函数关系;但它反映的关系最接近y与x之间的真实关系,故选D.例16.设有一个回归方程y^=3-5x,变量x增加一个单位时( )A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位解析:选B.∵-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.例17.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不.正确的是( ) A.由样本数据得到的回归方程y^=b^x+a^必过样本中心(x,y)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r =-0.9362,则变量y和x之间具有线性相关关系解析:选C.C中应为R2越大拟合效果越好.例18.已知回归方程y^=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是( )A .0.01B .0.02C .0.03D .0.04解析:选C.当x =2时,y ^=5, 当x =3时,y ^=7,当x =4时,y ^=9.∴e ^1=4.9-5=-0.1,e ^2=7.1-7=0.1, e ^3=9.1-9=0.1.∴ i =13e ^i 2=(-0.1)2+(0.1)2+(0.1)2=0.03.例19.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②回归方程y ^=bx +a 必过点(x ,y ); ③曲线上的点与该点的坐标之间具有相关关系;④在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是 90%.其中错误的是________.解析:①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.答案:③④例20.在2009年十一国庆8天黄金周期间,某市物价部门,对本市五个商场销售的某商品的一天销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:9通过分析,发现销售量对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.解析:由数据表可得x=10,y=8,离差x-x:-1,-0.5,0,0.5,1;离差y-y:3,2,0,-2,-3.∴b^=-1×3-0.5×2-0.5×2-1×3 1+0.25+0+0.25+1=-3.2,a ^=y -b ^x =40,∴回归直线方程为y ^=-3.2x +40. 答案:y ^=-3.2x +40例21.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.解:以x 轴表示身高,y 轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程y^=b^ x+a^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?解:(1)设抽到不相邻2组数据为事件A,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻2组数据的情况有4种,所以P(A)=1-410=35.(2)由数据求得,x=12,y=27,由公式求得.b^=52,a^=y-b^x=-3.所以y关于x的线性回归方程为y^=5 2 x-3.(3)当x=10时,y^=52×10-3=22,|22-23|<2;当x=8时,y^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的.。
整合提升知识网络典例精讲第二、三章内容是概率统计的基础,重点,知识与知识板块联系紧密,在学习过程中,要注意知识的前后沟通与相互应用,使整个概率统计部分成为一个有机整体.此外,在处理数据时,计算量较大且繁琐,注意用科学的方法与计算器来处理,使之简单化.【例1】一袋中装有6个同样大小的黑球,编号为1,2,3,4,5,6,现从中随机取出3个球,以ξ表示取出球的最大号码,求ξ的分布列.分析:随机取出3个球的最大号码ξ所有可能取值为3,4,5,6.“ξ=3”对应事件“取出的3个球,编号为1,2,3”;“ξ=4”对应事件“取出的3个球中”恰取到4号球和1,2,3号球中的2个;“ξ=5”对应事件“取出的3个球中”恰取到5号球和1,2,3,4号球中的2个;“ξ=6”对应事件“取出的3个球中”恰取到6号球及1,2,3,4,5号球中的2个,而要求其概率则要利用等可能事件的概率公式和排列组合知识来求解,从而获得ξ的分布列.解析:随机变量ξ的取值为3,4,5,6.从袋中随机地取3个球,包含的基本事件总数为36C ,事件“ξ=3”包含的基本事件总数为33C ,事件“ξ=4”包含的基本事件总为11C 23C ;事件“ξ=5”包含的基本事件总数为11C 24C ;事件“ξ=6”包含的基本事件总数为11C 25C ;从而有 p(ξ=3)=2013633=C Cp(ξ=4)=203362311=C C C ;p(ξ=5)=103362411=C C C ; p(ξ=6)=21362511=C C C .【例2】在一袋中有一只红球和九只白球,每次从袋中取出一球记下颜色后放回,求取得红 球次数ξ的分布列.解析:取得红球次数ξ的值为0、1、3、……、n ,由于每次取球相互独立且“环境”相同,所以可以看成是n 次独立重复试验,故服从二项分布ξ—B(n,0.1).∴P(ξ=k)= kn C (0.1)k ×0.9n -k,故ξ的分布列为:【例3】坛子里放着5个相同大小,相同形状的咸鸭蛋,其中有3个是绿皮的,2个是白皮的.如果不放回地依次拿出2个鸭蛋,求: (1)第1次拿出绿皮鸭蛋的概率;(2)第1次和第2次都拿到绿皮鸭蛋的概率;(3)在第1次拿出绿皮鸭蛋的条件下,第2次拿出绿皮鸭蛋的概率.解析:设第1次拿出绿皮鸭蛋为事件A ,第2次拿出绿皮鸭蛋为事件B ,则第1次和第2次都拿出绿皮鸭蛋为事件AB.(1)从5个鸭蛋中不放回地依次拿出2个事件数为n(Ω)=25A =20.根据分步乘法计数原理,n(A)=13A ×14A =12.于是P(A)=532012)()(==Ωn A n . (2)因为n(AB)=23A =6,所以P(AB)=206)()(=Ωn AB n =103.(3)解法一 由(1)(2)可得,在第1次拿出绿皮鸭蛋的条件下,第2次拿出绿皮鸭蛋的概率为P(B|A)=53103)()(=A P AB P =21. 解法二 因为n(AB)=6,n(A)=12,所以P(B|A)=126)()(=A n AB n =21. 【例4】一个袋中装有大小相同的球,其中红球5个,黑球3个,现从中随机摸出3个球. (1)求至少摸到一个红球的概率;(2)求摸到黑球个数X 的概率分布和均值. 解析:(1)至少摸到一个红球的概率P=1-5655383305=C C C . (2)设X 表示摸到黑球的个数,P(X=0)= 285383303=C C C , P(X=1)= 2815382513=C C C , P(X=2)=5615381523=C C C , P(X=3)=561380533=C C C . 摸到黑球的个数X 的概率分布为:EX=1·2815+2·5615+3·615=89. 【例5】一袋中有3个白球,3个红球和5个黑球,从袋中随机取3个球,假定取得一个白球得1分,取得一个红球扣1分,取得一个黑球既不得分也不扣分,求所得分数的概率分布及期望值与方差.解析:设ξ为所得分数,则ξ可以取0,±1,±2,±3.ξ=0表示所取3球的分数和为0,即取3个黑球或取一白、一红、一黑,故有P(ξ=0)=1655531115131335=+C C C C C ; ξ=1表示所取3球的分数和为1,即取一白二黑或二白一红,故有P(ξ=1)=551331113232513=+C C C C C ;ξ=2表示所取球的分数和为2,即取二白一黑,故P(ξ=2)=1113111523=C C C ; ξ=3表示所取球的分数和为3,即取三白,故P(ξ=3)=165131133=C C .类似地,我们可求得P(ξ=-1)=13,P(ξ=-2)=1,P(ξ=-3)= 1,故ξ的分布列为:∴Eξ=(-3)×165+(-2)×11+(-1)×55+0×165+1×55+2×11+3×165=0Dξ=(-3)2×1651+(-2)2×111+(-1)2×5513+02×16555+12×5513+22×111+32×1651=165216=1.3.【例6】某厂生产的T 1型的零件的外直径ξ—N(10,0.22),一天从某厂上午、下午生产 的T 1型零件中各随机取出一个,测得其外直径分别为9.92 cm 和9.30 cm.试分析该厂这 一天的生产状况是否正常?思路分析:因为ξ—N(10,0.22),这里μ=10,σ=0.2.正态总体在区间(μ-3σ,μ+3σ)内的概率为99.7%,在此区间外的概率为0.3%,概率值很小.我们只要算出(μ-3σ,μ+3σ).便可通过判定抽得的产品是否落在这一区间来分析生产是否正常. 解:(μ-3σ,μ+3σ)=(9.4,10.6).因为9.92∈(9.4,10.6),可知该厂上午的生产正常.而9.30∉(9.4,10.6),小概率事件发生了.说明该厂下午的生产有异常情况发生.需要立即停机检查,找出原因. 温馨提示若ξ—N(μ,σ2),则正态总体在区间(μ-σ,μ+σ)的概率为68.3%.在区间(μ-2σ,μ+2σ)的概率为95.4%,在区间(μ-3σ,μ+3σ)的概率为99.7%,记住了这些值对解决正态分布问题很方便.“一次试验中,小概率事件几乎不可能发生”是统计中常用的假设检验方法的基本思想.【例7】调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表,试问能 以多大把握认为婴儿的性别与出生时间有关系.解析:∵K 2=34555732)8312624(892⨯⨯⨯⨯-⨯⨯≈3.69>2.706∴我们有90%的把握认为婴儿的性别与出生时间有关系.。
最新人教版高中数学选修2-3《统计案例》本章概览
第三章统计案例
本章概览
三维目标
通过收集现实问题中的两个有关联变量的数据作出散点图,并能利用散点图直观认识两变量的相关关系.通过对典型案例的探究,进一步了解回归的基本思想、方法及初步应用.
通过案例来认识、思考,根据问题的需求合理地选择不同的方法,合理地选取样本,从样本数据中提取需要的数字特征,经历数据处理全过程,在此过程中学习并应用回归分析的一些方法.
学会对数据的收集、整理和分析,增强社会实践能力,提高解决问题的能力.
通过对典型案例的分析与探究,认识、归纳和总结独立性检验的基本思想、方法及其初步应用.
通过探究案例、解决实际问题的过程,了解独立性检验这种统计方法的用法与本质.
经历数据处理的过程,从而训练我们对数据的直观感觉,体会统计方法应用的广泛性,养成科学严谨的学习态度与品质.。
统计案例一、知识要点1.回归分析(1)定义:对具有____________的两个变量进行统计分析的一种常用方法. (2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^ =b ^ x +a ^的斜率和截距的最小二乘估计分别为:b ^=________________,a ^=____________.(3)相关指数 R 2=________________________________.R 2的值越大,说明残差平方和________,也就是说模型的拟合效果________.在线性回归模型中,R 2表示解释变量对于预报变量变化的贡献率,R 2越接近于1,表示回归的效果越好. 2.独立性检验(1)分类变量:变量的不同“值”表示个体所属的__________,像这类变量称为分类变量.(2)列联表:列出两个分类变量的__________,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为构造一个随机变量K 2=____________________,其中n =____________为样本容量.(3)独立性检验利用随机变量________来判断“两个分类变量__________”的方法称为独立性检验. 题型一 线性回归分析【例1 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是 ( )A .模型1的相关指数R 2为0.98B .模型2的相关指数R 2为0.80C .模型3的相关指数R 2为0.50D .模型4的相关指数R 2为0.25 练习:1.下列说法错误..的个数是 ( ) A .1 B .2 C .3 D .4 ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ^=3-5x ,变量x 增加1个单位时,y 平均增加5个单位;③线性回归方程y ^=bx +a 必过(x ,y );④曲线上的点与该点的坐标之间具有相关关系;(1)(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.题型二 独立性检验【例2 某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.说明:下图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.(1)根据以上数据完成2×2列联表:主食肉类合计附:K 2=n (ad -bc )2 ( 如下表)题型三 独立性检验的综合应用例3 为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?练习:为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜爱打篮球与性别有关?说明你的理由;(3)已知喜爱打篮球的10位女生中,A 1,A 2,A 3,A 4,A 5还喜欢打羽毛球,B 1,B 2,B 3还喜欢打乒乓球,C 1,C 2还喜欢踢足球,现再从喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的女生中各选出1名进行其他方面的调查,求B 1和C 1不全被选中的概率.课后练习( ) A .有99%以上的把握认为“爱好该项运动与性别有关” B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 2.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( )①若K 2的观测值满足K 2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. A .① B .①③ C .③ D .②3.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:则认为选修文科与性别有关系出错的可能性为________.4.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15们的身高和体重制成2×2列联表,根据列联表的数据,可以有________的把握认为该学校15至16周岁的男生的身高和体重之间有关系.5.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K 2的观测值k =27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关).6.为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查对临界值表知P (K 2≥3.841)≈0.05.对此,四名同学作出了以下的判断:p :有95%的把握认为“这种血清能起到预防感冒的作用”;q :若某人未使用该血清,那么他在一年中有95%的可能性得感冒; r :这种血清预防感冒的有效率为95%; s :这种血清预防感冒的有效率为5%.则下列结论中,正确结论的是________.7. 下列命题正确的个数是( )A .1 B .2 C .3 D .4 (1)回归分析是对具有函数关系的两个变量进行统计分析的一种方法;(2)线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱; (3)残差平方和越小的模型,模型拟合的效果越好;(4)用相关指数R 2来刻画回归效果,R 2越小,说明模型的拟合效果越好.(5)在回归线方程=0.4x+12中,变量x 每增加一个单位,平均增加约为0.4个单位8.[2014·辽宁卷] 一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图1-4所示.将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;(2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列,期望E(X)及方差D(X).。
选修2-3统计案例2一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.(2010·宁夏银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,其线性回归直线方程是y ^=-0.7x +a ,则a 等于( )A .10.5B .5.15C .5.2D .5.252.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵轴上的截距是a ,那么必有( )A .b 与r 的符号相同B .a 与r 的符号相同C .b 与r 的符号相反D .a 与r 的符号相反 3.有下列说法:①随机误差是引起预报值与真实值之间的误差的原因之一; ②残差平方和越小,预报精度越高;③在独立性检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系.其中真命题的个数是( ) A .0 B .1 C .2D .34.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下: 甲乙现要比较两种钢材哪一种抗拉强度较好,应考察哪项指标( ) A .期望与方差 B .正态分布 C .卡方K 2D .概率5.为调查中学生近视情况,测得某校男生150名中有80名近视,女生140名中有70名近视.在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A .期望与方差B .排列与组合C .独立性检验D .概率6.(2009·海南宁夏理,3)对变量x ,y 观测数据(x 1,y 1)(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u 1,v 1)(i =1,2,…,10),得散点图2.由这两个散点图可以判断.( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关7.某地2010年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:行业名称 计算机 机械 营销 物流 贸易 应聘人数2158302002501546767457065280行业名称 计算机 营销 机械 建筑 化工 招聘人数124620102935891157651670436则根据表中数据,就业形势一定是( )A .计算机行业好于化工行业B .建筑行业好于物流行业C .机械行业最紧张D .营销行业比贸易行业紧张8.工人月工资y (单位:元)关于劳动生产率x (单位:千元)的回归方程为y ^=650+80x ,下列说法中正确的个数是( )①劳动生产率为1000元时,工资约为730元;②劳动生产率提高1000元时,则工资约提高80元; ③劳动生产率提高1000元时,则工资约提高730元; ④当月工资为810元时,劳动生产率约为2000元. A .1 B .2 C .3D .49.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A .由样本数据得到的回归方程为y ^=b ^x +a ^必过样本点的中心(x -,y -) B .残差平方和越小的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D .若变量y 和x 之间的相关系数r =-0.9362,则变量y 和x 之间具有线性相关关系 10.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是( ) A .三维柱形图 B .二维条形图 C .等高条形图 D .独立性检验11.在建立两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合得最好的模型为( )A .模型1的相关指数R 2为0.75B .模型2的相关指数R 2为0.90C .模型3的相关指数R 2为0.25D .模型4的相关指数R 2为0.55 12.下面是某市场农产品的调查表. 市场供应量表:) A .(2.3,2.6) B .(2.4,2.6) C .(2.6,2.8)D .(2.8,2.9)二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上) 13.当且仅当r 满足________时,数据点(x i ,y i )(i =1,2,…,n )在一条直线上.14.已知一个回归直线方程为y ^=1.5x +45,x ∈{1,7,5,13,19},则y =__________.15.对具有线性相关关系的变量x 和y ,测得一组数据如下表.若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为________.16.(2010·广东文,12)某市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:出有__________线性相关关系.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.(本题满分10分)为了调查胃病是否与生活规律有关,调查某地540名40岁以上的人得结果如下:18.(本题满分12分)一台机器可以按各种不同的速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多寡,随机器运转的速度而变化,下面表格中的数据是几次试验的结果.(1)(2)若实际生产中所允许的每小时最大问题物件数为10,那么机器的速度不得超过多少转/秒?19.(本题满分12分)在从烟台—大连的某次航运中,海上出现恶劣气候.随机调查男、女乘客在船上晕船的情况如下表所示:20.(本题满分12分)有两个分类变量X与Y,其一组观测的2×2列联表如下表.其中a,15-a均为大于5的整数,则a取何值时有90%以上的把握认为“X与Y之间有关系”?21.(本题满分12分)某超市为了了解热茶销售与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:22.(本题满分14分)在一个文娱网络中,点击观看某个节目的累积人次和播放天数如下表:(1)画出散点图;(2)判断两变量之间是否具有线性相关关系,求回归直线方程是否有意义?选修2-3统计案例2 答案一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.[答案] D[解析]x=2.5,y=3.5,∵回归直线方程过定点(x,y),∴3.5=-0.7×2.5+a,∴a=5.25.故选D.2.[答案] A[解析]因为b>0时,两变量正相关,此时,r>0;b<0时,两变量负相关,此时r<0.3.[答案] D4.[答案] A5.[答案] C6.[答案] C[解析]本题主要考查了变量的相关知识,考查学生分析问题和解决问题的能力.用散点图可以判断变量x与y负相关,u与v正相关.7.[答案] B[解析]建筑行业的比值小于6528076516,物流行业的比值大于7457070436,故建筑好于物流.8.[答案] C[解析]代入方程计算可判断①②④正确.9.[答案] C[解析]R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C. 10.[答案] D[解析] 前三种方法只能直观地看出两个分类变量x 与y 是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.11. [答案] B[解析] 相关指数R 2的值越大,意味着残差平方和越小,也就是说模型的拟合效果越好,故选B.12. [答案] C[解析] 以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C.二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上) 13. [答案] |r |=1[解析] 当数据点(x i ,y i )在一条直线上时,y 只受x 的影响,即数据点完全线性相关,此时|r |=1.14. [答案] 58.5[解析] 因为x =15(1+7+5+13+19)=9,且y =1.5x +45,所以y =1.5×9+45=58.5.本题易错之处是根据x 的值及y ^=1.5x +45求出y 的值再求y ,由y ^=1.5x +45求得的y 值不是原始数据,故错误.15. [答案] y ^=17.5+6.5x[解析] 由数据表得x =5,y =50,所以a ^=y -6.5x =17.5,即回归直线方程为y ^=17.5+6.5x .16.[答案] 13 正[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.[解析] k =540×(60×200-260×20)2320×220×80×460=2496960259072≈9.638∵9.638>6.635∴40岁以上的人患胃病与生活是否有规律有关,有99%的把握认为生活不规律的人易患胃病.18. [解析] (1)用x 表示机器速度,y 表示每小时生产有问题物件数,那么4个样本数据为:(8,5)、(12,8)、(14,9)、(16,11),则x -=12.5,y -=8.25.于是回归直线的斜率为b ^=∑x i y i -4x -y -∑x 2i -4x -2=25.535≈0.7286,a ^=y --b ^x -=-0.8575,所以所求的回归直线方程为y =0.7286x -0.8575.(2)根据公式y ^=0.7286x -0.8575,要使y ≤10,则就需要0.7286x -0.8575≤10,x ≤14.9019,即机器的旋转速度不能超过14.9019转/秒.19. [解析] 男人晕船所占比例为3283×100%=0.386,女人晕船所占比例为832×100%=0.25,虽然0.386远大于0.25,但我们不能用此判断在恶劣气候中航行,男人比女人更容易晕船,而应根据独立性检验进行分析.由公式得:K 2=115×(32×24-51×8)283×32×40×75≈1.870.因为1.870<2.706,所以我们没有充分的证据说晕船跟男女性别有关.20. [解析] 查表可知,要使有90%以上的把握认为X 与Y 之间有关系,则K 2>2.706, 而其观测值k =65[a (30+a )-(20-a )(15-a )]220×45×15×50=13(65a -300)260×45×50=13(13a -60)260×90,解k >2.706得a >7.19或a <2.04.又因为a >5且15-a >5,a ∈Z ,所以a =8,9,故当a 取8或9时有90%以上的把握认为“X 与Y 之间有关系”.21.[解析] 由表中数据画出散点图如图所示.由表中数据得x =16(26+18+13+10+4-1)≈11.67,y=16(20+24+34+38+50+64)≈38.33,∑i =16x i y i =26×20+18×24+13×34+10×38+4×50-1×64=1910,∑i =16x 2i =262+182+132+102+42+(-1)2=1286,∑i =16y 2i =202+242+342+382+502+642=10172,所以r ≈-0.97,因为|r |≈0.97>0.75,所以热茶销售量与气温之间具有很强的线性相关关系.22.[解析] (1)散点图如图所示.(2)由散点图知两变量线性相关,故求回归直线方程有意义.或借助科学计算器,完成下表中的有关计算. i 1 2 3 4 5 6 7 8 9 10 x i 1 2 3 4 5 6 7 8 9 10 y i 51 134 213 235 262 294 330 378 457 533 x i y i51268639940131017642310302441135330x =5.5,y =288.7,∑i =110x 2i =385,∑i =110y 2i =1020953,∑i =110x i y i =19749 r =19749-10×5.5×288.7(385-10×5.52)×(1020953-10×288.72)≈0.984>0.75.这说明累积人次与播放天数之间存在着线性相关关系,自然求回归直线方程有意义.。