2018版高中数学第二章统计章末分层突破学案新人教B版必修3(含解析)
- 格式:doc
- 大小:832.50 KB
- 文档页数:16
描述:例题:高中数学必修3(人教B版)知识点总结含同步练习题及答案第二章 统计 2.3 变量的相关性一、学习任务1. 能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.2. 了解线性回归的方法,了解用最小二乘法研究两个变量的线性相关问题的思想方法,会根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式).二、知识清单变量间的相关关系相关关系 线性相关三、知识讲解1.变量间的相关关系2.相关关系变量与变量之间的关系一类是确定性的函数关系,像正方形的边长 和面积 的关系 .另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.例如,人的身高不能确定体重,但一般说来“身高者,体也重”.我们说身高与体重这两个变量具有相关关系.函数关系与相关关系的异同点相同点:是两者均是指两个变量的关系;不同点:①函数关系是一种确定性的关系,相关关系是一种非确定性的关系.②函数关系式一种因果关系,而相关关系不一定是因果关系,其也可能是伴随关系.a S 给出下列关系:①正方形的边长与面积之间的关系;②水稻产量与施肥量之间的关系;③降雪量与交通事故的发生率之间的关系.其中具有相关关系的是______.解:②③两个变量之间的关系有两种:函数关系与相关关系.①正方形的边长和面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③降雪量与交通事故的发生率具有相关关系.下图中的两个变量是相关关系的是( )描述:3.线性相关两个变量的线性关系对具有相关关系的两个变量进行统计分析的方法叫回归分析.将样本中的个数据点(,,,)描在平面直角坐标系中,就得到了散点图.如果两个变量的散点图中的点散步在左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,我们将这种相关称为正相关.如果两个变量的散点图中的点散步的位置是从左上角到右下角的区域,即一个变量的值由小变大是,另一个变量的值由大变小,我们将这种相关称为负相关.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量具有线性相关关系.回归直线方程“最贴近”已知的数据点的直线方程称之为回归直线方程,简称回归方程,方程为,叫做回归系数.刻画了实际观察值与回归直线上相应点纵坐标之间的偏离程度,个离差构成的总离差越小越好,总离差通常是用离差的平方和来表示,即作为总离差,并使之达到最小.回归直线就是所有直线中取最小的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.A.①② B.①③ C.②④ D.②③解:D①属于函数关系,因为每个 值对应一个 值,这是确定性的关系;②中散点图中各点分布的区域大致为从左下角到右上角,没有确定的函数关系,但是具有相关关系;③中散点图分布的区域大致在一条曲线附近,对于每个 ,其对应的 呈现出一定的规律性,因此这两个变量具有相关关系;④ 中各点的分布比较均匀,但对于每个 , 的分布没有规律,因此不属于相关关系.x y x y x y n (,)x i y i i =12⋯n =a +bx y ^b −y i y ^i y i n Q =(−a −b ∑i =1ny i x i )2Q(),得散点图2.由这两个散点图可以判断( )(,)u i v i i =12⋯10高考不提分,赔付1万元,关注快乐学了解详情。
学习目标 1.会根据不同的特点选择适当的抽样方法获得样本数据.2.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体.3.能利用散点图对两个变量是否相关进行初步判断,能用回归直线方程进行预测.知识点一 抽样方法1.当总体容量较小,样本容量也较小时,可采用__________________. 2.当总体容量较大,样本容量较小时,可用______________________. 3.当总体容量较大,样本容量也较大时,可用______________________. 4.当总体由差异明显的几部分组成时,可用____________________. 知识点二 用样本估计总体 1.用样本估计总体用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率__________与频率______________.当样本只有两组数据且样本容量比较小时,用__________刻画数据比较方便.2.样本的数字特征样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括________、________和__________;另一类是反映样本波动大小的,包括________及__________. 知识点三 变量间的相关关系1.两个变量之间的相关关系的研究,通常先作变量的____________,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系). 2.求回归方程的步骤:(1)先把数据制成表,从表中计算出x ,y,∑ni =1x 2i ,∑n i =1x i y i ;(2)计算回归系数a ^,b ^.公式为⎩⎨⎧b ^=∑ni =1x i y i-n x y ∑n i =1x 2i-n x 2,a ^=y -b ^x .(3)写出回归方程y ^=b ^x +a ^.类型一 用频率分布估计总体例1 某制造商生产一批直径为40 mm 的乒乓球,现随机抽样检查20个,测得每个球的直径(单位:mm ,保留两位小数)如下:40.03 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96 (1)完成下面的频率分布表,并画出频率分布直方图;(2)10 000,试根据抽样检查结果估计这批产品的合格个数.反思与感悟 总体分布中相应的统计图表主要包括:频率分布表、频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估计总体.跟踪训练1为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A.64 B.54 C.48 D.27类型二用样本的数字特征估计总体的数字特征例2某市共有50万户居民,城市调查队按千分之一的比例进行入户调查,抽样调查的结果如表:求:(1)工作人员家庭人均月收入的估计值x1及方差的估计值s21;(2)管理人员家庭人均月收入的估计值x2及方差的估计值s22;(3)总体人均月收入的估计值x及总体方差的估计值s2.反思与感悟 样本的数字特征分为两大类:一类是反映样本数据集中趋势的特征数,例如平均数;另一类是反映样本数据波动大小的特征数,例如方差和标准差.通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),从而实现对总体的估计. 跟踪训练2 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?类型三 用回归直线方程对总体进行估计例3 某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的回归直线方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x )反思与感悟 对两个变量进行研究,通常是先作出两个变量之间的散点图,根据散点图直观判断两个变量是否具有线性相关关系,如果具有,就可以应用最小二乘法求线性回归直线方程.由于样本可以反映总体,所以可以利用所求的线性回归直线方程,对这两个变量所确定的总体进行估计,即根据一个变量的取值,预测另一个变量的取值.跟踪训练3 某市统计局统计了10户家庭的年收入和年饮食支出的统计资料如下表:(1)如果已知y 与x 成线性相关关系,求回归直线方程; (2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:∑10i =1x i y i =117.7,∑10i =1x 2i =406)1.10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,则数0.4是指1号球占总体分布的( )A .频数B .频率C .累积频率D .以上都不对2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的回归方程为( )A.y ^=x -1 B.y ^=x +1C.y ^=12x +88D.y ^=1763.某班50名学生的一次数学质量测验成绩的频率分布直方图如图所示,则成绩不低于70分的学生人数是____________.4.在如图所示的茎叶图表示的数据中,众数和中位数分别为________,________.5.从某学校的男生中随机抽取50名测量身高,被测学生身高全部介于155 cm和195 cm之间,将测量结果按如下方式分成八组;第一组[155,160),第二组[160,165),…,第八组[190,195].如图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组的人数相同,第六组的人数为4.(1)求第七组的频率;(2)估计该校的800名男生的身高的中位数以及身高在180 cm以上(含180 cm)的人数.1.用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点:(1)纵轴表示频率/组距;(2)频率分布直方图中各小长方形高的比就是相应各组的频率之比;(3)直方图中各小长方形的面积是相应各组的频率,所有的小长方形的面积之和等于1,即频率之和为1.2.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述波动大小.答案精析知识梳理 知识点一1.抽签法 2.随机数法 3.系统抽样法 4.分层抽样法 知识点二1.分布表 分布直方图 茎叶图 2.众数 中位数 平均数 方差 标准差 知识点三 1.散点图 题型探究 类型一例1 解 (1)频率分布表如下:频率分布直方图如图.(2)∵抽样的20个产品中在[39.98,40.02]范围内的有17个, ∴合格品频率为1720×100%=85%.∴10 000×85%=8 500.故根据抽样检查结果,可以估计这批产品的合格个数为8 500.跟踪训练1 B [[4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-0.62-0.05-0.11=1-0.78=0.22,∴a =(0.22+0.32)×100=54.] 类型二例2 解 (1)x 1=1400×(20×350+60×650+200×950+80×1 250+40×1 550)=995,s 21=1400×[20×(350-995)2+60×(650-995)2+200×(950-995)2+80×(1 250-995)2+40×(1 550-995)2]=83 475.(2)x 2=1100×(5×350+10×650+50×950+20×1 250+15×1 550)=1 040,s 22=1100×[5×(350-1 040)2+10×(650-1 040)2+50×(950-1 040)2+20×(1 250-1 040)2+15×(1 550-1 040)2]=90 900.(3)x =1500×(25×350+70×650+250×950+100×1 250+55×1 550)=1 004,s 2=1500×[25×(350-1 004)2+70×(650-1 004)2+250×(950-1 004)2+100×(1 250-1 004)2+55×(1 550-1 004)2]=85 284.跟踪训练2 解 甲的平均成绩为x 甲=74,乙的平均成绩为x 乙=73.所以甲的平均成绩好. 甲的方差是s 2甲=15[(-14)2+62+(-4)2+162+(-4)2)=104,乙的方差是s 2乙=15×[72+(-13)2+(-3)2+72+22]=56.因为s 2甲>s 2乙,所以乙的各门功课发展较平衡.类型三例3 解 (1)散点图如图.(2)由表中数据得:∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,∴b ^=0.7,∴a ^=1.05,∴y ^=0.7x +1.05,回归直线如图所示.(3)将x =10代入回归直线方程,得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时.跟踪训练3 解 (1)依题意可计算得:x =6,y =1.83,x 2=36, x y =10.98,又∵∑10i =1x i y i =117.7,∑10i =1x 2i =406, ∴b ^=∑10i =1x i y i -10x y∑10i =1x 2i -10x 2≈0.17,a ^=y -b ^x ≈0.81,∴y ^=0.17x +0.81.∴所求的回归直线方程为y ^=0.17x +0.81.(2)当x =9时,y ^=0.17×9+0.81=2.34(万元).可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元. 当堂训练 1.B2.C [由已知得x =176,y =176,因为点(x ,y )必在回归直线上,代入选项验证可知C 正确.] 3.35解析 低于70分的频率为(0.012+0.018)×10=0.3,所以不低于70分的频率为0.7,故不低于70分的人数为50×0.7=35. 4.31 26解析 由茎叶图可知这组数据为12,14,20,23,25,26,30,31,31,41,42.所以众数和中位数分别为31,26.5.解 (1)第六组的频率为450=0.08,所以第七组的频率为1-0.08-5×(0.008×2+0.016+0.04×2+0.06)=0.06. (2)身高在第一组[155,160)的频率为0.008×5=0.04, 身高在第二组[160,165)的频率为0.016×5=0.08,身高在第三组[165,170)的频率为0.04×5=0.2,身高在第四组[170,175)的频率为0.04×5=0.2,由于0.04+0.08+0.2=0.32<0.5,0.04+0.08+0.2+0.2=0.52>0.5,估计这所学校的800名男生的身高的中位数为m,则170<m<175,由0.04+0.08+0.2+(m-170)×0.04=0.5,得m=174.5,所以可估计这所学校的800名男生的身高的中位数为174.5,由直方图得后三组频率之和为0.06+0.08+0.008×5=0.18,所以身高在180 cm以上(含180 cm)的人数为0.18×800=144.。
2018版高中数学第二章统计章末综合测评新人教B版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高中数学第二章统计章末综合测评新人教B版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高中数学第二章统计章末综合测评新人教B版必修3的全部内容。
第二章统计(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.某学校为了调查高一年级的200名学生完成课后作业所需时间,采取了两种抽样调查的方式:第一种由学生会的同学随机抽取20名同学进行抽查;第二种由教务处对该年级的学生进行编号,从001到200,抽取学号最后一位为2的同学进行调查。
则这两种抽样的方法依次是( )A.分层抽样,简单随机抽样B.简单随机抽样,分层抽样C.分层抽样,系统抽样D.简单随机抽样,系统抽样【解析】由抽样方法的概念知,第一种是简单随机抽样,第二种是系统抽样。
【答案】D2。
小波一星期的总开支分布如图1①所示,一星期的食品开支如图1②所示,则小波一星期的鸡蛋开支占总开支的百分比为( )图1A.1% B。
2% C.3%D。
5%【解析】由题图②知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%.【答案】C3.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,则由此求出的平均数与实际平均数的差是( )A。
3。
5 B。
-3 C.3 D。
2.1.3 分层抽样1.了解分层抽样的方法.2.理解分层抽样的概念及与简单随机抽样、系统抽样的关系.3.掌握分层抽样的一般步骤.[学生用书P30])1.分层抽样的概念(1)将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.(2)当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.2.分层抽样的优点分层抽样的优点是使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的抽样法.1.判断正误.(对的打“√”,错的打“×”)(1)系统抽样时,将总体分成均等的几部分,每部分抽取一个,符合分层抽样,故系统抽样就是一种特殊的分层抽样.( )(2)在分层抽样时,每层可以不等可能抽样.( )(3)在分层抽样的过程中,每个个体被抽到的可能性是相同的,与层数及分层有关.( )解析:(1)因为分层抽样是从各层独立地抽取个体,而系统抽样各段上抽取时是按事先定好的规则进行的,各层编号有联系,不是独立的,故系统抽样不同于分层抽样.(2)分层抽样时,每层仍然要等可能抽样.(3)与层数及分层无关.答案:(1)×(2)×(3)×2.某地区为了解居民家庭生活状况,先把居民按所在行业分为几类,然后每个行业抽取1100的居民家庭进行调查,这种抽样是( ) A .简单随机抽样B .系统抽样C .分层抽样D .分类抽样 解析:选C.符合分层抽样的特点.3.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,且男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A .简单随机抽样B .按性别分层抽样C .按学段分层抽样D .系统抽样解析:选C.依据题意,了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,且男女生视力情况差异不大,故要了解该地区学生的视力情况,应按学段分层抽样.4.一个班共有54人,其中男同学、女同学比为5∶4,若抽取9人参加教改调查会,则每个男同学被抽取的可能性为________,每个女同学被抽取的可能性为________.解析:男、女每人被抽取的可能是相同的,因为男同学共有54×59=30(人),女同学共有54×49=24(人), 所以每个男同学被抽取的可能性为530=16,每个女同学被抽取的可能性为424=16. 答案:16 16分层抽样的概念[学生用书P31]下列三个抽样:①一个城市有250家百货商店,其中大型商店有30家,中型商店有40家,小型商店有180家.为了掌握各商店的营业情况,要从中抽取一个容量为25的样本;②在某班的50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的10名学生进行作业检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱10件)产品中抽取3件进行质量检查.抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B.分层抽样;简单随机抽样;系统抽样C.分层抽样;系统抽样;简单随机抽样D.系统抽样;分层抽样;简单随机抽样【解析】①中商店的规模不同,所以应利用分层抽样;②中抽出的学号具有等距性,所以应是系统抽样;③中总体没有差异,容量较小,样本数量也较小,所以应为简单随机抽样,故选C.【答案】 C判断一个抽样方法是不是分层抽样的条件(1)看它是否具有分层抽样的特点,如总体中个体差异是否明显.(2)是否按照相同比例从各层中抽取.至于各层内用什么方法抽样是灵活的,可采用简单随机抽样,也可采用系统抽样.(3)在分层抽样中,无论哪一层的个体,被抽中的机会都是相等的,体现了抽样的公平性.1.某市有四所重点大学,为了解该市大学生的课外书籍阅读情况,采用下列哪种方法抽取样本最合适(四所大学图书馆的藏书有一定的差距)( ) A.抽签法B.随机数表法C.系统抽样法D.分层抽样法解析:选D. 因为学校图书馆的藏书对学生课外书籍阅读影响比较大,因此采取分层抽样.2.某校高三年级有男生800人,女生600人,为了解该年级学生的身体健康情况,从男生中任意抽取40人,从女生中任意抽取30人进行调查.这种抽样方法是( ) A.系统抽样法B.抽签法C.随机数表法D.分层抽样法解析:选D.总体中个体差异比较明显,且抽取的比例也符合分层抽样.分层抽样的计算[学生用书P32](1)某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为________.(2)某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:高一年级 高二年级 高三年级 泥塑a b c 剪纸 x y z其中x ∶y ∶z =5∶3∶2,且“泥塑”社团的人数占两个社团总人数的35,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取________人.【解析】 (1)设该单位老年职工人数为x ,由题意得3x =430-160,解得x =90.则样本中的老年职工人数为90×32160=18. (2)法一:因为“泥塑”社团的人数占总人数的35, 故“剪纸”社团的人数占总人数的25, 所以“剪纸”社团的人数为800×25=320; 因为“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310, 所以“剪纸”社团中高二年级人数为320×310=96. 由题意知,抽样比为50800=116, 所以从高二年级“剪纸”社团中抽取的人数为96×116=6. 法二:因为“泥塑”社团的人数占总人数的35, 故“剪纸”社团的人数占总人数的25,所以抽取的50人的样本中,“剪纸”社团中的人数为50×25=20. 又“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310, 所以从高二年级“剪纸”社团中抽取的人数为20×310=6. 【答案】 (1)18 (2)6分层抽样中有关抽样比的计算方法对于分层抽样中的比值问题,常利用以下关系式巧解:(1)样本容量n 总体容量N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解.1.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为8,16,24.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为( )A .3B .4C .5D .6解析:选 B.根据分层抽样的特点可知,抽样比例为1248=14,则应抽取的中型城市数为16×14=4. 2.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,则应抽取超过45岁的职工________人.解析:抽样比为25∶200=1∶8,而超过45岁的职工有80人,则从中应抽取的个体数为80×18=10. 答案:10分层抽样的设计[学生用书P32]一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的抽样方法?并写出具体过程.【解】因为疾病的发病率与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法.具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层.(2)按照样本容量的比例求得各乡镇应抽取的人数分别为60人、40人、100人、40人、60人.(3)按照各层抽取的人数随机抽取各乡镇应抽取的样本.(4)将300人合到一起,即得到一个样本.分层抽样的操作步骤第一步,计算样本容量与总体的个体数之比;第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数;第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体;第四步,将各层抽取的个体合在一起,就得到所取样本.某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表所示:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 072电视台为了进一步了解观众的具体想法和意见,打算从中再抽取60人进行更为详细的调查,应怎样进行抽样?解:采用分层抽样的方法,抽样比为6012 000=1 200.“很喜爱”的有2 435人,应抽取2 435×1200≈12(人);“喜爱”的有4 567人,应抽取4 567×1200≈23(人);“一般”的有3 926人,应抽取3 926×1200≈20(人); “不喜爱”的有1 072人,应抽取1 072×1200≈5(人). 因此,采用分层抽样的方法在“很喜爱”“喜爱”“一般”“不喜爱”的人中应分别抽取12人、23人、20人、5人.三种抽样方法的综合运用[学生用书P33]某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人进行某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,3,…,270;使用系统抽样时,将学生统一随机编号为1,2,3,…,270,并将整个编号平均分为10段.如果抽得的号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④36,62,88,114,140,166,192,218,244,270.关于上述样本的下列结论中,正确的是( )A .②③都不能为系统抽样B .②④都不能为分层抽样C .①④都可能为系统抽样D .①③都可能为分层抽样【解析】 系统抽样又名“等距抽样”,做到等距的有①③④,但只做到等距还不一定是系统抽样,还应做到10段中每段要抽1个,检查这一点只需看第一个元素是否在1~27范围内,结果发现④不符合,同时,若为系统抽样,则分段间隔k =27010=27,④也不符合这一要求,所以可能是系统抽样的为①③,因此排除A ,C ;若采用分层抽样,一、二、三年级的人数比例为4∶3∶3,由于共抽取10人,所以三个年级应分别抽取4人、3人、3人,即在1~108范围内要有4个编号,在109~189和190~270范围内要分别有3个编号,符合此要求的有①②③,即它们都可能为分层抽样(其中①③在每一层内采用了系统抽样,②在每一层内采用了简单随机抽样),所以排除B.【答案】 D选择抽样方法的思路(1)判断总体是否由差异明显的几部分组成,若是,则选用分层抽样;否则,考虑用简单随机抽样或系统抽样;(2)判断总体容量和样本容量的大小.当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法;当总体容量较大、样本容量也较大时,采用系统抽样.某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各岗位中的人数情况如下表所示:管理技术开发营销生产合计老年40404080200 中年80120160240600 青年40160280720 1 200 合计160320480 1 040 2 000(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个有25人参与的讨论单位发展与薪金调整方案的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对某运动会筹备情况的了解程度,则应怎样抽样?解:(1)用分层抽样法,并按老年职工4人,中年职工12人,青年职工24人抽取.(2)用分层抽样法,并按管理岗位2人,技术开发岗位4人,营销岗位6人,生产岗位13人抽取.(3)用系统抽样法,对全部2 000人随机编号,号码为0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,所得到的号码对应的20人即为要抽取的样本.1.分层抽样的特点(1)适用于总体由有明显差别的几部分组成的情况.(2)抽取的样本更好地反映了总体的情况.(3)是等可能性抽样,每个个体被抽到的可能性都是n N . 2.分层抽样的公平性如果总体中个体的总数是N ,样本容量为n ,第i 层中个数为N i ,则第i 层中要抽取的个体数为n i =n ·N i N .每一个个体被抽取的可能性是n i N i =1N i ·n ·N i N =n N,与层数无关.所以对所有个体来说,被抽取的可能性是一样的,与层数及分层无关,所以分层抽样是公平的.分层抽样需注意的问题1.分层抽样中分多少层、如何分层要视具体情况而定,总的原则是每层内样本的差异要小,不同层之间的样本差异要大,且互不重叠.2.抽取比例由每层个体占总体的比例确定.3.各层抽样按简单随机抽样或系统抽样进行.1.某镇有四所中学,为了解该镇中学生视力情况,用什么方法抽取人数(四所中学视力有一定的差距)( )A .抽签法B .随机数表法C .系统抽样法D .分层抽样法解析:选D.由于每所中学的情况不同,应采用分层抽样.2.某单位的老年人、中年人、青年人依次有25人、35人、40人,用分层抽样的方法抽取40人,则老、中、青年人中应抽取的人数依次为( )A .8,14,18B .9,13,18C .10,14,16D .9,14,17解析:选C.由已知得样本容量和总体容量之比为40100=25,即抽样比例为25,所以在老年人中应抽取25×25=10(人),在中年人中应抽取35×25=14(人),在青年人中应抽取40×25=16(人).3.调查某班学生的平均身高,从50名学生中抽取5名,应采取的抽样方法是________;如果男、女生身高有显著不同(男生30人,女生20人),应采取的抽样方法:________.解析:总体及样本容量较少且无差异可用简单随机抽样.当总体有明显差异,用分层抽样.答案:简单随机抽样 分层抽样4.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2∶3∶5,现用分层抽样方法抽取一个容量为n 的样本,样本中A 种型号产品有16件,那么此样本容量n =________.解析:n ×210=16,n =80. 答案:80, [学生用书P99(单独成册)])[A 基础达标]1.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户.为了调查社会购买力的某项指标,要从中抽取1个容量为100的样本,记作①;某学校高一年级有12名女排运动员,要从中选出3名调查学习负担情况,记作②.那么完成上述两项调查应采用的抽样方法是( )A .①用简单随机抽样法;②用系统抽样法B .①用分层抽样法;②用简单随机抽样法C .①用系统抽样法;②用分层抽样法D .①用分层抽样法;②用系统抽样法解析:选B.对于①,总体由高收入家庭、中等收入家庭和低收入家庭差异明显的3部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样法.对于②,总体中的个体数较少,而且所调查内容对12名调查对象是“平等”的,所以应采用简单随机抽样法.2.某商场出售三种品牌电脑,现库存量分别是60台、36台和24台,用分层抽样的方法从中抽取10台进行检测,则这三种品牌的电脑依次应抽取的台数是( )A .6,3,1B .5,3,2C .5,4,1D .4,3,3解析:选B.抽样比为1060+36+24=112,则三种品牌的电脑依次应抽取的台数是60×112=5,36×112=3,24×112=2.故选B. 3.采用分层抽样的方法从某学校三个年级的全体学生中抽取一个容量为45的样本,高一年级被抽取20人,高三年级被抽取10人,高二年级共有300人,则这个学校共有高中学生( )A .1 350人B .675人C .900人D .450人解析:选C.高二年级被抽取的人数为45-20-10=15,则抽样比为15∶300=1∶20,所以45÷120=900,即这个学校共有高中学生900人. 4.某班有男生36人,女生18人,用分层抽样的方法从该班全体学生中抽取一个容量为9的样本,则抽取的女生人数为( )A .6B .4C .3D .2解析:选C.据分层抽样,得抽取的女生人数为936+18×18=3,选C. 5.某中学有高中生3 500人,初中生1 500人.为了了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( )A .100B .150C .200D .250解析:选A.抽样比为703 500=150,该校总人数为1 500+3 500=5 000,则n 5 000=150,故n =100.6.从总体容量为N 的一批零件中用分层抽样抽取一个容量为30的样本,若每个零件被抽取的可能性为0.25,则N 等于________.解析:分层抽样是等可能抽样,故总体容量为30÷0.25=120.答案:1207.某校初选了98名大学生作为某项活动的志愿者,其中男生有56名.现按男女比例用分层抽样的方法,从已选的98名大学生中抽出28名志愿者,那么应抽取的女生人数是________. 解析:本题考查分层抽样,男女生人数比例为5698-56=43,则应抽取的女生人数为28×34+3=12. 答案:128.最新高考改革方案已在上海和浙江实施,某教育机构为了解我省广大师生对新高考改革方案的看法,对某市部分学校500名师生进行调查,统计结果如下表:赞成改革 不赞成改革 无所谓 教师120 20 40 学生 150 40 130现从500名师生中用分层抽样的方法抽取50名进行问卷调查,则应抽取“不赞成改革”的教师和学生人数分别为________.解析:由题意知,抽样比为50500=110, 则应抽取“不赞成改革”的教师人数为110×20=2,学生人数为110×40=4. 答案:2,49.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作为样本,用系统抽样法将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).(1)若第5组抽出的号码为22,则第8组抽出的号码应是多少?(2)若用分层抽样法,则应从40岁以下年龄段的职工中抽取多少名?解:(1)由分组可知,分段的间隔为5.又第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.(2)由题意知,40岁以下年龄段的职工人数为200×50%=100.若用分层抽样法,则应从40岁以下年龄段的职工中抽取40200×100=20(名).10.某校高一年级500名学生中,血型为O型的有200人,A型的有125人,B型的有125人,AB型的有50人.为了研究血型与色弱的关系,要从中抽取一个容量为40的样本,应如何抽样?写出抽取血型为AB型的学生的过程.解:因为总体由差异明显的四部分组成,故采用分层抽样法.因为40÷500=225,所以血型为O型的应抽取200×225=16(人),血型为A型的应抽取125×225=10(人),血型为B型的应抽取125×225=10(人),血型为AB型的应抽取50×225=4(人).AB型的4人可以这样抽取:第一步,将血型为AB型的50人随机编号,编号为1,2, (50)第二步,把以上50个编号分别写在50张小纸条上,并揉成小球,制成号签;第三步,把得到的号签放入一个不透明的袋子中,充分搅匀;第四步,从袋子中不放回地逐个抽取4个号签,并记录上面的编号;第五步,根据得到的编号找出对应的4人,即得到AB血型的样本.[B 能力提升]11.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )A.4 B.5C.6 D.7解析:选C.四类食品的种数比为4∶1∶3∶2,则抽取的植物油类的种数为20×110=2,抽取的果蔬类的种数为20×210=4,二者之和为6种,故选C.12.将参加数学竞赛决赛的500名学生编号为001,002,…,500,采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003,这500名学生分别在三个考点考试,从001到200在第一考点,从201到355在第二考点,从356到500在第三考点,则第三考点被抽中的人数为________.解析:系统抽样的样本间隔为50050=10,第一个号码为003,按照系统抽样的规则,抽到的号码依次为003,013,023,033,043,053,…,493,第三考点抽到的第一个号码为363,最后一个号码为493,所以493=363+(n -1)×10,解得n =14.答案:1413.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例;(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.解:(1)设登山组人数为x ,游泳组中,青年人、中年人、老年人所占比例分别为a 、b 、c ,则有x ×40%+3xb 4x =47.5%,x ×10%+3xc 4x=10%, 解得b =50%,c =10%,故a =100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人所占比例分别为40%、50%、10%.(2)游泳组中,抽取的青年人人数为200×34×40%=60(人); 抽取的中年人人数为200×34×50%=75(人); 抽取的老年人人数为200×34×10%=15(人).即游泳组中,青年人、中年人、老年人分别应抽取的人数为60人,75人,15人.14.(选做题)为了对某课题进行讨论研究,用分层抽样的方法从三所高校A ,B ,C 的相关人员中,抽取若干人组成研究小组,有关数据见下表(单位:人).(1)求x ,y ; (2)若从高校B 相关人数中选2人作专题发言,应采用什么抽样法,请写出合理的抽样过程.解:(1)分层抽样是按各层相关人数和抽取人数的比例进行的,所以有x 54=13⇒x =18,3654=y 3⇒y =2.故x =18,y =2. (2)总体容量和样本容量较小,所以应采用抽签法,过程如下:第一步,将36人随机编号,号码为1,2,3, (36)第二步,将号码分别写在相同的纸片上,揉成团,制成号签;第三步,将号签放入一个不透明的容器中,充分搅匀,依次不放回地抽取2个号码,并记录上面的编号;第四步,把与号码相对应的人抽出,即可得到所要的样本.。
章末复习课知识概览对点讲练知识点一三种抽样方法的选择例1选择合适的抽样方法抽样,写出抽样过程.(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个.(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个.(3)有甲厂生产的300个篮球,抽取10个.(4)有甲厂生产的300个篮球,抽取30个.点评弄清三种抽样方法的实质和适用范围,是灵活选用抽样方法的前提和基础.若用分层抽样,应先确定各层的抽取个数,然后在各层中用系统抽样或简单随机抽样进行抽取.变式迁移1某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是() A.4 B.5 C.6 D.7知识点二用样本估计总体例2有1个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计小于30的数据约占多大百分比.点评频率分布直方图可直观看出在各个区间内机会的差异,可对总体情况作出估计.变式迁移2为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83 C.2.7,78 D.2.7,83例3甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2):变式迁移3随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.知识点三回归直线方程及应用例4在7块并排、形状大小相同的实验田上进行施化肥量对水稻产量影响的试验,得数据列表(1)(2)求水稻产量y与施化肥量x之间的回归直线方程;(3)当施化肥50 kg时,对水稻的产量予以估计.点评(1)回归分析是寻找相关关系中非确定性关系的某种确定性;(2)求回归直线方程,关键在于正确地求出系数a ^,b ^,由于a ^,b ^的计算量大,计算时要仔细,避免计算失误.变式迁移4 某个服装店经营某种服装,在某周内获纯利y (元)与该周每天销售这种服装件数x已知:∑7i =1x 2i =280,∑i =1y 2i =45 309,∑i =1x i y i =3 487,且y 与x 有线性相关关系.(1)求x ,y ;(2)求纯利y 与每天销售件数x 之间的回归直线方程.课时作业一、选择题1.某质检人员从编号为1~100这100件产品中,依次抽出号码为3,7,13,17,23,27,…,93,97的产品进行检验,则这样的抽样方法是( )A .简单随机抽样B .系统抽样C .分层抽样D .以上都不对2.下列说法:①一组数据不可能有两个众数;②一组数据的方差不可能是负数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率,其中错误的个数有( )A .0B .1C .2D .33.现有60瓶牛奶制品,编号从1至60,若从中抽取6瓶进行检验,用系统抽样方法确定所抽的编号为( )A .3,13,23,33,43,53B .2,14,26,38,42,56C .5,8,31,36,48,54D .5,10,15,20,25,304.数学老师对某同学在参加高考前的5次数学模拟考试成绩进行统计分析,判断该同学的数学成绩是否稳定,于是老师需要知道该同学这5次成绩的( )A .平均数或中位数B .方差或标准差C .众数或频率D .频数或众数5.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程为y ^=b ^x +a ^,那么下列说法不正确的是( )A .直线y ^ =b ^ x +a ^ 必经过点(x ,y )B .直线y ^=b ^x +a ^至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点 C .直线y ^=b ^x +a ^的斜率为∑ni =1x i y i -n x y∑n i =1x 2i -n x 2D .直线y ^=b ^x +a ^和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑ni =1[y i -(bx i +a )]2是该坐标平面上所有直线与这些点的偏差中最小的 二、填空题6.某校有教师200人,男学生1 200人,女学生1 000人,现用分层抽样的方法从所有师生中抽取一个容量为n 的样本,已知从女学生中抽取的人数为80人,则n 的值为________.7.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图所示,则平均分数较高的是________,成绩较为稳定的是________.8.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表:三、解答题9.对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:甲 27,38,30,37,35,31; 乙 33,29,38,34,28,36.根据以上数据,试判断他们谁更优秀. 10.随机选取15家销售公司,由营业报告中查出其上年度的广告费(占总费用的百分比)及盈利额(1)画出散点图;(2)如果变量x 与y 之间具有线性相关关系,求出回归直线方程; (3)已知某销售公司的广告费为其总费用的1.7%,试估计其盈利额占销售总额的百分比.章末复习课对点讲练例1 解 (1)总体容量较小,用抽签法. ①将30个篮球编号,号码为00,01, (29)②将以上30个编号分别写在一张小纸条上,揉成小球,制成号签; ③把号签放入一个不透明的袋子中,充分搅拌;④从袋子中逐个抽取3个号签,并记录上面的号码; ⑤找出和所得号码对应的篮球.(2)总体由差异明显的两个层次组成,需选用分层抽样法. ①确定抽取个数. 3010=3,所以甲厂生产的应抽取213=7(个), 乙厂生产的应抽取93=3(个);②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.(3)总体容量较大,样本容量较小,宜用随机数表法.①将300个篮球用随机方式编号,编号为000,001,…,299; ②在随机数表中随机的确定一个数作为开始,如第8行第11列的数“2”开始.任选一个方向作为读数方向,比如向右读;③从数“2”开始向右读,每次读三位,凡不在000~299中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到10个号码,这就是所要抽取的10个样本个体的号码.(4)总体容量较大,样本容量也较大宜用系统抽样法.①将300个篮球用随机方式编号,编号为001,002,003,…,300,并分成30段,其中每一段包含30030=10(个)个体;②在第一段001,002,003,…,010这十个编号中用简单随机抽样抽出一个(如002)作为起始号码;③将编号为002,012,022,…,292的个体抽出,组成样本. 变式迁移1 C [抽取的植物油类种数:1040+10+30+20×20=2,抽取的果蔬类食品种数:2040+10+30+20×20=4,故抽取的植物油类与果蔬类食品种数之和是6.] 例2 解 (1)(2)(3)小于30的数据约占90%.变式迁移2 A [100人分为10组,第1组1人,第2组3人,第三组9人,第四组27人,故a =0.27;后六组共87人,故b =78.]例3 甲解析 方法一 x 甲=15×(9.8+9.9+10.1+10+10.2)=10,x 乙=15×(9.4+10.3+10.8+9.7+9.8)=10,即甲、乙两种冬小麦的平均单位面积产量的均值都等于10,其方差分别为s 2甲=15×(0.04+0.01+0.01+0+0.04)=0.02,s 2乙=15×(0.36+0.09+0.64+0.09+0.04) =0.244,即s 2甲<s 2乙,表明甲种小麦的产量比较稳定.方法二 (通过特殊的数据作出合理的推测)表中乙品种在第一年的产量为9.4,在第三年的产量为10.8,其波动比甲品种大得多,所以甲种冬小麦的产量比较稳定.变式迁移3 解 (1)由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间,因此乙班平均身高高于甲班.(2)x =158+162+163+168+168+170+171+179+179+18210=170.甲班的样本方差s 2=110×[(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2.例4 解 (1)画出散点图如下图:由图可见是线性相关的.x =30,y ≈399.3,∑i =17x i y i =87 175.∑i =17x 2i =7 000.计算得:b ^=87 175-7×30×399.37 000-7×302≈4.75,a ^ =399.3-4.75×30=256.8.即得回归直线方程y ^=256.8+4.75x.(3)施化肥50 kg 时,可以估计水稻产量约为494.3 kg .变式迁移4 解 (1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917=5597≈79.86.(2)设回归直线方程为y ^=b ^x +a ^,因为∑7i =1x 2i =280,∑7i =1y 2i =45 309,∑7i =1x i y i =3 487,x =6,y =5597,所以b ^=3 487-7×6×5597280-7×36=13328=4.75,a ^=5597-6×4.75≈51.36.所以回归直线方程为y ^=4.75x +51.36. 课时作业 1.B 2.B 3.A 4.B 5.B 6.192解析 801 000=n2 400,n =192.7.甲 甲解析 甲的平均分为x =68+69+70+71+725=70,乙的平均分为y =68;甲的方差为s 21=(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70)25=2.乙的方差为s 22=7.2,故甲的平均分高于乙,甲的成绩比乙稳定.8.y ^=14.7+0.132x9.解 x 甲=16×(27+38+30+37+35+31)=1986=33.s 2甲=16×[(27-33)2+(38-33)2+…+(31-33)2] =16×94≈15.7. x 乙=16×(33+29+38+34+28+36)=1986=33,s 2乙=16×[(33-33)2+(29-33)2+…+(36-33)2] =16×76≈12.7 ∴x 甲=x 乙,s 2甲>s 2乙,说明甲乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.10.解 (1)散点图如图所示.(2)回归直线方程是y ^=1.414 68x +0.821 23.(3)当x =1.7时,由回归直线方程得y =3.23,即可估算其盈利额占销售总额的3.23%.。
描述:例题:高中数学必修3(人教B版)知识点总结含同步练习题及答案
第二章 统计 2.1 随机抽样
一、学习任务
1. 通过实际问题情境,了解随机抽样的必要性和重要性.
2. 了解简单随机抽样的方法,会用抽签法与随机数表法从总体中抽取样本;了解系统抽样方
法,会用系统抽样方法从总体中抽取样本;了解分层抽样方法,会用分层抽样方法从总体中抽取样本;了解各种抽样方法的适用范围,能区分简单随机抽样、系统抽样和分层抽样,会选择适当的方法进行抽样.
3. 了解可以通过试验、查阅资料、设计调查问卷等方法收集数据.
二、知识清单
总体、个体与样本
简单随机抽样 系统抽样
分层抽样 三种抽样方法的比较三、知识讲解
1.总体、个体与样本
总体
我们一般把所考察对象的某一数值指标的全体构成的集合看作总体.
个体
构成总体的每一个元素作为个体.
样本
从总体中抽出若干个体所组成的集合叫做样本.
样本容量
样本中个体的数量叫做样本容量.
为了了解全校 名高一学生的体重情况,该校学生小明随机抽取了 名学生进行测量.下
列说法中正确的是( )A.总体是 B.个体是每一个学生
C.样本是 名学生 D.样本容量是 解:D
根据定义,总体是某一数值指标的全体,而个人和样本考察的也是指标,因此本题中总体是 名高一学生的体重,个体是高一每一名学生的体重,样本是抽取的 名学生的体重,样本容量是 .
300803008080
3008080为了了解一批零件的长度,抽测了其中 个零件的长度,在这个问题中, 个零件的长度
200200
高考不提分,赔付1万元,关注快乐学了解详情。
答案:
C。
高中数学学习材料马鸣风萧萧*整理制作2.2.1用样本的频率分布估计总体的分布课时目标 1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体的分布,初步体会样本频率分布的随机性.1.极差的概念极差是一组数据的__________________的差,它反映了一组数据__________,极差又叫________.2.频数、频率的概念将一批数据按要求分为若干组,对落在各个小组内数据的________进行累计,这个累计数叫做各个小组的________,各个小组的________除以__________,即得该小组的________.3.频率分布直方图在频率分布直方图中,纵轴表示________________,各小长方形的面积等于________________,所有长方形面积之和等于____.4.频率分布折线图把频率分布直方图中各个长方形____________用线段连接起来,就得到频率分布折线图.5.总体密度曲线如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体在各个小组内所取值的__________________的大小;当样本容量不断增大,分组的组距不断缩小时,频率分布直方图实际上越来越接近于______________,它可以用一条______________来描绘,这条光滑曲线就叫做_______________________________.6.茎叶图用茎叶图表示数据的两个优点在于:一是从茎叶图上没有__________的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时__________,方便记录与表示.一、选择题1.下列说法不正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的2.一个容量为100的样本,其数据的分组与各组的频数如下:组别(0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]频数12 13 24 15 16 13 7则样本数据落在(10,40]上的频率为()A.0.13 B.0.39 C.0.52 D.0.643.如图是总体密度曲线,下列说法正确的是()A.组距越大,频率分布折线图越接近于它B.样本容量越小,频率分布折线图越接近于它C.阴影部分的面积代表总体在(a,b)内取值的百分比D.阴影部分的平均高度代表总体在(a,b)内取值的百分比4.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A.20% B.69% C.31% D.27%5.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A.90 B.75C.60 D.45题号 1 2 3 4 5答案二、填空题6.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 7.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________.8.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题9.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51, 54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.10.抽查100袋洗衣粉,测得它们的重量如下(单位:g):494498493505496492485483508 511495494483485511493505488 501491493509509512484509510 495497498504498483510503497 502511497500493509510493491 497515503515518510514509499 493499509492505489494501509 498502500508491509509499495 493509496509505499486491492 496499508485498496495496505 499505496501510496487511501496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升11.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?绘制频率分布直方图的具体步骤:①求极差:找出一组数据中的最大值和最小值,最大值与最小值的差是极差(正值).②确定组距与组数:组数与样本容量有关,当样本容量不超过100时,按照数据的多少,常分成5~12组;组距的选择力求“取整”,组数=极差组距.③将数据分组:将数据分成互不相交的组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.④列频率分布表:一般分“分组”、“频数累计”、“频数”、“频率”四列,最后一行是合计.注意频数的合计是样本容量,频率的合计是1.⑤绘制频率分布直方图:根据频率分布表绘制频率分布直方图,其中纵轴表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积,即每个矩形的面积=组距×频率组距=频率.这样频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各小矩形的面积的总和等于1.第二章 统 计§2.2 用样本估计总体2.2.1 用样本的频率分布估计总体的分布知识梳理1.最大值与最小值 变化的幅度 全距 2.个数 频数 频数 样本容量 频率 3.频率与组距的比值 相应各组的频率 1 4.上边的中点 5.个数与总数比值 总体的分布 光滑曲线y =f(x) 总体密度曲线 6.原始信息 随时记录作业设计1.A2.C [样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.] 3.C4.C [由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.] 5.A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120. ∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.]6.60解析 ∵n·2+3+42+3+4+6+4+1=27,∴n =60. 7.45,46解析 由茎叶图及中位数的概念可知x 甲中=45,x 乙中=46.8.m h解析 频率组距=h ,故|a -b|=组距=频率h =m h . 9.解 (1)以4为组距,列表如下:(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.10.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计 频数 频率 累积 频率[482.5,486.5) 正8 0.08 0.08 [486.5,490.5) 3 0.03 0.11 [490.5,494.5) 正正正 17 0.17 0.28[494.5,498.5) 正正正正- 21 0.21 0.49[498.5,502.5) 正正14 0.14 0.63 [502.5,506.5) 正9 0.09 0.72 [506.5,510.5) 正正正 19 0.19 0.91[510.5,514.5) 正-6 0.06 0.97 [514.5,518.5]3 0.03 1.00 合计100 1.00 (2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44.设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55. 11.解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.。
2.2.2用样本的数字特征估计总体的数字特征学习目标 1.能合理地选取样本,并从中提取基本的数字特征.2.了解众数、中位数、平均数的概念,会计算方差和标准差.3.进一步体会用样本估计总体的思想,会用样本的数字特征估计总体的数字特征.知识点一众数、中位数、平均数思考1平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?思考2在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?梳理众数、中位数、平均数定义(1)众数:一组数据中出现次数________的数.(2)中位数:把一组数据按______________________的顺序排列,处在______________位置的数(或中间两个数的________)叫做这组数据的中位数.(3)平均数:如果n个数x1,x2,…,x n,那么x=____________________叫做这n个数的平均数.知识点二方差、标准差思考1当样本数据的标准差为0时,该组数据有何特点?思考2 标准差、方差的意义是什么?梳理 标准差、方差的概念及计算公式(1)标准差是样本数据到平均数的一种__________,一般用s 表示.s = _______________(x n 是样本数据,n 是样本容量,x 是样本平均数). (2)标准差的平方s 2叫做方差.s 2=__________________________________(x n 是样本数据,n 是样本容量,x 是样本平均数). (3)标准差(或方差)越小,数据越稳定在平均数附近.s =0时,每一组样本数据均为x . 知识拓展 平均数、方差公式的推广:1.若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .2.设数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则 a .s 2=1n[(x 21+x 22+…+x 2n )-n x 2]; b .数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; c .数据ax 1,ax 2,…,ax n 的方差为a 2s 2.知识点三 用样本的基本数字特征估计总体的基本数字特征1.样本的基本数字特征包括______、________、________、__________.2.平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,还需要用标准差来反映数据的分散程度.3.现实中的总体所包含的个体数往往是很多的,虽然总体的平均数与标准差客观存在,但是我们无从知道.所以通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.虽然样本具有________性,不同的样本测得的数据不一样,与总体的数字特征也可能不同,但只要样本的代表性好,这样做就是合理的,也是可以接受的.类型一 众数、中位数和平均数的理解与应用 命题角度1 众数、中位数、平均数的计算例1某公司的33名职工的月工资(单位:元)如下表:(1)求该公司职工月工资的平均数;(2)若董事长、副董事长的工资分别从5 500元、5 000元提升到30 000元、20 000元,那么公司职工月工资新的平均数又是什么?反思与感悟(1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,众数往往更能反映问题.(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.(4)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动.(5)因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.跟踪训练1对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:①这组数据的众数是3;②这组数据的众数与中位数的数值不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等.其中正确结论的个数为()A.1 B.2 C.3 D.4命题角度2在频率分布直方图中估算众数、中位数、平均数例2以教材2.2.1节调查的100位居民的月均用水量为例,样本数据的频率分布表和频率分布直方图如图所示,试估算月均用水量的中位数.反思与感悟样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.跟踪训练2一批乒乓球,随机抽取100个进行检查,球的直径频率分布直方图如图.试估计这个样本的众数,中位数和平均数.类型二标准差、方差与应用例3计算数据89,93,88,91,94,90,88,87的方差和标准差(标准差结果精确到0.1).反思与感悟(1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.(3)若样本数据都相等,则s=0.(4)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度是由标准差来衡量的.跟踪训练3甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和(1)中算得的结果,对两人的训练成绩作出评价.1.某市2016年各月的平均气温(℃)数据的茎叶图如图:则这组数据的中位数是()A.19 B.20C.21.5 D.232.设样本数据x1,x2,…,x10的平均数和方差分别为1和4,若y i=x i+a(a为非零常数,i =1,2,…,10),则y1,y2,…,y10的平均数和方差分别为()A.1+a,4 B.1+a,4+aC.1,4 D.1,4+a3.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.4.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.5.某校医务室抽查了高一10位同学的体重(单位:kg)如下:74,71,72,68,76,73,67,70,65,74.(1)求这10个学生体重数据的平均数、中位数、方差、标准差;(2)估计高一所有学生体重数据的平均数、中位数、方差、标准差.1.利用直方图求数字特征:①众数是最高的矩形的底边的中点.②中位数左右两边直方图的面积应相等.③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.3.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.答案精析问题导学 知识点一思考1 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但它的缺点是平均数受数据中极端值的影响较大.思考2 为了避免平均值受数据中个别极端值的影响,增大它在估计总体时的可靠性,故计算评委打分时要去掉一个最高分和一个最低分.梳理 (1)最多 (2)从小到大(或从大到小) 中间 平均数 (3)1n (x 1+x 2+…+x n ). 知识点二思考1 当样本数据的标准差为0时,该组数据都相等.思考2 标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小. 梳理 (1)平均距离1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2] 知识点三1.众数 中位数 平均数 标准差 3.随机 题型探究 类型一例1 解 (1)公司职工月工资的平均数为x =5 500+5 000+3 500×2+3 000+2 500×5+2 000×3+1 500×2033=69 00033≈2 091(元). (2)若董事长、副董事长的工资提升后,职工月工资的平均数为x =30 000+20 000+3 500×2+3 000+2 500×5+2 000×3+1 500×2033=108 50033≈3 288(元). 跟踪训练1 A [在这11个数中,数3出现了6次,频率最高,故众数是3;将这11个数按从小到大的顺序排列得2,2,3,3,3,3,3,3,6,6,10,中间数据是3,故中位数是3;而平均数x =2×2+3×6+6×2+1011=4.故只有①正确.]例2 解 在频率分布直方图中,中位数左边和右边的直方图的面积是相等的,由此可以估计中位数的值.下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02 .跟踪训练2 解 众数=39.99+40.012=40;四个矩形的面积分别是0.02×5=0.1, 0.02×10=0.2, 0.02×25=0.5, 0.02×10=0.2. 中位数为39.99+0.225=39.998;平均数为39.96×0.1+39.98×0.2+40×0.5+40.02×0.2=39.996. 类型二例3 解 ①x =90+18[(-1)+3+(-2)+1+4+0+(-2)+(-3)]=90+18×0=90;②计算x i -x (i =1,2,…,8),得各数据为-1,3,-2,1,4,0,-2,-3; ③计算(x i -x )2(i =1,2,…,8),得各数据为1,9,4,1,16,0,4,9; ④计算方差:s 2=18(1+9+4+1+16+0+4+9)=448=5.5;⑤计算标准差:s = 5.5≈2.3.所以这组数据的方差为5.5,标准差约为2.3.跟踪训练3 解 (1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+ (16-13)2]=4,s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图来看,甲的成绩基本上呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩无明显提高.当堂训练1.B [由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B.]2.A [∵x 1,x 2,…,x 10的平均数x =1,方差s 21=4,且y i =x i +a (i =1,2,…,10),∴y 1,y 2,…,y 10的平均数y =110·(y 1+y 2+…+y 10) =110·(x 1+x 2+…+x 10+10a ) =110·(x 1+x 2+…+x 10)+a =x +a =1+a , 其方差s 22=110·[(y 1-y )2+(y 2-y )2+…+(y 10-y )2] =110[(x 1-1)2+(x 2-1)2+…+(x 10-1)2] =s 21=4.故选A.]3.6解析 由已知得,所求平均数为4+6+5+8+7+66=6. 4.16解析 设样本数据x 1,x 2,…,x 10的标准差为s ,则s =8,可知数据2x 1-1,2x 2-1,…,2x 10-1的标准差为2s =16.5.解 (1)这10个学生体重数据的平均数为x =110×(74+71+72+68+76+73+67+70+65+74)=71.这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,∴这10个学生体重数据的中位数为71+722=71.5. 这10个学生体重数据的方差为s 2=110×[(74-71)2+(71-71)2+(72-71)2+(68-71)2+ (76-71)2+(73-71)2+(67-71)2+(70-71)2+(65-71)2+(74-71)2]=11,这10个学生体重数据的标准差为s=s2=11.(2)由样本估计总体得高一所有学生体重数据的平均数为71,中位数为71.5,方差为11,标准差为11.。
第二章统计
[自我校对]
①随机数法
②系统抽样
③分层抽样
④频率分布直方图
⑤茎叶图
⑥方差与标准差
⑦散点图
⑧回归方程
体被抽到的机会相等,当总体中的个体数较少时,常采用简单随机抽样;当总体中的个体数较多时,多采用系统抽样;当已知总体由差异明显的几部分组成时,常采用分层抽样.其中简单随机抽样是最简单、最基本的抽样方法.在进行系统抽样和分层抽样时都要用到简单随
机抽样.
应用各种抽样方法抽样时要注意以下问题:
(1)利用抽签法时要注意把号签放在不透明的容器中且搅拌均匀; (2)利用随机数表法时注意编号位数要一致;
(3)利用系统抽样时,若抽样间隔k =N
n
不是整数,应剔除部分个体;
(4)在分层抽样中,若在某一层抽到的个体数不是整数,应在该层剔除部分个体,使抽取个体数为整数.
某高级中学有学生270人,其中一年级108人,二、三年级各81人.现要从所
有学生中随机抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④30,57,84,111,138,165,192,219,246,270. 关于上述样本的下列结论中,正确的是( ) A.②③都不能为系统抽样 B.②④都不能为分层抽样 C.①④都可能为系统抽样 D.①③都可能为分层抽样
【精彩点拨】 分层抽样时,在各层所抽取的样本个数与该层个体数的比值等于抽样比;系统抽样抽取的号码按从小到大排列后,每一个号码与前一个号码的差都等于分段间隔.
【规范解答】 按分层抽样时,在一年级抽取108×10
270=4(人),在二年级、三年级各
抽取81×10
270=3(人),则在号码段1,2,…,108中抽取4个号码,在号码段109,110,…,
189中抽取3个号码,在号码段190,191,…,270中抽取3个号码,①②③符合,所以①②③可能是分层抽样,④不符合,所以④不可能是分层抽样;如果按系统抽样时,抽取出的号码应该是“等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④都不能为系统抽样.
【答案】 D [再练一题]
1.①教育局督学组到校检查工作,临时需在每班各抽调两人参加座谈;②某班数学期中
考试有15人在120分以上,40人在90~119分,1人不及格,现从中抽出8人研讨进一步改进教与学;③某班春节聚会,要产生两位“幸运者”.就这三件事,合适的抽样方法分别为( )
A.分层抽样,分层抽样,简单随机抽样
B.系统抽样,系统抽样,简单随机抽样
C.分层抽样,简单随机抽样,简单随机抽样
D.系统抽样,分层抽样,简单随机抽样
【尝试解答】①每班各抽两人需用系统抽样.
②由于学生分成了差异比较大的几层,应用分层抽样.
③由于总体与样本容量较小,应用简单随机抽样.故选D.
【答案】 D
线图和茎叶图对总体情况作出估计.直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,这样根据样本的频率分布,我们可以大致估计出总体的分布.但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细的信息.在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可以随时记录,这给数据的记录和表示都能带来方便.
如下表所示给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料.(单位:cm)
(2)画出频率分布直方图;
(3)估计身高低于134 cm的人数占总人数的百分比.
【精彩点拨】(1)根据频数计算出频率.分“分组”、“频数”、“频率”三列,列出频率分布表.
(2)根据频率分布表画出频率分布直方图.
(3)根据频率分布表计算出身高低于134 cm的频率.
【规范解答】 (1)样本的频率分布表:
(2)
(3)因为样本中身高低于134 cm 的人数的频率为5+8+10120=23
120≈0.19,所以估计身高
低于134 cm 的人数约占总人数的19%.
[再练一题]
2.为了了解某校高一学生的视力情况,随机地抽查了该校100名高一学生的视力情况,得到频率分布直方图如图21,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a ,最大频率为0.32,则a 的值为( )
图21
A.64
B.54
C.48
D.27
【解析】 [4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-0.62-0.05-0.11
=1-0.78=0.22.
∴a=(0.22+0.32)×100=54.
【答案】 B
中位数;另一类是反映样本数据的波动大小,包括样本方差及标准差.通常,在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,质量越稳定.
甲、乙两人数学成绩的茎叶图如图22所示:
图22
(1)求出这两名同学的数学成绩的平均数、标准差;
(2)比较两名同学的成绩,谈谈你的看法.
【精彩点拨】(1)利用茎叶图中的数据计算平均数、标准差.
(2)从平均数和方差两方面比较两人的成绩.
【规范解答】x甲=1
10
(65+70+80+86+89+95+91+94+107+113)=89.
s2甲=
1
10
[(65-89)2+(70-89)2+(80-89)2+(86-89)2+(89-89)2+(95-89)2+(91
-89)2+(94-89)2+(107-89)2+(113-89)2]=199.2,∴s甲≈14.1.
x乙=1
10
(79+86+83+88+93+99+98+98+102+114)=94.
s2乙=
1
10
[(79-94)2+(86-94)2+(83-94)2+(88-94)2+(93-94)2+(99-94)2+(98
-94)2+(98-94)2+(102-94)2+(114-94)2]=96.8.
∴s乙≈9.8.
∴x甲<x乙且s甲>s乙.
∴乙同学的平均成绩较高且标准差较小;
说明乙同学比甲同学的成绩扎实,稳定.
[再练一题]。