高考数学集合总复习-随机抽样
- 格式:doc
- 大小:106.65 KB
- 文档页数:5
2019高考数学复习简单随机抽样专题复习题(带答案)简单随机抽样也称为单纯随机抽样、纯随机抽样、SRS 抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
以下是简单随机抽样专题复习题,请考生认真练习。
一、选择题1.关于简单随机抽样的特点,有以下几种说法,其中不正确的是()A.要求总体的个数有限B.从总体中逐个抽取C.它一般情况是一种不放回的抽取D.每个个体被抽到的可能性与抽取的顺序有关[答案] D[解析] 在简单随机抽样中,每个个体被抽到的可能性相等,它与抽取的顺序无关,故D错误.2.下列抽样中,用抽签法方便的有()A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验[答案] B[解析] 当样本个数比较小且制号签比较方便时,用抽签法.故选B.3.下列说法正确的是()A.抽签法中可一次抽取两个个体B.随机数法中每次只取一个个体C.简单随机抽样是有放回抽样D.抽签法中将号签放入箱子中,可以不搅拌直接抽取[答案] B[解析] 根据简单随机抽样的特点判断.4.下列抽样方法是简单随机抽样的是()A.从50个零件中一次性抽取5个做质量检验B.从50个零件中有放回地抽取5个做质量检验C.从实数集中随机的抽取10个正整数分析奇偶性D.运动员从8个跑道中随机抽取一个跑道[答案] D[解析] 简单随机抽样每个样本是逐个抽取,并且是无放回的抽取,样本总体的容量为有限个,故A、B、C均错.5.用随机数法从100名学生(男生25人)中抽选20人进行评教,某男学生被抽到的概率是()A.0.01B.0.04C.0.2D.0.25[答案] C[解析] 明确是简单随机抽样且每个个体被抽到的概率是相等的,问题的突破口就找到了.因为样本容量为20,总体容量为100,所以总体中每一个个体被抽到的概率为=0.2.6.下列问题中,最适合用简单随机抽样方法抽样的是()A.某单位有员工40人,其中男员工30人,女员工10人,要从中抽8人调查吸烟情况B.从20台电视机中抽取5台进行质量检查C.中央电视台要对春节联欢晚会的收视率进行调查,从全国观众中选10000名观众D.某公司在甲、乙、丙三地分别有120个、80个、150个销售点,要从中抽取35个调查收入情况[答案] B[解析] 根据简单随机抽样的概念及其特点可知当总体中的个体数和样本容量都较小时可采用简单随机抽样.抽出的样本必须准确地反映总体特征.二、填空题7.抽签法中确保样本具有代表性的关键是________.[答案] 搅拌均匀[解析] 在数理统计里,为了使样本具有较好的代表性,设计抽样方法时,最重要的是将总体搅拌均匀,使每个个体有同样的机会被抽到,而抽签法是简单随机抽样,因此在给总体标号后,一定要搅拌均匀.8.某总体容量为M,其中带有标记的有N个,现用简单随机抽样方法从中抽取一个容量为m的样本,则抽取的m个个体中带有标记的个数估计为________.[答案] N[解析] 设m个个体中带有标记的个数为n,根据简单随机抽样的特点知=,解得n=N.三、解答题9.为了了解某校高三期中文、理科数学考试填空题的得分情况,决定从80名文科学生中抽取10名学生,从300名理科学生中抽取50名学生进行分析,请选择合适的抽样方法设计抽样方案.[分析] 应从文、理科学生中分别抽样,由于文科学生总人数较少,抽取的人数也较少,故宜用抽签法,但理科学生人数较多,抽取人数也较多,故抽取理科学生宜用随机数法. [解析] 文科抽样用抽签法,理科抽样用随机数法.抽样过程如下:(1)先抽取10名文科学生:将80名文科学生依次编号为1,2,3,,80;将号码分别写在相同形状、大小的纸片上,制成号签;把80个号签放入同一个容器中,搅拌均匀,每次从中不放回地抽取一个号签,连续抽取10次;与号签上号码相对应的10名学生的填空题得分就构成容量为10的一个样本.(2)再抽取50名理科学生:将300名理科学生依次编号为001,002,,081,082,,300; 从随机数表中任选一数字作为读数的起始数字,任选一方向作为读数方向,比如从教材附表的第4行第1列数字1开始向右读,每次读取三位,凡不在001300范围内以及重复的数都跳过去,得到号码125,210,142,188,264,这50个号码所对应的学生的填空题得分就是抽取的对象. 简单随机抽样专题复习题及答案的全部内容就是这些,查字典数学网希望对考生复习数学有帮助。
概率与统计知识点及专练(一)统计基础知识:1. 随机抽样:(1).简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.(2).系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).(3).分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.2. 普通的众数、平均数、中位数及方差: (1).众数:一组数据中,出现次数最多的数(2).平均数:常规平均数:12nx x x x n ++⋅⋅⋅+=(3).中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数(4).方差:2222121[()()()]n s x x x x x x n =-+-+⋅⋅⋅+-(5).标准差:s3 .频率直方分布图中的频率:(1).频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数; 频数=总数*频率(2).频率之和等于1:121n f f f ++⋅⋅⋅+=;即面积之和为1: 121n S S S ++⋅⋅⋅+=4. 频率直方分布图下的众数、平均数、中位数及方差: (1).众数:最高小矩形底边的中点(2).平均数:112233n n x x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+(3).中位数:从左到右或者从右到左累加,面积等于0.5时x 的值(4).方差:22221122()()()nn s x x f x x f x x f =-+-+⋅⋅⋅+-5.线性回归直线方程:(1).公式:ˆˆˆy bx a=+其中:1122211()()ˆ()n ni i i ii in ni ii ix x y y x y nxybx x x nx====---∑∑==--∑∑(展开)ˆˆa y bx=-(2).线性回归直线方程必过样本中心(,) x y(3).ˆ0:b>正相关;ˆ0:b<负相关(4).线性回归直线方程:ˆˆˆy bx a=+的斜率ˆb中,两个公式中分子、分母对应也相等;中间可以推导得到6. 回归分析:(1).残差:ˆˆi i ie y y=-(残差=真实值—预报值)分析:ˆie越小越好(2).残差平方和:2 1ˆ() ni iiy y =-∑分析:①意义:越小越好;②计算:222211221ˆˆˆˆ()()()() ni i n niy y y y y y y y =-=-+-+⋅⋅⋅+-∑(3).拟合度(相关指数):2 2121ˆ()1()ni iiniiy y Ry y==-∑=--∑分析:①.(]20,1R∈的常数;②.越大拟合度越高(4).相关系数:()()n ni i i ix x y y x y nx y r---⋅∑∑==分析:①.[1,1]r∈-的常数;②.0:r>正相关;0:r<负相关③.[0,0.25]r∈;相关性很弱;(0.25,0.75)r∈;相关性一般;[0.75,1]r∈;相关性很强7. 独立性检验:(1).2×2列联表(卡方图): (2).独立性检验公式①.22()()()()()n ad bc k a b c d a c b d -=++++②.上界P 对照表:(3).独立性检验步骤:①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++ ②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k③.下结论:0k k ≥即认为有P 的没把握、有1-P 以上的有把握认为两个量相关;0k k <:即认为没有1-P 以上的把握认为两个量是相关关系。
2022年新高考数学总复习:随机抽样知识点一 总体、个体、样本、样本容量的概念统计中所考察对象的全体构成的集合看做总体,构成总体的每个元素作为个体,从总体中抽取的__一部分个体__所组成的集合叫做样本,样本中个体的__数目__叫做样本容量. 知识点二 简单随机抽样一般地,设一个总体含有N 个个体,从中逐个__不放回__地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的__机会都相等__,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法有两种:__抽签法__和__随机数表法__.知识点三 系统抽样当总体中的个体比较多且均衡时,首先把总体分成均衡的若干部分,然后__按照预先定出的规则__,从每一部分中抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样. 系统抽样的步骤一般地,假设要从容量为N 的总体中抽取容量为n 的样本.(1)先将总体的N 个个体__编号__;(2)确定__分段间隔k __,对编号进行__分段__.当N n (n 是样本容量)是整数时,取k =N n; (3)在第1段用__简单随机抽样__确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号__(l +k )__,再加k 得到第3个个体编号__(l +2k )__,依次进行下去,直到获取整个样本. 知识点四 分层抽样一般地,在抽样时将总体分成互不交叉的层,然后按照__一定的比例__,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. 分层抽样的应用范围:当总体是由__差异明显的几个部分__组成时,往往选用分层抽样的方法. 归纳拓展1.不论哪种抽样方法, 总体中的每一个个体入样的概率都是相同的.2.系统抽样一般也称为等距抽样,入样个体的编号相差分段时间隔k 的整数倍.3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比. 双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是从总体中逐个不放回的抽取样本.( √ )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.(×)(3)系统抽样在起始部分抽样时采用简单随机抽样.(√)(4)抽签法中,先抽的人抽中的可能性大.(×)(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.(×)(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.(×)题组二走进教材2.(P100A组T2)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为(B)A.33,34,33B.25,56,19C.30,40,30D.30,50,20[解析]因为125∶280∶95=25∶56∶19,所以抽取人数分别为25,56,19.3.(P59T2)某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号,29号,42号学生在样本中,那么样本中还有一个学生的学号是(D) A.10B.11C.12D.16[解析]从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.题组三走向高考4.(2018·课标全国Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是__分层抽样__.[解析]因为不同年龄段客户对其服务的评价有较大差异,所以根据三种抽样方法的特点可知最合适的抽样方法是分层抽样.5.(2019·课标全国Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是(C)A.8号学生B.200号学生C.616号学生D.815号学生[解析]将1 000名学生分成100组,每组10人,则每组抽取的号码构成公差为10的等差数列{a n},由题意知a5=46,则a n=a5+(n-5)×10=10n-4,n∈N*,易知只有C选项满足题意.故选C.考点突破·互动探究考点一 简单随机抽样——自主练透例1 (1)(2021·陕西模拟)某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生、6名女生,则下列命题正确的是( A )A .这次抽样可能采用的是简单随机抽样B .这次抽样一定没有采用系统抽样C .这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率D .这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率(2)(2021·山西大同)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( A )A .110,110B .310,15C .15,310D .310,310(3)(2021·山西大学附中诊断)某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,…,599,600从中抽取60个样本,如下提供随机数表的第4行到第6行:32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42;84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04;32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号( D )A .522B .324C .535D .578[解析] (1)利用排除法求解.这次抽样可能采用的是简单随机抽样,A 正确;这次抽样可能采用系统抽样,男生编号为1~20,女生编号为21~50,间隔为5,依次抽取1号,6号,…,46号便可,B 错误;这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率,C 和D 均错误,故选A .(2)在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110.故选A . (3)从第6行第6列开始向右依次读取3个数,依次得到的样本为436,535,577,348,522,578,故选D .名师点拨(1)简单随机抽样满足:①抽取的个体数有限;②逐个抽取;③不放回抽取;④等可能抽取.(2)抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况.〔变式训练1〕(2021·赣州模拟)从某班50名同学中选出5人参加户外活动,利用随机数表法抽取样本时,先将50名同学按01,02,…,50进行编号,然后从随机数表的第1行第5列和第6列数字开始从左往右依次选取两个数字,则选出的第5个个体的编号为( A )(注:表为随机数表的第1行与第2行)A .24C .46D .47[解析] 由题知从随机数表的第1行第5列和第6列数字开始,由表可知依次选取43,36,47,46,24.故选A .考点二 系统抽样——师生共研例2 (1)(2021·甘肃张掖诊断)某校高三科创班共48人,班主任为了解学生高考前的心理状况,将学生按1至48的学号用系统抽样方法抽取8人进行调查,若抽到的最大学号为48,则抽到的最小学号为__6__.(2)(2021·安徽江淮十校联考)某校阳光心理辅导室为了解高三同学们的心理状况,将高三年级20个班依次编号为1到20,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为50,则抽到的最大编号为( C )A .14B .16C .18D .20(3)(2021·湖北模拟)将参加数学竞赛决赛的500名学生编号为:001,002,…,500,采用系统抽样的方法抽取一个容量为50的样本,分组后,在第一组采用简单随机抽样抽得的号码为003.这500名学生分别在三个考点考试,从001到200在第一考点,从201到355在第二考点,从356到500在第三考点,则第三考点被抽中的人数为( A )A .14B .15C .16D .21[解析] (1)系统抽样的抽取间隔为488=6,则48-6×7=6,则抽到的最小学号为6,故答案为6.(2)由题意组距为4,设第一组抽到的编号为x ,则抽到的编号之和为x +(x +4)+(x +8)+(x +12)+(x +16)=50,解得x =2,故最大编号为18.(3)解法一:按照系统抽样的规则,356号在第36组且为第6位,500号在第50组,又第36组抽到的考生没在第三考点,故第三考点被抽到的人数为50-36=14.解法二:由题意可知,将500名学生平均分成50组,每组10人,第k (k ∈N *)组抽到的号码为10(k -1)+3.令356≤10(k -1)+3≤500(k ∈N *),解得37≤k ≤50,则满足37≤k ≤50的正整数k 有14个,故第三考点被抽中的学生人数为14人.故选A .名师点拨系统抽样的特点(1)适用于元素个数很多且均衡的总体.(2)各个个体被抽到的机会均等.(3)总体分组后,在起始部分抽样时采用的是简单随机抽样.(4)如果总体容量N 能被样本容量n 整除,则抽样间隔为k =N n.如果总体容量N 不能被样本容量n 整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样.(5)样本容量是几就是分几段,每段抽取一个个体.〔变式训练2〕(2021·安徽黄山质检)某校高三(1)班共有48人,学号依次为1,2,3,…,48,现用系统抽样的办法抽取一个容量为6的样本.已知学号为3,11,19,35,43的同学在样本中,那么还有一个同学的学号应为( A )A .27B .26C .25D .24[解析] 根据系统抽样的规则——“等距离”时抽取,也就是抽取的号码差相等,根据抽出的序号可知学号之间的差为8,所以在19与35之间还有27,故选A .考点三,分层抽样——多维探究角度1 求某层入样的个体数例3 (1)(2021·广西桂林、崇左、贺州联考)某校为了解学生学习的情况,采用分层抽样的方法从高一2 400人、高二2 000人、高三n 人中,抽取90人进行问卷调查.已知高一被抽取的人数为36,那么高三被抽取的人数为__24__.(2)(2021·宁波一模)调查某高中1 000名学生的身高情况得下表,已知从这批学生中随机抽取1名学生,抽到偏矮男生的概率为0.12,若用分层抽样的方法,从这些学生中随机抽取50名,问应在偏高学生中抽取__11__名.[解析] (1)由分层抽样的知识可得 2 4002 400+2 000+n×90=36,即n =1 600, 所以高三被抽取的人数为 1 6002 400+2 000+1 600×90=24,应填答案24. (2)由题意可知x =1 000×0.12=120,所以y +z =220.所以偏高学生占学生总数的比例为2201 000=1150,所以抽50名应抽偏高学生50×1150=11(人).角度2 求总体或样本容量例4 (1)(2021·湖南模拟)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n =( D )A .9B .10C .12D .13 (2)(2021·吴忠模拟)某中学高一年级共有学生2 400人,为了解他们的身体状况,按性别用分层抽样的方法从中抽取一个容量为80的样本,若样本中共有男生42人,则该校高一年级共有女生( D )A .1 260B .1 230C .1 200D .1 140[解析] (1)由分层抽样可得,360=n 260,解得n =13.故选D . (2)高一年级共有学生2 400人,按性别用分层抽样的方法从中抽取一个容量为80的样本,样本中共有男生42人, 则高一年级的女生人数约为:2 400×80-4280=1 140.故选D .名师点拨(1)分层抽样的操作步骤:①将总体按一定标准进行分层;②计算各层的个体数与总体数的比,按各层个体数占总体数的比确定各层应抽取的样本容量;③在每一层进行抽样(可用简单随机抽样或系统抽样).(2)进行分层抽样的相关计算时,常利用以下关系式巧解:①样本容量n 总体的个数N =该层抽取的个体数该层的个体数;②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.〔变式训练3〕(1)(角度1)(2021·广东广州模拟)某公司生产A ,B ,C 三种不同型号的轿车,产量之比依次为2∶3∶4,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为n 的样本,若样本中A 种型号的轿车比B 种型号的轿车少8辆,则n =( B )A .96B .72C .48D .36(2)(角度2)某高中计划从全校学生中按年级采用分层抽样方法抽取20名学生进行心理测试,其中高三有学生900人,已知高一与高二共抽取了14人,则全校学生的人数为( C )A .2 400B .2 700C .3 000D .3 600(3)(角度3)某中学为了更好地开展社团活动,丰富同学们的课余生活,现用分层抽样的方法从“模拟法庭”“街舞”“动漫”“话剧”四个社团中抽取若干人组成校社团指导小组,有关数据见下表:①求a ,b ,c ②若从“动漫”与“话剧”社团已抽取的人中选2人担任指导小组组长,求这2人分别来自这两个社团的概率.[解析] (1)由题意得29n -39n =-8,∴n =72,故选B . (2)设全校学生人数为n ,由题意可知20n =20-14900, 解得n =3 000,故选C .(3)①由表可知抽取比例为530=16,故a =4,b =24,c =2. ②设“动漫”社团的4人分别为:A 1,A 2,A 3,A 4;“话剧”社团的2人分别为:B 1,B 2.则从中任选2人的所有基本事件为:(A 1,A 2),(A 1,A 3),(A 1,A 4),(A 2,A 3),(A 2,A 4),(A 3,A 4),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(A 4,B 1),(A 4,B 2),(B 1,B 2)共15个.其中2人分别来自这两个社团的基本事件为:(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(A 4,B 1),(A 4,B 2),共8个.所以这2人分别来自这两个社团的概率P =815. (理)⎝⎛⎭⎫或这2人分别来自这两个社团的概率P =C 14C 12C 26=815名师讲坛·素养提升Ⅰ 随机抽样与概率的结合例5 (理)(2018·天津)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(ⅰ)用X 表示抽取的3人中睡眠不足的员工人数,求随机变量X 的分布列与数学期望; (ⅱ)设A 为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A 发生的概率.(文)(2018·天津高考)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(2)设抽出的7名同学分别用A ,B ,C ,D ,E ,F ,G 表示,现从中随机抽取2名同学承担敬老院的卫生工作.①试用所给字母列举出所有可能的抽取结果;②设M 为事件“抽取的2名同学来自同一年级”,求事件M 发生的概率.[解析] (理)(1)单位甲、乙、丙三个部门的员工人数分别为24,16,16.人数比为:3∶2∶2,从中抽取7人,应从甲、乙、丙三个部门的员工中分别抽取3,2,2人.(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(ⅰ)用X 表示抽取的3人中睡眠不足的员工人数,随机变量X 的取值为:0,1,2,3,P (X =k )=C k 4·C 3-k 3C 37,k =0,1,2,3. 所以随机变量的分布列为:随机变量X 的数学期望E (X )=0×135 +1×1235+2×1835+3×435=127; (ⅱ)设A 为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”, 设事件B 为:抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人,事件C 为:抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人,则:A =B ∪C ,且P (B )=P (X =2),P (C )=P (X =1),故P (A )=P (B ∪C )=P (X =2)+P (X =1)=67. 所以事件A 发生的概率为67. (文)(1)由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(2)①从抽出的7名同学中随机抽取2名同学的所有可能结果为{A ,B },{A ,C },{A ,D },{A ,E },{A ,F },{A ,G },{B ,C },{B ,D },{B ,E },{B ,F },{B ,G },{C ,D },{C ,E },{C ,F },{C ,G },{D ,E },{D ,F },{D ,G },{E ,F },{E ,G },{F ,G },共21种.②由(1),不妨设抽出的7名同学中,来自甲年级的是A ,B ,C ,来自乙年级的是D ,E ,来自丙年级的是F ,G ,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{A ,B },{A ,C },{B ,C },{D ,E },{F ,G },共5种,所以,事件M 发生的概率P (M )=521. 注:分层抽样与概率相结合的题目是高考的热点,解题时先根据分层抽样确定人数,再利用古典概型求解相应的概率.Ⅱ 几种常用的统计图形一、扇形图例6 在疫情防控阻击战之外,另一条战线也日渐清晰——恢复经济正常运行,国人万众一心,众志成城,防控疫情、复工复产,某企业对本企业1 000名职工关于复工的态度进行调查,调查结果如图所示,则下列结论错误的是( C )A .x =34.8B.从该企业中任取一名职工,该职工是倾向于在家办公的概率为0.178C.不到50名职工倾向于继续申请休假D.倾向于复工后在家办公或在公司办公的职工超过600名[解析]对于A,x=100-5.1-17.8-42.3=34.8,A正确;对于B,倾向于在家办公的人员占比为17.8%,故对应概率为0.178,B正确;对于C,倾向于继续申请休假人数为1 000×5.1%=51人,C错误;对于D,倾向于在家办公或在公司办公的职工人数为1 000×(17.8%+42.3%)=601人,D正确.二、条形图(柱状图)例7(2021·山东日照联考、江西南昌摸底)爱美之心,人皆有之.健身减肥已成为很多肥胖者业余选择的项目.为了了解运动健身减肥的效果,某健身房调查了40名肥胖者,健身之前他们的体重(单位:kg)情况如柱状图1所示,经过四个月的健身后,他们的体重情况如柱状图2所示.对比健身前后,关于这40名肥胖者,下面结论不正确的是(C)A.他们健身后,体重在区间[90,100)内的人数增加了4个B.他们健身后,体重在区间[100,110)内的人数没有改变C.因为体重在[100,110)内所占比例没有发生变化,所以说明健身对体重没有任何影响D.他们健身后,原来体重在区间[110,120)内的肥胖者体重都有减少[解析]根据给定的健身前后的体重柱状图,可得健身前体重在区间[90,100)内的有40×30%=12人,健身后有40×40%=16,所以体重在区间[90,100)内的人数增加了4个,所以A正确;由健身前体重在[100,110)的人数为40×50%=20人,健身后有40×50%=20,所以健身前后体重在[100,110)的人数不变,所以B正确;由健身前后体重在[90,100)和[110,120)的人数有明显变化,所以健身对体重有明显效果,所以C不正确;由健身前体重在[110,120)的人数为40×20%=8人,健身后为0人,所以原来体重在区间[110,120)内的肥胖者体重都有减少,所以D正确.故选C.三、雷达图例8(2021·湖南湘潭高三月考)某工厂组织员工进行专业技能比赛,下图是7位评委对甲、乙两位员工评分(满分10分)的雷达图.根据图中信息,下列说法正确的个数是(B)①甲得分的中位数大于乙得分的中位数②甲得分的众数大于乙得分的众数③甲得分的平均数与乙得分的平均数相等④甲得分的极差小于乙得分的极差A.1B.2C.3D.4[解析]由雷达图可知,甲的得分从小到大排列依次是8.8,9.1,9.3,9.5,9.5,9.7,9.9;乙的得分从小到大排列依次是8.5,8.9,9.4,9.6,9.6,9.8,10.甲得分的中位数为9.5,乙得分的中位数为9.6,9.5<9.6,故①错误;甲得分的众数为9.5,乙得分的众数9.6,9.5<9.6,故②错误;甲得分的平均数为8.8+9.1+9.3+9.5+9.5+9.7+9.97=9.4,乙得分的平均数8.5+8.9+9.4+9.6+9.6+9.8+107=9.4,平均数相等,故③正确;甲得分的极差为9.9-8.8=1.1,乙得分的极差10-8.5=1.5,1.1<1.5,故④正确.故选B.〔变式训练4〕(1)(2021·江苏南京调研)5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图,某单位结合近年数据,对今后几年的5G经济产岀做出预测由上图提供的信息可知,下列结论错误的是(C)A.运营商的经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.设备制造商在各年的总经济产出中一直处于领先地位D.信息服务商与运营商的经济产岀的差距有逐步拉大的趋势(2)(2018·课标全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是(A)A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半(3)(2021·四川成都石室中学模拟)某商家统计了去年P,Q两种产品的月销售额(单位:万元),绘制了月销售额的雷达图,图中A点表示P产品2月份销售额约为20万元,B点表示Q产品9月份销售额约为25万元.根据图中信息,下面统计结论错误的是(B)A.P产品的销售额极差较大B.P产品销售额的中位数较大C.Q产品的销售额平均值较大D.Q产品的销售额波动较小[解析](1)从图表中可以看出2029年、2030年信息服务商在总经济产出中处于领先地位,C错误,故选C.(2)解法一:设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a;建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.故选A.解法二:因为0.6<0.37×2.所以新农村建设后,种植收入增加,而不是减少,所以A 是错误的,故选A.(3)据图可以看出,P产品的销售额的波动较大,Q产品的销售额的波动较小,并且Q 产品的销售额只有两个月的销售额比25万元稍小,其余都在25万元至30万元之间,所以P产品的销售额的极差较大,中位数较小,Q产品的销售的平均值较大,销售的波动较小,选B.。
第1讲 随机抽样 用样本估计总体A 组基础巩固一、单选题1.(2024·陕西汉中模拟)某射击运动员连续射击5次,命环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为( B )A .7.6B .7.8C .8D .8.2[解析] 由题意可知该组数据为6,7,8,9,9,∴平均数x =6+7+8+9+95=7.8.故选B.2.(2023·陕西西安联考)某社区有1 500名老年居民、2 100名中青年居民和1 800名儿童居民.为了解该社区居民对社区工作的满意度,现采用分层抽样的方法从这些居民中抽取一个容量为n 的样本,若中青年居民比老年居民多抽取20人,则n =( C )A .120B .150C .180D .210[解析] 由题可知⎝ ⎛⎭⎪⎫2 1001 500+2 100+1 800- 1 5001 500+2 100+1 800×n =20,解得n =180.故选C.3.(2023·湖南部分学校联考)已知某班共有学生46人,该班语文老师为了了解学生每天阅读课外书籍的时长情况,决定利用随机数表法从全班学生中抽取10人进行调查.将46名学生按01,02,…,46进行编号.现提供随机数表的第7行至第9行:84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 56 57 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 32 21 12 34 29 78 64 56 07 82 82 42 07 44 38 15 51 00 13 42 99 66 02 79 54 若从表中第7行第41列开始向右依次读取2个数据,每行结束后,下一行依然向右读数,则得到的第8个样本编号是( D )A .07B .12C .39D .44 [解析] 依次抽取的样本编号为12,06,01,16,19,10,12,07,44,39,38.剔除重复号码12,故选D.4.(2024·江苏南京六校联合调研)已知样本数据3x 1+1,3x 2+1,3x 3+1,3x 4+1,3x 5+1,3x 6+1的平均数为16,方差为9,则另一组数据x 1,x 2,x 3,x 4,x 5,x 6,12的方差为( C )A.467B .477C .487D .7[解析] 设数据x 1,x 2,x 3,x 4,x 5,x 6的平均数为x ,方差为s 2,由3x +1=16,9s2=9,得x =16∑i =16x i =5,s 2=16∑i =16 (x i -5)2=1,则x 1,x 2,x 3,x 4,x 5,x 6,12的平均数为5×6+127=6,方差为∑i =16x i -62+12-627=∑i =16x i -5-12+367=∑i =16x i -52-2∑i =16x i -5+1×6+367=∑i =16x i -52-2∑i =16x i +1027=6s 2-2×6x +1027=487.故选C.5.(2022·全国高考甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识,为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( B )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差[解析] 讲座前中位数为70%+75%2>70%,所以A 错;讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B 对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C 错;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D 错.故选B.6.(2024·四川南充高级中学月考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( D )A.100,10 B.100,20C.200,10 D.200,20[解析]依题意可得样本容量为(3 500+2 000+4 500)×2%=200,其中高中生抽取2 000×2%=40人,因为样本中高中生的近视率为50%,所以抽取的高中生近视人数为40×50%=20人;故选D.7.(2024·江苏基地校大联考改编)如图为甲、乙两人在同一星期内每日步数的折线统计图,则下列结论错误的是( C )A.这一星期内甲的日步数的中位数为11 600B.这一星期内甲的日步数的极差大于乙的日步数的极差C.这一星期内乙的日步数的方差大于甲的日步数的方差D.这一星期内乙的日步数的下四分位数是7 030[解析]甲的步数从小到大排列为:2 435,7 965,9 500,11 600,12 700,16 000,16 800,中位数是11 600.故A正确;这一星期内甲的日步数的极差16 800-2 435=14 365,这一星期内乙的日步数的极差14 200-5 340=8 860,这一星期内甲的日步数的极差大于乙的日步数的极差,故B正确;由图知甲的波动程度大,故方差大故C错误;乙的步数从小到大排列为:5 340,7 030,10 060,11 600,12 300,12 970,14 200,7×25%=1.75,故这一星期内乙的日步数为25%分位数是7 030,故D正确.故选C.8.(2023·江西赣州模拟)某校随机抽取了100名学生测量体重,经统计,这些学生的体重数据(单位:kg)全部介于45至70之间,将数据整理得到如图所示的频率分布直方图,则下列结论错误的是( D )A .频率分布直方图中a 的值为0.07B .这100名学生中体重低于60 kg 的人数为70C .据此可以估计该校学生体重的第78百分位数约为62D .据此可以估计该校学生体重的平均数约为56.25[解析] 因为5×(0.01+0.02+0.04+0.06+a )=1,解得a =0.07,所以A 正确;体重低于60 kg 的频率为5×(0.01+0.06+0.07)=0.7,所以人数为0.7×100=70,所以B 正确;因为5×(0.01+0.06+0.07)=0.7,5×(0.01+0.06+0.07+0.04)=0.9,所以体重的第78百分位数位于[60,65)之间,设体重的第78百分位数为x ,则(0.01+0.07+0.06)×5+(x -60)×0.04=0.78,解得x =62,所以C 正确;体重的平均数约为0.01×5×47.5+0.07×5×52.5+0.06×5×57.5+0.04×5×62.5+0.02×5×67.5=57.25,所以D 错误.故选D.二、多选题9.(2024·安徽安庆、池州、铜陵部分学校联考)甲乙两名射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4 乙9578768677则A .甲乙两人射击成绩的平均数相同 B .甲乙两人射击成绩的中位数相同 C .甲命中环数的极差大于乙命中环数的极差 D .甲比乙射击成绩更稳定[解析] 可求甲乙平均数为x 1=x 2=7,中位数均为7,故A ,B 正确;甲的极差为6,乙的极差为4,故C 正确;甲的方差为:17×(1+4+4+9+4+9+9)=407,乙的方差为:17×(4+4+1+1+1+1)=127,故D 错误.10.(2024·湖北宜荆荆恩联考、广东深圳宝安区调研)下列说法正确的有( AC )A .从40个个体中随机抽取一个容量为10的样本,则每个个体被抽到的概率都是0.25B .已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是5C .数据26,11,14,31,15,17,19,23的50%分位数是18D .若样本数据x 1,x 2,…,x n 的标准差为4,则数据2x 1+1,2x 2+1,…,2x n +1的标准差为16[解析] 从40个个体中随机抽取一个容量为10的样本,则每个个体被抽到的概率都是1040=0.25,故A 正确;已知一组数据1,2,m,6,7的平均数为4,则m =4×5-(1+2+6+7)=4,这组数据的方差为15×[(1-4)2+(2-4)2+(4-4)2+(6-4)2+(7-4)2]=265,故B 错误;这组数据从小到大排列为:11,14,15,17,19,23,26,31,共8个,故其50%分位数为第4个数17和第5个数19的平均数,为18,故C 正确;若样本数据x 1,x 2,…,x n 的标准差为4,则方差为16,故数据2x 1+1,2x 2+1,…,2x n +1的方差为16×22=64,标准差为8,故D 错误.故选AC.11.(2024·江西南昌摸底)“未来之星”少儿才艺大赛,选手通过自我介绍和才艺表演,展示仪表形象、表达能力、风度气质等自身的整体形象,评委现场打分.若九位评委对某选手打分分别是x 1,x 2,…,x 9,记这组数据的平均分、中位数、标准差、极差分别为x ,z ,s ,j ,去掉这组数据的一个最高分和一个最低分后,其平均分、中位数、标准差、极差分别为x ′,z ′,s ′,j ′,则下列判断中一定正确的是( BCD )A.x =x ′ B .z =z ′ C .s ≥s ′D .j ≥j ′[解析] 根据平均数的性质可知x =x ′不一定成立,例如九个数一个90,其他都是80,显然该等式不成立,因此A 不正确;根据中位数的定义可知这九个数据从小到大排列,中间的一个数据是中位数,去掉最高和最低不影响中间的数据,所以B 正确;根据标准差的意义可知去掉最高和最低分,数据有可能会更集中,所以选项C 正确;因为去掉最高和最低分,极差有可能减小,所以选项D 正确,故选BCD.12.(2024·江西新余一中开学考)下列命题是真命题的有( BD )A .分层抽样调查后的样本中甲、乙、丙三种个体的比例为3∶1∶2,如果抽取的甲个体数为9,则样本容量为30B .某一组样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在区间[114.5,124.5]内的频率为0.4C .甲、乙两队队员体重的平均数分别为60,68,人数之比为1∶3,则甲、乙两队全部队员体重的平均数为67D .一组数6,5,4,3,3,3,2,2,2,1的85%分位数为5[解析] 根据样本的抽样比等于各层的抽样比,样本容量为9÷33+1+2=18,故选项A 错误;样本数据落在区间[114.5,124.5]内的有120,122,116,120共4个,所以样本数据落在区间[114.5,124.5]内的频率为410=0.4,故选项B 正确;甲、乙两队的人数之比为1∶3,则甲队队员在所有队员中所占权重为11+3=14,乙队队员在所有队员中所占权重为31+3=34,则甲、乙两队全部队员体重的平均数为x =14×60+34×68=66,故选项C 错误;将该组数据从小到大排列为:1,2,2,2,3,3,3,4,5,6,由10×85%=8.5,则该组数据的85%分位数是第9个数,该数为5,故选项D 正确.13.(2024·陕西西安、河北保定部分学校联考)某公司统计了2023年1月至6月的月销售额(单位:万元),并与2022年比较,得到同比增长率数据,绘制了如图所示的统计图,则下列说法正确的是( ACD )注:同比增长率=(今年月销售额-去年同期月销售额)÷去年同期月销售额×100%. A .2023年1月至6月的月销售额的极差为8B .2023年1月至6月的月销售额的第60百分位数为8C .2023年1月至6月的月销售额的中位数为9.5D .2022年5月的月销售额为10万元[解析] 2023年1月至6月的月销售额的极差为8,故A 正确;因为6×60%=3.6,所以2023年1月至6月的月销售额的第60百分位数为11,故B 错误;2023年1月至6月的月销售额的中位数为9.5,故C 正确;设2022年5月的月销售额为x 万元,则11-xx×100%=10%,解得x =10,故D 正确.故选ACD.三、填空题14.(2023·辽宁沈阳东北育才学校模拟)已知一组样本数据x 1,x 2,x 3…x 10,且x 21+x 22+x 23+…+x 210=185,平均数x =4,则该组数据的方差s 2= 2.5 .[解析] 由题意知x 1+x 2+x 3…+x 10=4×10=40,又s 2=x 1-42+x 2-42+x 3-42+…+x 10-4210=x 21+x 22+x 23+…+x 210-8x 1+x 2+x 3…+x 10+16×1010=185-8×40+16×1010=18.5-32+16=2.5.15.(2024·浙江名校联盟高考研究卷改编)从树人小学二年级学生中随机抽取100名学生,将他们的身高(单位:cm)数据绘制成频率分布直方图如图,则下列结论正确的是 ①② (填上所有正确结论的序号)①a =0.030②估计树人小学这100名二年级学生的平均身高为124.5 cm ③估计树人小学这100名二年级学生身高的中位数为122.5 cm ④估计树人小学这100名二年级学生身高的众数为120 cm[解析] a =0.1-(0.005+0.01+0.02+0.035)=0.03.①正确.平均身高:105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm),②正确.由(x -120)×0.03=0.1得x ≈123.3(cm),③错.身高的众数为115 cm.④错.故填①②.B 组能力提升1.(2024·山西大同质检)一组数据按从小到大的顺序排列为1,3,5,6,m,10,12,13,若该组数据的中位数是极差的58,则该组数据的第60百分位数是( C )A .7.5B .8C .9D .9.5[解析] 由题意得6+m 2=58×(13-1),∴m =9.故选C.2.(多选题)(2024·安徽皖东智校协作联盟联考)某学校共有学生2 000人,其中高一800人,高二高三各600人,学校为了了解学生在寒假期间每天的读书时间,按照分层随机抽样的方法从全校学生中抽取100人,其中高一学生,高二学生,高三学生每天读书时间的平均数分别为x 1=2.7,x 2=3.1,x 3=3.3,每天读书时间的方差分别为s 21=1,s 22=2,s 23=3,则下列正确的是( ACD )A.从高二年级抽取30人B.被抽取的学生中,高二年级每天的总读书时间比高一年级多15小时C.被抽取的学生每天的读书时间的平均数为3小时D.估计全体学生每天的读书时间的方差为s2=1.966[解析]根据分层抽样,分别从高一学生,高二学生,高三学生中抽取40人,30人,30人,故A正确;抽取的高二年级每天的总读书时间为x2×30=93,抽取的高一年级每天的总读书时间为x1×40=108,高二年级每天的总读书时间比高一年级少15小时,故B错误;被抽取的学生每天的读书时间的平均数为40100×2.7+30100×3.1+30100×3.3=3(小时),故C正确;被抽取的学生每天的读书时间的方差为40100×[1+(2.7-3)2]+30100×[2+(3.1-3)2]+30100×[3+(3.3-3)2]=1.966,∴估计全体学生每天的读书时间的方差为s2=1.966,故D正确.故选ACD.3.(多选题)(2023高考新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( BD )A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差[解析]x2,x3,x4,x5的平均数不一定等于x1,x2,…,x6的平均数,A错误;x2,x3,x4,x5的中位数等于x3+x42,x1,x2,…,x6的中位数等于x3+x42,B正确;设样本数据x1,x2,…,x6为0,1,2,8,9,10,可知x1,x2,…,x6的平均数是5,x2,x3,x4,x5的平均数是5,x1,x2,…,x6的方差s21=16×[(0-5)2+(1-5)2+(2-5)2+(8-5)2+(9-5)2+(10-5)2]=503,x2,x3,x4,x5的方差s22=14×[(1-5)2+(2-5)2+(8-5)2+(9-5)2]=252,s21>s22,∴s1>s2,C错误;x6>x5,x2>x1,∴x6-x1>x5-x2,D正确.故选BD.4.(2023·陕西渭南模拟)2022年2月28日,国家统计局发布了我国2021年国民经济和社会发展统计公报,在以习近平同志为核心的党中央坚强领导下,实现了“十四五”良好开局.2021年,全国居民人均可支配收入和消费支出均较上一年有所增长,结合如下统计图表,下列说法中正确的是( B )A .2017~2021年全国居民人均可支配收入逐年递减B .2021年全国居民人均消费支出24 100元C .2020年全国居民人均可支配收入较前一年下降D .2021年全国居民人均消费支出构成中食品烟酒和居住占比超过60%[解析] 根据条形图可知,2017~2021年全国居民人均可支配收入逐年递增,A 错误.根据扇形图可知,2021年全国居民人均消费支出为:5 641+1 419+7 178+569+2 115+2 599+3 156+1 423=24 100元,B 正确.根据条形图可知,2020年全国居民人均可支配收入较前一年上升,C 错误.2021年全国居民人均消费支出构成中食品烟酒和居住占比:7 178+5 64124 100×100%≈53.2%<60%,D 错误.故选B.5.(2023·全国乙卷)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x i ,y i (i =1,2,…,10).试验结果如下: 试验序号i 1 2 3 4 5 6 7 8 9 10 伸缩率x i 545 533 551 522 575 544 541 568 596 548 伸缩率y i536527543530560533522550576536记z i =x i -y i (i =1,2,…,10),记z 1,z 2,…,z 10的样本平均数为z ,样本方差为s2.(1)求z,s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.(如果z≥2s210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高) [解析](1)x=545+533+551+522+575+544+541+568+596+54810=552.3,y=536+527+543+530+560+533+522+550+576+53610=541.3,z=x-y=552.3-541.3=11,z i=x i-y i的值分别为:9,6,8,-8,15,11,19,18,20,12,∴s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知:z=11,2s210=2 6.1=24.4,故有z≥2s210,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.。
随机抽样导学目标: 1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本.3.了解分层抽样和系统抽样方法.自主梳理1.简单随机抽样(1)定义:设一个总体含有N 个个体,从中____________抽取n 个个体作为样本(n≤N),如果每次抽取时总体的各个个体被抽到的机会都________,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:__________和____________.2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.(1)先将总体的N 个个体进行________;(2)确定____________,对编号进行________.当N n (n 是样本容量)是整数时,取k =N n; (3)在第1段用________________确定第一个个体编号l (l≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号________,再加k 得到第3个个体编号________,依次进行下去,直到获取整个样本.3.分层抽样(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用围:当总体是由________________________________组成时,往往选用分层抽样.自我检测1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量其长度,在这个问题中,200个零件的长度是( )A .总体B .个体C .总体的一个样本D .样本容量2.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么( )A .①是系统抽样,②是简单随机抽样B .①是分层抽样,②是简单随机抽样C .①是系统抽样,②是分层抽样D .①是分层抽样,②是系统抽样3.(2010·)一个单位有职工800人,其中具有高级职称的为160人,具有中级职称的为320人,具有初级职称的为200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( )A .12,24,15,9B .9,12,12,7C .8,15,12,5D .8,16,10,64.(2010·)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )A .7B .15C .25D .355.(2011·模拟)在120个零件中,一级品24个,二级品36个,三级品60个,用系统抽样方法从中抽取量为20的样本,则三级品a 被抽到的可能性为________.探究点一抽样方法的选取例1(2011·检测)要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为( ) A.①简单随机抽样法,②系统抽样法B.①分层抽样法,②简单随机抽样法C.①系统抽样法,②分层抽样法D.①②都用分层抽样法变式迁移1 某高级中学有学生270人,其中一年级108人,二、三年级各81人,现要抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是( )A.②、③都不能为系统抽样B.②、④都不能为分层抽样C.①、④都可能为系统抽样D.①、③都可能为分层抽样探究点二系统抽样例2(2010·)将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( )A.26,16,8 B.25,17,8C.25,16,9 D.24,17,9变式迁移2 (2009·)某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作为样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的为22,则第8组抽出的应是________.若用分层抽样方法,则40岁以下年龄段应抽取______________________人.探究点三分层抽样例3某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )A.9 B.18 C.27 D.36变式迁移3 某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为________ h.1.简单随机抽样的特点:(1)样本的总体个数不多;(2)从总体中逐个不放回地抽取,是不放回抽样;(3)是一种等机会抽样,各个个体被抽取的机会均等,保证了抽样的公平性.2.系统抽样的特点:(1)适用于总体个数较多的情况;(2)剔除多余个体并在第一段中用简单随机抽样确定起始的个体编号;(3)是等可能抽样.3.对于分层抽样的理解应注意:(1)分层抽样适用于由差异明显的几部分组成的情况;(2)在每一层进行抽样时,采用简单随机抽样或系统抽样;(3)分层抽样充分利用已掌握的信息,使样本具有良好的代表性;(4)分层抽样也是等概率抽样,而且在每层抽样时,可以根据具体情况采用不同的抽样方法,因此应用较为广泛.(满分:75分)一、选择题(每小题5分,共25分)1.(2011·第一次调研)现要完成下列3项抽样调查:①从10盒酸奶中抽取3盒进行食品卫生检查;②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.③中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.较为合理的抽样方法是( )A.①简单随机抽样,②系统抽样,③分层抽样B.①简单随机抽样,②分层抽样,③系统抽样C.①系统抽样,②简单随机抽样,③分层抽样D.①分层抽样,②系统抽样,③简单随机抽样2.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( ) A.简单随机抽样法B.抽签法C.随机数法D.分层抽样法3.要从已经编号(1~60)的60枚最新研制的某型号导弹中随机抽取6枚来进行发射试验,用每部分选取的间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( ) A.5,10,15,20,25,30 B.3,13,23,33,43,53C.1,2,3,4,5,6 D.2,4,8,16,32,484.某校共有学生2 000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三A.24 B.5.(2011·师大附中模拟)某中学开学后从高一年级的学生中随机抽取90名学生进行家庭情况调查,经过一段时间后再次从这个年级随机抽取100名学生进行学情调查,发现有20名同学上次被抽到过,估计这个学校高一年级的学生人数为( )A.180 B.400 C.450 D.2 000二、填空题(每小题4分,共12分)6.一个总体有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10组,组号依次为1,2,3,…,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组中随机抽取的为m,那么在第k组中抽取的个位数字与m+k的个位数字相同,若m=6,则在第7组中抽取的是________.7.(2011·月考)某学院的A,B,C三个专业共有1 200名学生.为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取________名学生.8.一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B层中每个个体被抽到的概率都为112,则总体中的个体数为________.三、解答题(共38分)9.(12分)某校高中三年级的295名学生已经编号为1,2,…,295,为了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.10.(12分)(2011·模拟)统计局就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民月收入在[3 000,3 500)的频率;(2)根据频率分布直方图算出样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?11.(14分)某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如表所示:(1)(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率.。