高三数学简单随机抽样
- 格式:pdf
- 大小:1.38 MB
- 文档页数:8
随机抽样考纲要求1.理解随机抽样的必要性和重要性;2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.会用随机抽样的基本方法解决一些简单的实际问题.知识梳理1.简单随机抽样(1)定义:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法:抽签法和随机数法. 2.系统抽样(1)定义:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样. (2)系统抽样的操作步骤假设要从容量为N 的总体中抽取容量为n 的样本. ①先将总体的N 个个体编号;②确定分段间隔k ,对编号进行分段,当N n (n 是样本容量)是整数时,取k =Nn (否则,先剔除一些个体);③在第1段用简单随机抽样确定第一个个体编号l (l ≤k );④按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),……,依次进行下去,直到获取整个样本. 3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. (2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k的整数倍.3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.诊断自测1.判断下列结论正误(在括号内打“√”或“×”)(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.()(2)系统抽样在起始部分抽样时采用简单随机抽样.()(3)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.()答案(1)×(2)√(3)×(4)×2.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是() A.总体B.个体C.样本的容量D.从总体中抽取的一个样本答案 A解析由题目条件知,5 000名居民的阅读时间的全体是总体;其中每1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.3.一个公司共有N名员工,下设一些部门,要采用等比例分层抽样的方法从全体员工中抽取样本容量为n的样本,已知某部门有m名员工,那么从该部门抽取的员工人数是________.答案nm N解析 每个个体被抽到的概率是n N ,设这个部门抽取了x 个员工,则x m =n N ,∴x =nmN.4.(2020·上饶一模)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为( ) 附:第6行至第9行的随机数表如下: 2635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 A .3 B .16 C .38 D .20答案 D解析 按随机数表法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,超出00~49及重复的不选,则编号依次为33,16,20,38,49,32,…,则选出的第3个个体的编号为20,故选D.5.(2021·郑州调研)某校有高中生1 500人,现采用系统抽样法抽取50人作问卷调查,将高一、高二、高三学生(高一、高二、高三分别有学生495人、490人、515人)按1,2,3,…, 1 500编号,若第一组用简单随机抽样的方法抽取的号码为23,则所抽样本中高二学生的人数为( ) A .15 B .16 C .17 D .18答案 C解析 采用系统抽样法从1 500人中抽取50人,所以将1 500人平均分成50组,每组30人,并且在第一组抽取的号码为23,所以第n 组抽取的号码为a n =23+(n -1)×30=30n -7,而高二学生的编号为496到985,所以496≤30n -7≤985,又n ∈N *,所以17≤n ≤33,则共有17人,故选C.6.(2018·全国Ⅲ卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________. 答案 分层抽样解析 因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.考点一 简单随机抽样及其应用1.下面的抽样方法是简单随机抽样的是( )A .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B .某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C .某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D .用抽签方法从10件产品中选取3件进行质量检验 答案 D解析 A ,B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;C 不是简单随机抽样,因为总体中的个体有明显的层次;D 是简单随机抽样.故选D.2.用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( ) A.110,110 B .310,15C.15,310 D .310,310答案 A解析 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110,故选A.3.(2021·南昌一模)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08 B.07 C.02 D.01答案 D解析从第1行第5列和第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.感悟升华 1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.2.简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).考点二系统抽样及其应用【例1】(1)(2021·太原调研)某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样法,抽取4个班进行调查,若抽到的最小编号为3,则抽取的最大编号为()A.15 B.18 C.21 D.22(2)(2019·全国Ⅰ卷)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生(3)中央电视台为了解观众对某综艺节目的意见,准备从502名现场观众中抽取10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽样间隔为________.答案 (1)C (2)C (3)2 10解析 (1)由已知得间隔数为k =244=6,则抽取的最大编号为3+(4-1)×6=21.(2)根据题意,系统抽样是等距抽样, 所以抽样间隔为1 000100=10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.故选C. (3)把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;再将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含50050=10个个体.所以需剔除2个个体,抽样间隔为10.感悟升华 1.如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn ,否则,可随机地从总体中剔除余数,然后按系统抽样的方法抽样,特别注意,每个个体被抽到的机会均是nN .2.系统抽样中依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.【训练1】 (1)(2021·衡水调研)衡水中学高三(2)班现有64名学生,随机编号为0,1,2,…,63,依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8的样本,若在第一组中随机抽取的号码为5,则在第6组中抽取的号码为________. (2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________. 答案 (1)45 (2)4解析 (1)分组间隔为648=8,∵在第一组中随机抽取的号码为5,∴在第6组中抽取的号码为5+5×8=45.(2)依题意,可将编号为1~35号的35个数据分成7组,每组有5个数据,从每组中抽取一人.成绩在区间[139,151]上共有20个数据,分在4个小组内,每组抽取1人,共抽取4人. 考点三 分层抽样及其应用角度1 求某层入样的个体数【例2】 某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有 20 000人,其中各种态度对应的人数如下表所示:最喜爱 喜爱 一般 不喜欢 4 8007 2006 4001 600为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( ) A .25,25,25,25 B .48,72,64,16 C .20,40,30,10 D .24,36,32,8答案 D解析 法一 因为抽样比为10020 000=1200,所以每类人中应抽取的人数分别为4 800×1200=24,7 200×1200=36,6 400×1200=32,1 600×1200=8.法二 最喜爱、喜爱、一般、不喜欢的比例为4 800∶7 200∶6 400∶1 600=6∶9∶8∶2,所以每类人中应抽取的人数分别为66+9+8+2×100=24,96+9+8+2×100=36,86+9+8+2×100=32,26+9+8+2×100=8.角度2 求总体或样本容量【例3】 (1)(2021·东北三省四校联考)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n 的样本,其中高中生有24人,那么n 等于( ) A .12B .18C .24D .36(2)(2020·西安调研)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案 (1)D (2)1 800解析 (1)根据分层抽样方法知n 960+480=24960,解得n =36.(2)由题设,抽样比为804 800=160.设甲设备生产的产品为x 件,则x60=50,∴x =3 000.故乙设备生产的产品总数为4 800-3 000=1 800.感悟升华 1.求某层应抽个体数量:按该层所占总体的比例计算.2.已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.3.分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=样本容量总体容量=各层样本数量各层个体数量”.【训练2】 (1)(2020·郴州二模)已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取30%的户主进行调查,则样本容量和抽取的户主对四居室满意的人数分别为( )A .240,18B .200,20C .240,20D .200,18(2)(2021·合肥模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种,10种,30种,20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是________. 答案 (1)A (2)6解析 (1)样本容量n =(250+150+400)×30%=240,抽取的户主对四居室满意的人数为150×30%×40%=18.(2)抽样比为2040+10+30+20=15,则抽取的植物油类种数是10×15=2,抽取的果蔬类食品种数是20×15=4,所以抽取的植物油类与果蔬类食品种数之和是2+4=6.A 级 基础巩固一、选择题1.(2020·兰州二模)某学校为响应“平安出行”号召,拟从2 019名学生中选取50名学生加入“交通志愿者”,若采用以下方法选取:先用简单随机抽样方法剔除19名学生,剩下的2 000名再按照系统抽样的方法抽取,则每名学生入选的概率( ) A .不全相等 B .均不相等C .都相等,且为140D .都相等,且为502 019答案 D解析 先用简单随机抽样方法剔除19名学生,剩下的2 000名再按照系统抽样的方法抽取,则每名学生入选的概率相等,且为p =502 019,故选D. 2.(2021·永州模拟)现从已编号(1~50)的50位同学中随机抽取5位以了解他们的数学学习状况,用选取的号码间隔一样的系统抽样方法确定所选取的5位同学的编号可能是( ) A .5,10,15,20,25 B .3,13,23,33,43 C .1,2,3,4,5 D .2,10,18,26,34答案 B解析 抽样间隔为505=10,只有选项B 符合题意.3.(2020·长春一模)完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.宜采用的抽样方法依次是( ) A .①简单随机抽样,②系统抽样 B .①分层抽样,②简单随机抽样 C .①系统抽样,②分层抽样 D .①②都用分层抽样 答案 B4.在一个容量为N 的总体中抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( ) A .p 1=p 2<p 3 B .p 2=p 3<p 1 C .p 1=p 3<p 2 D .p 1=p 2=p 3 答案 D解析 由随机抽样的知识知,三种抽样中,每个个体被抽到的概率都相等,故选D. 5. (2021·襄阳联考)如图是调查某学校高三年级男女学生是否喜欢数学的等高条形图,阴影部分的高表示喜欢数学的频率.已知该年级男、女生各500名(所有学生都参加了调查),现从所有喜欢数学的学生中按分层抽样的方式抽取32人,则抽取的男生人数为( )A .16B .32C .24D .8答案 C解析 由题中等高条形图可知喜欢数学的女生和男生的人数比为1∶3,,所以抽取的男生人数为24.故选C.6.某中学400名教师的年龄分布情况如图,现要从中抽取40名教师作样本,若用分层抽样方法,则40岁以下年龄段应抽取( )A .40人B .200人C .20人D .10人答案 C解析 由图知,40岁以下年龄段的人数为400×50%=200,若采用分层抽样应抽取200×40400=20(人).7.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A .50 B .40 C .25 D .20答案 C解析 由系统抽样的定义知,分段间隔为1 00040=25.8.某工厂在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 构成等差数列,则第二车间生产的产品数为( )A .800双B .1 000双C .1 200双D .1 500双答案 C解析 因为a ,b ,c 成等差数列,所以2b =a +c ,即第二车间抽取的产品数占抽样产品总数的13,根据分层抽样的性质可知,第二车间生产的产品数占12月份生产总数的13,即为1 200双皮靴. 二、填空题9.某单位在岗职工共620人,为了调查工人用于上班途中的时间,决定抽取62名工人进行调查,若采用系统抽样方法将全体工人编号等距分成62段,再用简单随机抽样法得到第1段的起始编号为4,则第40段应抽取的个体编号为________. 答案 394解析 将620人的编号分成62段,每段10个编号,按系统抽样,所抽取工人编号成等差数列,因此第40段的编号为4+(40-1)×10=394.10.假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,将800袋牛奶按000,001,…,799进行编号,若从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是________(下面摘取了随机数表第7行至第9行).答案 068解析 由随机数表知,前4个样本的个体编号分别是331,572,455,068.11.某企业三月中旬生产A ,B ,C 三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A A 产品的样本容量比C 产品的样本容量多10,根据以上信息,可得C 的产品数量是________件. 答案 800解析 设样本容量为x ,则x3 000×1 300=130,∴x =300.∴A 产品和C 产品在样本中共有300-130=170(件). 设C 产品的样本容量为y ,则y +y +10=170,∴y =80. ∴C 产品的数量为3 000300×80=800(件).12.某校高三年级共有30个班,学校心理咨询室为了了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为75,则抽到的最小的编号为________. 答案 3解析 系统抽样的抽取间隔为305=6.设抽到的最小编号为x ,则x +(6+x )+(12+x )+(18+x )+(24+x )=75,所以x =3.B 级 能力提升13.我国古代数学算经十书之一的《九章算术》有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣( ) A .104人 B .108人C .112人D .120人答案 B解析 由题意知,抽样比为 3008 100+7 488+6 912=175,所以北乡遣175×8 100=108(人).14.下列抽取样本的方式属于简单随机抽样的个数为( ) ①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里. ③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛. A .0 B .1 C .2 D .3答案 A解析 ①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样.因为它是有放回抽样;③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样.因为不是等可能抽样.故选A.15.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数减少1人,在采用系统抽样时,需要在总体中先剔除2个个体,则n =________. 答案 18解析 总体容量为6+12+18=36,当样本容量为n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n -1)时,总体容量剔除以后是34人,系统抽样的间隔为34n -1,因为34n -1必须是整数,所以n 只能取18,即样本容量n =18.16.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定:如果在第1组随机抽取的号码为m,那么在第k组(k≥2)中抽取的号码个位数字与m+k的个位数字相同,若m=8,则k的值为________,在第8组中抽取的号码是________.答案876解析由题意知m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.。
随机抽样知识讲解一、统计中的相关概念总体:所考察对象的某一数值指标的全体构成的集合看作总体.个体:构成总体的每一个元素作为个体.样本:从总体中抽出若干个体所组成的集合叫做样本.样本容量:样本中个体的数目叫样本容量.统计的基本思想方法:用样本估计总体,即通常不去直接去研究总体,而是通过从总体中随机抽取一个样本,根据样本的情况去估计总体的相应情况.二、简单随机抽样1.简单随机抽样的概念概念:一般地,从元素个数为N的总体中不放回地抽取容量为n样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.2.简单随机抽样的特点1)被抽取样本的总体的个数有限;2)从总体中逐个地进行抽取,使抽样便于在实践中操作;3)它是不放回抽样,使其具有广泛的应用性;4)它是等可能抽样,每个个体被抽到的可能性都是nN,保证了抽样方法的公平性.3.常用的简单随机抽样方法1)抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一张号签,连续抽取n次,就得到一个容量为n的样本.抽签法的步骤:a.编号,即给总体中的所有个体编号,号码可以从1到N.b.制签,即将1~N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作).c搅拌均匀,即将号签放在一个不透明的容器中,搅拌均匀..d逐个不放回抽取,即从容器中每次抽取一个号签,并记录其编号,连续抽取n次.抽签法的优缺点:.a优点:简单易行..b缺点:当总体的容量非常大时,费时、费力又不方便.况且,如果号签搅拌的不均匀,可能导致抽样的不公平.2)随机数表法:随机数表是由0,1,2,,9L这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同.通过,随机数表,根据实际需要和方便使用的原则,将几个数组合成一组,然后通过随机数表抽取样本.随机数表法的步骤:.a编号,即将总体中的所有个体进行编号(每个号码位数一致);.b在随机数表中任选一个数作为起始号码;.c从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过,若再编号中,则取出,如果得到的号码前面已经取出,也跳过,如此继续下去,直到取满为止;随机数表法的优缺点:.a优点:简单易行,它很好的解决了用抽签法当总体中的个体数较多时制签难的问题..b缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数表法抽取仍不方便.4.简单随机抽样的应用应用:常用的简单随机抽样方法有抽签法和随机数表法.抽签法一般适用于容量较小的总体,易于操作;随机数表法解决了制签比较麻烦的问题,但在利用“随机数表法”进行简单随机抽样时,要严格按照课本中介绍的步骤,否则易出错误.结合具体的问题,我们应灵活使用这两种方法.三、系统抽样1.系统抽样的概念概念:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样.(由于抽样样的间隔相等,因此系统抽样也被称作等距抽样)2.系统抽样的步骤:1)编号,即将总体中的个体编号.为方便起见,也可直接利用个体所带有的号码,如准考证号、门牌号等;2)分段,即为将整个的编号进行分段,要确定分段的间隔k .当N n 是整数时,N k n =;当Nn不是整数时,则可用简单随机抽样的方法从总体中剔除一些个体,使剩下的总体中个体个数'N 能被n 整除,这时'N k n=. 3)确定起始个体编号,即由数字1~k 中随机抽取一个数S .4)按照预先确定的规则抽取样本,即通常是将S 依次加上间隔k 的倍数,这样样本的编号依次是:,,2,,(1).S S k S k S n k +++-L3.系统抽样的公平性当N n 是整数时,N k n =;当Nn不是整数时,则可用简单随机抽样的方法从总体中剔除一些个体,使剩下的总体中个体个数'N 能被n 整除,这时'N k n=,上述过程中,总体的每个个体被剔除的可能性相同,也就是说每个个体不被剔除的可能性相同,所以在整个抽样过程中每个个体抽取的可能性仍然相同.4.系统抽样的特点1)适用于总体容量较大的情况;2)剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系; 3)它是等可能抽抽样,每个个体被抽到的可能性都是nN. 四、分层抽样1.分层抽样的概念概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,我们经常将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这样的抽样方法叫做分层抽样.2.分层抽样的步骤1)分层,即将总体中各个个体按某种特征分成若干个互不重叠的几部分; 2)按比例确定每层抽取个体的个数;3)各层抽样,即各层中采用简单随机抽样或系统抽样抽取相应的个数; 4)汇合成样本.3.分层抽样的特点1)适用于总体由差异明显的几部分组成的情况;2)更充分的反映了总体的情况;3)它是等可能抽样,每个个体被抽到的可能性都是nN .五、三种抽样方式的区别与联系典型例题一.选择题(共5小题)1.(2015•湖北)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石【解答】解:由题意,这批米内夹谷约为1534×≈169石,故选:B.2.(2014•重庆)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100 B.150 C.200 D.250【解答】解:分层抽样的抽取比例为=,总体个数为3500+1500=5000,∴样本容量n=5000×=100.故选:A.3.(2014•广东)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50 B.40 C.25 D.20【解答】解:∵从1000名学生中抽取40个样本,∴样本数据间隔为1000÷40=25.故选:C.4.(2014•湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为P1,P2,P3,则()A.P1=P2<P3B.P2=P3<P1C.P1=P3<P2D.P1=P2=P3【解答】解:根据简单随机抽样、系统抽样和分层抽样的定义可知,无论哪种抽样,每个个体被抽中的概率都是相等的,即P1=P2=P3.故选:D.5.(2013•湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=()A.9 B.10 C.12 D.13【解答】解:∵甲、乙、丙三个车间生产的产品件数分别是120,80,60,∴甲、乙、丙三个车间生产的产品数量的比依次为6:4:3,丙车间生产产品所占的比例,因为样本中丙车间生产产品有3件,占总产品的,所以样本容量n=3÷=13.故选:D.二.填空题(共2小题)6.(2017•江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取18件.【解答】解:产品总数为200+400+300+100=1000件,而抽取60件进行检验,抽样比例为=,则应从丙种型号的产品中抽取300×=18件,故答案为:187.(2012•江苏)某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取15名学生.【解答】解:∵高一、高二、高三年级的学生人数之比为3:3:4,∴高二在总体中所占的比例是=,∵用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,∴要从高二抽取,故答案为:15三.解答题(共3小题)8.从2开始的200个偶数,即2、4、6、8…400中,用系统抽样的办法抽取20个偶数作样本.【解答】解:S1:编号,把2、4、6、8…400这200个偶从002到400按偶数次序编号;S2:分段,计算分间隔为k==10,把编号从小到大依次分成20段,每段10个号;S3:定首号,在第一段002~020的10个号中,用简单随机抽样的方法,抽取一个号码,假设抽中的是008;S4:取余号,依次抽取008,028,048,068,088,108,128,148,168,188,208,228,248,268,288,308,328,348,368,388.9.某校组织高一学生对所在市的居民中拥有电视机、电冰箱、组合音响的情况进行一次抽样调查,调查结果:3户特困户三种全无;有一种的:电视机1090户,电冰箱747户,组合音响850户;有两种的:电视机、组合音响570户,组合音响、电冰箱420户,电视机、电冰箱520户;“三大件”都有的265户.调查组的同学在统计上述数字时,发现没有记下被调查的居民总户数,你能避免重新调查而解决这个问题吗?【解答】解:由题意,抽样调查总数3+265+255+265+72+305+155+125=1445户,∴有两种的有1445﹣3﹣747﹣265=430户,故比例为3:747:430:265,利用分层抽样即可解决.10.某地区工人的平均工资是15元/小时,标准差为4元/小时.若从该地区抽取n=50个工厂,问所取得样本的平均工资的期望和方差各是多少?平均工资的抽样分布是什么?【解答】解:∵某地区工人的平均工资是15元/小时,∴抽取的样本的期望是15.∵标准差为4元/小时,∴抽取样本的方差是16.抽样分布符合二项分布,即X~N(15,16).。
人教版高中数学必修三 第二章 统计2.1《随机抽样》知识梳理知识点一:简单随机抽样1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎨⎧随机数法抽签法 3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.知识点二:系统抽样1.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k ,对编号进行分段.当N n(n 是样本容量)是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l(l ≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本.知识点三:简单随机抽样1.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.人教版高中数学必修三第二章统计2.1《随机抽样》跟踪检测一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是1 5B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .126.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,87.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A. 22,100x s +B. 22100,100x s ++C. 2,x sD. 2100,x s +9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A.①②③B.①②④C.①③④D.①②③④10.下列抽样实验中,最适宜用系统抽样的是()A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B.某厂生产的2 000个电子元件中随机抽取5个入样C.从某厂生产的2 000个电子元件中随机抽取200个入样D.从某厂生产的20个电子元件中随机抽取5个入样11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.16712.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为()A.2个B.3个C.5个D.13个13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,614.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,5315.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,916.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. 18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.人.三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:60人进行更为详细的调查,应当怎样进行抽样?23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?2.1《随机抽样》跟踪检测解答一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况[答案] D2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量[答案] C3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对[答案] C[解析]按照一定的规律进行抽取为系统抽样.4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是15B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此 C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同[答案] A[解析] 无论采用哪种抽样,每个个体被抽到的概率相等.5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .12[答案] A[解析] 运动员共计98人,抽取比例为2898=27,因此男运动员56人中抽取16人.6.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,8[答案] C[解析] 由题意得x =15,16.8=51(9+15+10+y +18+24) y =8,选C. 7.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. 22,100x s + B. 22100,100x s ++ C. 2,x s D. 2100,x s +[答案] D[解析] 设增加工资后10位员工下月工资均值为'x ,方差为2's , 则平均数()()()12101'10010010010x x x x =++++⋅⋅⋅++⎡⎤⎣⎦ ()1210110010010x x x x =++++=+; ()()()222212101'100'100'100'10s x x x x x x ⎡⎤=+-++-+⋅⋅⋅++-⎣⎦ ()()()22221210110x x x x x x s ⎡⎤=-+-+⋅⋅⋅+-=⎣⎦.故选D . 9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A .①②③B .①②④C .①③④D .①②③④[答案] D10.下列抽样实验中,最适宜用系统抽样的是( )A .某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B .某厂生产的2 000个电子元件中随机抽取5个入样C .从某厂生产的2 000个电子元件中随机抽取200个入样D .从某厂生产的20个电子元件中随机抽取5个入样[答案] C[解析] A 中总体有明显层次,不适用系统抽样法;B 中样本容量很小,适宜用简单随机抽样法中的随机数法;D 中总体数很小,故适宜用抽签法,只有C 比较适用系统抽样法.11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93B.123C.137D.167[答案] C[解析] 由图可知该校女教师的人数为()11070%150160%7760137⨯+⨯-=+= 故选C12.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为( )A .2个B .3个C .5个D .13个[答案] A[考点]分层抽样方法[分析]由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x ,即可得出结论.解:由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x , ∴x=2,故选A .[点评]本题考查分层抽样,抽样过程中每个个体被抽到的可能性相同,这是解决抽样问题的依据,样本容量、总体个数、每个个体被抽到的概率,这三者可以做到知二求一.13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6[答案] D[解析]由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×4 20=8,40×820=16,40×520=10,40×320=6.14.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,53[答案] A[解析]样本中共有30个数据,中位数为4547462+=;显然样本中数据出现次数最多的为45,故众数为45;极差为68-12=56,故选A.15.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,9[答案] B[解析]各年龄段所选分别为20100×45=9,20100×25=5,20100×30=6.16.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36[答案] B[解析]设该单位老年职工有x人,从中抽取y人.则160+3x=430⇒x=90,即老年职工有90人,则90160=y32⇒y=18.故选B.二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. [答案]30[解析]由题意,知22+3+5×n=6,∴n=30.18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.[答案]760[解析]设该校女生人数为x,则男生人数为(1 600-x).由已知,2001 600×(1 600-x)-2001 600·x=10,解得x=760.故该校的女生人数是760人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.[答案] 5.7%[解析]∵990∶99 000=1∶100,∴普通家庭中拥有3套或3套以上住房的大约为50×100=5 000(户).又∵100∶1 000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).∴3套或3套以上住房的家庭约有5 000+700=5 700(户).故5 700100 000=5.7%.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.[答案]3720[解析]由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为40200×100=20(人).21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.生活能否自理人数性别男女能178 278不能23 21人.[答案]60[解析]由表知500人中生活不能自理的男性比女性多2人,所以该地区15 000位老人生活不能自理的男性比女性多2×15 000500=60(人).三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 07260人进行更为详细的调查,应当怎样进行抽样?解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000,应取60×2 43512 000≈12(人);“喜爱”占4 56712 000,应取60×4 56712 000≈23(人);“一般”占3 92612 000,应取60×3 92612 000≈20(人);“不喜爱”占1 07212 000,应取60×1 07212 000≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?解:(1)将624名职工用随机方式编号由000至623.(2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619.(4)分段,取间隔k=62062=10,将总体分成62组,每组含10人.(5)从第一段,即为000到009号随机抽取一个号l.(6)按编号将l,10+l,20+l,…,610+l,共62个号码选出,这62个号码所对应的职工组成样本.24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?解:学生A的方法得到的样本不能够反映不上网的居民情况,是一种方便样本,所得的结果代表性差,不能很准确地获得平均每户居民的月用水量;学生B 的方法实际上是普查,花费的人力物力要多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;在小区的每户居民都装有电话的情况下,学生C的方法是一种随机抽样方法,所得的样本具有代表性,可以比较准确地获得平均每户居民的月用水量.在小区的每户居民都装有电话的情况下,建议用随机抽样的方法获取数据,即用学生C的方法,以节省人力物力,并且可以得到比较精确的结果.5、已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为( )A. 0.4.3ˆ2yx =+ B. 2 2.4ˆy x =- C. 9ˆ2.5yx =-+ D. 0.3 4.4ˆy x =-+ [答案] A[解析] 变量x 与y 正相关,可以排除C,D;样本平均数代入可求这组样本数据的回归直线方程.∵变量x 与y 正相关,∴可以排除C,D;样本平均数3x =, 3.5y =,代入A 符合,B 不符合,故选A.。
课 题 简单随机抽样,系统抽样,分层抽样 教学目标1.正确理解三种抽样方法的一般步骤和方法2.正确理解三中抽样方法间的区别和联系;重点、难点三种抽样方法概念的理解 2能够灵活应用三种抽样的方法解决统计问题。
考点及考试要求综合题考点一、简单随机抽样的概念一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
【说明】简单随机抽样必须具备下列特点:(1)简单随机抽样要求被抽取的样本的总体个数N 是有限的。
(2)简单随机样本数n 小于等于样本总体的个数N 。
(3)简单随机样本是从总体中逐个抽取的。
(4)简单随机抽样是一种不放回的抽样。
(5)简单随机抽样的每个个体入样的可能性均为Nn 。
思考:下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本。
(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。
抽签法和随机数表法 1、抽签法的定义。
抽签法就是把总体中的N 个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到一个容量为n 的样本。
【说明】抽签法的一般步骤:(1)将总体的个体编号。
(2)连续抽签获取样本号码。
思考:你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?2、随机数表法的定义:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法。
【说明】随机数表法的步骤: (1)将总体的个体编号。
(2)在随机数表中选择开始数字。
(3)读数获取样本号码。
【例题精析】例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?[分析] 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。
第九章统计9.1随机抽样9.1.1简单随机抽样课后篇巩固提升必备知识基础练1.为抽查汽车排放尾气的合格率,某环保局在一路口随机抽查,这种抽查是()A.放回简单随机抽样B.抽签法C.随机数法D.以上都不对(包括总体个数),因此不属于简单随机抽样.2.高三某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列和第7列数字开始,由左向右依次选取两个数字,则选出来的第4个志愿者的座号为()495443548217379323788735209643842634916457245506887704744767217633502583921206A.23B.09C.16D.02,依次抽取的样本数据为:21,32,09,16,17,所以第4个数据是16.3.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()78166572080263140702436997280198 32049234493582003623486969387481A.08B.07C.02D.01,选出的5个个体的编号为:08,02,14,07,01,故第5个个体的编号是01.4.某总体容量为M ,其中带有标记的有N 个,现用简单随机抽样的方法从中抽取一个容量为m 的样本,则抽取的m 个个体中带有标记的个数估计为( )A.mN MB.mM NC.MN mD.N总体中带有标记的比例是N M ,则抽取的m 个个体中带有标记的个数估计为mN M .5.“XX 彩票”的中奖号码是从分别标有01,02,…,30的30个小球中逐个不放回地选出7个小球来按规则确定中奖情况,这种从30个号码中选7个号码的抽样方法是 .个小球相当于号签,搅拌均匀后逐个不放回地抽取,这是典型的抽签法.6.用随机数法从100名学生(男生25人)中抽选20人进行评教,某男学生被抽到的可能性是 ,某女学生被抽到的可能性是 ..2 0.220,总体数量为100,所以总体中每个个体被抽到的可能性都为20100=0.2.7.已知数据x 1,x 2,…,x n 的平均数为x =4,则数据3x 1+7,3x 2+7,…,3x n +7的平均数为 .数据x 1,x 2,…,x n 的平均数为x =4,即数据(x 1+x 2+…+x n )=4n ,则数据3x 1+7,3x 2+7,…,3x n +7的平均数3(x 1+x 2+…+x n )+7nn =3×4n+7n n=19. 8.学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目,某班有男生32名,女生28名,试用抽签法确定该班参加合唱节目的同学.,将32名男生从00到31进行编号.第二步,用相同的纸条制成32个号签,在每个号签上写上这些编号.第三步,将写好的号签放在一个不透明的容器内摇匀,不放回地从中逐个抽出10个号签.第四步,相应编号的男生参加合唱.第五步,用相同的办法从28名女生中选出8名,则此8名女生参加合唱.关键能力提升练9.(2021江西南昌二模)从编号依次为01,02,…,20的20人中选取5人,现从随机数表的第一行第3列和第4列数字开始,由左向右依次选取两个数字,则第五个编号为( ) 5308 3395 5502 6215 2702 4369 3218 1826 099478465887 3522 2468 3748 1685 9527 1413 8727 14955656A.09B.02C.15D.183列和第4列数字开始,依次读取:08,33(舍),95(舍),55(舍),02,62(舍),15,27(舍),02(舍),43(舍),69(舍),32(舍),18,18(舍),26(舍),09,则第五个编号为09.故选A.10.用放回简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()A.110,110B.310,15C.1 5,310D.310,310,个体a每次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为110.故选A.11.从一群游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏.过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为()A.knmB.k+m-nC.kmnD.不能估计x人,则kx =nm,解得x=kmn.12.(多选题)下列调查中,适宜采用抽样调查的是()A.调查某市中小学生每天的运动时间B.某幼儿园中有位小朋友得了手足口病,对此幼儿园中的小朋友进行检查C.农业科技人员调查今年麦穗的单穗平均质量D.调查某快餐店中8位店员的生活质量情况B中要对所有小朋友进行检查,所以用普查的方式;D中共8名店员,可采用普查的方式;A,C 中总体容量大,难以做到普查,故采用抽样调查的方式.13.(多选题)下列抽样方法是简单随机抽样的是()A.从50个零件中随机抽取5个做质量检验B.从50个零件中每次抽取一个有放回地共抽取5次做质量检验C.从整数集中随机抽取10个分析奇偶性D.运动员从8个跑道中随机选取一个跑道不是,因为整数集是无限集.14.(多选题)下列抽取样本的方式,不是简单随机抽样的是()A.从无限多个个体中抽取100个个体作为样本B.盒子里共有80个零件,从中逐个不放回地选出5个零件进行质量检验C.从80件玩具中一次性随机抽取3件进行质量检验D.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛不是简单随机抽样,原因是简单随机抽样中总体的个数是有限的,而题中是无限的;B,C是简单随机抽样;D不是简单随机抽样,原因是指定个子最高的5名同学是56名同学中特指的,不存在随机性,不是等可能抽样.15.假设要抽查某种品牌的900颗种子的发芽率,抽取60粒进行实验.利用随机数法抽取种子时,先将900颗种子按001,002,…,900进行编号,如果从随机数表第8行第7列的数字7开始向右读,请你依次写出最先检测的3颗种子的编号.(下面摘取了随机数表第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 00 13 4299 66 02 79 548行第7列的数字7开始向右读,第一个符合条件的是785,916要舍去,955要舍去,第二个符合条件是567,第三个符合条件是199,故最先检测的3颗种子的编号为785,567,199.16.某工厂抽取50个机械零件检验其直径大小,得到如下数据:估计这个工厂生产的零件的平均直径大约为..84 cm y=12×12+13×34+14×4=12.84(cm).50学科素养创新练17.选择合适的抽样方法抽样,并写出抽样过程.(1)现有一批电子元件600个,从中抽取6个进行质量检测;(2)现有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样.总体中个体数较大,用随机数法.第一步,给元件编号为001,002,003,...,099,100, (600)第二步,用随机数工具产生1~600范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的电子元件进入样本;第三步,依次操作,如果生成的随机数有重复,则剔除并重新产生随机数,直到样本量达到6;第四步,以上这6个号码对应的元件就是要抽取的对象.(2)总体中个体数较小,用抽签法.第一步,将30个篮球,编号为01,02, (30)第二步,将以上30个编号分别写在外观、质地等无差别的小纸条上,制成号签; 第三步,把号签放入一个不透明的盒子中,充分搅拌;第四步,从盒子中不放回地逐个抽取3个号签,并记录上面的号码;第五步,找出和所得号码对应的篮球.。
统计1:简单随机抽样(1)总体和样本①在统计学中, 把研究对象的全体叫做总体.②把每个研究对象叫做个体.③把总体中个体的总数叫做总体容量.④为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.(2)简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
(3)简单随机抽样常用的方法:①抽签法②随机数表法③计算机模拟法③使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
(4)抽签法:①给调查对象群体中的每一个对象编号;②准备抽签的工具,实施抽签;③对样本中的每一个个体进行测量或调查(5)随机数表法:2:系统抽样(1)系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
(2)系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实施也比较简单。
更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。
3:分层抽样(1)分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。