分层抽样(计算详解)
- 格式:docx
- 大小:37.28 KB
- 文档页数:2
【抽样调查】分层随机抽样第2部分:分层随机抽样⽬录概述分层随机抽样的思路:当N ,n 都较⼤,总体单元之间的差异也较⼤时,简单随机抽样会出现⾼成本、低精度情形,解决⽅法是将总体划分为若⼲个⼦总体、减少总体单元之间的差异。
假设在各个⼦总体内已经满⾜实施简单随机抽样的条件,则可以在各个⼦总体内独⽴地进⾏简单随机抽样,再将各个⼦总体参数的估计值进⾏加权,得到总体参数的估计。
分层抽样的概念:层:如果⼀个包含N 个单位的总体可以分成不重不漏的L 个⼦总体,即每个单元必定属于且仅属于⼀个⼦总体,则这样的⼦总体称为层。
有N 1+⋯+N L =N 。
分层抽样:在每⼀层中独⽴进⾏抽样,总的样本由各层样本组成,总体参数⼜按照各层样本参数的汇总作出估计。
有n 1+⋯+n L =n 。
分层随机抽样:每层的样本,都独⽴地按照简单随机抽样进⾏,这样的分层抽样称为分层随机抽样。
符号规定:h :层。
从⽽N h 代表第h 层的单位总数,n h 代表第h 层的样本数。
i :层内单位号。
从⽽Y hi 代表第h 层第i 个总体单元,y hi 代表第h 层第i 个样本单元。
W h :层权,即W h =N h N 。
f h :层内抽样⽐,即f h =n hN h 。
¯Yh,Y h,S 2h:层内总体参数(均值、总值与⽅差)。
¯y h ,y h ,s 2h:层内样本参数(样本均值、样本总值与样本⽅差)。
简单估计量分层抽样⾸先根据各层的样本,计算出各层均值¯Y h的适当估计值ˆ¯Y h ,然后再使⽤总体层权加权平均,得到总体均值¯Y 的估计,即ˆ¯Y st =L∑h =1W h ˆ¯Y h =1N L∑h =1N h ^¯Y h .对于分层随机抽样,每⼀层的ˆ¯Y h就是h 层的样本均值¯y h ,即ˆ¯Y st =L∑h =1W h ¯y h =1N L∑h =1N h ¯y h .注意这⾥的线性形式。
实验题目:1、某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。
调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并进行了调查每户最近一个月购买彩票花费的金额(元),下表为每个新村及调查的情况:请估计该小区居民户购买彩票的平均支出,并给出估计的标准差。
给出95%的置信区间,并与简单随机抽样进行精度比较。
2、随着经济发展,某市居民正在悄悄改变过年的习惯,虽然大多数居民除夕夜在家吃年夜饭、看电视节目,但是有些家庭到饭店吃年夜饭,或逛夜市,或用过年的假期到外地旅游。
为研究这种现象,某研究机构以市中心165万居民户作为研究对象,将居民户按6个行政区分层,每个行政区随机抽取了30户居民户进行了调查(各层抽样比可以忽略),每个行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表:试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。
9.030273011===a p933.030283022===a p9.030273033===a p 867.030263044===a p933.030283055===a p 967.030293066===a p867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑pw p hHhst923.0967.0*22.0933.0*16.0≈++06.0*933.0*301*1.0*9.0*301*)1(1)(ˆ21.018.0222+=--=∑p p nf w p hhhhhhstV067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*16.009.014.0222+++838.322.042033.0*967.0*301*-=+P:[)(ˆ96.1p pststV±]=[0.923±1.96*838.34-]=[0.866,0.979]。
分层抽样的案例(文档3篇)以下是网友分享的关于分层抽样的案例的资料3篇,希望对您有所帮助,就爱阅读感谢您的支持。
第一篇某市有300所小学,共有240000名学生,这些小学分布在全市5个行政区中,其中重点小学有30所,一般小学有240所,较差的小学有30所。
现在要从全市小学生中抽取1200名学生进行调查,以了解全市小学生的学习情况。
请设计一份抽样方案。
答:分层抽样方案:1、因为有300所小学,240000名学生,假设每所小学的学生人数相同,所以每所小学有学生人数800名。
2、又因为有重点小学30所,一般小学240所,较差小学30所,所以重点小学有学生人数24000名,一般小学有学生人数192000名,较差小学有学生人数24000名。
3、因为要从240000名学生中抽取1200名学生进行调查,所以1200:240000=1:200,即每200名学生中抽取1名学生进行调查,所以由第2步得出24000×1/200=120名;192000×1/200=960名;24000×1/200=120名,然后按照简单随机抽样的方法分别抽取相应的人数。
4、综上所述,要从240000名学生中抽取1200名学生进行调查,应当从30所重点小学中抽取120名学生,从240所一般小学中抽取960名学生,从30所较差小学中抽取120名学生,共计1200名学生。
第二篇作者:金勇进石可统计研究2000年02期一、问题的提出分层抽样中样本量在各层中如何分配,这是抽样设计中的一个重要问题。
计算各层的样本量需要一些辅助信息,如各层中目标变量的方差。
在抽样调查的实践中,特别是一次性的抽样调查中,上述所需的辅助信息常常不具备,因此,我们面临着在信息量最小的条件下如何在各层中分配样本量的问题。
本文产生于作者在美国NORC(National Opinion Research Center)进行研究期间所做的调查设计中的一个实例,这里对其进行了归纳,,加工,提炼与析,希望能够就极小信息量条件下如何在分层抽样中进行样本量的分配这一问题提供一种思考的途径。
分层抽样————————————————————————————————作者: ————————————————————————————————日期:ﻩ分层抽样抽样技术作为现代统计学科体系的重要组成部分,被广泛运用到社会实践当中。
自从1895年挪威首任中央统计局局长凯尔在伯尔尼第五届国际统计学会会议上提出所谓“代表性调查”的抽样方法以来,经过100多年的理论探讨和时间积累,抽样理论更加科学,抽样技术日臻完善。
抽样又称取样。
其原理是从研究的全部样品中抽取一部分样品单位。
从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。
基本的抽样技术包括简单随机抽样,系统抽样,分层抽样,多阶段抽样等。
在实际的抽样调查中我们常常会根据调查成本,调查规模等结合运用各种抽样方法进行实践。
分层抽样是通过对总体单位进行分类,即分成若干子总体,子总体之间比较相似,使每一个字总体的方差变小,这样只需要在子总体中抽取少量样本单位,就能很好地代表子总体的特征,从而提高对整个总体估计的精度。
分层抽样需要事先知道各层权重,但在现实情况下有些资料无法提前预知。
这时我们可以先从总体中抽取一个大的初始样本,从而获得有关的辅助信息,然后再从初始样本中抽取一个字样本,这种方法就是双重抽样。
其定义为,当简单性状与复杂性状存在关系时可用抽取简单性状来间接估计复杂性状的抽样方法。
结合分层抽样的双重抽样方法即为分层的双重抽样。
分层抽样,的主要特点就是可以提高估计精度,它不但能对总体进行估计。
同时可以对各层子总体进行估计。
如此便于实际中抽样的组织和实施。
下面我们就分层抽样方法展开讨论,运用实例分析进行比较。
一、分层抽样的原理简介在抽样之前,先将总体N 个单位划分成L个互不重复的子总体,每个子总体成为层,他们的大小分别为L N N N N ...,,,321,这L 层构成整个总体(1lh N Nh ==∑)。
2.1.3分层抽样考点学习目标核心素养分层抽样的概念理解分层抽样的概念数学抽象分层抽样的使用条件和操作步骤掌握分层抽样的使用条件和操作步骤,会用分层抽样法进行抽样逻辑推理、数学运算问题导学(1)什么叫分层抽样?(2)分层抽样适用于什么情况?(3)分层抽样时,每个个体被抽到的机会是相等的吗?1.分层抽样的概念一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的特点(1)适用于总体由差异明显的几部分组成的情况.(2)更充分地反映了总体的情况,使样本具有较强的代表性.(3)等可能抽样,每个个体被抽到的可能性都是n N.3.分层抽样中分层原则(1)层内样本的差异要小,各层之间样本的差异要大.(2)分层后总体中的每个个体互不重叠,也不遗漏.4.抽样比(1)分层抽样也称“按比例抽样”,这里的“按比例”是指:①样本中第n层的个体数总体中第n层的个体数=样本容量总体容量;②总体中第m层的个体数总体中第n层的个体数=样本中第m层的个体数样本中第n层的个体数.(2)分层抽样中,每个个体被抽到的可能性是相等的,与层数、分层情况无关.■名师点拨如果总体的个数为N,样本容量为n,N i为第i层的个体数,则第i层抽取的个体数n i=n ·N i N ,每个个体被抽到的可能性是n i N i =1N i ·n ·N i N =n N.判断正误(对的打“√”,错的打“×”)(1)系统抽样时,将总体分成均等的几部分,每部分抽取一个,符合分层抽样,故系统抽样就是一种特殊的分层抽样.( )(2)在分层抽样时,每层可以不等可能抽样.( )(3)在分层抽样的过程中,每个个体被抽到的可能性是相同的,与层数及分层有关.( ) 解析:(1)因为分层抽样是从各层独立地抽取个体,而系统抽样各段上抽取时是按事先定好的规则进行的,各层编号有联系,不是独立的,故系统抽样不同于分层抽样.(2)分层抽样时,每层仍然要等可能抽样. (3)与层数及分层无关. 答案:(1)× (2)× (3)×(2020·江西省临川第一中学期末考试)为创建文明城市,共建美好家园,某市教育局拟从3 000名小学生,2 500名初中生和1 500名高中生中抽取700人参与“城市文明知识”问卷调查活动,应采用的最佳抽样方法是( )A .简单随机抽样法B .分层抽样法C .系统抽样法D .简单随机抽样法或系统抽样法解析:选B.根据题意,所有学生明显分成互不交叉的三层,即小学生,初中生,高中生,故采用分层抽样法.故选B.分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等可能抽样,必须进行( )A .每层等可能抽样B .每层可以不等可能抽样C .所有层按同一抽样比等可能抽样D .所有层抽取个体数量相同解析:选C.保证每个个体等可能的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等可能抽样.一个班共有54人,其中男同学、女同学之比为5∶4,若抽取9人参加教改调查会,则每个男同学被抽取的可能性为________,每个女同学被抽取的可能性为________.解析:男、女每人被抽取的可能性是相同的,因为男同学共有54×59=30(人),女同学共有54×49=24(人),所以每个男同学被抽取的可能性为530=16,每个女同学被抽取的可能性为424=16.答案:16 16分层抽样的判断某社区有500户家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户.为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本,记作①;某学校高一年级有18名女排运动员,要从中选出4人调查学习负担情况,记作②.那么完成上述两项调查应采用的抽样方法是( )A .①用简单随机抽样法,②用系统抽样法B .①用分层抽样法,②用简单随机抽样法C .①用系统抽样法,②用分层抽样法D .①用分层抽样法,②用系统抽样法【解析】 ①因家庭收入不同其社会购买力也不同,宜用分层抽样的方法.②因总体个数较小,宜用简单随机抽样法.【答案】 B判断一个抽样方法是不是分层抽样的条件(1)看它是否具有分层抽样的特点,如总体中个体差异是否明显.(2)是否按照相同比例从各层中抽取.至于各层内用什么方法抽样是灵活的,可采用简单随机抽样,也可采用系统抽样.(3)在分层抽样中,无论哪一层的个体,被抽中的机会都是相等的,体现了抽样的公平性.(2018·高考全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异,为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.解析:因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.答案:分层抽样分层抽样中的有关计算(1)某单位共有老、中、青年职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为________.(2)某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:高一年级高二年级高三年级泥塑 a b c 剪纸xyz其中x ∶y ∶z =5∶3∶2,且“泥塑”社团的人数占两个社团总人数的35,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取________人.【解析】 (1)设该单位老年职工人数为x ,由题意得3x =430-160,解得x =90.则样本中的老年职工人数为90×32160=18.(2)法一:因为“泥塑”社团的人数占总人数的35,故“剪纸”社团的人数占总人数的25,所以“剪纸”社团的人数为800×25=320;因为“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310,所以“剪纸”社团中高二年级人数为320×310=96.由题意知,抽样比为50800=116,所以从高二年级“剪纸”社团中抽取的人数为96×116=6.法二:因为“泥塑”社团的人数占总人数的35,故“剪纸”社团的人数占总人数的25,所以抽取的50人的样本中,“剪纸”社团中的人数为50×25=20.又“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310,所以从高二年级“剪纸”社团中抽取的人数为20×310=6.【答案】 (1)18 (2)6分层抽样中有关计算的方法(1)抽样比=样本容量n 总体容量N =该层抽取的个体数该层的个体数.(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解.1.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为8,16,24.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为( )A .3B .4C .5D .6解析:选 B.根据分层抽样的特点可知,抽样比例为1248=14,则应抽取的中型城市数为16×14=4.2.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,则应抽取超过45岁的职工为________人.解析:抽样比为25∶200=1∶8,而超过45岁的职工有80人,则从中应抽取的个体数为80×18=10.答案:10分层抽样的设计与应用一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?【解】 用分层抽样来抽取样本,步骤如下:(1)分层,按年龄将500名职工分成三层:不到35岁的职工;35至49岁的职工;50岁及50岁以上的职工.(2)确定每层抽取个体的个数.抽样比为100500=15,则在不到35岁的职工中抽取125×15=25(人);在35岁至49岁的职工中抽取280×15=56(人);在50岁及50岁以上的职工中抽出95×15=19(人).(3)在各层分别按系统抽样或随机数法抽取样本. (4)汇总每层抽样,组成样本.分层抽样的操作步骤第一步,计算样本容量与总体的个体数之比.第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数. 第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体. 第四步,将各层抽取的个体合在一起,就得到所取样本.在100个产品中,有一等品20个,二等品30个,三等品50个,现要抽取一个容量为30的样本,请说明抽样过程.解:先将产品按等级分成三层:第一层,一等品20个;第二层,二等品30个;第三层,三等品50个.然后确定每一层抽取的个体数,因为20∶30∶50=2∶3∶5,所以应在第一层中抽取产品6个,在第二层中抽取产品9个,在第三层中抽取产品15个.再分别给这些产品编号并贴上标签,用抽签法或随机数表法在各层中抽取,取到一等品6个,二等品9个,三等品15个,这样就通过分层抽样得到了一个容量为30的样本.三种抽样方法的选择及应用为了考察某学校的教学水平,将抽取这个学校高三年级的部分学生本学年的考试成绩进行统计分析,为了全面反映实际情况,采取以下三种方式进行抽查(已知该学校高三年级共有20个教学班,并且每个班内的学生按随机方式编好了学号,假定该校每班学生人数都相同):①从全年级20个班中任意抽取一个班,再从该班任意抽取20人,考察他们的学习成绩;②每个班都抽取1人,共计20人,考察这20个学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从中共抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种抽样方法?【解】(1)三种抽取方式中,其总体都是高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.第一种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第三种抽取方式中,样本为所抽取的100名学生本学年的考试成绩,样本容量为100.(2)三种抽取方式中,第一种方式采用的是简单随机抽样法;第二种方式采用的是系统抽样法和简单随机抽样法;第三种方式采用的是分层抽样法和简单随机抽样法.选择抽样方法的思路(1)判断总体是否由差异明显的几部分组成,若是,则选用分层抽样;否则,考虑用简单随机抽样或系统抽样.(2)判断总体容量和样本容量的大小.当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法;当总体容量较大、样本容量也较大时,采用系统抽样.某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各岗位中的人数情况如下表所示:管理技术开发营销生产合计老年40404080200 中年80120160240600 青年40160280720 1 200 合计160320480 1 040 2 000(2)若要开一个有25人参与的讨论单位发展与薪金调整方案的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对某运动会筹备情况的了解程度,则应怎样抽样?解:(1)用分层抽样法,并按老年职工4人,中年职工12人,青年职工24人抽取.(2)用分层抽样法,并按管理岗位2人,技术开发岗位4人,营销岗位6人,生产岗位13人抽取.(3)用系统抽样法,对全部2 000人随机编号,号码为0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,所得到的号码对应的20人即为要抽取的人.1.(2020·贵州省铜仁市第一中学期末考试)某高校有男学生3 000名,女学生7 000名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取男学生300名,女学生700名进行调查,则这种抽样方法是()A.抽签法B.随机数法C.系统抽样法D.分层抽样法解析:选D.总体由男生和女生组成,比例为3 000∶7 000=3∶7,所抽取的比例也是3∶7,这种抽样方法是分层抽样法.故选D.2.(2020·广西钦州市期末考试)某中学共有1 000名学生,其中高一年级350人,该校为了了解本校学生视力情况,用分层抽样的方法从该校学生中抽出一个容量为100的样本进行调查,则应从高一年级抽取的人数为()A.20 B.25C.30 D.35解析:选D.高一年级抽取的人数为3501 000×100=35.故选D.3.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人进行某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,3,…,270;使用系统抽样时,将学生统一随机编号为1,2,3,…,270,并将整个编号平均分为10段.如果抽得的号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④36,62,88,114,140,166,192,218,244,270. 关于上述样本的下列结论中,正确的是( ) A .②③都不能为系统抽样 B .②④都不能为分层抽样 C .①④都可能为系统抽样 D .①③都可能为分层抽样解析:选D.系统抽样又名“等距抽样”,做到等距的有①③④,但只做到等距还不一定是系统抽样,还应做到10段中每段要抽1个,检查这一点只需看第一个元素是否在1~27 范围内,结果发现④不符合,同时,若为系统抽样,则分段间隔k =27010=27,④也不符合这一要求,所以可能是系统抽样的为①③,因此排除A ,C ;若采用分层抽样,一、二、三年级的人数比例为4∶3∶3,由于共抽取10人,所以三个年级应分别抽取4人、3人、3人,即在1~108范围内要有4个编号,在109~189和190~270范围内要分别有3个编号,符合此要求的有①②③,即它们都可能为分层抽样(其中①③在每一层内采用了系统抽样,②在每一层内采用了简单随机抽样),所以排除B.4.某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.解析:设应抽取的男生人数为x ,则x 900-400=45900,解得x =25.答案:25[A 基础达标]1.为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样解析:选C.我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理,故选C.2.(2020·黑龙江省哈尔滨市第六中学期末考试)某校共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,用分层抽样抽取一个容量为20的样本,则应抽取的后勤人员人数是() A.3 B.2C.15 D.4解析:选A.因为160人抽取20人,所以抽取的比例为20160=18,因为后勤人数为24,所以应抽取24×18=3.故选A.3.(2020·河北省枣强中学期末考试)某中学高二年级共有学生2 400人,为了解他们的身体状况,用分层抽样的方法从中抽取一个容量为80的样本,若样本中共有男生42人,则该校高二年级共有女生()A.1 260 B.1 230C.1 200 D.1 140解析:选D.设女生总人数为x人,由分层抽样的方法,可得抽取女生人数为80-42=38(人),所以802 400=38x,解得x=1 140.故选D.4.(2020·河北省石家庄市期末考试)某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中取一个容量为36的样本,则老年人、中年人、青年人依次抽取的人数是()A.7,11,19 B.7,12,17C.6,13,17 D.6,12,18解析:选D.由题意,老年人27人,中年人54人,青年人81人的比例为1∶2∶3,所以抽取人数:老年人:16×36=6,中年人:26×36=12,青年人:36×36=18.故选D.5.某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为() A.100 B.150C.200 D.250解析:选A.抽样比为703 500=150,该校总人数为1 500+3 500=5 000,则n5 000=150,故n=100.6.(2020·四川省遂宁市期末考试)已知某地区中小学生人数如图所示,用分层抽样的方法抽取200名学生进行调查,则抽取的高中生人数为________.解析:某地区中小学生人数如图所示,用分层抽样的方法抽取200名学生进行调查,则抽取的高中生人数为200×2 0003 500+2 000+4 500=40.答案:407.某校对全校共1 800名学生进行健康调查,选用分层抽样法抽取一个容量为200的样本,已知女生比男生少抽了20人,则该校的女生人数应是________.解析:设抽取的女生人数为x,则x+(x+20)=200,解得x=90,则抽取的女生人数为90,抽取的男生人数为200-90=110,据此可知该校的女生人数应是1 800×90200=810.答案:8108.(2020·湖南省张家界市期末联考)我国古代数学算经十书之一的《九章算术》中有一“衰分”问题“今有北乡八千七百五十人,西乡七千二百五十人,南乡八千三百五十人,凡三乡,发役四百八十七人,则西乡遣____________人”.解析:今有北乡八千七百五十人,西乡七千二百五十人,南乡八千三百五十人,凡三乡,发役四百八十七人,则西乡遣487×7 2508 750+7 250+8 350=145(人).答案:1459.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作为样本,用系统抽样法将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).(1)若第5组抽出的号码为22,则第8组抽出的号码应是多少? (2)若用分层抽样法,则应从40岁以下年龄段的职工中抽取多少名?解:(1)由分组可知,分段的间隔为5.又第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.(2)由题意知,40岁以下年龄段的职工人数为200×50%=100.若用分层抽样法,则应从40岁以下年龄段的职工中抽取40200×100=20(名).10.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例; (2)游泳组中,青年人、中年人、老年人分别应抽取的人数.解:(1)设登山组人数为x ,游泳组中,青年人、中年人、老年人所占比例分别为a 、b 、c ,则有x ×40%+3xb 4x =47.5%,x ×10%+3xc4x =10%,解得b =50%,c =10%,故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人所占比例分别为40%、50%、10%.(2)游泳组中,抽取的青年人人数为200×34×40%=60(人);抽取的中年人人数为200×34×50%=75(人);抽取的老年人人数为200×34×10%=15(人).即游泳组中,青年人、中年人、老年人分别应抽取的人数为60人,75人,15人.[B能力提升]11.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4 B.5C.6 D.7解析:选C.四类食品的种数比为4∶1∶3∶2,则抽取的植物油类的种数为20×110=2,抽取的果蔬类的种数为20×210=4,二者之和为6种,故选C.12.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.解析:由分层抽样中各层的抽样比相同.样本中甲设备生产的有50件,则乙设备生产的有30件,所以在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品总数为4 800×35+3=1 800(件).答案:1 80013.某单位有工程师6人、技术员12人、技工18人.要从这些人中抽取一个容量为n 的样本,如果采用系统抽样和分层抽样的方法抽取,那么不用剔除个体;如果样本容量增加一个,那么在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n.解:依题意,知总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为36n ,分层抽样的抽样比是n36,抽取工程师的人数为n 36×6=n 6,技术员的人数为n 36×12=n 3,技工的人数为n 36×18=n2,所以n 应是36的约数且是6的倍数,即n =6,12,18. 当样本容量为n +1时,系统抽样的间隔为35n +1.因为35n +1必须为整数,所以n 只能取6,即样本容量n =6.14.(选做题)为了对某课题进行讨论研究,用分层抽样的方法从三所高校A ,B ,C 的相关人员中,抽取若干人组成研究小组,有关数据见下表(单位:人).(2)若从高校B 相关人员中选2人作专题发言,应采用什么抽样法,请写出合理的抽样过程.解:(1)分层抽样是按各层相关人数和抽取人数的比例进行的,所以有x 54=13⇒x =18,3654=y3⇒y =2.故x =18,y =2. (2)总体容量和样本容量较小,所以应采用抽签法,过程如下: 第一步,将36人随机编号,号码为1,2,3,…,36; 第二步,将号码分别写在相同的纸片上,揉成团,制成号签;第三步,将号签放入一个不透明的容器中,充分搅匀,依次不放回地抽取2个号码,并记录上面的编号;第四步,把与号码相对应的人抽出,即可得到所要的样本.。
分层抽样的计算公式
p=Cm(t0-t)。
分层抽样样本量的计算公式:p=Cm(t0-t)。
分层抽样法也叫类型抽样法。
它是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法。
1、首先,辩明突出的(重要的)人口统计特征和分类特征,这些特征与所研究的行为相关。
例如,研究某种产品的消费率时,按常理认为男性和女性有不同的平均消费比率。
2、为了把性别作为有意义的分层标志,调查者肯定能够拿出资料证明男性与女性的消费水平明显不同。
用这种方式可识别出各种不同的显著特征。
调查表明,一般来说,识别出6个重要的显著特征后,再增加显著特征的辨别对于提高样本代表性就没有多大帮助了。
3、确定在每个层次上总体的比例(如性别已被确定为一个显著的特征,那么总体中男性占多少比例,女性占多少比例呢?)。
利用这个比例,可计算出样本中每组(层)应调查的人数。
最后,调查者必须从每层中抽取独立简单随机样本。
2.1.3分层抽样学习目标(1)正确理解分层抽样的概念; (2)掌握分层抽样的一般步骤;(3)区分简单随机抽样、系统抽样和分层抽样,并选择适当的方法进行抽样。
知识清单:1、分层抽样的定义是:一般地,在抽样时,将总体分成 的层,然后按照 ,从各层 抽取一定数量的个体,将各层取出的个体 作为样本,这种抽样方法是分层抽样。
分层抽样时,每一个个体被抽到的概率都是 相等 的,分层抽样适用于 总体是由差异明显的几部分组成时的抽样 ;在每一层抽样时,采用的抽样方法可以是 随机抽样。
2、分层抽样的步骤:①分层:将总体按一定标准进行分层;② 计算抽样比:计算各层的个体数与总体的个体数的比;③样本容量的分配:按各层的个体数占总体的比确定各层应抽取的样本容量; ④层内抽样:在每一层进行抽样(可用简单随机抽样或系统抽样);⑤定样:最后将每一层抽取的样本汇总合成样本;3、在分层抽样中常用的关系式:该层的个体数各层抽取的个体数总体的个数样本容量 N n 总体中某两层的个体数之比=样本中这两层抽取的个体数之比4、选择抽样方法的规律:(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法;(2)当总体容量较大,样本容量也较小时,可采用随机数法;(3)当总体容量较大时,样本容量也较大时,可采用系统抽样法;(4)当总体是由差异明显的几部分组成时,可采用分层抽样;例题讲解例1 某学校在编教师160人,其中老教师16人,中年教师112人,青年教师32人,为了了解教师得健康状况,要从中抽取一个容量为20的样本,试确定用何种方法抽取?解:①计算抽样比n/N=20/160=1/8②样本容量的分配:样本中老教师人数为16*1/8=2;中年教师人数为112*1/8=14;青年教师人数为32*1/8=4③层内抽样:运用抽签法在16名老教师中抽取2人,运用系统抽样法在112名中年教师中抽取14人,运用抽签法在32名青年教师中抽取4人.④定样:把层内抽样得到的教师汇集一起,得到所求样本。
实验题目:
1、某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。
调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并进行
了调查每户最近一个月购买彩票花费的金额(元),下表为每个新村及
调查的情况:
请估计该小区居民户购买彩票的平均支出,并给出估计的标准差。
给出95%的置信区间,并与简单随机抽样进行精度比较。
2、随着经济发展,某市居民正在悄悄改变过年的习惯,虽然大多数居民除
夕夜在家吃年夜饭、看电视节目,但是有些家庭到饭店吃年夜饭,或逛
夜市,或用过年的假期到外地旅游。
为研究这种现象,某研究机构以市
中心165万居民户作为研究对象,将居民户按6个行政区分层,每个行
政区随机抽取了30户居民户进行了调查(各层抽样比可以忽略),每个
行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表:
试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。
9.03027301
1
===a p
933.030
283022===a p
9.030
27
303
3
===a p 867.03026304
4
===a p
933.030283055
===
a p 967.03029306
6
===a p
867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑p
w p h
H
h
st
923.0967.0*22.0933.0*16.0≈++
06.0*933.0*301
*1.0*9.0*301*)1(1)(ˆ21.018.02
2
2+=--
=∑p p n
f w p h
h
h
h
h
h
st
V
067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*
16.009.014.02
22
+++
838.322.04
2
033.0*967.0*30
1*
-=+
P:[
)(ˆ96.1p p
st
st
V
±]=[0.923±1.96*838
.34
-]=[0.866,0.979]。