第三章(分层抽样)
- 格式:ppt
- 大小:1.66 MB
- 文档页数:95
第三章分层随机抽样概述简单估计及其性质各层样本量的分配样本总量的确定分层随机抽样效果分析第一节概述一、特点¾分层抽样不仅可估计总体参数,还可估计层的参数¾实施方便,便于组织¾分层样本比简单随机样本在总体中分布更均匀¾分层抽样能较大地提高调查地精度二、符号¾总体分为L 层,h 表示层的编号¾第h 层单位总数:N h ¾样本单位数:n h¾层权:抽样比:¾第h 层子总体第i 个单位标志值:Y hi¾第h 层样本中第i 个单位标志值:y hiNN W h h =hhh N n f =¾总体均值:¾样本均值:¾总体方差:¾样本方差:∑==hNihihhYNY11∑==hnihihyny11()∑=−−=hNihhihhYYNS12 211()∑=−−=hnihhihhyyns12 211第二节简单估计量及其性质一、对总体均值或总量的估计hLh h h L h h st Lh h st sth Lh h Lh h h st y N y W N Y N Y Y y y W Y W Y ∑∑∑∑∑============11111ˆˆˆˆˆstststst Y YE Y y E ==)ˆ()(∑∑∑===−==Lh hh Lh h hh h L h hst N SW n S W y V W y V 1212212)()(样本方差s 2∑∑==−=Lh hh Lh h hh st N sW n s W y v 12122)(hhh h h st st st n S n N N y V N Y V N Y V 222)()()ˆ()ˆ(−===∑hhh h h st n s n N N Y v 2)()ˆ(−=∑())(,)(st st st sty v u y y v u yαα+−例:某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇23560户中抽取300户,在全部农村148420户中抽取250户(均按简单随机抽样进行),调查结果城镇年平均户收入为15180元,标准差为2972元;农村年平均户收入为9856元,标准差为2546元。
第三章分层随机抽样书P1293.1.某高校欲了解教职员工对某项津贴与职务职称挂钩的分配制度改革的态度,准备在全校教职员工中进行抽样调查,为了提高抽样技术,准备进行分层抽样,请判断下面的几种分层方法是否合适?(1)按性别分层(2)按教师、行政管理人员、职工分层;(3)按职称)(正高、副高、中级、初级、其他)分层(4)按部门(如系、所、处)分层3.2. 某学院4个专业的新生元旦晚会,组织者为了活跃气氛,欲在800名学生中抽出8名作为“幸运星”,为了以示公平,要求每位学生被抽中的概率相同。
组织者知道利用简单随机抽样的方法可以满足要求,你能不能帮助组织者再设计几种方案?3.3.某居委会辖有三个居民新村,居委会欲对居民购买彩票情况进行调查,调查者考虑以新村分层,在每个新村中随机抽取了10个居民户最近一个月购买彩票所花费的金额(元),下表是每个新村及调查情况:(1)试估计该小区居民户购买彩票的平均支出,并给出估计标准差。
(2)当置信度为95%,要求极限误差不超过10%时,按比例和奈曼分配时样本量及各层的样本量分别为多少?3.4.随着经济发展,某市居民年生活习惯在改变,为研究该现象,某机构以市中心163万居民户作为研究对象,将居民户按6个行政分层,在每个行政区随机抽出30户居民进行调查,(各层抽样比可忽略),调查结果如下:(1)试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。
(2)置信度为95%,要求极限绝对误差不超过1%时,按比例和奈曼分配时样本量及各层的样本量分别为多少?3.5.某开发区利用电话调查对区内冷冻食品情况进行调查(各层抽样比忽略)调查后各层样本户购买冷冻食品支出的中间结果如下表:试估计该开发区居民购买冷冻食品的平均支出,以及估计的95%的置信区间。
3.6.某单位欲估计职工的离职意愿,聘请了专业公司来进行调研,公司人员按高级职称、中级职称和初级职称分为3层,已知层权分别为0.2,0.3,0.5,预先猜测各层的总体比例为:0.1,0.2,,0.4,如果采用按比例的分层抽样,要求估计的方差与样本量为100的简单随机抽样相当,则样本量为多少?(不考虑有限总体校正系数)3.7.如果一个大的简单随机样本按类别分为6组,然后按照层的实际大小重新进行加权,这一过程称为事后分层,才用这种方法是由于(判断以下说法的对错)(1)它能比简单随机抽样产生更精确的结果;(2)它能比按比例分配产生更精确的结果;(3)它能比最优分配产生更精确的结果;(4)在抽样时不能得到分层变量;(5)它的估计量方差与真正按比例分层随机抽样的方差差不多。
时分层抽样【学习导航】学习要求1.体会分层抽样的的概念及如何用分层抽样获取样本;2.感受分层抽样也是等可能性抽样,它适用于总体由差异明显的几部分组成的;3.简单随机抽样、系统抽样、分层抽样的特点及适用范围。
【课堂互动】自学评价案例1某校高一、高二和高三年级分别有学生1000,800和700名,为了了解全校学生的视力情况,欲从中抽取容量为100的样本,怎样抽样较为合理.【分析】如果在2500名学生中随机抽取100名学生作为样本,或者在三个年级中平均抽取学生组成样本,这样的样本是否合理?能否反映总体情况?由于不同年级的学生视力状况有一定的差异,为准确反映客观实际,不仅要使每个个体被抽到的机会均等,而且要注意总体中个体的层次性,从而使抽取的样本具有良好的代表性. 对于这种容量较大、个体差异较大且明显分成几部分的总体,就考虑用分层抽样来抽取样本.1.分层抽样分层抽样的概念:当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这样的抽样方法称为分层抽样(stratified sampling)分层抽样的步骤为:(1)将总体按一定标准分层;(2)计算各层的个体数与总体的个体数的比;(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;(4)在每一层进行抽样(可用简单随机抽样或系统抽样)。
【小结】①分层抽样适用于总体由差异比较明显的几个部分组成的情况,是等可能抽样,它也是客观的、公平的;②分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时可以根据情况采用不同的抽样方法,因此在实践中有着非常广泛的应用.【精典范例】例1某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取。
第三章分层随机抽样
§3.1 引言
§3.2 估计量
§3.3 样本量在各层的分配§3.4 样本量的确定
附录一
附录二
§3.1 引言⏹定义与特点➢定义
➢特点
※分层抽样的抽样效率高(即分层抽样的估计精度高)。
①层抽样估计量的方差只与层内方差有关,与层间方
差无关。
通过分层,尽可能降低层内差异,使层间差异增大,从而提高估计精度。
②从直观的角度来看,分层抽样可以使样本在总体中
分布比较均匀。
※分层抽样不仅可以对总体指标进行推算,也可以对各层指标进行推算。
▪使用场合
符号说明
§3.2 估计量
⏹总体均值的估计➢简单估计量的定义
➢简单估计量的性质
⏹总体总量的估计➢简单估计量的定义
➢简单估计量的性质
⏹总体比例的估计➢简单估计量的定义
➢估计量的性质
§3.3 样本量在各层的分配 比例分配
➢比例分配下总体均值估计
➢比例分配下总体总值估计
➢比例分配下总体比例估计
最优分配
➢Neyman(内曼)分配
▪考虑估计总体比例P的情形
§3.4 样本量的确定 影响样本量的因素
➢估计总体均值的情形
➢总体参数为P的情形。
第3章 分层随机抽样在前面一章,我们介绍了简单随机抽样。
应该说简单随机抽样在实际中具有广泛的应用,尤其是在总体N 较小或者总体方差2S 与任意局部方差基本相当的情况下,简单随机抽样的优势明显。
然而,当总体单元数N 较大或者总体各单元之间差异较大时,采用简单随机抽样对总体指标进行估计通常会产生很大的误差。
例如,欲通过调查了解我国居民的人均年收入水平。
这时总体是全国人口的13亿人,倘若采取简单随机抽样从中抽取10万人入样,则需要将全国人口依次编号,然后在1~13亿中生产10万个随机数,然后将这些随机数一一对应成具体某个人。
显然这样做是不实际的,就算可以,由于某些人口较少的省市或民族的样本量过小,甚至没有样本点,从而降低了样本对总体的代表性。
不仅如此,由于类似的全国性调查总是需要地方政府的大力协调与配合,如果地方政府不能通过此次调查获取辖区内的相关信息,达到一举两得的效果,那就勉为其难了。
为了克服简单随机抽样上述缺陷和不足,本章引入——分层随机抽样(Stratified sampling )。
§3.1 定义与符号一、定义与符号 (一)定义定义3.1 层(类):如果一个包含N 个基本单元的总体可以分成“不重不漏”的L 个子总体,即每个单元必属于且只属于其中一个子总体,则称这样的子总体为层(stratum )。
设L 个子总体所包含的单元数分别为L N N N ,,,21 ,即有: L N N N N +++= 21},,,{21N N Y Y Y =π,},,,{21i h hN h h N Y Y Y =π,L h ,,2,1 =定义3.2 分层抽样 又称为类型抽样或分类抽样,即抽样在每个层中独立进行,总的样本由各层样本构成。
定义3.3 分层随机抽样若在每层中的抽样采用SRS ,这样得到的样本为分层随机样本(stratified random sample )。
即从第h 层简单随机抽样h n 个单元,构成第h 层子样本。