当前位置:文档之家› 分层随机抽样及其excel分析资料

分层随机抽样及其excel分析资料

分层随机抽样及其excel分析资料
分层随机抽样及其excel分析资料

课程设计任务书

案例:某公司要估计某地家用电器的潜在用户。这种商品的消费同居民收入水平相关,因而以家庭年收入为分层基础。假定某地居民为1,000,000户,已确定样本数为1,000户,家庭年收入分10,000元以下,10,000——30,000元;30,000——60,000元,60,000元以上四层,其中收入在10,000元以下家庭户为180,000户,收入在10,000——30,000元家庭户为350,000户,收入在30,000——60,000元家庭户为3000,000户,收入在60,000元以下家庭户为170,000户,若采取分层比例抽样法,如何抽样?

下面针对案例对分层随机抽样进行大致说明。

一.分层随机抽样定义:

分层抽样也称类型抽样或分类抽样,就是将总体单位按一定标准(调研对象的属性、特征等)分组,然后在各个类型组中用纯随机抽样方式或其他抽样方式抽取样本单位,而不是在总体中直接抽取样本单位。

二.注意事项:

分层抽样必须注意以下问题:第一,必须有清楚的分层界限,在划分时不致发生混淆;第二,必须知道各层中的单位数目和比例;第三,分层的数目不宜太多,否则将失去分层的特征,不便在每层中抽样。

三.分层抽样步骤:

分层抽样的步骤包括:

(1)确认目标总体。

(2)决定样本数。

(3)决定分层标志。

(4)将总体按照分层标志分成若干类,其中每一类称为一层。

(5)在每一层中随机抽取出足够的样本。

四.具体做法及例子说明:

分层抽样的具体做法有以下两种:

1.等比例分层抽样。这种抽样法就是按照各层中样本单位的数目占总体单位数目的比例分配各层的样本数量。

[例]某教授对甲大学的学生消费倾向产生了兴趣,想对全校学生做抽样调查,总体有5 000人,欲抽样500人,则:

总体样本

一年级 2 000人一年级200人

二年级 1 500人二年级150人

三年级 1 000人三年级100人

四年级500人四年级50人

2.不等比例分层抽样,又称分层最佳抽样。这种抽样法不按各层中样本单位数占总体单位数的比例分配各层样本数,而是根据各层的标准差的大小来调整各层样本数目。该方法既考虑了各层在总体中所占比重的大小,又考虑了各层标准差的差异程度,有利于降低各层的差异,以提高样本的可信程度,故也可将不等比例分层抽样称为分层信任程度抽样。[例]某公司要调研某地家用电器产品的潜在用户,这种产品的消费同居民收入水平有关,因

此以家庭收入为分层基础。假定该地居民户即总体单位数为20 000户,已确定调研样本数为200户。家庭收入分高、中、低三层,其中高档收入家庭为2 000户,占总体单位数的比重为10%;中等收入家庭为6 000户,占总体单位数的30%;低等收入家庭为12 000户,占总体单位数的60%。现又假定各层样本标准差为:高档收入家庭是300元,中等收入家庭是200元,低等收入家庭是50元。现要求根据分层最佳抽样法,确定各收入层家庭应抽取的户数各为多少? 公式n Si Ni Si Ni ???∑

Ni 为i 层调查单位总数;ni 为i 层应抽的样本数目;si 为i 层调查单位标准差

为了便于观察,列表1如下。

表1 调研单位数与样本标准差乘积计算表

家庭收入分层 各层调研单位数

(潜在用户数) 各层的样本标准差 乘积 样本单位数

高 2 000 300 600 000 200×600 000÷2 400 000=50

中 6 000 200 1 200 000 200×1200000÷2400 000=100

低 12 000 50 600 000 200×600 000÷2 400 000=50

合计20 000 — 2 400 000 —

如果根据等比例分层抽样的话,那么,高档收入家庭的分层样本数为20户(200×10%);中等收入家庭的分层样本数为60户(200×30%);低等收入家庭的分层样本数为120户(200 ×60%)。将前后两种方法抽取的各层样本数做个对比,不难看出,相比于等比例分层抽样法,根据分层最佳抽样法抽取样本,则高档收入家庭的分层样本数增加了30户,中等收入家庭的分层样本数增加了40户;低等收入家庭的分层样本数则减少了70户。由于购买家用电器同家庭收入水平是成正比例变动的,所以,增加高、中档层的样本数,相应减少低档层的样本数,将有利于提高抽样的准确性。

对案例开始进行分析:

由上述可知该案例中应采取不等比例抽样。

由公式可以求出:

收入在10000以下的家庭户的样本量应为(180000/1000000)*1000=180.

收入在10000—30000的家庭户的样本量应为(350000/1000000)*1000=350.

收入在30000—60000的家庭户的样本量应为(3000000/1000000)*1000=300.

收入在60000以上的家庭户的样本量应为(170000/1000000)*1000=170.

其分层比例抽样示意图如下所示:

分层比例抽样示意图总体

子样本样本

N 1000000

N1180000 N2 350000 N3300000 N4170000 n1180 n2350 n3300 n4170

n 1000

案例的excel实现过程:

因为在excel中,抽样功能是作为一种扩展功能存在的,所以在应用时就应该先加载分析工具库。

点击工具,选择加载宏,再选择分析工具库。

单击“工具”菜单,再选择“数据分析”选项,打开“数据分析”对话框,从中选择“抽样”。

单击“抽样”选项,弹出“抽样”对话框。

在输入区域框中输入总体单位编号所在的单元格区域,如果输入区域的第二行或第一列为标志项(横行标题或纵列标题),可以选中“标志”复选框。

在抽样方法项下,有周期和随机两种抽样模式:“周期”模式即所谓的等距抽样。“随机”模式适用于纯随机抽样、分层抽样、整群抽样和多阶段抽样。在这里我们选择随机选项。

指定输出区域,单击“确定”后,即可得到抽样结果。

点击确定,可得抽样结果,得到与计算相同数量的分层抽样。

1简单随机抽样、系统抽样、分层抽样含答案

简单随机抽样、系统抽样、分层抽样 1.简单随机抽样的定义 设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. 2.简单随机抽样的分类 简单随机抽样????? 抽签法随机数法 3.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的. 4.系统抽样的概念 先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本. 5.系统抽样的步骤 假设要从容量为N 的总体中抽取容量为n 的样本,步骤为: (1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等. (2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n ; (3)在第1段用简单随机抽样确定第一个个体编号l(l≤k); (4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本. 6.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. 7.分层抽样的适用条件 分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选

用excel进行随机抽样

方法: 在进行统计的时候,我们可能需要随机抽取一定数量的样本,比如从100个数中抽取40个,保证无重复性。 工具:Microsoft Excel 2013 步骤:1.选择“视图”-“宏”-“录制宏”,宏名任取,然后“确定”。 2.选择“宏”-“停止录制”;再选择“宏”-“查看宏”。 3.选择“编辑”按钮,将下面的代码粘贴覆盖原有代码。

以下复制粘贴 1.Sub Randx() 2.Dim xx(1 To 100) As Integer 3.For t = 1 To 40 4.rerand: 5.x = Int(Rnd() * 100 + 1) 6.If xx(x) > 0 Then GoTo rerand 7.r = r + 1 8.Cells(r, 1) = x 9.xx(x) = r 10.Next 11.End Sub 4.点击工具栏的按钮或者"F5"按钮,在excel的A列就可以发现随机生成的40个数了。 实践: 从2000个数中抽取51个,保证无重复性。

步骤1,2 同前 步骤3: 复制粘贴 1.Sub Randx() 2.Dim xx(1 To 2000) As Integer 3.For t = 1 To 50 4.rerand: 5.x = Int(Rnd() * 100 + 1) 6.If xx(x) > 0 Then GoTo rerand 7.r = r + 1 8.Cells(r, 1) = x 9.xx(x) = r 10.Next End Sub 步骤4同上 结果:

步骤5: 排序选中抽取的数字--- 点选excel 表的数据项----选择排序----确定

2005年全国1%人口抽样调查

2005年全国1%人口抽样调查主要数据公报 中华人民共和国国家统计局 2006年3月16日 经国务院批准,我国于2005年底开展了全国1%人口抽样调查工作。这次调查以全国为总体,以各省、自治区、直辖市为次总体,采取分层、多阶段、整群概率比例的抽样方法。最终样本单位为调查小区。这次调查的样本量为1705万人,占全国总人口的1.31%。在国务院和地方各级人民政府的统一领导下,通过调查工作人员的艰苦努力,调查的各项任务已基本完成。现将快速汇总的全国总人口及其结构的主要数据公布如下: 一、总人口 2005年11月1日零时,全国31个省、自治区、直辖市和现役军人的总人口为130628万人,与2000年11月1日零时第五次全国人口普查的总人口126583万人相比,增加了4045万人,增长3.2%;年平均增加809万人,年平均增长0.63%。根据调查数据推算,2005年年末总人口为130756万人。 二、流动人口 全国人口中,流动人口为14735万人,其中,跨省流动人口4779万人。与第五次全国人口普查相比,流动人口增加296万人,跨省流动人口增加537万人。 三、城乡构成 全国人口中,居住在城镇的人口56157万人,占总人口的42.99%;居住在乡村的人口74471万人,占总人口的57.01%。与第五次全国人口普查相比,城镇人口占总人口的比重上升了6.77个百分点。 四、性别构成 全国人口中,男性为67309万人,占总人口的51.53%;女性为63319万人,占总人口的48.47%。性别比(以女性为100,男性对女性的比例)为106.30,与第五次全国人口普查相比下降0.44。 五、年龄构成 全国人口中,0-14岁的人口为26478万人,占总人口的20.27%;15-59岁的人口为89742万人,占总人口的68.70%;60岁及以上的人口为14408万人,占总人口的11.03%(其中,65岁及以上的人口为10045万人,占总人口的7.69%)。与第五次全国人口普查相比,0-14岁人口的比重下降了2.62个百分点,60岁及以上人口的比重上升了0.76个百分点(其中,65岁及以上人口比重上升了0.73个百分点)。

2015年全国1%人口抽样调查主要数据公报

2015年全国1%人口抽样调查主要数据公报[1] 中华人民共和国国家统计局 2016年4月20日 根据《全国人口普查条例》和《国务院办公厅关于开展2015年全国1%人口抽样调查的通知》,我国以2015年11月1日零时为标准时点进行了全国1%人口抽样调查[2]。这次调查以全国为总体,以各地级市(地区、盟、州)为子总体,采取分层、二阶段、概率比例、整群抽样方法,最终样本量为2131万人,占全国总人口的1.55%。在党中央、国务院的正确领导下,在地方各级人民政府的精心组织和调查对象的支持配合下,经过广大调查工作人员的艰苦努力,目前已基本完成各项调查任务。现将根据这次调查推算的人口主要数据公布如下: 一、总人口 全国大陆31个省、自治区、直辖市和现役军人的人口为137349万人。同第六次全国人口普查2010年11月1日零时的133972万人相比,五年共增加3377万人,增长2.52%,年平均增长率为0.50%。 二、家庭户人口 大陆31个省、自治区、直辖市共有家庭户[3]40947万户,家庭户人口为126935万人,平均每个家庭户的人口为3.10人,与2010年第六次全国人口普查持平。 三、性别构成 大陆31个省、自治区、直辖市和现役军人的人口中,男性人口为70356万人,占51.22%;女性人口为66993万人,占48.78%。总人口性别比(以女性为100,男性对女性的比例)由2010年第六次全国人口普查的105.20下降为105.02。 四、年龄构成 大陆31个省、自治区、直辖市和现役军人的人口中,0-14岁人口[4]为22696万人,占16.52%;15-59岁人口为92471万人,占67.33%;60岁及以上人口为22182万人,占16.15%,其中65岁及以上人口为14374万人,占10.47%。同2010年第六次全国人口普查相比,0-14岁人口比重下降0.08个百分点,15-59

正态抽样及概率分布的EXCEL模拟演示

正态抽样及概率分布的EXCEL模拟 张庆远1 [摘要] 利用EXCEL办公软件的函数及VBA功能,编制正态分布抽样的演示程序,并根据所抽到的样本数据自动进行相应的统计分析,通过理论分布频数与计算出的实际分布频数比较,帮助学生加深理解正态分布的概率分布规律,辅助于医学统计学教学;该方法具有直观、形象、易用且快速得到结果等特点,使复杂的抽象理论变得形象而具体,极大提高了课堂教学效果。 [关键词] EXCEL 正态分布统计教学演示 在医学统计学教学过程中,正态分布规律是一个教学重点,也是统计学习所遇到的第一个概率分布规律。曾有老师以实际调查的方式指导学生对某校入学新生的相应体检指标数据进行统计分析[1],以达到帮助学生来加深对正态分布规律的认识和理解,但这种方法效率低,手工计算工作量大,在实际操作中会存在一定难度。也有以EXCEL制作简单的动态正态分布曲线的方式来进行课件展示[2],感觉也仅是将手工画正态分布曲线改为用多媒体来制作,少了抽样模拟的效果。 在借鉴他人经验的基础上[3],本人利用EXCEL的相关函数及VBA 功能,编制程序,模拟正态分布的抽样,并利用表格中的关联计算,即时完成对所抽到样本数据的统计描述分析,随时了解查看不同u值下样本数据的频数分布情况。 1、设计思路 给出一个假设已知其总体均数和总体标准差的正态分布总体,在要求的样本含量及精度的情况下,利用相应函数从中随机进行单个数据抽取,每抽出一个数据便依次写在相应列中,抽完后,做出该批样本数据的频数分布表,并自动绘出频数分布直方图,最后按照所给的不同标准正态分布u值,计算并比较相应理论频数分布与实际概率分布的吻合程度。 2 具体操作 首先用EXCEL新建一个文件,保存并命名为“正态抽样及概率分布的EXCEL演示”,接着在此文件SHEET1工作薄中相应单元格输入如下文字、公式代码或数值。 2.1 完成假设已知总体的总体均数及总体标准差的设置,见图1,其中B1、B2、B3、B4格子中可以自行设置已知总体的总体均数,总体标准差,欲抽样本含量值,及抽出样本值欲保留的小数位数;B5格中所输入公式可以完成以假设已知总体的相应参数为基础的一次正态抽样,抽出一个样本值显示在B5格中,通过编制相应程序,可以做到当抽样时,每抽出一个样本值后,便依次将其数值写在D列中保存,B7、B8、B9、B10、B11格中为即时根据所抽样本计算出的相应统计量值,以备下面进行频数表编制时组距的计算和组段的划分引用。同时在“视图”-“工具栏”下拉菜单中选中并打开“控件工具箱”,在B6格中添加一个按钮控件,其“caption”属性改为“开始抽样”,以便将来点击运行程序时使用。 1张庆远男讲师河南南阳医学高等专科学校基础部

社区人口抽样调查总结信息与社区人口普查总结汇编

如对你有帮助,请购买下载打赏,谢谢! 社区人口抽样调查总结信息与社区人口普查总结汇编 社区人口抽样调查总结信息 关于人口抽样调查的调查报告前言:人口普查箭在弦上,为了更好地亲身体现人口普查的重难点,积极配合人口普查工作的顺利进行,从而为建设“幸福徐州”贡献自己的一份薄力,我们特意在街道办事处统计办实习开展了一次人口1%抽样调查的调查体验。通过本次的调查活动,让我们亲身地体现了开展人口调查工作的重点和难点,同时也总结出了本次调查的相关经验。调查标准时间为20**年11月1日零点,所谓标准时间,就是规定的一个时间点,无论普查员入户登记哪一天进行,登记的人口都是反映在那个时间点上的情况,这样的时间点称为人口普查的标准时点。普查对象:只要是指普查标准时点在中华人民共和国境内的自然人(港、澳、台及外籍人员),以及在中华人民共和国境外但为定居的中国公民,但不包括在中华人民共和国境内短暂停留的境外人员。为了保证普查对象的不重不漏,这次普查采用按现住地登记的原则,普查员在实际入户登记时,不论是否见到本人,只要在标准时点也就是 20**年11月1日晚在本户居住都要进行登记;20**年11月1日在本户户籍在册不论人在哪里,也要进行登记。主体:这几年以来,徐州的社会经济有了长足发展,在此期间,人们的居住条件和居住环境大大改善,因而动迁和搬迁现象十分普遍;流动人口数量不断增加,流动频率不断加快,流动跨度不断扩大。与以往人口普查相比,除“出生”与“死亡”仍是人口普查的重点和难点之外,人口搬迁与流动使这次人口普查的难度加大。我们走进徐州市丰财小区,挨家挨户上门调查,填写调查问卷,了解人口的出生、死亡、流动人口及基层的管理等情况。调查持续了一个月。通过这次调查了解到城市人口调查的一些难题。城市难点一:搬迁人口多,熟悉住户难十年来,徐州市市区及镇区所在地,动迁和搬迁现象十分普遍,可以说有些地方发生了翻天覆地的变化。在此期间,很多城市居民居住地发生了变化,一些富裕家庭为了投资购臵了多处房产,一方面出现了大量的出租房,另外也出现了一些无人居住的房屋。凡此种种,都将产生很多各种“人户分离”现象,因此也很难有人对某一小区某一栋楼房甚至某一门栋的住户十分了解。由此看来,人口调查如何在居民区里挑选尽可能熟悉

随机抽样知识讲解

随机抽样 【学习目标】 1、了解简单随机抽样的概念,掌握实施简单随机抽样的常用方法:抽签法和随机数表法; 2、了解系统抽样的意义,并会用系统抽样的方法从总体中抽取样本; 3、了解分层抽样的概念与特征,清楚简单随机抽样、系统抽样、分层抽样的区别和联系. 【要点梳理】 要点一、简单随机抽样 简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取. 1、简单随机抽样的概念: 一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 2、简单随机抽样的特点: (1)被抽取样本的总体个数N是有限的; (2)简单随机样本数n小于等于样本总体的个数N; (3)从总体中逐个进行抽取,使抽样便于在实践中操作; (4)它是不放回抽取,这使其具有广泛应用性; (5)每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性. 3、实施抽样的方法: (1)抽签法: 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力又不方便,若标号的纸片或小球搅拌得不均匀还可能导致抽样的不公平.

抽签法的一般步骤: ①将总体中的N个个体编号; ②把这N个号码写在形状、大小相同的号签上; ③将号签放在同一箱中,并搅拌均匀; ④从箱中每次抽取一个号签,连续抽取n次; ⑤将总体中与抽到的号签的编号一致的n个个体取出. (2)随机数表法: 要理解好随机数表,即表中每个位置上等可能出现0,1,2,…,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性. 随机数表法的步骤: ①将总体的个体编号(每个号码的位数一致); ②在随机数表中任选一个数字作为开始; ③从选定的数开始按一定的方向读下去,若得到的数码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止. 注意: ①选定开始数字,要保证所选数字的随机性; ②确定读数方向获取样本号码时,读数方向可向左、向右、向上、向下,样本号码不能重复,否则舍去. 要点诠释: 1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法. 2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不

在excel中产生随机数

用excel产生随机数 统计软件提供的随机数发生器可以使我们对抽样分布进行计算机模拟,对抽样分布有更加直观的理解。Excel的分析工具库中有一个“随机数发生器”模块,可以产生服从大部分常用分布的模拟数据,但没有提供直接产生随机数的函数。在SPSS中产生随机数的函数在“Randomnumbers”类别中,相应的函数都是以Rv 开头的。 1 样本均值抽样分布的随机模拟 假总体的均值为μ,标准差为σ,则统计理论表明,不论总体的分布如何,只要样本容量n足够大,样本均值的分布总会趋向于正态分布,且均值为μ,标 准差为。 例题:假设总体为均匀分布,模拟样本均值的抽样分布。 假设总体的分布为0-1区间上的均匀分布,则总体的均值为0.5,方差等于 1/12,标准差等于0.288675。现在,我们从总体中抽取1000个样本容量为2的样本(有放回抽样),计算每个样本的样本均值,然后观察样本均值的分布状况。 新建一个Excel工作簿,单击“工具”“数据分析”“随机数发生器”,在弹出的对话框中把变量个数设为2,随机数个数为1000,选择0-1区间的均匀分布,结果放在新工作表中(图1)。把输出结果的每一行看作一个容量为2的样本,共有1000个样本。在C列中计算每个样本的均值。接下来我们就可以分析这1000个样本均值的分布状况了。由于SPSS的直方图工具更为方便,我们把相应的数据复制到SPSS中作直方图,结果如图2,抽样分布的均值为0.5097,标准差为 0.20345,理论值等于0.288675/ 2 =0.20412,两者差异不大。 图1 随机数发生器对话框

图2 样本均值的抽样分布,样本容量=2 2 样本比例抽样分布的随机模拟 样本比例实质上就是指标数值只能取0和1时的样本均值。由于在这种情况下总体的分布为0-1分布,因此在重复抽样的条件下样本均值抽样分布的理论分布是二项分布。中心极限定理表明当样本用量足够大(能够保证np≥5,nq≥5)时二项分布可以用正态分布来近似。 [例] 假设有大批零件,不合格率p为0.2。随机模拟从总体中抽取样本容量分别为5,20,50的2000个样本,分析样本比例p? 的抽样分布。 新建一个工作表,在单元格中输入图5-10左上角所示的信息作为总体:总体中取值为1(不合格)的概率为0.2,取值为0(合格)的概率为0.8。 图3 二项分布的随机模拟

谈谈几种典型的抽样方法(案例)

谈谈几种典型的抽样方法(案例) 学院:经济学院 班级: 08经41 学号: 08084004 姓名:毛雪晨 日期: 2011年10月20日

摘要:本文以抽样方法为中心,主要阐述几种常见的抽样方法,如简单随机抽样,分层抽样,整群抽样,系统抽样以及配额抽样,探讨了各种抽样方法在实际生活的应用以及各自的优缺点等。 关键词:抽样调查,应用,缺点。

导语:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。 抽样调查是建立在随机原则基础上,从总体中抽取部分单位进行调查,并概率估计原理,应用所的资料对总体的数量特征进行推断的一种调查方法。例如,从某地区全部职工当中随机抽取部分职工,以家庭为单位按月调查取得有关收入、支出等方面的资料,并依据这些资料推断出全区职工的收支情况,这就是一种抽样调查。从调查方法上来看,它是属于一种非全面调查。但又与一般调查不同,它不只停留于搜集资料和整理资料,而且还要对资料进行分析,并据以推断总体的数量特征,从而提高统计的认识能力。因此,抽样调查的理论和方法在统计中占有很重要的地位。 下面介绍一下常用的抽样方法: 一. 简单随机抽样 一般,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的个体被抽到的机会相等,就把这种抽样方法叫做简单随机抽样。 简单随机抽样的具体作法有:直接抽选法,抽签法,随机数法。 直接抽选法例如某项调查采用抽样调查的方法对某市职工收入状况进行研究,该市有职工56,000名,抽取5,000名职工进行调查,他们的年平均收入为10,000元,据此推断全市职工年收入为8,000--12,000元之间。 抽签法又称“抓阄法”。它是先将调查总体的每个单位编号,然后采用随机的方法任意抽取号码,直到抽足样本。在这里选取一个案例说明,如要在10个人中选取3个人作为代表,先把总体中的10个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取3次,就得到一个容量为3的样本。这就是抽签法,与直接抽样法类似。 另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算

统计学excel实验答案(版)

Excel在统计学中的应用 用Excel搜集与整理数据 用Excel搜集数据 统计数据的收集是统计工作过程的基础性环节,方法有多种多样,其中以抽样调查最有代表性。在抽样调查中,为保证抽样的随机性,需要取得随机数字,所以我们在这里介绍一下如何用Excel生成随机数字并进行抽样的方法。需要提醒的是,在使用Excel进行实习前,电脑中的Excel需要完全安装,所以部分同学电脑中的office软件需要重新安装,否则实习无法正常进行。本书中例题全部用Excel2007完成。 使用Excel进行抽样,首先要对各个总体单位进行编号,编号可以按随机原则,也可以按有关标志或无关标志,具体可参见本书有关抽样的章节,编号后,将编号输入工作表。 1.我们假定统计总体有200个总体单位,总体单位的编号从1到200,输入工作表后如图10-1所示: 图10-1 总体各单位编号表 各总体单位的编号输入完成后,可按以下步骤进行操作: 第一步:选择数据分析选项(如果你使用的是Excel2003,单击工具菜单,若无数据分析选项,可在工具菜单下选择加载宏,在弹出的对话框中选择分析工具库,便可出现数据分

析选项;如果你使用的是Excel2007,点击左上角Office标志图标,Excel选项,加载项,在下面的管理下拉列表中选择“Excel加载项”,转到,勾选“分析工具库”,确定。),打开数据分析对话框,从中选择抽样。如图10-2所示。 图10-2数据分析对话框 第二步:单击抽样选项,确定后弹出抽样对话框。如图10-3: 图10-3 抽样对话框 第三步:在输入区域框中输入总体单位编号所在的单元格区域,在本例是$A$1:$J$20,系统将从A列开始抽取样本,然后按顺序抽取B列至J列。如果输入区域的第一行或第一列为标志项(横行标题或纵列标题),可单击标志复选框。 第四步:选择“随机模式”,样本数为10。 在抽样方法项下,有周期和随机两种抽样模式。 “周期”模式即所谓的等距抽样(或机械抽样),采用这种抽样方法,需将总体单位数除以要抽取的样本单位数,求得取样的周期间隔。如我们要在200个总体单位中抽取10个,则在“间隔”框中输入20;如果在200个总体单位中抽取24个,则在“间隔”框中输入8

分层、分段随机抽样的区别

分层、分段随机的区别简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。 分段抽样又称多级抽样或多阶段抽样,就是把从总体中抽取样本的过程分成两个或多个阶段进行的抽样方法。它是在总体内个体单位数量较大,而彼此间的差异不太大时,先将总体各单位按一定标志分成若干群体,作为抽样的第1阶段单位,并依照随机原则,从中抽出若干群体作为第1阶段样本;然后将第1阶段样本又分成若干小群体,作为抽样的第2阶段单位,从中抽出若干群体作为第2阶段样本,依此类推,直到满足需要为止。最末阶段抽出的样本单位的集合,就是最终形成的总体样本。一般在抽取前阶段样本时采用分类抽样或等距抽样,抽取后阶段样本时用整群抽样或简单随机抽样。多阶段抽样的意义在于缩小总体范围,提高抽样效率,降低抽样成本。其最大优点就是可以达到以最小的人财物消耗和最短的时间获得最佳调查效果的目的,特别适用于调查范围大、单位多、情况复杂的调查对象。此外,多阶段抽样由于在各阶段抽样时可根据具体情况灵活选用不同的抽样方法,所以能够综合各种抽样方法的优点,有利于提高样本质量。多阶段抽样的不足之处是抽样误差较大。由于每次抽样都必然产生误差,所以抽样阶段越多抽样误差就越大。

分层抽样,也叫类型抽样。就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。群集抽样法即将母体按某种标准分为若干群集(cluster) ; 其次,以群集为抽样单位。然后,由这些群集中用简单随机抽样法抽出若干群集为一组群集样本,这种抽样程序即称为群集随机抽样法。其所抽出的样本称为群集样本。 系统抽样,也叫机械抽样或等距抽样。是将总体各单位按一定标志或次序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位。特点是:抽出的单位在总体中是均匀分布的,且抽取的样本可少于纯随机抽样。等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。等距抽样是实际工作中应用较多的方法,目前我国城乡居民收支等调查,都是采用这种方式。

人口抽样调查会到家里查吗

竭诚为您提供优质文档/双击可除人口抽样调查会到家里查吗 篇一:20xx年全国1%人口抽样调查工作细则 20xx年全国1%人口抽样调查工作细则 20xx年7月 目录 1.20xx年全国1%人口抽样调查调查指导员、调查员借调、招 聘和培训工作细则 2.20xx年全国1%人口抽样调查抽样工作细则 3.20xx年全国1%人口抽样调查小区划分、地址编码和绘图工 作细则 4.20xx年全国1%人口抽样调查摸底工作细则 5.20xx年全国1%人口抽样调查登记工作细则 6.20xx年全国1%人口抽样调查编码工作细则 7.20xx年全国1%人口抽样调查各阶段质量控制工作细则 8.20xx年全国1%人口抽样调查事后质量抽查工作细则

9.20xx年全国1%人口抽样调查宣传工作细则 10.20xx年全国1%人口抽样调查资料开发工作细则 20xx年全国1%人口抽样调查 调查指导员、调查员借调、招聘和培训工作细则 一、根据《20xx年全国1%人口抽样调查方案》,制定本细则。 二、调查指导员和调查员的借调、招聘工作由县级1% 人口抽样调查领导机构负责。可以从党政机关、社会团体、企业事业单位借调,也可以从村民委员会、居民委员会或者社会招聘。 为保证调查质量,调查指导员和调查员应尽量由熟悉本地区情况的人员担任。 在调查任务完成以前,各单位不得随意调用调查指导员和调查员做调查以外的工作。 为更好地开展工作,调查指导员的借调、招聘工作应先于调查员进行。 三、每个调查小区至少配备一名调查员,每个被抽中的乡、镇、街道至少配备一名调查指导员。 四、调查指导员、调查员应具备以下条件: (一)身体健康,能胜任工作。 (二)具有初中以上文化水平,经培训能够使用手持电子终端设备(pda)。

2019年中考数学复习冲刺预测卷:抽样与数据分析(含答案)

数学精品复习资料 中考数学复习冲刺预测卷 抽样与数据分析 一、选择题 1. 为了解某小区居民的日用电情况,居住在该小区的一名同学随机抽查了15户家庭的日用 则关于这15户家庭的日用电量,下列说法错误..的是( ) A .众数是6度 B .平均数是6.8度 C .极差是5度 D .中位数是6度 2. 为了解初三学生的体育锻炼时间,小华调查了某班45名 同学一周参加体育锻炼的情况,并把它绘制成折线统计图(如图所示).那么关于该班45名同学一周参加体育.. 锻炼时间....的说法错误..的是( ) A .众数是9 B .中位数是9 C .平均数是9 D .锻炼时间不低于9小时的有14人 3. 一组数据3、2、1、2、2的众数,中位数,方差分别是( ) A .2,1,0.4 B .2,2,0.4 C .3,1,2 D .2,1,0.2 4. 一位经销商计划进一批“运动鞋”,他到眉山的一所学校里对初二的100名男生的鞋号进行了调查,经销商最感兴趣的是这组鞋号的( ) A .中位数 B .平均数 C .方差 D .众数 5. A .1.66 B .1.67 C .1.68 D .1.75 6. 已知一组数据2,1,x ,7,3,5,3,2的众数是2,则这组数据的中位数是( ) A .2 B .2.5 C .3 D .5 7. “只要人人都献出一点爱,世界将变成美好的人间”.在今年的慈善一日捐活动中,济南 市某中学八年级三班50名学生自发组 织献爱心捐款活动.班长将捐款情况进 行了统计,并绘制成了统计图.根据右图提供的信息,捐款金额..的众数和中位数分别是( ) A .20、20 B .30、20 C .30、30 D . 20、30 8. 对于数据:80,88,85,85,83,83, 84.下列说法中错误的有( ) 锻炼时间(小时) 金额(元) 20 30 50 100

中国人口受教育状况分析

中国人口受教育状况分析 作者:段成荣来源:孤独书斋 原载《人口研究》2006年第1期 「作者简介」段成荣,中国人民大学人口与发展研究中心北京:100872 2004年全国人口变动情况抽样调查收集了我国人口受教育状况的相关信息,根据这些信息,同时结合2000年全国人口普查的有关资料,本文对我国人口受教育状况进行了分析。结果表明,平均受教育年限继续提高,高等教育发展迅速,小学阶段义务教育达到了很高的普及率,文盲率持续下降。但是,我国城乡人口受教育程度仍存在明显差异,男女两性的受教育状况也还存在一定差异甚至在某些方面还存在比较明显的差异。 1受教育水平继续提高,6岁及以上人口平均受教育年限首次超过8年,劳动力人口的平均受教育水平接近初中毕业 近年来,我国人口平均受教育年限持续得到提高。2004年,6岁及以上人口平均受教育年限达到8.01年,比1990年提高了1.75年,比2000年提高了0.39年(见图1)。 劳动力人口的受教育水平也有所提高。16岁及以上人口平均受教育年限是反映劳动力人口受教育水平的常用指标之一。2004年人口变动抽样调查数据显示,全国16岁及以上人口平均受教育年限达到8.20年,接近初中毕业水平。 尽管我国人口的受教育水平不断得到提升,但是,男、女性受教育水平还存在一定差距。

6岁及以上人口平均受教育年限男性为8.5年,女性为7.5年,女性比男性低1年;16岁及以上人口平均受教育年限,男性高达8.8年,女性则为7.6年,女性比男性低1.2年。与此同时,城、乡之间在受教育程度方面的差异更为突出。2004年,我国6岁及以上人口平均受教育年限城镇为9.43年,乡村为7年,乡村比城镇低2.4年。不同地区之间的平均受教育年限也存在明显差距。东部地区平均受教育年限略高于中部地区,而西部地区则明显地低于东部和中部地区(见表1)。 东部地区包括北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东和海南等11个省(市);中部包括山西、吉林、黑龙江、安徽、江西、河南、湖北、湖南等8个省;西部包括内蒙古、广西、重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆等12个省(市、区)。下同。 资料来源:根据2004年人口变动情况抽样调查资料计算。 2文盲率已下降到较低水平,但文盲率下降还存在较大的不平衡性 近年来,我国文盲人口数量不断减少,文盲率持续下降。2004年,我国人口粗文盲率(15岁及15岁以上不识字或识字很少的人口占总人口的比重)降低到8.33%,较上年下降0.39个百分点,比1990年时的15.88%下降了7.55个百分点。自1990年以来的15年间,我国文盲率下降幅度达到50%(见表2)。 资料来源:根据人口普查、1%人口抽样调查和人口变动情况抽样调查资料计算。 在粗文盲率大幅度下降的同时,劳动力人口的文盲率下降幅度更大。我国15~45岁青壮年文盲率由1990年的10.38%大幅度减少到2004年的2.22%,下降了8.16个百分点(见表2),下降幅度接近80%。 但是,也要看到,我国文盲率的下降还不平衡。 文盲率下降的不平衡首先表现在男女两性的对比上。我国女性人口粗文盲率明显高于男

分层随机抽样(答案)

分层随机抽样 一、单选题 1、分层抽样设计效应满足(B ) A 、1deff = B 、1deff < C 、1deff ≈ D 、1deff > 2、分层抽样的特点是(A ) A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 3、下面的表达式中错误的是(D ) A 、 ∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 4、在给定费用下估计量的方差)(st y V 达到最小,或者对于给定的估计量方差V 使得总费用达到最小的样本量分配称为(C ) A 、常数分配 B 、比例分配 C 、最优分配 D 、奈曼分配 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随机抽样(srs V )的精度之间的关系式为(A ) A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、下面哪种样本量分配方式属于比例分配?( A) A 、 N n N n h h = B 、h L h h h h h h h c S N c S N n n ∑== 1 C 、 ∑==L h h h h h h S N S N n n 1 D 、 ∑==L h h h h h h S W S W n n 1 7、下面哪种样本量分配属于一般最优分配?( B) A 、N n N n h h = B 、h L h h h h h h h c S N c S N n n ∑== 1

201x届中考数学复习第八章统计与概率8.1抽样与数据分析练习

抽样与数据分析 命题点1 中位数、众数、平均数(8年4考) 命题解读:题型为选择题,分值为3分。主要考查中位数、众数、平均数的计算。考查形式为给出一组数据,或给出一个数据表,求其中位数、众数或平均数。 1.(xx·陕西中考)某校男子篮球队10名队员的身高(厘米)如下:179,182,170,174,188,172,180,195,185,182,则这组数据的中位数和众数分别是() A.181厘米,181厘米 B.182厘米,181厘米 C.180厘米,182厘米 D.181厘米,182厘米 2.(xx·陕西中考)我省某市五月份第二周连续七天的空气质量指数分别为:111,96,47,68,70,77,105,则这七天空气质量指数的平均数是() A.71.8 B.77 C.82 D.95.7 3.(xx·陕西中考)某中学举行歌咏比赛,以班为单位参赛,评委组的各位评委给九年级三班的演唱打分情况(满分100分)如下表,从中去掉一个最高分和一个最低分,则余下的分数的平均分是() A.92分 B.93分 C.94分 D.95分 4.(xx·陕西中考)某区10名学生参加市级汉字听写大赛,他们得分情况如下表: 那么这10名学生所得分数的平均数和众数分别是() A.85和82.5 B.85.5和85 C.85和85 D.85.5和80 拓展变式 1.某商场为了了解产品A的销售情况,在上个月的销售记录中,随机抽取了5天A产品的销售记录,其售价x(元/件)与对应销量y(件)的全部数据如下表: 则在这5天中,A产品平均每件的售价为() A.100元 B.95元 C.98元 D.97.5元 命题点2统计图的应用(8年8考) 命题解读:题型为解答题,分值为5分或7分。主要的考查形式为条形统计图与扇形统计图结合,考查学生的数据分析能力。 5.(xx·陕西中考)养成良好的早锻炼习惯,对学生的学习和生活都非常有益。某中学为了了解七年级学生的早锻炼情况,校政教处在七年级随机抽取了部分学生,并对这些学生通常情况下一天的早锻炼时间x(分)进行了调查。现把调查结果分成A,B,C,D四组,如下表;同时,将调查结果绘制成如图两幅不完整的统计图。

常见的随机抽样方法介绍

抽样方法介绍 朱一军 福建省产品质量检验研究院 、随机方法选择及随机数产生 按照GB/T 10111-2008《随机数的产生及其在产品质量抽 样检验中的应用程序》的要求,并根据受检单位的产品堆放形式、基数(批量)大 小,确定抽样方法(通常包括简单随机抽样、分层随机抽样、系统抽样、整群抽 样、全数抽样五种方法 )。 随机数一般可使用随机数表、骰子或扑克牌中任选一种方式产生。 (一)简单随机抽样 (抽签法、随机样数表法)常常用于总体个数较少时,它的主要特征是从总 体中逐个抽取; 优点:操作简便易行 缺点:总体过大不易实行 1.定义: 一般地,设一个总体含有N个个体,从中逐个不放回地抽取 n个个体作为样本(nW N ,如果每次抽取式总体内的各个个体被抽到的机会都相 等,就把这种抽样方法叫做简单随机抽样。 2.简单随机抽样方法 (1)抽签法 一般地,抽签法就是把总体中的N个个体编号,把号码写在 号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取 n次,就得到一个容量为n的样本。

抽签法简单易行,适用于总体中的个数不多时。当总体中 的个体数较多时,将总体“搅拌均匀”就比较困难,用抽签法产生的样本代表性差的可能性很大) 2)随机数法 随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。 二)分层抽样 Stratified Random Sampling) 主要特征分层按比例抽 样,主要使用于总体中的个体有明显差异。共同点:每个个体被抽到的概率都相等N/M。 定义 般地,在抽样时,将总体分成互不交叉的层,然后按照 定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 stratified sampling )。 三)系统抽样 当总体中的个体数较多时,采用简单随机抽样显得较为费事。这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。 步骤: 般地,假设要从容量为N 的总体中抽取容量为n 的样本, 我们可以按下列步骤进行系统抽样: (1)先将总体的N个个体编号。 (2)确定分段间隔k,对编号 进行分段。当N/n (n是样本

用EXCEL数据分析工具进行抽样

用EXCEL数据分析工具进行抽样 用EXCEL数据分析工具进行抽样有二种方法:第一种:举例:EXCEL表格中一列有3000多个数据,我想在这3000多个数据中随机抽取200个出来,3000多个都是文字的数据在一列里面,要随机抽取出200个出来要怎么做呢?而且要多次可以取随机的,就是200个随机数可以快捷的取多次……。 解答:数据设在a列公式c1 =rand() ,下拉至c3000 ,【c 列可隐藏起来】(有多少数据就下拉几个) 公式b1 =index(a:a,rank(c1,c:c)),下拉至b200 (抽几个就下拉几个) F9 即可多次抽取。第二种: 离如何在EXCEL进行抽样,主要利用EXCEL里的加载项“数据分析”进行介绍。如果你的EXCEL尚未安装数据分析,请依次选择“工具”-“加载宏”,在安装光盘的支持下加载“数据分析库”。加载成功后,可以在工具的下拉菜单中看到“数据分析”选项。2007则需要在“EXCEL选项”--“加载项”--“分析工具库”进行加载。 操作步骤: 1.

打存放需要抽样数据的EXCEL表格,本例采用手机号码进行介绍。 2. 选择“工具”—“数据分析”—“抽样”后,出现对话框,依次选择:输入区域:把原始总体数据放在此区域中,数据类型不限,数值型或者文本型均可; 抽样方法:有间隔和随机两种 间隔抽样需要输入周期间隔,输入区域中位于间隔点处的数值以及此后每一个间隔点处的数值将被复制到输出列中。当到达输入区域的末尾时,抽样将停止; 随机抽样是指直接输入样本数,电脑自行进行抽样,不用受间隔的规律限制。样本数:在此输入需要在输出列中显示需要随机抽取总体中数据的个数。每个数值是从输入区域中的

分层随机抽样及其excel分析

课程设计任务书

案例:某公司要估计某地家用电器的潜在用户。这种商品的消费同居民收入水平相关,因而以家庭年收入为分层基础。假定某地居民为1,000,000户,已确定样本数为1,000户,家庭年收入分10,000元以下,10,000——30,000元;30,000——60,000元,60,000元以上四层,其中收入在10,000元以下家庭户为180,000户,收入在10,000——30,000元家庭户为350,000户,收入在30,000——60,000元家庭户为3000,000户,收入在60,000元以下家庭户为170,000户,若采取分层比例抽样法,如何抽样? 下面针对案例对分层随机抽样进行大致说明。 一.分层随机抽样定义: 分层抽样也称类型抽样或分类抽样,就是将总体单位按一定标准(调研对象的属性、特征等)分组,然后在各个类型组中用纯随机抽样方式或其他抽样方式抽取样本单位,而不是在总体中直接抽取样本单位。 二.注意事项: 分层抽样必须注意以下问题:第一,必须有清楚的分层界限,在划分时不致发生混淆;第二,必须知道各层中的单位数目和比例;第三,分层的数目不宜太多,否则将失去分层的特征,不便在每层中抽样。 三.分层抽样步骤: 分层抽样的步骤包括: (1)确认目标总体。 (2)决定样本数。 (3)决定分层标志。 (4)将总体按照分层标志分成若干类,其中每一类称为一层。 (5)在每一层中随机抽取出足够的样本。 四.具体做法及例子说明: 分层抽样的具体做法有以下两种: 1.等比例分层抽样。这种抽样法就是按照各层中样本单位的数目占总体单位数目的比例分配各层的样本数量。 [例]某教授对甲大学的学生消费倾向产生了兴趣,想对全校学生做抽样调查,总体有5 000人,欲抽样500人,则: 总体样本 一年级 2 000人一年级200人 二年级 1 500人二年级150人 三年级 1 000人三年级100人 四年级500人四年级50人 2.不等比例分层抽样,又称分层最佳抽样。这种抽样法不按各层中样本单位数占总体单位数的比例分配各层样本数,而是根据各层的标准差的大小来调整各层样本数目。该方法既考虑了各层在总体中所占比重的大小,又考虑了各层标准差的差异程度,有利于降低各层的差异,以提高样本的可信程度,故也可将不等比例分层抽样称为分层信任程度抽样。[例]某公司要调研某地家用电器产品的潜在用户,这种产品的消费同居民收入水平有关,因

分层随机抽样的SAS实现

分层随机抽样的SAS实现 摘要:本文首先分别就抽样和分层随机抽样进行了简单介绍,然后利用SAS 宏指令和函数给出了分层抽样的SAS实现程序并简要阐述了决定系数的使用方法。 抽样方法(Sampling Method)是按照一定程序,从所研究对象的全体(母体)中抽取一部份(样本)进行调查或观查,并在一定的条件下,运用数理统计的原理和方法,对母体的数量特征进行估计和推断。 抽样方法可分为随机抽样(亦称为机率抽样Probability Sampling)和非随机抽样(亦称为非机率抽样Non-Probability Sampling)两大类,这两类的抽样方法都被经常地使用。随机抽样是指按照机率原则,从母体中抽取一定数目的单位元作为样本进行观察,随机抽样使母体中每个单位都有一定的机率被选入样本,从而使根据样本所做出的结论对母体具有充分的代表性。非随机抽样则是以方便为出发点或根据研究者主观的判断来抽取样本。非随机抽样主要依赖研究者个人的经验和判断,它无法估计和控制抽样误差(sampling error),亦无法用样本的量化数据来推断母体。 在所有抽样方法中,属分层抽样(Stratified Sampling)法所应用的范围最广与最多。它是先将母体所有单位按某些重要因素进行分类(层),然后在各类(层)中采用简单随机抽样(simple random sampling)或系统抽样(system sampling)方式抽取样本单位。分层抽样比简单随机抽样和系统抽样更为精确,能够通过对较少的抽样单位的调查,得到比较准确的推断结果,特别是当母体较大、内部结构复杂时,分层抽样常能取得令人满意的效果。同时,分层抽样在对母体推断的同时,还能获得对每层的推论。 分层抽样的方式,一般有等比例抽样与非等比例抽样。等比例抽样,要求各类样本单位数的分配比例与母体单位在各类的分配比例一致。等比例抽样简便易行且分配比较合理,在实际工作中应用较广。非等比例抽样,不受上述条件限制,即有的层可多抽些样本单位,有的层也可少抽些样本单位。非等比例抽样大多适用于各层的单位数相差悬殊,或层内变异数相差较大的情形。在这种情况下,如按等比例抽样,可能在母体单位数少的层中抽取样本单位数过少,代表性不足,则可适当放宽多抽;同样,层内变异触较大的,也可多抽些样本单位。但是在实际运作前要准确了解各层标志变异程度大小是比较困难的。 可将本文中母体视为一个庞大的数据库,而所做的抽样工作即是在这数据库中抽取具有代表性的样本点。 在设计抽样方法的过程中,最具有关键性的角色即是选择何种抽样方法。抽样设计的方法有很多种,一般较常用的就属分层随机抽样法。在统计推论时,即是由样本数据对母体进行推估,如何找出抽样比也是一个相当重要的问题。 本文运用SAS宏指令及一些函数,编写了一个抽样程序,并简要阐述了决定系数的使用方法。 SAS Macro程序 A. 仿真产生1000笔数据

相关主题
文本预览
相关文档 最新文档