抽样调查
- 格式:doc
- 大小:384.00 KB
- 文档页数:12
抽样调查报告12篇抽样调查报告1为了解我市近期建筑节能设计选用的节能技术(产品)情况,由市墙材革新与建筑节能办公室对我市____年民用建筑节能设计资料进行抽样调查、统计分析,形成以下报告。
一、抽样调查情况本次调查对象为我市____年民用建筑节能设计审查备案表,共抽样280项工程,其中公共建筑59项,居住建筑221项。
涉及到的建设单位有64家,设计院38家。
本次调查内容主要是在民用建筑中采用的各项建筑节能技术(产品)情况。
(一)外墙节能设计在外墙节能设计方面,目前使用的主要墙材是加气混凝土砌块,占85.7%,其次是烧结粉煤灰砖、蒸压泡沫粉混凝土砖和灰砂砖。
外墙使用灰砂砖的比例为1.8%,比____年抽查统计数据下降78%。
采取保温隔热措施的比例为31.4%,比____年抽查统计数据增长32.5%,其中外墙外保温做法占77.3%。
使用的保温隔热材料主要是聚苯颗粒保温砂浆,占60.2%,其次是普通砂浆,占13.6%。
其中,居住建筑中采用加气混凝土砌块的比例为86.9%;加气混凝土砌块+聚苯颗粒保温砂浆(外保温)的比例为14.9%;公共建筑中采用加气混凝土砌块的比例为81.4%,加气混凝土砌块+聚苯颗粒保温砂浆(外保温)的比例为15.3%。
外墙采用的墙材和保温隔热材料情况见表1、表2:表1外墙采用的墙材外墙采用的墙材抽样调查报告2国家统计局继首次开展全国群众安全感调查之后,已于11月份组织开展了第二次全国群众安全感抽样调查工作。
现将本次抽样调查的主要数据公布如下:一、被调查者的基本情况本次共抽取全国31个省、自治区、直辖市年满16周岁以上的101988人进行了问卷调查。
在被调查者中,男性59760人,占被调查人员总数的58.6%;女性42228人,占41.4%。
从被调查者的年龄来看,16岁至17岁的2192人,占2.1%;18岁至25岁的10396人,占10.2%;26岁至34岁的23674人,占23.2%;35岁至49岁的38407人,占37.7%;50岁至59岁的13694人,占13.4%;60岁以上的13625人,占13.4%。
一、抽样调查是什么?抽样调查是,一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。
显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。
二、抽样调查有什么特点?1、按随机原则抽选样本;2、总体中每一个单位都有一定的概率被抽中;3、可以用一定的概率来保证将误差控制在规定的范围之内。
三、具体的抽样调查方法有哪些?1、简单随机抽样简单随机抽样也称为单纯随机抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
简单随机抽样一般可采用掷硬币、掷骰子、抽签、查随机数表等办法抽取样本。
在统计调查中,由于总体单位较多,前三种方法较少采用,主要运用后一种方法。
按照样本抽选时每个单位是否允许被重复抽中,简单随机抽样可分为重复抽样和不重复抽样两种。
在抽样调查中,特别是社会经济的抽样调查中,简单随机抽样一般是指不重复抽样。
简单随机抽样是其它抽样方法的基础,因为它在理论上最容易处理,而且当总体单位数N不太大时,实施起来并不困难。
但在实际中,若N相当大时,简单随机抽样就不是很容易办到的。
首先它要求有一个包含全部N个单位的抽样框;其次用这种抽样得到的样本单位较为分散,调查不容易实施。
因此,在实际中直接采用简单随机抽样的并不多。
2、分层抽样分层抽样又称为分类抽样、或类型抽样,它首先是将总体的N 个单位分成互不交叉、互不重复的k个部分,我们称之为层;然后在每个层内分别抽选n1、n2、...... nk个样本,构成一个容量为个样本的一种抽样方式。
分层的作用主要有三:一是为了工作的方便和研究目的的需要;二是为了提高抽样的精度;三是为了在一定精度的要求下,减少样本的单位数以节约调查费用。
因此,分层抽样是应用上最为普遍的抽样技术之一。
按照各层之间的抽样比是否相同,分层抽样可分为等比例分层抽样与非等比例分层抽样两种。
第六章抽样调查第一节抽样调查的意义及全然概念一、抽样调查的意义抽样调查(随机抽样):按照随机原那么从总体中抽取一局部单位进行瞧瞧,并运用数理统计的原理,以被抽取的那局部单位的数量特征为代表,对总体作出数量上的推断分析。
二、抽样调查的适用范围抽样调查方法是市场经济国家在调查方法上的必定选择,和普查相比,它具有正确度高、本钞票低、速度快、应用面广等优点。
一般适用于以下范围:1.实际工作不可能进行全面调查瞧瞧,而又需要了解其全面资料的事物;2.虽可进行全面调查瞧瞧,但比立困难或并不必要;3.对普查或全面调查统计资料的质量进行检查和修正;4.抽样方法适用于对大量现象的瞧瞧,即组成事物总体的单位数量较多的情况;5.利用抽样推断的方法,能够关于某种总体的假设进行检验,判定这种假设的真伪,以决定取舍。
三、抽样调查的全然概念(一)全及总体和抽样总体(总体和样本)全及总体:所要调查瞧瞧的全部事物。
总体单位数用N表示。
抽样总体:抽取出来调查瞧瞧的单位。
抽样总体的单位数用n表示。
n≥30大样本n<30小样本(二)全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。
抽样指标:抽样总体的那些指标。
第二节抽样调查的组织形式通常有以下四种组织形式:一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。
随机抽选可有各种不同的具体做法,如:1.直截了当抽选法;2.抽签法;3.随机数码表法;二、类型抽样(分类抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原那么抽取样本,组成一个总的样本。
类型的划分:一是必须有清楚的划类界限;二是必须明白各类中的单位数目和比例;三是分类型的数目不宜太多。
类型抽样的好处是:样本代表性高、抽样误差小、抽样调查本钞票较低。
要是抽样误差的要求相同的话那么抽样数目能够减少。
两种类型:1.等比例类型抽样(类型比例抽样);2.不等比例类型抽样(类型适宜抽样)。
抽样调查的名词解释抽样调查是社会科学研究中常见的一种数据收集方法。
它通过从研究对象中选取一部分样本进行调查,然后对样本数据进行分析和总结,以推断出整个群体的特征和规律。
抽样调查的目的是为了在有限的资源和时间条件下,获取全面和真实的信息。
对于社会研究、市场调查、舆情分析等领域来说,抽样调查是一种重要的工具,有助于揭示现象背后的原因和关联。
1. 抽样方法的选择抽样方法是抽样调查中的关键环节。
它决定了样本的代表性和可靠性。
常用的抽样方法包括简单随机抽样、系统抽样、分层抽样、整群抽样等。
简单随机抽样是一种基本的抽样方法,通过将研究对象列入抽签或抽号,随机选取样本。
系统抽样是按照一定规则,如每隔一定间隔选取一个样本。
分层抽样是将研究对象按照某种特征分组,再从每个组中随机选取样本。
整群抽样是将群体划分为若干个群组,然后从中随机选取部分群组进行调查。
2. 抽样误差的控制抽样误差是指样本数据与目标总体的真实情况之间的差异。
在抽样调查中,如果样本容量足够大,且抽样方法随机且代表性好,那么抽样误差会相对较小。
然而,由于资源、时间等限制,完全消除抽样误差是不可能的。
因此,研究者需要在控制误差和成本之间进行权衡。
常见的控制抽样误差的方法有增加样本规模、选择更适合的抽样方法、提高调查问卷的设计质量等。
3. 抽样调查的优缺点抽样调查相比于全面调查的主要优点在于节约资源、时间和人力成本。
通过对样本数据的分析,可以推断出整个群体的特征和情况。
而全面调查则需要对整个群体进行调查,成本和时间消耗较大。
然而,抽样调查也存在一定的局限性。
一是抽样误差无法完全避免,样本在一定程度上无法代表整个群体。
二是调查结果受到调查问卷设计、调查方式以及受访者个人主观因素等的影响。
因此,在抽样调查中应注意合理选择抽样方法,确保样本的代表性和可靠性。
4. 抽样调查在实际应用中的案例抽样调查在实际应用中有广泛的应用。
例如,在市场调查中,通过对样本消费者的需求和偏好进行分析,可以为企业的产品开发和营销策略提供决策依据。
第七章抽样调查一、抽样原理1、定义抽样调查是按照随机原则从被研究对象的总体中(全部研究对象)抽取一部分单位进行调查观察,并运用数理统计的原理,以调查所得的指标(实际观察数值)来推断被研究总体的相应指标达到对总体的认识。
简言之,抽样调查就是从总体中抽取一定数量的样本来推断总体的情况。
2、抽样调查的特点⑴随机原则。
所谓随机原则,就是说在我们所研究的总体中,每一个个案都有被选中、抽取的机会。
也即我们在总体中抽样时,哪一个个案能被抽取,哪一个个案不能被抽取,不是人为主观决定的,而完全是偶然碰机会的。
⑵从数量上推算全体。
抽样调查是抽取部分个案进行调查,但它的主要目的不是为了了解这部分单位本身,而是为了据此从数量上推算全体。
⑶抽样调查使我们有可能用更少的人力、物力、时间、费用达到对总体的认识,而且可以起到丢普查资料进行修正补充,提高大范围调查的准确程度的作用,因而在理论上和方法上都具有重要的意义。
3、几个概念⑴总体也称为母体、一般总体等。
是指具有某种统计特征的一类事物的全部个案。
也即,研究对象的全体称为总体。
例如,某批产品、某类病人、某个生产过程等。
总体的单位数通常用符号N来表示。
⑵个体也称为个案、元素。
组成总体的每个元素称为个体。
有时也称具有某种统计特征的每一个对象为个案构成一个总体的个案,可以是人或物,也可以指个性、心理反应等。
⑶样本也称为抽样总体、样本总体等从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。
也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。
总体是大群体,样本是小群体。
在社会研究中,资料的收集工作往往是在样本中完成的。
样本的单位数(即样本容量)常用符号n来表示。
⑷抽样从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽样样本的过程。
(5)抽样单位就是一次直接的抽样所使用的基本单位。
名词解释抽样调查抽样调查是指在整体人口或样本的基础上,通过统计方法和技术手段,采用一定的抽样方法选取一部分个体进行研究,以获取其特定信息、观点或意见的一种调查方法。
抽样调查是社会科学研究中常用的数据收集方式,通过分析抽样数据可以得到关于总体的推断性结论,具有较高的效率和可靠性。
抽样调查的主要目的是通过选取样本来代表总体,并通过研究样本数据来了解和推断总体状况。
抽样调查可以广泛应用于各个领域,包括社会学、经济学、教育学、医学等。
在具体实施抽样调查时,需要确定以下几个重要要素:1. 总体:是指研究对象的全部个体或现象。
例如,如果研究全国大学生对某一政策的态度,则总体是所有全国大学生。
2. 样本:是指从总体中选取的部分个体的集合。
样本应具有代表性,即反映总体的重要特征。
样本的大小应根据总体大小和调查目的确定,通常采用随机抽样或分层抽样等方法来选取样本。
3. 抽样方法:是指在决定样本的过程中所使用的方法。
常见的抽样方法包括随机抽样、整群抽样、分层抽样等。
不同的抽样方法适用于不同的研究场景,可以提高数据的可靠性和有效性。
4. 数据收集:是指通过设计问卷、面访、电话调查等方式获取样本个体的信息。
数据收集应当遵守一定的科学原则,确保数据的准确性和可比性。
5. 数据分析:是指对收集到的数据进行整理、统计和分析的过程。
通常使用统计学方法,如描述性统计分析、推断性统计分析等,从样本数据中推断出总体特征和总体参数。
抽样调查的优点在于降低调查成本和时间,提高效率和可靠性。
同时,抽样调查也存在一些限制和偏差,例如样本选择偏差、非回应偏执、抽样误差等。
因此,在进行抽样调查时,需要注意样本选取的科学性和合理性,以及数据分析的方法和技巧,以获取准确可靠的研究结果。
抽样调查填空题:1.若样本统计量w的期望和方差分别为E(w)和var(w),那么以样本统计量w 估计总体的数字特征W,有偏量B(w)=E(w)-W;均方偏差MSE(w)=E(w-W)2;且偏量、统计量w的方差与均方偏差三者之间的关系为:MSE(w)= var(w)+[B(w)]2.2.在概率抽样调查中,有简单随机抽样、不等概抽样、分层抽样、多阶抽样、系统抽样、多相抽样等基本的抽样方法。
3.抽样框:又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。
设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。
若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。
抽样框除包含有抽样单位的编号及抽样单位与总体、个体单位的联系外,还应包含一些有用的辅助信息。
这些辅助吸血可用于抽样方案的设计和数据处理,有益于提高调查的质量。
4.抽样方案的设计要求:利用抽样框的辅助信息,综合各种基本的概率抽样方法来制定一个可行的、精度满足要求而且费用最省的抽样方法。
5.一个完整的抽样策略由抽样方法应配合有一个相适应的估计结合在一起组成。
6. 总体采用简单随机抽样时,对总体目标量的均值或总数,可以有多种估计方法。
在没有辅助信息是,可以采用简单估值法,以样本的均值估计总体的均值;当有适宜的辅助信息利用时,可以采用比估计和回归估计。
7.二相抽样是对总体进行一次以上的抽样。
第一次抽样的样本单元并不是调查所需的目标量,而是调查一些可通过较小的工作量快速获得辅助信息;第二次抽样则是在获得辅助信息的基础上,再作一个样本量较小的调查,调查所需的目标量。
8.分层随机抽样适用于总体单位数量较多、内部差异较大的调查对象。
在分层时,要使层内的个体单元有较好的同一性,层间的差异较大。
9.多阶段抽样与整群抽样都是将总体分成若干小的群体,这些小的群体为第一性抽样单元。
再对抽中的第一性抽样单元抽样,其中的个体为第二性抽样单元。
10.有放回不等概抽样是每个单元入样概率正比于规模测度的抽样方法;实施无放回不等概抽样的方法主要有:布鲁尔法和德宾法。
定义:即抽取概率。
计算题:1.假设总体容量为N=6,其标志值分别为1,2,3,5,6,7.若分为两个群(1,2,3)和(5,6,7),计算群内相关系数。
求出的群内相关系数能说明什么问题。
又若分为(1,5,7)和(2,3,6), 计算群内相关系数。
求出的群内相关系数又能说明什么问题。
2.给定一个包含25个单元的目标为总体,先排成5行5列的形式,每行每列均包含5个单元,单元排列先按列排列,考虑n=k=5的系统抽样,以行为群组成系统样本,而以列为层。
若按从小到大的顺序排列,比较该系统抽样,简单抽样,及分层抽样的效率。
1 2 3 4 5 1 12 26 29 36 44 2 18 28 29 36 46 3 19 28 30 39 48 4 24 28 33 39 50 52529344052解:依题意可知:分为以下两种情况讨论。
i)以行为群,组成系统抽样。
此时25N =,5o K N ==。
根据公式:11Ki ij j Y Y K•==∑ , ()22111K i i ij j S Y Y K ••==--∑有: 表c12345i Y •2i S •1 12 26 29 36 44 29.40 142.8 2 18 28 29 36 46 31.40 107.83 19 28 30 39 48 32.80 122.74 24 28 33 39 50 34.80 103.7 52529344052 36.00 111.5_1132.88K i i Y Y K •===∑2211=117.7K i i S S K•==∑内()2211 6.9321Ki i S Y Y K •==-=-∑外()()0022211103.8611N K K N S S S N N --=+=--外内所以:()02211 1.62281sy K N N V Y S S N N ∧-⎛⎫-=-= ⎪-⎝⎭内201116.6176V Y S N N ∧⎛⎫⎛⎫=-= ⎪ ⎪⎝⎭⎝⎭由上述可知:sy V Y V Y ∧∧⎛⎫⎛⎫< ⎪ ⎪⎝⎭⎝⎭3.某县农村共有14个乡509个村,在实现小康的过程中欲计算该县农村的恩格尔系数(居民的食品支出占总指出的比例)。
首先要调查全县的食品总支出,现采用了二阶段抽样,第一阶段先在14个乡中,按村的的数目多少进行了PPS 抽样,共抽取5个乡,第二阶段在抽取的乡中随机地抽取6个村做调查,然后对抽中的村做全面调查,取得数据如下:样本乡序号 k 村数 i N样本村数 in样本村平均食品支出(万元) 1 19 6 48 2 41 6 175 3 72 6 108 4 54 6 90 5366100要估计全县的食品支出总金额及估计的标准差。
问题分析:此题为第一阶段是以14个乡中所含村的个数为规模测度的PPS 抽样,第二阶段是取等额的简单随机抽样的二阶抽样。
故^11k iPPS i i iN G y k P ==∑(*) 由题意可知:总村数N=509,样本乡数k=5,第i 个样本乡的入样概率ii N P N=,抽取的样本总村数n=30,第二阶段为取等额的简单随机抽样故/1n kij i j k y y n ==∑其中ij y 表示第i 个样本乡中第j 个样本村的食品支出总额。
解:^11k i PPS i i iN G y k P ==∑ 将iiN P N =代入后得 111k ki i ii i i N Ny yk N N k====∑∑【①】代入数据可得估计值为:()^509481751089010053037.85PPS G =++++=(万元)均方偏差的无偏估计量:2^^11(1)ki PPS PPS i i i N v G y G k k P =⎛⎫⎛⎫=- ⎪ ⎪-⎝⎭⎝⎭∑ 将【①】式与iiN P N =代入左式得()22^1(1)k PPS i i N v G y y k k =⎛⎫=- ⎪-⎝⎭∑ 【②】 其中__11k i i y y k ==∑ 再代入数据^PPS v G ⎛⎫ ⎪⎝⎭=1088776199.4(万元)故标准差为:^^()()PPS PPS s G v G =(万元)注意:其中公式【①】与公式【②】的运用是在第一阶段是正比于子总体规模的PPS 抽样,第二阶段是取等额的简单随机抽样的二阶抽样的前提条件下才能进行的。
4.若假设已知该县有380千人,并有各个乡的人口资料,则第一阶段按与乡的人口多少成比例地抽样,也抽取5个乡。
第二阶段用简单随机抽样抽取6个村得数据如下表,再估计全县的食品支出总金及估计的标准差。
样本乡序号 人口数村数样本村平均食品支出k X iN i(万元) 1 24 30 96 2 50 41 175 3 38 35 167 4 60 48 188 53039130问题分析:此题与前一题的差别不大,抽样方法都是第一阶段是PPS 抽样,第二阶段是取等额的简单随机抽样的二阶抽样。
唯一不同的是两者的规模测度不同,此题是按与乡的人口数为规模测度的PPS 抽样。
故此题中ii X P X =,其中X 为该县的总人数,i X 为抽中样本乡的总人数。
没有与子总体的i N 成正比,不能用直接公式【①】与公式【②】解:^1111155991k k ki i iPPS i i i i i i i i iN N N X G y y y k P k X X kX ======≈∑∑∑(万元) 2^^119261315.8(1)ki PPS PPS i i i N v G y G k k P =⎛⎫⎛⎫=-≈ ⎪ ⎪-⎝⎭⎝⎭∑(万元) 标准差为:^^()()PPSPPSs v GG=(万元)注意:两题抽样方法的选择虽然相同,但PPS 抽样中的规模测度选择不同导致估计的效率不同,从而影响到估计的准确度。
ii N/i i w N N =yi s i n5.某市进行家庭收入调查,分城镇居民与农村居民两部分抽样,在全部城镇23560户中抽取300户,在全部农村148420户中抽取250户(均按简单随机抽样进行),调查结果是城镇平均年收入标准差为3000元,农村年平均户收入标准差为2000元. 且对城镇居民与农村居民抽样平均每户费用比为1:2. 给出城镇与农村两层比列分配与最优分配的样本量的分配。
解:已知总体总量 171980()N =户, 城镇居民总量123560()N =户, 农村居民总量2N =148420(户),, 总样本容量 n=550, 城镇占总体比例11N =0.137NW =,农村占总体比例22N W ==0.863N, 费用比12C 1=C 2。
1. 按比例分配:城镇样本量:11*0.137*55075()n W n ===户 农村样本量:22W *0.863*550475()n n ===户2. 考虑费用前提下的最优分配由定理4.3.2知i ii in k c = k 为待求得比例系数又因为:i i i i n n k c ==∑ 则 /()i i ik n c = *(/i i i i i i in n c c = 2111110.137*30000.137*30000.863*2500/)550*/()117()112i i i in n c c ===+=户 21433()n n n =-=户1 (城镇) 23560 0.137 15180 3972 300 2(农村) 148240 0.863 9856 2546 250 合计 171980(若不考虑费用)(奈曼最优分配): 由定理4.3.1知 i n n =∑ 固定 有1*i ii kjjj W S n n W S==∑考虑本题有21*i ii jjj W S n n W S==∑10.137*3000550*88()0.137*30000.863*2500n ==+户21432()n n n =-=户6. 三种样本量估算的比较条件n 值(样本量) 简化公式按绝对精度 │y Y -│≤d221/22221/2(u )n=1(u )NS d S αα--+221/22(u )n S d α-≈按相对精度 │y Y Y-│≤h. 221/22221/2(u )n=1(u )C h C Nαα--+221/22(u )n=C h α-考虑费用2011(1)nF F F n a S n N=++-21aS n F =注:1/2uα-是N(0,1)分布的12α-分位数,2S 是总体方差,d 是绝对精度, N :总体种抽样单位的数额,/C S Y=为变异系数,0F 是调查的基本费用,1F 是每调查一个样本单元所需费用,a 是常数。