抽样调查理论及方法[1]
- 格式:pdf
- 大小:133.61 KB
- 文档页数:7
抽样调查的基本概念与理论依据(一)
抽样调查是一种常见的社会调研方法,其基本概念和理论依据是有必要进行了解的。
一、抽样调查的基本概念
抽样调查是指通过抽取代表性样本,对个体或群体的某些特定情况或认识进行调查。
这种调查方法与全面调查相比,具有省时、省力、精确度高等优点。
抽样调查的过程包括样本的抽取、样本的调查和结果的分析三个步骤。
二、抽样调查的理论依据
1.概率论基础:抽样调查的理论依据是概率论的基础。
从一个总体中随机选出样本,对这些样本进行统计分析,得到的结果可以反映整个总体的情况。
抽样调查中,概率论相关的知识可用于计算样本的大小和推断总体的参数,从而提高样本调查的准确性。
2.中心极限定理:中心极限定理是抽样调查的另一个理论依据。
它表明,当样本容量较大时,样本平均数的分布会趋近于正态分布。
这一定理对于估计总体参数和确定置信区间等都有重要的应用价值。
3.抽样误差:抽样误差也是抽样调查的理论基础之一。
它指的是样本调查结果与总体实际情况之间的偏差,通常来说,样本容量越大,抽样误差越小。
了解抽样误差的概念和大小,有助于对抽样结果的解释和推理。
4.信度和效度:信度和效度也是抽样调查中重要的理论概念。
信度指
的是对同样问题的几次调查结果之间的一致性,而效度指的是调查结
果是否能够有效地反映目标问题的本质。
保证调查工具的信度和效度,对于可靠的抽样调查结果至关重要。
总之,抽样调查的基本概念和理论依据涵盖了概率论、中心极限定理
和抽样误差等内容。
这些理论基础的应用使得抽样调查在定量研究中
发挥着不可替代的作用。
抽样理论与抽样误差的计算与分析在统计学中,抽样理论是研究如何从总体中选取样本,并利用样本数据对总体进行推断和估计的理论基础。
而抽样误差则是通过样本数据所做出的估计与总体真值之间的差异。
本文将就抽样理论与抽样误差的计算与分析展开讨论。
一、抽样理论1. 简单随机抽样:简单随机抽样是从总体中以等概率抽取样本,每个个体被选中的概率相等。
根据抽样理论,简单随机抽样是保证样本能够代表总体的有效方法。
2. 系统抽样:系统抽样是在总体中随机选取一个起始点,然后以固定间隔选择样本。
系统抽样常用于总体有序排列的情况,比如按时间顺序排列的数据。
3. 分层抽样:分层抽样是将总体划分为若干层,然后从每一层中独立地抽取样本。
这种抽样方法可以确保每个层次的样本数量足够,能够更好地反映总体特征。
4. 整群抽样:整群抽样是将总体划分为若干群,然后随机地选取部分群体作为样本。
这种抽样方法适用于总体结构简单明确而群体内部差异较大的情况。
二、抽样误差的计算与分析抽样误差是通过样本数据所做出的估计与总体真值之间的差异。
在进行抽样调查时,我们通常通过抽样误差来评估样本数据对总体的代表性和精确性。
1. 抽样误差的计算方法:(1)标准误差(Standard Error):标准误差是衡量样本估计值与总体参数的差异程度,常用于对平均值、比例和总量等进行估计。
(2)置信区间(Confidence Interval):置信区间是通过样本数据对总体参数进行估计,并给出一个范围,在一定的置信水平下,总体参数落在该范围内的概率较高。
2. 抽样误差的影响因素:(1)样本量(Sample Size):样本量的增加可以减小抽样误差,提高估计值的精确性。
(2)总体大小(Population Size):当总体大小较大时,抽样误差会减小;反之,总体大小较小时,抽样误差会增大。
(3)总体分布(Population Distribution):总体分布的偏斜程度越大,抽样误差越大。
抽样调查理论及方法200834 11:53:33 来源:不详一、抽样调查(Sampling Survey)意义抽样调查为科学研究方法中重要技术之一,是指就所要研究的某特定现象之母群体中, 依随机原理抽取一部份作为样本(Sample),以为研究母群体(Population)之依据。
将样 本研究结果,在抽样信赖水准内,推算母群体可能特性以为决策之参考。
抽样调查之优点:1.利用抽样技术及机率理论,可获得既定精确估计值,以代表母群体特征。
2.节省调查人力,物力,时间及经费。
3.经由少数优秀人员施予特殊训练及配合特殊设备,施行调查,可得较深入且正确调 查结果。
故在实地市场调查中,抽样调查为一不可或者之工具。
抽样调查基本目的乃在信息之搜集作成结论, 以供决策参考。
有效抽样调查应具有准则 有下:1.有效原则抽样调查应该(1)符合调查目的之需要,(2)所获信息价值应超过所支付成本。
2.可测量原则抽样的正确程度必须能够测量,否则抽样调查就失去意义。
3.简单原则抽样调查必须保持简单性要求。
俾使抽样调查顺利进行,以避免不必要之节外生枝。
二、抽样调查的基本术语1 母群体(Population)在调查研究中,调查研究对象的集合体。
调查台北市中学生,则在台北市上课之54所 中学生总数,便是调查研究之母群体。
2 抽样架构(Sampling frame)整体抽样单位的详细名单,以供抽样之用。
例如以台北市医师为抽样单位,则台北市医 师公会名册,便是抽样架构。
如果以学校班级为抽样单位,则学校60班班级名册便是抽样 构架。
抽样架构有三种型态:具体的抽样架构:每一个抽样单位名字皆列成表册,可以直接按表册名字抽取样本。
抽象的抽样架构:没有抽样单位之名册,只要符合调查之条件就有被抽样之可能。
例如 在百货公司举行消费者抽样,随然没有抽样名册,但是抽样架构却冥冥中隐约出现。
阶段式抽样架构:在采用分段抽样中,依抽样阶段之不同,产生不同之抽样架构。
3 抽样单位(Sampling unit)在抽样架构上排列的名单之个别单位。
例如台北市每一医师即为一抽样单位。
在上例中, 每一班级都是抽样单位。
4 元素 ( Element )指接受调查的最小单位,通常是指人。
上例中,班上每一位学生既为元素。
5 样本(Sample)从抽样架构中抽出取来的抽样单位总和。
例如百事可乐抽出350家庭做测试称为样 本。
从台北市医师公会抽出90名医生作调查,称为样本。
6 精确度(Precision)与 准确度(Validity)精确度乃用以衡量估计值精确可依赖的程度, 如在物价统计中,经济家若认为物价如上 升0.02将影向经济决策,则精确度即须订在0.02。
准确度乃衡量母全体特性与实际母全体特性间之差异。
两者之差异愈小, 代表准确度愈 高。
7 抽样误差(Sampling error)因为抽样时样本可能会偏离母群体, 其间的差距称为抽样误差。
抽样误差可用统计方法 估计。
8 信赖水准(Confidence level)以样本估计数推论母群体大小时,正确估计的概率有多少。
信赖水准是95﹪,即正确 估计概率为95%,调查者以此来表示其正确估计程度。
9 容忍误差(Tolerated erro)在抽样调查时,调查者所要求的精确度不是百分之百,而是在设定母群体平均数上下各 多少百分点作为误差容忍范围,称为容忍误差。
三、抽样方法种类及其意义抽样方法可分为两大类:1.随机抽样(Probability-Sampling),即在抽样时,母群体中每一个抽样单位被选为 样本之机率相同。
随机抽样具有健全之统计理论基础,可用机率理论加以解释,是一种客观 而科学的抽样方法,在市场调查中通常都用随机抽样。
2.非随时抽样(Non-Probabity-Sampling),在抽样时,抽样单位被选为样本之机率为 不可知。
非机率抽样之种类,主要有四种:(1).便利抽样(Convenience Sampling)在样本之选择只考虑到接近样本或衡量便利。
如访问过路行人即为一例。
(2).配额抽样(Quota Sampling)a选择「控制特征」,作为将母体细分类之标准。
b将母体细分为几个子母体,按比较分配各子母体样本数大小。
c访查员有极大自由去选择子母体中之样本个体,只要完成配额调查,即告完成。
此一方法因调查偏好及方便,丧失精确度。
抽样配额分配表,此配额由访问员选定,不做任何修正。
(3).判断抽样(Judgement Sampling)在母体之构体极不相同且样本数很小之时,根据抽样设计者之判断来选择样本个体,设 计者必须对母体有关特征具有相当了解。
在编制物价指数时,有关产品项目选择及样本地区 之决定,即采用判断抽样。
(4).雪球抽样(Snowball Sampling)利用随机方法或社会调查选出原始受访者。
再根据原始受访者提供信息去取得其它受访 者。
本法之目的乃母体很难寻找或十分稀少。
例如单亲家庭计抽样属之。
随机抽样之种类有:1.简单随机抽样(Simple random Sampling)母体中全部个体, 完全委诸均匀机率分布抽取样本,使每一个体被抽出之机率均为己知 且相等。
简单随机抽样为其它各种随机抽样方法之基础。
简单随机抽样法样本之取得,对母体编号后以利用随机数表依机率抽取。
假定由2000名调查对象,以随机数表随机抽取150名样本,其抽样步骤如下: (1)将2000名调查对象,由0001编至2000等2000个连续编号。
(2)由随机数表,利用抽签方法选取号码开始点。
例如选取为第十五行第四列。
(3)由设定之起始点,选取号码,选取号码以调查对象之编号位数相同:即1475, 9938,4460,0628,....,有效号码样本2000以下。
(4)若抽样单位与随机数表抽样号码条件相同即为样本,大于调查编号,跳过不取。
(5)若逢重复号码,亦应跳过。
(6)依上述方法,连续采用150个号码,即为完成样本选用。
采用简单随机抽样之时机:(1)母体小,母体名册令人满意且为母体信息唯一来源。
(2)单位访问成本不受样本单位所在地远近之影向。
2.双重抽样(Double Sampling)先对母群体做一次初步抽样,搜集一些有关母群体之信息,根据所获得之信息,再做一 次比较精密之抽样。
通常对母群体认识极为贫乏之下,可用本法。
第一次抽样,因所要信息 较少,故样本数通常较大。
第二次进行比较流入调查,样本数较小。
3.逐次抽样(Sequential Sampling)此一方式之抽样, 开始只抽取少量样本,根据此少量样本之结果来决定是否接受某一假 设,或应继续抽取样本,直到能够决定接受或摈弃假定为止 。
逐次抽样法应是费用较低且实用的一种方法。
4.分段抽样(Subsampling)先由一母体中抽取n个单位随机样本(PUS),再由 PUS 中抽出m个单位(SSU),就 SSU 进行调查,称二段抽样。
若续从 SSU 抽取更小单位进行调查,称为三段抽样。
三段以上, 称多段调查。
分段抽样之调查费用节省且处理方便,应用范围很广,且有限母群体或无限母群体,均 可采用。
二段抽样法样本数分配实例5.分层抽样(Stratified Sampling)先设立目的及某种分类标准分为若干组或若干类,此组类称为层,然后将母群体之各个 体分别编入相当层中,再由各层中以简单抽样或系统抽样法选取适量样本之方法。
分层之基础有赖抽样设计者之经验及判断。
理想上分层之数目愈多愈好。
因为层数愈多, 每层之样本单位愈相似,样本估计值之精确度愈高。
但成本与疾率之考虑,层数不宜超过六 层。
分层抽样图标6.群集抽样(Cluster Sampling)在本法抽样是以随机选出一群, 一群为单位, 不是个别单位。
群集抽样之优点简便易行, 经济省事。
但是易产生抽样误差危险性很大。
群集抽样图标7.系统抽样(Systematic Sampling)将母群体之每单位加以编号,先计算样本区隔,在1~N/n 间随机选出一个号码作为第 一个样本单位,依定距循序抽出样本。
此法优点,抽样操作简单。
有发生抽样误差的可能为其缺点。
8.复合抽样(Replicated Sampling)将母体分为若干层,用系统抽样法选取样本。
因此有分层抽样及系统抽样优点。
抽样调查方法一览图四、抽样样本使用方式依样本使用方式分:1 重复调查(Repeated Survey)每次调查均重新抽样,使用新样本(Fresh Survey)进行同样调查,是最常用之方法。
2 同样本调查(Panel Survey)利用同一样本作长期的观念调查,以集中力量于样本变化研究上。
又称追纵调查(Logitudiual Survey)。
在研究消费者品牌忠诚度或消费者购买行为,多使用此一方式。
3轮换样本调查(Rotating Pauel Survey)每次换取部份样本,以代表母体变化;维持部份样本的连续性及稳定性又降低成本。
4分裂调查(Split Pauel Survery)一部份每次均采用新样本(重复调查);一部份均用相同样本(同样本调查)。
五 抽样调查之程序举办抽样调查之步骤有:1.对母群体的识别「这次市场调查的母全体是什么」?·调查之时,必须一贯性。
如果针对家庭的事实调查,就不要混杂个人意见调查。
·母全体有何特征必须掌握?否则易丧失其代表性。
2.抽样方法的选择决定采用抽样方法考虑因素:(1)抽样调查可用资源极为有限,以非机抽样为主。
(2)要获得不偏估计值,必须采用随机抽样。
否则可考虑非随机抽样。
(3)必须以客观方法评估抽样设计精密度,应采用随机抽样;否则就考虑非随机抽样。
(4)预期抽样误差是研究误差主要来源,采用随机抽样,如预期非抽样误差是研究误 差主要来源,则可虑用非随机抽样。
当选用随机抽样之后, 斟酌下表各种随机抽样方法之优缺点比较, 与调查之时间, 人力, 经费及母群体特征与需要估计值精准度需要,选取适当抽 样方法。
各种随机抽样方法之优劣比较3.样本数决定决定样本数考虑因素及样本数估算1.调查结果所要求的精准度。
精度愈高,样本数愈多。
2.抽样母体的特性。
如母全体不规则且分成若干较小子群体(Sar-Groups)则需求较 多的样本,以求抽样准确度。
3.抽样调查设计良窳。
如果样本能真正代表母群体,样本数小准确性高。
由不相干之 人来答,其误差随样本数加大而加大。
4.抽样成本合理化因此最佳抽样数量,应是样本数足以产生准确的资料,又不超过调查预算称 。
即 ┌─────────┐ ┌──────┐│抽样调查之信息价值| > │抽样调查成本│└─────────┘ └──────┘估算抽样样本有多种,仅介络抽样统计项目提供简便之样本大小估计公式,以供参考。
实例: 市场调查者想利用简单随机抽样自消费者1000名中抽出若干消费者来测验其 品牌忠诚度,并希望估计误差小于1.00,在95%依赖水准之下,应抽样人数是多少﹖<此部份详阅统计学抽样理论部份,将更深入了解精密做法>六、非抽样误差之避免在实际进行抽样调查时,常会产生「非随机因素」以外之其它因素所造成的误差,影向 抽样结果精准性甚大,称为「非抽样误差」。