第5章 抽样与抽样分布
- 格式:ppt
- 大小:4.56 MB
- 文档页数:108
第5章抽样(8学时)第一节抽样的意义与作用一、抽样的概念1.总体总体(population)通常与构成它的元素共同定义:总体是构成它的所有元素的集合,元素则是构成总体的最基本单位。
2.样本样本(sample)就是从总体中按一定方式抽取出的—部分元素的集合。
或者说一个样本就是总体的一个子集。
3.抽样明白了总体和样本的概念,再来理解抽样的概念就十分容易了。
所谓抽样(sampling),指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择成抽取样本的过程。
4.抽样单位抽样单位(sampling unit)就是一次直接的抽样所使用的基本单位。
抽样单位与构成总体的元素有时是相同的,有时又是不同的。
5.抽样框抽样框(sampling frame)又称做抽样X围,它指的是一次直接抽样时总体中所有抽样单位的。
6.参数值参数值(parameter)也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。
在统计中最常见的总体值是某一变量的平均值,7.统计值统计值(statistic)也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。
样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。
二、抽样的作用在社会研究中,抽样主要解决的是对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。
本章一开始我们就说过,一项社会研究若能对总体中的全部个体都进行了解,那当然是很好的。
但实际上广大研究人员在时间、经费、人力等方面遇到难题,甚至陷入困境,从而不得不在庞大的总体与有限的时间、人力、经费这二者之间寻求平衡。
以现代统计学和概率论为基础的现代抽样理论,以及不断发展、不断完善的各种抽样方法.正好适应了社会研究的发展和应用的需要,成为社会研究知识体系中必不可少的一部分内容。
第五章 参数估计基础一、样本均数的抽样分布与抽样误差内 容1. 抽样误差和抽样分布2. 样本均数抽样分布和抽样误差1. 抽样误差和抽样分布n误差泛指实测值和真实值之差。
按其产生原因与性质分两 大类:系统误差和随机误差。
抽样误差是一种随机误差。
n抽样误差由于生物固有的个体变异,从某一总体中随机抽取一个样 本,所得样本统计量与相应总体参数往往是有差异的,这种 差异称为抽样误差(sampling error)。
n误差产生的原因n系统误差:由受试对象、研究者、仪器设备、研究方法等确定性 原因造成,有倾向性,可避免。
n随机误差:由多种无法控制的偶然因素引起的,无倾向性,不可 避免。
n抽样误差:产生的根本原因是个体变异、产生的直接原因是抽样。
n抽样分布n由于抽样误差存在,从同一总体中随机抽取若干份样本, 所得样本统计量是不一致的,差异无法避免但其存在一定的分布规律。
n 正态分布总体样本均数抽样分布的电脑试验n假定某年某地所有13岁女生的身高服从总体均数为155.4 cm ,总 体标准差为5.3cm 的正态分布 。
用计算机从该总体中 随机抽样,每次抽取30例组成一份样本,重复抽样100次,计算 每份样本的平均身高。
() 2 155.4,5.3 N 2. 样本均数抽样分布和抽样误差n电脑试验表明,正态分布总体样本均数抽样分布具有以 下特点:n样本均数恰好等于总体均数极其罕见;n样本均数之间存在差异;n样本均数围绕总体均数,中间多、两边少,左右基本对称,呈 近似正态分布;n样本均数间的变异小于原始变量值间的变异。
PERCENT30x MIDPOINT0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0n 非正态分布总体样本均数抽样分布的电脑实验n图 (a ) 是正偏峰分布原始数据对应的直方图,用计算机随机抽取 样本量分别为5, 10, 30和50的样本各1000份,计算样本均数并绘 制4个直方图。
第五章抽样与抽样分布一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。
)1.抽样推断的主要目的是( )。
A.用统计量来推算总体参数B.对调查单位作深入研究C.计算和控制抽样误差D.广泛运用数学方法[答案] A[解析] 抽样调查是指从总体中按随机原则抽取部分单位作为样本,进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法,因此,抽样推断的主要目的是用已知的统计量来推算未知的总体参数。
2.抽样调查中,无法消除的误差是( )。
A.抽样误差B.责任心误差C.登记误差D.系统性误差[答案] A[解析] 抽样误差是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。
3.在其他条件相同的情况下,重复抽样的抽样平均误差和不重复抽样相比,( )。
A.前者一定小于后者B.前者一定大于后者C.两者相等D.前者可能大于,也可能小于后者[答案] B[解析] 以抽样平均数的抽样平均误差为例进行说明:在重复抽样条件下,抽样平均数的平均误差的计算公式:;在不重复抽样条件下,抽样平均数的平均误差的计算公式:。
因为,故。
4.拟分别对甲、乙两个地区大学毕业生在试用期的工薪收入进行抽样调查。
据估计甲地区大学毕业生试用期月工薪的方差要比乙区高出一倍。
在样本量和抽样方法相同的情况下,甲区的抽样误差要比乙区高( )。
A.41.4% B.42.4% C.46.8% D.48.8%[答案] A[解析] 假设乙地区的大学毕业生试用期月工薪的方差为σ2,甲地区的大学毕业生试用期月工薪的方差为2σ2,则:,那么,在样本量和抽样方法相同的,情况下,甲区的抽样误差要比乙区高=41.4%。
5.对某天生产的2000件电子元件的耐用时间进行全面检测,又抽取5%进行抽样复测,资料如表5-1所示。
表5-1耐用时间(小时) 全面检测(支) 抽样复测(支)3000以下3000~4000 4000~5000 50600990230505000以上总计36020018100规定耐用时间在3000小时以下为不合格品,则该电子元件合格率的抽样平均误差为( )。
第5章抽样(8学时)第一节抽样的意义与作用一、抽样的概念1.总体总体(population)通常与构成它的元素共同定义:总体是构成它的所有元素的集合,元素则是构成总体的最基本单位。
2.样本样本(sample)就是从总体中按一定方式抽取出的—部分元素的集合。
或者说一个样本就是总体的一个子集。
3.抽样明白了总体和样本的概念,再来理解抽样的概念就十分容易了。
所谓抽样(sampling),指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择成抽取样本的过程。
4.抽样单位抽样单位(samplingunit)就是一次直接的抽样所使用的基本单位。
抽样单位与构成总体的元素有时是相同的,有时又是不同的。
5.抽样框抽样框(samplingframe)又称做抽样范围,它指的是一次直接抽样时总体中所有抽样单位的名单。
6.参数值参数值(parameter)也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。
在统计中最常见的总体值是某一变量的平均值,7.统计值统计值(statistic)也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。
样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。
二、抽样的作用在社会研究中,抽样主要解决的是对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。
本章一开始我们就说过,一项社会研究若能对总体中的全部个体都进行了解,那当然是很好的。
但实际上广大研究人员在时间、经费、人力等方面遇到难题,甚至陷入困境,从而不得不在庞大的总体与有限的时间、人力、经费这二者之间寻求平衡。
以现代统计学和概率论为基础的现代抽样理论,以及不断发展、不断完善的各种抽样方法.正好适应了社会研究的发展和应用的需要,成为社会研究知识体系中必不可少的一部分内容。