第七章抽样与抽样分布
一、思考题
1.什么是随机抽样与非随机抽样?二者有何根本区别。
2.什么是重复抽样?什么是不重复抽样?
3.什么是样本可能数目?它主要与哪些因素有关?
4.随机抽样有哪几种不同的组织形式?并简述它们各自的特点。
5.什么是抽样方案的设计?抽样方案的设计应遵循的基本原则是什么?
6.举例说明什么是总体分布、样本分布和抽样分布。
二、练习题
(一)填空题
1.抽样分布是指 __的概率分布。
2.抽样分布的理论基础 __ 和。
3.中心极限定理告诉我们不管总体服从什么分布,只要样本容量足够多,其 __ 的分布总是近似服从正态分布。
4.科学地设计抽样方案必须遵循两个基本原则:即保证实现 __ ;保证实现 __。
5.正态曲线下的总面积等于。
(二)判断题
σ,这两
1.正态分布总体有两个参数,一个是均值(期望值)μ,一个是方差2
个参数确定以后,一个正态分布也就确定了。( )
2.一般而言,类型抽样的误差比简单随机抽样的误差小。( )
3.重复抽样的抽样误差一定大于不重复抽样的抽样误差。( )
4.随机抽样与非随机抽样的根本区别在于是否遵循随机原则。( )
5.大数定律从理论上揭示了样本与总体之间的内在联系,即随着样本容量n 的增大,样本均值(或样本比例)有接近于总体均值(或总体比例)的趋势。( )
6.中心极限定理是阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。( )
7.总体分布是指总体X的概率分布。( )
8.样本均值的抽样分布与总体是否正态分布无关。( )
(三)单项选择题
1.从纯理论出发,在直观上最符合随机原则的抽样方式是( )。
A.简单随机抽样
B.类型抽样
C.等距抽样
D.整群抽样
2.整群抽样的随机原则落实在( )。
A.各总体单位被抽中的机会均等
B.各群被抽中的机会均等
C.各群、各总体单位被中的机会均等 C.各群被抽中的机会不等
3.标准正态分布的特征是( )。
A.不对称
B.有的对称,有的不对称
C.关于0=x 对称
D. 关于μ=x 对称
4.t 分布的特征是( )。
A.不对称
B.有的对称,有的不对称
C.关于0=x 对称
D. 关于μ=x 对称
5.n 足够大时,n x σμ
-服从( )。
A.正态分布
B.标准正态分布
C.t 分布
D.2χ分布
6.n 足够大时,n s x μ
-服从( )。
A.正态分布
B.标准正态分布
C.t 分布
D.2χ分布
7.n 足够大时,n p )1(πππ
--服从( )。
A.正态分布
B.标准正态分布
C.t 分布
D.2χ分布
8.n 足够大时,n p p p )1(--π
服从( )。
A.正态分布
B.标准正态分布
C.t 分布
D.2χ分布
(四)多项选择题
1.重复抽样的特点是( )
A.各次抽选相互影响
B.各次抽选互不影响
C.每次抽选时,总体单位数始终不变
D.每次抽选时,总体单位数逐渐减少
E.各单位被抽中的机会在各次抽选中相等
2.随机抽样的组织形式主要有()
A.纯随机抽样
B.判断抽样
C.机械抽样
D.分层抽样
E.整群抽样
3. 正态分布的特征是( )。
σ决定 B. 正态曲线下的总面积小于1
A. 正态分布曲线由均值μ和方差2
C. 随机变量在某一点的概率为)
f D. 正态曲线关于μ
(x
x对称
=
E. x轴为正态曲线)
f的渐近线
(x
4.样本均值服从正态分布的前提是()
A. 正态总体,方差已知,大样本
B.正态总体,方差未知,大样本
C. 非正态总体,方差已知,大样本
D.非正态总体,方差未知,小样本
E. 正态总体,方差已知,小样本
(五)计算题
1.某班学生有60人,某次的英语考试成绩服从正态分布,全班平均成绩为
78分,标准差为6分。现从该班学生中按不重复抽样抽出一个由16个学生组成
的简单随机样本,求该样本的平均成绩介于85分~95分之间的概率。
2.某电视机厂生产的电视机的一级品率为80%,现从中抽取49台组成简单
随机样本,问这49台的一级品率介于90~95%之间的概率约为多少?
第四章抽样与抽样分布 例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果: 例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求: 1)随机抽取一人,收入超过18430元的概率? 2)抽取一个10人样本,平均收入超过18430元的概率? 例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少? 例4:一架电梯极限负重1000公斤,一般可容纳13人。假定电梯的所有乘客平均体重70公斤,标准差12公斤。那么一个13个人的随机样本总重量超过极限负重的概率是多少? 例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。设生育态度X:赞成为1,否则为0。求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、
1、0、1、1、1,求样本均值、样本中赞成比例。 解:1)计算见下表 2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7 例6:学校选人大代表,结果有60%的选民投了我院院长而当选。假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。 例7:某中学学生男女人数相同,现随机从中抽取15名学生,问男生人数大于10的概率是多少? 四、样本方差的抽样分布 设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值2χ,其服从于自由度为n-1的卡方分布: 2χ=2222312( )( )( ).....( )i x x x x μ μ μ μ σ σ σ σ ----++++= 2 2 1 1 () k i i x μσ=-∑ 分子分母同乘n-1,进一步整理得2 χ=2 2 (1)n s σ-~2χ(n-1) 练习题: 1、某专业学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采用重复抽样的方法从该专业学生中抽取容量为100的样本,则样本均值的抽样分布为? 2、从均值为50,标准差为5的正态总体中抽取容量为25的样本,则样本均值超过51的概率为? 3、某企业声明企业人均收入为5500元,标准差为550元。如果随机抽取16位员工,则平均收入落在5400-5600元的概率是? 4、样本量为10的样本均值方差为12,则总体的方差为? 5、总体均值为3.1,标准差为0.8,从该总体中随机抽取容量为36的样本,样本
第五章抽样与抽样估计复习题 一、填空题 1 、在实际工作中,人们通常把n≥ 30 的样本称为大样本,而把n<30 的样本称为小样本。 2 、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3 、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4 、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5 、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1 、在其它条件不变的情况下,要使抽样平均误差为原来的1/3 ,则样本单位数必须 ((2)) ( 1)增加到原来的 3 倍(2)增加到原来的9 倍 ( 3)增加到原来的 6 倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) ( 1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20 小时抽 1 小时的全部产进行检验,这种方式是((4)) ( 1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) ( 1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100 次通话中,通话持续平均时间为 3 分钟,均方差为分钟,则概 率为时,通话平均持续时间的抽样极限误差为((2)) ( 1)(2)(3)(4) 6、假定11 亿人口大国和100 万人口小国的居民年龄变异程度相同,现在各自用重复 抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))( 1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1 、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2 、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3 、抽样极限误差((1)(2)( 4))
第六章样本及抽样分布 【授课对象】理工类本科二年级 【授课时数】4学时 【授课方法】课堂讲授与提问相结合 【基本要求】1、理解总体、个体和样本的概念; 2、了解经验分布函数和直方图的作法,知道格林汶科定理; 3、理解样本均值、样本方差和样本矩的概念并会计算; 4、理解统计量的概念,掌握几种常用统计量的分布及其结论; 5、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布,F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【授课内容及学时分配】 §6.0 前言5分钟前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象的统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本25分钟一、总体与样本
1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究华北工学院男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但在数理统计里,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X (可以是向量)和该数量指标X 在总体的分布情况。在上述例子中X 是表示灯泡的寿命或男大学生的身高和体重。在实验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X 可能取值的全体组成的集合等同起来。我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指标X 的分布,因此,X 的分布函数和数字特征分别称为总体的分布函数和数字特征。 定义1:把研究对象的某项或几项数量指标的值的全体称为总体; 总体中的每个元素称为个体。 根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 Ex 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 对应的分布: +∞<<= ≤= ≤=? ∞ --- x N dt e x x P x F x t 0),(~21 }{)(22)(2 2σμσ πξσμ总麦穗数的麦穗数重量 Ex 2:考察一位射手的射击情况: X =此射手反复地无限次射下去所有射击结果全体; 每次射击结果都是一个个体(对应于靶上的一点) 个体数量化???=未中射中 01x 1在总体中的比例p 为命中率
第五章 抽样估计学习指导 一、判断题×√ 1.抽样估计是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免地会产生误差,这种误差的大小是不能进行控制的.( ) 2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本.( ) 3.在抽样估计中,作为推断的总体和作为观察对象的样本都是确定的.唯一的.( ) 4.优良估计的无偏性是指:所有可能的样本平均数的平均数等于总体平均数.( ) 5.抽样成数的特点是,样本成数越大,则成数方差越大.( ) 6.在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大.( ) n x σ μ= 7.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度.( )
8.抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的.( ) 9.在其他条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度.( ) 10.在简单随机抽样中,如果重复抽样的抽样极限误差增加40%,其他条件不变,则样本单位数只需要原来的一半左右.( ) 11.抽样平均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差.( ) 12.样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比.( ) 二.单项选择题 1.抽样调查的主要目的是( ). A.用样本指标来推算总体指标 B.对调查单位做深入研究 C.计算和控制抽样误差 D.广泛运用数学方法 2.抽样调查所必须遵循的基本原则是( ). A.准确性原则 B.随机性原则 C.可靠性原则 D.灵活性原则
第五章 抽样调查及参数估计 5.1 抽样与抽样分布 5.2 参数估计的基本方法 5.3 总体均值的区间估计 5.4 总体比例的区间估计 5.5 样本容量的确定 一、简答题 1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计? 2.什么是抽样误差,影响抽样误差的主要因素有哪些? 3.简述概率抽样的五种方式 二、填空题 1.抽样推断是在 随机抽样 的基础上,利用样本资料计算样本指标,并据以推算 总体数量 特征的一种统计分析方法 。 2.从全部总体单位中随机抽选样本单位的方法有两种,即 重复 抽样和 不重复 抽样。 3.常用的抽样组织形式有 简单随机抽样 、 类型抽样 、等距抽样、 整群抽样 等四种。 4.影响抽样误差大小的因素有总体各单位标志值的差异程度、 抽样单位数的多少 、 抽样方法 和抽样调查的组织形式 。 5.总体参数区间估计必须具备估计值、 概率保证程度或概率度 、 抽样极限误差 等三个要素。 6.从总体单位数为N 的总体中抽取容量为n 的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。 7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。 8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。 三、选择题 1.抽样调查需要遵守的基本原则是( B )。 A .准确性原则 B .随机性原则 C .代表性原则 D .可靠性原则 2.抽样调查的主要目的是( A )。 A .用样本指标推断总体指标 B .用总体指标推断样本指标 C .弥补普查资料的不足 D .节约经费开支 3.抽样平均误差反映了样本指标与总体指标之间的( B )。 A .实际误差 B .实际误差的平均数 C .可能的误差范围 D .实际的误差范围 4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D ) 。 A .简单随机抽样 B .类型抽样 C .等距抽样 D .整群抽样 5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。 A .样本单位数越多,抽样误差越大 B .样本单位数越多,抽样误差越小 C .样本单位数与抽样误差无关 D .抽样误差是样本单位数的10% 6.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,那么样本n n N B N =!()!n N N A N n =-
一、填空题 1、在实际工作中,人们通常把 n≥30 的样本称为大样本,而把 n<30 的样本称为小样本。 2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须 ((2)) (1)增加到原来的3倍(2)增加到原来的9倍 (3)增加到原来的6倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1 小时的全部产进行检验,这种方式是((4)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) (1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为分钟,则概率为时,通话平均持续时间的抽样极限误差为((2)) (1)(2)(3)(4)
6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3、抽样极限误差((1)(2)(4)) (1)是所有可能的样本指标与总体指标之间的误差范围 (2)也叫允许误差(3)与所做估计的概率保证程度成反比 (4)通常用来表示抽样结果的精确度 4、影响样本容量的因素有((1)(2)(3)(4)(5)) (1)总体方差 (2)所要求的概率保证程度 (3)抽样方法 (4)抽样的组织形式 (5)允许误差法范围的大小 5、不重复抽样的抽样平均误差((2)(4)) (1)总是大于重复抽样的抽样平均误差
第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1
一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2
第5章 样本及抽样分布 1,设总体X 服从均值为1/2的指数分布,4321,,,X X X X 是来自总体的容量为4的样本,求 (1)4321,,,X X X X 的联合概率密度;(2)}2.17.0,15.0{21<<<
第六章抽样调查 一、填空题 1.抽选样本单位时要遵守原则,使样本单位被抽中的机会。 2.常用的总体指标有、、。 3.在抽样估计中,样本指标又称为量,总体指标又称为。 4.全及总体标志变异程度越大,抽样误差就;全及总体标志变异程度越小, 抽样误差。 5.抽样估计的方法有和两种。 6.整群抽样是对被抽中群内的进行的抽样组织方式。 7.误差分为和代表性误差;代表性误差分为________和偏差;偏差是 ____________________________,也称为________________。 8.简单随机抽样的成数抽样平均误差计算公式是:重复抽样条件下:; 不重复抽样条件下:。 9.误差范围△,概率度t和抽样平均误差 之间的关系表达式为。 10.抽样调查的组织形式有:。 二、单项选择题 1.所谓大样本是指样本单位数在( )及以上 A 30个 B 50个 C 80个D100个 2.抽样指标与总体指标之间抽样误差的可能范围是( )
A 抽样平均误差 B 抽样极限误差 C 区间估计范围 D 置信区间 3.抽样平均误差说明抽样指标与总体指标之间的( ) A 实际误差 B 平均误差 C 实际误差的平方 D 允许误差 4.是非标志方差的计算公式( ) A P(1-P) B P(1-P)2 C )1(P P D P 2(1-P) 5.总体平均数和样本平均数之间的关系是( ) A 总体平均数是确定值,样本平均数是随机变量 B 总体平均数是随机变量,样本平均数是确定值 C 两者都是随机变量 D 两者都是确定值 6.对入库的一批产品抽检10件,其中有9件合格,可以( )概率保证合格率不低于80%。 A 95.45% B 99.7396 C 68.27% D 90% 7.在简单随机重复抽样情况下,若要求允许误差为原来的2/3,则样本容量( ) A 扩大为原来的3倍 B 扩大为原来的2/3倍 C 扩大为原来的4/9倍 D 扩大为原来的2.25倍 8.根据抽样调查得知:甲企业一等品产品比重为30%,乙企业一等品比重为50% 一等品产品比重的抽样平均误差为 ( ) A 甲企业大 B 两企业相同 C 乙企业大 D 无法判断 9.是非标志的平均数是( ) A -P)1P( B P(1-P) C p D (1-P)2 10.重复抽样的误差一定( )不重复抽样的误差。
第五章抽样与参数估计 学习内容 一、抽样推断概述 二、抽样分布及其应用 三、常见的抽样分布 四、参数估计 五、区间估计的计算 学习目标 1. 了解抽样和抽样分布的基本概念。 2. 理解抽样分布与总体分布的关系。 3. 了解点估计的概念和估计量的优良标准。 4. 掌握总体均值、总体比例和总体方差的区间估计。 一、抽样推断概述 ①推断统计的内容 ②抽样推断的过程 统计推断的基本假定 a)总体看作是一个随机变量X,其概率分布为f(x)。 b)样本看作是n个独立的随机变量(X1, X2, …, X n),每个都具有与总体X相同的分布。 c)样本中每个个体必须取自同一总体, X1, X2, …, X n相互独立。
统计推断涉及的概念 参数与统计量 –参数:描述总体分布特征的量,如平均数μ,标准差σ。 –统计量:由样本观察值算出的量,如,S2,S。 –统计量是随机变量。 ③抽样分布及其形成过程 抽样分布(概念要点) 所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布。 抽样分布是一种理论概率的分布。 抽样分布的结果来自容量相同的所有可能样本。 单选题 样本平均数和总体平均数() – A、前者是一个确定值,后者是随机变量 – B、前者是随机变量,后者是一个确定值 – C、两者都是随机变量 – D、两者都是确定值 ④抽样推断的理论基础 (1)大数定律 a)大数定律在统计中是指一切关于大量随机现象之平均结果稳定性的定理。 –尽管单个随机现象的具体表现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消、补偿和拉平,致使总的平均结果趋 于稳定。 b)为整个推断统计提供了最基本的理论依据。 猜硬币赌局 赌局1:–掷10次硬币,赌正面朝上的频率为0.4到0.6次。 赌局2:–掷100次硬币,赌正面朝上的频率0.4到0.6次。 赌局3:–掷1000次硬币,赌正面朝上的频率0.4到0.6次。
第六章样本及抽样分布 §1总体与样本 从理论上讲,对随机变量进行大量的观测,被研究的随机变量的概率特征一定能显现出来,可是实际进行的观测次数只能是有限的,有时甚至是少量的。因此,我们关心的问题就是怎样有效地利用收集到的有限的资料,尽可能地对被研究的随机变量的概率特征作出精确而可靠的结论. 我们把被研究的对象的全体称为总体(或母体),而把组成总体的各个元素称为个体。代表总体的指标是一个随机变量,所以总体就是指某个随机变量可能取的值的全体。 从总体中抽取一个个体,就是对代表总体的随机变量进行一次试验(或观测),得到的一个试验数据(或观测值)。从总体中抽取一部分个体,就是对随机变量进行若干次试验(观测)。 从总体中抽取若干个个体的过程称为抽样。抽样结果得到的一组试验数据(观测值),称为样本(或子样);样本中所含个体的数量称为样本容量。 从总体中抽取样本,一般总是假设满足下述两个条件: (1)随机性为了使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个个体都有同等的机会被抽取到,通常可以用编号抽签的方法或利用随机数表来实现。 (2)独立性各次抽样必须是相互独立的,即每次抽样的结果既不影响其它各次抽样的结果,也不受其它各次抽样结果的影响。 这种随机的、独立的抽样方法称为简单随机抽样,由此得到的样本称为简单随机样本。 例如,从总体中进行放回抽样,显然是简单随机抽样,得到的样本就是简单随机样本。 从有限总体(即其中只含有有限多个个体的总体)中,进行不放回抽样,虽然不是简单随机抽 样,但是若总体容量很大而样本容量较小(,则可以近似地看作是放回抽样,因而也就可以近似地看作是简单随机抽样,得到的样本可以近似地看作是简单随机样本。 今后,凡是提到抽样与样本,都是指简单随机抽样与简单随机样本。 从总体中抽取容量为n的样本,就是对代表总体的随机变量随机地、独立地进行n次试验(观测),每次试验的结果可以看作是一个随机变量,n次试验的结果就是n个随机变量 。 这些随机变量相互独立,并且与总体服从相同的分布。设得到的样本观测值分别是 ,
第五章抽样推断习题 一、一、单项选择题: 1、抽样推断的主要目的是(③)。 ①对调查单位作深入研究②计算和控制抽样误差 ③用样本指标来推算总体指标④广泛运用数学方法 2、抽样调查与典型调查的主要区别是(④)。 ①所研究的总体不同②调查对象不同 ③调查对象的代表性不同④调查单位的选取方式不同 3、样本是指(④)。 ①任何一个总体②任何一个被抽中的调查单位 ③抽样单元④由被抽中的调查单位所形成的总体 4、抽样误差是指(③)。 ①在调查过程中由于观察、测量等差错所引起的误差 ②在调查中违反随机原则出现的系统误差 ③随机抽样而产生的代表性误差④人为原因所造成的误差 5、抽样极限误差是(②)。 ①随机误差②抽样估计所允许的误差的上下界限 ③最小抽样误差④最大抽样误差 6、抽样平均误差就是(④)。 ①样本的标准差②总体的标准差 ③随机误差④样本指标的标准差 7、抽样估计的可靠性和精确度(②)。 ①是一致的②是矛盾的 ③成正比④无关系 8、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应(①)。 ①增加8倍②增加9倍 ③增加1.25倍④增加2.25倍 9、当有多个参数需要估计时,可以计算出多个样品容量n,为满足共同的要求,必要的样本容量一般应是(②)。 ①最小的n值②最大的n值 ③中间的n值④第一个计算出来的n值 10、抽样时需要遵循随机原则的原因是(③)。
①可以防止一些工作中的失误②能使样本与总体有相同的分布 ③能使样本与总体有相似或相同的分布④可使单位调查费用降低 二、多项选择题: 1、抽样推断的优点(①②③④)。 ①时效性强②更经济③能够控制抽样估计的误差 ④适用范围广⑤无调查误差 2、抽样推断适用于(①②③④⑤)。 ①具有破坏性的场合②用于时效性要求强的场合 ③对于大规模总体和无限总体的场合进行调查 ④用于对全面调查的结果进行核查和修正 ⑤不必要进行全面调查,但又需要知道总体的全面情况时 3、抽样推断中哪些误差是可以避免的(①②④)。 ①调查性误差②因抽样破坏随机原则而造成的系统性偏差 ③抽样误差④因抽样破坏随机原则而造成的方向性偏差 4、区间估计的要素是(①③④)。 ①点估计值②样本的分布③估计的可靠度 ④抽样极限误差⑤总体的分布形式 5、影响必要样本容量的因素主要有(①②③⑤)。 ①总体的标志变异程度②允许误差的大小③重复抽样和不重复抽样 ④样本的差异程度⑤估计的可靠度 三、填空题 1、抽样推断就是根据()的信息去研究总体的特征。 2、样本单位选取方法可分为()和()。 3、对于简单随机抽样,总体中的每个单位被抽中的概率为()。 4、区间估计时,既要考虑极限误差的大小,即估计的()问题,又要考虑估计的()问题。 四、简答题 1、什么是抽样推断?抽样推断有哪几方面的特点? 2、抽样推断与典型调查相比有何不同? 五、计算题 1、为检查某批电子元件的质量,随机抽取1%的产品,将测得结果整理成如下表的形式:
第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X L 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=, 则a =____________。 3.若(5)X t :,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N :,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分) 1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势
第六章 自测题 时间:120分钟 一、单项选择题 (每题5分,共25分) 1. 设总体2(,)X N μσ , 其中μ已知,2σ未知, X 1, X 2, …, X n 是来自总体X 的简单随机样 本,则下列表达式中不是统计量的是( ) (A) 11n i i X n =∑ (B) 1min{}i i n X ≤≤ (C) 21 n i i X μσ=-∑() (D) 2 11n i i X n μ=-∑() 2. 设随机变量X 和Y 都服从标准正态分布,则 ( ) (A) X +Y 服从正态分布;(B) X 2+Y 2服从χ2分布; (C) X 2和Y 2都服从χ2分布;(D) X 2/Y 2服从F 分布。 3. 设二维随机变量(X , Y )服从二维正态分布N (μ1, μ2, σ12, σ22, ρ) (ρ≠0),则( ) (A) 2X +Y 服从正态分布;(B) X 2+Y 2服从χ2分布; (C) X -Y 不服从正态分布;(D) X 2/Y 2服从F 分布. 4.设X 1, X 2, …, X 11是来自正态总体2 (0,)X N σ 的简单随机样本,102 211,10i i Y X ==∑,则下 列选项正确的是( ) (A)22(1)X χ ; (B) 22 (10);Y χ (C) 11 (10);X t Y (D) 2112(10,1).X F Y 5. 设总体X 和Y 相互独立且都服从正态分布2(,)N μσ,,X Y 分别是来自总体X 和Y 容量为n 的样本均值, 则当n 固定时, 概率{}P X Y σ->的值随着σ的增大而( ) (A)单调增大; (B) 单调减小; (C)保持不变; (D) 增减不定. 二、填空题 (每题5分,共15分) 1. 设随机变量2110012...,X N X X ~(,),,是取自X 的样本,X 为样本均值, 已知 (0,1),Y aX b N =+ 则a ,b 的值为( ). 2. 设总体X 服从正态分布)2,0(2 N ,而1521,,,X X X 是来自总体的简单随机样本,则随 机变量 ) (22 152112 10 21X X X X Y ++++= 服从( )分布,参数为( ).
《统计学》习题五 参考答案 、单项选择题: 1、抽样误差是指( )。 C A 在调查过程中由于观察、测量等差错所引起的误差 B 人为原因所造成的误差 C 随机抽样而产生的代表性误差 D 在调查中违反随机原则出现的系统误差 2、抽样平均误差就是( )。 D A 样本的标准差 B 总体的标准差 C 随机误差 D 样本指标的标准差 3、抽样估计的可靠性和精确度( )。 B A 是一致的 B 是矛盾的 C 成正比 D 无关系 4、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应( )。 A A 增加 8 倍 B 增加 9 倍 C 增加 1.25 倍 D 增加 2.25 倍 5、当有多个参数需要估计时,可以计算出多个样品容量 n 为满足共同的要求,必要的样本容量 一般应是( )。 B A 总体的标志变异程度 B 允许误差的大小 C 重复抽样和不重复抽样 D 样本的差异程度 E 估计的可靠度 三、填空题: 3、 实施概率抽样的前提条件是要具备( )。抽样框 4、 对总体参数进行区间估计时,既要考虑极限误差的大小,即估计的( 虑估计的( )问题。准确性 可靠性 四、简答题: 1、抽样调查与重点调查的主要不同点。 A 最小的n 值 B 最大的n 值 6、抽样时需要遵循随机原则的原因是( C 中间的n 值 D 第一个计算出来的n 值 )。C A 可以防止一些工作中的失误 B 能使样本与总体有相同的分布 C 能使样本与总体有相似或相同的分布 D 可使单位调查费用降低 二、多项选择题: 1、抽样推断中哪些误差是可以避免的( A 工作条件造成的误差 B D 人为因素形成偏差 E 2、区间估计的要素是( A 点估计值 B D 抽样极限误差 E 3、影响必要样本容量的因素主要有( )。 A B D 系统性偏差 C 抽样随机误差 抽样实际误 差 )。 A C D 样本的分布 C 估计的可靠度 总体的分布形式 )。 A B C E 1、抽样推断就是根据( )的信息去研究总体的特征。样本 2、样本单位选取方法可分为( )和( )。重复抽样 不重复抽样 )问题,又要考
第六章抽样 一、辨析题 1、一般来说,任意抽样技术适用于正式的实际调查。 错误。适用于非正式的探测性调查,或调查前的准备工作。 2、一般说来,总体中各单位之间标志值的变异程度越大,需要抽样的样本数目越多;反之,需要抽样的样本数目越少。 正确 3、分层最佳抽样法指的是等比例分层抽样。 错误。这是非比例分层抽样。 4、一般而言,抽样的样本占总体的比例同抽样误差成反向关系,即抽样比例越大,抽样误差相对越小。 正确 5、抽样误差是随机抽样调查中必然发生的代表性误差,所以平均误差是不可避免的。而且,这种误差一般包括了技术性误差,即调查工作中的误差。 错误。这种误差一般不包括技术性误差即调查工作中的误差。 6、总体单位之间标志变异程度越大,抽样误差越大;反之则越
小。 正确 7、样本单位数目越多,抽样误差越大,反之则越小。 错误。样本单位数目越多,抽样误差越小,反之则大。 8、一般来说,简单随机抽样比分层、分群抽样误差大,不重复抽样比重复抽样误差大。 错误。重复抽样比不重复抽样误差大。 9、点值估计是考虑了抽样误差,直接以样本指标作为总体指标的估计值,作近似的估计。 错误,不考虑抽样误差。 二、名词解释 1、抽样调查 抽样调查也称为抽查,是指从调查总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。 2、抽样 抽样是指在抽样调查时采用一定的方法,抽选具有代表性的样本,以及各种抽样操作技巧和工作程序等的总称。 3、随机抽样 随机抽样又称为概率抽样或机率抽样,是对总体中每一个体都给予平等的抽取机会的抽样技术。在随机抽样的条件下,每个个体抽中或抽不中完全凭机遇,
习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21(4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量2 1 ~()(1),,X t n n Y X >= 则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7
样本与抽样分布 Corporation standardization office #QS8QHH-HHGX8Q8-GNHHJ8
第六章样本与抽样分布 §数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X 表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X £1000)=F(10000),求F(x) (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)、D(x)。 要解决二个问题
1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。
(2)为研究方便将总体与一个 X对应 (等同)。 a.总体中不同的数量指标的全体, 即是的全部取值。 b. X的分布即是总体的分布情 况。 例:一批产品是100个灯泡,经测 试其寿命是: 1000小时 1100小时 1200小时 20个30个 50个 X 1000 1100
1200 P 20/100 30/100 50/100 (设X表示灯泡的寿命)可知的分布 律, 就是总体寿命的分布,反之亦然。 常称总体X,若~F(x),有时也用 F(x)表示一个总体。 (3)我们对每一个研究对象可能要观 测两个或多个数量指标,则可用多 维随机向量(X,Y,Z, …)去描述总 体。 2.总体的分类
第五章抽样与抽样分布 第一节抽样的基本概念 一、几个基本概念 1、目标总体和抽样总体 目标总体就是研究对象的全体。抽样总体是指从中抽取样本的总体。二者理应一致,但实际中有时难以保证。 2、抽样单元和抽样框 抽样总体的具体表现就是抽样框,通常是一份包含所有抽样单元的名单,好的抽样框应该尽可能多地提供与研究目标有关的辅助信息。抽样单元是构成抽样框的基本单位,可以是一个个体,也可以包含若干个个体,还可以分级。分级情况下,总体由若干个较大规模的抽样单元组成,为初级单元,每个初级单元又包含若干个规模较小的单元,为二级单元,以此类推。抽取哪一级,就需要有哪一级的抽样框。 3、抽样误差和非抽样误差 抽样误差是抽取样本的随机性造成的样本值和总体值之间的差异。只要采用抽样调查,抽样误差就不可避免,但可通过增大样本量来减小误差。非抽样误差是由于其他多种原因引起的样本值和总体值之间的差异。 三、抽样方案设计 1、抽样设计步骤: 明确调查目的,确定研究对象,确定目标量; 明确总体及抽样单元;(根据总体的定义,收集一份全部个案的名单) 对主要目标量的精度提出要求(误差控制在多大范围内); 选择抽样方法; 根据抽样方法、精度要求等确定样本量,并估计抽样误差; 制定具体步骤。 2、设计原则 (1)随机性原则——总体中所有个体被抽中机会相等。 (2)抽样效果最佳原则——在固定费用下,抽样误差最小;在要求精度下,费用最少。 第二节抽样方法 一、随机抽样 1、简单随机抽样:最基本的抽样方法,最符合随机原则,每个个体都有同样的被抽中概率。是其它复杂抽样设计的基础。使用随机数表。 2、分层抽样:将总体按照某些特征分成若干个层,在每一层当中独立抽取