第五章抽样分布与推断

格式：pdf
大小：263.36 KB
文档页数：36

下载文档原格式

第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是，标准差是，从这个总体中抽出一个容量是 n 的样本，则样本平均数 X 也服从正态分布，其平均数 E( X ) 仍为，其标准
差为。 X 5-19
从正态分布的再生定理可以看出，只要总体变量服从正态分布，则从中抽取的样本，不管n 是多少，样本平均数都服从正态分布。但是在客观实际中，总体并非都是正态分布。对于从非正态分布的总体中抽取的样本平均数的分布问题，需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节抽样的基本概念与数学原理
一、有关抽样的基本概念二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
（一）样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合，这个集合的大小称为样本容量，一般用n表示，它表明一个样本中所包含的单位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明：尽管个别现象受偶然因素影响，有各自不同的表现。但是，对总体的大量观察后进行平均，就能使偶然因素的影响相互抵消，消除由个别偶然因素引起的极端性影响，从而使总体平均数稳定下来，反映出事物变化的一般规律。

社会统计学第五章正态分布

在相同条件下进行N次实验或观察，随机事件A出现的次数为n，频次n与实验次数N 的比值n/N，称作N次实验或观察中事件A的频率，即这一事件出现的概率。频率是试验值，而概率是个理论值，其值是唯一的。
n P ( A) N
（2）古典概率类型
在古典概率类型问题中，所有可能的试验结果是有限的，即试验的基本事件数是有限的，并且，所有这些基本事件都是等可能的。若事件组 A1, A2 , A3 ,, An 满足下面三个条件，则称该事件为等可能完备事件组。
（1）二项试验
一个二项实验是一个满足如下条件的实验:
实验由确定的试验数所组成; 每个试验只有两个可能的结果,通常称为”成功” 和”失败”; 任一试验的结果独立于任何其他试验结果; 在各次实验中,”成功”的概率和”失败”的概率都是固定的常数,并且他们的和等于1。
（2）二项实验的概率
1 5 p , q 1 p , n 20, m 7. 6 6
因此,20次中恰好出现7次6点的概率为:
P
7 20
1 7 5 20 -7 C （）（） 6 6
7 20
二项实验的概率
如果单次试验中,事件成功与失败的概 1 率相等,即 p q 2 则上述二项实验的概率公式可简化为:
C
m n
Pnm m!
例7：
一条航线上共有十个航空站，请问这条航线上共有多少种不同的飞机票？有四栋大楼将分配给四个单位使用，分配原则是每个单位只允许分配一栋，请问共有多少种分配方案？
例8：
抛掷一枚骰子20次,则恰好出现7次“6 点”的概率. 解:这是一个二项实验,依题意,此时
例2：某年级共有学生100名，其中来自广东省的有25名，来自广西省的有10名，问任抽一名，来自两广的概率是多少？

抽样分布及总体平均数的推断

量服从呈t分布。
于是需用t分布来估计该校三年级学生阅读
能力总体平均数95％和99％的置信区间。
由原始数据计算出样本统计量为
X 29.917
S 3.926
当Ｐ＝0.95时， t11 2.201 0.05
因此，该校三年级学生阅读能力2 得分95％的置信区间为：
X t11 0.05
S n 1
检验的思路是：假定研究样本是从平均数为μ 的总体随机抽取的，而目标总体的平均数为μ0，检验μ与μ0之间是否存在差异。如果差异显著，可以认为研究样本的总体不是平均数为μ0的总体，也就是说，研究样本不是来自平均数为μ0的总体。
二、总体平均数显著性检验的步骤
一个完整的假设检验过程，一般经过四个主要步骤：
2．平均数区间估计的计算
①总体正态，σ已知（不管样本容量大小），
或总体非正态，σ已知，大样本
平均数离差的的抽样分布呈正态，平均数的置信区间为：
X
Z
2
n
X
Z
2
n
（9．1）
例题1：某小学10岁全体女童身高历年来标准差为6.25厘米，现从该校随机抽27名10岁女童，测得平均身高为134.2厘米，试估计该校10岁全体女童平均身高的95％和99％置信区间。
⑴．提出假设 ⑵．选择检验统计量并计算统计量的值 ⑶．确定显著性水平 ⑷．做出统计结论
⑴.提出假设
即根据研究假设提出相应的统计检验的假设。
双侧检验的假设形式为： H0：μ＝μ0， H1：μ≠μ0 单侧检验的假设形式为： H0：μ≥μ0，H1:μ＜μ0 （左侧检验）或者 H0：μ≤μ0，H1:μ＞μ0 （右侧检验）
在确定检验形式时，凡是检验是否与假设的总体一致的假设检验，α被分散在概率分布曲线的两端，因此称为双侧检验。

第五章统计推断(1)

2检验是根据s判断抽出该样本的总体其标准差是否等于
某一给定值。
检验程序：
(a) 确定假设H 0和H A： H 0：＝ 0；H A 有三种可能的形式：（ 1 ） 0 （2） 0 (若已知不可能小于 0 ) （3） 0 (若已知不可能大于 0 )
(b)计算检验的统计量：
1. 单个样本平均数检验
在实际研究中，常常要检验一个样本平均数 x与已知的总体平均数0是否有显著差异，即检验该样本是否来自某一已知的总体。
已知的总体平均数一般为一些公认的理论数值。如畜禽正常的生理指标、怀孕期、生产性能指标等，都可以样本平均数与之比较，检验差异显著性。
1.1 在σ已知的情况下，单个平均数的显著性检验－u检验检验程序：
• 两类错误之间的关系如何？
二者的区别是I型错误只有在否定H0的情况下发生，而 II型错误只有在接受H0时才会发生。二者的联系是，在样本容量相同的情况下，I型错误减小，II型错误就会增大；反之II型错误减小，I型错误就会增大。比如，将显著性水平α从0.05提高到0.01，就更容易接受H0，因此犯I型错误的概率就减小，但相应地增加了犯II型错误的概率。
第一节假设检验的基本步骤及原理
1. 假设检验的基本步骤
我们通过一个例子来介绍假设检验的基本步骤：
例一，已知某品种玉米单穗重X ~ N (300,9.52 )，即单穗重总体平均数0 300g，标准差 9.5 g。在种植过程中喷洒了某种药剂的植株中随机抽取9个果穗，测得平均单穗重 x 308g，试问这种药剂对该品种玉米的平均单穗重有无真实影响？
• （一）提出假设
首先对样本所在的总体作一假设。假设喷洒了药剂的玉米单穗重总体平均数与原来的玉米单穗重总体平均数0之间没有真实差异，即＝0。也就是说表面差异（ x 0）是由抽样误差造成的。

抽样与抽样分布(试题及答案)

第五章抽样与抽样分布一、单项选择题(以下每小题各有四项备选答案，其中只有一项是正确的。

)1．抽样推断的主要目的是( )。

A．用统计量来推算总体参数B．对调查单位作深入研究C．计算和控制抽样误差D．广泛运用数学方法[答案] A[解析] 抽样调查是指从总体中按随机原则抽取部分单位作为样本，进行观察研究，并根据这部分单位的调查结果来推断总体，以达到认识总体的一种统计调查方法，因此，抽样推断的主要目的是用已知的统计量来推算未知的总体参数。

2．抽样调查中，无法消除的误差是( )。

A．抽样误差B．责任心误差C．登记误差D．系统性误差[答案] A[解析] 抽样误差是指在遵循了随机原则的条件下，不包括登记误差和系统性误差在内的，用样本指标代表总体指标而产生的不可避免的误差。

3．在其他条件相同的情况下，重复抽样的抽样平均误差和不重复抽样相比，( )。

A．前者一定小于后者B．前者一定大于后者C．两者相等D．前者可能大于，也可能小于后者[答案] B[解析] 以抽样平均数的抽样平均误差为例进行说明：在重复抽样条件下，抽样平均数的平均误差的计算公式：；在不重复抽样条件下，抽样平均数的平均误差的计算公式：。

因为，故。

4．拟分别对甲、乙两个地区大学毕业生在试用期的工薪收入进行抽样调查。

据估计甲地区大学毕业生试用期月工薪的方差要比乙区高出一倍。

在样本量和抽样方法相同的情况下，甲区的抽样误差要比乙区高( )。

A．41.4% B．42.4% C．46.8% D．48.8%[答案] A[解析] 假设乙地区的大学毕业生试用期月工薪的方差为σ2，甲地区的大学毕业生试用期月工薪的方差为2σ2，则：，那么，在样本量和抽样方法相同的，情况下，甲区的抽样误差要比乙区高=41.4%。

5．对某天生产的2000件电子元件的耐用时间进行全面检测，又抽取5%进行抽样复测，资料如表5-1所示。

表5-1耐用时间(小时) 全面检测(支) 抽样复测(支)3000以下3000～4000 4000～5000 50600990230505000以上总计36020018100规定耐用时间在3000小时以下为不合格品，则该电子元件合格率的抽样平均误差为( )。

统计学第五章

第五章抽样推断抽样推断定义：是一种非全面调查，是按随机原则，从总体中抽取一部分单位进行调查，并以其结果对总体某一数量特征作出估计和推断的一种统计方法。

（一）总体和样本在抽样推断中面临两个不同的总体，即全及总体和样本总体，全及总体也叫母体，简称总体。

全及总体的单位数用N 表示全及总体⎪⎩⎪⎨⎧⎩⎨⎧属性总体有限总体无限总体变量总体样本总体又叫抽样总体、子样，简称样本，样本总体的单位数称样本容量，用n 表示。

（二）参数和统计量参数亦称全及指标，由于全及总体是唯一确定的，故根据全及总体计算的参数也是个定值对于属性总体，可以有如下参数，全及总体成数p ，全及总体标准差)(2p p σσ方差属性总体标准差：()p p p-=1σ统计量即样本指标设样本总体有n 个变量：n x x x x ,...,,,321 则：样本平均数 nx x ∑=（三）样本容量与样本个数样本容量是指一个样本所包含的单位数，用n 来表示，一般地，样本单位数达到或超过30个的样本称为大样本，而在30个以下称为小样本。

社会经济统计的抽样推断多属于大样本，而科学实验的抽样观察则多取小样本。

样本个数又称样本可能数目，是指从全及总体中可能抽取的样本的个数。

一个总体可能抽取多少样本，与样本容量大小有关，也与抽样的方法有关。

在样本容量确定之后，样本的可能数目便完全取决于抽样方法。

抽样误差是抽样调查自身所固有的，不可避免的误差，虽然不能消除这种误差，但有办法进行计算，并能对其加以控制。

抽样平均误差越大，表示样本的代表性越低；抽样平均误差越小，表示样本的代表性越高。

在重复简单随机抽样时，样本平均数的抽样分布有数学期望值E(a)=a（a代表全及总体平均数，即X）X⇔。

样本平均数的平均数=总体平均数抽样平均误差=抽样标准误差=样本平均数的标准差（它反映抽样平均数与总体平均数的平均误差程度）例题：某班组4个工人的月工资（N=4）分别是：1400元，1500元，1600元，1700元，现用重复简单随机抽样的方法从全及总体中抽选出容量大小为2的样本（n=2），求抽样平均误差？解：全及总体平均工资)(15501700160015001400元=+++=X全及总体标准差()4500002=-=∑NX Xσ抽样平均误差x μ=nnσσ=2=)(0569.792*450000元=例题：某班组4个工人的月工资（N=4）分别是：1400元，1500元，1600元，1700元，现用不重复简单随机抽样的方法从全部总体中抽选容量大小为2的样本（n=2），求抽样平均误差？解：全及总体平均工资)(155041700160015001400元=+++==∑NXX全及总体标准差()4500002=-=∑NX Xσx μ=⎪⎭⎫ ⎝⎛--∙12N n N n σ=)(55.6414244*250000元=--∙例题：某电子元件厂，生产某型号晶体管，按正常生产试验，产品中属于一级品的占70%，现在从10000件晶体管中，抽取100件进行抽查检验，求一级品率的抽样平均误差？解：已知：P=0.7 ， P(1-P)=0.21在重复抽样的情况下，抽样平均误差为：()np p p -=1μ=%58.410021.0=在不重复抽样的情况下，抽样平均误差为：()⎪⎭⎫⎝⎛-∙-=N n n p p p 11μ=%56.410000*********.0=⎪⎭⎫ ⎝⎛-∙参数估计()()⎪⎪⎩⎪⎪⎨⎧→-==+≤≤是概率度是置信度，极限误差）样本指标总体指标极限误差—（样本指标区间估计：求不高的情况准确程度与可靠程度要点估计：适用于推断的t t F t F P α1例题：已知某车间某产品的合格率在某个置信度下的估计区间是（85%，95%），还已知样本容量为100，求置信度？解：显然p p ∆-=85%，p p ∆+=95%，即p=90%，p ∆=5%p ∆=μ⋅t μpt ∆=⇒=()()67.1100%901%90%51=-∙=-∆np p p ()t F =0.9052即置信度为90.51% ★求置信度，只需要求出t影响抽样数目的因素⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧∆样本单位不重置抽样可以少抽些单位，抽样需要多抽一些样本、在同等条件下，重置单位，则反之值越大，则多抽些样本、概率度则反之单位，的值大可以少抽些样本）、允许误差（极限误差越多，则反之值越大，必要抽样数目、总体标准差4321t x σ例题：某城市组织职工家庭生活抽样调查，职工家庭平均每户每月收入的标准差为11.50元，要求把握程度为95.45%，允许误差为1元，问需抽选多少户？解：()t F =0.95452=⇒t ，元元，150.11=∆=x σxt n 222∆=σ=()户529150.1142=∙。

第五章抽样法

抽样的作用

抽样调查能够解决全面调查无法或难以解决的问
题。

抽样调查可以补充和订正全面调查的结果。
抽样调查方法可以用于生产过程中产品质量的检
查和控制。抽样调查方法可以用于对总体的某种假设进行检验，以判断这种假设的真伪，决定行动的取舍。

抽样中的几个基本术语
总体(Population)：调查研究的事物或现象的全体个体(Item unit)：组成总体的每个元素
一、抽样的概念、特点、作用二、抽样中的基本术语（一）总体和样本（二）参数和统计量（三）样本容量和样本个数（四）重复抽样和不重复抽样（五）概率抽样与非概率抽样（六）抽样框三、抽样误差
抽样的概念特点
（一）概念抽样调查是按照随机原则从全部研究对象中抽取一部分单位进行观察，并依据获得的数据对全部研究对象的数量特征做出具有一定可靠性的估计和判断.达到对现象总体认识的一种方法. （二）特点它是按照随机原则从总体中抽取样本。它是由部分推算整体的一种方法。它是运用概率估计的方法。抽样误差可事先计算并加以控制。
抽样中的几个基本术语
X
i 1 N
总体均值
X
i
N
或
X F
i 1 K i
K
i
F
i 1
i
标准差

X
N i 1
i
X
2
N
或
X
K i 1
i K
X Fi
i
2
F
i 1
抽样中的几个基本术语
总体方差
2
( X i X )2
i 1
N
N
或
( X i X ) 2 Fi

《统计学原理》第5章：抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数， θ为样本统计量，则 θ的优良标准为：１若 E(θ ) =θ ，则称 θ为 θ 的无偏估计量（无偏性）
更有效的估计量（有效性）２若σθ1 < σθ2，则称θ1为比θ2
３若越大σθ 越小，则称 θ 为θ 的一致估计量（一致性）
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样类型抽样整群抽样等距抽样多阶段抽样多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个单位构成样本,一共可以抽出的不同样本的数量,一般用M表示. 考虑顺序的不重复抽样考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标：参数（未知量）统计推断样本总体指标：统计量（已知量）
抽样推断的一般问题
抽样推断的特点按随机原则抽取样本运用概率论的理论和方法，用样本指标来推断总体指标。推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用无法或很难进行全面调查而又需要了解其全面情况时某些可以采用全面调查的社会经济现象，也可采用抽样推断。可用于生产过程的质量控制进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理

第5章抽样调查及参数估计(练习题)

第五章抽样调查及参数估计5.1 抽样与抽样分布5.2 参数估计的基本方法5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本容量的确定一、简答题1.什么是抽样推断？用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计？2.什么是抽样误差，影响抽样误差的主要因素有哪些？3.简述概率抽样的五种方式二、填空题1.抽样推断是在随机抽样的基础上，利用样本资料计算样本指标，并据以推算总体数量特征的一种统计分析方法。

2.从全部总体单位中随机抽选样本单位的方法有两种，即重复抽样和不重复抽样。

3.常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等四种。

4.影响抽样误差大小的因素有总体各单位标志值的差异程度、抽样单位数的多少、抽样方法和抽样调查的组织形式。

5.总体参数区间估计必须具备估计值、概率保证程度或概率度、抽样极限误差等三个要素。

6.从总体单位数为N的总体中抽取容量为n的样本，在重复抽样和不重复抽样条件下，可能的样本个数分别是______________和_____________。

7.简单随机_抽样是最基本的抽样组织方式，也是其他复杂抽样设计的基础。

8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。

三、选择题1.抽样调查需要遵守的基本原则是（ B ）。

A．准确性原则 B．随机性原则 C．代表性原则 D．可靠性原则2.抽样调查的主要目的是（ A ）。

A．用样本指标推断总体指标 B．用总体指标推断样本指标C．弥补普查资料的不足 D．节约经费开支3.抽样平均误差反映了样本指标与总体指标之间的（ B ）。

A．实际误差 B．实际误差的平均数C．可能的误差范围 D．实际的误差范围4.对某种连续生产的产品进行质量检验，要求每隔一小时抽出10分钟的产品进行检验，这种抽查方式是（ D ）。

A．简单随机抽样 B．类型抽样 C．等距抽样 D．整群抽样5.在其他情况一定的情况下，样本单位数与抽样误差之间的关系是（ B ）。

医药统计学第五章抽样分布

3、总体参数（parameter）: 总体X 的数字特征即总体的特征指标。
eg：、。
（三）样本（sample）：数理统计方法实质上是由局部来推断整体，即通过一些个体的特征来推断总体的特征。 eg：观察某显像管厂所有显像管的平均寿命。
1、抽样研究（sampling）：在实际工作中，所要研究的总体无论是有限的还是无限的，通常都是采用抽样研究。
抽样：依照一定的规则从总体X 中抽取n个个体，然后对这
些个体进行测试或观察得到一组数据
。
目的：抽样研究的目的是用样本信息推断总体特征。
eg：
从上例的有限总体（浙江省2006年7岁健康男孩）中，按照随机化
原则抽取100名7岁健康男孩，他们的身高值
即为样本。因
此，从总体中抽取样本的过程为抽样，抽样方法有多种。
第四章抽样分布
数理统计基本概念抽样分布
学习目的和要求
掌握总体、样本、统计量、标准误等数理统计的基本概
念；查表求 2 分布、t 分布、Ｆ分布的临界值及其定理；
熟悉 X 的分布、 2分布、t 分布、Ｆ分布定义、性质和应
用。
数理统计的基本任务：
实验或调查
以概率论为理论基础，通过样本提供的信息，对总体的统计规律和特征进行估计与推断，其实用性较强。
1、 2分布（chi-square distribution）：是指数分布的改进，
尤其当n较大时， 2分布可全面反映随机变量的分布。
eg: 寿命、保险等资料。
定义：设随机变量
为相互独立且服从标准
正态分布N（0，1），则称随机变量
2= X12 + X22 +X32 + … + … +Xn2

第五章《用样本推断总体》复习讲义(解析版)

第五章用样本推断总体（考点讲义）1.样本容量：样本中个体的数目叫做样本容量。

2.在用样本特性估计总体特性时，要注意一是样本要有代表性，二是样本容量要足够大。

3.求平均数的公式：123nx x x x x n++++=L【类型一】利用样本平均数估算总体数量【例1】为了创设全新的校园文化氛围，进一步组织学生开展课外阅读，让学生在丰富多彩的书海中，扩大知识源，亲近母语，提高文学素养．某校准备开展“与经典为友、与名著为伴”的阅读活动，活动前对本校学生进行了“你最喜欢的图书类型（只写一项）”的随机抽样调查，相关数据统计如下：请根据以上信息解答下列问题：(1)该校对_____名学生进行了抽样调查,m = _____n =_____(2)请将图1和图2补充完整，并求出扇形统计图中小说所对应的圆心角度数；(3)已知该校共有学生800人，利用样本数据估计全校学生中最喜欢科幻人数约为多少人？【解析】（1）用其它初一它的百分比即可；（2）用360∘乘以所占得百分比；（3）用样本估计总体．解：(1)20÷10%=200（名）．由图1，得n=40，m=100-20-10-40=30答：该校对200名学生进行了抽样调查；m=30,n=40(2)如图：小说对应的圆心角度数为360∘×20%=72∘；(3)800×30%=240．答：全校学生中最喜欢小说的人数约为240名．【对应训练1】为了估计湖里有多少条鱼，小刚先从湖里捞出了100条鱼做上标记，然后放回湖里去．经过一段时间，带有标记的鱼完全混合于鱼群后，小刚又从湖里捞出200条鱼，如果其中15条有标记，那么估计湖里有鱼()A.1333条B.3000条C.300条D.1500条【答案】A【解析】在样本中“捕捞200条鱼，发现其中15条有标记”，即可求得有标记的所占比例，而这一比例也适用于整体，据此即可解答．【对应训练2】我国古代数学名著《九章算术》有“米谷粒分”．粮仓开仓收粮，有人送来谷米1608石，验得其中夹有谷粒．现从中抽取谷米一把，共数得256粒，其中夹有谷粒32粒，则这批谷米内夹有谷粒约是________石．【答案】201【解析】根据256粒内夹谷32粒，可得比例，再乘以1608石，即可得出答案．【解答】解：根据题意，得1608×32=201（石），256∴这批谷米内夹有谷粒约201石.【对应训练3】某山区中学280名学生参加植树节活动，要求每人植3至6棵，活动结束后随机抽查了若干名学生每人的植树量，并分为四种类型，A:3棵；B:4棵；C:5棵；D:6棵，将各类的人数绘制成扇形图（如图1）和条形图（如图2）．回答下列问题：（1）这次调查一共抽查了________名学生的植树量；请将条形图补充完整；（2）被调查学生每人植树量的众数是________棵、中位数是________棵；（3）求被调查学生每人植树量的平均数，并估计这280名学生共植树多少棵？【解析】（1）由B类型的人数及其所占百分比可得总人数，总人数乘以D类型的对应的百分比即可求出其人数，据此可补全图形；（2）根据众数和中位数的概念可得答案；（3）先求出样本的平均数，再乘以总人数即可．【解答】（1）这次调查一共抽查植树的学生人数为8÷40%=20（人），D类人数=20×10%=2（人）；条形图补充如图：（2）植树4棵的人数最多，则众数是4，共有20人植树，其中位数是第10、11人植树数量的平均数，则中位数是4，（3）x=4×48×562×7=5.3（棵），205.3×280=148（棵）．答：估计这3280名学生共植树1484棵．【类型二】用样本估计总体【例2】为了提高学生的综合素养，某校开设了五门第二课堂活动课，按照类别分为：A“剪纸”、B“绘画”、C“雕刻”、D“泥塑”、E“插花”．为了了解学生对每种活动课的喜爱情况，随机抽取了部分同学进行调查，将调查结果绘制成如下两幅不完整的统计图．根据信息，回答下列问题：(1)本次调查的样本容量为________，统计图中的a=________，b=________；(2)通过计算补全条形统计图；(3)该校共有3000名学生，请你估计全校喜爱“雕刻”的学生人数.解：(1)样本容量为1815％=120，a=120×10％=12，b=120×30％=36.故答案为：120；12；36.(2)组频数：120―18―12―30―36=24（人），补全条形统计图如图所示：(3)3000×30120=750（人），答：该校喜爱“雕刻”约有750人.【跟踪训练1】在一个不透明的盒子中装有20个黄、白两种颜色的乒乓球，除颜色外其它都相同，小明进行了多次摸球试验，发现摸到白色乒乓球的频率稳定在0.2左右，由此可知盒子中黄色乒乓球约有…（）A.2个B.4个C.18个D.16个【答案】D【跟踪训练2】质检部门从1000件电子元件中随机抽取100件进行检测，其中有2件是次品．试据此估计这批电子元件中大约有________件次品．【答案】20【解析】根据随机抽取100件进行检测，其中有2件是次品，可以计算出这批电子元件中大约有多少件次品．【跟踪训练3】书籍是人类进步的阶梯．为了解学生的课外阅读情况，某校随机抽查了部分学生本学期阅读课外书的册数，并绘制出如下统计图．(1)共抽查了多少名学生？(2)请补全条形统计图，并写出被抽查学生本学期阅读课外书册数的众数、中位数；(3)根据抽查结果，请估计该校1200名学生中本学期课外阅读5册书的学生人数．解：(1)12÷30%=40（名）．(2)如图所示，由图知，众数为5，中位数为5．(3)∵抽查的样本中，课外阅读5册书的学生人数占14×100%=35%，40∴估计该校学生课外阅读5册书的学生人数约占35%，∴该校1200名学生中课外阅读5册书的学生人数约为1200×35%=420（人）．【类型三】用样本频率估计总体频率【例3】中长跑（男生1000m，女生800m）是河南省某市中招体育考试的必考项目．甲、乙两校为了解本校九年级学生的训练情况，各随机抽取了20名九年级学生的中长跑模拟测试成绩(满分：30分)，将成绩进行统计、整理与分析，过程如下：【收集数据】【整理数据】整理以上数据，得到模拟测试成绩x（分）的频数分布表．【分析数据】根据以上数据，得到以下统计量．根据以上信息，回答下列问题：(1)填空：a= ________，b=_________, m=________, n=________；(2)综合上表中的统计量，推断________校学生中长跑成绩更好，理由为________（写出一条即可）(3)若甲、乙两校各有800名学生，请估计两校中长跑模拟测试成绩不低于25分的学生一共有多少名？解：(1)由数据可得，a=7，b=8，m=24.75，n=23.4. 故答案为：7；8；24.75；23.4.(2)甲校学生成绩的平均数比乙校学生成绩的平均数高，且甲校学生成绩的方差比乙校学生成绩的方差小，成绩较稳定．（答案不唯一，合理即可）故答案为：甲.=720（名）,(3)(800+800)×1082020答：估计两校中长跑模拟测试成绩不低于25分的学生一共有720名．【跟踪训练】今年是建党100周年，为了让全校学生牢固树立爱国爱党的崇高信念，某校开展了形式多样的党史学习教育活动，八、九年级（各有500名学生）举行了一次党史知识竞答（满分为100分），然后随机各抽取20名同学的成绩进行了收集、统计与分析，过程如下：【收集数据】两个年级抽取的20名同学的成绩如下表：八年级：7968878985598997898998938586899077898379九年级：8688979194625194877194789255979294948598【整理数据】将两个年级的抽样成绩进行分组整理：成绩x（分）50≤x<6060≤x<7070≤x<8080≤x<9090≤x<100八年级113114九年级2a b411【分析数据】抽样的平均数、众数、中位数、方差和优秀率（90分及以上为优秀）如下表：年级统计量平均数众数中位数方差优秀率八年级8589c80.420%九年级859491.5192d请根据以下信息，回答下列问题：(1)填空：a=________，b= ________，c=________，d=________；(2)请估计此次知识竞答中，八年级成绩优秀的学生人数；(3)小李同学认为九年级的整体成绩更好，请从至少两个方面分析其合理性．解：(1)由表中数据可知，九年级落在60≤x<70内的只有62，故a=1；九年级落在70≤x<80内的有71，78，故b=2；八年级成绩按照从小到大的顺序排列后，落在第10，11的数为87，89，∴中位数为88，故c=88；九年级90分及以上的学生有11人，∴九年级的优秀率为1120×100%=55%.故答案为：1；2；88；55%.(2)∵500×20%=100，∴估计此次知识竞答中，八年级成绩优秀的学生人数为100人.(3)九年级抽样成绩的众数，中位数和优秀率均高于八年级，说明九年级平均成绩更高，高分更多，因此九年级整体成绩更好．【类型四】用样本推断总体的实际应用【例4】某运动鞋经销商随机调查某校40名女生的运动鞋号码，结果如下表：鞋的号码35.53636.53737.5人数4616122现在该经销商要进200双上述五种运动鞋，你认为应该怎样进货比较合理？解析：先求出各鞋码所占比例，再乘200，即可得到所需进货数.解：由表中数据可知各鞋码的女生的比例，根据比例进货.需要进35.5码运动鞋：200×440＝20（双），需要进36码运动鞋：200×640＝30（双）需要进36.5码运动鞋：200×1640＝80（双），需要进37码运动鞋：200×1240＝60（双）需要进37.5码运动鞋：200×240＝10（双）。

第5章抽样分布与参数估计

第5章抽样分布与参数估计在统计学中，抽样分布与参数估计是重要的概念。

抽样分布是指从总体中随机抽取样本，计算样本统计量，然后将这些统计量进行分布的过程。

参数估计是通过样本数据对总体参数进行估计的方法。

首先，我们来了解抽样分布。

在统计学中，我们通常很难直接获得总体数据，因为总体数据往往很大，难以收集。

因此，我们采用抽样的方式来获取样本数据，并通过样本数据来推断总体特征。

抽样分布是指在重复抽取样本的过程中得到的统计量的分布。

抽样分布的中心趋于总体参数，而抽样分布的形状可以通过中心极限定理进行描述。

中心极限定理认为，当样本数量足够大时，样本均值的抽样分布近似服从正态分布，且均值等于总体均值。

这对于统计推断和参数估计具有重要意义。

其次，我们来了解参数估计的概念及其方法。

参数估计是指根据样本数据对总体参数进行估计的统计方法。

常见的参数包括总体均值、总体方差等。

参数估计可以分为点估计和区间估计两种方法。

点估计是指通过样本数据计算得到的单个数值来估计总体参数。

常用的点估计方法包括最大似然估计和矩估计。

最大似然估计是基于样本的观测值选择使得观测值出现的概率最大的参数值作为估计值的方法。

矩估计是通过样本矩与总体矩的对应关系来估计总体参数的方法。

区间估计是指对总体参数给出一个区间估计值，该区间包含了真实参数值的概率。

常用的区间估计方法包括置信区间估计和预测区间估计。

置信区间估计是通过样本数据计算得到的一个区间，可以包含真实参数值的概率。

置信区间的置信水平是指在多次重复抽样中，这个区间包含了真实参数值的概率。

预测区间估计是在给定自变量取值的情况下，通过样本数据对应的因变量的取值的一个区间估计。

总之，抽样分布与参数估计是统计学中重要的概念和方法。

通过抽样分布可以了解样本统计量的分布情况，而参数估计可以通过样本数据对总体参数进行估计。

这些概念和方法对于数据分析和决策具有重要的实际应用价值。

关于对统计推断中抽样分布的总结及判别

关于对统计推断中抽样分布的总结及判别统计推断是概括地利用样本数据进行总体特性分析和进行总体特性判断的一种方法。

而抽样分布是统计推断的基础，它是指从总体中抽取多个样本，并根据样本数据计算出一种统计量的分布。

通过对抽样分布的分析和判断，可以对总体的一些特性进行估计和推断。

抽样分布有很多种类型，下面将对其中常见的几种进行总结和判别。

首先是均值的抽样分布，它是指从总体中抽取多个样本并计算出样本均值的分布。

根据中心极限定理，当样本容量足够大时（通常大于30），样本均值的抽样分布近似服从正态分布。

这个结论非常重要，因为正态分布具有许多重要的数学性质，可以方便地进行推断。

当总体分布未知时，可以使用样本均值的抽样分布进行总体均值的置信区间估计和假设检验。

其次是比例的抽样分布，它是指从总体中抽取多个样本并计算出样本比例的分布。

对于大样本而言，样本比例的抽样分布近似服从正态分布。

和样本均值一样，样本比例也适用于总体比例的置信区间估计和假设检验。

在判别抽样分布时，通常需要进行假设检验。

假设检验是基于样本数据进行的，其中包括原假设和备择假设。

原假设是指对总体特性进行的某种假设，备择假设是对原假设的补充或对立的假设。

根据样本数据计算出的统计量会与假设进行比较，并计算出一个p值来判断原假设是否可接受。

具体而言，如果p值小于事先设定的显著性水平，则拒绝原假设，接受备择假设；如果p值大于显著性水平，则无法拒绝原假设。

除了假设检验，还可以利用抽样分布进行置信区间的估计。

置信区间是关于总体特性的一个区间估计，表示总体参数的一个范围，其中包括了抽样分布的变化范围。

置信区间的计算通常基于抽样分布的性质和中心极限定理，可以用来估计总体的平均值、比例、差异等。

抽样分布是统计推断的基础，它可以用来进行总体特性的估计和判断。

在应用抽样分布时，需要了解不同类型抽样分布的特性，并掌握假设检验和置信区间估计的方法。

抽样分布的理论和应用在很多领域都有重要的应用，对于定量分析和决策有着重要的意义。

抽样分布公式总结从样本到总体的推断基础

抽样分布公式总结从样本到总体的推断基础引言在统计学中，抽样是一种常用的研究方法，通过从总体中选取一部分个体来代表整体，从而进行总体特征的估计和假设的推断。

抽样分布则是在给定样本量和总体分布情况下，研究抽样统计量的分布情况。

本文将总结抽样分布的基本公式，从样本到总体的推断基础。

一、样本均值的抽样分布当样本容量n足够大时，样本均值的抽样分布近似服从正态分布，其中：1. 点估计的抽样分布公式样本均值的期望值E(ȳ)等于总体均值μ，即：E(ȳ) = μ样本均值的方差V(ȳ)等于总体方差σ^2除以样本容量n，即：V(ȳ) = σ^2/n其中，σ^2为总体方差。

2. 区间估计的抽样分布公式样本均值的标准差σ(ȳ)等于总体标准差σ除以样本容量n的平方根，即：σ(ȳ) = σ/√n根据正态分布的性质，样本均值与总体均值之间的差异服从一个以0为均值、σ(ȳ)为标准差的正态分布。

因此，我们可以利用样本均值与总体均值之间的差异来构建置信区间，从而进行总体均值的估计。

二、样本比例的抽样分布当样本容量n足够大时，样本比例的抽样分布近似服从正态分布，其中：1. 点估计的抽样分布公式样本比例的期望值E(p)等于总体比例π，即：E(p) = π样本比例的方差V(p)等于总体比例π(1-π)除以样本容量n，即：V(p) = π(1-π)/n其中，π为总体比例。

2. 区间估计的抽样分布公式样本比例的标准差σ(p)等于总体比例π(1-π)/n的平方根，即：σ(p) = √(π(1-π)/n)根据正态分布的性质，样本比例与总体比例之间的差异服从一个以0为均值、σ(p)为标准差的正态分布。

因此，我们可以利用样本比例与总体比例之间的差异来构建置信区间，从而进行总体比例的估计。

三、样本差异的抽样分布当两个样本容量n1和n2都足够大时，样本差异（两个样本均值之差或两个样本比例之差）的抽样分布近似服从正态分布，其中：1. 点估计的抽样分布公式样本差异的期望值E(ȳ1-ȳ2)等于总体均值之差μ1-μ2，即：E(ȳ1-ȳ2) = μ1-μ2样本差异的方差V(ȳ1-ȳ2)等于两个总体方差σ1^2/n1和σ2^2/n2之和，即：V(ȳ1-ȳ2) = σ1^2/n1 + σ2^2/n2其中，σ1^2和σ2^2为两个总体方差。

黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解第5章抽样分布与抽样方法【圣才出品

②性质
(s 1) s (s)
(n 1) n!
（2） 2 (n) 分布的密度函数和主要性质
① 2 (n) 分布的密度函数
f
(x)
2n/2
1 (n
/
2)
x
n 2
1e
x
2，x
0
0，
x 0
②主要性质
a．如果 X~ 2 (n) ，则 E（X）=n，Var （X）=2n； b．如果 X1~ 2 (n) ，X2~ 2 (n) 且相互独立，则 X1+X2~ 2 (n1 n2 ) 。

其特点是：①n 个单位的样本由 n 次抽取的结果构成；②每次抽取的结果不是独立的。 ③虽然在同次试验中每个单位被抽取到的概率相同，但在不同次的试验中被抽取到的概率是不相等的。
如果考虑顺序，其总样本个数为 PNn N ! (N n)!。如果不考虑顺序，总样本个数为 CNn N !/[（N n）!n!] ，每个样本被抽取到的概率都为1/ CNn 1 (N n)!n / N ! 。
i
类子总体的均值和方差分别为
i
，
2 i
。那么，样本均值
样本均值的数学期望
E(
X
)
。样本均值的方差（抽样标准误差）
2 X
k i 1
(
ni n
)2
2 Xi
①重置抽样
②不重置抽样
或
（2）整群抽样整群抽样就是将总体的所有单位分成若干群，然后从其中随机抽取部分群，接着对中选的群进行全面调查的抽样方式。设总体的全部 N 个单位被划分为 R 群，每群都含有 M 个单位。现在从总体的所有 R
Dn
max
1k n
Xk
min 1k n

统计学5章

在重复简单随机抽样时，样本平均数的抽样分布
有数学期望值 E ( x ) = a a 代表全及总体平均数）（
设总体变量有 N 个：X1，X2，… ， XN，则
样本容量为 n：x1 ， x2 ， … ， xn ，则：
X1 X 2 X N X= N
x1 x2 xn x = n
∵ ∴ =
2 x
x1, x2,…, xn相互独立
1 n2 E x1 X

2
E x2 X

2
E xn X
2

2
E ( xi X )( x j X ) i j
=
1 n2 1 n2
E ( x X )2 E x X 1 2 E X X
对于属性总体来说则有如下对应样本指标：设样本总体 n 个单位中有 n1 个单位具有某种属性， n0 个单位不具有某种属性，且n1 +n0 = n 。则：
n1 p n n0 n n1 q 1 p n n
样本标准差
s
p1 p
（二）参数和统计量
（三）样本容量与样本个数
样本容量是指一个样本所包含的单位数，用 n 来表示。一般地讲，样本单位数达到或超过30个的样本称为大样本，而在30个以下称为小样本。样本个数又称样本可能数目，是指从全及总体中
二、抽样推断的几个基本概念
抽样推断的几个基本概念（见图5-1）。
图5-1 抽样推断的几个基本概念
（一）总体和样本
在抽样推断中面临两个不同的总体，即全及总体和样本总体（见图5-2）。
图5-2 全及总体和样本总体关系示意
（一）总体和样本

统计学第五章抽样推断

统计学第五章抽样推断二、单项选择题１、对总体的数量特征进行抽样估计的前提是抽样必须遵循（B）。

A.大量性B.随机性C.可靠性D.准确性２、一般认为大样本的样本单位数至少要大于（A）。

A.30B.50C.100D.2003、抽样平均误差是指（D）。

A.抽中样本的样本指标与总体指标的实际误差B.抽中样本的样本指标与总体指标的误差范围C.所有可能样本的抽样误差的算术平均数D.所有可能样本的样本指标的标准差4、在其它条件相同的情况下，重复抽样的抽样误差（A）不重复抽样的抽样误差。

A.大于B.小于C.总是等于D.通常小于或等于5、在其它条件不变的情况下，要使抽样误差减少1/3，样本单位数必须增加（D）。

A.1/3B.1.25倍C.3倍D.9倍6、从产品生产线上每隔10分钟抽取一件产品进行质量检验。

推断全天产品的合格率时，其抽样平均误差常常是按（C）的误差公式近似计算的。

A.简单随机抽样B.整群抽样C.等距抽样D.类型抽样7、通常使样本单位在总体中分布最不均匀的抽样组织方式是（B）。

A.简单随机抽样B.整群抽样C.分层抽样D.等距抽样9、抽样平均误差和极限误差的关系是（D）A抽样平均误差大于极限误差B抽样平均误差等于极限误差C抽样平均误差小于极限误差D抽样平均误差大于、等于、小于极限误差都可能10、抽样平均误差的实质是（D）A、总体标准差B、样本标准差C、抽样误差的标准差D、全部可能样本平均数的标准差三、多项选择题C、可以计算抽样误差D、以概率论和数理统计学为理论基础２、影响抽样平均误差大小的因素有（ABCD）。

A、总体各单位标志值的差异程度B、抽样数目C、样本各单位标志值的差异程度D、抽样组织方式E、抽样推断的把握程度３、影响必要的抽样数目的因素有（BCDE）。

A、总体各单位标志值的差异程度B、样本各单位标志值的差异程度C、抽样方法和抽样组织方式D、抽样推断的把握程度E、允许误差４、计算抽样平均误差时，由于总体方差是未知的，通常有下列代替方法（ACE）。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

统计分布
概率统计分布抽样统计分布
离散性连续性
单变量
多变量
0-1分布
二项分布B（n,p）
泊松分布P()
Pλ
超几何分布
()
,
,
H k n N
大样本
小样本
样本均值分布
样本成数分布
样本方差分布
样本均值之差分布
样本成数之差分布
样本方差纸币分布正态分布)2
N u,σ
（
平均分布G（a,b）
指数分布()
Bλ
开方分布()
2
x n
统计分布
概率分布抽样分布
离散性连续性单变量多变量
概率分布
离散性连续性
0-1分布二项分布B （n,p ）大样本小样本
泊松分布P （λ）超几何分布H （k ，N ，n ）正态分布N
平均分布G （a ，b ）
指数分布
开方分布
T 分布t （n ）
F 分布F （n ，m ）
()
2
,μσ()
2X n 概率分布
z
z z z
z z
抽样分布
单变量多变量
样本均值分布样本成数分布样本方差分布样本均值之差分布样本成数之差分布样本方差之比分布
z z
()
z
⎜
z z
124.86126.443.26/25 3.26/253.26/25 3.26/25X −≤
z
z
10
z
z
101 10
N N N X
×+×
==∑
z z z
z z
z (
0.030.050.0750.05
p
−−
≤≤
z z
z z
z
z
22
12
,
X X N
σσ
μμ
⎛
−−+
⎜
∼
z
都近似的服从正态分布，其成数之差也服从正z
z
z
1122
+
11112222
+
⎜⎟⎜
z
11
z z
z z z
z z z z
z z
z z z z
z z n
2
(1)
n n N σ
−
z z z z
z
在其他条件相同的情况下，重复抽样和不重复抽样仅差一个修正均误差小于重复抽样的平均误差的
z
(1)
p p n
−(1)(1)p p n
n N
−−(1)n N
−1n
n −1n N
−
z
z
2
n
σ
2
(1)n n N
σ
−(1)
p p n
−(1)(1)p p n
n N
−−
z z z
z z z
z
是参数的一个估计量，z ˆn θθ−
z z z z z
z z z z z z。

第五章抽样分布

页数:3
曾五一《统计学导论》(第2版)配套题库【课后习题】第五章抽样分布与参数估计【圣才出品】

页数:8
第五章抽样分布与推断

页数:36
第5章抽样分布与参数估计

页数:70
第 5 章抽样调查及参数估计(练习题)

页数:5
第5章样本及抽样分布课后习题答案(高教出版社,浙江大学)

页数:5
第五章抽样理论解析

页数:20
第五章抽样分布与参数估计

页数:39
第五章抽样与抽样分布

页数:38
第五章抽样与抽样分布

页数:40

第五章抽样分布与推断

合集下载

第5章--抽样分布与参数估计教案资料

社会统计学第五章正态分布

抽样分布及总体平均数的推断

第五章统计推断(1)

抽样与抽样分布(试题及答案)

统计学第五章

第五章抽样法

《统计学原理》第5章：抽样推断

第5章抽样调查及参数估计(练习题)

医药统计学第五章抽样分布

第五章《用样本推断总体》复习讲义(解析版)

第5章抽样分布与参数估计

关于对统计推断中抽样分布的总结及判别

抽样分布公式总结从样本到总体的推断基础

黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解第5章抽样分布与抽样方法【圣才出品

统计学5章

统计学第五章抽样推断

文档推荐

最新文档

第五章 抽样分布与推断

合集下载

第5章--抽样分布与参数估计教案资料

社会统计学 第五章 正态分布

抽样分布及总体平均数的推断

第五章 统计推断(1)

抽样与抽样分布(试题及答案)

统计学 第五章

第五章 抽样法

《统计学原理》第5章：抽样推断

第5章抽样调查及参数估计(练习题)

医药统计学 第五章 抽样分布

第五章《用样本推断总体》复习讲义(解析版)

第5章抽样分布与参数估计

关于对统计推断中抽样分布的总结及判别

抽样分布公式总结从样本到总体的推断基础

黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解 第5章 抽样分布与抽样方法 【圣才出品

统计学5章

统计学第五章抽样推断

文档推荐

最新文档

第五章抽样分布与推断

社会统计学第五章正态分布

第五章统计推断(1)

统计学第五章

第五章抽样法

医药统计学第五章抽样分布

黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解第5章抽样分布与抽样方法【圣才出品