6-第4章抽样分布
- 格式:pps
- 大小:307.00 KB
- 文档页数:28
第四章抽样分布
生物统计学的最基本问题是研究总体与样本间的的关系。
总体与样本之间的关系,可从两个方面研究:
1、由已知的总体研究样本的分布规律,即由总体
到样本的过程。
本章讨论此问题。
2、由样本如何去推断总体,属于从样本到总体的
过程。
以后的章节将讲。
为了解决由总体推断样本的分布规律,我们可以从一个已知的总体中,独立随机地抽取含量为n的样本,研究所得样本的各种统计量(平均数、标准差等)的概率分布,即所谓的抽样分布。
为更好地理解抽样分布概念,我们来举个例子。
假定某个总体只包括5个个体,变量值分别是:50,60,70,80和90,现抽取容量为2的样本(放回式抽样),则总体分布和样本均值分布的情况如下:
表4.1总体分布表
变量X的取值50 60 70 80 90 频率(%)20 20 20 20 20
图4.1 总体概率
分布图
第1个值2值x第1个值2值x第1个值2值x
505050
70
5060
90
5070 605560656075 706070707080 806580758085 907090809090
605055
80
5065 60606070 70657075 80708080 90759085
样本平均数分布的计算
平均数505560657075808590次数123454321
频率(%)1/25
X100
=4
2/25
X100
=8
121620161284
样本平均数的频率分布(每次取2个样本)
表4.2样本均值分布表
图4.2样本均值分布图
样本均值(i x ) 50 55 60 65 70 75 80 85 90 频率(%)
4 8 12 16 20 16 12 8 4
总体平均数:
11
1
(5060708090)705
N
i
i X N μ===⨯++++=∑1
504%55%904%70
n
i i
i x x f ===⨯+⨯++⨯=∑ 样本平均数(均值)的平均数:
Introduction
总体方差:
()2
2
12221()
1(5070)6070(9070)
200
N
i i X X N N σ==-⎡⎤=⨯-+-++-⎣
⎦=∑ ()
()()()2
2
1
222
50704%55708%90704%100
n
i i
i S x x f ==-=-+-++-=∑ 样本平均数的方差:
从图4.1和图4.2的比较中,可以清晰地看出,抽样分布与总体分布是不同的,在该例中,总体分布为离散均匀分布,而样本均值的分布则成了对称的二项分布。
但存在一定的联系:
x
= µ,S2=100<σ2=200/2
即:抽样分布的均值与总体分布的均值完全相等抽样分布的方差比总体方差要小。
了解抽样分布与总体分布之间的这种关系十分必要,它是建立抽样推断的理论依据。
抽样分布的作用表现在多方面,其中最重要的两点是:
(1)可据抽样分布研究统计量的性质,(2)可对统计推断方法进行评价。
4.1 从一个正态总体中抽取的样本统计
量的分布
4.1.1 样本平均数的分布
4.1.2 样本方差的分布
4.1.1 样本平均数的分布
(1)标准差已知时的平均数的分布
(2)标准差未知时的平均数的分布-t分布
从平均数为μ,标准差为σ的正态总体中,独立随机地抽取含量为n 的样本,其样本平均数为一服从正态分布的随机变量。
它的平均数和方差分别为(实际是求样本平均数的平均数和标准差):
x x n σμμ
σ==
称为标准误差。
平均数进行标准化:
平均数服从N (0, 1)分布。
/n σx u n
μ
σ
-=
-t 分布
若上述总体的标准差未知,可以用样本标准差代替总体标准差,标准化的平均数称为t
x t s
n
μ-=
-t分布
统计量t不再服从N (0,1)分布,而服从n -1自由度的t 分布。
/S n
称为样本标准误差。
t分布也是一种对称分布,在密度函数中只有自由度一个参数,随着自由度的增加,t分布越来越接近于标准正态分布。
不同自由度下的t分布
(2)标准差未知时的平均数的分布
-t 分布
与标准正态分布类似,t 分布的上侧、下侧和双侧临界值,由以下各式给出:
对于给定的α从附表4中可以查出相应的单侧和双侧临界值(t 值)。
()()2P t t P t t P t t αααα
α
α≥=≤-=⎛⎫≥= ⎪⎝⎭
4.1.2 样本方差的分布
从方差为σ2的正态总体中,随机抽取含量为n 的样本,计算出样本方差s 2,标准化的s 2称为χ2。
在这里,χ2服从n -1自由度的卡方分布。
它是概率曲线随
自由度而改变的一类分布。
附表6给出了P(χ2>χ2α) =α时的χ2α值。
()2
2
22
2
1df
n s df s
χσ
σ
-=
=
2是概率曲线随自由度而改变的一类分布
4.2 从两个正态总体中抽取的样本
统计量的分布
4.2.1 标准差σi已知时,两个平均数的和与差的分布
4.2.2 标准差σi未知但相等时,两个平均数的和与差的分布
4.2.3 两个样本方差比的分布—F分布
的和与差的分布
如果两个总体的分布都是正态或近似正态的,平均数的和与差的分布也是正态的
()()1
2
1
2
12
221
2
1
2
x x x x n n μμμσ
σ
σ±±=±=
+
()22
121212,N n n σσμμ⎡⎤⎛⎫±+⎢⎥
⎪⎝⎭⎣
⎦
的和与差的分布
标准化的变量服从标准正态分布
()()12122
21
2
1
2
x x u n n μμσ
σ
±-±=
+
4.2.2 标准差σi 未知但相等时,两个
平均数的和与差的分布
当σ1和σ2未知时,可用s 1和s 2代替,标准化变量t 服从(df 1+df 2)自由度的t 分布,统计量t 为:
()()()()()()12121222
11221212111111df df x x t n s n s n n n n μμ+±-±=
-+-⎛⎫
+ ⎪
-+-⎝⎭
统计量F 的定义为:
21212222
s
F s
σσ
=
F分布的密度函数是由两个自由度df1和df2决定的。
属于不对称分布,分布曲线如下图。