- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.
1.从总体到样本方向的研究。即从已知
.
的总体中,按照一定的样本容量n随机抽
取一系列样本,研究样本统计量的分布
规律。这属于抽样分布问题。
.
2.从样本到总体方向的研究。即由已知
.
样本推断未知的总体。这属于统计推断
问题。
二.总体参数与样本统计量
.
描述总体数据分布特征的数值称为总体
.
参数。如总体平均数m , 总体标准差s 。
.
描述样本数据分布特征的数值称为样本
统计量。如样本平均数、样本标准差。
三.样本统计量的分布—抽样分布
从一个已知的总体中,独立地随机抽
.
取含量为n的样本,所得样本统计量(如
.
样本平均数、样本标准差)的概率分布称
为样本统计量的分布,又称为抽样分布。
把样本平均数的概率分布称之为样本平 均数的抽样分布;
.
.
③ c2分布的取值范围0—+∞。 ④ c2分布曲线与横坐标轴所围成的面
积等于1。
. .
. .
.
(三)c2分布的临界值
.
c2分布的临界值有上侧临界值和下侧
.
临界值。
上侧临界值记为 c2a,满足P(c2>c2a)=a
下侧临界值记为 c21a 满足P(c2 <c21a )=a
.
.
一定自由度下的c2a和c21a临界值由
1
F0.95,4,20 F0.05,20,4 5.802 0.172
.
.
它满足 PF 0.172 0.05(见示意图)
. . .
. .
.
PF 0.172 0.05 示意图
.
.
个总体的样本平均数所构成的差数也服
.
从正态分布。
2、样本平均数差数的平均数等于两个原
总体平均数之差。
3、样本平均数差数的方差等于两个原总 体的样本平均数方差之和。
.
.
4、当两个总体方差未知时,根据样本容
量的大小,样本平均数差的分布有以下
两种情况:
(1)两个总体方差未知,但两个样本为大样本:
.
.
(2)两个总体方差未知,但两个样本为小样本:
这时,样本平均数服从df=n-1的t分布。
统计量t 的定义:
xm
t
.
s
.
t分布的特性:
n
.
. .
① t 分布曲线与标准正态分布相似,也呈左右
对称分布。
.
② t分布曲线的形状随自由度df 的改变而变化。
.
③ t分布曲线的取值范围为-∞ — +∞。
④ t分布曲线与横坐标轴围成的面积等于1。
t分布的临界值:
第三章 抽样分布
第一节 抽样分布的概念 第二节 从一个正态总体中抽取的
样本统计量的分布
第三节 从两个正态总体中抽取的 样本统计量的分布
一.总体与样本的关系
.
总体是研究对像的全体,样本则是
.
来自总体中的一部分个体。在一定程度
.
上,样本可以代表所属总体。
总体与样本之间的关系,可从两个方 向进行研究: (见示意图)
(一)两个样本方差比分布的定义
.
设有两个相互独立的正态总体 N (m1,s12)
.
和N (m2,s22),从第一个正态总体中以样
.
本含量n1抽取样本,计算样本方差
s12, df1 n1 1; 从第二个正态总体中以样
本含量n2抽取样本,计算样本方差
s22, df2 n2 1, 则定义:
.
s12
.
t分布的临界值分为单侧临界值和双侧
.
临界值。
.
单侧临界值又分为上侧临界值ta和下侧
临界值-ta。上侧临界值ta满足P(t > ta)=a;
下侧临界值-ta满足P(t < -ta)=a。
. .
. .
. . .
.
.
ta值由附表4a查出。
例如,df=9, a=0.05上侧临界值t0.05=1.833,
.
下侧临界值 -t0.05= -1.833。
.
.
t分布的双侧临界值记为ta/2或ta(双侧) ,
满足 P( t >ta/2)=a 。
.
.
. .
ta/2值由附表4b查出。
.
例 如 , df=9, a=0.05, 双 侧 临 界 值
.
t0.025=2.262,或t0.05(双侧) =2.262。
(一)样本方差分布的定义
.
量 n2 随 机 抽 取 m 个 样 本 , 计 算 样 本 平 均 数 x21, x22, , x2m ;将来自两个总体的
.
样本平均数进行所有可能的比较,求得
km个差数,由km个差数所构成的概率分
布称为两个样本平均数差的分布。
.
.
(二)两个样本平均数差分布的特性
.
1、如果两个总体为正态分布,则来自两
.
. .
. .
P(c2<3.325)=0.05示意图
.
(一)两个样本平均数差分布的定义
.
假定有两个相互独立的正态总体
.
N(m1,s12)和N(m2,s22),从第一个正态总
体N(m1,s12 ) 中以样本含量n1随机抽取k
个样本,计算样本平均数 x11, x12 , , x1k.
从第二个正态总体N(m2,s22)中以样本含
.
F
s
2 1
s22
.
s
2 2
当
s
2 1
s
2 2
时,上式简化为
F
s12 s22
.
F服从自由度df1 n1 1和 df2 n2 1的F分布。
(二)F分布的特性
.
. .
.
.
① F分布曲线呈偏态。
② F分布曲线的形状由分子自由度df1和 分母自由度df2决定。
.
③ F分布的取值范围0—+∞。
.
④ F分布曲线与横坐标轴所围成的面积
均数 x1, x2 , , xk ,因为样本平均数x 为
随机变量,由k个样本平均数所构成的概
率分布称为样本平均数的分布,又称为
.
样本平均数的抽样分布。(见示意图)
.
. .
(二)样本平均数分布的特性
.
1.从一个正态总体N(m ,s2)中随机抽取
.
的样本,无论样本容量n大或小,其样本
.
平均数服从正态分布。
2.样本平均数分布的平均数等于原总体
的平均数。
3.样本平均数分布的方差等于原总体方
.
差的1/n倍。
.
4.从一个非正态总体(m ,s2)中随机抽取
样本,当样本容量n大于30时,样本平
均数也服从正态分布,称之为中心极限
定理。
.
在通常情况下,总体方差s2未知(可由
.
样本方差s2估计),若样本容量n小于30,
.
.
. .
②在自由度df1和df2下, F分布的下侧临
.
界值F1-a可以通过下式求出:
.
1
.
F F 1a ,df1 ,df2
a ,df2 ,df1
例如,计算df1 =4 ,df2=20, a=0.05 的下侧 临界值F0.95。
.
由附表7查出 F0.05,20,4 5.802 ,代入上式:
.
1
等于1。
(三)F分布的临界值
.
F分布的上侧临界值记为Fa,满足
.
P(F>Fa)=a;下侧临界值记为F1-a,满足
.
P(F<F1-a)=a。
①在自由度df1和df2下, F分布的上侧临界
值Fa由附表7查出。
例如,df1 =4 ,df2=20, a=0.05 的上侧临界
值 F0.05,4,20 2.866 ,满足 PF 2.866 0.05
附表6查出。
. .
例如,由附表查得 df=9, a0.05的上
.
侧临界值c20.0516.919 , 即:
.
.
P(c2>16.919)=0.05
. .
.
P(c2>16.919)=0.05示意图
.
.
同样,由附表6查得df=9,a0.05的下侧临
.
界值 c20.953.325 , P(c2<3.325)=0.05 。
把样本标准差的概率分布称之为样本标
准差的抽样分布。
. . .
. .
在生物学中,遇到最多的是正态总体。
下面主要介绍几种从正态总体中抽取的样本
.
统计量的分布。
.
(一)样本平均数分布的定义
.
从一个已知的正态总体(m ,s2)中,
.
以样本含量n独立地随机抽取尽可能多的
.
样本(例如k个样本),分别计算样本平
.
从样本,计算出样本方差S2,
.
标准化的S2定义为c2。
c
2
n
1s2
s2
统计量c2服从df=n-1的c2分布。c2分布
是随自由度的改变而变化的一组曲线。
.
.
. .
(二)c2分布的特性
.
① c2分布曲线呈偏态。
.
② c2分布曲线的形状由自由度df决定。
.