统计学第4章 参数估计和假设检验[精]

  • 格式:ppt
  • 大小:1.41 MB
  • 文档页数:93

下载文档原格式

  / 93
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

简单随机抽样、不重复抽样时,样本均值
抽样分布的方差略小于重复抽样的方差,
等于
2 Nn
n N 1
N n 这一系数称为有限总体校正系数。
N 1
当抽样比(n/N)<0.05时可以忽略有限总 体校正系数。
中央财经大学统计学院 19
4.2 总体均值和比例的区间估计
中央财经大学统计学院 20
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
中央财经大学统计学院 12
抽样分布的一个演示:重复抽 样时样本均值的抽样分布(3)
各样本的均值如下表,并给出样本均值的抽样分布
16个样本的均值(x)
第一个
第二个观察值
观察值 1 2 3 4
1 1.0 1.5 2.0 2.5
2 1.5 2.0 2.5 3.0
n
(xi x)2
2 i1 x
M
பைடு நூலகம்
M为样本数目
(1.02.5)2
(4.02.5)2
2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值
2. 样本均值的方差等于总体方差的1/n
中央财经大学统计学院 14
样本均值的抽样分布与总体分布的 比较
总体分布
.3 .2 .1 0
1
N
中央财经大学统计学院 11
234
抽样分布的一个演示:重复抽样 时样本均值的抽样分布(2)
现从总体中抽取n=2的简单随机样本,在重复
抽样条件下,共有42=16个样本。所有样本的结果 如下表.
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
相关理论


总体正态?
σ2已知?


n≥30?



x Z 2 n
s x t 2
n

x Z 2 n
增大n?数学 变换?
实际中总体方差总是未知的, 因而这是应用最多的公式。在 大样本时t值可以用z值来近似。
根据中心极限定理得 到的近似结果。 σ未知时用s来估计。
中央财经大学统计学院 3
点估计
点估计: 用估计量的数值作为总体参数的估 计值。
一个总体参数的估计量可以有多个 。例如, 在估计总体方差时,
n
(xi x)2 和
i 1
n 都可以作为估计量。
n
(xi x)2
i 1
n 1
中央财经大学统计学院 4
点估计量的常用评价准则:无偏性
抽样分布:几个要点
抽样分布是统计量的分布而不是总体或样本的 分布。
在统计推断中总体的分布一般是未知的,不可 观测的(常常被假设为正态分布)。
样本数据的统计分布是可以直接观测的,最直 观的方式是直方图,可以用来对总体分布进行 检验。
抽样分布一般利用概率统计的理论推导得出, 在应用中也是不能直接观测的。其形状和参数 可能完全不同于总体或样本数据的分布。
1
234
= 2.5
σ2 =1.25
.3 P ( x )
抽样分布
.2
.1
0
1.0 1.5 2.0 2.5 3.0 3.5 4.0
样本均值的抽样分布
x 2.5
2 x
0.625
中央财经大学统计学院 15
样本均值的抽样分布
一般的,当总体服从 N(μ,σ2 )时,来自该总体 的容量为n的样本的均值X也服从正态分布,X 的 期望为μ,方差为σ2/n。即X~N(μ,σ2/n)。
参数估计与假设检验
4.1参数估计 4.2假设检验
中央财经大学统计学院
4.1 参数估计
4.1.1参数估计的基本概念 4.1.2总体均值和比例的区间估计 4.1.3必要样本容量的确定
中央财经大学统计学院 2
4.1.1 参数估计的基本概念
总体
样本
参数
?
统计量
算术平均数 x
用来推断总体参数的统计量称为估计量(estimator), 其取值称 为估计值(estimate) 。 同一个参数可以有多个不同的估计量。 参数是唯一的,但估计量(统计量)是随机变量,取值是不确 定的。
中央财经大学统计学院 10
抽样分布的一个演示:重复抽样 时样本均值的抽样分布(1)
设一个总体含有4 个个体,分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下。
均值和方差
总体的频数分布
N
Xi
.3
i1 2.5
N
.2
N
.1
(Xi )2
0
2 i1
1.25
小样本
x
X
标准误(Standard Error)
简单随机抽样、重复抽样时,样本均 值抽样分布的标准差等于 ,这
n
个指标在统计上称为标准误。 统计软件在对变量进行描述统计时一
般会输出这一结果。
中央财经大学统计学院 18
有限总体校正系数
Finite Population Correction Factor
无偏性:估计量的数学期望与总体待估参 数的真值相等: E(ˆ)
P(ˆ )
无偏
有偏
A
B

ˆ
中央财经大学统计学院 5
区间估计
根据事先确定的置信度1 - 给出总体参数 的一个估计范围。
置信度1 - 的含义是:在同样的方法得到 的所有置信区间中,有100(1- )% 的区间 包含总体参数。
抽样分布是区间估计的理论基础。
置信区间
置信下限
估计值(点估计)
中央财经大学统计学院 8
置信上限
抽样分布 Sampling Distribution
从总体中抽取一个样本量为n的随机样本, 我们可以计算出统计量的一个值。
如果从总体中重复抽取样本量为n的样本, 就可以得到统计量的多个值。
统计量的抽样分布就是这一统计量所有可 能值的概率分布。
=10
n=4
x 5
n =16
x 2.5
= 50 X
总体分布
x 50
X
抽样分布
中央财经大学统计学院 16
中心极限定理
从均值为,方差为 2的一个任意总体中抽取容量 为n的样本,当n充分大时,样本均值的抽样分布近 似服从均值为μ、方差为σ2/n的正态分布。
x
n
f(X)
大样本(n 30)
3 2.0 2.5 3.0 3.5
4 2.5 3.0 3.5 4.0
.3 P ( x ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
中央财经大学统计学院 13
所有样本均值的均值和方差
n
xi M 1xi 1.01.5 1 64.02.5