统计学PPT第四章:估计

  • 格式:ppt
  • 大小:983.00 KB
  • 文档页数:60

下载文档原格式

  / 60
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本章重点
点估计 抽样分布 均值区间估计 比例区间估计 方差区间估计
第一节 点估计
✓矩估计 ✓最大似然估计 ✓点估计标准
总体和样本
▪ 总体
X : x1, x2 , , xN , (N为总体容量)
▪ 样本
X1, X 2, , X n , (n为样本容量)
▪ 观测
x1, x2 , , xn
▪ 基本假设:独立同分布(iid)
▪ 求 的矩估计和最大似然估计
优良估计标准
▪ 无偏(unbiased)
E(ˆ)
▪ 有效(effective)
D(ˆ) min
▪ 一致(consistent)
lim (ˆ)
n
主要参数和估计值
名称 均值 方差
比例 (0-1变量)方差
总体
X
N
2 X X 2 N
样本
x x n
s2 x x2
由题意:N 5000, n 200,x 423,s 12
则:sx
Nn s N 1 n
5000 200 5000-1
12 200
0.83
随机试验
重复地从1到9中随机抽5个数,计算均值。 观察均值的分布
Frequency 0 5 15
Frequency 0 5 10 15
3
4
5
6
7
50 times
i 1
i 1
最大似然估计
▪ 让似然函数或者对数似然函数取最大值的参 数极为最大似然估计,即令
ln L
1
0
ln L
2
0
ln L
k
0
▪ 该方程组得解即为最大似然估计
练习
▪ 某变量的10次观测如下 2 1 6 5 3 0.1 13 1 1 2
▪ 假设该变量的概率密度函数为
f (x) ex , (x 0)
x
density
样本比例
▪ 样本比例是样本均值的特殊情况,即样本 比例可看成是0-1变量的均值,因此容易 知道样本比例分布
▪ 均值
E p
标准误差
▪ 标准差(标准误差):
重复抽样: p
1
n
1 1
n
不重复抽样: p
Nn N 1
1 1
n
标准误差的估计
▪ 同样的道理,总体比例常常未知,需用样本 比例估计
Nn
N 1 n

N n N 1
叫有限总体修正系数(finite
population correction)
▪ 但当总体容量很大时,这种修正就不存在或 作用很少
误差计算
从某企业生产的5000个零件中随机检测200个, 测得这200个零件的平均长度为423毫米,标准 差为12毫米。若采用不重复抽样,求标准误差
参数和估计
▪ 总体:参数(parameter)
f (x1, x2, , xN )
▪ 样本:估计量(estimator)
ˆ f ( X1, X 2 , , X n )
▪ 观测:估计值(estimate)
ˆ f (x1, x2 , , xn )
抽样估计
▪ 利用样本估计值去估计总体参数的过程称为抽样 估计(sampling estimation)或参数估计 (parameter estimation)
矩估计
▪ 根据分布计算总体矩
j E(x j ) g j (1,2 , ,k ),( j 1,2, , k; k为待估计参数个数 )
▪ 根据样本观测计算样本矩
ˆ j
1 n
x j ,( j 1,2, , k)
▪ 据总体矩等于样本矩联立方程组求参数
g
j
(1, 2 ,
,k
)
Байду номын сангаас
1 n
xj
最大似然估计
n 1
p
2 1 s 2 p 1 p
第二节 样本均值和比例分布
✓ 样本均值的分布 ✓ 样本比例的分布
均值和标准差
▪ 样本均值的均值(expectation)为总 体均值,即
Ex
▪ 标准差
x
1
n
标准误差
▪ 样本均值的标准差代表了样本均值估计总体 均值的误差,亦称样本均值的标准误差 ( standard error)
重复抽样: ˆ p sp
1 p1 p
n
不重复抽样: ˆ p sp
Nn N 1
1 p1 p
n
样本比例的标准误差
某公司从一批产品中随机抽取100件进行调查,发现其中有 10件不合格 。求样本合格品率的标准误差
分析:题目未告知是否采用不重复抽样,但据题意可 知总体单位数很大,因此即便采用不重复抽样其标准 误差的修正效果也不好,因此视同重复抽样
▪ 用单值估计参数称为点估计(point estimation)
▪ 用区间估计参数称为区间估计(interval estimation)
点估计
▪ 点估计的基本思想是根据样本观测为总体参 数找到一个最优估计
▪ 矩估计(method of moments)
▪ 最大似然估计(maximum likelihood estimation, mle)
误差计算
从某企业生产的5000个零件中随机检测 200个,测得这200个零件的平均长度为 423毫米,标准差为12毫米。求标准误差
由题意:N 5000 , n 200, x 423,s 12
则:sx
1 s n
1 12 200
0.85
误差的修正
▪ 不重复抽样时,标准误差计算公式为
x
3
4
5
6
7
100 times
Frequency 0 400 800
3
4
5
6
7
500 times
3
4
5
6
7
10000 times
Frequency 0 40 80
样本均值的分布形态
中心极限定理(central limit theorem):不论
总体变量成何种分布,当样本容量很大时,样本均 值服从以 为均值, x 为标准差的正态分布
▪ 影响抽样误差大小的因素有二:一为总体的 标准差,;二为样本容量的大小
▪ 应当指出,抽样误差同总体容量没有关系或 关系很小
标准误差的估计
▪ 实际中总体标准差 常常是未知的,因此要样本均
值的标准误差,需用样本标准差s代替
ˆ x sx
1 s n
▪ 当样本容量很大时,这种代替的误差是很小的; 但当样本容量较小时,就会产生较大的误差
▪ 根据分布计算样本观测的取值概率
P(xi ) f (xi ;1,2, ,k ),(i 1,2, , n; k为待估计参数个数 )
▪ 样本观测的总取值概率即为似然函数,其对 数为对数似然函数
n
n
L(1,2 ,L ,k ) P(xi ) f (xi;1,2,L ,k )
i 1
i 1
n
n
ln L(1,2,L ,k ) lnP(xi ) ln f (xi;1,2,L ,k )