- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18
Y 抽样分布的均值和方差
一般情况: Yi i.i.d. 取自任何分布, 不一定是 Bernoulli: 1 n 1 n 1 n 均值: E(Y ) = E( Yi ) = E (Yi ) = Y = Y n i 1 n i 1 n i 1 方差: var(Y ) = E[Y – E(Y )]2 = E[Y – Y]2
统计理论复习
统计推断的概率框架 贯穿计量经济学始终的三种类型的统计方法 估计 检验 置信区间 统计推断的概率框架
总体, 随机变量, 分布 分布矩 (均值, 方差, 标准差, 协方差, 相关系数) 条件分布、条件均值 从总体中随机抽取的样本服从的分布(抽样分布)
1
△
(1)总体、随机变量和分布
1 n n = 2 cov(Yi ,Y j ) n i 1 j 1 1 = 2 n
2 Y i 1 n
=
Y2
n
20
Y 抽样分布的均值和方差(续)
E(Y ) = Y var(Y ) =
Y2
n
结论:
1. 2.
Y 是Y 的无偏估计量(即, E(Y ) = Y) var(Y ) 与 n 成反比 抽样分布的离散程度与 1/ n 成比例 因此Y 的抽样不确定性与 1/ n 成比例(样本越大, 不确定性越小, 根号 n 定律)
8
相关系数度量了线性相关 性
9
条件分布和条件均值
条件分布 Conditional distributions
给定其他随机变量 X 取值时,Y 的分布 例: 给定 STR<20 时测试成绩的分布 条件期望 Conditional expectations 和条件矩 nditional moments 条件均值 = 条件分布的均值 = E(Y|X = x) (重要概念和符号) 条件方差 = 条件分布的方差 例: E(Test scores|STR < 20) = 小班规模的学区的平均测试 成绩
12
简单随机抽样下 Y1,…, Yn 的分布
由于个体 #1 和 #2 是随机抽取的, 因此 YB1取值中不包含 B : Y2 B 的信息。故 B Y1 B B 和 YB2B 是 独立分布的 independent distributed Y1 B B 和 YB2B 取自同一分布, 即, YB1, B YB2B 同分布 identically distributed 于是, 简单随机抽样下, YB1B 和 YB2B 独立同分布 (i.i.d.). 更一般地, 简单随机抽样下, {YiB }, B i = 1,…, n, i.i.d.
17
关于抽样分布我们要了解的:
Y 的均值是多少? 如果 E(Y ) =真实的 = .78, 则Y 是 of 的无偏 unbiased 估计量 Y 的方差是多少? var(Y ) 如何依赖于 n (著名的 1/n 公式) 当 n 较大时 Y 是否靠近 ? 大数定律: Y 是 的相合 consistent 估计量 当 n 较大时,Y 表现出钟形形状…普遍成立吗? 事实上, 当 n 较大时,Y 近似服从正态分布 (中心极限 定理)
6
测试成绩Test Score和学生教师比STR负相关:
相关系数也为负
7
相关系数是利用协方差定义的:
cov( X , Z ) XZ corr( X, Z ) = = rX Z var( X ) var( Z ) X Z
1 corr( X, Z ) 1 corr( X, Z ) = 1 表明完全线性正相关 corr( X, Z ) = 1 表明完全线性负相关 corr( X, Z ) = 0 表明不存在线性关系(线性不相关)
4
5
(3)2个随机变量: 联合分布与协方差
随机变量 X 和 Z 服从某一 联合分布 joint distribution X 和 Z 之间的协方差定义为 cov(X,Z) = E[(X – X)(Z – Z)] = XZ 协方差是 X 和 Z 线性关联程度的度量; 其单位为 X 的单位 ´ Z 的单位 cov(X,Z) > 0 表明 X 和 Z 正相关 若 X 和 Z 独立分布, 则 cov(X,Z) = 0 (反之不成立!!) r.v.与其自身的协方差就是它的方差 : 2 cov(X,X) = E[(X – X)(X – X)] = E[(X – X)2] = X
3
矩(续)
3 E Y Y 偏度 skewness = 3
Y
=分布不对称性的度量 偏度 = 0: 分布是对称的 偏度 > (<) 0: 分布具有右(左)长尾
4 E Y Y 峰度 kurtosis = 4
Y
= 尾部厚薄的度量 = 出现大值的可能性度量 峰度 = 3: 正态分布 峰度 > 3: 厚尾 (“尖峰 leptokurtotic”)
21
Y 的抽样分布
1. 对任何的样本容量(特别当样本容量较小时), Y 的分布 很复杂,但当总体服从正态分布时,Y 精确服从正态分布 2. n 较大时, 抽样分布很简单!
当 n 增大时, Y 的分布越来越紧密的聚集于 Y 周围(大数定律 Law of Large Numbers) 此外, Y 的分布近似为正态 (中心极限定理 Central Limit Theorem)
15
Y 的抽样分布(续)
例: 设 Y 取 0 或 1 ( Bernoulli 随机变量),服从概率分布,
Pr[Y = 0] = .22, Pr(Y =1) = .78 则 E(Y) = p1 + (1 – p)0 = p = .78 2 Y = E[Y – E(Y)]2 = p(1 – p) = .78(1–.78) = 0.1716
22
大数定律:
如果估计量落入总体真值区间内的概率当样本容量增大时 趋于 1,则称估计量是一致的
2 < ¥, 则 Y 是 Y 的一致估计 如果 (Y1,…,Yn) i.i.d. 且 Y
量,即, Pr[|Y – Y| < ] 1 as n ¥ 可以写为 Y Y (“Y Y” 意指 “Y 依概率收敛于 Y”). (数学推导: 当 n ¥, var(Y ) = Pr[|Y – Y| < ] 1.)
2
数
(2)总体分布矩: 均值、方差、标准差、协方差、相关系
均值 mean = Y 的期望值(期望)
= E(Y) = BYB = Y 多次重复取值的长期平均值
2P 方差variance = E(Y – BY) P B
2 = Y
= 分布平方散布的度量
标准差standard deviation = 方差 = BYB
min m (Yi m ) 2
i 1 n
p
因此, Y 使 “残差”平方和最小 推导: (参见附录 3.2)
这一框架允许我们能利用从总体中取出的样本进行有关总体 矩的严格统计推断
13
△ 估计 Estimation
Y 是均值的一个自然估计. 但:
(a) Y 的性质怎样? (b) 为什么我们不用其他估计量而用 Y 呢? Y1 B B (第一个观测) 利用不同的权重 – 而不是简单平均 Yn B) Median(YB1,…, B B (中位数) 出发点是 Y 的抽样分布
1 = E Yi Y n i 1
n 2
1 = E (Yi Y ) n i 1
n
2
19
于是
1 var(Y ) = E (Yi Y ) n i 1
n
2
1 n 1 n = E (Yi Y ) (Y j Y ) n j 1 n i 1 1 n n = 2 E (Yi Y )(Y j Y ) n i 1 j 1
14
(a) 的抽样分布 Y
Y 是一个随机变量, 其性质取决于 Y 的抽样分布
样本中的个体是随机抽取的 YBn) 因此 (Y1 B ,…, B B 的取值是随机的 Yn B) (Y1 B ,…, B B 的函数, 如 Y , 也是随机的: 抽到了不同的样本 则得到不同的值 在所有可能的容量为 n 的不同样本上Y 的分布称为Y 的抽 样分布. Y 的均值和方差即为其抽样分布的均值和方差 E(Y ) 和 var(Y ). 抽样分布的概念是整个计量经济学的基础.
Y 的抽样分布依赖于 n. 考虑 n = 2. Y 的抽样分布为, Pr(Y = 0) = .222 = .0484 Pr(Y = ½) = 2.22.78 = .3432 Pr(Y = 1) = .782 = .6084
Hale Waihona Puke 16当Y 服从Bernoulli分布(p = .78)时 Y 的抽样分布:
10
条件均值(续)
均值之差为两个条件分布均值的差:
= E(Test scores|STR < 20) – E(Test scores|STR ≥ 20) 条件均值的其他例题: 所有女职工的工资 (Y = 工资, X = 性别) 若 E(X|Z) =常数, 则 corr(X,Z) = 0 (但反之不一定成立)
总体(Population)
感兴趣的所有可能个体的集合 (学区) 我们将总体视为无限大 (∞近似于“非常大”)
随机变量(Random variable) Y
一个随机结果的数值概括 (地区平均测试成绩、学生教师比)
Y 的总体分布
Y 离散时:总体中出现的不同Y取值的概率,如Pr[Y = 650] Y 连续时:这些取值集合的概率,如Pr[640≤Y ≤660]
23