- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由方差 相关系数
1 N S = ∑ (Yi Y ) 2 N 1 i =1
2 y
1 N S = ( X i X )2 ∑ N 1 i =1
2 x
ρ=
E (Yi Y )( X i X ) E (Yi Y ) 2 E ( X i X ) 2
=
∑ (Y
i =1
N
i
Y )( X i X )
(2)比估计方法,对抽样调查单元是有条件的,通 常是用组成总体的最基层单位为调查单元. (3)比估计只适用于有限总体,因为只有有限总体 才可能计算出为比估计所需要的辅助变量的总体 总和与总体均值. (4)当每个单元的调查变量与辅助变量的比例(一 般要求为正比例)十分稳定,且变异很小时,比估 计就具有十分精确的估计效果,只要抽取少量的 样本单元,就可得到满意的结论. (5)在比估计时,出于估计精度方面的要求,选择 辅助变量时,须与调查变量的关系愈密切愈好, 至少要求相关系数在1/2以上.
2 (1 f h ) 2 2 2 V (YRS ) ≈ ∑ N h ( S yh + Rh S xh 2 Rh ρ h S yh S xh ) nh h L
当各层的总体方差未知时,方差的估计量:
2 (1 f h ) 2 2 2 V (YRS ) ≈ ∑ N h ( s yh + Rh s xh 2 Rh rh s yh s xh ) nh h 1 Y的估计量的方差(或方差估计量)乘以 N 2 即可得出 Y 的估 L
三,各层分别比估计量与联合比估计量的比较 从偏倚的角度看,各层分别比估计量YRS的偏倚较大,从方 V 差的角度看,除了各层比率Rh均相等时, (YRS ) = V (YRC ) 外, 一般只要各层的样本量均较大时,各层比估计更加有效. 即有: V (YRC ) > V (YRS ) 因此,当 n h 均大时,用分别比估计量 YRS .否则用联合比估 计量 YRC 较好
X
注意到 y Rx 是 d i = yi Rxi 的样本均值,且d i 的总体均值D = Y RX = 0 因此 1 1 1 f 2 V ( R ) ≈ 2 E (d ) 2 = 2 Sd X X n
1 1 f 1 = 2 X n 1 N 1 1 f 1 N ∑ D = X 2 n N 1 ∑ (Yi RX i ) 2 i =1 i =1
二,总体比率的估计
设总体有N个单元,对每个单元考虑两个指标Y(调查指标)和X(辅助 变量).抽取容量为n的简单随机样本,则总体比率R的估计量为:
y y (样本比率) R = = x x
总体比率为 R =
Y Y = X X
比率估计是有偏的,但当样本量 n ( n → N )增大时,偏倚逐渐趋于零. 其方差为:
( N 1) S y S x
当总体方差未知时,可用样本方差替代,以估计方差.此 N 时: 2
1 f V1 ( R) = nX 2
∑(y
i =1
i
Rxi )
n 1
=
1 f 2 2 ( s y + R 2 s x 2 Rs yx ) 2 nX
或(X 未知时)
1 f V2 ( R ) = nx 2
N 2 i
证明:
1 f 1 N V ( R) = [ ∑ (Yi RX i ) 2 ] nX 2 N 1 i =1
N 1 f 1 = { [∑ (Yi Y ) R ( X i X )]2 } nX 2 N 1 i =1
N N N 1 f 1 2 2 2 = { [∑ (Yi Y ) + R ∑ ( X i X ) 2 R ∑ (Yi Y )( X i X )]} 2 nX N 1 i =1 i =1 i =1
L
其方差估计量为:
L ) ≈ W 2 (1 f h ) ( s 2 + R 2 s 2 2 R r s s ) V (YRC ∑ h n yh c xh c h yh xh h h
2 (1 f h ) 2 2 2 V (YRC ) ≈ ∑ N h ( s yh + Rc s xh 2 Rc rh s yh s xh ) nh h L
四,比估计量与简单估计量的比较 对简单随机抽样,若n足够大,则当
ρ>
1 Sx X 1 Cx × = × 2 Sy Y 2 Cy
时,有: V (YR ) < V ( y )
S Cx = x 其中: X
Cy = Sy Y
分别为总体中x与y的变异系数.
证明:∵n足够大时,对比估计量有: 证明
(1 f ) 2 2 V (YR ) ≈ ( S y + R 2 S x 2 Rρ S y S x ) n
比估计中,辅助变量可以是上次普查或调查时与调查变量 相应的数据(即调查变量的前期或历史资料);也可以是对 调查变量的粗略估计;或者是表示单元规模的某个量. 为了充分发挥比估计的优越性,在应用比估计时应考虑两 应用比估计时应考虑两 条: 一是选与调查变量有较密切的正相关关系的变量作为辅助 变量.因为如果辅助变量与调查变量的关系不密切,各自 独立变化,则对比估计起不了应有的辅助作用. 二是样本容量要比较大.因为比估计是有偏倚的,只有当 样本容量n比较大时,其偏倚才能比较小,比估计才更加 有效.
其中X 或 X必须已知. E (YR ) ≈ Y 当n充分大时 E (YR ) ≈ Y 即YR与YR分别是 Y 与 Y 的近似无偏估计. 其方差为:
1 f × V (YR ) = X 2V ( R ) ≈ n
=
( y i Rxi ) 2 ∑
i =1
N
N 1
=
1 f 2 2 ( S y + R 2 S x 2 RS yx ) n
五,样本容量的确定
估计总体比率时如果允许 R 的最大方差为V,当n充分大时, 由
1 f S 2 V ( R) ≈ d nX 2
Sd
1 N = ( y i Rxi ) 2 ∑ N 1 i =1
2
得
V = 1 f 2 Sd nX 2
Sd X 2V n= 2 Sd 1+ NX 2V
估计总体均值时,如果允许 YR 的最大方差为V, 1 f 2 S d 所以: 由于 V =
1 f 2 2 ( S y + R 2 S x 2 RρS y S x ) n
V (YR ) ≈ N 2V (YR ) = N 2 X 2V ( R)
≈
N (1 f ) × n
2
∑(y
i =1
N
i
Rxi ) 2
N 1
N 2 (1 f ) 2 2 = ( S y + R 2 S x 2 RρS y S x ) n
(
L L L yh = W Y = W yh X = 1 YRS ∑ h Rh ∑ h ∑ X h X h 及X h h N h xh xh h h
已知)
(
已知)
y YRS = ∑ h X h = ∑ YRh h xh h
L
L
Xh
在分层随机抽样中,若每层的样本量 nh 都较大,则 YRS为Y 的近似无偏估计.其方差为:
第五章 比估计与回归估计
第一节 第二节 第三节 第四节
比估计的一般形式 分层比估计 回归估计的一般形式 分层回归估计
第一节 比估计的一般形式
一,比估计综述 比估计是依据调查变量与辅助变量间的比率来对 总体有关参数进行估计和推断.通常简称比估计. 同简单估计相比,比估计具有以下特点: (1)在比估计中,除调查变量外,还需要了解与调 查变量有关的辅助变量,并且要求辅助变量的总 体均值或总体总和必须事先已知.充分利用辅助 变量带来的信息估计总体参数,比单纯用调查变 量资料会有更好的效果.
第三节 回归估计的一般形式
一,回归估计概述 回归估计就是根据样本各单元调查变量与辅助变量间的关系构 造回归方程,并据回归系数对总体有关参数进行估计. 如果在回归估计中只有一个辅助变量,则所进行的估计称为一 元回归估计,若同时采用多个辅助变量综合进行估计,则称为 多元回归估计.多元回归估计比一元回归估计效果更好,但更 复杂.这里只介绍一元回归中的线性回归估计. 回归估计的主要特点有: 回归估计的主要特点有: 同比估计一样,回归估计充分利用了有关的辅助变量资料以有 效地提高估计的精度;回归估计中要求辅助变量的总体均值或 总和事先已知;回归估计一般只适用于有限总体,因为只有有 限总体才可能计算出辅助变量的总体均值和总和;回归估计量 一般优于比估计量和简单估计量.特别地当回归系数等于总体 比率(即总体回归直线通过原点)时,回归估计量与比估计量的 效果相同,当调查变量与辅助变量间的相关系数ρ=0时,回归 估计与简单估计的效果相同.
∑(y
i =1
n
i
Rx i ) 2
=
n 1
1 f 2 2 ( s y + R 2 s x 2 Rs yx ) nx 2
其中
sy
2
s yx
1 n 1 n 2 2 = sx = ∑ ( yi y ) ∑ ( xi x ) 2 n 1 i =1 n 1 i =1 1 n = ∑ ( yi y )( xi x ) n 1 i =1
n
Sd n= V 2 S 1+ d NV
2
~ V ~ 估计总体总和时,如果允许 YR的最大方差为 V ,将 V = 2 N
代入上式,则得:
N 2Sd ~ V n= 2 NS d 1+ ~ V
2
第二节 分层比估计
分层随机抽样中的比估计量有两种形式:先构造 各层比估计,再加权平均——各层分别比估计; 先加权平均,再构造比估计——联合比估计. 一,各层分别比估计 各层分别比估计是先对各层分别进行比估计,然 后按层权加权平均,以得出总体参数的估计,即:
其方差估计量为:
1 f V (YR ) = n ( y i Rx i ) 2 ∑