- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
拟合模型 显著有效
(二)参数的显著性检验
(1)目的: 检验每一个未知参数是否显著非零。删除不显著参 数使模型结构最精简 (2)假设条件:
H0 : j 0 H1 : j 0
(3)检验统计量:
1 j m
T nm
其中
ˆ j j
ˆt2 Q( )
一般地有:
ˆt (l ) 1 x ˆt (l 1) x
x
l 1 t
预测值满足模型差分 方程部分:
ˆt (l ) 1 x ˆt (l 1) 0 x ˆt (0) xt x
AR(2)序列的预测
xt 1xt 1 2 xt 2 t
ˆt (1) E ( xt 1 xt , xt 1 , ) x 1 xt 2 xt 1
例3.13续:用AIC准则和SBC准则评判例3.13中 两个拟合模型的相对优劣。
模型 MA(2) AR(1) AIC 7.49 7.43 SBC 7.59 7.50
结果: AR(1)优于MA(2)
六、序列预测
所谓预测是要利用序列已观测到的样本值对 序列未来某个时刻的取值进行估计。预测方法主 要有线性最小方差预测和条件期望预测。
2 ˆ ˆ t ------残差平方和 2 n
T ------待估参数的个数
中心化的ARMA(p,q)模型, T p q 1 非中心化的ARMA(p,q)模型, T pq2
t 1
理论上, AIC和 SBC的值越小越好(注意: 两者皆可为负)。当模型的拟合优度上升时, AIC和 SBC的值会趋于 -∞ 。需注意的是:在 比较两个备选模型的AIC(或 SBC)时,必须基 于相同样本期估计的模型。 SBC具有更优的大样本特性,可以证明, SBC准则是最优模型的真实阶数的相合估计 (一致估计)。而在小样本下AIC效用优于 SBC。一般来说, AIC倾向于选择过多参数的 模型,而SBC倾向于选择更为简练模型。 在使用AIC(或 SBC)准则选择模型时, 我们只能得到相对最优模型,而不可能得到绝 对最优模型。(因为不可能比较所有模型的 AIC值 )。
(一)线性预测函数
对于一个平稳可逆的ARMA(p,q)模型来说, 其所有历史未知信息
xt l都可以用已知历史信息
xt , xt 1 ,
表示出来。即
xt l Di xt i
i 0
ˆt (l ) 以 x
D x
i 0
i t i
作为
xt l
的预测值,称
ˆt (l )为 xt 的向前第 l 步线性预测。 x
ˆt (l ) E( xt l xt , xt 1, ) x
对于平稳可逆的ARMA(p,q)模型来说,有
E( xk xt , xt 1, ) xk (k t ) E( k xt , xt 1, ) k (k t )
E( k xt , xt 1, ) 0
E ( xk xt , xt 1 , ) E ( xk t , t 1 , ) xk (k t )
四、模型检验
(一)模型的显著性检验
(1)检验目的 检验模型的有效性(对信息的提取是否充分) (2)检验对象 残差序列 (3)判定原则 一个好的拟合模型应该能够提取观察值序列中几乎 所有的样本相关信息,即残差序列应该为白噪声序列 。 反之,如果残差序列为非白噪声序列,那就意味着残差序 列中还残留着相关信息未被提取,这就说明拟合模型不够 有效。
(4)假设条件 原假设:残差序列为白噪声序列
H0:1 2
m 0, m 1
备择假设:残差序列为非白噪声序列
H1:至少存在某个 k 0, m 1,k m
(5)检验统计量:LB统计量
2 ˆ k 2 LB n(n 2) ( ) ~ (m) ˆk n k k 1 m
i 0 i 0
l 1
2 Gi2
i 0
l 1
当 Gl i Wi , i 0,1, 2,
此时
时,预测方差达到最小,
xt l
的预测值为:
ˆt (l ) W0t W1t 1 x
(2)条件期望预测
xt l t l G1 t l 1 et (l )
xt 1 xt 1 t
ˆt (1) E ( xt 1 xt , xt 1 , ) x E (1 xt t 1 ) xt , xt 1 , 1 xt ˆt (2) E ( xt 2 xt , xt 1 , ) x
E (1 xt 1 t 2 ) xt , xt 1 , 1 E ( xt 1 xt , xt 1 , ) ˆt (1) 1 x 12 xt
6.72
<0.0001
显著
例3.8续: 对OVERSHORTS序列的拟合模型进 行检验。
残差白噪声检验结果:
延迟阶数 6 12 LB统计量 P值 结论
3.15 9.05
0.6772 0.6171
模型显著 有效
参数显著性检验结果:
检验参数 均值 t统计量 -3.75 10.60 P值 <0.0004 <0.0001 结论 显著 显著
由此可见,线性最小方差预测与条件期望
预测是一致的。在正态假定下,有
xt l xt , xt 1,
其中:
ˆt (l ),Var[et (l )]) N (x
ˆt (l ) Glt Gl 1t 1 x et (l ) t l G1t l 1
Gl 1t 1
一般地有,预测值 满足模型差分方程部分:
ˆt (l ) 1x ˆt (l 1) 2 x ˆt (l 2) 0 x
ˆt (2) E ( xt 2 xt , xt 1 , ) x ˆt (1) 2 xt 1 x ˆt (3) E ( xt 3 xt , xt 1 , ) x ˆt (2) 2 x ˆt (1) 1 x
ˆ ˆ
t 1 n t 1
nk
t t k
2 ˆ t
例2.5续:检验1950年——1998年北京市城乡居民 定期储蓄比例序列拟合模型的显著性。 残差白噪声序列检验结果: 延迟阶数 6 LB统计量 5.83 P值 0.3229 检验结论
12
18
10.28
11.38
0.5050
0.8361
(二)预测方差最小原则
预测误差: et (l )
ˆt (l ) xt l x
Varx ˆt ( l ) et (l ) min Var et (l )
由于 x ˆt (l ) 是 xt , xt 1 , 的线性函数,所以
该原理也称为线性预测方差最小原理。
(三)条件 ˆ AIC n ln( ) 2T
AIC 2ln( L) n 2T n 2T 惩罚因子为2 1 n 2 ˆ AIC e n 其中: n ------可用的序列观测值的个数 T ------待估参数的个数
ˆt2------残差平方和 ˆ 2
结论 显著 显著
五、模型优化
问题提出:当一个拟合模型通过了检验,说明 在一定的置信水平下,该模型能有效地拟合观 察值序列的波动,但这种有效模型并不是唯一 的。
优化的目的:选择相对最优模型。
例3.13:拟合某一化学序列(附录1.8)
序列自相关图
序列偏自相关图
拟合模型一 根据自相关系数2阶截尾,拟合MA(2)模型 参数估计:
t 1
n
中心化的ARMA(p,q)模型, T p q 1
非中心化的ARMA(p,q)模型, T pq2
n 1 1 2 l ( , x1 , , xn ) [ ln( ) ln 2 S ( )] 2 2 2
由似然函数可以看出上述三个 统计量会选择相同的模型。
i 0 i 0 j 0 i 0
ˆt (l ) Gi t l i (Gl i Wi ) t i et (l ) xt l x
i 0 i 0
l 1
Var (et (l )) [ Gi2 (Gl i Wi ) 2 ] 2
yieldt 51.17301 (1 0.32286 B 0.31009 B ) t
2
模型检验:模型显著有效;三参数均显著。 拟合模型二 根据偏自相关系数1阶截尾,拟合AR(1)模型
参数估计:
yield t 51.26169
t
1 0.42481 B
模型检验:模型显著有效;两参数均显著。
问题:同一个序列可以构造两个拟合模型,两 个模型都显著有效,那么到底该选择哪个模型 用于统计推断呢?
解决办法:确定适当的比较准则,构造适当的统
计量,确定相对最优。
AIC准则(An Information Criterion)
由日本统计学家赤池弘次(Akaike) 1973年提出,称为最小信息量准则。 如何评价模型对数据的拟合程度?通常 似然函数值越大(或估计的残差平方和越小) 越好。一般地,增加模型中滞后变量的个数 会使估计的残差平方和降低。然而,增加模 型中滞后变量的个数,会使需估计的参数增 多,响应地减少自由度,参数估计的难度越 大,估计的精度越差。甚至,包含了无关紧 要的变量还会降低拟合模型的预测效果。所 以,一个好的拟合模型应该是拟合精度和未 知参数个数的综合最优配置。
预测误差
Glt Gl 1t 1
Gl 1 t 1 Gl t Gl 1 t 1 ˆt (l ) x
预测值
ˆ (l ) E ( xt l xt , xt 1 , ) x Var ( xt l xt , xt 1 , ) Var[et (l )]