第五章
时间序列数据的平稳性检验
1
本章要点
§平稳性的定义
§平稳性的检验方法(ADF检验)
§伪回归的定义
§协整的定义及检验方法(AEG方法)
§误差修正模型的含义及表示形式
2
3
第一节随机过程和平稳性原理§
一、随机过程§
一般称依赖于参数时间t 的随机变量集合{ }为随机过程。§例如,假设样本观察值y 1,y 2…,y t 是来自无穷随机变量序列…y -2, y -1,y 0,y 1,y 2…的一部分,则这个无穷随机序列称为随机过程。
t y
4
§随机过程中有一特殊情况叫白噪音,其定义如下:如果随机过程服从的分布不随时间改变,且
()0t E y =(对所有t )22
y var()()t t y E y σ===常数(对所有t )
cov(,)(*)0t s t s y y E y y ==()t s ≠那么,这一随机过程称为白噪声。
§二、平稳性原理
§如果一个随机过程的均值和方差在时间过程上都是常数,并且在任何两时期的协方差值仅依赖于该两时期间的距离或滞后,而不依赖于计算这个协方差的实际时间,就称它为平稳的。
5
6
§
平稳随机过程的性质:§
均值(对所有t )§
方差(对所有t )§
协方差(对所有t )§其中即滞后k 的协方差[或自(身)协方差],是和,也就是相隔k 期的两值之间的协方差。
()t E y μ=22var()()t t y E y μσ=?=[()()]k t t k E y y γμμ+=??k γt y t k y +
§三、伪回归现象
§将一个随机游走变量(即非平稳数据)对另一个随机游走变量进行回归可能导致荒谬的结果,传统的显著性检验将告知我们变量之间的关系是不存在的。
§有时候时间序列的高度相关仅仅是因为二者同时随时间有向上或向下变动的趋势,并没有真正的联系。这种情况就称为“伪回归”(Spurious Regression)。
7
第二节平稳性检验的具体方法
一、单位根检验
§(一)单位根检验的基本原理
§David Dickey和Wayne Fuller的单位根检验(unit root test)即迪基——富勒(DF)检验,是在对数据进行平稳性检验中比较经常用到的一种方法。
8
9
DF 检验的基本思想:
从考虑如下模型开始:
1t t t Y Y u ρ?=+(5.1)
其中即前面提到的白噪音(零均值、
恒定方
差、非自相关)的随机误差项。t u
10由式(5.1),我们可以得到:
121
t t t Y Y u ρ???=+(5.2) 232
t t t Y Y u ρ???=+(5.3)…
T T-1T t t t Y
Y u ρ???=+(5.4)
11
§依次将式(5.4)…(5.3)、(5.2)代入相邻的上式,并整理,可得:
T 2
T
t T 12T ...t t t t t Y Y u u u u ρρρρ????=+++++(5.5)
根据值的不同,可以分三种情况考虑:
(1)若<1,则当T →∞时,→0,即对序列的冲击将随着时间的推移其影响逐渐减弱,此时序列是稳定的。
ρρT ρ
12
§(2)若>1,则当T →∞时,→∞,即对序列的冲击随着时间的推移其影响反而是逐渐增大的,很显然,此时序列是不稳定的。
§(3 )若=1,则当T →∞时,=1,即对序列的冲击随着时间的推移其影响是不变的,很显然,
序列也是不稳定的。ρρT ρT ρ
13
§对于式(5.1),DF 检验相当于对其系数的显著性检验,所建立的零假设是:H 0:如果拒绝零假设,则称Y t 没有单位根,此时Y t 是平稳的;如果不能拒绝零假设,我们就说Y t 具有单位根,此时Y t 被称为随机游走序列(random walk series )是不稳定的。
1ρ=
14
§方程(5.1)也可以表达成:
11(1)t t t t t Y Y u Y u ρδ???=?+=+(5.6)
其中= -,△是一阶差分运算因子。此时的零假设变为:H 0:=0。注意到如果不能拒绝H 0,则= 是一个平稳序列,即一阶差分后是一个平稳序列,此时我们称一阶单整过程(integrated of order 1)序列,记为I (1)。
t Y ?t Y 1t Y ?δt Y ?t u t Y
15
§I (1)过程在金融、经济时间序列数据中是最普遍的,而I (0)则表示平稳时间序列。
§从理论与应用的角度,DF 检验的检验模型有如下的三个:
11(1)t t t t t t Y Y u Y Y u δδ??=++?=+ 即 (5.7)
1111(1)t t t t t t Y Y u Y Y u βδβδ??=+++?=++ 即 (5.8)
121121(1)t t t t t t
Y t Y u Y t Y u ββδββδ??=++++?=+++ 即 (5.9)
16
§其中t 是时间或趋势变量,在每一种形式中,建立的零假设都是:H 0:或H 0:,即存在一单位根。(5.7 )和另外两个回归模型的差别在于是否包含有常数(截距)和趋势项。如果误差项是自相关的,就把(5.9)修改如下:
1ρ=0δ=1211
m
t t i t i t i Y t Y Y ββδαε??=?=+++?+∑(5.10)
17
§式(5.10)中增加了的滞后项,建立在式(5.10)基础上的DF 检验又被称为增广的DF 检验(augmented Dickey-Fuller ,简记ADF )。ADF 检验统计量和DF 统计量有同样的渐近分布,使用相同的临界值。
t Y ?
§(二)ADF检验模型的确定
§首先,我们来看如何判断检验模型是否应该包含常数项和时间趋势项。解决这一问题的经验做法是:考察数据图形
§其次,我们来看如何判断滞后项数m。在实证中,常用的方法有两种:
18
§(1)渐进t检验。该种方法是首先选择一个较
大的m值,然后用t检验确定系数是否显著,如
果是显著的,则选择滞后项数为m;如果不显
著,则减少m直到对应的系数值是显著的。
§(2)信息准则。常用的信息准则有AIC信息准则、SC信息准则,一般而言,我们选择给出了最小信息准则值的m值
19
§二、非平稳性数据的处理
§一般是通过差分处理来消除数据的不平稳性。即对时间序列进行差分,然后对差分序列进行回归。对于金融数据做一阶差分后,即由总量数据变为增长率,一般会平稳。但这样会让我们丢失总量数据的长期信息,而这些信息对分析问题来说又是必要的。这就是通常我们所说的时间序列检验的两难问题。
20