七章非平稳时间序列
- 格式:doc
- 大小:843.19 KB
- 文档页数:23
非平稳时间序列概述非平稳时间序列是指其统计特性在不同时间上发生了变化的时间序列数据。
与平稳时间序列不同,非平稳时间序列在时间上存在趋势、季节性、周期性等变化。
这些变化使得序列的平均值、方差和协方差随着时间的推移而变化,从而使得非平稳时间序列的分析和预测更加复杂。
非平稳时间序列的主要特点包括以下几个方面:1. 趋势性:非平稳时间序列在长期内呈现出明显的趋势变化。
例如,股票价格在长期内可能会呈现上升或下降的趋势。
2. 季节性:非平稳时间序列在特定的时间段内存在周期性波动。
例如,零售销售额可能会在节假日季节出现明显的周期性增长。
3. 周期性:非平稳时间序列可能呈现出长期的周期性波动。
例如,经济增长率可能会在数年或数十年内出现周期性的波动。
4. 自相关性:非平稳时间序列的自相关性通常不会随着时间的推移而衰减。
这使得使用传统的时间序列分析方法变得困难。
非平稳时间序列的分析和预测需要使用特殊的技术和方法。
常用的方法包括差分法、季节性调整、趋势拟合、转换等。
差分法可以通过对序列的差分来消除趋势性和季节性,使得序列变得平稳。
季节性调整可以通过季节性分解或回归模型来消除季节性效应。
趋势拟合可以使用线性回归、移动平均或指数平滑等方法来拟合趋势。
转换可以将非平稳时间序列转化为平稳时间序列,例如取对数、平方根等。
非平稳时间序列的分析和预测对于许多领域的决策非常重要,如经济学、金融学、工程学等。
准确理解和预测非平稳时间序列的变化趋势可以帮助我们做出合理的决策,优化资源配置,提高效率和盈利能力。
非平稳时间序列的分析和预测在许多领域中具有重要的应用价值。
以下是一些常见的应用领域:1. 经济学:非平稳时间序列分析在宏观经济学中具有重要意义。
经济指标如GDP、通货膨胀率、失业率等往往呈现出明显的趋势和周期性变化。
对这些经济指标进行分析和预测有助于了解经济发展的趋势和周期,以及制定相应的经济政策。
2. 金融学:金融市场中的价格、交易量、股票收益等数据通常呈现出较强的非平稳性。
第七章非平稳时间序列时间序列数据被广泛地运用于计量经济研究。
经典时间序列分析和回归分析有许多假定前提,如序列的平稳性、正态性等,,如果直接将经济变量的时间序列数据用于建模分析,实际上隐含了这些假定。
在这些假定成立的条件下,进行的t检验、F检验与2 等检验才具有较高的可靠度。
但是,越来越多的经验证据表明,经济分析中所涉及的大多数时间序列是非平稳的。
那末,如果直接将非平稳时间序列当作平稳时间序列来进行分析,会造成什么不良后果?如何判断一个时间序列是否为平稳序列?当我们在计量经济分析中涉及到非平稳时间序列时,应作如何处理呢?这就是本章要讨论的基本内容。
第一节伪回归问题经典计量经济学建模过程中,通常假定经济时间序列是平稳的,而且主要以某种经济理论或对某种经济行为的认识来确立计量经济模型的理论关系形式,借此形式进行数据收集、参数估计以及模型检验,这是20世纪70年代以前计量经济学的主导方法。
然而,这种方法所构建的计量经济模型在20世纪70年代出现石油危机后引起的经济动荡面前却失灵了。
这里的失灵不是指这些模型没能预见石油危机的出现,而是指这些模型无法预计石油危机的振荡对许多基本经济变量的动态影响。
因此引起了计量经济学界对经典计量经济学方法论的反思,并将研究的注意力转向宏观经济变量非平稳性对建模的影响。
人们发现,由于经济分析中所涉及的经济变量数据基本上是时间序列数据,而大多数经济时间序列是非平稳的,如果直接将非平稳时间序列当作平稳时间序列进行回归分析,则可能会带来不良后果,如伪回归问题。
所谓“伪回归”,是指变量间本来不存在有意义的关系,但回归结果却得出存在有意义关系的错误结论。
经济学家早就发现经济变量之间可能会存在伪回归现象,但在什么条件下会产生伪回归现象,长期以来无统一认识。
直到20世纪70年代,Grange、Newbold研究发现,造成“伪回归”的根本原因在于时间序列变量的非平稳性。
他们用Monte Carlo模拟方法研究表明,如果用传统回归分析方法对彼此不相关联的非平稳变量进行回归,t检验值和F检验值往往会倾向于显著,从而得出“变量相依”的“伪回归结果”。
因此,在利用回归分析方法讨论经济变量有意义的经济关系之前,必须对经济变量时间序列的平稳性与非平稳性进行判断。
如果经济变量时间序列是非平稳的,则需要寻找新的处理方法。
20世纪80年代发展起来的协整理论就是处理非平稳经济变量关系的行之有效的方法。
该理论自从诞生以来,受到众多经济学家的重视,并广泛运用于对实际经济问题的研究。
所谓时间序列的非平稳性,是指时间序列的统计规律随着时间的位移而发生变化,即生成变量时间序列数据的随机过程的特征随时间而变化。
当生成序列的随机过程是非平稳的时候,其均值函数,方差函数不再是常数,自协方差函数也不仅仅是时间间隔t-s的函数,前面所介绍的高斯——马尔科夫定理不再成立,一个变量对其他变量的回归可能会导致伪回归结果,前面所介绍的计量经济技术也将遇到困难。
在经济领域中,我们所得到的许多时间序列观测值大都不是由平稳过程产生的。
例如,国内生产总值GDP大多数情况下随时间的位移而持续增长;货币供给量M2在正常状态下会随时间的位移而扩大。
也就是说,2009年GDP或M2观测值的随机性质与1999年的GDP和M2的随机性质有相当的区别。
由于在实际中遇到的时间序列数据很可能是非平稳序列,而平稳性在计量经济建模中又具有重要地位,因此有必要对观测值的时间序列数据进行平稳性检验。
第二节单位根过程与检验从前面平稳过程的定义可以看出,一个平稳过程的数据图形特征为:数据围绕长期均值E(x t)=μ波动,偏离均值之后,有复归均值的调整;方差有限且不随时间改变;其自相关函数随时间衰减。
与之相对应的概念是非平稳过程,定义为对平稳过程的条件之一不能满足的过程即为非平稳过程,其数据图形特征为:不存在长期均值;方差具有时变性且趋于无穷;从理论说,自相关不随时间衰减,但对于有限样本,样本自相关亦可能较慢速的衰减。
所以我们可以根据平稳过程的数字特征对它进行平稳性检验,这是时间序列平稳性的检验方法的传统方法。
介绍传统方法的书籍较多,所以本书不作介绍,本书介绍平稳性检验的现代方法之一:单位根检验法。
一、单位根过程一般来讲,由于经济系统惯性的作用,经济时间序列往往存在着前后依存关系,这种前后依存关系是时间序列预测的基础。
假定{}t y 为一时间序列,最简单的一种前后依存关系就是变量当前的取值主要与其前一时期的取值状况有关,而与其前一时期以前的取值状况无直接关系,也就是说t y 主要与1t y -相关,与2t y - ,3t y -,……无关。
可用如下的一阶自回归模型来描述这种关系:1t t t y y u γ-=+ (7.1)常记作AR(1)。
如果t y 不仅与前一期1t y -有关,而且与2t y -相关,显然,在这种情况下用AR(1) 来刻画t y 的动态依存关系就不恰当了,而需要在模型中引入2t y -。
一般的,如果t y 与过去时期直到t p y -的取值相关,则{}t y 的动态关系就需要使用包含1t y - ,……,t p y -在内的p 阶自回归模型来加以刻画。
p 阶自回归模型的一般形式为:1122t t t p t p t y y y y u γγγ---=++++ (7.2)为了说明单位根过程的概念,这里侧重以AR(1)模型1t t t y y u γ-=+进行分析。
根据平稳时间序列分析的理论可知,当1γ<时,该序列{}t y 是平稳的,此模型是经典的Box-Jenkins 时间序列AR(1)模型。
但是,如果1γ=,则序列的生成过程变为随机游走过程:1t t t y y u -=+ (7.3)其中,{}t u 独立同分布且均值为零、方差恒定为2σ。
随机游走过程的方差为:121()()()t t t t t t Var y Var y u Var y u u ---=+=++2121()t t Var u u u u t σ-=++++=当∞→t 时,序列的方差趋于无穷大,这说明随机游走过程是非平稳的,同时也说明随机游走过程具有“记忆性”。
下面我们来对比一下随机游走过程和平稳的一阶自回归过程统计特征表1 随机游走过程和平稳的一阶自回归过程统计特征比较有时我们也称一个随机游动过程是一个单位根过程。
过程1t t t y y u -=+之所以被称为单位根过程是因为如下事实。
如果我们用滞后算子L 来表示过程{}t y ,则有(1)t t L y u ρ-= (7.4)而(7.4)所对应的特征函数为0|1|=-L ρ (7.5)当方程(7.5)有一个根位于单位园上即L =1,有1||=ρ时,从而可知y t 由随机趋势所决定。
这样,1=ρ刻划了数据生成过程(DGP)(7.1)的特征根位于单位园上且数据由随机趋势所支配,因此,1=ρ时称过程(7.1)为单位根过程较随机游动更一般的,是一般的单位根过程。
如果随机过程{}t y 遵从:1t t t y y u γ-=+ (7.6)其中,1=γ,}{t u 为一平稳过程,且 ,2,1,0,),(,0)(=∞<==-s u u Cov u E s s t t t μ。
则称序列{}t y 为(不带漂移的)单位根过程。
带漂移和时间趋势的单位根过程服从如下模型:1t t t y t y u αβ-=+++ (7.7)显然,随机游动过程是一般单位根过程的一个特例。
从单位根过程的定义可以看出,含一个单位根的过程{}t y ,其一阶差分:1t t t t y y y u -∆=-=是一平稳过程,像这种经过一次差分后变为平稳的序列称为一阶单整序列(Integrated Process),记为{}t y ~I(1)。
有时一个序列经一次差分后可能还是非平稳的,如果序列经过二阶差分后才变成平稳过程,则称序列为二阶单整序列,记为{}t y ~I(2)。
一般地,如果序列{}t y 经过d 次差分后平稳,而d-1次差分却不平稳,那么称{}t y 为d 阶单整序列,记为{}t y ~I (d ),d 称为整形阶数。
特别地,若序列{}t Y 本身是平稳的,则称序列为零阶单整序列,记为{}t y ~I (0)。
二、Dickey-Fuller 检验(DF 检验)我们知道大多数的经济变量,如GDP 、总消费、价格水平以及货币供给虽M2等都会呈现出强烈的趋势特征。
这些具有趋势特征的经济变量,当发生经济振荡或冲击后,一般会出现两种情形,一是受到振荡或冲击后,经济变量逐渐又回到它们的长期趋势轨迹;二是这些经济变量没有回到原有轨迹,而呈现出随机游走的状态。
若我们研究的经济变量遵从一个非平稳过程(比如随机游走过程),当运用最小二乘法时,前面所介绍的高斯——马尔科夫定理不再成立,一个变量对其他变量的回归可能会导致伪回归结果。
同时,如果我们所研究的经济变量(如GDP)是非平稳的,则经济出现突发性振荡(如石油价格猛增,金融危机或政府开支骤减等)所造成的影响不会在短期内消失,其影响将是持久性的。
这也是研究单位根检验的重要意义所在。
在介绍检验方法之前,先讨论检验统计量的分布。
(这部分内容理论性强,可跳过或选讲) 情形1:数据生成过程(DGP ):1t t t y y u -=+, y 0 = 0, u t ~ IID(0, σ 2) (7.8)OLS 估计过程: 1t t t y y u γ-=+ (7.9)提出假设 1:0=γH ;1:1H γ<以OLS 估计式1t t t y y u γ-=+为例,若真值0γ=,则统计量ˆ()ˆ(1)ˆ()t t T se γγγ=-, (7.10)的极限分布为标准正态分布。
若真值||1γ<,则统计量ˆ()t γ=ˆˆ()se γγγ- (7.11) 渐近服从标准正态分布。
在0H 成立的条件下1γ=,这时ˆ()t γ统计量不再服从通常的t 分布,而是服从DF 分布。
此时ˆ()t γ称为DF 统计量。
可以证明当T → ∞ 时,2ˆ()ˆ()1[((1))1]ˆ1W DF t s γγβ--==⇒ (7.12) DF 统计量是O p (1 )的,其渐近分布与σ 无关。
由于该极限分布无法用解析的方法求解,一般都是用模拟和数值计算的方法研究DF 统计量的有限样本分布。
图1 在情形1下: T =100,模拟1万次的DF 统计量的分布 情形2:数据生成过程(DGP ):y t = y t -1 + u t , y 0 = 0, u t ~ IID(0, σ 2) (7.13)OLS 估计过程: 1t t t y y u αγ-=++ (7.14) 其原假设为0:0;1;H αγ==1:0;1;H αγ≠<下面我们讨论ˆ()t γ、)ˆ(αt 的极限分布和有限样本分布特征。