当前位置:文档之家› 时间序列回归

时间序列回归

时间序列回归
时间序列回归

第十三章 时间序列回归

本章讨论含有ARMA 项的单方程回归方法,这种方法对于分析时间序列数据(检验序列相关性,估计ARMA 模型,使用分布多重滞后,非平稳时间序列的单位根检验)是很重要的。

§13.1序列相关理论 时间序列回归中的一个普遍现象是:残差和它自己的滞后值有关。这种相关性违背了回归理论的标准假设:干扰项互不相关。与序列相关相联系的主要问题有:

一、一阶自回归模型

最简单且最常用的序列相关模型是一阶自回归AR(1)模型

定义如下:t t t u x y +'=β

t t t u u ερ+=-1

参数ρ是一阶序列相关系数,实际上,AR(1)模型是将以前观测值的残差包含到现观测值的回归模型中。

二、高阶自回归模型:

更为一般,带有p 阶自回归的回归,AR(p)误差由下式给出:

t t t u x y +'=β

t p t p t t t u u u u ερρρ++++=--- 2211

AR(p)的自回归将渐渐衰减至零,同时高于p 阶的偏自相关也是零。

§13.2 检验序列相关

在使用估计方程进行统计推断(如假设检验和预测)之前,一般应检验残差(序列相关的证据),Eviews 提供了几种方法来检验当前序列相关。

1.Dubin-Waston 统计量 D-W 统计量用于检验一阶序列相关。

2.相关图和Q-统计量 计算相关图和Q-统计量的细节见第七章

3.序列相关LM 检验 检验的原假设是:至给定阶数,残差不具有序列相关。

§13.3 估计含AR 项的模型

随机误差项存在序列相关说明模型定义存在严重问题。特别的,应注意使用OLS 得出的过分限制的定义。有时,在回归方程中添加不应被排除的变量会消除序列相关。

1.一阶序列相关

在EViews 中估计一AR(1)模型,选择Quick/Estimate Equation 打开一个方程,用列表法输入方程后,最后将AR(1)项加到列表中。例如:估计一个带有AR(1)误差的简单消费函数

t t t u GDP c c CS ++=21

t t t u u ερ+=-1

应定义方程为: cs c gdp ar(1)

2.高阶序列相关

估计高阶AR 模型稍稍复杂些,为估计AR(k ),应输入模型的定义和所包括的各阶AR 值。如果想估计一个有1-5阶自回归的模型

t t t u GDP c c CS ++=21

t t t t u u u ερρ+++=--5511

应输入: cs c gdp ar(1) ar(2) ar(3) ar(4) ar(5)

3.存在序列相关的非线性模型

EViews 可以估计带有AR 误差项的非线性回归模型。例如:

估计如下的带有附加AR(2)误差的非线性方程

t c t

t u GDP c CS ++=21

t t t t u c u c u ε++=--2413

使用EViews 表达式定义模型,在后面的方括号内描述AR 修正项,对每一阶AR 滞后项都应包括一个系数,每项之间用逗号隔开。

cs=c(1)+gdp ∧

c(2)+[ar(1)=c(3),ar(2)=c(4)]

EViews 通过ρ差分来转换这种非线性模型且使用Gauss-Newton 迭代法来估计转换后的非线性模型。

4.存在序列相关的两阶段回归模型

通过把二阶段最小二乘法或二阶段非线性最小二乘法和AR 项结合起来,对于在回归因子和扰动项存在相关性的情况和残差存在序列相关一样估计模型。

5.AR 估计输出 含有AR 项的模型有两种残差:第一种是无条件残差 b x y u

t t t '-=?, 通过原始变量以及估计参数β算出。在用同期信息对y t 值进行预测时,这些残差是可以观测出的误差,但要忽略滞后残差中包含的信息。

通常,除非有特别的原因来检验这些残差,Eviews 不能自动计算下面的估计。

第二种残差是估计的一期向前预测误差ε

?。如名所示,这种残差代表预测误差。 一般AR(p )平稳条件是:滞后算子多项式的根的倒数在单位圆内。EViews 在回归输出的底部给出这些根:Inverted AR Roots 。如果存在虚根,根的模应该小于1。

6.EViews 如何估计AR 模型

EViews 估计AR 模型采用非线性回归方法。这种方法的优点在于:易被理解,应用广泛,易被扩展为非线性定义的模型。注意:非线性最小二乘估计渐进等于极大似然估计且渐进有效。

§13.4 ARIMA 理论

ARIMA (自回归单整动平均)模型是AR 模型的一般化,EViews 使用三种工具来为干扰项的序列相关建模:自回归AR 、单整I 、动平均MA 。

§13.5 估计ARIMA 模型

为建立ARIMA 模型,需要:① 差分因变量,确定差分阶数;② 描述结构回归模型(因变量和回归因子),加入AR 或MA 项。

一、ARMA 项 模型中AR 和MA 部分应使用关键词ar 和ma 定义。

二、季节ARMA 项 对于带有季节移动的季度数据,Box and Jenkins(1976)建议使用季节自回归SAR 和季节动平均SMA 。

三、ARIMA 估计输出 存在AR 或MA 定义的估计输出和OLS 是一样的,只是增加了一个AR ,MA 多项式的倒根的下部程序块。

四、ARMA 估计选择 带有AR 或MA 的模型用非线性最小二乘法估计。非线性估计方法对所有系数估计都要求初值。作为缺省Eviews 决定初值。用户可设置初值,EViews 使用C 系数向量。也可使用命令安排C 向量值定义,例如下面方程的系数

Y c X ma(2) ma(1) sma(4) ar(1)

可定义为 param c(1) 50 c(2 ) 0.8 c(3) 0.2 c(4) 0.6 c(5) 0.1 c(6) 0.5

初值:常数是50, X 系数的初值是0.8, ar(1)、ma(2)、ma(1)、sma(4) 系数的初值分别是0.2 , 0.6,0.1,0.5。

§13.6 诊断检验

如果ARMA 模型定义正确,模型残差将为白噪声。这意味着残差中应不存在序列相关。D-W 统计量是当方程右边没有滞后变量时对一阶序列相关的检验。如上所述,对残差中序列相关更多的检验可以如:

View/Residual Tests/Correlogram-Q-Statistic 和View/Residual Tests/Serial correlation LM Test 。

§13.7 多项分布滞后(PDLs )

一个分布滞后算子如下

t k t k t t t t x x x y εβββδω+++++=-- 110 (13.37)

系数β描述x 对y 作用的滞后。在模型中解释变量与随机误差项不相关的情况下,可以直接使用OLS 估计参数。在其它情形下,x 的当前和滞后值具有高共线性时,直接估计失败。

可以使用多项式分布滞后(PDLS )来减少要估计的参数个数,以此来平滑滞后系数。平滑就是要求系数服从一个相对低阶的多项式。P 阶PDLS 模型限制β系数服从如下形式的p 阶多项式

p p j c j c j c j )()()(12321-++-+-+=+γγγγβ j = 0 , 1 , 2 , … , k (13.38)

c 是事先定义常数:

???-=是偶数是奇数(p k p k c 2/)(2/)1(

PDLS 有时被称为Almon 分布滞后模型。常数c 仅用来避免共线性引起的数值问题,不影响β的估计。这种定义允许仅使用参数p 来估计一个x 的k 阶滞后的模型(如果p > k ,将显示“近似奇异“错误信息)。

如果定义一个PDL 模型,EViews 用(13.38)式代入到(13.37)式,将产生如下形式方程

t p p t t z z z y εγγγα+++++=++11221 (13.40)

其中

k

t p t p t p p k

t t t k

t t t x c k x c x c z x c k x c x c z x x x z --+-----++-+-=-++-+-=+++=)()1()()()1(111211

(13.41)

一旦从(13.40)式估计γ,利用(13.38)式就可得到β的各系数。这一过程很明了,因为β是γ的线性变换。定义一个PDLs 有三个元素:滞后长度k ,多项式阶数(多项式最高次幂数)p 和附加的约束。 §13.8 非平稳时间序列

上述ARMA 估计理论都是基于平稳时间序列。如果一个序列的均值和自协方差不依赖于时间,就说它是平稳的。非平稳序列的典型例子是随机游动 t t t y y ε+=-1,t ε是平稳随机扰动项。序列y 有一个常数预测值,方差随时间增长。随机游动是差分平稳序列,因为y 一阶差分后平稳。t t t t y L y y ε=-=--)1(1,差分平稳序列称为单整,记为I(d),d 为单整阶数。单整阶数是序列中单位根数,或者是使序列平稳而差分的阶数。对于上面的随机游动,有一个单位根,所以是I(1),同样,平稳序列是I(0)。

§13.9 单位根检验

EViews 提供两种单位根检验:Dickey-Fuller(DF)、增广DF(ADF)检验和Phillips-Perron (PP )检验。

一、ADF 检验

为说明ADF 检验的使用,先考虑一个AR(1)过程

t t t y y ερμ++=-1 (13.46)

ρμ,是参数,t ε假设为白噪声。如果-1<ρ<1,y 平稳序列。如果ρ=1,y 是非平稳序列(带漂移的随机游动)。如果这一过程在一些点开始,y 的方差随时间增长趋于无穷。如果ρ的绝对值大于1,序列发散。因此,一个序列是否平稳,可以检验ρ是否严格小于1。DF 和PP 都用单位根作为原假设。1:0=ρH 因为发散序列没有经济学含义,所以备选假设为单边假设1:1<ρH 。

从方程两边同时减去1-t y

t t t y y εγμ++=?-1

其中 1-=ργ (13.47)

所以原假设和备选假设可改为???<=0:0:1

0γγH H (13.48) 单位根检验可以看作对γ进行t 检验。EViews 将DF ,ADF 检验都看成为ADF 检验。ADF 检验考虑如下三种回归形式:

t p

i i t i t t y y y εβγ+?+=?∑=--11

t p

i i t i t t y y y εβγμ+?++=?∑=--11

t p i i t i t t y t a y a y εβγ∑=--+?+

++=?1210 即通过在模型中增加?y t 的滞后项,以消除残差的序列相关性。在检验回归中包括常数,常数和线性

趋势,或二者都不包含。 二、Phillips-Perron(PP)检验

Phillips 和Perron (1988)提出一种非参数方法来控制序列中高阶序列相关。对AR(1)的PP 检验为:

t t t y y εβα++=?-1 (13.51)

ADF 检验通过在方程右边添加滞后差分项来修正高阶序列相关。PP 检验γ参数的t 统计量来修正AR(1)的ε序列相关。这种修正方法是非参数的,因为我们使用ε在零频率的谱估计。零频率对未知形式的异方差性和自相关性较稳健。EViews 使用Newey-West 异方差自相关一致估计

∑=+-+=q j j q 102

)11(2?γυ

γω (13.52) ∑+=-=T j t j t t j T 1

??1εεγ (13.53) q 是截断滞后值。PP 统计量由下式计算:

s Ts t t b b pp ω

γωωγ?2)?(?0210--= (13.54) b t 是t 统计量;b s 是β的标准差;s 是检验回归标准差。PP 统计量渐进分布同ADF 的t 统计量一样。EViews 显示Mackinnon 临界值。对PP 检验,必须为Newey-West 纠正定义截断滞后因子q ,即要包括的序列相关期数。对话框开始包括N-W 自动截断滞后选择(floor 函数返回的是不超过括号中数的最大整数)

))100/(4(92T floor q =

这仅基于检验回归中使用的观测值数,也可定义为任何整数。

§13.10 命 令

命令equation eq_gdp.ls gdp c ar(1) ar (2) ma(1) ma(2)用来用一个arma(2,2)模型拟和序列GDP 并把结果储存在方程 EQ_GDP 中。

命令 eq1.auto(4) 用来检验方程EQ!残差序列直到四阶的相关系数。

命令eq1.correlogram(12)用来显示方程直到12阶的残差相关图。

命令equation eq2.ls gdp c pdl(m1,12,3) 使用一个三次多项式拟和m1直到十二阶的值。

命令gdp.ruoot(4, c)用来运行一个带常数和四阶滞后的ADF 检验。

多元时间序列建模分析

应用时间序列分析实验报告

单位根检验输出结果如下:序列x的单位根检验结果:

1967 58.8 53.4 1968 57.6 50.9 1969 59.8 47.2 1970 56.8 56.1 1971 68.5 52.4 1972 82.9 64.0 1973 116.9 103.6 1974 139.4 152.8 1975 143.0 147.4 1976 134.8 129.3 1977 139.7 132.8 1978 167.6 187.4 1979 211.7 242.9 1980 271.2 298.8 1981 367.6 367.7 1982 413.8 357.5 1983 438.3 421.8 1984 580.5 620.5 1985 808.9 1257.8 1986 1082.1 1498.3 1987 1470.0 1614.2 1988 1766.7 2055.1 1989 1956.0 2199.9 1990 2985.8 2574.3 1991 3827.1 3398.7 1992 4676.3 4443.3 1993 5284.8 5986.2 1994 10421.8 9960.1 1995 12451.8 11048.1 1996 12576.4 11557.4 1997 15160.7 11806.5 1998 15223.6 11626.1 1999 16159.8 13736.5 2000 20634.4 18638.8 2001 22024.4 20159.2 2002 26947.9 24430.3 2003 36287.9 34195.6 2004 49103.3 46435.8 2005 62648.1 54273.7 2006 77594.6 63376.9 2007 93455.6 73284.6 2008 100394.9 79526.5 run; proc gplot; plot x*t=1 y*t=2/overlay; symbol1c=black i=join v=none; symbol2c=red i=join v=none w=2l=2; run; proc arima data=example6_4; identify var=x stationarity=(adf=1); identify var=y stationarity=(adf=1); run; proc arima; identify var=y crrosscorr=x; estimate methed=ml input=x plot; forecast lead=0id=t out=out; proc aima data=out; identify varresidual stationarity=(adf=2); run;

试验一异方差的检验与修正-时间序列分析

案例三 ARIMA 模型的建立 一、实验目的 了解ARIMA 模型的特点和建模过程,了解AR ,MA 和ARIMA 模型三者之间的区别与联系,掌握如何利用自相关系数和偏自相关系数对ARIMA 模型进行识别,利用最小二乘法等方法对ARIMA 模型进行估计,利用信息准则对估计的ARIMA 模型进行诊断,以及如何利用ARIMA 模型进行预测。掌握在实证研究如何运用Eviews 软件进行ARIMA 模型的识别、诊断、估计和预测。 二、基本概念 所谓ARIMA 模型,是指将非平稳时间序列转化为平稳时间序列,然后将平稳的时间序列建立ARMA 模型。ARIMA 模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA )、自回归过程(AR )、自回归移动平均过程(ARMA )以及ARIMA 过程。 在ARIMA 模型的识别过程中,我们主要用到两个工具:自相关函数ACF ,偏自相关函数PACF 以及它们各自的相关图。对于一个序列{}t X 而言,它的第j 阶自相关系数j ρ为它的j 阶自协方差除以方差,即j ρ=j 0γγ ,它是关于滞后期j 的函数,因此我们也称之为自相关函数,通常记ACF(j )。偏自相关函数PACF(j )度量了消除中间滞后项影响后两滞后变量之间的相关关系。 三、实验内容及要求 1、实验内容: (1)根据时序图的形状,采用相应的方法把非平稳序列平稳化; (2)对经过平稳化后的1950年到2007年中国进出口贸易总额数据运用经典B-J 方法论建立合适的ARIMA (,,p d q )模型,并能够利用此模型进行进出口贸易总额的预测。 2、实验要求: (1)深刻理解非平稳时间序列的概念和ARIMA 模型的建模思想; (2)如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARIMA 模型;如何利用ARIMA 模型进行预测; (3)熟练掌握相关Eviews 操作,读懂模型参数估计结果。 四、实验指导 1、模型识别 (1)数据录入 打开Eviews 软件,选择“File”菜单中的“New --Workfile”选项,在“Workfile structure type ”栏选择“Dated –regular frequency ”,在“Date specification ”栏中分别选择“Annual ”(年数据) ,分别在起始年输入1950,终止年输入2007,点击ok ,见图3-1,这样就建立了一个工作文件。点击File/Import ,找到相应的Excel 数据集,导入即可。

时间序列分析——最经典的

【时间简“识”】 说明:本文摘自于经管之家(原人大经济论坛) 作者:胖胖小龟宝。原版请到经管之家(原人大经济论坛) 查看。 1.带你看看时间序列的简史 现在前面的话—— 时间序列作为一门统计学,经济学相结合的学科,在我们论坛,特别是五区计量经济学中是热门讨论话题。本月楼主推出新的系列专题——时间简“识”,旨在对时间序列方面进行知识扫盲(扫盲,仅仅扫盲而已……),同时也想借此吸引一些专业人士能够协助讨论和帮助大家解疑答惑。 在统计学的必修课里,时间序列估计是遭吐槽的重点科目了,其理论性强,虽然应用领域十分广泛,但往往在实际操作中会遇到很多“令人发指”的问题。所以本帖就从基础开始,为大家絮叨絮叨那些关于“时间”的故事! Long long ago,有多long估计大概7000年前吧,古埃及人把尼罗河涨落的情况逐天记录下来,这一记录也就被我们称作所谓的时间序列。记录这个河流涨落有什么意义当时的人们并不是随手一记,而是对这个时间序列进行了长期的观察。结果,他们发现尼罗河的涨落非常有规律。掌握了尼罗河泛滥的规律,这帮助了古埃及对农耕和居所有了规划,使农业迅速发展,从而创建了埃及灿烂的史前文明。

好~~从上面那个故事我们看到了 1、时间序列的定义——按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。 2、时间序列分析的定义——对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。 既然有了序列,那怎么拿来分析呢 时间序列分析方法分为描述性时序分析和统计时序分析。 1、描述性时序分析——通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析 描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。 2、统计时序分析 (1)频域分析方法 原理:假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动 发展过程: 1)早期的频域分析方法借助富里埃分析从频率的角度揭示时间序列的规律 2)后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数 3)20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段 特点:非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性 (2)时域分析方法

统计学第四版贾俊平人大_回归与时间序列stata

回归分析与时间序列 一、一元线性回归 11.1 (1)编辑数据集,命名为linehuigui1.dat 输入命令scatter cost product,xlabel(#10, grid) ylabel(#10, grid),得到如下散点图,可以看到,产量和生产费用是正线性相关的关系。 (2)输入命令reg cost product,得到如下图: 可得线性函数(product为自变量,cost为因变量):y=0.4206832x+124.15,即β0=124.15,β1=0.4206832 (3)对相关系数的显著性进行检验,可输入命令pwcorr cost product, sig star(.05) print(.05),得到下图:

可见,在α=0.05的显著性水平下,P=0.0000<α=0.05,故拒绝原假设,即产量和生产费用之间存在显著的正相关性。 11.2 (1)编辑数据集,命名为linehuigui2.dat 输入命令scatter fenshu time,xlabel(#4, grid) ylabel(#4, grid),得到如下散点图,可以看到,分数和复习时间是正线性相关的关系。 2)输入命令cor fenshu time计算相关系数,得下图: 可见,r=0.8621,可见分数和复习时间之间存在高度的正相关性。 11.3 (1)(2)对于线性回归方程y=10-0.5x,其中β0=10,表示回归直线的截距为10;β1=-0.5,表示x变化一单位引起y的变化为-0.5。 (3)x=6时,E(y)=10-0.5*6=7。 11.4 (1) ,判定系数 测度了回归直线对观测数据的拟合程度,即在分数的变差中,有90%可以由分数与复习时间之间的线性关系解释,或者说,在分数取值的变动中,

第十三章 时间序列回归

第十三章 时间序列回归 本章讨论含有ARMA 项的单方程回归方法,这种方法对于分析时间序列数据(检验序列相关性,估计ARMA 模型,使用分布多重滞后,非平稳时间序列的单位根检验)是很重要的。 §13.1序列相关理论 时间序列回归中的一个普遍现象是:残差和它自己的滞后值有关。这种相关性违背了回归理论的标准假设:干扰项互不相关。与序列相关相联系的主要问题有: 一、一阶自回归模型 最简单且最常用的序列相关模型是一阶自回归AR(1)模型 定义如下:t t t u x y +'=β t t t u u ερ+=-1 参数ρ是一阶序列相关系数,实际上,AR(1)模型是将以前观测值的残差包含到现观测值的回归模型中。 二、高阶自回归模型: 更为一般,带有p 阶自回归的回归,AR(p)误差由下式给出: t t t u x y +'=β t p t p t t t u u u u ερρρ++++=--- 2211 AR(p)的自回归将渐渐衰减至零,同时高于p 阶的偏自相关也是零。 §13.2 检验序列相关 在使用估计方程进行统计推断(如假设检验和预测)之前,一般应检验残差(序列相关的证据),Eviews 提供了几种方法来检验当前序列相关。 1.Dubin-Waston 统计量 D-W 统计量用于检验一阶序列相关。 2.相关图和Q-统计量 计算相关图和Q-统计量的细节见第七章 3.序列相关LM 检验 检验的原假设是:至给定阶数,残差不具有序列相关。 §13.3 估计含AR 项的模型 随机误差项存在序列相关说明模型定义存在严重问题。特别的,应注意使用OLS 得出的过分限制的定义。有时,在回归方程中添加不应被排除的变量会消除序列相关。 1.一阶序列相关 在EViews 中估计一AR(1)模型,选择Quick/Estimate Equation 打开一个方程,用列表法输入方程后,最后将AR(1)项加到列表中。例如:估计一个带有AR(1)误差的简单消费函数 t t t u GDP c c CS ++=21 t t t u u ερ+=-1 应定义方程为: cs c gdp ar(1) 2.高阶序列相关 估计高阶AR 模型稍稍复杂些,为估计AR(k ),应输入模型的定义和所包括的各阶AR 值。如果想估计一个有1-5阶自回归的模型 t t t u GDP c c CS ++=21 t t t t u u u ερρ+++=--5511 应输入: cs c gdp ar(1) ar(2) ar(3) ar(4) ar(5) 3.存在序列相关的非线性模型 EViews 可以估计带有AR 误差项的非线性回归模型。例如: 估计如下的带有附加AR(2)误差的非线性方程 t c t t u GDP c CS ++=21

时间序列分析法原理及步骤

时间序列分析法原理及步骤 ----目标变量随决策变量随时间序列变化系统 一、认识时间序列变动特征 认识时间序列所具有的变动特征, 以便在系统预测时选择采用不同的方法 1》随机性:均匀分布、无规则分布,可能符合某统计分布(用因变量的散点图和直方图及其包含的正态分布检验随机性, 大多服从正态分布 2》平稳性:样本序列的自相关函数在某一固定水平线附近摆动, 即方差和数学期望稳定为常数 识别序列特征可利用函数 ACF :其中是的 k 阶自 协方差,且 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于 0, 前者测度当前序列与先前序列之间简单和常规的相关程度, 后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。实际上, 预测模型大都难以满足这些条件, 现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。 二、选择模型形式和参数检验 1》自回归 AR(p模型

模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量互相独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性的比你更造成的困难用 PACF 函数判别 (从 p 阶开始的所有偏自相关系数均为 0 2》移动平均 MA(q模型 识别条件

平稳时间序列的偏相关系数和自相关系数均不截尾,但较快收敛到 0, 则该时间序列可能是 ARMA(p,q模型。实际问题中,多数要用此模型。因此建模解模的主要工作时求解 p,q 和φ、θ的值,检验和的值。 模型阶数 实际应用中 p,q 一般不超过 2. 3》自回归综合移动平均 ARIMA(p,d,q模型 模型含义 模型形式类似 ARMA(p,q模型, 但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用 ARMA(p,q模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中 d (差分次数一般不超过 2. 模型识别 平稳时间序列的偏相关系数和自相关系数均不截尾,且缓慢衰减收敛,则该时间序列可能是 ARIMA(p,d,q模型。若时间序列存在周期性波动, 则可按时间周期进

时间序列中回归模型的诊断检验

时间序列中回归模型的诊断检验 【摘要】:时间序列是指被观测到的依时间次序排列的数据序列。从经济、金融到工程技术,从天文、地理到气象,从医学到生物,几乎在各个领域中都涉及到时间序列。对时间序列数据进行统计分析及推断,被称为时间序列分析。近几十年来,金融时间序列分析得到了人们广泛的关注。Engle在1982年对英国的通货膨胀率数据进行分析时提出一种统计建模思想:时间序列自回归模型误差的条件方差不一定是常数,可以随时间的变化而不同。基于这个思想,Engle首次提出了条件异方差模型,即人们熟知的ARCH(p)模型。由于Engle出色的开创性工作,金融时间序列条件异方差模型很快在学术界和实际应用中得到了极大的关注。许多专家学者根据实际中经济、金融数据的各种特征,提出了各种各样的条件异方差模型,并研究各种参数或非参数估计方法。但是,提出的模型是否合理?或者说,观测数据是否真的来自这一模型?人们往往不太关心。这个问题实际上是所谓的模型检验问题。对于著名的Box-Jenkins时间序列建模三步曲:模型的建立、模型的参数估计和模型的检验,理论上他们具有同等重要的地位。但是,正如专著Li所述,人们关注更多的是前面两步工作,而第三步(即模型的检验)常常得不到应有的重视。对于近二十年来受到广泛关注的条件异方差模型,模型检验问题同样没有得到应有的关注,相关的研究寥寥无几。对传统的回归模型,文献中主要有两大类模型检验方法:局部光滑方法和整体光滑方法。局部光滑方法涉及用非参数

估计方法估计其均值函数从而有可能导致维数问题。为了避免维数问题,学者们提出了各种各样的整体光滑方法用于模型检验,构造的检验不需要非参数光滑,但是对高频备择不敏感。上述两种方法各有优缺点。另外,这两种方法基本上都是针对因变量为一元情形。因此,本文提出一些新的方法来处理时间序列自回归模型的模型检验问题。需要特别指出的是,本文考虑的时间序列包括一元和多元情形,回归函数形式可以非常一般,自回归变量可以有多个后置项。本文首先研究了一元时间序列一般形式的自回归模型(包括条件异方差模型的均值模型和方差模型)的模型检验问题。通过模型的残差或标准化的残差进行加权平均,我们构造了一个得分型检验统计量。该检验具有许多优良性质,比如:在零假设模型下是渐近卡方分布的,处理起来简单;对备择假设敏感,能检测到以参数的速度收敛到原假设的备择假设模型;通过权函数的选择可以构造功效高的检验。在方向备择情形,我们研究得到了最优(功效最高)的得分型检验。当备择不是沿着某一方向而是多个可能的方向趋于原假设时,我们构造了极大极小(maximin)检验,该检验是渐近分布自由的,并具有许多优良性质。另外,对备择完全未知(即完全饱和备择)情形,我们也基于得分型检验的思想提出了一个构造万能检验(omnibustest)的可行性方案。需要指出的是,关于时间序列回归模型的诊断检验问题,本文是第一篇理论上研究检验的功效性质的文章。另外,在进行功效研究的过程中,我们得到了当模型被错误指定时参数估计(拟极大似然估计)的渐近性质。注意到得分型检验在构造过程中涉及渐近方差的插入估计

实验三 SPSS 多元时间序列分析方法

实验三多元时间序列分析方法 1.实验目的 了解协整理论及协整检验方法;掌握协整的两种检验方法:E-G两步法与Johansen方法;熟悉向量自回归模型VAR的应用;掌握误差修正模型ECM的含义及检验方法;掌握Granger因果关系检验方法。 2.实验仪器 装有EViews7.0软件的微机一台。 3.实验内容 【例6-2】 时间与M2之间的关系首先用单位根检验是否为平稳序列。原假设为H0:非平稳序列H1:平稳序列。用Eviews软件解决该问题,得到如下结果:Null Hypothesis: M2 has a unit root Exogenous: None Lag Length: 3 (Automatic - based on SIC, maxlag=13) t-Statistic Prob.* Augmented Dickey-Fuller test statistic 5.681169 1.0000 Test critical values: 1% level -2.579052 5% level -1.942768 10% level -1.615423

*MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(M2) Method: Least Squares Date: 04/16/13 Time: 10:36 Sample (adjusted): 1991M05 2005M01 Included observations: 165 after adjustments Variable Coefficien t Std. Error t-Statistic Prob. M2(-1) 0.013514 0.002379 5.681169 0.0000 D(M2(-1)) -0.490280 0.074458 -6.584611 0.0000 D(M2(-2)) 0.070618 0.083790 0.842797 0.4006 D(M2(-3)) 0.387086 0.073788 5.245935 0.0000 R-squared 0.480147 Mean dependent var 1440.03 7 Adjusted R-squared 0.470461 S.D. dependent var 1509.48 9 S.E. of regression 1098.447 Akaike info criterion 16.8651 3

8时间序列回归模型——R实现

时间序列回归模型 1干预分析 1.1概念及模型 Box和Tiao引入的干预分析提供了对于干预影响时间序列的效果进行评估的一个框架,假设干预是可以通过时间序列的均值函数或者趋势而对过程施加影响,干预可以自然产生也可以人为施加的,如国家的宏观调控等。 其模型可以如下表示: 其中mt代表均值的变化,Nt是ARIMA过程。 1.2干预的分类 阶梯响应干预

脉冲响应干预 1.3干预的实例分析 1.3.1模型初探 对数化航空客运里程的干预模型的估计

> data(airmiles) > acf(diff(diff(window(log(airmiles),end=c(2001,8)),12))),=48)#用window得到在911事件以前的未爱干预的时间序列子集 对暂用的模型进行诊断 >fitmode<-arima(airmiles,order=c(0,1,1),seasonal=list(order=c(0,1,0))) > tsdiag(fitmode)

从诊断图可以看出存在三个异常点,acf在12阶存在高度相关因此在季节中加入MA(1)系数。 1.3.2拟合带有干预信息的模型 函数: arimax(x, order = c(0, 0, 0), seasonal = list(order = c(0, 0, 0), period = NA), xreg = NULL, = TRUE, = TRUE, fixed = NULL, init = NULL, method = c("CSS-ML", "ML", "CSS"), , = list(), kappa = 1e+06, io = NULL, xtransf, transfer = NULL) arimax函数扩展了arima函数,可以处理时间序列中干扰分析及异常值。假设干扰影响过程的均值,相对未受干扰的无价值函数的偏离用一些协变量的ARMA滤波器的输出这种来表示,偏差被称作传递函数。构造传递函数的协变量通过xtransf参数以矩阵或者的形式代入arimax函数。 =arimax(log(airmiles),order=c(0,1,1),seasonal=list(order=c(0,1,1), period=12),xtransf=(I911=1*(seq(airmiles)==69),

多元时间序列建模分析

多元时间序列建模分析 应用时间序列分析实验报告

实验过程记录(含程序、数据记录及分析与实验结果等): 时序图如下: 单位根检验输出结果如下: 序列x的单位根检验结果: 序列y的单位根检验结果: 序列y与序列x之间的相关图如下:

1968 57、6 50、9 1969 59、8 47、2 1970 56、8 56、1 1971 68、5 52、4 1972 82、9 64、0 1973 116、9 103、6 1974 139、4 152、8 1975 143、0 147、4 1976 134、8 129、3 1977 139、7 132、8 1978 167、6 187、4 1979 211、7 242、9 1980 271、2 298、8 1981 367、6 367、7 1982 413、8 357、5 1983 438、3 421、8 1984 580、5 620、5 1985 808、9 1257、8 1986 1082、1 1498、3 1987 1470、0 1614、2 1988 1766、7 2055、1 1989 1956、0 2199、9 1990 2985、8 2574、3 1991 3827、1 3398、7 1992 4676、3 4443、3 1993 5284、8 5986、2 1994 10421、8 9960、1 1995 12451、8 11048、1 1996 12576、4 11557、4 1997 15160、7 11806、5 1998 15223、6 11626、1 1999 16159、8 13736、5 2000 20634、4 18638、8 2001 22024、4 20159、2 2002 26947、9 24430、3 2003 36287、9 34195、6 2004 49103、3 46435、8 2005 62648、1 54273、7 2006 77594、6 63376、9 2007 93455、6 73284、6 2008 100394、9 79526、5 run; proc gplot; plot x*t=1 y*t=2/overlay; symbol1c=black i=join v=none; symbol2c=red i=join v=none w=2l=2; run; proc arima data=example6_4; identify var=x stationarity=(adf=1); identify var=y stationarity=(adf=1); run; proc arima; identify var=y crrosscorr=x; estimate methed=ml input=x plot; forecast lead=0id=t out=out; proc aima data=out; identify varresidual stationarity=(adf=2);

回归分析时间序列分析答案.doc

回归分析时间序列分析答案 一、单项选择题 1、下面的关系中不是相关关系的是(D ) A、身高与体重之间的关系 B、工资水平与工龄之间的关系 C、农作物的单位面积产量与降雨量之间的关系 D、圆的面积与半径之间的关系 2、具有相关关系的两个变量的特点是(A ) A、一个变量的取值不能由另一个变量唯一确定 B、一个变量的取值由另一个变量唯一确定 C、一个变量的取值增大时另一个变量的取值也一定增大 D、一个变量的取值增大时另一个变量的取值肯定变小 3、下面的假定中,哪个属于相关分析中的假定(B) A、两个变量之间是非线性关系 B、两个变量都是随机变量 C、自变量是随机变量,因变量不是随机变量 D、一个变量的数值增大,另一个变量的数值也应增大 4、如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为(A ) A、完全相关关系 B、正线性相关关系 C、非线性相关关系 D、负线性相关关系 5、根据你的判断,下面的相关系数取值哪一个是错误的( C ) A、–0.86 B、0.78 C、1.25 D、0

x6、某校经济管理类的学生学习统计学的时间()与考试成绩(y)之间建立线性回归方程y x=a+b。经计算,方程为y =200—0.8x,该方程参数的计算(C) cc A a值是明显不对的 B b值是明显不对的 C a值和b值都是不对的 D a值和b值都是正确的 7、在回归分析中,描述因变量y如何依赖于自变量x和误差项ε的方程称为(B) A、回归方程 B、回归模型 C、估计回归方程 D、经验回归方程 ,,,x,,8、在回归模型y=中,ε反映的是(C ) 01 A、由于x的变化引起的y的线性变化部分 B、由于y的变化引起的x的线性变化部分 C、除x和y的线性关系之外的随机因素对y的影响 D、由于x和y的线性关系对y的影响 9、如果两个变量之间存在负相关关系,下列回归方程中哪个肯定有误(B) ,, A、=25–0.75x B、= –120+ 0.86x yy ,, C、=200–2.5x D、= –34–0.74x yy 10、说明回归方程拟合优度的统计量是(C ) A、相关系数 B、回归系数 C、判定系数 D、估计标准误差 211、判定系数R是说明回归方程拟合度的一个统计量,它的计算公式为(A ) SSRSSRSSESSTA、 B、 C、 D、 SSTSSESSTSSR 12、为了研究居民消费(C)与可支配收入(Y)之间的关系,有人运用回归分析的方法,得到以下方程:在该方程中0.76的含义是(B ) LnC,2.36,0.76LnY, A、可支配收入每增加1元,消费支出增加0.76元

时间序列分析课程设计(最终版)汇总

《时间序列分析》 课程设计报告 学院 专业 姓名 学号 评语: 分数 二○一二年十一月

目录 1.平稳序列分析(选用数据:国内工业同比增长率)-------------------------3 1.1 序列分析--------------------------------------------------------------3 1.2 附录(程序代码)------------------------------------------------------7 2.非平稳序列分析I(选用数据:国家财政预算支出)-------------------------8 2.1 使用ARIMA进行拟合-------------------------------------------------8 2.2 使用残差自回归进行拟合---------------------------------------------11 2.3 附录(程序代码)-----------------------------------------------------12 3.非平稳序列分析II(选用数据:美国月度进出口额)------------------------13 3.1序列分析--------------------------------------------------------------13 3.2附录(程序代码)------------------------------------------------------18

一、平稳序列分析(选用数据:国内工业同比增长率,2005年01月-2012年5月)绘制时序图 的趋势以及周期性,波动稳定,可以初步判定为平稳序列。下面进一步考察序列的自相关图。 认为该序列平稳。下面对序列进行白噪声检验。

一异方差的检验与修正-时间序列分析

案例三ARIMA模型的建立 一、实验目的 了解ARIMA模型的特点和建模过程,了解AR,MA和ARIMA模型三者之间的区别与联系,掌握如何利用自相关系数和偏自相关系数对ARIMA模型进行识别,利用最小二乘法等方法对ARIMA模型进行估计,利用信息准则对估计的ARIMA模型进行诊断,以及如何利用ARIMA模型进行预测。掌握在实证研究如何运用Eviews软件进行ARIMA模型的识别、诊断、估计和预测。 二、基本概念 所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将平稳的时间序列建立ARMA模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。 在ARIMA模型的识别过程中,我们主要用到两个工具:自相关函数ACF,偏自相关函数PACF以及它们各自的相关图。对于一个序列{}t X而言,它的第j阶自相关系数jρ为它 γγ,它是关于滞后期j的函数,因此我们也称之为的j阶自协方差除以方差,即jρ=j0 自相关函数,通常记ACF(j)。偏自相关函数PACF(j)度量了消除中间滞后项影响后两滞后变量之间的相关关系。 三、实验内容及要求 1、实验内容: (1)根据时序图的形状,采用相应的方法把非平稳序列平稳化; (2)对经过平稳化后的1950年到2007年中国进出口贸易总额数据运用经典B-J方法论建p d q)模型,并能够利用此模型进行进出口贸易总额的预测。 立合适的ARIMA(,, 2、实验要求: (1)深刻理解非平稳时间序列的概念和ARIMA模型的建模思想; (2)如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARIMA模型;如何利用ARIMA模型进行预测; (3)熟练掌握相关Eviews操作,读懂模型参数估计结果。 四、实验指导 1、模型识别 (1)数据录入 打开Eviews软件,选择“File”菜单中的“New--Workfile”选项,在“Workfile structure type”栏选择“Dated –regular frequency”,在“Date specification”栏中分别选择“Annual”(年数据) ,分别在起始年输入1950,终止年输入2007,点击ok,见图3-1,这样就建立了一个工作文件。点击File/Import,找到相应的Excel数据集,导入即可。

基于时间序列模型与线性回归模型的历史数据预测

基于时间序列模型与线性回归模型的历史数据预测 摘要:本文通过具体案例,简要说明根据时间序列数据建立和相应经济理论建立线性回归模型的简要步骤及基本原则,并着重介绍了在模型建立和模型有效性检验过程中需要注意的三个主要问题,最后简单介绍了进行模型修正的相应方法。 引言 多元线性回归模型的一般形式为: Y=β0+β1X1+β2X2+…+βkXk+μi (k,i=1,2,…,n) 其中k为解释变量的数目,βk(k=1,2,…,n)称为回归系数,上式也被称为总体回归函数的随机表达式。 从统计意义上说,所谓时间序列模型就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响,往往表现出某种随机性,彼此之间存在着统计上的依赖关系。从数学意义上说,如果我们对某一过程中的某一个变量或一组变量X(t)进行观察测量,在一系列时刻t1,t2, …,tn(t为自变量,且t1

时间序列分析方法第11章向量自回归

第十一章 向量自回归 前一章我们讨论了向量随机过程的基本性质。本章我们将深入分析向量自回归模型,这种模型更适合于估计和预测。由于Sims(1980)年在经济中的出色运用,向量自回归模型在分析经济系统的动态性上得到了广泛的应用。 §11.1 无限制向量自回归模型的极大似然估计和假设检验 按照时间序列模型极大似然估计方法,我们首先分析向量自回归模型的条件似然估计。 11.1.1 向量自回归模型的条件似然函数 假设t y 表示一个包含时间t 时n 个变量的1?n 的向量。假设t y 的动态过程可以由下面的p 阶高斯向量自回归过程: t t t 1t 1εy Φy Φy Φc y +++++=---p p t 22,)(~Ω0,εt N 假设我们已经在)(p T +个时间间隔中观测到这些n 个变量的观测值。如同标量过程时的情形,最简单的方法是将前p 个样本(表示为021,,,y y y +-+-p p )做为条件,然后利用后面的T 个样本(表示为T y y y ,,,21 )形成参数估计。我们的目的是构造下面的条件似然函数: );(θy ,y ,y |y ,,y ,y 1p 1011T T Y ,Y ,Y |Y ,,Y ,Y 1p 1011T T +---+--- f 这里参数向量为)(Ω,Φ,,Φ,Φc,θp 21 =,我们在上述函数中相对于参数θ进行极大化。一般情形下,向量自回归模型是在条件似然函数基础上,而不是在无条件似然函数基础上进行估计的。为了简单起见,我们将上述“条件似然函数”称为“似然函数”,相应的“条件极大似然估计”称为“极大似然估计”。 向量自回归与标量自回归过程的似然函数的计算方法是类似的。基于时刻1-t 以前观测值,时刻t 的t y 值等于常数向量:p t p t t ---++++y Φy Φy Φc 2211,加上一个多元正态分布的随机向量)(~Ω0,εt N ,因此条件分布为: ),(~|22Ωy Φy Φy Φc y ,,y y t t 1t 11p p p t t t N -----++++ 我们可以将上述条件分布表示成为更为紧凑的形式。假设向量t x 是常数向量和t y 滞后值向量构成的综合向量: ),1(1'''≡--p t t t y ,,y x 这是一个维数为]1)1[(?+np 的列向量。假设Π'表示下述)]1([+?np n 维矩阵: ],,,,[21p ΦΦΦc Π ≡' 这时条件均值可以表示为t x Π',Π'的第j 行包含V AR 模型第j 个方程中的参数。使用这样的符号,我们可以把条件分布表示成为紧凑形式: ),(~|Ωx Πy ,,y y 1t p t t t N '-- 因此第t 个观测值的条件分布可以表示成为: )] ())(2/1exp{(||)2() ;,|(12/112/21|11t t t t n p t t t p t t f x Πy Ωx Πy Ωθy ,y ,y y 1Y ,,Y ,Y '-''--=---+---+--π 这是基于条件),,,{110+--p y y y 的观测值从1到t 的联合概率分布为:

相关主题
文本预览
相关文档 最新文档