当前位置:文档之家› 时间序列模型概述

时间序列模型概述

时间序列模型概述
时间序列模型概述

Wold 分解定理:任何协方差平稳过程x t ,都可以被表示为

x t - - d t = u t + 1 u t -1+ 2 u t -2 + … + =

其中 表示x t 的期望。d t 表示x t 的线性确定性成分,如周期性成分、时间t 的多项式和指数形式等,可以直接用x t 的滞后值预测。

= 1,

∑∞

=0

2

j j ψ< ∞。u t 为白噪声过程。u t 表示用x t 的滞后项预测x t

时的误差。

u t = x t - E(x t x t -1, x t -2 , …)

∞=-0

j j

t j u ψ称为x t 的线性非确定性成分。当d t = 0时,称x t 为纯线性非确定性过程。

Wold 分解定理由Wold 在1938年提出。Wold 分解定理只要求过程2阶平稳即可。从原理上讲,要得到过程的Wold 分解,就必须知道无限个j 参数,这对于一个有限样本来说是不可能的。实际中可以对

j 做另一种假定,即可以把

(L )看作是2个有限特征多项式的比, (L ) =∑

=0

j j

j L

ψ=)()(L L ΦΘ=p p q q L L L L L L φφφθθθ++++++++...1 (1221221)

注意,无论原序列中含有何种确定性成分,在前面介绍的模型种类中,还是后面介绍的自相关函数、偏自相关函数中都假设在原序列中已经剔除了所有确定性成分,是一个纯的随机过程(过程中不含有任何确定性成分)。如果一个序列如上式,

x t = + d t + u t + 1 u t -1+ 2 u t -2 + … +

则所有研究都是在y t = x t - - d t 的基础上进行。例如前面给出的各类模型中都不含有均值项、时间趋势项就是这个道理。

2.3 自相关函数

以上介绍了随机过程的几种模型。实际中单凭对时间序列的观察很难确定其属于哪一种模型,而自相关函数和偏自相关函数是分析随机过程和识别模型的有力工具。

1. 自相关函数定义

在给出自相关函数定义之前先介绍自协方差函数概念。由第一节知随机过程{x t }中的每一个元素x t ,t = 1, 2, … 都是随机变量。对于平稳的随机过程,其期望为常数,用 表示,即

E(x t ) = , t = 1, 2, … (2.25)

随机过程的取值将以为中心上下变动。平稳随机过程的方差也是一个常量

Var(x t) = E [(x t- E(x t))2] = E [(x t- )2] = x2, t= 1, 2, … (2.26) x

2用来度量随机过程取值对其均值的离散程度。

相隔k期的两个随机变量x t与x t - k的协方差即滞后k期的自协方差,定义为

k= Cov (x t, x t - k) = E[(x t- ) (x t - k- ) ] (2.27)自协方差序列

k, k= 0, 1, …, K,

称为随机过程 {x t} 的自协方差函数。当k = 0 时

0 = Var (

x t) = x2

自相关系数定义

k =

)

(

)

(

)

,

(

k

t

t

k

t

t

x

Var

x

ar

V

x

x

Cov

-

-

(2.28)

因为对于一个平稳过程有

Var (x t) = Var (x t - k) = x2 (2.29)所以(2.28)可以改写为

k =

2

)

,

(

x

k

t

t

x

x

Cov

σ

-

=

2

x

k

σ

γ

= 0γ

γk

(2.30)

当k = 0 时,有0 = 1。

以滞后期k为变量的自相关系数列

k, k= 0, 1, …, K (2.31)

称为自相关函数。因为k = - k即Cov (x t - k, x t ) = Cov (x t, x t + k ),自相关函数是零对称的,所以实际研究中只给出自相关函数的正半部分即可。

2.自回归过程的自相关函数

(1) 平稳AR(1)过程的自相关函数

AR(1) 过程如下

x t = x t-1 + u t , 1

用x t- k同乘上式两侧

x t x t- k= x t-1 x t- k + u t x t- k

两侧同取期望,

k = 1 k -1

其中E(x t- k u t) = 0(u t与其t - k期及以前各项都不相关)。两侧同除0 得,

k = 1 k -1 = 1 1 k -2= … = 1k

因为o = 1。所以有

k = 1

k , (k 0)

对于平稳序列有。所以当1为正时,自相关函数按指数衰减至零(过阻尼情形),当1为负时,自相关函数正负交错地指数衰减至零。见图2.6。因为对于经济时间序列,1一般为正,所以第一种情形常见。指数衰减至零的表现形式说明随着时间间隔的加长,变量之间的关系变得越来越弱。

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

0 (经济问题中常见)

0 (经济问题中少见)

图2.6 AR(1) 过程的自相关函数

(2)AR(p ) 过程的自相关函数 用x t - k , (k 同乘平稳的 p 阶自回归过程 x t =

1 x t -1

+

2

x t -2 +…+

p x t - p

+ u t (2.32)

的两侧,得

x t - k x t = 1 x t - k x t -1 + 2

x t - k x t -2 + … +

p

x t - k x t - p + x t - k u t (2.33)

对上式两侧分别求期望得

k

=

1 k -1

+

2 k -2

+ … +

p k - p

, k 0 (2.34)

上式中对于 k 0,有E(x t - k u t ) = 0。因为当 k 0时,x t - k 发生在u t 之前,所以 x t - k 与 u t 不相关。

用 0分别除(2.34)式的两侧得

k

=

1 k -1

+

2

k -2

+ … +

p k -p

, k 0 (2.35)

令 (L ) = (1 - 1

L - 2

L 2 - … -

p

L p )其中L 为k 的滞后算子,则上式可表达为

(L )

k

= 0

因 (L ) 可因式分解为,

(L ) =

∏=p

i i L G 1

)

-(1,

则(2.35)式的通解(证明见附录)是

k

= A 1 G 1k

+ A 2 G 2k + … + A p G p k

. (2.36)

其中A i , i = 1, … p 为待定常数。这里 G i -1

, i = 1, 2, …, p 是特征方程 (L ) = (1 -

1

L -

2

L 2 - … -

p

L p ) = 0

的根。为保证随机过程的平稳性,要求 | G i | 1, i = 1, 2, …, p 。这会遇到如下两种情形。

① 当G i 为实数时,(2.36) 式中的A i G i k

将随着k 的增加而几何衰减至零,称为指数衰减(过阻尼情形)。

② 当G i 和G j 表示一对共轭复根时,设G i = a + bi , G j = a – bi , 2

2b a += R ,则G i , G j 的极

座标形式是G i = R (Cos + i Sin ),G j = R (Cos - i Sin )。若AR(p ) 过程平稳,则 G i <

1,所以必有R <1。那么随着k 的增加,G i k = R k (Cosk + i Sink ),G j k = R k

(Cosk - i Sink ),

自相关函数(2.36)式中的相应项G i k , G j k

将按正弦振荡形式衰减(欠阻尼情形)。实际中的平稳自回归过程的自相关函数常是由指数衰减和正弦衰减两部分混合而成。

③ 从(2.36)式可以看出,当特征方程的根取值远离单位圆时,k 不必很大,自相关函数就会衰减至零。

④ 有一个实数根接近1时,自相关函数将衰减的很慢,近似于线性衰减。当有两个以上的根取值接近1时,自相关函数同样会衰减的很慢。

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

a. 两个特征根为实根

b. 两个特征根为共轭复根

图2.6 AR(2) 过程的自相关函数

3. 移动平均过程的自相关函数 (1) MA(1) 过程的自相关函数。 对于MA(1)过程x t = u t + 1 u t -1 有

k = E(x t x t - k ) = E [(u t + 1 u t -1) (u t - k + 1 u t -k -1)] 当k = 0时,

0 = E(x t x t ) = E [(u t + 1 u t -1) (u t + 1 u t -1)]

= E (u t 2

+ 1 u t u t -1 + 1 u t u t -1 + 12

u t -12

) = (1 + 12

) 2

当k = 1时

1 = E(x t x t - 1) = E [(u t + 1 u t -1) (u t – 1 + 1 u t –

2 )] = E (u t u t -1 + 1 u t -12

+ 1 u t u t -2 + 12

u t -1 u t -2) = 1

E (u t -1) 2

=

1

2

当 k 1 时,

k = E [(u t + 1 u t -1) (u t – k + 1 u t – k -1)] = 0 综合以上三种情形,MA(1)过程自相关函数为

k = 0γγk

= 2

111θθ+ , k = 1

0 , k 1,

见图2.7。

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

1

1

图2.7 MA(1)过程的自相关函数

可见MA(1) 过程的自相关函数具有截尾特征。当k 1时,k

= 0。

(2) MA(q ) 过程的自相关函数 MA(q ) 过程的自相关函数是

k =

2

22212211...1...q q

k q k k k θθθθθθθθθθ++++++++-++, k = 1, 2, …, q ,

0 k q , 当k q 时,k = 0,说明 k , k = 0, 1, … 具有截尾特征。

(注意:模型移动平均项的符号以及这里 k

的符号正好与Box-Jenkins 书中的符号相反,这样表示

的好处是保持与计算机输出结果一致。)

4. ARMA (1, 1) 过程的自相关函数

ARMA (1, 1) 过程的自相关函数k 从 1开始指数衰减。1的大小取决于 1和 1, 1的符号取决于 ( 1 - 1 )。若 1 > 0,指数衰减是平滑的,或正或负。若 1 < 0,相关函数为正负交替式指数衰减。

对于ARMA (p , q ) 过程,p , q 2时,自相关函数是指数衰减或正弦衰减的。 5. 相关图(correlogram )

对于一个有限时间序列(x 1, x 2, …, x T )用样本平均数

x = T

1

∑=T

t t

x

1

估计总体均值 ,用样本方差

s 2

=

2

1

)(1∑=-T

t t

x x

T

估计总体方差x 2

当用样本矩估计随机过程的自相关函数,则称其为相关图或估计的自相关函数,记为

r k = 0

C C k , k = 0, 1 , 2, …, K , ( K < T ) . (2.41)

r k 是对

k

的估计。其中

C k =T

1

∑-=---k

T t k t t

x x x x

1),

)(( k = 0, 1, 2, …, K , (2.42)

是对

k

的估计

C 0 =

2

1

)(1∑=-T

t t

x x

T

(2.43)

是对0的估计,T是时间序列数据的样本容量。实际中T不应太小,最好能大于60。

注意:(2.42)式分母为T,不是T-k。C k为有偏估计量。但在小样本条件下更有效。

注:2个标准差 = 2 T -1/2 = 2(1/7)= 0.286。图中虚线表示到中心线2个标准差宽度。

相关图是对自相关函数的估计。由于MA过程和ARMA过程中的MA分量的自相关函数具有截尾特性,所以通过相关图可以估计MA过程的阶数q。相关图是识别MA过程阶数和ARMA过程中MA分量阶数的一个重要方法。实际应用中相关图一般取k = 15就足够了。

r k的方差近似为T-1。所以在观察相关图时,若r k的绝对值超过2T-1/2(2个标准差),就被认为是显著地不为零。当T充分大时,近似有

(r k -0) / T-1/2 = r k T1/2~ N (0, 1)

2.4偏自相关函数

偏自相关函数是描述随机过程结构特征的另一种方法。用kj 表示k阶自回归式中第j个回归系数,则k阶自回归模型表示为

x t= k 1 x t-1 + k 2 x t-2+ … + kk x t-k + u t

其中kk 是最后一个回归系数。若把k= 1, 2…的一系列回归式kk看作是滞后期k的函数,则称kk, k= 1, 2 … (2.45)

为偏自相关函数。它由下式中的红项组成。

x t= 11 x t-1 + u t

x t= 21 x t-1 + 22 x t-2 + u t

。。。

x t= k 1 x t-1 + k 2 x t-2+ … + kk x t-k + u t

因偏自相关函数中每一个回归系数kk 恰好表示x t 与x t-k在排除了其中间变量x t-1, x t-2, …, x t-k +1影响之后的相关系数,

x t- k 1 x t-1 - k 2 x t-2 - … - kk-1x t-k +1 = kk x t-k + u t

所以偏自相关函数由此得名。

对于AR(1)过程,x t= 11 x t-1 + u t,当k = 1时,11 0,当k > 1时,kk = 0,所以AR(1)过程的偏自相关函数特征是在k = 1出现峰值(11 = 1)然后截尾。

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

11

> 0

11

< 0

AR(1) 过程的偏相关图

对于AR(2)过程,当k 2时,kk 0,当k >2时,kk = 0。偏自相关函数在滞后期2以后有截尾特性。

对于AR(p )过程,当k p 时,kk 0,当k > p 时,kk = 0。偏自相关函数在滞后期p 以后有截尾特性,因此可用此特征识别AR(p )过程的阶数。

MA(1) 过程的偏自相关函数呈指数衰减特征。若 1 > 0, 偏自相关函数呈交替改变符号式指数衰减;若 1 0,偏自相关函数呈负数的指数衰减。

因为任何一个可逆的MA(q ) 过程都可以转换成一个无限阶的系数按几何递减的AR 过程,所以MA(q ) 过程的偏自相关函数呈缓慢衰减特征。

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

-0.8

-0.6-0.4-0.20.00.20.40.60.8

1

> 0

1

< 0

MA(1) 过程的偏自相关函数

例5:对于x t = u t + 1 u t -1过程,有 [1/ (1+ 1 L )] x t = u t , 当 1 > 0,

(1- 1 L + 12 L 2

- … ) x t = u t ,

x t = 1 x t -1 - 12 x t -2 + 13

x t -3 - … + u t ,

对于x t = u t - 1 u t -1过程,有 [1/ (1- 1 L )] x t = u t ,当 1 > 0,

(1+ 1 L + 12 L 2

+ … ) x t = u t ,

x t = - 1 x t -1 - 12 x t -2 - 13 x t -3 - … + u t , 对于MA(2) 过程,若 (L ) = 0的根是实数,偏自相关函数由两个指数衰减形式叠加而成。若 (L ) = 0的根是虚数,偏自相关函数呈正弦衰减形式。

ARMA( p , q ) 过程的偏自相关函数也是无限延长的,其表现形式与MA(q )过程的偏自相关函数相类似。根据模型中移动平均部分的阶数q 以及参数i 的不同,偏自相关函数呈指数衰减和(或)正弦衰减混合形式。

对于时间序列数据,偏自相关函数通常是未知的。可用样本计算 11, 22, … 的估计量 11?

φ, 22?φ, …。估计的偏自相关函数

kk φ?

, k = 1, 2, …, K , (2.48) 称为偏相关图。因为AR 过程和ARMA 过程中AR 分量的偏自相关函数具有截尾特性,所以可利用偏相关图估计自回归过程的阶数p 。实际中对于偏相关图取k = 15就足可以了。

kk φ?的方差近似为T -1。当T 充分大时,近似有

(kk φ?

-0) / T

-1/2

= T 1/2kk φ?

~ N (0, 1)

所以在观察偏相关图时,若kk φ?

的绝对值超过2 T

-1/2

(2个标准差),就被认为是显著地不为零。

2.5时间序列模型的建立与预测

ARIMA过程y t用

(L)Δd y t = 0 +(L) u t (2.51)

表示,其中 (L)和 (L)分别是p, q阶的以L 为变数的多项式,它们的根都在单位圆之外。0为位移项,Δd y t表示对y t 进行d次差分之后可以表达为一个平稳的可逆的ARMA过程。这是随机过程的一般表达式。它既包括了AR,MA 和ARMA过程,也包括了单整的AR,MA和ARMA过程。

建立时间序列模型通常包括三个步骤。(1)模型的识别,(2)模型参数的估计,(3)诊断与检验。

模型的识别就是通过对相关图的分析,初步确定适合于给定样本的ARIMA模型形式,即确定d, p, q 的取值。

模型参数的估计就是待初步确定模型形式后对模型参数进行估计。

诊断与检验就是以样本为基础检验拟合的模型,以求发现某些不妥之处。如果模型的某些参数估计值不能通过显著性检验,或者残差序列不能近似为一个白噪声过程,应返回第一步再次对模型进行识别。如果上述两个问题都不存在,就可接受所建立的模型。建摸过程用图2.8表示。下面对建摸过程做详细论述。

1.模型的识别

模型的识别主要依赖于对相关图与偏相关图的分析。在对经济时间序列进行分析之前,首先应对样本数据取对数,目的是消除数据中可能存在的异方差,然后分析其相关图。

识别的第1步是判断随机过程是否平稳。由2.2节知,如果一个随机过程是平稳的,其特征方程的根都应在单位圆之外。由2.7节知,如果 (L) = 0的根接近单位圆,自相关函数将衰减的很慢。所以在分析相关图时,如果发现其衰减很慢,即可认为该时间序列是非平稳的。这时应对该时间序列进行差分,同时分析差分序列的相关图以判断差分序列的平稳性,直至得到一个平稳的序列。对于经济时间序列,差分次数,即模型(2.51)中的参数d通常只取0,1或2。

一.识别

用相关图和偏相关图识别模型

形式(确定参数d,p, q)

二.估计

对初步选取的模型进行参数估计

三.诊断与检验

包括参数的显著性检验和

残差的随机性检验

不可取

模型可取吗

可取

图2.8 建立时间序列模型程序图

实际中也要防止过度差分。一般来说平稳序列差分得到的仍然是平稳序列,但当差分次数过多时存在两个缺点,(1)序列的样本容量减小;(2)方差变大;所以建模过程中要防止差分过度。对于一个序列,差分后若数据的极差变大,说明差分过度。

-0.8

-0.6-0.4-0.2

0.0

0.20.40.60.82

4

6

8

10

12

14

-0.8

-0.6-0.4-0.20.0

0.20.40.60.82

4

6

8

10

12

14

第2步是在平稳时间序列基础上识别ARMA 模型阶数p , q 。表2.3给出了不同ARMA 模型的自相关函数和偏自相关函数。当然一个过程的自相关函数和偏自相关函数通常是未知的。用样本得到的只是估计的自相关函数和偏自相关函数,即相关图和偏相关图。建立ARMA 模型,时间序列的相关图与偏相关图可为识别模型参数p , q 提供信息。相关图和偏相关图(估计的自相关系数和偏自相关系数)通常比真实的自相关系数和偏自相关系数的方差要大,并表现为更高的自相关。实际中相关图,偏相关图的特征不会像自相关函数与偏自相关函数那样“规范”,所以应该善于从相关图,偏相关图中识别出模型的真实参数p , q 。另外,估计的模型形式不是唯一的,所以在模型识别阶段应多选择几种模型形式,以供进一步选择。

表2.3 ARIMA 过程与其自相关函数偏自相关函数特征

ARIMA(1,1,1)

x t = 1 x t -1 + u t +

1u AR (1)

x t = 1 x t -1 + u t

若1 > 0,平滑地指数衰减

1

< 0,正负交替地指数衰减

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

若11

> 0,k =1时有正峰值然后截尾

11

< 0,k =1时有负峰值然后截尾

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

MA (1)

x t = u t +

1 u t -1

1

> 0,k =1时有正峰值然后截尾 -0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

1 < 0,k =1时有负峰值然后截尾 -0.8

-0.6-0.4-0.20.00.20.40.60.82468101214

1

> 0,交替式指数衰减

-0.8

-0.6

-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

1

< 0,负的平滑式指数衰减

-0.8

-0.6-0.4-0.20.00.20.40.60.82468101214

AR (2)

x t = 1 x t -1 +

2 x t -2

+ u t

k =1, 2时有两个峰值然后截尾

-0.8

-0.6-0.4-0.20.00.20.40.60.82468101214

( 1 > 0, 2 > 0)

-0.8

-0.6-0.4-0.20.00.20.42

4

6

8

10

12

14

( 1 > 0, 2

< 0)

MA (2) x t = u t +

1 u t -1

+

2

u t -2

k =1, 2有两个峰值然后截尾

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

1

> 0,

2

< 0)

-0.8

-0.6-0.4-0.20.00.20.40.60.82468101214

( 1 > 0, 2 > 0)

指数或正弦衰减

-0.8

-0.6-0.4-0.20.00.20.40.60.82468101214

1

> 0,

2

< 0)

-0.8

-0.6-0.4-0.20.00.20.40.60.82468101214

( 1 > 0, 2 > 0)

ARMA (1,1)

x t = 1 x t -1 + u t +

1 u t -1

k =1有峰值然后按指数衰减

-0.50.00.5

1.0

2468101214

1

> 0,

1

> 0)

-0.8

-0.6-0.4-0.20.00.20.40.60.82468101214

( 1 > 0, 1 < 0)

k =1有峰值然后按指数衰减

-0.5

0.0

0.5

1.024********

1

> 0,

1

> 0)

-0.8

-0.6-0.4-0.20.00.20.40.60.82468101214

( 1 > 0, 1 < 0)

ARMA (2,1)

x t = 1 x t -1+ 2 x t -2+ u t +

1

u t -

k =1有峰值然后按指数或正弦衰减

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

( 1 > 0, 2 < 0, 1 > 0)

k =1, 2有两个峰值然后按指数衰减

-0.8

-0.6-0.4-0.20.00.20.40.60.82468101214

( 1 > 0, 2 < 0, 1 > 0) ARMA (1,2) x t = 1 x t -1+ u t +

1 u t -1

+

2

u t -

k =1, 2有两个峰值然后按指数衰减

-0.8

-0.6-0.4-0.20.00.20.40.60.82

4

6

8

10

12

14

( 1 > 0, 1 > 0, 2 < 0)

k =1有峰值然后按指数或正弦衰减

-0.8

-0.6-0.4-0.20.00.20.40.60.82468101214

( 1 > 0, 1 > 0, 2 < 0)

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

2468101214

( 1 > 0, 1 > 0, 2 >0)

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

2468101214

( 1 > 0, 1 > 0, 2 > 0)

ARMA(2,2)

x t=1x t-1+2x t-2+ u

+1u t-1+2u t-2

k=1, 2有两个峰值然后按指数或正

弦衰减

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

2468101214

( 1 > 0, 2 < 0, 1 > 0, 2 < 0)

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

2468101214

( 1 > 0, 2 < 0, 1 > 0, 2 > 0)

k=1, 2有两个峰值然后按指数或正

弦衰减

-0.8

-0.6

-0.4

-0.2

0.0

0.2

0.4

0.6

0.8

2468101214

( 1 > 0, 2 < 0, 1 > 0, 2 < 0)

-0.8

-0.4

0.0

0.4

0.8

2468101214

( 1 > 0, 2 < 0, 1 > 0, 2 > 0)下面通过一些相关图和偏相关图识别模型结构。

2. 模型参数的估计

对于时间序列模型,一般采用极大似然法估计参数。对于一组相互独立的随机变量x t ,(t = 1, 2, …, T ),当得到一个样本 (x 1, x 2, …, x T ) 时,似然函数可表示为

L ( | x 1, x 2, …, x T ) = f (x 1| ) f (x 2| ) … f (x T | ) =

∏=T

t t

x

f 1

(| )

(2.52) 其中 =(

1,

2, …,

k

)是一组未知参数。对数似然函数是

log L =

∑=T

t

log 1

f (x t | )

通过选择 使上式达到最大,从而求得极大似然估计值 γ?

。具体步骤是用上述对数似然函数对每个未

知参数求偏导数并令其为零,即

1

log γ??L = 0

k

L γ??log = 0, (k 个方程联立)

一般来说似然函数是非线性的,必须采用迭代计算的方法求参数的极大似然估计值。极大似然估计量 (MLE) 具有一致性和渐近有效性。

首先讨论怎样对如下线性回归模型

y t = 0 + 1 x t 1 + 2 x t 2 + … + k -1 x t k -1 + u t , t = 1, 2, …, T , (2.53)

进行极大似然估计。假定u t N(0, 2

), 则y t 也服从正态分布。 y t N(E(y t ), 2

),

其中E(y t ) = 0 + 1 x t 1

+ 2 x t 2

+ … +

k -1 x t k -1

。若y t 是相互独立的,则对于样本 ( y 1, y 2, …,

y T ),似然函数是 L (,

2

| y 1, ,y 2, …, y T ) = f ( y 1) f ( y 2) … f ( y T )

其中 表示未知参数 0

,

1

, …,

k -1

的集合。由(2.53)式每个y t 的概率密度函数为

f ( y t ) = 2

/12)2(1

πσexp[

2

2

2))(E (σt t y y --

].

对于样本 ( y 1, y 2, …, y T ),对数似然函数为

logL = ∑

=T

t

log 1f ( y t ) = -2T log 2

-2T

log

2

-

∑=T

t t

y 1

2

[21

σ- E( y t ) ]2

(2.54)

上式右侧前两项是常量。第三项的符号为负,所以对logL 极大化等同于选择β~值从而使平方和∑=T

t t

y 1[- E( y t

)]2 极小化,即选择β~

使

∑=T

t t

y 1

(-

0~

β -1

~βx t 1 -2~βx t 2 - (1)

-k βx t k -1) 2

= ∑=T

t t u

12~

极小化。上式中t u ~表示残差。这种估计方法恰好与OLS 法相同,所以在这个例子中 的MLE 估计量

β~与OLS 估计量β?完全相同,即β~=β?。与OLS 法不同的是极大似然估计法在估计β~的同时,还得到u t

差的估计量。对(2.54)式求

2

的偏导数并令其为零。

2

σ

??L

log = -2

2σT

+4

21

σ

∑=T

t t

y 1

[- E( y t ) ]2

= 0 (2.55)

用β~

代替上式中E(y t ) 中的 得

2~σ = T -1

∑=T

t t u

1

2~

现在讨论怎样对时间序列模型的参数进行极大似然估计。

对于非平稳过程y t ,假定经过d 次差分之后可以表达为一个平稳、可逆的自回归移动平均过程x t ,

(L ) d

y t = (L ) x t = (L ) u t . (2.56) 对于y t 假定可以观测到T + d 个观测值,即y - d +1, …, y 0, y 1, …, y T ,则经过d 次差分之后, x t 的样本容量为T 。 以 {x 1, …, x T }为样本估计ARMA (p , q ) 模型参数 (1, …, p , 1, …, q )。 对随机过程{x t }的参数估计就如对回归模型的参数估计一样,目的是使x t 与其拟合值t x ?

的残差平方和

∑-t t t

x

x

2)?(= ∑t t

u 2

?

最小。把 (2.56) 式改写为

u t = t

x L L )

()(ΘΦ . (2.57)

若用i φ?,i θ?和t u ?

分别表示对

i

, i 和u t 的估计,则使下式最小。 ∑t

t

u 2

?

= S (1?φ, …, p

φ?, 1

?θ, …, q

θ?) (2.58)

假定u t N (0, u 2

), t = 1, … T ,且不存在自相关,则条件对数似然函数为

log L = -T log

u

-

2

2

2?

u t

t

u σ∑ (2.59)

之所以称之为条件对数似然函数是因为∑

2

?t u

依赖于过去的不可知观测值x 0, x -1, …, x - p +1和u 0, u -1, …,

u - q +1。比如

u 1 = x 1 -

1 x 0

-

2 x -1

- … -

p

x -p +1 -

1u 0

- …-

q u - q +1

(2.60)

对(2.59)式求极大即等同于对∑2

?t u

求极小。对∑

2

?t u

求极小时需要先确定x 0, x –1, …, x -p +1和u 0, u -1, …,

u - q +1的值。此问题的一般处理方法是取这些变量等于他们的无条件期望值。u 0, u -1, …, u - q +1的无条件

期望值为零。若模型(2.56)中不含有漂移项,则x 0, x -1, …, x - p +1的无条件期望值也为零。当样本容量T 与滞后长度p , q 值相比充分大,且1, …, p 的值不接近1时,这种近似非常理想。

若 (2.56) 式中不含有移动平均项,对于自回归参数来说 (2.57) 式是一个线性函数。可以用OLS 法估计参数。如果 (2.56) 式中含有移动平均项,那么对于移动平均参数来说, (2.57) 式是一个非线性函数。对 (2.57) 式必须采用非线性估计方法。

首先假定模型为纯自回归形式,

(L ) x t = u t (2.61) 或

x t = 1 x t-1 + … + p x t -p + u t . (2.62) 这是一个线性回归模型,极大似然估计与OLS 估计结果近似相同。

当模型中含有移动平均成分时

u t = -1

(L ) (L ) x t (2.63) 对于参数来说,模型是非线性的。对于非线性模型,通常由三种估计方法。

⑴直接搜索法。通过改变参数的取值,反复计算残差平方和∑

2?t u

的值。然后从中选择最小的那个

值所对应的参数值作为对参数的估计值。这种方法只有在参数个数较少时才是可行的。当参数个数较多时,计算量将非常大。例如当含有四个被估参数,每个参数需选择20个计算值时,则需要计算 (20) 4

= 160000次。

⑵直接优化法。求误差平方和函数对每一个参数的偏导数并令其为零,从而求得正规方程

i t

t

u γ??∑)

?

(

2

= 0, i =1, …, p + q (2.64)

其中(1, …, p +q )=(1, …, p , 1, …, q )。因为 p + q 个方程中都含有 p + q 个参数,所以必须联立求解。由于计算上的困难,这种方法很少直接采用。

⑶线性迭代法。对任何非线性函数通常都可以按泰勒级数展开。

f (x ) = f (x 0) + f ‘(x 0) (x – x 0) + … = f (x 0) - f ‘(x 0) x 0 + f ‘(x 0) x + …

首先为参数选一组初始值(1, 0 , …, p +q , 0)(下标零表示初始值。怎样确定初始值并不重要。), 然后将x t = f (x t-1, …, x t -p ) 按泰勒级数在(1, 0 , …, p +q , 0)点展开。

x t = f (x t-1, …, x t -p ,

1, 0

, …,

p +q , 0 ) +

)(0,01i i q

p i i f γγγ-????

?

???∑+= +

)

)((2

1

0,0,0

1

12j j i i q p i q

p j j i f γγγγγγ--????

?

???∑∑

+=+= + … (2.65)

其中偏导数的下标写为零表示偏导数在 1 = 1, 0 , …, p +q

=

p +q , 0

时的值。取上式右侧的前两项对

原非线性函数x t 进行近似。去掉右侧第三项及以后各项得

x t - f (x t-1, …, x t -p , 1, 0 , …, p +q , 0 ) +

010,∑

+=???? ????q

p i i i f γγ= 01∑

+=?

??? ????q

p i i

i f γγ+ u t

. (2.66)

上式为线性回归方程形式。左侧为已知量,右侧含有一组未知量i , i = 1, …, p + q 。利用OLS 法对上式进行估计。设所得估计值用(1, 1 , …, p +q , 1)表示。以此作为第二组估计值,对非线性函数再一次线性化,从而得到一个新的线性方程。

x t - f (x t-1, …, x t -p ,

1, 1

, …,

p +q , 1 ) +

11

1,∑

+=???? ????q

p i i i f γγ= 11∑

+=?

??? ????q

p i i

i f γγ+ u t

(2.67) 对上式再次应用OLS 法估计参数,并把 (

1, 2

, …,

p +q , 2

) 作为待估参数的第三组估计值。重复上述

过程,直至满足如下要求为止。

ij

ij

j i γγγ-+1, < , i = 1, …, p + q , (2.68)

其中i 表示参数序号,j 表示迭代次数。 是预先给定的精度标准。

如果最后一次的参数估计值用 (1, k , …, p +q , k ) 表示,并且 (1, k , …,

p +q , k

) 接近真值

( 1 , …, p +q ) ,则必有,

k

q

p i i k i f ∑

+=????

????1,γγ

k q

p i i

i f ∑

+=????

????1

γγ

所以有

x t = f (x t-1, …, x t -p , 1, k

, …,

p +q , k

) + t u ?

(

1, k

, …,

p +q , k

) 是对 (

1

, …, p +q

) 的最终估计。这种迭代计算一般都是通过计算机完成。

评价线性模型的一些统计量例F , t 等都不能直接用于评价非线性模型。原因是尽管u t 是正态分布的且均值为零,但残差

t u ? = x t - t x ?

= x t - f (x t-1, …, x t -p ,

1, k

, …,

p +q , k

) (2.69)

不服从正态分布,则 ∑

2

?t

u

不服从

2

分布,参数估计量不服从正态分布。所以不能使用

F 和t 检验。然而对迭代中的最后一步可以进行F , t 检验。 如果估计量i γ?

= i , k

, (i = 1, …, p +

q ),接近真值

i

,那么F , t 检验将会对非线性模型有很满意的解释作用。

3. 诊断与检验

完成模型的识别与参数估计后,应对估计结果进行诊断与检验,以求发现所选用的模型是否合适。若不合适,应该知道下一步作何种修改。

这一阶段主要检验拟合的模型是否合理。一是检验模型参数的估计值是否具有显著性;二是检验模型的残差序列是否为白噪声。参数估计值的显著性检验是通过t 检验完成的,而模型的残差序列是否为白噪声的检验是用Box-Pierce (1970) 提出的Q 统计量完成的。Q 检验的零假设是

H :1 = 2 = … = K = 0

即模型的误差项是一个白噪声过程。Q 统计量定义为

Q = T ∑=K

k k

r

1

2

(2.70)

近似服从 2

( K - p - q ) 分布,其中T 表示样本容量,r k 表示用残差序列计算的自相关系数值,K 表示自相关系数的个数,p 表示模型自回归部分的最大滞后值,q 表示移动平均部分的最大滞后值。

Ljung 和Box 认为(2.70)式定义的Q 统计量的分布与2

( K - p - q )分布存在差异(相应值偏小),于是提出修正的Q 统计量。

Q = T (T +2)

=-K

k k k

T r 12

(2.71)

其中r k ,K ,p ,q 的定义如(2.70)式。修正的Q 统计量(2.71) 近似服从 2

( K - p - q ) 分布。且它的近似性比原Q 统计量的近似性更好。(EViews 中给出的Q 统计量就是按(2.71)式定义的。)

用残差序列计算Q 统计量的值。显然若残差序列不是白噪声,残差序列中必含有其他成份,自相关系数不等于零。则Q 值将很大,反之Q 值将很小。判别规则是:

若Q < 2

( K - p - q ) ,则接受H 0。 若Q >

2

( K - p - q )

,则拒绝H 0。

其中 表示检验水平。

4. 时间序列模型预测

下面以ARMA (1, 1) 模型为例具体介绍预测方法。其他形式时间序列模型的预测方法与此类似。 设对时间序列样本{x t }, t = 1, 2, …, T ,所拟合的模型是 x t =

1 x t -1

+ u t +

1 u t -1

(2.72)

则理论上T + 1期x t 的值应按下式计算

x T +1 =

1 x T

+ u T +1 +

1 u T

(2.73)

用估计的参数1?φ, 1?θ和T u ?

分别代替上式中的

1

,

1

和u T 。 上式中的u T +1是未知的,但知E(u T +1) = 0,

所以取u T +1 = 0。x T 是已知的(样本值)。对x T +1的预测按下式进行

1?

+T x = 1?φx T +1?θT u ? (2.74)

由(2.73)式,理论上x T +2的预测式是

x T +2 =

1 x T +1

+ u T +2 +

1 u T +1

仍取u T +1 = 0,u T +2 = 0,则x T +2的实际预测式是

2?

+T x = 1?φ1?+T x (2.75)

其中1?

+T x 是上一步得到的预测值,与此类推x T +3的预测式是

3?

+T x = 1?φ2?+T x (2.76)

由上可见,随着预测期的加长,预测式 (2.73) 中移动平均项逐步淡出预测模型,预测式变成了纯自回归形式。

若上面所用的x t 是一个差分变量,设 y t = x t ,则得到的预测值相当于t y ?, (t = T +1, T +2 , … )。

因为

y t = y t-1 + y t

所以原序列 T +1期预测值应按下式计算

1?+T y = y T + 1?

+T y (2.77)

对于t > T +1,预测式是

t y ?=1?

-t y +

t y ?

, t = T +2, T +3, … (2.78)

其中1?

-t y 是相应上一步的预测结果。

用EViews 计算相关图和偏相关图。

附录:对(2.36)式(自相关函数通解表达式)的证明

对于AR(p ) 过程 x t =

1 x t -1

+

2

x t -2 +…+

p x t - p

+ u t (1)

它的自相关函数满足下式,

k

=

1 k -1

+

2

k -2

+ … +

p k –p

, k 0 (2)

(见《计量经济分析》第77页)即有

(1 -

1

L -

2

L 2 - … -

p

L p )

k

= 0 (3)

则(2)式的自相关函数有如下形式通解,

k

= A 1 G 1k + A 2 G 2k + … + A p G p k

. (4)

其中A i , i = 1, … p 为待定系数。G i -1

, i = 1, 2, …, p 是(3)式特征方程

(1 -

1

L -

2

L 2 - … -

p

L p ) = 0

的根。

证明(1):首先以AR(2) 过程为例

x t =

1 x t -1

+

2

x t -2 + u t (5)

由上式可知

k

=

1 k -1

+

2

k -2

, k 0 (6)

即有

(1 - G 1 L ) (1 – G 2 L ) k

= 0 (7)

其中,G i -1

, i = 1, 2是方程(1 -

1

L - 2

L 2 ) = 0 的根。令

(1 – G 2 L )

k

= y k (8)

由(7)式,可得

(1 - G 1 L ) y k = 0 (9) 将上式展开并进行迭代,可得

y k = G 1 y k -1 = G 1 (G 1 y k -2) = G 12 y k -2 = … = G 1k y 0

其中y 0是由初始值确定的常数。由(8)式可得

k

= G 2

k -1

+ y k = G 2

k -1

+ y 0 G 1k

(10)

对上式进行迭代,

k

= G 2 (G 2

k -2

+ y 0 G 1k -1) + y 0 G 1k

= G 22

k -2

+ y 0 G 2 G 1k -1

+ y 0 G 1k

…. = G 2k

+ y 0 (G 1k + G 2 G 1k -1 + … + G 2

k -1

G 1

) (11)

当(3)式有相同的根(G 1 = G 2)时,

k

= G 1k + y 0 k G 1k = G 1k

(1+ y 0 k )

当(3)式的根不相等(G 1≠G 2)时,因为

G 1k - G 2k = (G 1 - G 2) (G 1 k -1 + G 1 k -2 G 21 +…+ G 11 G 2 k -2 + G 2 k -1),

所以(11)式

k

= G 2k

+ y 0 G 1 (G 1k -1 + G 2 G 1k -2 + … + G 2

k -1

)

= G 2k

0 + y 0 G 1

212

1G G G G k

k -- = G 2k

+

1

20

/1G G y -(G 1k –G 2 k

)

= G 2k

+

1

20

/1G G y -G 1k –

1

20

/1G G y -G 2 k =

1

20

/1G G y -G 1k – (1–

1

20

/1G G y -) G 2 k

= A 1G 1k

– A 2 G 2 k

(12) 其中

A 1 =

1

20

/1G G y -,

A 2 = 1-

1

20

/1G G y -

同理可以证明(2)式的通解是(4)式。(A i 是一个权数,所以它应该与系数以及系数方程的特征根有关系的。)

证明(2):下面用归纳法证明。假定对于AR(p -1) 过程,

x t =

1 x t -1

+

2

x t -2 +…+

p -1 x t – p +1

+ u t (13)

则它的自相关函数有如下形式通解

k

= A 1,p-1 G 1k + A 2,p-1 G 2k + … + A p -1,p-1 G p -1k

. (14)

其中,G i -1

, i = 1, 2, …, p -1 是方程(1 - 1

L -

2

L 2 - … -

p -1

L p -1 ) = 0 的根;A i,p -1, i = 1, …

p -1 为待定系数。

对于AR(p ) 过程, x t =

1 x t -1

+

2

x t -2 +…+

p x t - p

+ u t (15)

则它的自相关函数满足下面方程

k

=

1 k -1

+

2

k -2

+ … +

p k –p

, k 0 (16)

即有

(1 - G 1 L ) (1 – G 2 L ) … (1 – G p L )k

= 0 (17)

其中,G i -1

, i = 1, 2是方程(1 -

1

L -

2

L 2 - … - p

L p ) = 0 的根。令

(1 – G p L )

k

= y k (18)

由(17)式,可得

(1 - G 1 L ) (1 – G 2 L ) … (1 – G p -1 L )y k = 0 (19) 即y k 满足AR(p -1) 过程的自相关函数方程,从而可得

y k = A 1 G 1k

+ A 2 G 2k

+ … + A p -1 G p -1k

. (20) 由(18)式可得

k

= G p

k -1

+ y k = G p

k -1

+

∑-=1

1

p i k i

i G

A (21)

对上式进行迭代,

k

= G p (G p

k -2

+

∑-=-1

1

1,p i k i

p i G

A

) +

∑-=1

1

,p i k i

p i G A

= G p 2

k -2

+

∑-=+

1

1

,)1(p i k

i i

p p

i G G G A

= ….

= G p k 0 +∑-

=

-

-

+

+

+

1

1

1

1

) 1(

p i

k

i

p

i

p

p

i

p

i

G

G

G

G

G

AΛ (22)

证毕

多元时间序列建模分析

应用时间序列分析实验报告

单位根检验输出结果如下:序列x的单位根检验结果:

1967 58.8 53.4 1968 57.6 50.9 1969 59.8 47.2 1970 56.8 56.1 1971 68.5 52.4 1972 82.9 64.0 1973 116.9 103.6 1974 139.4 152.8 1975 143.0 147.4 1976 134.8 129.3 1977 139.7 132.8 1978 167.6 187.4 1979 211.7 242.9 1980 271.2 298.8 1981 367.6 367.7 1982 413.8 357.5 1983 438.3 421.8 1984 580.5 620.5 1985 808.9 1257.8 1986 1082.1 1498.3 1987 1470.0 1614.2 1988 1766.7 2055.1 1989 1956.0 2199.9 1990 2985.8 2574.3 1991 3827.1 3398.7 1992 4676.3 4443.3 1993 5284.8 5986.2 1994 10421.8 9960.1 1995 12451.8 11048.1 1996 12576.4 11557.4 1997 15160.7 11806.5 1998 15223.6 11626.1 1999 16159.8 13736.5 2000 20634.4 18638.8 2001 22024.4 20159.2 2002 26947.9 24430.3 2003 36287.9 34195.6 2004 49103.3 46435.8 2005 62648.1 54273.7 2006 77594.6 63376.9 2007 93455.6 73284.6 2008 100394.9 79526.5 run; proc gplot; plot x*t=1 y*t=2/overlay; symbol1c=black i=join v=none; symbol2c=red i=join v=none w=2l=2; run; proc arima data=example6_4; identify var=x stationarity=(adf=1); identify var=y stationarity=(adf=1); run; proc arima; identify var=y crrosscorr=x; estimate methed=ml input=x plot; forecast lead=0id=t out=out; proc aima data=out; identify varresidual stationarity=(adf=2); run;

时间序列分析基于R——习题答案

第一章习题答案 略 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 2.2 (1)非平稳,时序图如下 (2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

2.3 (1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2)平稳序列 (3)白噪声序列 2.4 ,序列LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。显著性水平=0.05 不能视为纯随机序列。 2.5 (1)时序图与样本自相关图如下

(2) 非平稳 (3)非纯随机 2.6 (1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机 第三章习题答案 3.1 ()0t E x =,2 1 () 1.9610.7 t Var x ==-,220.70.49ρ==,220φ= 3.2 1715φ=,2115 φ= 3.3 ()0t E x =,10.15 () 1.98(10.15)(10.80.15)(10.80.15) t Var x += =--+++ 10.8 0.7010.15 ρ= =+,210.80.150.41ρρ=-=,3210.80.150.22ρρρ=-= 1110.70φρ==,2220.15φφ==-,330φ= 3.4 10c -<<, 1121,1,2 k k k c c k ρρρρ--?=? -??=+≥? 3.5 证明: 该序列的特征方程为:32 --c 0c λλλ+=,解该特征方程得三个特征根: 11λ=,2c λ=3c λ=-

时间序列分析资料报告——ARMA模型实验

基于ARMA模型的社会融资规模增长分析 ————ARMA模型实验

第一部分实验分析目的及方法 一般说来,若时间序列满足平稳随机过程的性质,则可用经典的ARMA模型进行建模和预则。但是, 由于金融时间序列随机波动较大,很少满足ARMA模型的适用条件,无法直接采用该模型进行处理。通过对数化及差分处理后,将原本非平稳的序列处理为近似平稳的序列,可以采用ARMA模型进行建模和分析。 第二部分实验数据 2.1数据来源 数据来源于中经网统计数据库。具体数据见附录表5.1 。 2.2所选数据变量 社会融资规模指一定时期(每月、每季或每年)实体经济从金融体系获得的全部资金总额,为一增量概念,即期末余额减去期初余额的差额,或当期发行或发生额扣除当期兑付或偿还额的差额。社会融资规模作为重要的宏观监测指标,由实体经济需求所决定,反映金融体系对实体经济的资金量支持。 本实验拟选取2005年11月到2014年9月我国以月为单位的社会融资规模的数据来构建ARMA模型,并利用该模型进行分析预测。 第三部分 ARMA模型构建 3.1判断序列的平稳性 首先绘制出M的折线图,结果如下图:

图3.1 社会融资规模M曲线图 从图中可以看出,社会融资规模M序列具有一定的趋势性,由此可以初步判断该序列是非平稳的。此外,m在每年同时期出现相同的变动趋势,表明m还存在季节特征。下面对m的平稳性和季节性·进行进一步检验。 为了减少m的变动趋势以及异方差性,先对m进行对数化处理,记为lm,其时序图如下: 图3.2 lm曲线图

对数化后的趋势性减弱,但仍存在一定的趋势性,下面观察lm的自相关图 表3.1 lm的自相关图 上表可以看出,该lm序列的PACF只在滞后一期、二期和三期是显著的,ACF随着滞后结束的增加慢慢衰减至0,由此可以看出该序列表现出一定的平稳性。进一步进行单位根检验,由于存在较弱的趋势性且均值不为零,选择存在趋势项的形式,并根据AIC自动选择之后结束,单位根检验结果如下: 表3.2 单位根输出结果 Null Hypothesis: LM has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic - based on SIC, maxlag=12) t-Statistic Prob.*

典型时间序列模型分析

实验1 典型时间序列模型分析 1、实验目的 熟悉三种典型的时间序列模型:AR 模型,MA 模型与ARMA 模型,学会运用Matlab 工具对对上述三种模型进行统计特性分析,通过对2 阶模型的仿真分析,探讨几种模型的适用范围,并且通过实验分析理论分析与实验结果之间的差异。 2、实验原理 AR 模型分析: 设有 AR(2)模型, X(n)=-0.3X(n-1)-0.5X(n-2)+W(n) 其中:W(n)是零均值正态白噪声,方差为4。 (1)用MA TLAB 模拟产生X(n)的500 观测点的样本函数,并绘出波形 (2)用产生的500 个观测点估计X(n)的均值和方差 (3)画出理论的功率谱 (4)估计X(n)的相关函数和功率谱 【分析】给定二阶的AR 过程,可以用递推公式得出最终的输出序列。或者按照一个白噪声 通过线性系统的方式得到,这个系统的传递函数为: 1 2 1 ()10.30.5H z z z --= ++ 这是一个全极点的滤波器,具有无限长的冲激响应。 对于功率谱,可以这样得到, ()() 2 2 12 12exp 11x w z jw P w a z a z σ--==++ 可以看出, () x P w 完全由两个极点位置决定。 对于 AR 模型的自相关函数,有下面的公式: 这称为 Yule-Walker 方程,当相关长度大于p 时,由递推式求出: 这样,就可以求出理论的 AR 模型的自相关序列。

1.产生样本函数,并画出波形 2.题目中的AR 过程相当于一个零均值正态白噪声通过线性系统后的输出,可以按照上面的方法进行描述。 clear all; b=[1]; a=[1 0.3 0.5]; % 由描述的差分方程,得到系统传递函数 h=impz(b,a,20); % 得到系统的单位冲激函数,在20 点处已经可以认为值是0 randn('state',0); w=normrnd(0,2,1,500); % 产生题设的白噪声随机序列,标准差为2 x=filter(b,a,w); % 通过线形系统,得到输出就是题目中要求的2 阶AR 过程 plot(x,'r'); ylabel('x(n)'); title('邹先雄——产生的AR 随机序列'); grid on; 得到的输出序列波形为: 2.估计均值和方差 可以首先计算出理论输出的均值和方差,得到 x m ,对于方差可以先求出理论自相 关输出,然后取零点的值。

平稳时间序列模型的建立

-0.8 -0.6-0.4-0.20.00.20.40.60.82 4 6 8 10 12 14 -0.8 -0.6-0.4-0.20.0 0.20.40.60.82 4 6 8 10 12 14 第四章 平稳时间序列模型的建立 本章讨论平稳时间序列的建模问题,也就是从观测到的有限样本数据出发,通过模型的识别、模型的定阶、参数估计和诊断校验等步骤,建立起适合的序列模型。学习重点为模型的识别和模型的检验。 第一节 模型识别 一、 识别依据 模型识别主要是依据SACF 和SPACF 的拖尾性与截尾性来完成。常见的一些ARMA 类型的SACF 和SPACF 的统计特征在下表中列出,可供建模时,进行对照选择。 表 ARIMA 过程与其自相关函数偏自相关函数特征 模 型 自相关函数特征 偏自相关函数特征 ARIMA(1,1,1) ? x t = ?1? x t -1 + u t + θ1u t -1 缓慢地线性衰减 AR (1) x t = ?1 x t -1 + u t 若?1 > 0,平滑地指数衰减 若?1 < 0,正负交替地指数衰减 -0.8 -0.6-0.4-0.20.00.20.40.60.82 4 6 8 10 12 14 若?11 > 0,k =1时有正峰值然后截尾 若?11 < 0,k =1时有负峰值然后截尾 -0.8 -0.6-0.4-0.20.00.20.40.60.82 4 6 8 10 12 14 MA (1) x t = u t + θ1 u t -1 若θ1 > 0,k =1时有正峰值然后截尾 若θ1 > 0,交替式指数衰减 -1.0 -0.5 0.0 0.5 1.02 4 6 8 10 12 14 -1.0 -0.5 0.0 0.5 1.0 2 4 6 8 10 12 14

时间序列分析基于R——习题答案

第一章习题答案 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 Au+ocorreliil. i ons Correlation -1 M 7 6 5 4 3 2 1 0 I ; 3 4 5 6 7 9 9 1 1.00000■Hi ■ K. B H,J B ik L L1■* J.1 jA1-.IM L L* rn^rp ■ i>i?iTwin H'iTiii M[lrp i,*nfr 'TirjlvTilT'1 iBrp O.7QOO0■ill. Ii ill ■ _.ill?L■ ill iL si ill .la11 ■ fall■ 1 ■ rpTirp Tp和阳申■丽轉■晒?|?卉(ft 0.41212■强:料榊<牌■ 0.14343'■讯榊* -.07078■ -.25758, WWHOHHf ■ -.375761 marks two 总t and&rd errors 2.2 (1) 非平稳,时序图如下 (2) - ( 3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

Ctorrelat ion LOOOOO n.A'7F1 0.72171 0.51252 Q,34982 0.24600 0.20309 0.?1021 0.26429 0.36433 0.49472 0.58456 0.60198 0.51841 Q ?菲晡 日 0.20671 0.0013& -,03243 -.02710 Q.01124 0,08275 0.17011 Autocorrel at ions raarka two standard errors 2.3 (1) 自相关系数为: 0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2 )平稳序列 (3) 白噪声序列 2.4 LB=4.83 , LB 统计量对应的分位点为 0.9634 , P 值为0.0363。显著性水平 :-=0.05,序列 不能视为纯随机序列。 2.5 (1) 时序图与样本自相关图如下 AuEocorreI ati ons 弗卅制iti 电卅栅冷卅樹 側樹 榊 惟 1 ■ liihCidi iliihQriHi il>LljU_nll Hnlidiili Hialli iT ,, T^,, T^s ?T* iTijTirr ,^T 1 IT * -i> ■> - ■ ■ *畑** ? ■ ■ 耶曲邯 ? ■ ■ ■ >|{和怦I {册卅KHi 笊出恸 mrpmrp 山!rpEHi erp . 卑*寧* a 1 *

时间序列分析及VAR模型

Lecture 6 6. Time series analysis: Multivariate models 6.1Learning outcomes ?Vector autoregression (VAR) ?Cointegration ?Vector error correction model (VECM) ?Application: pairs trading 6.2Vector autoregression (VAR)向量自回归 The classical linear regression model assumes strict exogeneity; hence, there is no serial correlation between error terms and any realisation of any independent variable (lead or lag). As we discovered, serial correlation (or autocorrelation) is very common in financial time series and panel data. Furthermore, we assumed a pre-defined relation of causality: explanatory variable affect the dependent variable? 传统的线性回归模型假设严格的外主性,误差项与可实现的独立变量之间没有序列相关性。金融时间序列及面板数据往往都有很强的自相关性,假定解释变量影响因变量。 We now relax bo什]assumptions using a VAR model. VAR models can be regarded as a generalisation of AR(p) processes by adding additional time series. Hence, we enter the field of multivariate time series analysis. VAR模型可以'"l作是在一般的自回归过程中加入时间序列。 Lefs look at a standard AR(p) process for hvo variables (y( and xj? (1)%= Ql + 琅]仇『一 +仏 (2)x t = a2 + - + £2t The next step is to allow that lagged values of xt can affect y( and vice versa. This means that we obtain a system of equations for two dependent variables(y(and xj?Both dependent variables are influenced by past realisations of y(and x t. By doing that, we violate strict exogeneity (see Lecture 2); however, we can use a more relaxed concept, namely weak exogeneity?As we use lagged values of bodi dependent variables, we can argue that these lagged values are known to us, as we observed them in the previous period? We call these variables predetermined? Predetermined (lagged) variables fulfil weak exogeneity in the sense that they have to be uncorrelated with the contemporaneoiis error term in t? We can still use OLS to estimate the following system of equations, which is called a VAR in reduced form. (3)+y 仇1化_丫+sr=i ^12 +£it (4)X t = a2+2X1021”—, + _i + f2t

实验十时间序列模型

实验十时间序列模型 10.1 实验目的 掌握时间序列的基本理论,时间序列模型种类的识别、估计、诊断和预测方法,以及相应的EViews软件操作方法。 10.2 实验原理 时间序列分析方法由Box-Jenkins (1976) 年提出。它适用于各种领域的时间序列分析。 时间序列模型不同于经济计量模型的两个特点是: (1)这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。 (2)明确考虑时间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过差分把它变换成平稳的时间序列,再考虑建模问题。 时间序列模型的应用: (1)研究时间序列本身的变化规律(建立何种结构模型,有无确定性趋势,有无单位根,有无季节性成分,估计参数)。 (2)在回归模型中的应用(预测回归模型中解释变量的值)。 (3)时间序列模型是非经典计量经济学的基础之一(不懂时间序列模型学不好非经典计量经济学)。 10.3 实验内容 建立中国人口时间序列模型。 表10.1给出了中国人口数据y t(1952-2004,单位万人),试建立y t的时间序列模型,并预测2005年中国人口总数。 表10.2

10.4 建模步骤 10.4.1 识别模型 利用表10.2数据建立y t序列图,如图10.20。 图10.20 中国人口序列(1952-2004) 从人口序列图可以看出我国人口总水平除在1960和1961两年出现回落外,其余年份基本上保持线性增长趋势。 察看序列的相关图,在序列窗口选择View/Correlogram,便会弹出如下窗口,见图10.21,选择滞后阶数(本例输入滞后期10),点击ok,得到如图10.22所示的序列y t的相关图和偏相关图。 图10.21 图10.22 y t的相关图,偏相关图 由y t的相关图,偏相关图判断y t为非平稳性序列。进一步考察其差分序列Dy t,序列图见图10.23,其相关图,偏相关图见图10.24。 图10.23 图10.24 Dy t的相关图,偏相关图 人口差分序列Dy t是平稳序列。应该用Dy t建立模型。因为Dy t均值非零,结合图2.14拟建立带有漂移项的AR(1)模型。 10.4.2 估计模型 采用AR(1)模型对Dy t进行估计,从EViews主菜单中点击Quick键,选择Estimate Equation功能。随即会弹出Equation specification对话框。输入漂移项非零的AR(1)模型估计命令(C表示漂移项)如下: D(Y) C AR(1) 结果如图10.25所示,整理如下: Dy t = 1374.097 + 0.6681 (Dy t-1– 1374.097) + v t

基于时间序列模型的中国GDP增长预测分析

第33卷 第178期2012年7月 财经理论与实践(双月刊) THE THEORY AND PRACTICE OF FINANCE AND ECONOMICS Vol.33 No.178 Jul. 2012 ·信息与统计· 基于时间序列模型的中国GDP增长预测分析 何新易 (南通大学商学院,江苏南通 226019)* 摘 要:作为度量一个国家或地区所有常住单位在一定时期之内所生产和所提供的最终产品或服务的重要总量指标,如果能够对GDP做出正确的预测,必然可以有效引导宏观经济健康发展,为高层管理部门提供决策依据。选用适合短期预测的ARIMA模型对中国1952~2010年的GDP进行计量建模分析,预测结果认为未来五年中国的经济增长仍将处于一个水平较高的上升通道。 关键词:时间序列模型;GDP;预测 中图分类号:F234 文献标识码: A 文章编号:1003-7217(2012)04-0096-04 一、引 言 作为度量一个国家或地区所有常住单位在一定时期之内所生产和所提供的最终产品或服务的重要总量指标,国内生产总值(Gross Domestic Product,GDP)对于判断经济态势运行、衡量经济综合实力、正确制定经济政策等诸多方面,以及在经济研究实际工作中,均起着不可替代的重要作用。 熊志斌(2011)深入分析了时间序列模型与神经网络(NN)模型的优势和劣势,按照两种模型的预测特性,在比较的基础之上,分别构建了ARIMA模型和NN模型,并根据一定算法对两种模型进行了集成。将GDP时间序列的数据结构,根据在非线性空间和线性空间的预测优势,进一步分解为线性非线性残差和自相关主体两部分,即首先用ARIMA分析技术构建线性主体模型,然后用NN模型估计非线性残差,再对序列的整个预测结果进行最终集成。仿真实证结果表明:与单一模型相比,集成模型的预测准确率显著提高,进行GDP预测当然使用集成模型更为有效[1]。桂文林和韩兆洲(2011)认为由于迄今为止,包括季度GDP在内的经季节调整之后的经济数据,中国政府尚未进行公布,不但无法进行国际之间的横向比较,也不利于监测中国宏观经济态势。本文运用1996年第1季度至2009年第4季度的中国实际GDP数据,构建了状态空间模型,使用卡尔曼滤波迭代算法对季节调整模型状态向量的 各分量,进行了最优平滑、预测和估计,并使用极大似然方法估计了超参数。经过对GDP的主要季节和趋势特征的分析,计算出了环比增长率指标来监测和分析经济走势,并与国际通用的TRAMO-SEATS季节调整模型进行了对比,以便鉴别趋势拐点,制定相关的经济政策[2]。高帆(2010)运用1952~2008年的上海GDP增长率数据,实证研究其内在变动机制,将GDP增长率分解为纯生产率效应、纯劳动投入效应、纯生产结构效应、纯劳动结构效应,并分析了这四种效应之间的交互影响。结果表明:在上海GDP增长率提高的四种效应之中,纯生产率效应起到了关键作用。上海GDP增长率自1978年改革开放之后,在整体上对纯生产率效应的依赖度趋于增强。在1978~1989年期间,纯劳动结构效应是GDP增长的主要因素,由于市场化改革的进一步加大,劳动力跨部门流转在很大程度上得以实现。在1990~2008年期间,纯生产率效应是GDP增长的主要因素,正是由于在此历史阶段,由于资本深化进一步加速,从而有效提高了部门劳动生产率。基于实证的研究结论,可以针对性地制定出今后上海市经济实现持续增长的若干宏观政策[3]。腾格尔和何跃(2010)利用中国季度GDP数据分别构建了ARIMA和ARCH模型,同时利用GMDH自组织方法尝试建模,经过Bon-ferroni-Dunn检验,表明与单一模型相比,组合模型的拟合能力更强。研究表明,基于GMDH组合的GDP模 *收稿日期: 2012-02-12 作者简介: 何新易(1966—),男,湖北武汉人,南通大学商学院副教授,经济学博士,研究方向:宏观国民经济问题、中国企业集团融资和投资。

时间序列模型概述

Wold 分解定理:任何协方差平稳过程x t ,都可以被表示为 x t - - d t = u t + 1 u t -1+ 2 u t -2 + … + = 其中 表示x t 的期望。d t 表示x t 的线性确定性成分,如周期性成分、时间t 的多项式和指数形式等,可以直接用x t 的滞后值预测。 = 1, ∑∞ =0 2 j j ψ< ∞。u t 为白噪声过程。u t 表示用x t 的滞后项预测x t 时的误差。 u t = x t - E(x t x t -1, x t -2 , …) ∑ ∞=-0 j j t j u ψ称为x t 的线性非确定性成分。当d t = 0时,称x t 为纯线性非确定性过程。 Wold 分解定理由Wold 在1938年提出。Wold 分解定理只要求过程2阶平稳即可。从原理上讲,要得到过程的Wold 分解,就必须知道无限个j 参数,这对于一个有限样本来说是不可能的。实际中可以对 j 做另一种假定,即可以把 (L )看作是2个有限特征多项式的比, (L ) =∑ ∞ =0 j j j L ψ=)()(L L ΦΘ=p p q q L L L L L L φφφθθθ++++++++...1 (1221221) 注意,无论原序列中含有何种确定性成分,在前面介绍的模型种类中,还是后面介绍的自相关函数、偏自相关函数中都假设在原序列中已经剔除了所有确定性成分,是一个纯的随机过程(过程中不含有任何确定性成分)。如果一个序列如上式, x t = + d t + u t + 1 u t -1+ 2 u t -2 + … + 则所有研究都是在y t = x t - - d t 的基础上进行。例如前面给出的各类模型中都不含有均值项、时间趋势项就是这个道理。 2.3 自相关函数 以上介绍了随机过程的几种模型。实际中单凭对时间序列的观察很难确定其属于哪一种模型,而自相关函数和偏自相关函数是分析随机过程和识别模型的有力工具。 1. 自相关函数定义 在给出自相关函数定义之前先介绍自协方差函数概念。由第一节知随机过程{x t }中的每一个元素x t ,t = 1, 2, … 都是随机变量。对于平稳的随机过程,其期望为常数,用 表示,即 E(x t ) = , t = 1, 2, … (2.25)

基于时间序列序列分析优秀论文

梧州学院 论文题目基于时间序列分析梧州市财政 收入研究 系别数理系 专业信息与计算科学 班级 09信息与计算科学 学号 200901106034 学生姓名胡莲珍 指导老师覃桂江 完成时间

摘要 梧州市财政收入主要来源于基金收入,地方税收收入和非税收收入等几方面。近年来梧州市在自治区党委、自治区政府和市委的正确领导下,全市广大干部群众深入贯彻落实科学发展观,抢抓机遇,开拓进取,克难攻坚,使得全市经济连续几年快速发展,全市人民的生活水平也大幅度提高,但伴随着发展的同时也存在一些问题,本文主要通过研究分析梧州财政收入近几年的状况,根据采用时间序列分析中的一次简单滑动平均法研究分析梧州市财政收入和支出的情况,得到的结果是梧州市财政收入呈现下降状态,而财政支出却逐年上涨,这种状况将导致梧州市人民生活水平下降,影响梧州市各方面的发展。给予一些有益于梧州市财政发展的建议。本文首先介绍主要运用的时间序列分析的概念及其一次简单滑动平均法的方法,再用图表说明了梧州市财政近几年的财政收入和支出状况,然后建立模型,分析由时间序列分析方法得出的对2012年财政收入状况的预测结果,最后,鉴于提高梧州市财政收入的思想,给予了一些合理性建议,比如:积极实施工业强县战略,壮大工业主导财源;大力发展第三产业,强化地方财源建设;完善公共财政支出机制,着力构建和谐社会。 关键词:梧州市;财政收入;时间序列分析;建立模型;建议

Based onThe Time Series Analysis of Wuzhou city Finance Income Studies Abstract Wuzhou city, fiscal revenue mainly comes from fund income, local tax revenue and the tax revenue etc. Wuzhou city in recent years in the autonomous region party committee, the government of the autonomous region and the municipal party committee under the correct leadership, the cadres and masses thoroughly apply the scientific outlook on development, catch every opportunity, pioneering and enterprising, g hard, make the crucial economic rapid development for several years, the people's living standard has also increased significantly, but with the development at the same time, there are also some problems, this paper mainly through the research and analysis the condition of wuzhou fiscal revenue in recent years, according to the time series analysis of a simple moving average method research and analysis of financial income and expenditure wuzhou city, the result obtained is wuzhou city, fiscal revenue decline present condition, and fiscal spending is rising year by year, the situation will lead to wuzhou city, the people's living standards decline, influence all aspects of wuzhou city development. Give some Suggestions on the development of the financial benefit wuzhou city. This paper first introduces the main use of the time series analysis of the concept and a simple moving average method method, reoccupy chart illustrates the wuzhou city, in recent years the financial revenue and expenditure situation, then set a model, analysis the time series analysis method to draw 2012 fiscal income condition prediction results, finally, in view of wuzhou city, improve the financial income thoughts, give some advice, for instance: rationality vigorously implement the strategy of industrial county, strengthen the industry leading financial sources, A vigorous development of the third industry, and to strengthen the construction of local revenue;

时间序列分析教程汇总

3.3时间序列分析 3.3.1时间序列概述 1.基本概念 (1)一般概念:系统中某一变量的观测值按时间顺序(时间间隔相同)排列成一 个数值序列,展示研究对象在一定时期内的变动过程,从中寻找 和分析事物的变化特征、发展趋势和规律。它是系统中某一变量 受其它各种因素影响的总结果。 (2)研究实质:通过处理预测目标本身的时间序列数据,获得事物随时间过程的 演变特性与规律,进而预测事物的未来发展。它不研究事物之间 相互依存的因果关系。 (3)假设基础:惯性原则。即在一定条件下,被预测事物的过去变化趋势会延续 到未来。暗示着历史数据存在着某些信息,利用它们可以解释与 预测时间序列的现在和未来。 近大远小原理(时间越近的数据影响力越大)和无季节性、无趋 势性、线性、常数方差等。 (4)研究意义:许多经济、金融、商业等方面的数据都是时间序列数据。 时间序列的预测和评估技术相对完善,其预测情景相对明确。 尤其关注预测目标可用数据的数量和质量,即时间序列的长度和 预测的频率。 2.变动特点 (1)趋势性:某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的 持续上升、下降、停留的同性质变动趋向,但变动幅度可能不等。 (2)周期性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。 (3)随机性:个别为随机变动,整体呈统计规律。 (4)综合性:实际变化情况一般是几种变动的叠加或组合。预测时一般设法过滤 除去不规则变动,突出反映趋势性和周期性变动。 3.特征识别 认识时间序列所具有的变动特征,以便在系统预测时选择采用不同的方法。(1)随机性:均匀分布、无规则分布,可能符合某统计分布。(用因变量的散点图 和直方图及其包含的正态分布检验随机性,大多数服从正态分布。) (2)平稳性:样本序列的自相关函数在某一固定水平线附近摆动,即方差和数学 期望稳定为常数。 样本序列的自相关函数只是时间间隔的函数,与时间起点无关。其 具有对称性,能反映平稳序列的周期性变化。 特征识别利用自相关函数ACF:ρ k =γ k /γ 其中γ k 是y t的k阶自协方差,且ρ =1、-1<ρ k <1。 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋 近于0,前者测度当前序列与先前序列之间简单和常规的相关程度, 后者是在控制其它先前序列的影响后,测度当前序列与某一先前序 列之间的相关程度。 实际上,预测模型大都难以满足这些条件,现实的经济、金融、商业等序列

ARMA模型的eviews的建立--时间序列分析实验指导

时间序列分析 实验指导 4 2 -2 -4 50100150200250

统计与应用数学学院

前言 随着计算机技术的飞跃发展以及应用软件的普及,对高等院校的实验教学提出了越来越高的要求。为实现教育思想与教学理念的不断更新,在教学中必须注重对大学生动手能力的培训和创新思维的培养,注重学生知识、能力、素质的综合协调发展。为此,我们组织统计与应用数学学院的部分教师编写了系列实验教学指导书。 这套实验教学指导书具有以下特点: ①理论与实践相结合,书中的大量经济案例紧密联系我国的经济发展实际,有利于提高学生分析问题解决问题的能力。 ②理论教学与应用软件相结合,我们根据不同的课程分别介绍了SPSS、SAS、MATLAB、EVIEWS等软件的使用方法,有利于提高学生建立数学模型并能正确求解的能力。 这套实验教学指导书在编写的过程中始终得到安徽财经大学教务处、实验室管理处以及统计与应用数学学院的关心、帮助和大力支持,对此我们表示衷心的感谢! 限于我们的水平,欢迎各方面对教材存在的错误和不当之处予以批评指正。 统计与数学模型分析实验中心 2007年2月

目录 实验一 EVIEWS中时间序列相关函数操作···························- 1 - 实验二确定性时间序列建模方法 ····································- 8 - 实验三时间序列随机性和平稳性检验 ···························· - 18 - 实验四时间序列季节性、可逆性检验 ···························· - 21 - 实验五 ARMA模型的建立、识别、检验···························· - 27 - 实验六 ARMA模型的诊断性检验····································· - 30 - 实验七 ARMA模型的预测·············································· - 31 - 实验八复习ARMA建模过程·········································· - 33 - 实验九时间序列非平稳性检验 ····································· - 35 -

时间序列分析法原理及步骤

时间序列分析法原理及步骤 ----目标变量随决策变量随时间序列变化系统 一、认识时间序列变动特征 认识时间序列所具有的变动特征, 以便在系统预测时选择采用不同的方法 1》随机性:均匀分布、无规则分布,可能符合某统计分布(用因变量的散点图和直方图及其包含的正态分布检验随机性, 大多服从正态分布 2》平稳性:样本序列的自相关函数在某一固定水平线附近摆动, 即方差和数学期望稳定为常数 识别序列特征可利用函数 ACF :其中是的 k 阶自 协方差,且 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于 0, 前者测度当前序列与先前序列之间简单和常规的相关程度, 后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。实际上, 预测模型大都难以满足这些条件, 现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。 二、选择模型形式和参数检验 1》自回归 AR(p模型

模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量互相独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性的比你更造成的困难用 PACF 函数判别 (从 p 阶开始的所有偏自相关系数均为 0 2》移动平均 MA(q模型 识别条件

平稳时间序列的偏相关系数和自相关系数均不截尾,但较快收敛到 0, 则该时间序列可能是 ARMA(p,q模型。实际问题中,多数要用此模型。因此建模解模的主要工作时求解 p,q 和φ、θ的值,检验和的值。 模型阶数 实际应用中 p,q 一般不超过 2. 3》自回归综合移动平均 ARIMA(p,d,q模型 模型含义 模型形式类似 ARMA(p,q模型, 但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用 ARMA(p,q模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中 d (差分次数一般不超过 2. 模型识别 平稳时间序列的偏相关系数和自相关系数均不截尾,且缓慢衰减收敛,则该时间序列可能是 ARIMA(p,d,q模型。若时间序列存在周期性波动, 则可按时间周期进

Eviews时间序列分析实例.

Eviews时间序列分析实例 时间序列是市场预测中经常涉及的一类数据形式,本书第七章对它进行了比较详细的介绍。通过第七章的学习,读者了解了什么是时间序列,并接触到有关时间序列分析方法的原理和一些分析实例。本节的主要内容是说明如何使用Eviews软件进行分析。 一、指数平滑法实例 所谓指数平滑实际就是对历史数据的加权平均。它可以用于任何一种没有明显函数规律,但确实存在某种前后关联的时间序列的短期预测。由于其他很多分析方法都不具有这种特点,指数平滑法在时间序列预测中仍然占据着相当重要的位置。 (-)一次指数平滑 一次指数平滑又称单指数平滑。它最突出的优点是方法非常简单,甚至只要样本末期的平滑值,就可以得到预测结果。 一次指数平滑的特点是:能够跟踪数据变化。这一特点所有指数都具有。预测过程中添加最新的样本数据后,新数据应取代老数据的地位,老数据会逐渐居于次要的地位,直至被淘汰。这样,预测值总是反映最新的数据结构。 一次指数平滑有局限性。第一,预测值不能反映趋势变动、季节波动等有规律的变动;第二,这种方法多适用于短期预测,而不适合作中长期的预测;第三,由于预测值是历史数据的均值,因此与实际序列的变化相比有滞后现象。 指数平滑预测是否理想,很大程度上取决于平滑系数。Eviews提供两种确定指数平滑系数的方法:自动给定和人工确定。选择自动给定,系统将按照预测误差平方和最小原则自动确定系数。如果系数接近1,说明该序列近似纯随机序列,这时最新的观测值就是最理想的预测值。 出于预测的考虑,有时系统给定的系数不是很理想,用户需要自己指定平滑系数值。平滑系数取什么值比较合适呢?一般来说,如果序列变化比较平缓,平滑系数值应该比较小,比如小于0.l;如果序列变化比较剧烈,平滑系数值可以取得大一些,如0.3~0.5。若平滑系数值大于0.5才能跟上序列的变化,表明序列有很强的趋势,不能采用一次指数平滑进行预测。 [例1]某企业食盐销售量预测。现在拥有最近连续30个月份的历史资料(见表l),试预测下一月份销售量。 表1 某企业食盐销售量单位:吨 解:使用Eviews对数据进行分析,第一步是建立工作文件和录入数据。有关操作在本

相关主题
文本预览
相关文档 最新文档