当前位置:文档之家› 非平稳时间序列的建模研究

非平稳时间序列的建模研究

非平稳时间序列的建模研究
非平稳时间序列的建模研究

(申请理学硕士学位论文)

非平稳时间序列的建模方法研究

培养单位 :理学院

学科专业 :应用数学

研 究 生 :林 卉 指导教师 :童恒庆 教授

2005年5月

分类号密级

UDC 学校代码 10497

学位论文

题目非平稳时间序列的建模方法研究

英文The Research on the Method of the Modeling

题目of Nonstationary Time Series

研究生姓名林 卉

姓名童恒庆职称教授学位博士

指导教师

单位名称理学院邮编 430070 申请学位级别硕士学科专业名称应用数学

论文提交日期 2005年5月论文答辩日期 2005年6月学位授予单位武汉理工大学日期

答辩委员会主席评阅人

2005年5月

武汉理工大学硕士学位论文

中文摘要

时间序列分析是概率统计学中一个内容十分丰富的重要分支,近年来它在理论与应用两方面都得到了蓬勃发展。时间序列分析按时间序列的统计特性可以分为平稳时间序列和非平稳时间序列两类。在实际问题中,我们经常遇到的序列,特别是反映社会、经济现象的序列,大多数并不平稳,并且呈现出明显的趋势性或周期性,因此研究非平稳时间序列的建模具有很重要的现实意义。本文的重点是对非平稳时间序列的建模方法进行研究。

首先,本文介绍非平稳时间序列的一些传统的建模方法,主要对ARIMA模型法、季节性模型法、X-11法、回归方法、灰色模型法等方法加以研究分析。

然后,本文对非平稳时间序列的状态空间建模方法进行重点研究,主要有如下的研究工作:

(1)在建模方面,参照Kitagawa和顾岚教授关于时间序列状态空间建模思路,把非平稳时间序列趋势项、循环项和季节项这三项分别建立非平稳时间序列趋势项状态空间模型、非平稳时间序列循环项状态空间模型和非平稳时间序列季节项状态空间模型,最后建立非平稳时间序列的总体的状态空间模型。

(2)在状态估计方面,介绍卡尔曼滤波递推公式的理论依据,采用卡尔曼滤波与固定区间平滑融为一体的算法,对状态空间模型中的状态向量及其误差方差阵进行估计,并用Matlab编写出相应的程序。

(3)介绍改进的EM算法,对改进的EM算法的收敛性给出证明。

(4)在参数估计方面,提出采用卡尔曼滤波、固定区间平滑以及改进的EM 算法融为一体的方法进行估计。

(5)把传统的ARIMA建模方法和本文介绍的状态空间建模方法分别用于我国第三产业总值的预测中,比较两种模型的预测效果。用实例验证使用卡尔曼滤波与固定区间平滑相结合的算法优于单独使用卡尔曼滤波,以及卡尔曼滤波、卡尔曼滤波与固定区间平滑相结合的算法都具有算法稳定性。

关键词:非平稳时间序列,ARIMA模型,状态空间模型

. I

武汉理工大学硕士学位论文

Abstract

Time series analysis is one of important branch in probability and statistics. Recently, the theory and application of time series is developed quickly. According to the characteristic of statistics, time series is divided into two classes. One is stationary time series, the other is nonstationary time series. In daily time we usually observe time series which is almost nonstationary especially in the phenomena of society and economic. The nonstationary time series presents obvious tendency and periodicity. The research of the modeling of nonstationary time series is very important in practice. The study narrates mainly about the method of the modeling of nonstationary time series.

Firstly, some traditional research methods of the modeling of nonstationary time series are introduced in the study. For example, ARIMA model, season model, X-11 model, grey model and so on.

The emphasis of the study is the research of the state space modeling of nonstationary time series, it includes the five points:

(i) In modeling phase, according to the method of Kitagawa and Gulan on the state space modeling of nonstationary time series, time series is decomposed into four items which are trend item, cycle item, season item and random item. Then the study establishes the state space modeling of four items separatly which constitute the total state space modeling of nonstationary time series.

(ii) In the estimate of state vector, the study introduces the academic gist of the Kalman filtering and uses the arithmetic of the Kalman filtering and optimal fixed interval smoothing.

(iii) The study introduces the improved EM algorithm, and it proves the convergent property.

(iv) In the estimate of the parameter, the study uses the arithmetic of the Kalman filtering, optimal fixed interval smoothing and improved EM algorithm.

(v) The study uses the ARIMA model and state space model to forecast the total value of the three industry in our country. It compares the impact of the two model. And it testifies that the arithmetic of the Kalman filtering and optimal fixed interval smoothing is better than the Kalman filtering. And the Kalman filtering and the arithmetic of the Kalman filtering and optimal fixed interval smoothing are steady in arithmetic.

Keywords: nonstationary time series, ARIMA model, state space model

. II

武汉理工大学硕士学位论文

目录

第1章引言 (1)

1.1 时间序列概述 (1)

1.2 平稳时间序列 (3)

1.3 非平稳时间序列 (4)

1.3.1 国外关于非平稳时间序列建模的主要研究成果 (5)

1.3.2 国内关于非平稳时间序列建模的主要研究成果 (6)

1.4 本文所要解决的问题 (7)

第2章非平稳时间序列的若干传统建模方法 (9)

2.1 ARIMA模型法 (9)

2.2 季节性模型法 (11)

2.3 X-11方法 (12)

2.4 回归方法 (14)

2.5 灰色模型法 (17)

第3章非平稳时间序列的状态空间建模方法 (20)

3.1 非平稳时间序列的分解 (20)

3.2 状态空间模型的介绍 (21)

3.3 非平稳时间序列的状态空间模型的建立 (22)

3.3.1 非平稳时间序列趋势项状态空间建模 (23)

3.3.2 非平稳时间序列循环项状态空间建模 (25)

3.3.3 非平稳时间序列季节项状态空间建模 (27)

3.3.4 非平稳时间序列总体状态空间模型的建立 (28)

3.3.5 非平稳时间序列的最佳状态空间模型的确定 (29)

3.4 非平稳时间序列状态空间模型的状态估计 (30)

3.4.1 无偏最小方差估计 (30)

. i

武汉理工大学硕士学位论文

3.4.2 卡尔曼滤波 (32)

3.4.3 固定区间平滑 (35)

3.4.4 卡尔曼滤波与固定区间平滑相结合方法 (37)

3.5 非平稳时间序列状态空间模型的参数估计 (39)

3.5.1 参数的极大似然估计 (39)

3.5.3 EM算法及其改进算法 (41)

3.6 非平稳时间序列状态空间模型的预测 (43)

第4章ARIMA模型与状态空间模型的预测的实例 (44)

4.1 ARIMA建模法在全国第三产业总值预测中的应用 (44)

4.2 状态空间建模法在全国第三产业总值预测中的应用 (47)

第5章本文的结论 (51)

5.1 传统建模方法的优点及其不足 (51)

5.2 非平稳时间序列状态空间模型的建模方法的优点及其不足 (52)

5.3 本文研究的内容和进一步研究的重点 (53)

5.3.1 本文研究的内容 (53)

5.3.1 本文进一步研究的重点 (54)

参考文献 (56)

致谢 (59)

附录1 攻读硕士学位期间发表的论文 (60)

附录2 卡尔曼滤波与固定区间平滑方法的Matlab程序 (61)

. ii

武汉理工大学硕士学位论文

. 1

第1章 引言

1.1 时间序列概述

随着科学技术的进步和社会经济的发展,在许多领域,人们日益重视对各种现象的定量观测和有关数据的收集和分析。这些数据一般按时间顺序排列,由于受到多种偶然因素的影响,往往表现出某种随机性,且观测值之间存在着相互依赖关系。对这种按时间顺序排列的动态数据进行研究,构成了数理统计的一个重要分支——时间序列分析[2]。

自从1970年Box 和Jenkins 提出自回归滑动平均模型及其一套完整的建模、估计、检验、预测和控制方法以来,时间序列分析这一领域吸引了大批科技人员在理论和方法上的进一步研究,其应用遍及气象、生物、电力、机械、化工、交通、经济以及土建等领域。

从统计意义上讲,所谓时间序列就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。这些时间序列由于受到各种偶然因素的影响,往往表现出随机性,彼此之间存在着统计上的依赖关系。而时间序列中的“时间”可以具有不同的物理意义,可以小到生活琐事,如一天内的体温变化、情绪波动规律等,也可以大到国家、世界大事,如世界森林面积的变化、

地球空气污染的变化、股市行情变化以及国民生产值的变化等等[3]。

从数学意义上讲,如果对某一过程中的某一个变量或一组变量()X t 进行观察测量,在一系列时刻12,,,N t t t L 12(1,2,,)i N t i N t t t =<<

从系统意义上讲,时间序列就是某一系统在不同时间(地点、条件等)的响应。这个定义从系统运行的观点出发,指出时间序列是按一定顺序排列而成的;这里的“一定顺序”既可以是时间顺序,也可以是具有各种不同意义的物理量(如代表温度,速度或其它单调递增取值的物理量)。可见,时间序列只是

武汉理工大学硕士学位论文

强调顺序的重要性,而并非强调必须以时间顺序排列[7]。

时间序列根据所研究的依据不同,有不同的分类[3]。

1.按所研究对象的多少来分,有一元时间序列和多元时间序列。如果所研究的对象是一个变量,例如某种商品销售量,则称为一元时间序列;如果所研究的对象是多个变量,例如按年或月顺序排列的气温、气压、雨量数据,这种序列每个时刻t对应着多个变量,则称为多元时间序列。多元时间序列不仅描述了各个变量的变化规律,而且揭示了各变量间相互依存关系的动态规律性。

2.按时间的连续性来分,有离散时间序列和连续时间序列。如果某一序列中的每一个序列值所对应的时间参数为间断点,那么该序列就是一个离散时间序列;如果某一序列中的每一个序列值所对应的时间参数为连续函数,则该序列就是一个连续时间序列。本文研究的是离散时间序列。

3.按时间序列的统计特性来分,有平稳时间序列和非平稳时间序列。如果一个时间序列的概率分布与时间t无关,则称该时间序列为严格的(狭义的)平稳时间序列。如果时间序列的一、二阶矩存在,而且对任意时刻t满足:(1)均值为常数,(2)协方差为时间间隔τ的函数,则称该时间序列为宽平稳时间序列,也叫广义平稳时间序列。反之,把不具有平稳性的时间序列(即时间序列的均值或协方差是与时间有关的序列)称之为非平稳序列。

4.按时间序列的分布规律来分,有高斯型(Gaussian)时间序列和非高斯型(non-Gaussian)时间序列。服从高斯分布(正态分布)的时间序列叫做高斯型时间序列,否则叫做非高斯型时间序列。对于一些非高斯序列,往往通过适当变换,则可近似地看成是高斯型时间序列。

时间序列的一个重要的基本特征就是相邻观测值之间具有依赖性,这种依赖特征具有很大的实际意义。时间序列分析所论及的就是对这种依赖性进行分析的技巧,即根据已有的动态数据来揭示系统动态结构和规律。时间序列分析的基本思想是寻找系统的当前值与其过去的运行记录(观察数据)的关系(是一种纵向关系),建立能够比较精确地反映时间序列中动态依存关系的数学模型,并借此对系统的未来行为进行预报。

时间序列分析有时域分析、统计分析和频域分析,如果时间序列数据图像的横轴表示时间,纵轴表示函数值,那么时间序列沿时间轴表现出来的性质是时域性质,对其分析称为时域分析;时间序列沿函数值轴表现出来的性质(一

. 2

武汉理工大学硕士学位论文

. 3

般是概率意义上的随机值,是概率性质),对其分析称为统计分析;如果时间序列数据表现出来的波动性,既有振幅也有频率,对其分析称为频域分析或频谱分析。本文主要介绍时域分析。

1.2 平稳时间序列

平稳时间序列的直观含义就是时间序列中不存在任何趋势性和周期性,其统计意义就是一阶矩为常数,二阶矩存在且为时间间隔τ的函数。这里讲的时间序列的平稳是指宽平稳,其特性是序列的统计特性不随时间的变化而变化,即均值和协方差不随时间变化而变化。

对平稳时间序列建模,如果是要寻找序列变量之间或者序列变量前后之间的联系,就考虑建立自回归模型(Auto Regressive model 简称AR 模型);如果是要寻找序列变量与白噪声之间的联系,就考虑建立移动平均模型(Moving Average model 简称MA 模型);如果既要寻找序列变量前后之间的联系又要寻找序列变量与白噪声之间的联系,就考虑建立自回归移动平均模型(Auto Regressive Moving Average model 简称ARMA 模型)。将三种模型表示如下:

()AR n 即n 阶自回归模型为:

1122t t t n t n t X X X X a ??????=++++L

()MA m 即m 阶移动平均模型为:

1122t t t t m t m X a a a a θθθ???=????L

(,)ARMA n m 即n 阶自回归m 阶移动平均模型为:

11221122t t t n t n t t t m t m X X X X a a a a ???θθθ??????????=????L L

对平稳时间序列建立模型的方法有很多,如Box-Jenkins 方法、Pandit -Wu 方法以及长阶自回归法等等[2,3,7]。

Box-Jenkins 方法是以自相关函数、偏自相关函数的统计特征为依据的方法,其基本步骤有四步:(1)模型识别,即对一个观察序列,用其相关图和偏相关图来从各种模型族中选择一个与其实际过程相吻合的模型结构,找到合适的,p d q 和的值。(2)参数估计,估计模型中所含自回归和移动平均项的参数。

(3)诊断,看所选的模型对数据拟合是否够好。(4)预测,利用所选模型对时间序列进行一步或多步预测。

武汉理工大学硕士学位论文

. 4

Pandit-Wu 方法是Pandit-Wu 在1977年提出一种系统建模的新方法。这种方法是在Box-Jenkins 方法的基础上,经过实践和进一步发展得出的。它认为任何一个平稳时间序列总可以用一个(,1)ARMA n n ?模型来表示。而()AR n 、()MA m 以及(,)(1)ARMA n m m n ≠?模型都是(,1)ARMA n n ?模型的特例。这种方法的思想为:逐渐增加模型的阶数,拟合较高阶(,1)ARMA n n ?模型,直到再增加模型的阶数而剩余平方和不再显著减小为止。主要建模步骤:(1)零均值化,使时间序列的均值为零。(2)从1n =开始,逐渐增加模型阶数,拟合(2,21)ARMA n n ?模型。(3)模型适应性检验。(4)求最优模型。

长阶自回归法的理论依据是:任一个时间序列都可以用一个足够高阶的()AR n 模型来逼近到所要求的精度。其建模的基本步骤为:(1)零均值化,这与

Pandit-Wu 方法一致。(2)建立(2)AR n 模型,直至达到所要求的精度为止。

(3)根据拟合的AR 模型求(,1)ARMA n n ?。(4)(,1)ARMA n n ?的可逆性检验。

1.3 非平稳时间序列

前面叙述了平稳时间序列及如何用有限阶()AR n 、()MA m 和(,)ARMA n m 模型对平稳时间序列的观测数据进行建模拟合。但是在实际问题中,我们常常遇到的序列,特别是反映社会、经济现象的序列,大多数并不平稳,而是具有明显的增长或减少趋势,或者含有依时间周期变化的趋势。例如国际航线客票数据、太阳黑子数据以及证券交易所每日收盘的综合指数等等。这就需要我们对非平稳时间序列进行研究。

判断时间序列是否非平稳,常见的方法有:数据图检验法、自相关或偏相关函数检验法、特征根检验法、参数检验法、逆序检验法、游程检验法[8]。

对于非平稳时间序列的分析研究,其主要思路是将其转化为平稳时间序列来进行研究。转化的办法可以是将它与一个普通函数相减(时序分解)、自己与自己前后项相减(滤波或单位根过程)、自己与另外一些时序相减(Co-Integration,一般翻译成协整)。

对于非平稳时间序列的建模方法有ARIMA 模型法、季节性模型法、X-11法等传统方法[2,3,7]。国内外关于非平稳时间序列的建模方法也有不同的研究成果。

武汉理工大学硕士学位论文

1.3.1 国外关于非平稳时间序列建模的主要研究成果

早在1920年,G.U.Yule就提出了自回归模型的概念,但这一工作在当时对预测并没有产生多大的影响。直到70年代,由于Box和Jenkins的开拓性工作,ARIMA模型才成了人们研究的热门课题[2]。Box和Jenkins提出的ARIMA模型是国际上流行的一种时间序列预测模型。Box-Jenkins方法是迄今为止理论上最完善的预测方法,通过预测技术的普及和计算机的广泛应用,它引起了越来越多的重视,目前已经有很多人进行了ARIMA模型的自动建模及预测的研究工作。在建立ARIMA模型时,Box-Jenkins方法是用差分方法来做平稳化处理,Parzen 认为这样的差分处理是粗略的,为此,他提出了ARARMA模型法[9,10],即首先用一个AR模型进行变换,使序列从非平稳变成平稳;然后再用一个ARMA模型进行变换,使序列从平稳变成白噪声。同时与ARIMA模型相比,ARARMA模型要估计参数较多,但是精度要高一些。70年代中期,由Box和Tiao首先提出干预分析模型,它可以看成多变量时间序列模型中传递函数模型的一种推广[14]。干预分析模型能够对时间序列中的动态特征进行合理的描述,甚至可以对未来做出主观的估计,把先验知识反映进模型中来。其成功用于交通、经济等领域,但是对于干预发生后没有足够观测数据的情况,可能无法建立干预模型。

对于季节性的时间序列的研究,运用较多的是X-12方法和BV4方法。X-12方法和BV4方法是从原始序列中分离出趋势(Trend)——也就是剔除季节因素。加拿大统计局将美国普查局的X-12方法改进为X-12-ARIMA方法,以消除原方法在序列两端不对称的影响。除此之外,一些国家或部门也继续尝试在不同方面的改进,例如韩国人根据本国的国情引入哑元以反映韩国的特定节假日因素,开发出了BOK-X-12-ARIMA方法;Box和Tiao将干预事件引入到X-12-ARIMA之中,形成带有干预分析的X-12-ARIMA模型,它在经济时间序列的研究和运用中越来越流行。

同时针对传统的差分回归的处理方法,美国经济学家、纽约大学金融学教授罗伯特.恩格尔(Engle)和英国经济学家、美国加利福尼亚大学荣誉教授克莱夫.格兰杰(C.Granger)于1987年正式提出协整理论和误差修正模型[16]。如果两个或两个以上同阶单整的非平稳时间序列的线性组合是平稳时间序列,那么就说这些变量之间的关系就是协整的。针对金融经济学研究的核心问题——

. 5

武汉理工大学硕士学位论文

波动性,恩格尔(Engle)教授于1982年创造性地引入自回归条件异方差模型即ARCH模型来刻画金融资产的价格波动行为。自恩格尔提出ARCH模型以来,虽然只有近20多年的历史,但是ARCH模型迄今为止已发展成为一系列模型,其主要形式有:ARCH模型、GARCH模型、ARCH-M模型、EGARCH模型以及TARCH模型等等。如果将非平稳时间序列通过差分、滤波等方法平稳化后,就能够运用ARCH族模型、GARCH族等模型来研究。

近年来,许多以状态空间模型为框架的时间序列预测方法应运而生。1987年日本的Masanao Aok出版了有关状态空间建模的专著State Space Modeling of Time Series,开始了时间序列状态空间分析的新纪元[15],但是有关篇幅很少,缺乏系统的理论性。对于以状态空间模型为框架的时间序列预测方法,具有代表性还有Kitagawa、Shumway以及Young P.C.等人对此方法的研究[1,3,6]。Kitagawa (1984)对时间序列的建模过程采用了向状态空间模型的转化技巧,但是无法实现对时变过程建模[1]。对于状态空间模型的参数估计,Shumway(1988)提出针对状态空间模型的参数估计方法—EM 算法(Expectation-maximination Algorithm)[2]。Young(1990)对模型的每一步都实现了完全递推形式,但是没有给出模型参数的新的估计方法[3]。状态空间模型的研究和应用还有待进一步发展。

1.3.2 国内关于非平稳时间序列建模的主要研究成果

随着统计学的发展,时间序列分析方法也得到了广泛的应用和发展,其理论也逐渐成熟起来。但是当前在国内以研究动态数据为特征的非平稳时间序列建模的研究,一直局限于传统的研究方法中。传统的非平稳时间序列建模的研究是以概率论、数理统计和频谱分析等数学方法为工具,由Box和Jenkins在1970年提出的ARIMA方法在国内已被广泛使用;对于季节调整,一般还是采用X-11方法及其改进的方法来处理;对于非平稳时间序列采用回归的方法,用线性函数、幂函数、指数函数、周期函数等函数提取时间序列的趋势项;有的研究者将灰色模型与时间序列相结合提取趋势项,然后采用组合模型的形式对非平稳时间序列进行预测;同时有关非平稳时间序列的协整理论在我国也得到了研究者们广泛的重视,特别是经济领域得到广泛应用;有的研究者将非平稳

. 6

武汉理工大学硕士学位论文

时间序列转化为平稳时间序列以后,将有异方差现象的时间序列用ARCH、GARCH族来建模,在预测上也取得了较好的结果[35]。

有关非平稳时间序列的状态空间的研究方法的还很少见。中国人民大学的顾岚教授曾在自己的著作和文章中提到时间序列的状态空间的研究方法[23,25]。 2000年,大连海事大学的任光和张均东教授正式将现代控制理论的状态空间技术和时间序列分析相结合的时间序列状态空间技术引入我国[27]。他们从离散系统出发,从空间映射的角度系统地论述了整个建模过程,形成了比较完整和系统的时间序列的状态空间建模理论,归纳出了多种有效的算法,得出了许多自己的结论,并且将论述的方法应用到工程控制系统、轮机工程系统和社会经济系统等多种系统的建模之中。当前,用状态空间研究时间序列的方法正在我国统计界日益得到广泛的关注。有的研究者将时间序列状态空间方法用于时间序列的季节调整[41],用于研究生活中的各个领域。

1.4 本文所要解决的问题

本文所要解决的问题主要有以下六个方面:

(1)对非平稳时间序列的一些传统建模方法进行分析和研究,叙述其优点和不足。

(2)用状态空间模型对非平稳时间序列建模时,首先将非平稳时间序列分解为趋势项、循环项、季节项和不规则项。参照Kitagawa和顾岚教授关于时间序列状态空间建模思路,分别建立非平稳时间序列趋势项状态空间模型、非平稳时间序列循环项状态空间模型和非平稳时间序列季节项状态空间模型,然后建立非平稳时间序列总体的状态空间模型。

(3)在模型状态估计方面,介绍卡尔曼滤波递推公式的理论依据,采用卡尔曼滤波和固定区间平滑相结合的方法对状态空间模型中的状态向量及其误差方差阵进行递推计算,并用Matlab编写出相应的程序。

(4)介绍改进的EM算法,对改进的EM算法的收敛性给出证明。

(5)在参数估计方面,提出可以采用卡尔曼滤波、固定区间平滑方法以及改进的EM算法融为一体的方法对模型参数进行迭代估计。

(6)用实例比较传统的ARIMA建模方法和本文介绍的状态空间建模方法. 7

武汉理工大学硕士学位论文

的预测效果。

本文以下部分的结构如下:第二章介绍非平稳时间序列的若干传统建模方法;第三章介绍非平稳时间序列的状态空间建模方法;第四章将传统的非平稳时间序列中的ARIMA建模方法和本文介绍的非平稳时间序列的状态空间建模方法用于我国第三产业总值的预测之中;第五章本文的结论。

. 8

武汉理工大学硕士学位论文

. 9

第2章 非平稳时间序列的若干传统建模方法

在传统的时间序列分析和回归分析中,为了保证统计推断的有效性,通常假定所给时间序列是平稳的。但大量的经验证据表明,大多数时间序列是非平稳的,往往会呈现出明显的趋势性或周期性。因此,研究非平稳时间序列建模有着重要的现实意义。下面介绍非平稳时间序列的若干传统建模方法,如ARIMA 模型法、季节性模型法、X-11方法等方法。

2.1 ARIMA 模型法

ARIMA 模型法在国际上被誉为时间序列预测方法中一种最复杂最高级的模型方法。随着计算机的发展,ARIMA 建模方法计算复杂、繁琐的难题迎刃而解,其应用范围越来越广。

ARIMA 模型意为求和自回归滑动平均模型(Integrated Auto-regressive Moving Average Model),简记为ARIMA(,,p d q ),,p q 分别为自回归、滑动平均部分的阶次,d 为差分运算阶次,对于某些非平稳时间序列{()}y t ,其一般形式为:

()(1)()()()d B B y t B a t ?θ?= (2-1)

若将(1)()d B y t ?记为()z t ,则上式就是ARMA 模型。

Box 发现,可通过差分方法求出增量序列:

()()(1)(2,3,,)y t y t y t t N ?=??=L

经过一次差分后,如果此增量序列{()}y t ?是平稳的,那么对{()}y t ?建立ARMA 模型,表示为:

()()()()B y t B a t ?θ?= (2-2)

根据差分算子?与后移算子B 的关系(1B ?=?),有

()(1)()()()B B y t B a t ?θ?= (2-3)

即还原得到{()}y t 的ARIMA 模型。

以上对非平稳时间序列{()}y t 作一次差分称为一阶差分。将这种思路推广,当采用一阶差分还不能使{()}y t ?成为平稳时间序列时,还可采用高阶(d 阶)

武汉理工大学硕士学位论文

. 10差分,以使{()}d y t ?成为平稳时间序列,再对{()}d y t ?建立ARMA 模型,然后根据差分算子?与后移算子B 的关系(1B ?=?),得到非平稳时间序列{()}y t 的ARIMA 模型,这就是ARIMA 模型法的基本思路。

一般而言,若某时间序列具有线性的趋势,则可以对其进行一次差分而将线性趋势剔除掉;若某时间序列具有指数的趋势,则可以取对数将指数趋势化为线性趋势,然后再进行差分以消除线性趋势,接着对差分后的序列拟合ARMA 模型进行分析与预测,最后再通过差分的反运算得到{}()y t 的ARIMA 模型。

ARIMA 模型法的流程图如图2-1所示。

图2-1 ARIMA 模型法流程图

非平稳时间序列分析

非平稳时间序列分析 1、首先画出时序图如下: 从时序图中看出有明显的递增趋势,而该序列是一直递增,不随季节波动,所以认为该序列不存在季节特征。故对原序列做一阶差分,画出一阶差分后的时序图如下:

从中可以看到一阶差分后序列仍然带有明显的增长趋势,再做二阶差分: 做完二阶差分可以看到,数据的趋势已经消除,接下来对二阶差分后的序列进行

检验: Autocorrelations Lag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error 0 577.333 1.00000 | |********************| 0 1 -209.345 -.36261 | *******| . | 0.071247 2 -52.915660 -.09166 | .**| . | 0.080069 3 9.139195 0.01583 | . | . | 0.080600 4 15.375892 0.02663 | . |* . | 0.080615 5 -59.441547 -.1029 6 | .**| . | 0.080660 6 -23.834489 -.04128 | . *| . | 0.081324 7 100.285 0.17370 | . |*** | 0.081431 8 -146.329 -.25346 | *****| . | 0.083290 9 52.228658 0.09047 | . |**. | 0.087118 10 21.008575 0.03639 | . |* . | 0.087593 11 134.018 0.23213 | . |***** | 0.087670 12 -181.531 -.31443 | ******| . | 0.090736 13 23.268470 0.04030 | . |* . | 0.096108 14 71.112195 0.12317 | . |** . | 0.096194 15 -105.621 -.18295 | ****| . | 0.096991 16 37.591996 0.06511 | . |* . | 0.098727 17 23.031506 0.03989 | . |* . | 0.098945 18 45.654745 0.07908 | . |** . | 0.099027 19 -101.320 -.17550 | ****| . | 0.099347 20 127.607 0.22103 | . |**** | 0.100908 21 -61.519663 -.10656 | . **| . | 0.103337 22 35.825317 0.06205 | . |* . | 0.103893 23 -93.627333 -.16217 | .***| . | 0.104081 24 55.451208 0.09605 | . |** . | 从其自相关图中可以看出二阶差分后的序列自相关系数很快衰减为零,且都在两倍标准差范围之内,所以认为平稳,白噪声检验结果: Autocorrelation Check for White Noise To Chi- Pr > Lag Square DF ChiSq --------------------Autocorrelations-------------------- 6 30.70 6 <.0001 -0.363 -0.092 0.016 0.02 7 -0.103 -0.041 12 84.54 12 <.0001 0.174 -0.253 0.090 0.036 0.232 -0.314 18 97.98 18 <.0001 0.040 0.123 -0.183 0.065 0.040 0.079 24 126.99 24 <.0001 -0.175 0.221 -0.107 0.062 -0.162 0.096

多元时间序列建模分析

应用时间序列分析实验报告

单位根检验输出结果如下:序列x的单位根检验结果:

1967 58.8 53.4 1968 57.6 50.9 1969 59.8 47.2 1970 56.8 56.1 1971 68.5 52.4 1972 82.9 64.0 1973 116.9 103.6 1974 139.4 152.8 1975 143.0 147.4 1976 134.8 129.3 1977 139.7 132.8 1978 167.6 187.4 1979 211.7 242.9 1980 271.2 298.8 1981 367.6 367.7 1982 413.8 357.5 1983 438.3 421.8 1984 580.5 620.5 1985 808.9 1257.8 1986 1082.1 1498.3 1987 1470.0 1614.2 1988 1766.7 2055.1 1989 1956.0 2199.9 1990 2985.8 2574.3 1991 3827.1 3398.7 1992 4676.3 4443.3 1993 5284.8 5986.2 1994 10421.8 9960.1 1995 12451.8 11048.1 1996 12576.4 11557.4 1997 15160.7 11806.5 1998 15223.6 11626.1 1999 16159.8 13736.5 2000 20634.4 18638.8 2001 22024.4 20159.2 2002 26947.9 24430.3 2003 36287.9 34195.6 2004 49103.3 46435.8 2005 62648.1 54273.7 2006 77594.6 63376.9 2007 93455.6 73284.6 2008 100394.9 79526.5 run; proc gplot; plot x*t=1 y*t=2/overlay; symbol1c=black i=join v=none; symbol2c=red i=join v=none w=2l=2; run; proc arima data=example6_4; identify var=x stationarity=(adf=1); identify var=y stationarity=(adf=1); run; proc arima; identify var=y crrosscorr=x; estimate methed=ml input=x plot; forecast lead=0id=t out=out; proc aima data=out; identify varresidual stationarity=(adf=2); run;

平稳时间序列的模型

目录 摘要 (1) 第一章绪论 (2) 1.1 时间序列模型的发展及其作用 (2) 1.2 什么是时间序列模型 (2) 1.3 本文研究的主要方法和手段 (2) 1.4 本文主要研究思路及内容安排 (2) 第二章 ARMA模型 (4) 2.1 ARMA模型的基本原理 (4) 2.2 样本自协方差函数、自相关函数和偏相关函数 (4) 2.3 ARMA模型识别方法 (5) 2.4 模型参数估计 (6) 第三章实例分析 (7) 3.1 题目 (7) 3.2 问题分析 (7) 3.3 问题求解 (8) 3.3.1数据的观测 (8) 3.3.2数据处理 (8) 3.3.3求解自相关和偏相关函数 (8) 3.4 模型的识别及求解 (9) 3.5 结论 (11) 参考文献 (12) 附录 (12) 评阅书 (15)

《随机过程》课程设计任务书

摘要 ARMA模型是研究时间序列的重要方法,由自回归模型(简称AR模型)与滑动平均模型(简称MA模型)为基础“混合”构成。ARMA模型广泛应用在经济、工程等各个领域得益于其在具体预测方面的优势。在许多方面用该模型所作出的预测比其他传统经济计量方法更加精确。平稳时间序列模型主要有自回归模型(AR)、滑动平均模型(MA)和自回归滑动平均模型(ARMA)等,这些线性模型考虑因素较简单。自回归滑动平均模型(ARMA)计算简单,易于实时更新数据。 本文描述了ARMA模型的原理、自相关函数和偏相关函数的计算过程、模型的识别方法以及ARMA模型的计算过程。并给出一组平稳时间序列的数据,对数据进行分析和处理,求出自相关系数和偏相关,并利用MATLAB软件画出自相关系数和偏相关图形,有图可知它们都是拖尾的,因此可以确定是) ARMA模 p , (q 型。接下来就是确定) ARMA的阶数,本文采用了AIC准则确定模型的阶数, p , (q 在实际问题中,为使线性模型简单起见,通常p与q的数值被取得较小,却需都不为零。确定阶数后,就用我们学过的求解方法解出未知的参数,这样我们就得到了混合模型的表达式。 关键字:) ARMA模型,自相关函数,偏相关函数 p , (q

时间序列分析_最经典的

【时间简“识”】 说明:本文摘自于经管之家(原人大经济论坛) 作者:胖胖小龟宝。原版请到经管之家(原人大经济论坛) 查看。 1.带你看看时间序列的简史 现在前面的话—— 时间序列作为一门统计学,经济学相结合的学科,在我们论坛,特别是五区计量经济学中是热门讨论话题。本月楼主推出新的系列专题——时间简“识”,旨在对时间序列方面进行知识扫盲(扫盲,仅仅扫盲而已……),同时也想借此吸引一些专业人士能够协助讨论和帮助大家解疑答惑。 在统计学的必修课里,时间序列估计是遭吐槽的重点科目了,其理论性强,虽然应用领域十分广泛,但往往在实际操作中会遇到很多“令人发指”的问题。所以本帖就从基础开始,为大家絮叨絮叨那些关于“时间”的故事!

Long long ago,有多long?估计大概7000年前吧,古埃及人把尼罗河涨落的情况逐天记录下来,这一记录也就被我们称作所谓的时间序列。记录这个河流涨落有什么意义?当时的人们并不是随手一记,而是对这个时间序列进行了长期的观察。结果,他们发现尼罗河的涨落非常有规律。掌握了尼罗河泛滥的规律,这帮助了古埃及对农耕和居所有了规划,使农业迅速发展,从而创建了埃及灿烂的史前文明。 好~~从上面那个故事我们看到了 1、时间序列的定义——按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。 2、时间序列分析的定义——对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。 既然有了序列,那怎么拿来分析呢? 时间序列分析方法分为描述性时序分析和统计时序分析。 1、描述性时序分析——通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析 ?描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。

平稳时间序列的ARMA模型

. . 第五讲(续)平稳时间序列的ARMA模型

. . 1 平稳性 有一类描述时间序列的重要随机模型受到了人们的广泛关注,这就是所谓的平稳模型。这类模型假设随机过程在一个不变的均值附近保持平衡。其统计规律不会随着时间的推移发生变化。平稳的定义分为严平稳和宽平稳。 定义1(严平稳) 设{},t x t T ∈是一个随机过程,t x 是在不同的时刻t 的随机变

. . 量,在不同的时刻t 是不同的随机变量,任取n 个值1,,n t t K 和任意的实数h ,则1,,n x x K 分布函数满足关系式 1111(,,;,)(,,;,) n n n n n n F x x t t F x x t h t h =++L L L L 则称{},t x t T ∈为严平稳过程。 在实际中,这几乎是不可能的。由此考虑到是否可以把条件放宽,仅仅要求其数字特征(数学期望和协方差)相等。 定义2(宽平稳) 若随机变量{},t x t T ∈的均值(一阶矩)和协方差(二阶矩)

. . 存在,且满足: (1)任取t T ∈,有()t E x c =; (2)任取t T ∈,t T τ+∈,有 [(())(())]()E X t a X t a R ττ-+-= 协方差是时间间隔的函数。则称{},t x t T ∈ 为宽平稳过程,其中()R τ为协方差函数。 2 各种随机时间序列的表现形式

. . 白噪声过程(white noise,如图1)。属于平稳过程。y t = u t, u t~ IID(0, σ2)

. . -3 -2 -1 1 2 3 140160240260 white noise 图1 白噪声序列( 2=1) 随机游走过程(random walk,如图11)。属于非平稳过

时间序列分析第三章平稳时间序列分析

应用时间序列分析实验报告 实验名称第三章平稳时间序列分析 一、上机练习 data example3_1; input x; time=_n_; cards; 0.30 -0.45 0.036 0.00 0.17 0.45 2.15 4.42 3.48 2.99 1.74 2.40 0.11 0.96 0.21 -0.10 -1.27 -1.45 -1.19 -1.47 -1.34 -1.02 -0.27 0.14 -0.07 0.10 -0.15 -0.36 -0.50 -1.93 -1.49 -2.35 -2.28 -0.39 -0.52 -2.24 -3.46 -3.97 -4.60 -3.09 -2.19 -1.21 0.78 0.88 2.07 1.44 1.50 0.29 -0.36 -0.97 -0.30 -0.28 0.80 0.91 1.95 1.77 1.80 0.56 -0.11 0.10 -0.56 -1.34 - 2.47 0.07 -0.69 -1.96 0.04 1.59 0.20 0.39 1.06 -0.39 -0.16 2.07 1.35 1.46 1.50 0.94 -0.08 -0.66 -0.21 -0.77 -0.52 0.05 ; procgplot data=example3_1; plot x*time=1; symbolc=red i=join v=star; run; 建立该数据集,绘制该序列时序图得: 根据所得图像,对序列进行平稳性检验。时序图就是一个平面二维坐标图,通常横轴表示时间,纵

轴表示序列取值。时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。 根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的X围有界的特点。如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。从图上可以看出,数值围绕在0附近随机波动,没有明显或周期,其本可以视为平稳序列,时序图显示该序列波动平稳。 procarima data=example3_1; identifyvar=x nlag=8; run; 图一 图二样本自相关图 图三样本逆自相关图

平稳时间序列模型及其特征

第一章平稳时间序列模型及其特征 第一节模型类型及其表示 一、自回归模型(AR) 由于经济系统惯性的作用,经济时间序列往往存在着前后依存关系。最简单的一种前后依存关系就是变量当前的取值主要与其前一时期的取值状况有关。用数学模型来描述这种关系就是如下的一阶自回归模型: X t=φX t-1+εt(2.1.1)常记作AR(1)。其中{X t}为零均值(即已中心化处理)平稳序列,φ为X t对X t-1的依赖程度,εt为随机扰动项序列(外部冲击)。 如果X t 与过去时期直到X t-p的取值相关,则需要使用包含X t- X t-p在内的p阶自回归模型来加以刻画。P阶自回归模型的一1 ,…… 般形式为: X t=φ1 X t-1+φ2 X t-2+…+φp X t-p+εt(2.1.2)为了简便运算和行文方便,我们引入滞后算子来简记模型。设B 为滞后算子,即BX t=X t-1, 则B(B k-1X t)=B k X t=X t-k B(C)=C(C为常数)。利用这些记号,(2.1.2)式可化为: X t=φ1BX t+φ2B2X t+φ3B3X t+……+φp B p X t+εt 从而有: (1-φ1B-φ2B2-……-φp B p)X t=εt 记算子多项式φ(B)=(1-φ1B-φ2B2-……-φp B P),则模型可以表

示成 φ(B)X t=εt (2.1.3) 例如,二阶自回归模型X t=0.7X t-1+0.3X t-2+0.3X t-3+εt可写成(1-0.7B-0.3B2)X t=εt 二、滑动平均模型(MA) 有时,序列X t的记忆是关于过去外部冲击值的记忆,在这种情况下,X t可以表示成过去冲击值和现在冲击值的线性组合,即 X t=εt-θ1εt-1-θ2εt-2-……-θqεt-q (2.1.4) 此模型常称为序列X t的滑动平均模型,记为MA(q),其中q为滑动平均的阶数,θ1,θ2…θq为参滑动平均的权数。相应的序列X t称为滑动平均序列。 使用滞后算子记号,(2.1.4)可写成 X t=(1-θ1B-θ2B2-……- θq B q)q t=θ(B)εt (2.1.5) 三、自回归滑动平均模型 如果序列{X t}的当前值不仅与自身的过去值有关,而且还与其以前进入系统的外部冲击存在一定依存关系,则在用模型刻画这种动态特征时,模型中既包括自身的滞后项,也包括过去的外部冲击,这种模型叫做自回归滑动平均模型,其一般结构为: X t=φ1X t-1+φ2X t-2+……+φp X t-p+εt-θ1εt-1-θ2εt-2-……-θqεt-q (2.1.6) 简记为ARMA(p, q)。利用滞后算子,此模型可写为 φ(B)X t=θ(B)εt(2.1.7)

时间序列分析与建模简介

第五章时间序列分析与建模简介 时间序列建模( Modelling viatime series )。时间序列分析与建模是数理统计的重要分支,其主要学术贡献人是Box和Jenkins。本章扼要介绍吴宪民和Pandit的工作,仅要求一般了解当前时间序列分析与建模的一些主要结果。参考书:“时间序列及系统分析与应用(美)吴宪民,机械工业出版社(1988)TP13/66。 引言 根据对系统观测得出的按照时间顺序排列的数据,通过曲线拟合和参数估计或者谱分析,建立数学模型的理论与方法,理论基础是数理统计。有时域和频域两类建模方法,这里概括介绍时域方法,即基于曲线拟合与参数估计(如最小二乘法)的方法。常用于经济系统建模(如市场预测、经济规划)、气象与水文预报、环境与地震信号处理和天文等学科的信号处理等等。 §5—1 ARMA模型分析 一、模型类 把具有相关性的观测数据组成的时间序列{x k }视为以正态同分布白噪声序列{ a k }为输入的动态系统的输出。用差分模型ARMA (n,m) 为Φ(z-1)xk= θ(z-1)a k式

(5-1-1) 其中:Φ (z -1) = 1- φ1 z -1-…- φn z-n θ (z -1) = 1- θ1 z -1-…- θm z-m 离散传函 式(5-1-2) 为与参考书符号一致,以下用B表示时间后移算子 即: B xk = x k -1 B即z -1,B 2即z -2… Φ (B)=0的根为系统的极点,若全部落在单位园内则系统稳定;θ(B)=0的根为系统的零点,若全部在单位园内则系统逆稳定。 二、关于格林函数和时间序列的稳定性 1.格林函数Gi 格林函数G i 用以把x t 表示成a t 及at 既往值的线性组合。 式(5-1-3) G I 可以由下式用长除法求得: 例1.A R(1): xt - φ1x t-1 = a t x B B B a B B a a t t t j t j j ==-=+++=-=∞∑θφφφφφ()()()1111112210 )()()(111---=z z z G φθ∑∞=-=0j j t j t a G x

平稳时间序列预测法

7 平稳时间序列预测法 7.1 概述 7.2 时间序列的自相关分析 7.3 单位根检验和协整检验 7.4 ARMA模型的建模 回总目录 7.1 概述 时间序列取自某一个随机过程,则称: 一、平稳时间序列 过程是平稳的――随机过程的随机特征不随时间变化而变化过程是非平稳的――随机过程的随机特征随时间变化而变化回总目录 回本章目录 宽平稳时间序列的定义: 设时间序列 ,对于任意的t,k和m,满足: 则称宽平稳。 回总目录

回本章目录 Box-Jenkins方法是一种理论较为完善的统计预测方法。 他们的工作为实际工作者提供了对时间序列进行分析、预测,以及对ARMA模型识别、估计和诊断的系统方 法。使ARMA模型的建立有了一套完整、正规、结构 化的建模方法,并且具有统计上的完善性和牢固的理 论基础。 ARMA模型是描述平稳随机序列的最常用的一种模型; 回总目录 回本章目录 ARMA模型三种基本形式: 自回归模型(AR:Auto-regressive); 移动平均模型(MA:Moving-Average); 混合模型(ARMA:Auto-regressive Moving-Average)。回总目录 回本章目录 如果时间序列满足 其中是独立同分布的随机变量序列,且满足:

则称时间序列服从p阶自回归模型。 二、自回归模型 回总目录 回本章目录 自回归模型的平稳条件: 滞后算子多项式 的根均在单位圆外,即 的根大于1。 回总目录 回本章目录 如果时间序列满足 则称时间序列服从q阶移动平均模型。或者记为。 平稳条件:任何条件下都平稳。

三、移动平均模型MA(q) 回总目录 回本章目录 四、ARMA(p,q)模型 如果时间序列 满足: 则称时间序列服从(p,q)阶自回归移动平均模型。 或者记为: 回总目录 回本章目录 q=0,模型即为AR(p); p=0,模型即为MA(q)。 ARMA(p,q)模型特殊情况: 回总目录 回本章目录 例题分析 设 ,其中A与B 为两个独立的零均值随机变量,方差为1;

典型时间序列模型分析

实验1 典型时间序列模型分析 1、实验目的 熟悉三种典型的时间序列模型:AR 模型,MA 模型与ARMA 模型,学会运用Matlab 工具对对上述三种模型进行统计特性分析,通过对2 阶模型的仿真分析,探讨几种模型的适用范围,并且通过实验分析理论分析与实验结果之间的差异。 2、实验原理 AR 模型分析: 设有 AR(2)模型, X(n)=-0.3X(n-1)-0.5X(n-2)+W(n) 其中:W(n)是零均值正态白噪声,方差为4。 (1)用MA TLAB 模拟产生X(n)的500 观测点的样本函数,并绘出波形 (2)用产生的500 个观测点估计X(n)的均值和方差 (3)画出理论的功率谱 (4)估计X(n)的相关函数和功率谱 【分析】给定二阶的AR 过程,可以用递推公式得出最终的输出序列。或者按照一个白噪声 通过线性系统的方式得到,这个系统的传递函数为: 1 2 1 ()10.30.5H z z z --= ++ 这是一个全极点的滤波器,具有无限长的冲激响应。 对于功率谱,可以这样得到, ()() 2 2 12 12exp 11x w z jw P w a z a z σ--==++ 可以看出, () x P w 完全由两个极点位置决定。 对于 AR 模型的自相关函数,有下面的公式: 这称为 Yule-Walker 方程,当相关长度大于p 时,由递推式求出: 这样,就可以求出理论的 AR 模型的自相关序列。

1.产生样本函数,并画出波形 2.题目中的AR 过程相当于一个零均值正态白噪声通过线性系统后的输出,可以按照上面的方法进行描述。 clear all; b=[1]; a=[1 0.3 0.5]; % 由描述的差分方程,得到系统传递函数 h=impz(b,a,20); % 得到系统的单位冲激函数,在20 点处已经可以认为值是0 randn('state',0); w=normrnd(0,2,1,500); % 产生题设的白噪声随机序列,标准差为2 x=filter(b,a,w); % 通过线形系统,得到输出就是题目中要求的2 阶AR 过程 plot(x,'r'); ylabel('x(n)'); title('邹先雄——产生的AR 随机序列'); grid on; 得到的输出序列波形为: 2.估计均值和方差 可以首先计算出理论输出的均值和方差,得到 x m ,对于方差可以先求出理论自相 关输出,然后取零点的值。

SAS分析非平稳时间序列

运用SAS对谷物产量进行分析 一、摘要 利用SAS软件(程序见附录)判断谷物产量数据为平稳序列且为非白噪声序列,然后先后通过模型的识别、参数的估计、模型的优化、残差白噪声检验,确定AR(1)模型拟合时间序列显著有效。由于时间序列之间的相关关系,且历史数据对未来数据有一定的影响,对未来5期的谷物生产量进行预测。 二、理论准备 首先判断序列的随机性和平稳性。通过随机性检验,判断该序列是否为白噪声序列,如果是白噪声序列,就认为该随机事件没有包含任何值得提取的有用信息,我们就应该终止分析。通过平稳性检验,序列可以分为平稳序列和非平稳序列。如果序列平稳,通过相关计算进行模型拟合,并利用过去行为对将来行为进行预测,达到预测效果。如果序列为非平稳,再确定模型为非平稳序列中四大类模型中的哪种种模型或者几种模型对序列的综合影响,通过把序列转化为平稳序列,再进一步分析。 三、数据选取 本实验采用某地区连续74年的谷物产量(单位:千吨),如下所示: 0.97 0.45 1.61 1.26 1.37 1.43 1.32 1.23 0.84 0.89 1.18 1.33 1.21 0.98 0.91 0.61 1.23 0.97 1.10 0.74 0.80 0.81 0.80 0.60 0.59 0.63 0.87 0.36 0.81 0.91 0.77 0.96 0.93 0.95 0.65 0.98 0.70 0.86 1.32 0.88 0.68 0.78 1.25 0.79 1.19 0.69 0.92 0.86 0.86 0.85 0.90 0.54 0.32 1.40 1.14 0.69 0.91 0.68 0.57 0.94 0.35 0.39 0.45 0.99 0.84 0.62 0.85 0.73 0.66 0.76 0.63 0.32 0.17 0.46 四、数据进行平稳性与纯随机性的检验与判别 (一)序列的纯随机性检验 图1序列延迟6阶LB检验结果 序列纯随机性检验结果显示延迟6阶LB检验统计量的P值小于1%的显著性水平0.0001,说明序列之间蕴含着很强的相关信息,即该序列是非随机性序列,为非白噪声。

第三章平稳时间序列分析

t P p t t t t t x B x x B x Bx x ===---M 221第3章 平稳时间序列分析 一个序列经过预处理被识别为平稳非白噪声序列,那就说明该序列是一个蕴含着相关信息的平稳序列。 3.1 方法性工具 3.1.1 差分运算 一、p 阶差分 记 t x ?为t x 的1阶差分:1--=?t t t x x x 记t x 2 ?为t x 的2阶差分:21122---+-=?-?=?t t t t t t x x x x x x 以此类推:记 t p x ?为t x 的p 阶差分:111---?-?=?t p t p t p x x x 二、k 步差分 记t k x ?为t x 的k 步差分:k t t t k x x x --=? 3.1.2 延迟算子 一、定义 延迟算子相当与一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻。记B 为延迟算子,有 延迟算子的性质: 1. 10 =B 2.若c 为任一常数,有1 )()(-?=?=?t t t x c x B c x c B 3.对任意俩个序列{t x }和{t y },有11)(--±=±t t t t y x y x B 4. n t t n x x B -= 5.)!(!!,)1()1(0 i n i n C B C B i n i i n n i i n -= -=-∑=其中 二、用延迟算子表示差分运算 1、p 阶差分 t p t p x B x )1(-=? 2、k 步差分 t k k t t t k x B x x x )1(-=-=?- 3.2 ARMA 模型的性质 3.2.1 AR 模型 定义 具有如下结构的模型称为p 阶自回归模型,简记为AR(p): t s Ex t s E Var E x x x x t s t s t t p t p t p t t t πΛ?=≠===≠+++++=---,0,0)(,)(,0)(,0222110εεεσεεφεφφφφε (3.4) AR(p)模型有三个限制条件: 条件一: ≠p φ。这个限制条件保证了模型的最高阶数为p 。 条件二: t s E Var E t s t t ≠===,0)(,)(,0)(2εεσεεε。这个限制条件实际上是要求随机干扰序列 }{t ε为 零均值白噪声序列。 条件三:t s Ex t s π?=,0ε。这个限制条件说明当期的随机干扰与过去的序列值无关。 通常把AR(p)模型简记为: t p t p t t t x x x x εφφφφ+++++=---Λ22110 (3.5)

平稳时间序列的ARMA模型

第五讲(续) 平稳时间序列的 ARMA模型1 平稳性

有一类描述时间序列的重要随机模型受到了人们的广泛关注,这就是所谓的平稳模型。这类模型假设随机过程在一个不变的均值附近保持平衡。其统计规律不会随着时间的推移发生变化。平稳的定义分为严平稳和宽平稳。 定义1(严平稳) 设{},t x t T ∈是一个随机过程,t x 是在不同的时刻t 的随机变量,在不同的时刻t 是不同的随机变量,任取n 个值1,,n t t K 和任意的实数h ,则1,,n x x K 分布函数满足关系式 1111(,,;,)(,,;,)n n n n n n F x x t t F x x t h t h =++L L L L

则称{},t x t T ∈为严平稳过程。 在实际中,这几乎是不可能的。由此考虑到是否可以把条件放宽,仅仅要求其数字特征(数学期望和协方差)相等。 定义2(宽平稳) 若随机变量{},t x t T ∈的均值(一阶矩)和协方差(二阶矩)存在,且满足: (1)任取t T ∈,有()t E x c =; (2)任取t T ∈,t T τ+∈,有 [(())(())]()E X t a X t a R ττ-+-=

协方差是时间间隔的函数。则称{},t x t T ∈ 为宽平稳过程,其中()R τ为协方差函数。 2 各种随机时间序列的表现形式 白噪声过程(white noise ,如图 1 )。属于平稳过程。y t = u t , u t IID(0, 2 )

图1 白噪声序列(2=1) 随机游走过程(random walk,如图11)。属于非平稳过程。y t = y t-1 + u t, u t IID(0, 2) 图2 随机游走序列(2=1) 图3 日元兑美元差分序列

非平稳时间序列

第七章非平稳时间序列 时间序列数据被广泛地运用于计量经济研究。经典时间序列分析和回归分析有许多假定前提,如序列的平稳性、正态性等,,如果直接将经济变量的时间序列数据用于建模分析,实际上隐含了这些假定。在这些假定成立的条件下,进行的t检验、F检验与2 等检验才具有较高的可靠度。但是,越来越多的经验证据表明,经济分析中所涉及的大多数时间序列是非平稳的。那末,如果直接将非平稳时间序列当作平稳时间序列来进行分析,会造成什么不良后果?如何判断一个时间序列是否为平稳序列?当我们在计量经济分析中涉及到非平稳时间序列时,应作如何处理呢?这就是本章要讨论的基本内容。 第一节伪回归问题 经典计量经济学建模过程中,通常假定经济时间序列是平稳的,而且主要以某种经济理论或对某种经济行为的认识来确立计量经济模型的理论关系形式,借此形式进行数据收集、参数估计以及模型检验,这是20世纪70年代以前计量经济学的主导方法。然而,这种方法所构建的计量经济模型在20世纪70年代出现石油危机后引起的经济动荡面前却失灵了。这里的失灵不是指这些模型没能预见石油危机的出现,而是指这些模型无法预计石油危机的振荡对许多基本经济变量的动态影响。因此引起了计量经济学界对经典计量经济学方法论的反思,并将研究的注意力转向宏观经济变量非平稳性对建模的影响。人们发现,由于经济分析中所涉及的经济变量数据基本上是时间序列数据,而大多数经济时间序列是非平稳的,如果直接将非平稳时间序列当作平稳时间序列进行回归分析,则可能会带来不良后果,如伪回归问题。 所谓“伪回归”,是指变量间本来不存在有意义的关系,但回归结果却得出存在有意义关系的错误结论。经济学家早就发现经济变量之间可能会存在伪回归现象,但在什么条件下会产生伪回归现象,长期以来无统一认识。直到20世纪70年代,Grange、Newbold研究发现,造成“伪回归”的根本原因在于时间序列变量的非平稳性。他们用Monte Carlo模拟方法研究表明,如果用传统回归分

平稳时间序列模型及其特征

平稳时间序列模型及其特征 第一章平稳时间序列模型及其特征 第一节模型类型及其表示一、自回归模型(AR 由于经济系统惯性的作用,经济时间序列往往存在着前后依存关系。最简单的一种前后依存关系就是变量当前的取值主要与其前一时期的取值状况有关。用数学模型来描述这种关系就是如下的一阶自回归模型: X t=? X-1 + £ t (2.1.1 )常记作AR(1)。其中{X t}为零均值(即已中心化处理)平稳序列,?为X t对X -1的依赖程度,£ t为随机扰动项序列(外部冲击)。 如果X t与过去时期直到X t-p的取值相关,则需要使用包含X t i ,……X-p 在内的p阶自回归模型来加以刻画。P阶自回归模型的一般形式为:X=? i X t-1+? 2 X t-2+ -------- ? p X t-p+ £ t (2.1.2 )为了简便运算和行文方便,我们引入滞后算子来简记模型。设 B 为滞后算子,即BX=X-1,则B(B k-1X)二B k X二X-k B(C)=C(C 为常数)。利

用这些记号,(2.1.2 )式可化为: X t= ? 1BX+ ? 2BX+ ? 3B‘X +.... +? P BX+£ t 从而有: (1- ? 1B- ? 启- ... -? P B) X t = £ t 记算子多项式?( B) = ( 1- ? 1B- ? 2B- ........... - ? p B),则模型可以表示成 ?( B) X=£ t (2.1.3) 例如,二阶自回归模型X=0.7X t「+0.3X t-2 +0.3X t-3 + £ t可写成 (1-0.7B-0.3B 2) X= £ t 二、滑动平均模型(MA 有时,序列X的记忆是关于过去外部冲击值的记忆,在这种情况下,X可以表示成过去冲击值和现在冲击值的线性组合,即 X = £t- 0 1 £t-1 - 0 2 £t-2 - .............................. - 0 q £t-q (2.1.4) 此模型常称为序列X的滑动平均模型,记为MA(q),其中q为滑动平均的阶数,0 1, 0 2…0 q为参滑动平均的权数。相应的序列X t称为滑动平均序列。 使用滞后算子记号,(2.1.4 )可写成 X t= (1- 0 1B- 0 2W-……-0 q£) q t=0 (B) £t (2.1.5) 三、自回归滑动平均模型 如果序列{X}的当前值不仅与自身的过去值有关,而且还与其以

非平稳时间序列的建模研究

(申请理学硕士学位论文) 非平稳时间序列的建模方法研究 培养单位 :理学院 学科专业 :应用数学 研 究 生 :林 卉 指导教师 :童恒庆 教授 2005年5月 非 平 稳 时 间 序 列 的 建 模 方 法 研 究 林 卉 武 汉 理 工 大 学

分类号密级 UDC 学校代码 10497 学位论文 题目非平稳时间序列的建模方法研究 英文The Research on the Method of the Modeling 题目of Nonstationary Time Series 研究生姓名林 卉 姓名童恒庆职称教授学位博士 指导教师 单位名称理学院邮编 430070 申请学位级别硕士学科专业名称应用数学 论文提交日期 2005年5月论文答辩日期 2005年6月学位授予单位武汉理工大学日期 答辩委员会主席评阅人 2005年5月

武汉理工大学硕士学位论文 中文摘要 时间序列分析是概率统计学中一个内容十分丰富的重要分支,近年来它在理论与应用两方面都得到了蓬勃发展。时间序列分析按时间序列的统计特性可以分为平稳时间序列和非平稳时间序列两类。在实际问题中,我们经常遇到的序列,特别是反映社会、经济现象的序列,大多数并不平稳,并且呈现出明显的趋势性或周期性,因此研究非平稳时间序列的建模具有很重要的现实意义。本文的重点是对非平稳时间序列的建模方法进行研究。 首先,本文介绍非平稳时间序列的一些传统的建模方法,主要对ARIMA模型法、季节性模型法、X-11法、回归方法、灰色模型法等方法加以研究分析。 然后,本文对非平稳时间序列的状态空间建模方法进行重点研究,主要有如下的研究工作: (1)在建模方面,参照Kitagawa和顾岚教授关于时间序列状态空间建模思路,把非平稳时间序列趋势项、循环项和季节项这三项分别建立非平稳时间序列趋势项状态空间模型、非平稳时间序列循环项状态空间模型和非平稳时间序列季节项状态空间模型,最后建立非平稳时间序列的总体的状态空间模型。 (2)在状态估计方面,介绍卡尔曼滤波递推公式的理论依据,采用卡尔曼滤波与固定区间平滑融为一体的算法,对状态空间模型中的状态向量及其误差方差阵进行估计,并用Matlab编写出相应的程序。 (3)介绍改进的EM算法,对改进的EM算法的收敛性给出证明。 (4)在参数估计方面,提出采用卡尔曼滤波、固定区间平滑以及改进的EM 算法融为一体的方法进行估计。 (5)把传统的ARIMA建模方法和本文介绍的状态空间建模方法分别用于我国第三产业总值的预测中,比较两种模型的预测效果。用实例验证使用卡尔曼滤波与固定区间平滑相结合的算法优于单独使用卡尔曼滤波,以及卡尔曼滤波、卡尔曼滤波与固定区间平滑相结合的算法都具有算法稳定性。 关键词:非平稳时间序列,ARIMA模型,状态空间模型 . I

第七章 非平稳时间序列模型

引言:前面我们讨论的是平稳时间序列的建模和预测方法,即所讨论的时间序列都是宽平稳的。一个宽平稳的时间序列的均值和方差都是常数,并且它的协方差有时间上的不变性。 但是许多经济领域产生的时间序列都是非平稳的。对协方差过程,非平稳时间序列会出现各种情形,如它们具有非常数的均值μt ,或非常数的二阶矩,如非常方差σt 2,或同时具有这两种情形的非平稳序列。 第七章非平稳时间序列模型

第七章非平稳时间序列模型 第一节非平稳时间序列模型的种类 第二节非平稳性的检验 第三节求和自回归滑动平均模型(ARIMA)

第一节非平稳时间序列模型的种类 一、均值非平稳过程 二、方差和自协方差非平稳过程

一、均值非平稳过程 均值非平稳过程指随机过程的均值随均值函数的变化而变化。 我们可以引进两种非常有用的均值非平稳过程:确定趋势模型和随机趋势模型。

(一)确定趋势模型 当非平稳过程均值函数可由一个特定的时间趋势表示时,一个标准的回归模型曲线可用来描述这种现象。 . ,::,,1010模型来描述前面介绍的可以用程是一个零均值的平稳过其中趋势模型表示如下则原序列可用确定的有服从线性趋势若均值例如ARMA y y t x t t t t t t ++=+=ααααμμ

t t t y t t x t t +++=++=22102210: ,ααααααμ原序列可用下式表示对二次均值函数此外,均值函数还可能是指数函数、 正弦—余弦波函数等,这些模型都可 以通过标准的回归分析处理。 处理方法是先拟合出μt 的具体形式, 然后对残差序列y t ={x t -μt }按平稳 过程进行分析和建模。

平稳时间序列分析

t P p t t t t t x B x x B x Bx x ===---M 221第3章 平稳时间序列分析 一个序列经过预处理被识别为平稳非白噪声序列,那就说明该序列是一个蕴含着相关信息的平稳序列。 方法性工具 差分运算 一、p 阶差分 记t x ?为t x 的1阶差分:1--=?t t t x x x 记t x 2 ? 为t x 的2阶差分:21122---+-=?-?=?t t t t t t x x x x x x 以此类推:记t p x ?为t x 的p 阶差分:111---?-?=?t p t p t p x x x 二、k 步差分 记t k x ?为t x 的k 步差分:k t t t k x x x --=? 延迟算子 一、定义 延迟算子相当与一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻。记B 为延迟算子,有 延迟算子的性质: 1.10 =B 2.若c 为任一常数,有1)()(-?=?=?t t t x c x B c x c B 3.对任意俩个序列{t x }和{t y },有11)(--±=±t t t t y x y x B 4.n t t n x x B -= 5.)! (!! ,)1()1(0 i n i n C B C B i n i i n n i i n -= -=-∑=其中 二、用延迟算子表示差分运算 1、p 阶差分 2、k 步差分 ARMA 模型的性质 AR 模型 定义 具有如下结构的模型称为p 阶自回归模型,简记为AR(p): t s Ex t s E Var E x x x x t s t s t t p t p t p t t t πΛ?=≠===≠+++++=---,0,0)(,)(,0)(,0222110εεεσεεφεφφφφε AR(p)模型有三个限制条件: 条件一:0≠p φ。这个限制条件保证了模型的最高阶数为p 。

时间序列分析实验平稳性

时间序列数据平稳性检验实验指导 一、实验目的: 理解经济时间序列存在的不平稳性,掌握对时间序列平稳性检验的步骤和各种方法,认识利用不平稳的序列进行建模所造成的影响。 二、基本概念: 如果一个随机过程的均值和方差在时间过程上都是常数,并且在任何两时期的协方差值仅依赖于该两个时期间的间隔,而不依赖于计算这个协方差的实际时间,就称它是宽平稳的。 时序图 ADF检验 PP检验 三、实验内容及要求: 1、实验内容: 用Eviews5.1来分析1964年到1999年中国纱产量的时间序列,主要内容: (1)、通过时序图看时间序列的平稳性,这个方法很直观,但比较粗糙; (2)、通过计算序列的自相关和偏自相关系数,根据平稳时间序列的性质观察其平稳性;(3)、进行纯随机性检验; (4)、平稳性的ADF检验; (5)、平稳性的pp检验。 2、实验要求: (1)理解不平稳的含义和影响; (2)熟悉对序列平稳化处理的各种方法; (2)对相应过程会熟练软件操作,对软件分析结果进行分析。 四、实验指导 (1)、绘制时间序列图 时序图可以大致看出序列的平稳性,平稳序列的时序图应该显示出序列始终围绕一个常数值波动,且波动的范围不大。如果观察序列的时序图显示出该序列有明显的趋势或周期,那它通常不是平稳序列,现以1964-1999年中国纱年产量序列(单位:万吨)来说明。 在EVIEWS中建立工作文件,在“Workfile structure type”栏中选择“Dated-regular frequency”,在右边的“Date specification”中输入起始年1964,终止年1999,点击ok则建立了工作文件。找到中国纱年产量序列的excel文件并导入命名该序列为sha,见图1-2。 图1-1 建立工作文件

相关主题
文本预览
相关文档 最新文档