模型定阶
- 格式:doc
- 大小:67.00 KB
- 文档页数:5
⽤python做时间序列预测九:ARIMA模型简介本篇介绍时间序列预测常⽤的ARIMA模型,通过了解本篇内容,将可以使⽤ARIMA预测⼀个时间序列。
什么是ARIMA?ARIMA是'Auto Regressive Integrated Moving Average'的简称。
ARIMA是⼀种基于时间序列历史值和历史值上的预测误差来对当前做预测的模型。
ARIMA整合了⾃回归项AR和滑动平均项MA。
ARIMA可以建模任何存在⼀定规律的⾮季节性时间序列。
如果时间序列具有季节性,则需要使⽤SARIMA(Seasonal ARIMA)建模,后续会介绍。
ARIMA模型参数ARIMA模型有三个超参数:p,d,qpAR(⾃回归)项的阶数。
需要事先设定好,表⽰y的当前值和前p个历史值有关。
d使序列平稳的最⼩差分阶数,⼀般是1阶。
⾮平稳序列可以通过差分来得到平稳序列,但是过度的差分,会导致时间序列失去⾃相关性,从⽽失去使⽤AR项的条件。
qMA(滑动平均)项的阶数。
需要事先设定好,表⽰y的当前值和前q个历史值AR预测误差有关。
实际是⽤历史值上的AR项预测误差来建⽴⼀个类似归回的模型。
ARIMA模型表⽰AR项表⽰⼀个p阶的⾃回归模型可以表⽰如下:c是常数项,εt是随机误差项。
对于⼀个AR(1)模型⽽⾔:当ϕ1=0 时,yt 相当于⽩噪声;当ϕ1=1 并且 c=0 时,yt 相当于随机游⾛模型;当ϕ1=1 并且 c≠0 时,yt 相当于带漂移的随机游⾛模型;当ϕ1<0 时,yt 倾向于在正负值之间上下浮动。
MA项表⽰⼀个q阶的预测误差回归模型可以表⽰如下:c是常数项,εt是随机误差项。
yt 可以看成是历史预测误差的加权移动平均值,q指定了历史预测误差的期数。
完整表⽰即: 被预测变量Yt = 常数+Y的p阶滞后的线性组合 + 预测误差的q阶滞后的线性组合ARIMA模型定阶看图定阶差分阶数d如果时间序列本⾝就是平稳的,就不需要差分,所以此时d=0。
ARIMA模型1.理论ARIMA(自回归综合移动平均):是时间系列分析中最常见的模型,又称Box-Jenkins模型或带差分的自回归移动平均模型。
时间系列的模型确定:时间系列必做步骤:定义日期:点击数据、定义日期(根据数据的时间记录方式,后进行对应的方式定义并填入初始时间):若存在数据缺失:可以采用,该列数据的平均值进行填补或者采用临近的均值:(点击转换、替换缺失值),且需要时间顺序的按一定的顺序进行排序的数据才能进行时间序列的分析。
A.模型初步分析:首先通过分析看数据的模型图情况:(点击分析、时间序列分析、系列图(时间变量需要放入定义后的时间变量))平稳性:时间系列数据可以看作随机过程的一个样本,且根据1.:均值不随时间的变化;2.方差不随时间变化;3.自相关关系只与时间间隔有关而以所处的具体时刻无关。
通常情况下数据在一定的范围内(M±2*SD)波动的话属于平稳,并且如果数据有特别的向下或向上的趋势表明不属于平稳。
B.模型识别与定阶:自相关(ACF)和偏相关操作:(点击分析、时间序列、自相关):自相关系数(如果系数迅速减少的表明属于平稳,系数慢慢的减少说明属于非平稳的),ACF图也可以看出。
判断是否平稳后需要进行差分(平稳化的手段:一般差分、季节性差分)处理:(点击分析、时间系列、自相关(定义好差分介数)):ARIMA模型(p (ACF图:从第几个后进入(2*SD)里表明为几介后),d(差分:做几介差分平稳就填入几),q(PCF图:从第几个后进入(2*SD)里表明为几介后)),拖尾:按指数衰减(呈现正弦波形式),截尾:某一步后为零(迅速降为零)。
平稳化处理后,若偏自相关函数是截尾的,而自相关函数是拖尾的,则建立AR模型;若自相关函数是拖尾的,而偏自相关函数是截尾的,则建立MA模型;若偏自相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。
C.模型估计参数:对识别阶段所给初步模型的参数进行估计及假设检验,并对模型的残差序列做诊断分析,以判断模型的合理性。
20XX级XX专业时间序列分析大作业20XX年X月X日某国1960年第一季度-1993年第四季度GNP平减指数的季度序列分析摘要附录中给出了某国1960年第一季度-1993年第四季度GNP平减指数的季度序列,本文旨在利用时间序列分析并结合Eviews来研究该时间序列,并给出该国GNP平减指数的时间序列方程式,从而对该国的GNP平减指数进行定性分析。
在进行时间序列分析时,先对数据进行平稳性检测,发现这个序列不平稳且具有季节性,故要用差分进行平稳化操作。
经过4阶普通差分,周期为4的季节差分后序列达到平稳。
平稳化后进行模型的识别。
首先要进行模型的识别与定阶,通过平稳后的序列的自相关系数和偏自相关系数图初步判定模型的种类,当模型都可以通过检验时,通过AIC准则进行模型的拟合度检验,模型的AIC值较小的拟合度较高。
拟合度检验后发现AR(4)SAR(4)的模型拟合度最高,故此序列的模型为AR(4)SAR(4)模型。
当模型定阶后,就要对模型参数()12,,Tp ϕϕϕϕ=,()12,,Tq θθθθ=进行估计,这一步可以得到模型表达式。
定阶与参数估计完成后,还要对模型进行检验,即要检验t ε是否为平稳白噪声,这里我们用2χ检验法进行模型检验。
关键字:时间序列分析,Eviews ,乘积季节模型1、平稳性和季节性检测1.1 从序列的时序图可以初步判断样本序列是否平稳:根据平稳时间序列均值、方差为常数的性质,平稳时间序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。
如果观察序列的时序图显示出该序列有明显的趋势性或者周期性,则时间序列通常不是平稳的时间序列。
该时间序列的时序图如下图所示:该时序图存在明显的上升趋势,故可判定该时间序列非平稳。
1.2 从序列的自相关系数和偏自相关系数图判断样本序列是否平稳:样本自相关函数与样本偏相关函数如果是截尾的或者是拖尾的(即被负指数控制的),说明已服从ARMA 模型。
北京工商大学《系统建模与辨识》课程上机实验报告()专业名称:上机题目:离散模型的参数估计及阶次辨识专业班级:学生姓名:学号:指导教师:年月目录目录 (2)第一章实验目的 (3)第二章实验内容 (4)第三章基本最小二乘法 (6)3.1基本最小二乘法原理 (6)3.2基本最小二乘法实验结果 (7)3.3源程序代码 (12)第四章递推广义最小二乘法 (15)4.1递推广义最小二乘法原理 (15)4.2递推广义最小二乘法实验结果 (16)4.3源程序代码 (19)第五章遗忘因子递推最小二乘算法 (21)5.1遗忘因子递推最小二乘算法原理 (21)5.2遗忘因子递推最小二乘算法实验结果 (21)5.3源程序代码 (25)第六章递推随机逼近算法 (29)6.1递推随机逼近算法原理 (29)6.2递推随机逼近算法实验结果 (30)6.3源程序代码 (34)第七章AIC模型定阶 (37)7.1 AIC模型定阶原理 (37)7.2 AIC模型定阶实验结果 (37)7.3源程序代码 (37)第八章实验总结 (41)参考文献 (41)通过实验掌握几种常用的模型参数估计算法和阶次辨识理论,具体的模型参数估计方法包括基本最小二乘法、递推广义最小二乘法(RELS)、衰减因子的递推最小二乘法和递推随机逼近算法,并在实验的基础上总结体会不同辨识方法的适用范围和优缺点。
《过程辨识》书P538实验2 离散模型的参数估计及阶次辨识,选择模拟的是第一个过程,采用基本最小二乘法、递推广义最小二乘法(RELS )、遗忘因子递推最小二乘法和递推随机逼近算法对被辨识系统进行参数估计,采用AIC 进行模型定阶。
1. 系统模拟图如图1所示图 1 系统模拟图 其中()()()()⎪⎪⎩⎪⎪⎨⎧=+-=+=+-=----------1.705.115.0.705.111211211211z D z z z C zz z B z z z A (1-1)输入信号()u k 采用幅值为1的M 序列,其特征多项式由实验者根据具体需要确定;()v k 是均值为零,方差为2v σ服从正态分布的不相关噪声,方差2v σ的大小由信噪比η确定。
ARIMA模型⼀、ARIMA模型介绍ARIMA模型全称为⾃回归积分滑动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),是由博克思(Box)和詹⾦斯(Jenkins)于70年代初提出⼀著名时间序列预测⽅法[1],所以⼜称为box-jenkins模型、博克思-詹⾦斯法。
其中ARIMA(p,d,q)称为差分⾃回归移动平均模型,AR是⾃回归, p为⾃回归项; MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。
所谓ARIMA模型,是指将⾮平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进⾏回归所建⽴的模型。
ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、⾃回归过程(AR)、⾃回归移动平均过程(ARMA)以及ARIMA过程。
ARIMA模型的基本思想是:将预测对象随时间推移⽽形成的数据序列视为⼀个随机序列,⽤⼀定的数学模型来近似描述这个序列。
这个模型⼀旦被识别后就可以从时间序列的过去值及现在值来预测未来值。
⼆、ARIMA模型建模过程1. 检查平稳性平稳性就是围绕着⼀个常数上下波动且波动范围有限,即有常数均值和常数⽅差。
如果有明显的趋势或周期性,那它通常不是平稳序列。
不平稳序列可以通过差分转换为平稳序列。
d阶差分就是相距d期的两个序列值之间相减。
如果⼀个时间序列经过差分运算后具有平稳性,则该序列为差分平稳序列,可以使⽤ARIMA模型进⾏分析。
2、确定模型阶数AIC准则:即最⼩信息准则,同时给出ARMA模型阶数和参数的最佳估计,适⽤于样本数据较少的问题。
⽬的是判断⽬标的发展过程与哪⼀个随机过程最为接近。
因为只有样本量⾜够⼤时,样本的⾃相关函数才⾮常接近原时间序列的⾃相关函数。
具体运⽤时,在规定范围内使模型阶数由低到⾼,分别计算AIC值,最后确定使其值最⼩的阶数,就是模型的合适阶数。
SPSS分析向量自回归V AR模型SPSSAUV AR模型Contents1背景 (2)2理论 (2)3操作 (4)4 SPSSAU输出结果 (5)5文字分析 (5)6剖析 (11)7疑难解惑 (12)在时间序列进行预测时,ARIMA可用于单一变量(比如GDP增长率)的预测,如果需要同时考虑几个变量的预测时(比如GDP增长率、失业率、储蓄率),此时可考虑分别针对研究变量进行,即多次重复进行。
通常情况下同一系统的几个研究变量之间均有着相互依旧关系,因而为更好的利用各变量的此类关系,此时可以使用V AR模型(Vector autoregressive model)进行多变量预测。
V AR模型的构建流程较为复杂,如下图所述:通常情况下,V AR模型需要满足单位根检验,如果没有单位根则直接构建V AR模型即可,如果研究变量有单位根,则说明不适合进行V AR模型构建,但是如果有单位根且满足同阶单整,此时说明V AR模型构建是适合的,与此同时研究变量满足协整关系也是一种常见的前提条件。
V AR模型构建时,通常包括定阶这一步骤,即选择适合的滞后阶数。
V AR模型构建完成后,接着还需要对模型的有效性进行分析,通常是针对AR特征根图进行分析。
另外,理论上V AR模型的残差还满足满足正态性,并且通过自相关检验等,但通常对此类检验的关注度相对较少。
V AR模型构建之后,通常需要进行比如格兰杰困果检验,脉冲响应和方差分析,用于进一步分析研究变量之间的相互作用依存关系情况。
最后,可得到模型的预测数据,满足模型预测目的。
特别提示:如果是使用V AR模型判断平稳性,其为直观图示法,带有一定的主观性,反之使用比如SPSSAU的ADF检验平稳性,二者有可能出现不同的结论。
V AR模型案例Contents1背景 (2)2理论 (2)3操作 (4)4 SPSSAU输出结果 (5)5文字分析 (5)6剖析 (11)7疑难解惑 (12)1背景当前有一项美国宏观联邦基金利率、通货膨胀率和失业率的数据,数据日期从1960年第1季度到2012年第1季度,单位为季度,共计209个数据。
天水师范学院数学与统计学院
实验报告
实验项目名称 平稳时间序列模型的定阶
所属课程名称 《应用时间序列分析》
实 验 类 型 设计型实验
实 验 日 期 4月27日
班 级 09统计一、班
学 号 291050140
姓 名 李志远
成 绩
1
一、实验概述:
【实验目的】
某车站1993~1997年各月的运行行数数量数据共60个,单位:单列.千米.试
对该序列建立合适的时间序列模型。
【实验原理】
常用的模型定阶方法:
1残差方差图定阶法
假设时间序列模型的阶数是有限的,如果我们选用正真阶数的模型,则是一种
不足的拟合,因而剩余平方和和Q必然偏大,残差方差
2ˆas将比正真模型的残差方差2
s
s
大,而这些项对于减小残差方差是有明显贡献的。另一方面,如果阶数已经达到真值,那么再
进一步增加阶数,就是过度拟合,这并不会使2ˆas有显著减小。甚至还略有增加。
2.F检验定阶法
以ARMA模型为例,拟合的较高阶模型是ARMA(n,m)模型,原假设为
0:0,0nm
Hjq==
,ARMA(n,m)模型的的剩余平方和记为Q0.AMMA(n-1,m-1)
模型的剩余平方和记为Q1,则100Q-Q2(2,2)Q(N-n)-(m+n)FFNnm=--,对于给定的显著性水
平a,如果F大于Fa,则H0不成立,模型阶数仍有上升的可能,否则H0成立。
3.准则函数定阶法
(1)AIC准则
2
ˆ
(,)2ln[]2ln()2AICnmlrNr
a
s=-+?+常数
(2)BIC准则2ˆB(,)2ln[L]ln[]ln()ln[]ICnmNrNNras=-+?+常数
【实验环境】
机房 Matable6.5
二、实验内容:
【实验方案】
1. 读入问题所需的数据
2. 模型识别
3. 模型定阶
【实验过程】(实验步骤、记录、数据、分析)
1. 读入数据y=[1196.8 … …]
2. 利用差分法时间序列数据做平稳化处理x=diff(y)
3.模型检验
(1)残差参数系数估计 参数系数估计的标准误差 极大似然值 残差 残差的
标准差
oeff =
Comment: 'Mean: ARMAX(2,1,0); Variance: GARCH(0,0)'
Distribution: 'Gaussian'
2
R: 2
M: 1
C: 0.7711
AR: [-0.1552 0.2821]
MA: -1.0000
VarianceModel: 'GARCH'
K: 1.2539e+003
Errors =
Comment: 'Mean: ARMAX(2,1,0); Variance: GARCH(0,0)'
Distribution: 'Gaussian'
R: 2
M: 1
C: 0.3470
AR: [0.1347 0.1751]
MA: 0.0482
VarianceModel: 'GARCH'
K: 307.3435
(2)F检验定阶
Mean: ARMAX(2,1,0); Variance: GARCH(0,0)
Conditional Probability Distribution: Gaussian
Number of Model Parameters Estimated: 5
Standard T
Parameter Value Error Statistic
----------- ----------- ------------ -----------
C 0.77112 0.34703 2.2221
AR(1) -0.15517 0.13467 -1.1522
AR(2) 0.28209 0.17511 1.6109
MA(1) -1 0.048166 -20.7616
K 1253.9 307.34 4.0798
(3)AIC、BIC准则定阶法
AIC = 596.3411
BIC =604.6513
【实验结论】(结果)
F
水平下没有显著差异,合适的模型阶数为1.
如果取显著性水平a=0.1,则F=2.96>F0.1(1,56).所以在显著性水平a=0.1下,
MA(3)模型与MA(4)模型有显著性差异,模型阶数不能降低,合适的模型阶数为
4.
【实验小结】(收获体会)
本节所介绍的几种定阶方法用于判断单纯的AR或MA模型的阶次还是比较有效
的,但是要判断混合的ARMA模型阶次却不大方便。1984年Tiao和Tsay提出了一
种可同时鉴定平稳的ARMA模型和非平稳的ARIMA模型阶数的延伸自相关函数方法。
有兴趣的读者可以参阅相关文献。
3
三、指导教师评语及成绩:
评 语
评语等级
优 良 中 及格 不及格
1.实验报告按时完成,字迹清楚,文字叙述流畅,逻辑性强
2.实验方案设计合理
3.实验过程(实验步骤详细,记录完整,数据合理,分析透彻)
4实验结论正确.
成 绩:
指导教师签名:
批阅日期:
附录1:源 程 序
y=[1196.8 … …]
length(y);
x=diff(y);
spec =garchset('P',0,'Q',0,'R',2,'M',1);
[Coeff, Errors, LLF, Innovations, Sigma, Summary] = garchfit(spec,x)%参数系数估计
参数系数估计的标准误差 极大似然值 残差 残差的标准差
garchdisp(Coeff, Errors)%可以展示估计系数的值 标准误差和相应的检验t值
NumParams=garchcount(Coeff);%提取估计的系数个数
sigma2=(Sigma(10))^2;%残差方差,这里实际上Sigma是常数数列, 取第几个求平方
都可以
ssr=sum((Innovations).^2)%残差平方和或剩余平方和
[AIC, BIC] = aicbic(LLF, NumParams-1, length(x))%这里NumParams减去1是异方
差模型中的常数项C
H,pValue,Qstat,CriticalValue] = lbqtest(Innovations-mean(Innovations),[6 12
15]',0.05)%进行P102页的卡方检验 H=0表明残差序列不具有相关性,模型合适
附录2:实验报告填写说明
1.实验项目名称:要求与实验教学大纲一致。
2.实验目的:目的要明确,要抓住重点,符合实验教学大纲要求。
3.实验原理:简要说明本实验项目所涉及的理论知识。
4.实验环境:实验用的软、硬件环境。
5.实验方案(思路、步骤和方法等):这是实验报告极其重要的内容。概括整个实验过程。
4
对于验证性实验,要写明依据何种原理、操作方法进行实验,要写明需要经过哪几个步
骤来实现其操作。对于设计性和综合性实验,在上述内容基础上还应该画出流程图、设
计思路和设计方法,再配以相应的文字说明。对于创新性实验,应注明其创新点、特色。
6.实验过程(实验中涉及的记录、数据、分析):写明具体实验方案的具体实施步骤,包
括实验过程中的记录、数据和相应的分析。
7.实验结论(结果):根据实验过程中得到的结果,做出结论。
8.实验小结:本次实验心得体会、思考和建议。
9.指导教师评语及成绩:指导教师依据学生的实际报告内容,给出本次实验报告的评价。