时间序列分析第三章平稳时间序列分析
- 格式:doc
- 大小:618.00 KB
- 文档页数:17
第 3章 安稳时间序列剖析一个序列经过预办理被辨别为安稳非白噪声序列,那就说明该序列是一个包含着有关信息的安稳序列。
3.1 方法性工具 3.1.1 差分运算 一、 p 阶差分记x t 为 x t 的 1 阶差分:x t x t x t 1记2x t 为 x t 的 2 阶差分:2x tx tx t 1xt2x t 1xt 2以此类推:记 px t 为 x t 的 p 阶差分:px tp 1x tp 1x t 1二、 k 步差分记 k xt 为 x t 的 k 步差分: kxtx t x t k延缓算子一、定义延缓算子相当与一个时间指针,目前序列值乘以一个延缓算子,就相当于把目前序列值的时间向过去拨了一个时辰。
记 B 为延缓算子,有x t 1 Bx t x t 2 B 2x tx t pB P x t二、用延缓算子表示差分运算 1、 p 阶差分 2 、 k 步差分 3.2ARMA 模型的性质AR 模型延缓算子的性质:1. B 0 12. 若 c 为任一常数,有 B(c x t ) c B( x t ) c x t 13. 对随意俩个序列 { x t } 和 { y t } ,有 B( x ty t )x t 1yt 14. Bnx t x t nnn! 5. (1 B)n( 1) i C n i B i ,此中 C n ii 0i!( n i )!定义拥有以下构造的模型称为p 阶自回归模型,简记为AR(p):xt 0 1xt 1 2xt 2pxt p tp0, E( t ) 0,Var ( t )2, E( s t ) 0, s tEx s t0, s t(3.4)AR(p) 模型有三个限制条件:条件一:p0 。
这个限制条件保证了模型的最高阶数为p 。
条件二: E( t ) 0,Var ( t )2, E( s t ) 0, s t 。
这个限制条件其实是要求随机扰乱序列{ t } 为零均值白噪声序列。
注:图中,S号代表序列的观察值;连续曲线代表拟合序列曲线;虚线代表拟合序列的95%上下置信限。
所谓预测就是要利用序列以观察到的样本值对序列在未来某个时刻的取值进行估计。
目前对平稳序列最常用的预测方法是线性最小方差预测。
线性是指预测值为观察值序列的线性函数,最小方差是指预测方差达到最小。
在预测图上可以看到,数据围绕一个范围内波动,即说明未来的数值变化时平稳的。
二、课后习题第十七题:根据某城市过去63年中每年降雪量数据(单位:mm)得:(书本P94)程序:data example17_1;input x@@;time=_n_;cards;2579588397 110;proc gplot data=example17_1;plot x*time=1;symbol c=red i=join v=star;run;proc arima data=example17_1;identify var=x nlag=15minic p= (0:5) q=(0:5);run;estimate p=1;run;estimate p=1 noin;run;forecast lead=5id=time out=results;run;proc gplot data=results;plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay;symbol1c=black i=none v=start;symbol2c=red i=join v=none;symbol3c=green i=join v=none l=32;run;(1)判断该序列的平稳性与纯随机性该序列的时序图如下(图a)图a由时序图显示过去63年中每年降雪量数据围绕早70mm附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图b)图b时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
线性平稳时间序列分析线性平稳时间序列分析是一种重要的时间序列分析方法,用于研究随时间变化的数据。
它基于一个核心假设,即数据的均值和方差在随时间推移的过程中保持不变。
线性平稳时间序列可以用数学模型来描述,通常使用自回归(AR)模型、滑动平均(MA)模型或自回归滑动平均(ARMA)模型。
这些模型基于该系列在某一时间点的值与该系列在过去时间点的值之间的线性关系。
为了进行线性平稳时间序列分析,首先需要检验数据是否满足平稳性的假设。
常用的检验方法包括ADF检验和单位根检验。
若数据不满足平稳性的假设,则需要通过差分操作将其转化为平稳时间序列。
在得到平稳的时间序列后,可以使用最小二乘法对时间序列进行模型拟合。
通过对数据进行模型拟合,我们可以得到模型的系数以及误差项的信息。
利用这些信息,可以进行时间序列的预测和分析。
在预测方面,线性平稳时间序列分析可以利用过去的观测值来预测未来的值。
预测方法包括简单的移动平均法和指数平滑法,以及更复杂的AR、MA和ARMA模型。
在分析时间序列方面,线性平稳时间序列分析可以通过模型的系数和误差项的信息来揭示数据的特征和规律。
例如,可以用模型的系数来检验是否存在滞后效应,用误差项的信息来检验模型的拟合程度。
总之,线性平稳时间序列分析是一种重要的时间序列分析方法,可以帮助我们研究随时间变化的数据。
通过对数据进行模型拟合、预测和分析,我们可以揭示数据的特征和规律,从而提供决策支持和预测能力。
线性平稳时间序列分析是一种重要的时间序列分析方法,它广泛应用于经济学、金融学、工程学等领域。
该方法基于数据的均值和方差在时间推移过程中保持不变的假设,旨在研究随时间变化的数据及其内在规律,以便进行预测、决策支持和其他分析。
在线性平稳时间序列分析中,首先需要检验数据是否符合平稳性的假设。
平稳性是指数据的均值和方差不随时间变化而发生显著变化。
为了检验平稳性,在实际应用中常常使用单位根检验或ADF检验等方法。
第3章平稳时间序列分析本章教学内容与要求:了解时间序列分析的方法性工具;理解并掌握ARMA 模型的性质;掌握时间序列建模的方法步骤及预测;能够利用软件进行模型的识别、参数的估计以及序列的建模与预测。
本章教学重点与难点:利用软件进行模型的识别、参数的估计以及序列的建模与预测。
型来息。
t x 为t x 的1阶差分: ▽1t t t x x x --=对1阶差分后的序列再进行一次1阶差分运算称为2阶差分,记▽2tx 为t x 的2阶差分:▽2t x =▽t x -▽1-t x以此类推,对p-1阶差分厚序列再进行一次1阶差分运算称为p 阶差分。
记▽p t x 为t x 的p 阶差分:▽p t x =▽p-1t x -▽p-11-t x (二)k 步差分kt x 为t x 的10,,1t = 10,,2 = 即2阶差分序列▽2t x :3,22,-63,-54,-6,16,-52,-40,10,,3t = 2步差分:▽29x x x 133=-= ▽234x x x 244=-=……▽2-28x x x 81010=-=即2步差分序列:9,34,-7,-26,12,21,-16,-28 二、延迟算子(滞后算子) (一)定义延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相x因此,15-18+6=343-30+9=222.k 步差分▽k =t k t k t k t t x )B 1(x B x x x -=-=--三、线性差分方程在实践序列的时域分析中,线性差分方程是非常重要的,也是极为有效的工具,事实上,任何一个ARMA模型都是一个现象差分方程。
因此,ARMA模型的性质往往取决于差分方程的性质。
为了更好地讨论ARMA 模型的性质,先简单介绍差分方程的一般性质。
设,,方程两边同除以,得特征方程(这是一个一元p次方程,应该至少有p个非零实根,称这p个实根为特征方程(3)的特征根,不防记作.特征根的取值情况不同,齐次线性差分方程的解会有不同的表达形式。
时序预测中的时间序列平稳性检验方法详解时间序列分析在各个领域都有着广泛的应用,如经济学、气象学、医学等。
而时间序列平稳性检验是时间序列分析中的重要一环,它可以帮助我们确认时间序列数据是否稳定,从而选择合适的模型进行预测。
本文将详细介绍时间序列平稳性检验的方法和原理。
一、平稳性的定义在进行时间序列分析时,我们通常假设时间序列是平稳的。
平稳性是指时间序列在统计特性上的稳定性,即均值和方差在时间上都是恒定的。
如果时间序列不满足平稳性的要求,将会导致预测结果不准确。
因此,平稳性检验在时间序列分析中至关重要。
二、时间序列平稳性的检验方法1. 直观法直观法是最简单的一种检验方法,它通过观察时间序列的均值和方差是否随时间变化而确定序列的平稳性。
如果均值和方差不随时间变化,则可以初步认定序列是平稳的。
然而,直观法往往不够准确,因为很难只通过肉眼观察就确定序列的平稳性。
2. 统计方法在统计方法中,有许多用于时间序列平稳性检验的经典方法,如ADF检验、PP检验、KPSS检验等。
这些方法都是通过建立统计模型,对序列的均值和方差进行检验,从而判断序列的平稳性。
ADF检验(Augmented Dickey-Fuller Test)是最常用的一种检验方法,它的原假设是时间序列具有单位根(非平稳),备择假设是时间序列是平稳的。
通过对序列进行单位根检验,ADF检验可以判断序列的平稳性。
如果p值小于显著性水平(通常为),则拒绝原假设,认为序列是平稳的。
PP检验(Phillips-Perron Test)是另一种常用的单位根检验方法,它与ADF检验类似,也是通过检验序列的单位根来判断序列的平稳性。
与ADF检验的区别在于PP检验对序列的自相关结构和序列长度的敏感性较低。
KPSS检验(Kwiatkowski-Phillips-Schmidt-Shin Test)则是一种反向的检验方法,它的原假设是序列是平稳的,备择假设是序列具有单位根。
第一节线性差分方程一、后移算子B定义为三、齐次方程解的计算1 、AR(n) 过程自相关函数ACF 1阶自回归模型AR(1) Xt= Xt-1+ at 的k阶滞后自协方差为:Xt= 1Xt-1+ 2Xt-2 + at 该模型的方差0以及滞后1期与2期的自协方差1, 2分别为一般地,n阶自回归模型AR(n) Xt= 1Xt-1+ 2Xt-2 +…nXt-n + at 其中:zi 是AR(n) 特征方程(z)=0 的特征根,由AR(n) 平稳的条件知,|zi|<1; 因此,当zi 均为实数根时,k呈几何型衰减(单调或振荡);当存在虚数根时,则一对共扼复根构成通解中的一个阻尼正弦波项,k呈正弦波衰减。
对MA(1) 过程其自协方差系数为二、偏自相关函数从Xt 中去掉Xt-1 的影响,则只剩下随机扰动项at ,显然它与Xt-2 无关,因此我们说Xt 与Xt-2 的偏自相关系数为零,记为MA(1) 过程可以等价地写成at 关于无穷序列Xt ,Xt-1 ,…的线性组合的形式:与MA(1) 相仿,可以验证MA(m) 过程的偏自相关函数是非截尾但趋于零的。
ARMA(n,m) 的自相关函数,可以看作MA(m) 的自相关函数和AR(n) 的自相关函数的混合物。
当n=0 时,它具有截尾性质;当m=0 时,它具有拖尾性质;当n、m都不为0时,它具有拖尾性质从识别上看,通常:ARMA(n ,m) 过程的偏自相关函数(PACF )可能在n阶滞后前有几项明显的尖柱(spikes ),但从n阶滞后项开始逐渐趋向于零;而它的自相关函数(ACF )则是在m阶滞后前有几项明显的尖柱,从m阶滞后项开始逐渐趋向于零。
对k=1 ,2,3,…依次求解方程,得上述……序列为AR 模型的偏自相关函数。
偏自相关性是条件相关,是在给定的条件下,和的条件相关。
换名话说,偏自相关函数是对和所解释的相关的度量。
之间未被由最小二乘原理易得,是作为关于线性回归的回归系数。
应用时间序列分析实验报告实验名称第三章平稳时间序列分析一、上机练习data example3_1;input x;time=_n_;cards;0.30 -0.45 0.036 0.00 0.17 0.45 2.154.42 3.48 2.99 1.74 2.40 0.11 0.960.21 -0.10 -1.27 -1.45 -1.19 -1.47 -1.34-1.02 -0.27 0.14 -0.07 0.10 -0.15 -0.36-0.50 -1.93 -1.49 -2.35 -2.28 -0.39 -0.52-2.24 -3.46 -3.97 -4.60 -3.09 -2.19 -1.210.78 0.88 2.07 1.44 1.50 0.29 -0.36-0.97 -0.30 -0.28 0.80 0.91 1.95 1.771.80 0.56 -0.11 0.10 -0.56 -1.34 -2.470.07 -0.69 -1.96 0.04 1.59 0.20 0.391.06 -0.39 -0.162.07 1.35 1.46 1.500.94 -0.08 -0.66 -0.21 -0.77 -0.52 0.05;procgplot data=example3_1;plot x*time=1;symbolc=red i=join v=star;run;建立该数据集,绘制该序列时序图得:根据所得图像,对序列进行平稳性检验。
时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的X围有界的特点。
如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。
从图上可以看出,数值围绕在0附近随机波动,没有明显或周期,其本可以视为平稳序列,时序图显示该序列波动平稳。
procarima data=example3_1;identifyvar=x nlag=8;run;图一图二样本自相关图图三样本逆自相关图图四样本偏自相关图图五纯随机检验图实验结果分析:(1)由图一我们可以知道序列样本的序列均值为-0.06595,标准差为1.561613,观察值个数为84个。
(2)根据图二序列样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。
我们发现样本自相关图延迟3阶之后,自相关系数都落入2倍标准差X围以内,而且自相关系数向0.03衰减的速度非常快,延迟5阶之后自相关系数即在0.03值附近波动。
这是一个短期相关的样本自相关图。
所以根据样本自相关图的相关性质,可以认为该序列平稳。
(3)根据图五的检验结果我们知道,在各阶延迟下LB检验统计量的P值都非常小(<0.0001),所以我们可以以很大的把握(置信水平>99.999%)断定该序列样本属于非白噪声序列。
procarima data=example3_1;identifyvar=x nlag=8minicp= (0:5) q=(0:5);run;IDENTIFY命令输出的最小信息量结果某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。
建模的基本步骤如下:A:求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
B:根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。
C:估计模型中未知参数的值。
D:检验模型有效性。
如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合。
E:模型优化。
如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型。
F:利用拟合模型,预测序列的将来走势。
为了尽量避免因个人经验不足导致的模型识别问题,SAS系统还提供了相对最优模型识别。
最后一条信息显示,在自相关延迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMR(p,q)模型中,BIC信息量相对最小的是ARMR(0,4)模型,即MA(4)模型。
需要注意的是,MINIC只给出一定X围内SBC最小的模型定阶结果,但该模型的参数未必都能通过参数检验,即经常会出现MINIC给出的模型阶数依然偏高的情况。
estimateq=4;run;本例参数估计输出结果显示均值MU不显著(t的检验统计量的P值为0.9968),其他参数均显著(t 检验统计量的P值均小于0.00001),所以选择NOINT选项,除去常数项,再次估计未知参数的结果,即可输入第二条ESTIMATE命令:estimateq=4 noint;run;参数估计部分输出结果如图六所示:图六ESTIMATE命令消除常数项之后的输出结果显然四个未知参数均显著。
拟合统计量的值这部分输出五个统计量的值,由上到下分别是方差估计值、标准差估计值、AIC信息量、SBC信息量及残差个数,如图七所示:图七ESTIMATE命令输出的拟合统计量的值系数相关阵这部分输出各参数估计值的相关阵,如图八所示:图八ESTIMATE命令输出的系数相关阵残差自相关检验结果这部分的输出格式(图九)和序列自相关系数白噪声检验部分的输出结果一样。
本例中由于延迟各阶的LB统计量的P值均显著大于a(a=0.05),所以该拟合模型显著成立。
图九ESTIMATE命令输出的残差自相关检验结果拟合模型的具体形式ESTIMA TE命令输出的拟合模型的形式序列预测forecastlead=5id=time out=results;run;其中,lead是指定预测期数;id是指定时间变量标识;out是指定预测后的结果存入某个数据集。
该命令运行后输出结果如下:FORECAST命令输出的预测结果该输出结果从左到右分别为序列值的序号、预测值、预测值的标准差、95%的置信下限、95%的置信上限。
利用存储在临时数据集RESULTS里的数据,我们还可以绘制漂亮的拟合预测图,相关命令如下:procgplot data=results;plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay;symbol1c=black i=none v=start;symbol2c=red i=join v=none;symbol3c=green i=join v=none l=32;run;输出图像如下:拟合效果图注:图中,S号代表序列的观察值;连续曲线代表拟合序列曲线;虚线代表拟合序列的95%上下置信限。
所谓预测就是要利用序列以观察到的样本值对序列在未来某个时刻的取值进行估计。
目前对平稳序列最常用的预测方法是线性最小方差预测。
线性是指预测值为观察值序列的线性函数,最小方差是指预测方差达到最小。
在预测图上可以看到,数据围绕一个X围内波动,即说明未来的数值变化时平稳的。
二、课后习题第十七题:根据某城市过去63年中每年降雪量数据(单位:mm)得:(书本P94)程序:data example17_1;input x;time=_n_;cards;126.4 82.4 78.1 51.1 90.9 76.2 104.5 87.4110.5 25 69.3 53.5 39.8 63.6 46.7 72.979.6 83.6 80.7 60.3 79 74.4 49.6 54.771.8 49.1 103.9 51.6 82.4 83.6 77.8 79.389.6 85.5 58 120.7 110.5 65.4 39.9 40.188.7 71.4 83 55.9 89.9 84.8 105.2 113.7124.7 114.5 115.6 102.4 101.4 89.8 71.5 70.998.3 55.5 66.1 78.4 120.5 97 110;procgplot data=example17_1;plot x*time=1;symbolc=red i=join v=star;run;procarima data=example17_1;identifyvar=x nlag=15minicp= (0:5) q=(0:5);run;estimatep=1;run;estimatep=1 noin;run;forecastlead=5id=time out=results;run;procgplot data=results;plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay;symbol1c=black i=none v=start;symbol2c=red i=join v=none;symbol3c=green i=join v=none l=32;run;(1)判断该序列的平稳性与纯随机性该序列的时序图如下(图a)图a由时序图显示过去63年中每年降雪量数据围绕早70mm附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图b)图b时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的X围有界的特点。
如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。
样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。
我们发现样本自相关图延迟2阶之后,自相关系数都落入2倍标准差X围以内,自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差X围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列。
纯随机性检验见下图:(图c)图c根据图c的检验结果我们知道,在6阶延迟下LB检验统计量的P值显著小于0.05,所以我们可以以很大的把握(置信水平>95%)断定这个拟合模型的残差序列属于非白噪声序列。
(2)如果序列平稳且非白躁声,选择适当模型拟合该序列的发展。
模型识别如下图(图d)图d假如某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。
建模的基本步骤如下:1:求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
2:根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。