第三章平稳时间序列分析
- 格式:docx
- 大小:1.22 MB
- 文档页数:25
第三章 线性平稳时间序列分析在时间序列的统计分析中,平稳序列是一类重要的随机序列。
在这方面已经有了比较成熟的理论知识,最常用的是ARMA (Autoregressive Moving Average )序列。
用ARMA 模型去近似地描述动态数据在实际应用中有许多优点,例如它是线性模型,只要给出少量参数就可完全确定模型形式;另外,便于分析数据的结构和内在性质,也便于在最小方差意义下进行最佳预测和控制。
本章将讨论ARMA 模型的基本性质和特征,这是时间序列统计分析中的重要理论基础。
§3.1 线性过程通常假设随机序列是由平稳序列{}t X 与相互独立的冲击或振动{}t ε叠加生成,其中tε是服从某一固定分布的随机变量,实际中由于t ε的独立性及分布情况难以确定,常用白噪声序列来定义。
在正式讨论之前,我们首先给出相应的准备工具,介绍延迟算子和求解线性差分方程,这些工具会使得时间序列模型表达和分析更为简洁和方便,下面是延迟算子的概念。
定义 设B 为一步延迟算子,如果当前序列乘以一个延迟算子,就表示把当前序列值的时间向过去拨一个时刻,即1-=t t X BX 。
进一步地,对于任意的n ,延迟算子B 满足:22t t n t t nB X X B X X --==一般地,延迟算子B 有如下性质: (1) 01B =;(2) 若c 为任意常数,则()()1t t t B c X c B X c X -⋅=⋅=⋅;(3) 对于任意的两个序列{}t X 和{}t Y ,有()()()11t t t t t t B X Y B X B Y X Y --±=±=±; (4)()()()01!1!!nnni i n B B i n i =--=-∑。
接下来我们讨论求解线性差分方程。
定义 定义如下形式方程为序列{:0,1,2,}t z t =±±的线性差分方程:()11t t p t p z z z h t αα--+++=,其中1p ≥,1,,p αα为实数,()h t 为t 的已知函数。
注:图中,S号代表序列的观察值;连续曲线代表拟合序列曲线;虚线代表拟合序列的95%上下置信限。
所谓预测就是要利用序列以观察到的样本值对序列在未来某个时刻的取值进行估计。
目前对平稳序列最常用的预测方法是线性最小方差预测。
线性是指预测值为观察值序列的线性函数,最小方差是指预测方差达到最小。
在预测图上可以看到,数据围绕一个范围内波动,即说明未来的数值变化时平稳的。
二、课后习题第十七题:根据某城市过去63年中每年降雪量数据(单位:mm)得:(书本P94)程序:data example17_1;input x@@;time=_n_;cards;2579588397 110;proc gplot data=example17_1;plot x*time=1;symbol c=red i=join v=star;run;proc arima data=example17_1;identify var=x nlag=15minic p= (0:5) q=(0:5);run;estimate p=1;run;estimate p=1 noin;run;forecast lead=5id=time out=results;run;proc gplot data=results;plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay;symbol1c=black i=none v=start;symbol2c=red i=join v=none;symbol3c=green i=join v=none l=32;run;(1)判断该序列的平稳性与纯随机性该序列的时序图如下(图a)图a由时序图显示过去63年中每年降雪量数据围绕早70mm附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图b)图b时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
时间序列平稳性分析(课件)时间序列平稳性分析文章结构•时间序列的概念•平稳性检验•纯随机性检验•spss的具体操作1.1时间序列分析的概念•时间序列是一个按时间的次序排列起来的随机数据集合。
而时间序列分析是概率论与数理统计学科的一个重要分支,它以概率统计学为理论基础来分析随机数据序列(或称为动态数据序列)并对其建立相应的数学模型,即对模型定阶,进行参数估计,进一步将用于预测。
在对时间序列进行分析的时候我们的前提任务是如何进行的呢?2.1平稳性检验•••••特征统计量平稳时间序列的定义平稳时间序列的统计性质平稳时间序列的意义平稳性检验概率分布•概率分布的意义随机变量族的统计性质完全由它们的联合分布函数或联合密度函数决定•时间序列概率分布族的定义{ }Ft1,t2,...,tm(x1,x2,...,xm)m(1,2,...,m),t1,2,...,T•实际应用局限性概率分布•概率分布的意义随机变量族的统计性质完全由它们的联合分布函数或联合密度函数决定•时间序列概率分布族的定义{ }Ft1,t2,...,tm(x1,x2,...,xm)m(1,2,...,m),t1,2,...,T•实际应用局限性特征统计量•均值t EXt•方差Var(Xt)E(Xt t)xdFt(x)2(x t)dFt(x)•协方差•自相关系数(t,s)E(Xt t)(XS)S(t,s)(t,s)DXt DXs平稳时间序列的定义•严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随时间的推移而发生变化时,该序列才能被认为平稳•宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。
它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。
•满足如下条件的序列称为严平稳序列正整数m,t1,t1,...,tm T,正整数t,有Ft1,t2,...,tm(x1,x2,...,xm)Ft1t,t2t,...,•满足如下条件的序列称为宽平稳序列1)EXt,t T2)EXt,为常数,t T2tmt(x1,x2,...,x3)(t,s)(k,k s t),t,s,k且k s t T•常数性质•自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关1)延迟k自协方差函数(k)(t,t k),k为整数2)延迟k自相关系数k(k)(0)自相关系数的性质••••规范性对称性非负定性非唯一性平稳性的检验•时序图检验根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应、无明显该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征•自相关图检验平稳序列通常具有短期相关性。
t Pp t tt tt x B x x B x Bx x===---221第3章 平稳时刻序列分析一个序列通过预处理被识不为平稳非白噪声序列,那就讲明该序列是一个蕴含着相关信息的平稳序列。
3.1方法性工具 3.1.1差分运算 一、p 阶差分记t x ∇为t x 的1阶差分:1--=∇t t t x x x记t x 2∇为t x 的2阶差分:21122---+-=∇-∇=∇t t t t t t x x x x x x以此类推:记t p x ∇为t x 的p 阶差分:111---∇-∇=∇t p t p t p x x x 二、k 步差分记t k x ∇为t x 的k 步差分:k t t t k x x x --=∇3.1.2延迟算子 一、定义延迟算子相当与一个时刻指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时刻向过往拨了一个时刻。
记B 为延迟算子,有 延迟算子的性质:1.10=B 2.假设c 为任一常数,有1)()(-⋅=⋅=⋅t t t x c x B c x c B3.对任意俩个序列{t x }和{t y },有11)(--±=±t t t t y x y x B 4.n t t n x x B -= 5.)!(!!,)1()1(0i n i n C B C B i n i i n ni i n-=-=-∑=其中二、用延迟算子表示差分运算 1、p 阶差分 2、k 步差分3.2ARMA 模型的性质 3.2.1AR 模型定义具有如下结构的模型称为p 阶自回回模型,简记为AR(p):ts Ex t s E Var E x x x x t s t s t t p tp t p t t t ∀=≠===≠+++++=---,0,0)(,)(,0)(,0222110εεεσεεφεφφφφε(3.4)AR(p)模型有三个限制条件:条件一:0≠p φ。
那个限制条件保证了模型的最高阶数为p 。
第三章 平稳ARMA 过程一元ARMA 模型是描述时间序列动态性质的基本模型。
通过介绍ARMA 模型,可以了解一些重要的时间序列的基本概念,并且为描述单变量时间序列的动态性质提供一类十分有用的模型。
§3.1 预期、平稳性和遍历性3.1.1 预期和随机过程假设可以观察到一个样本容量为T 的随机变量t Y 的样本:},,,{21T y y y这意味着这些随机变量之间的是相互独立且同分布的。
例3.1 假设T 个随机变量的集合为:},,,{21T εεε ,),0(~2σεN i 且相互独立,我们称其为高斯白噪声过程产生的样本。
对于一个随机变量t Y 而言,它是t 时刻的随机变量,因此即使在t 时刻实验,它也可以具有不同的取值,假设进行多次试验,其方式可能是进行多次整个时间序列的试验,获得I 个时间序列:+∞=-∞=t t t y }{)1(,+∞=-∞=t t t y }{)2(,…,+∞=-∞=t t I t y }{)(将其中仅仅是t 时刻的观测值抽取出来,得到序列:},,,{)()2()1(I t t t y y y ,这个序列便是对随机变量t Y 在t 时刻的I 次观测值,也是一种简单随机子样。
定义3.1 假设随机变量t Y 是定义在相同概率空间},,{P ℜΩ上的随机变量,则称随机变量集合},2,1,0,{ ±±=t Y t 为随机过程。
例3.2 假设随机变量t Y 的概率密度函数为:]21exp[21)(22t t Y y y f t σσπ= 此时称此时密度为该过程的无条件密度,此过程也称为高斯过程或者正态过程。
定义3.2 可以利用各阶矩描述随机过程的数值特征:(1) 随机变量t Y 的数学期望定义为(假设积分收敛):⎰==+∞∞-tt Y t t t dy y f y Y E t )()(μ (3.1) 此时它是随机样本的概率极限:∑==∞→I i i t I t y I P Y E 1)(1lim)( (3.2) (2) 随机变量t Y 的方差定义为(假设积分收敛): 20)(t t t Y E μγ-= (3.3) 例3.3 几种重要类型的随机过程1) 假设},,{21 εε是一个高斯白噪声过程,随机过程t Y 为常数加上高斯白噪声过程:t t Y εμ+=则它的均值和方差分别为:μεμμ=+==)()(t t t E Y E2220)()(σεμγ==-=t t t t E Y E(2) 随机过程t Y 为时间的线性趋势加上高斯白噪声过程:t t t Y εβ+=则它的均值和方差分别为:t E t Y E t t t βεβμ=+==)()(2220)()(σεμγ==-=t t t t E Y E3.1.2 随机过程的自协方差函数将j 个时间间隔的随机变量构成一个随机向量),,,(1'=--j t t t t Y Y Y X ,通过随机试验可以获得该随机向量的简单随机样本。
平稳时间序列分析平稳时间序列分析是一种常用的时间序列分析方法,它旨在研究时间序列在均值和方差上的稳定性,并将其用于预测未来的数据走势。
本文将详细介绍平稳时间序列分析的基本概念、建模方法和预测技术。
首先,让我们来了解什么是时间序列。
时间序列是按照一定的时间间隔收集到的一系列数据点的有序集合,它可以是连续的或离散的。
时间序列分析的目的是通过对过去的数据进行统计分析,揭示出时间序列中的内在规律和趋势,并预测未来的数据走势。
平稳时间序列是指在统计意义上具有稳定性的时间序列,即其均值和方差保持恒定不变。
平稳时间序列具有以下特点:1)均值是常数,不随时间变化;2)方差是常数,不随时间变化;3)协方差只与时间间隔有关,与具体的时间点无关。
为了实现平稳时间序列分析,我们需要进行以下几个步骤:1. 数据准备:收集所需的时间序列数据,并将其整理成适合分析的格式。
通常,我们会绘制时间序列图以直观地查看数据的趋势和模式。
2. 时间序列分解:时间序列通常包含趋势、季节性和随机成分。
我们需要对时间序列进行分解,将其分解为这些组成部分。
常用的分解方法有经典的加性模型和乘性模型。
3. 平稳性检验:对于时间序列分析,我们需要确保数据是平稳的。
平稳性检验的目的是判断时间序列的均值和方差是否是稳定的。
常用的平稳性检验方法有ADF检验、KPSS检验等。
4. 模型建立:如果时间序列被证实是平稳的,我们可以根据数据的模式和趋势选择适当的模型。
常用的模型包括自回归滑动平均模型(ARMA模型)、自回归积分滑动平均模型(ARIMA模型)等。
5. 模型识别与估计:在模型建立的基础上,我们需要对模型进行识别和估计。
模型识别的目的是选择最适合数据的模型阶数,常用的方法有自相关函数(ACF)和偏自相关函数(PACF)的分析。
模型的估计通常使用最大似然估计方法。
6. 模型检验:建立模型后,我们需要对模型进行检验,验证其拟合程度和预测准确度。
常用的模型检验方法有残差分析、DW检验、Ljung-Box检验等。
时间序列分析第三章平稳时间序列分析轴表示序列取值。
时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。
如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。
从图上可以看出,数值围绕在0附近随机波动,没有明显或周期,其本可以视为平稳序列,时序图显示该序列波动平稳。
procarimadata=e某ample3_1;identifyvar=某nlag=8;run;图一图二样本自相关图图三样本逆自相关图2图四样本偏自相关图图五纯随机检验图实验结果分析:(1)由图一我们可以知道序列样本的序列均值为-0.06595,标准差为1.561613,观察值个数为84个。
(2)根据图二序列样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。
我们发现样本自相关图延迟3阶之后,自相关系数都落入2倍标准差范围以内,而且自相关系数向0.03衰减的速度非常快,延迟5阶之后自相关系数即在0.03值附近波动。
这是一个短期相关的样本自相关图。
所以根据样本自相关图的相关性质,可以认为该序列平稳。
(3)根据图五的检验结果我们知道,在各阶延迟下LB检验统计量的P值都非常小(<0.0001),所以我们可以以很大的把握(置信水平>99.999%)断定该序列样本属于非白噪声序列。
procarimadata=e某ample3_1;identifyvar=某nlag=8minicp=(0:5)q=(0:5);run;IDENTIFY命令输出的最小信息量结果3某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。
建模的基本步骤如下:A:求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
tPp t tt t t x B x x B x Bx x ===---M221第3章 平稳时间序列分析一个序列经过预处理被识别为平稳非白噪声序列,那就说明该序列是一个蕴含着相关信息的平稳序列。
3.1 方法性工具 3.1.1 差分运算 一、p 阶差分 记t x ∇为t x 的1阶差分:1--=∇t t t x x x记t x 2∇为t x 的2阶差分:21122---+-=∇-∇=∇t t t t t t x x x x x x以此类推:记t p x ∇为t x 的p 阶差分:111---∇-∇=∇t p t p t p x x x 二、k 步差分记t k x ∇为t x 的k 步差分:kt t t k x x x --=∇ 3.1.2 延迟算子 一、定义延迟算子相当与一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻。
记B 为延迟算子,有延迟算子的性质:1.10=B 2.若c 为任一常数,有1)()(-⋅=⋅=⋅t t t x c x B c x c B3.对任意俩个序列{t x }和{t y },有11)(--±=±t t t t y x y x B4.n t t nx x B -=5.)!(!!,)1()1(0i n i n C B C B in i i n ni i n-=-=-∑=其中二、用延迟算子表示差分运算 1、p 阶差分t p t p x B x )1(-=∇ 2、k 步差分tk k t t t k x B x x x )1(-=-=∇-3.2 ARMA 模型的性质 3.2.1 AR 模型定义 具有如下结构的模型称为p 阶自回归模型,简记为AR(p):ts Ex ts E Var E x x x x t s t s t t p tp t p t t t πΛ∀=≠===≠+++++=---,0,0)(,)(,0)(,0222110εεεσεεφεφφφφε(3.4)AR(p)模型有三个限制条件: 条件一:≠p φ。
这个限制条件保证了模型的最高阶数为p 。
条件二:ts E Var E t s t t ≠===,0)(,)(,0)(2εεσεεε。
这个限制条件实际上是要求随机干扰序列}{t ε为零均值白噪声序列。
条件三:ts Ex t s π∀=,0ε。
这个限制条件说明当期的随机干扰与过去的序列值无关。
通常把AR(p)模型简记为: tp t p t t t x x x x εφφφφ+++++=---Λ22110(3.5)当00=φ时,自回归模型式(3.4)又称为中心化AR(p)模型。
非中心化AR(p)序列可以通过下面变化中心化AR(p)系列。
令μφφφφμ-=----=t t px y ,1210Λ则{t y }为{t x}的中心化序列。
AR(p)模型又可以记为:tt x B ε=Φ)(,其中pp B B B B φφφ----=ΦΛ2211)(称为p 阶自回归系数多项式二、AR 模型平稳性判断P45【例3.1】 考察如下四个AR 模型的平稳性:t t t x x ε+=-18.0)1(tt t x x ε+-=-11.1)2(t t t t xxx ε+-=--215.0)3( t t t t xxx ε++=--215.0)4( 拟合这四个序列的序列值,并会绘制时序图,发现(1)(3)模型平稳,(2)(4)模型非平稳1、特征根判别任一个中心化AR(p)模型tt x B ε=Φ)(都可以视为一个非齐次线性差分方程。
tp t p t t t x x x x εφφφφ=-+------Λ22110则其齐次线性方程0)(=Φt x B 的特征方程为:2211=------p p p p xxx φφφΛ设pλλλ,,,21Λ为齐次线性方程)1()(221=----=Φt p p t x B B B x B φφφΛ的p 个特征根。
所以AR(p)模型平稳的充要条件是它的p 个特征根pλλλ,,,21Λ都在单位圆内。
同时等价于:AR 模型的自回归系数多项式的根,即0)(=Φu 的根,都在单位圆外。
证明:设pλλλ,,,21Λ为齐次线性方程)(=Φt x B 的p 个特征根,任取)2,1(,p i i Λ∈λ,带入特征方程:2211=------p p i p i p i φλφλφλΛ把i i u λ1=带入0)(=ΦB 中,有][11111)(2211221=----=----=Φ--p p ip ip i pipipiii u φλφλφλλλφλφλφΛΛ根据这个性质,)(B Φ可以因子分解成:∏=-=Φpi i B B 1)1()(λ,于是可以得到非其次线性方程tt x B ε=Φ)(的一个特解:tpi i ipi ittt Bk B B x ελλεε∑∏==-=-=Φ=111)1()(2、平稳域判别 使得特征方程22110=-+------p t p t t t x x x x φφφφΛ的所有特征根都在单位圆内的系数集合}|,,,{21特征根都在单位圆内p φφφΛ被称为AR(p)模型的平稳域。
(1)AR(1)模型的平稳域AR(1)模型为:tt t x x εφ+=-1,其特征方程为:0=-φλ,特征根为:φλ=。
则AR (1)模型平稳的充要条件是1<φ,则AR(1)模型的平稳域是}11{<<-φ (2)AR(2)模型的平稳域AR(2)模型为:tt t t x x x εφφ++=--2211。
其特征方程为:0212=--φλφλ,特征根为:24,242211222111φφφλφφφλ-+=++=。
则AR (2)模型平稳的充要条件是:1121<<λλ且,从而有:{121221φλλφλλ=+=⋅11,21<<λλ,且因此可以导出:1)1)(1(1)31)1)(1(1)21)12121211221212121212<++-=---=-<---=++-=+<=λλλλλλφφλλλλλλφφλλφ所以 AR(2)模型的平稳域:}1,1|,{21221<±<φφφφφ且【例3.1续】 分别用特征根判别法和平稳域判别法检验如下四个AR 模型的平稳性:tt t x x ε+=-18.0)1(tt t x x ε+-=-11.1)2(tt t t x x x ε+-=--215.0)3(tt t t x x x ε++=--215.0)4(其中),0(~}{2εδεWN t三、平稳AR 模型的统计性质 1、均值假如AR(p)满足了平稳性条件,于是 )(22110t p t p t t t x x x E Ex εφφφφ+++++=---Λ(3.12)由平稳序列均值为常数的性质得:)(T t Ex t ∈∀=μ,因为),0(~}{2εδεWN t,所以 (3.12)等价于μφφφ=----)1(21p Λpφφφφμ----=⇒Λ2101特别对于中心化AR(p)模型有0=t Ex 。
模型 特征根判别平稳域判别结论 1) 8.01=λ 8.0=φ平稳 2) 1.11-=λ 1.1-=φ非平稳 3) 21,2121ii -=+=λλ5.1,5.0,5.012212-=-=+=φφφφφ平稳4)231,23121-=+=λλ非平稳5.0,5.1,5.012212-=-=+=φφφφφ2、方差(1)Green 函数。
设pλλλ,,,21Λ为平稳AR(p)模型的特征根,则平稳AR(p)模型可以写成:∑∑∑∑∑∑∞=-∞==-=∞=====-=Φ=001101ˆ)(1)(j jt j j p i j t j i i p i j t ji i t pi i i tt G k B k B k B x εελελελε(3.13)其中∑===pi ji i j j k G 1),2,1(Λλ,系数),Λ2,1(=j G j 称为Green 函数。
记jpi j B G ∑==1G(B),则(3.13)简记为:tG (B)ε=t x(3.14)再将(3.14)带入AR(p)模型tt x B ε=Φ)(中,得到tB εε=Φt G (B))(Green 函数的递推公式为:Λ,2,1,110='==∑=-j G G G jk k j kj φ其中{,,0='≤>k pk pk k φφ(2)平稳AR 模型的方差。
对平稳AR 模型tG (B)ε=t x 两边就方差,有∑∑∑∑∞=∞=∞=-∞=====02202)()()()(j j t j jj j t j j t jj t G Var G G Var B G Var x Var εσεεε由于∑∞=∞<02j jG,这说明平稳序列}{t x 方差有界,等于常数∑∞=022j jG εσ【例3.2】求平稳AR(1)模型的方差。
AR(1)模型:∑∑∞=-∞===-=⇒=-010111)()1()1(j jt j t jj t t t t B B x x B εφεφφεεφGreen 函数为:),1,0(,1Λ==j G j j φ,所以平稳AR(1)模型的方差为:2120221021)()(φσσφεεε-===∑∑∞=∞=j j t j jt Var G x Var3、协方差函数在平稳模型tp t p t t t x x x x εφφφφ+++++=---Λ22110等号两边同时乘)1(≥∀-k x k t ,再求期望,得)()()()()(2211k t t k t p t p k t t k t t k t t x E x x E x x E x x E x x E --------++++=εφφφΛ又由1,0)(≥∀=-k x E k t t ε,)(k t t k x x E -=γ,可以得到自协方差函数的递推公式:pk p k k k ---+++=γφγφγφγΛ2211(3.17)【例3.3】求平稳AR(1)模型的自协方差函数。
平稳AR(1)模型的自协方差函数的递推公式是:111γφγφγk k k ==-又由【例 3.2】知,21201φσγε-=,所以平稳AR(1)模型的自协方差函数的递推公式是:1,12121≥∀-=k k k φσφγε【例3.4】求平稳AR(2)模型的自协方差函数。
求平稳AR(2)模型的自协方差函数的递推公式为:1,2211≥∀+=--k k k k γφγφγ,特别地,当k=1时,有12011γφγφγ+=,即01011γφφγ-=利用Green 函数可以推出AR(2)模型的协方差:22121220)1)(1)(1(1εσφφφφφφγ++--+-=所以平稳AR(2)模型的协方差函数的推导公式为:2,1)1)(1)(1(1221101122121220≥∀+=-=++--+-=--k k k kγφγφγγφφγσφφφφφφγε4、自相关系数(1)平稳AR 模型自相关系数的推导公式。