时间序列分析第三章平稳时间序列分析
- 格式:doc
- 大小:621.00 KB
- 文档页数:21
《时间序列分析》课程教学大纲课程编号:33330775课程名称:时间序列分析课程基本情况:1.学分:3 学时:51学时(课内学时:45 课内实验:6)2.课程性质:专业必修课3.适用专业:统计学适用对象:本科4.先修课程:概率论、数理统计、随机过程5.首选教材:王燕:《应用时间序列分析》,中国人民大学出版社,2008出版。
备选教材:王振龙等编著:《时间序列分析》,中国统计出版社,2000年。
6.考核形式:闭卷考试7.教学环境:多媒体教室及实验室一、教学目的与要求本课程是数理统计学的一个重要分支,先期需完成的课程有概率论、随机过程。
通过本课程的学习,使学生掌握时间序列数据的分析方法,包括时间序列简介、平稳时间序列分析、时间序列分解、非平稳序列的随机分析、多元时间序列分析。
利用Eviews软件进行本课程的实验教学。
二、教学内容及学时分配课程内容及学时分配表三、教学内容安排第一章时间序列分析简介【教学目的】1、了解时间序列的定义及常用分析方法;2、掌握时间序列的几个基本概念:随机过程、平稳随机过程、非平稳随机过程、自相关、记忆性。
【教学重点】时间序列的相关概念。
【教学难点】随机过程、系统自相关性。
【教学方法】课堂讲授【教学内容】第一节时间序列的定义第二节时间序列分析方法第三节时间序列分析软件EVIEWS简介第二章时间序列的预处理【教学目的】1、掌握平稳性检验的原理和方法;2、掌握纯随机性检验的原理和方法。
【教学重点】平稳时间序列的定义及统计性质。
【教学难点】时间序列的相关统计量。
【教学方法】课堂讲授【教学内容】第一节平稳性检验一、特征统计量二、平稳时间序列的定义三、平稳时间序列的统计性质四、平稳时间序列的意义五、平稳时间序列的检验第二节纯随机性检验一、纯随机序列的定义二、白噪声序列的定义三、纯随机性检验第三章平稳时间序列序列分析【教学目的】1、理解ARMA模型的定义及性质。
2、掌握平稳序列建模方法。
3、掌握平稳时间序列的预测【教学重点】平稳时间序列建模【教学难点】模型识别,参数估计,序列预测【教学方法】课堂讲授与上机实验【教学内容】第一节方法性工具一、差分运算二、延迟算子三、线性差分方程第二节 ARMA模型的性质一、AR模型二、MA模型三、ARMA模型第三节平稳序列建模一、建模步骤二、样本自相关系数与偏相关系数三、模型识别四、参数估计五、模型检验六、模型优化第四节序列预测一、线性预测函数二、预测方差最小原则三、线性最小方差预测的性质四、修正预测第四章非平稳序列的确定性分析【教学目的】1、理解时间序列的分解原理。
时间序列平稳性分析(课件)时间序列平稳性分析文章结构•时间序列的概念•平稳性检验•纯随机性检验•spss的具体操作1.1时间序列分析的概念•时间序列是一个按时间的次序排列起来的随机数据集合。
而时间序列分析是概率论与数理统计学科的一个重要分支,它以概率统计学为理论基础来分析随机数据序列(或称为动态数据序列)并对其建立相应的数学模型,即对模型定阶,进行参数估计,进一步将用于预测。
在对时间序列进行分析的时候我们的前提任务是如何进行的呢?2.1平稳性检验•••••特征统计量平稳时间序列的定义平稳时间序列的统计性质平稳时间序列的意义平稳性检验概率分布•概率分布的意义随机变量族的统计性质完全由它们的联合分布函数或联合密度函数决定•时间序列概率分布族的定义{ }Ft1,t2,...,tm(x1,x2,...,xm)m(1,2,...,m),t1,2,...,T•实际应用局限性概率分布•概率分布的意义随机变量族的统计性质完全由它们的联合分布函数或联合密度函数决定•时间序列概率分布族的定义{ }Ft1,t2,...,tm(x1,x2,...,xm)m(1,2,...,m),t1,2,...,T•实际应用局限性特征统计量•均值t EXt•方差Var(Xt)E(Xt t)xdFt(x)2(x t)dFt(x)•协方差•自相关系数(t,s)E(Xt t)(XS)S(t,s)(t,s)DXt DXs平稳时间序列的定义•严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随时间的推移而发生变化时,该序列才能被认为平稳•宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。
它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。
•满足如下条件的序列称为严平稳序列正整数m,t1,t1,...,tm T,正整数t,有Ft1,t2,...,tm(x1,x2,...,xm)Ft1t,t2t,...,•满足如下条件的序列称为宽平稳序列1)EXt,t T2)EXt,为常数,t T2tmt(x1,x2,...,x3)(t,s)(k,k s t),t,s,k且k s t T•常数性质•自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关1)延迟k自协方差函数(k)(t,t k),k为整数2)延迟k自相关系数k(k)(0)自相关系数的性质••••规范性对称性非负定性非唯一性平稳性的检验•时序图检验根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应、无明显该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征•自相关图检验平稳序列通常具有短期相关性。
时序预测中的时间序列平稳性检验方法详解时间序列分析在各个领域都有着广泛的应用,如经济学、气象学、医学等。
而时间序列平稳性检验是时间序列分析中的重要一环,它可以帮助我们确认时间序列数据是否稳定,从而选择合适的模型进行预测。
本文将详细介绍时间序列平稳性检验的方法和原理。
一、平稳性的定义在进行时间序列分析时,我们通常假设时间序列是平稳的。
平稳性是指时间序列在统计特性上的稳定性,即均值和方差在时间上都是恒定的。
如果时间序列不满足平稳性的要求,将会导致预测结果不准确。
因此,平稳性检验在时间序列分析中至关重要。
二、时间序列平稳性的检验方法1. 直观法直观法是最简单的一种检验方法,它通过观察时间序列的均值和方差是否随时间变化而确定序列的平稳性。
如果均值和方差不随时间变化,则可以初步认定序列是平稳的。
然而,直观法往往不够准确,因为很难只通过肉眼观察就确定序列的平稳性。
2. 统计方法在统计方法中,有许多用于时间序列平稳性检验的经典方法,如ADF检验、PP检验、KPSS检验等。
这些方法都是通过建立统计模型,对序列的均值和方差进行检验,从而判断序列的平稳性。
ADF检验(Augmented Dickey-Fuller Test)是最常用的一种检验方法,它的原假设是时间序列具有单位根(非平稳),备择假设是时间序列是平稳的。
通过对序列进行单位根检验,ADF检验可以判断序列的平稳性。
如果p值小于显著性水平(通常为),则拒绝原假设,认为序列是平稳的。
PP检验(Phillips-Perron Test)是另一种常用的单位根检验方法,它与ADF检验类似,也是通过检验序列的单位根来判断序列的平稳性。
与ADF检验的区别在于PP检验对序列的自相关结构和序列长度的敏感性较低。
KPSS检验(Kwiatkowski-Phillips-Schmidt-Shin Test)则是一种反向的检验方法,它的原假设是序列是平稳的,备择假设是序列具有单位根。
t Pp t tt t t x B x x B x Bxx ===---221第3章第三章平稳时间序列分析一个序列通过预处理被识别为平稳非白噪声序列,那就说明该序列是一个蕴含着有关信息的平稳序列。
3.1 方法性工具 3.1.1 差分运算 一、p 阶差分记t x ∇为t x 的1阶差分:1--=∇t t t x x x记t x 2∇为t x 的2阶差分:21122---+-=∇-∇=∇t t t t t t x x x x x x以此类推:记t p x ∇为t x 的p 阶差分:111---∇-∇=∇t p t p t p x x x 二、k 步差分记t k x ∇为t x 的k 步差分:k t t t k x x x --=∇3.1.2 延迟算子 一、定义延迟算子相当与一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻。
记B 为延迟算子,有延迟算子的性质:1.10=B2.若c 为任一常数,有1)()(-⋅=⋅=⋅t t t x c x B c x c B3.对任意俩个序列{t x }与{t y },有11)(--±=±t t t t y x y x B4.n t t n x x B -=5.)!(!!,)1()1(0i n i n C B C B i n i i n ni i n-=-=-∑=其中二、用延迟算子表示差分运算 1、p 阶差分t p t p x B x )1(-=∇ 2、k 步差分t k k t t t k x B x x x )1(-=-=∇-3.2 ARMA 模型的性质 3.2.1 AR 模型定义 具有如下结构的模型称之p 阶自回归模型,简记为AR(p):ts Ex t s E Var E x x x x t s t s t t p tp t p t t t ∀=≠===≠+++++=---,0,0)(,)(,0)(,0222110εεεσεεφεφφφφε (3.4)AR(p)模型有三个限制条件:条件一:0≠p φ。
第三章 平稳ARMA 过程一元ARMA 模型是描述时间序列动态性质的基本模型。
通过介绍ARMA 模型,可以了解一些重要的时间序列的基本概念,并且为描述单变量时间序列的动态性质提供一类十分有用的模型。
§3.1 预期、平稳性和遍历性3.1.1 预期和随机过程假设可以观察到一个样本容量为T 的随机变量t Y 的样本:},,,{21T y y y这意味着这些随机变量之间的是相互独立且同分布的。
例3.1 假设T 个随机变量的集合为:},,,{21T εεε ,),0(~2σεN i 且相互独立,我们称其为高斯白噪声过程产生的样本。
对于一个随机变量t Y 而言,它是t 时刻的随机变量,因此即使在t 时刻实验,它也可以具有不同的取值,假设进行多次试验,其方式可能是进行多次整个时间序列的试验,获得I 个时间序列:+∞=-∞=t t t y }{)1(,+∞=-∞=t t t y }{)2(,…,+∞=-∞=t t I t y }{)(将其中仅仅是t 时刻的观测值抽取出来,得到序列:},,,{)()2()1(I t t t y y y ,这个序列便是对随机变量t Y 在t 时刻的I 次观测值,也是一种简单随机子样。
定义3.1 假设随机变量t Y 是定义在相同概率空间},,{P ℜΩ上的随机变量,则称随机变量集合},2,1,0,{ ±±=t Y t 为随机过程。
例3.2 假设随机变量t Y 的概率密度函数为:]21exp[21)(22t t Y y y f t σσπ= 此时称此时密度为该过程的无条件密度,此过程也称为高斯过程或者正态过程。
定义3.2 可以利用各阶矩描述随机过程的数值特征:(1) 随机变量t Y 的数学期望定义为(假设积分收敛):⎰==+∞∞-tt Y t t t dy y f y Y E t )()(μ (3.1) 此时它是随机样本的概率极限:∑==∞→I i i t I t y I P Y E 1)(1lim)( (3.2) (2) 随机变量t Y 的方差定义为(假设积分收敛): 20)(t t t Y E μγ-= (3.3) 例3.3 几种重要类型的随机过程1) 假设},,{21 εε是一个高斯白噪声过程,随机过程t Y 为常数加上高斯白噪声过程:t t Y εμ+=则它的均值和方差分别为:μεμμ=+==)()(t t t E Y E2220)()(σεμγ==-=t t t t E Y E(2) 随机过程t Y 为时间的线性趋势加上高斯白噪声过程:t t t Y εβ+=则它的均值和方差分别为:t E t Y E t t t βεβμ=+==)()(2220)()(σεμγ==-=t t t t E Y E3.1.2 随机过程的自协方差函数将j 个时间间隔的随机变量构成一个随机向量),,,(1'=--j t t t t Y Y Y X ,通过随机试验可以获得该随机向量的简单随机样本。
注:图中,S号代表序列的观察值;连续曲线代表拟合序列曲线;虚线代表拟合序列的95%上下置信限。
所谓预测就是要利用序列以观察到的样本值对序列在未来某个时刻的取值进行估计。
目前对平稳序列最常用的预测方法是线性最小方差预测。
线性是指预测值为观察值序列的线性函数,最小方差是指预测方差达到最小。
在预测图上可以看到,数据围绕一个范围内波动,即说明未来的数值变化时平稳的。
二、课后习题第十七题:根据某城市过去63年中每年降雪量数据(单位:mm)得:(书本P94)程序:data example17_1;input x@@;time=_n_;cards;2579588397 110;proc gplot data=example17_1;plot x*time=1;symbol c=red i=join v=star;run;proc arima data=example17_1;identify var=x nlag=15minic p= (0:5) q=(0:5);run;estimate p=1;run;estimate p=1 noin;run;forecast lead=5id=time out=results;run;proc gplot data=results;plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay;symbol1c=black i=none v=start;symbol2c=red i=join v=none;symbol3c=green i=join v=none l=32;run;(1)判断该序列的平稳性与纯随机性该序列的时序图如下(图a)图a由时序图显示过去63年中每年降雪量数据围绕早70mm附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图b)图b时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。
如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。
样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。
我们发现样本自相关图延迟2阶之后,自相关系数都落入2倍标准差范围以内,自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差范围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列。
纯随机性检验见下图:(图c)图c根据图c的检验结果我们知道,在6阶延迟下LB检验统计量的P值显著小于,所以我们可以以很大的把握(置信水平>95%)断定这个拟合模型的残差序列属于非白噪声序列。
(2)如果序列平稳且非白躁声,选择适当模型拟合该序列的发展。
模型识别如下图(图d)图d假如某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。
建模的基本步骤如下:1:求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
2:根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。
3:估计模型中未知参数的值。
4:检验模型有效性。
如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合。
5:模型优化。
如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型。
6:利用拟合模型,预测序列的将来走势。
最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMA(p,q)模型中,BIC信息量相对最小的是ARMA(1,0)模型,既AR(1)模型。
它们的自相关系数都呈现出拖尾性和呈指数衰减到零值附近的性质。
自相关系数是按负指数单调收敛到零;利用拟合模型,预测该城市未来5年的降雪量.由(2)可以知道该模型是AR(1)模型;预测结果如下图(图e)由图得未来5(64-68年)的降雪量分别为、、、、。
18. 某地区连续74年的谷物产量(单位:千吨)data example18_1;input x@@;time=_n_;cards;;proc gplot data=example18_1;plot x*time=1;symbol c=red i=join v=star;run;proc arima data=example18_1;identify var=x nlag=18minic p= (0:5) q=(0:5);run;estimate q=1;run;forecast lead=5id=time out=results;run;proc gplot data=results;plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay;symbol1c=black i=none v=start;symbol2c=red i=join v=none;symbol3c=green i=join v=none l=32;run;(1)判断该序列的平稳性与纯随机性该序列的时序图如下(图f)图f时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。
如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。
由时序图显示过去74年中每年谷物产量数据围绕早千吨附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图g)图g样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。
我们发现样本自相关图延迟2阶之后,自相关系数都落入2倍标准差范围以内,自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差范围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列。
纯随机性检验见下图:(图h)图h根据图h的检验结果我们知道,在各阶延迟下LB检验统计量的P值显著小于,所以我们可以以很大的把握(置信水平>95%)断定这个拟合模型的残差序列属于非白噪声序列。
选择适当模型拟合该序列的发展。
如果序列平稳且非白躁声,选折适当模型拟合序列的发展模型识别如下图(图i)图i假如某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。
建模的基本步骤如下:A:求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
B:根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。
C:估计模型中未知参数的值。
D:检验模型有效性。
如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合。
E:模型优化。
如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型。
F:利用拟合模型,预测序列的将来走势。
最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMA(p,q)模型中,BIC信息量相对最小的是ARMA(1,0)模型,既AR(1)模型。
它们的自相关系数都呈现出拖尾性和呈指数衰减到零值附近的性质。
自相关系数是按负指数单调收敛到零;利用拟合模型,预测该地区未来5年的谷物产量,预测结果如下图(图j)由(2)可知,该模型为AR(1)模型;图j未来5年的谷物产量一次为,,,。
19. 现有201个连续的生产记录data example19_1;input x@@;time=_n_;cards;由时序图显示过去201个连续的生产记录数据围绕早84附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图l)图l时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
时序图可以直观地帮助我们掌握时间序列的一些基本分布特征。
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。
如果观察序列的时序图,显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列。
样本的自相关图我们可以知道该图横轴表示自相关系数,综轴表示延迟时期数,用水平方向的垂线表示自相关系数的大小。
我们发现样本自相关图延迟1阶之后,自相关系数都落入2倍标准差范围以内,自相关图显示该序列自相关系数一直都比较小,1阶开始控制在2倍的标准差范围以内,可以认为该序列自始自终都在零轴附近波动,这是随即性非常强的平稳时间序列。
纯随机性检验见下图:(图m)根据图m的检验结果我们知道,在各阶延迟下LB检验统计量的P值显著小于,所以我们可以以很大的把握(置信水平>95%)断定这个拟合模型的残差序列属于非白噪声序列。
(2)如果序列平稳且非白躁声,选折适当模型拟合序列的发展模型识别如下图(图n)某个观察值序列通过序列预处理,可以判定为平稳非白噪声序列,就可以利用ARMA模型对该序列建模。
建模的基本步骤如下:1、求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
2、根据样本自相关系数和偏自相关系数的性质,选择适当地ARMA(p,q)模型进行拟合。
3、估计模型中未知参数的值。
4、检验模型有效性。
如果拟合模型不通过检验,转向步骤B,重新选择模型再拟合。
5、模型优化。
如果拟合模型通过检验,仍然转向步骤B,充分考虑各种可能,建立多个拟合模型,从所有通过检验中选择最优模型。
6、利用拟合模型,预测序列的将来走势。
最后一条信息显示,在自相数迟阶数小于等于5,移动平均延迟阶数也小于等于5的所有ARMA(p,q)模型中,BIC信息量相对最小的是ARMA(0,1)模型,即MA(1)模型。
利用拟合模型,预测该城市下一时刻95%的置信区间。
由(2)可得,该模型为MA(1)模型;下一时刻95%的置信区间[,]。
实验小结:给定一个序列,我们首先应该判断平稳性,如果平稳,再检查是否是纯随机序列,如果序列平稳且非白躁声,选折适当模型拟合序列的发展,选择AR,MA,或ARMA模型,然后可以对该序列进21。