时间序列分析第四章
- 格式:pptx
- 大小:1.06 MB
- 文档页数:71
第四章时间序列分析由于反映社会经济现象的大多数数据是按照时间顺序记录的,所以时间序列分析是研究社会经济现象的指标随时间变化的统计规律性的统计方法。
.为了研究事物在不同时间的发展状况,就要分析其随时间的推移的发展趋势,预测事物在未来时间的数量变化。
因此学习时间序列分析方法是非常必要的。
本章主要内容:1. 时间序列的线图,自相关图和偏自关系图;2. SPSS 软件的时间序列的分析方法−季节变动分析。
§4.1 实验准备工作§4.1.1 根据时间数据定义时间序列对于一组示定义时间的时间序列数据,可以通过数据窗口的Date菜单操作,得到相应时间的时间序列。
定义时间序列的具体操作方法是:将数据按时间顺序排列,然后单击Date →Define Dates打开Define Dates对话框,如图4.1所示。
从左框中选择合适的时间表示方法,并且在右边时间框内定义起始点后点击OK,可以在数据库中增加时间数列。
图4.1 产生时间序列对话框§4.1.2 绘制时间序列线图和自相关图一、线图线图用来反映时间序列随时间的推移的变化趋势和变化规律。
下面通过例题说明线图的制作。
例题4.1:表4.1中显示的是某地1979至1982年度的汗衫背心的零售量数据。
试根据这些的数据对汗衫背心零售量进行季节分析。
(参考文献[2])表4.1 某地背心汗衫零售量一览表单位:万件解:根据表4.1的数据,建立数据文件SY-11(零售量),并对数据定义相应的时间值,使数据成为时间序列。
为了分析时间序列,需要先绘制线图直观地反映时间序列的变化趋势和变化规律。
具体操作如下:1. 在数据编辑窗口单击Graphs→Line,打开Line Charts对话框如图4.2.。
从中选择Simple单线图,从Date in Chart Are 栏中选择Values of individual cases,即输出的线图中横坐标显示变量中按照时间顺序排列的个体序列号,纵坐标显示时间序列的变量数据。
第四章 随机过程与时间序列分析§4时间序列的预测分析时间序列分析的内容之一是系统的演化预测,预测的基本思想之一是设法消除随机扰动,考察其长期趋势或者周期变化。
对于严格意义的周期变化现象,不存在预测问题,例如没有人预测明天太阳什么时候升起,因为地球自转在人生的有限时期内可以近似地看成是严格的周期现象。
前面讲过的R/S 分析,则是典型的趋势预测,它不落实未来的具体数值。
但是,在许多时候,趋势预测较之数值预测更有意义。
寻找趋势,最简单的思路是基于某种平均方法对数据进行修匀处理——本节讲述的移动平均法即其之一。
这一节我们讲述两种基本的预测方法:移动平均法和指数平滑法。
这两种方法本质上都是趋势预测。
1 移动平均法移动平均法,实际上就是数据修匀式的一种时间序列预测方法,其计算方法非常简便,关键是理解它的基本思想。
⒈ 数学模型设x i 为时序中第i 个时点的观测值,序列长度为n ,平均处理的观测值数目为m ,则第t 个时点的移动平均值可定义为∑+-=+--=+++=tn t i i m t t t t x m x x x m M 1111)(1 , (4-4-1)式中M t 为第t 个时点的移动平均值,也可当作第t +1个时点的预测值y t +1,即有t t M y =+1, (4-4-2)由上式可得)(1)(1)(1)(1)(112111m t t t m t t m t t t m t m t m t t t t x x m M x x mx x x mx x m x x x m M --------+---+=-++++=-++++=, (4-4-3) 可以看出,只要计算出M t -1,就可以通过迭代法算出M t 。
从上面的公式还可以看到,m 值越大,M t 的修匀程度也就越大。
极端情况是:当m =1时,M t =x t ;当m =n ,只得一个平均值,即全体x 的均值。
⒉ 计算实例下面借助上节的数据说明移动平均法的计算方法。
第四章:非平稳序列的确定性分析题目一:()()()()()()()12312123121231ˆ14111ˆˆ2144451.1616T T T T T T T T T T T T T T T T T T T T T xx x x x xx x x x x x x x x x x x x x x -------------=+++⎡⎤=+++=++++++⎢⎥⎣⎦=+++ 题目二:因为采用指数平滑法,所以1,t t x x +满足式子()11t t t x x x αα-=+-,下面式子()()11111t t t t t tx x x x x x αααα-++=+-⎧⎪⎨=+-⎪⎩ 成立,由上式可以推导出()()11111t t t t x x x x αααα++-=+-+-⎡⎤⎣⎦,代入数据得:2=5α. 题目三:()()()21221922212020192001ˆ1210101113=11.251ˆ 1010111311.2=11.04.5ˆˆˆ10.40.6.i i i xxxx x x x x αα-==++++=++++===+-=⋅∑(1)(2)根据程序计算可得:22ˆ11.79277.x= ()222019181716161ˆ2525xx x x x x =++++(3)可以推导出16,0.425a b ==,则425b a -=-. 题目四:因为,1,2,3,t x t t ==,根据指数平滑的关系式,我们可以得到以下公式:()()()()()()()()()()()()()()()221221 11121111 1111311. 2t t t t t tt x t t t x t t αααααααααααααααααααα----=+-------=-+---+--+++2+, ++2+用(1)式减去(2)式得:()()()()()221=11111.t t tt x t αααααααααααα-------------所以我们可以得到下面的等式:()()()()()()122111=11111=.t t t tt x t t αααααααα+-----------------()111lim lim 1.ttt ttxt tααα+→∞→∞----==题目五:1. 运行程序:最下方。
第四章时间序列分析每一个时间序列都是事物变化过程中的一个样本,通过对样本的研究、分析,找出过程的特性、最佳的数学模型、估计模型中的参数,检验利用数学模型进行统计预测的精度。
如同描述随机变量一样,利用随机过程的一些数字特征来描述随机时间序列的基本统计特性。
地理要素的空间分布规律是地理系统研究的中心内容。
但是空间与时间是客观事物存在的形式,两者之间是互相联系而不能分割的。
因此,我们常常要分析要素在时间上的变化,在地理系统研究中,就称为地理过程。
据此来阐明地理现象发展的过程和规律。
1.通过对时间序列的研究,阐明对象发展的过程和规律。
现在的现象,往往必须从历史发展中寻找原因和依据。
这和其它学科是共同的。
2.时间上的变化是地理系统的本质特征。
很难找到在时间上不发生变化的地理系统,不同地区的不同变化速率,构成空间变化的主要特征。
3.空间差异有时还可以理解为特定区域地理系统或其要素的时间上变化在区域上的“投影”。
对同一种要素在一定时期的连续观察就确定出现象的时间序列。
许多时间序列的分析都是利用图解法来解决的。
在这种图象中,横轴是时间测度,纵轴是所研究的要素的数值。
第一节时间序列分析基本方法时间序列分析是地理预测的过程,主要研究地理要素及地理活动的时间变化趋势、季节变化、周期变化和不规则变化等规律。
一、图象法时间序列图象有两种表示方法:严格地说,线状图只能用于图象上与变量数值有关的每一点都与时间相对应的情况,例如逐日平均气温图象、人口增长图象等等。
如果变量数值是与各个时段有关,例如:月雨量、年出生率、24小时客流量,这种情况则用柱状图象表示更为合适。
但是,线状图也常用于表示与时段有关的变量。
这是因为线状图容易画、省时间,并且几条线可以叠加在一起,易于比较其趋势。
不过应该注意,不能用与时段有关的线状图进行内插求值。
这是因为一个时段内的每一点,并没有相对应的值。
比如,从年出生率线状图中,不能求出瞬时的或日、月的出生率。
河南大学:姓名:汪宝班级:七班学号:51 班级序号:685:我国1949年-2008年年末人口总数(单位:万人)序列如表4-8所示(行数据).选择适当的模型拟合该序列的长期数据,并作5期预测。
解:具体解题过程如下:(本题代码我是做一问写一问的)1:观察时序图:data wangbao4_5;input x@@;time=1949+_n_-1;cards;54167 55196 56300 57482 58796 60266 61465 6282864653 65994 67207 66207 65859 67295 69172 7049972538 74542 76368 78534 80671 82992 85229 8717789211 90859 92420 93717 94974 96259 97542 98705100072 101654 103008 104357 105851 107507 109300 111026112704 114333 115823 117171 118517 119850 121121 122389123626 124761 125786 126743 127627 128453 129227 129988130756 131448 132129 132802;proc gplot data=wangbao4_5;plot x*time=1;symbol1c=black v=star i=join;run;分析:通过时序图,我可以发现我国1949年-2008年年末人口总数(随时间的变化呈现出线性变化.故此时我可以用线性模型拟合序列的发展.X t=a+b t+I t t=1,2,3,…,60E(I t)=0,var(I t)=σ2其中,I t为随机波动;X t=a+b就是消除随机波动的影响之后该序列的长期趋势。
2:进行线性模型拟合:proc autoreg data=wangbao4_5;model x=time;output out=out p=wangbao4_5_cup;run;proc gplot data=out;plot x*time=1 wangbao4_5_cup*time=2/overlay ;symbol2c=red v=none i=join w=2l=3;run;分析:由上面输出结果可知:两个参数的p值明显小于,即这两个参数都是具有显著非零,4:模型检验又因为Regress R-square=total R-square=,即拟合度达到%所以用这个模型拟合的非常好。
时间序列分析第四章作业T1(p133第1题):程序(1):E4_1=read.table("C:\\Users\\DMXTC\\Documents\\E4_1.txt")# install.packages("aTSA")# library(aTSA)# install.packages("forecast")# library(forecast)par(mfrow=c(1,2))r4_1<-as.matrix(E4_1)d4_1<-as.vector(t(r4_1))T4_1<-ts(d4_1)# #绘制时序图#plot(T4_1,type = "o",col="blue",pch=13,main="表4-8时序图")adf.test(T4_1)#install.packages("caret", dependencies = c("Depends", "Suggests"))for (k in 1:2)print(Box.test(T4_1,lag=6*k))acf(T4_1)pacf(T4_1)fit1<-arima(T4_1,order=c(1,0,1))par(mfrow=c(1,1))fore1<-forecast::forecast(fit1,h=5)plot(fore1,lty=2)lines(fore1$fitted,col=4)fore1图形(1):(2)①时序图绘制如上,时序图显示该序列没有明显的趋势或周期特征,说明该序列没有显著的平稳特征。
进行ADF检验,其检验结果显示如下:> adf.test(T4_1)Augmented Dickey-Fuller Testalternative: stationaryType 1: no drift no trendlag ADF p.value[1,] 0 -3.60 0.01[2,] 1 -3.19 0.01[3,] 2 -3.30 0.01[4,] 3 -3.20 0.01Type 2: with drift no trendlag ADF p.value[1,] 0 -3.65 0.0100[2,] 1 -3.23 0.0256[3,] 2 -3.44 0.0165[4,] 3 -3.48 0.0148Type 3: with drift and trendlag ADF p.value[1,] 0 -3.70 0.0340[2,] 1 -3.29 0.0833[3,] 2 -3.64 0.0388[4,] 3 -3.94 0.0193----Note: in fact, p.value = 0.01 means p.value <= 0.01检验结果显示,该序列所有ADF检验统计量的P值均小于显著性水平(α=0.05),所以可以确定该系列为平稳序列;②对平稳序列进行纯随机性检验,其检验结果如下:Box-Pierce testdata: T4_1X-squared = 25.386, df = 6, p-value = 0.0002896Box-Pierce testdata: T4_1X-squared = 31.153, df = 12, p-value = 0.001867结果显示6阶和12阶延迟的LB统计量的P值都小于显著性水平(α=0.05),所以可以判断该系列为平稳非白噪声序列。
第四章 向量自回归过程的时间序列分析§1 向量自回归模型有时我们需要考虑多个时间序列过程的组合。
例如,宏观经济系统中,(,,,)t t t t y m p r 它们之间是一个相互联系的整体(IS —LM )。
多变量的时间序列将会产生一些单变量不存在的问题。
本章主要讨论平稳的自回归形式的多变量随机过程V AR 。
给一般的向量平稳过程,12(,,,) 0,1,2,t t t mt Y Y Y Y t '==±±。
这里t Y 的协差矩阵定义为:()cov(,)[()()]t t k t t k k Y Y E Y Y μμ--'Γ==--仅依赖于k 。
设,111212122212()m m m m mm kk γγγγγγγγγ⎛⎫⎪ ⎪Γ= ⎪⎪⎝⎭,于是得到矩阵序列{()}k Γ。
又()()ij ji k k γγ=-,()()k k '∴Γ=Γ-。
设()k k +∞=-∞Ω=Γ∑,那么,1(0)[()()]k k k ∞='Ω=Γ+Γ+Γ∑。
称为tY 的长期协差阵。
且t Y 的谱定义为:0111()(){[()()]}22t i ki k i k Y k k f k ek e k e ωωωωππ+∞∞--=-∞='=Γ=Γ+Γ+Γ∑∑。
用11ˆ()()(), 0,1,2,Tt t k t k k Y Y Y Y k T -=+'Γ=--=∑作为()k Γ的估计,又M 是一个截断,满足,M →∞且0M T →。
再用1ˆˆˆˆ(0)(1)[()()]1Mk k k k M ='Ω=Γ+-Γ+Γ+∑作为Ω的一致估计。
相应于单变量平稳过程,我们同样定义向量的白噪声过程WN 和向量的鞅差分过程MDS 。
并进一步给出由它们的线性过程组成的其他的向量过程:(1)VAR 过程,1t t t Y Y φε-=+。
这里φ是一个m m ⨯的矩阵,t ε是向量WN 。
校级精品课程《统计学》习题第四章时间序列一、单项选择题1.时间序列是()A.分配数列B.分布数列C.时间数列D.变量数列2.时期序列和时点序列的统计指标()。
A.都是绝对数B.都是相对数C.既可以是绝对数,也可以是相对数D.既可以是平均数,也可以是绝对数3.时间序列是( )。
A.连续序列的一种B.间断序列的一种C.变量序列的一种D.品质序列的一种4.最基本的时间序列是( )。
A.时点序列B.绝对数时间序列C.相对数时间序列D.平均数时间序列5.为便于比较分析,要求时点序列指标数值的时间间隔( )。
A.必须连续B.最好连续C.必须相等D.最好相等6.时间序列中的发展水平( )。
A.只能是总量指标B.只能是相对指标C.只能是平均指标D.上述三种指标均可7.在平均数时间序列中各指标之间具有( )。
A.总体性B.完整性C.可加性D.不可加性8.序时平均数与一般平均数相比较()。
A.均抽象了各总体单位的差异B.均根据同种序列计算C.序时平均数表明现象在某一段时间内的平均发展水平,一般平均数表明现象在规定时间内总体的一般水平D.严格说来,序时平均数不能算作平均数9.序时平均数与一般平均数的共同点是( )。
A.两者均是反映同一总体的一般水平B.都是反映现象的一般水平C.两者均可消除现象波动的影响D.都反映同质总体在不同时间的一般水平10.时期序列计算序时平均数应采用( )。
A.加数算术平均法B.简单算术平均法C.简单算术平均法D.加权算术平均数11.间隔相等连续时点序列计算序时平均数,应采用( )。
A.简单算术平均法B.加数算术平均法C.简单序时平均法D.加权序时平均法12.由间断时点序列计算序时平均数,其假定条件是研究现象在相邻两个时点之间的变动为( )。
A.连续的B.间断的C.稳定的D.均匀的13.时间序列最基本速度指标是( )。
A.发展速度B.平均发展速度C.增减速度D.平均增减速度14.用水平法计算平均发展速度应采用( )。