第四讲 时间序列分析的预处理

  • 格式:ppt
  • 大小:2.61 MB
  • 文档页数:61

下载文档原格式

  / 61
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 一个平稳的时间序列在图形上往往表现出一种 围绕其均值不断波动的过程;
• 而非平稳序列则往往表现出在不同的时间段具 有不同的均值(如持续上升或持续下降)。
Xt
Xt
t
t
(a)
(b)
图 9.1 平稳时间序列与非平稳时间序列图
这种方法通过观察时间序列的趋势图来判断时间序列 是否存在趋势性或周期性。
应用举例
•例1 时序图 •检验1951年——2005年我国居民住院消费价格指数 的平稳性 •例2 时序图
–检验1990年1月——1997年12月我国药品总产值序 列的平稳性
例1 居民住院消费价格指数时序图
平 稳 序 列
例2 药品总产值时序图
非 平 稳 序 列
绘制序列图的基本操作 (1)选择菜单Graph→Sequence。
五 纯随机性检验
• (一)纯随机序列的定义 • (二)纯随机性的性质 • (三)纯随机性检验
(一)纯随机序列的定义
• 纯随机序列也称为白噪声序列,它满足如下两 条性质
(1)EXt 0 , t T
方差 齐性
(2)
(t, s)
2,
t
s
,
t, s T
0, t s
纯随
机性
并不是所有平稳序列都值得建模!
(2)自相关图检验(判断准则)
平稳序列通常具有短期相关性。该性质用自相关系数来 描述就是随着延迟期数的增加,平稳序列的自相关系数会 很快地衰减向零。 ➢ 若时间序列的自相关函数在k>3时都落入置信区间,且 逐渐趋于零,则该时间序列具有平稳性; ➢ 若时间序列的自相关函数更多地落在置信区间外面,则 该时间序列就不具有平稳性。
7
.014
.165
55.227
7
.000
8
.611
.160
69.795
8
.000
9
-.010
.155
69.799
9
.000
10
-.568
.150
84.168
10
.000
11
-.003
.144
84.168
11
.000
12
.445
.139
94.482
12
.000
13
-.043
.133
94.588
13
.000
D(r)
渐近服从N (0,1)服布.
(3)检验方法
a.小样本情况 零假设H0:加号和减号以随机的方式出现 检验方法:取显著性水平α(一般取0.05), 查单样本游程检验
表,得出抽样分布的临界值rL、rU 判定:若rL <r< rU 则不能拒绝零假设,即不能拒绝序列是
平稳的;若r> rU 或r< rL则拒绝零假设,序列是非平稳的。
(5)选中Display autocorrelation at periodic lags表示只显示时 间序列周期整数倍处的相关函数值。一般如果只考虑序列中 的周期因素可选中该项。否则该步可略去。最后就OK了。
Series: gnp
Autoc or rela tions
Autocorrel
Box-Ljung Statistic
Байду номын сангаас
应用举例
•例3 自相关图 •检验1951年——2005年我国居民住院消费价格指数 的平稳性 •例4 自相关图
–检验1990年1月——1997年12月我国药品总产值序 列的平稳性
例2 居民住院消费价格指数自相关图
平 稳 序 列 自 相 关 图
例3 药品总产值相关图
非 平 稳 序 列 自 相 关 图

(4)单击Options按钮定义相关参数,Maximum Number of Lags表示相关 函数值包含的最大滞后期(时间间隔h)。一般选择两个最大周期以上的数 据。在Standard Error Method框中指定计算相关系数标准差的方法,确 定相关函数图形中的置信区间。其中Independence model表示假设序列 是白噪声的过程;Bartlett’s approximation表示用估计自相关系数和偏自 相关系数方差的近似式计算方差。该方法适合序列是k-1阶的移动平均过 程,且标准差随阶数的增大而增大的情况。
非参数检验法:游程检验
(1) 什么是游程
一个游程定义为一个具有相同符号的连续串,在它前 后相接的是与其不同的符号或完全无符号。
例如,观察的结果用加、减标志表示,得到一组这样 的记录顺序:
+ +- - - + - - - -+ + - + 这个样本的观察结果共有7个游程。
(2) 游程检验的基本思想
对于一个时间序列{xt }, 设其样本均值为x , 对序列中比x小的观察值记为" "号,比x大 的观察值记为" "号, 这样就形成了一个符 号序列.并可求出这个序列的游程数.
如果符号序列是随机的,那么“+”和“-”将随机出 现,因此它的游程数既不会太多,又不会太少;反 过来说如果符号序列的游程总数太少或太多,我们 就可以认为时间序列存在某种趋势性或周期性。
纯随机序列无法预测,无法进一步建模!
标准正态白噪声序列时序图
(二)白噪声序列的性质
• 纯随机性
(k) 0,k 0
– 各序列值之间没有任何相关关系,即为 “没有记忆”的 序列
• 方差齐性(平稳) DX t (0) 2
• 根据马尔可夫定理,只有方差齐性假定成立时,用最小二 乘法得到的未知参数估计值才是准确的、有效的
b.大样本情况 零假设H0:加号和减号以随机的方式出现 检验方法:给定显著性水平α(一般取0.05)查标准正态分布
表,得出抽样分布的临界值-zα,+zα。并计算统计量:
Z r E(r) D(r)
判定:若-z α<z<+z α,则不能拒绝零假设,即不能拒 绝序列是平稳的;否则拒绝零假设,序列是非平稳的。
t 1
可以证明:随着k的增加,样本自相关函数下降且趋 于零。
序列的自相关函数(ACF)要么是截尾的,要么是拖 尾的。因此我们可以根据这个特性来判断时间序 列是否为平稳序列。
从下降速度来看,平稳序列要比非平稳序列快得多。
平稳序列的自相关系数常常表现出截尾,而非平 稳序列的自相关系数常常是拖尾的。
1.平稳性定义——知识回顾
若时间序列有有穷的二阶矩,且 Xt 满足如下两个条件:
(1)t EXt c (2) (t, s) E(Xt c)(X s c) (t s,0)
则称该时间序列为平稳序列。
包括严平稳序列和宽平稳序列。
2. 关于非平稳序列的处理
• 在对实际的时间序列进行建模之前,应首先检验 序列是否平稳,若序列非平稳,应先通过适当变 换将其化为平稳序列,然后再进行模型的建立。
(2)将需绘图的序列变量选入Variables框中。
(3)在Time Axis Labels框中指定横轴(时间轴)标志变量。该标志变量 默认的是日期型变量。
(4)在Transform框中指定对变量进行怎样的变化处理。其中Natural log transform表示对数据取自然对数,Difference表示对数据进行n阶(默 认1阶)差分,Seasonally difference表示对数据进行季节差分。
(5)单击Time Lines 按钮定义序列图中需要特别标注的时间 点,给出了无标注(No reference Lines)、在某变量变化时 标注(Line at each change of)、在某个日期标注(Line at date)三项供选择。
(6)单击Format 按钮定义图形的格式,可选择横向或纵向
设序列长度为N , N N1 N 2 , N1和N 2分别 为记号序列中""与""出现的次数,游程
总数为r,对于随机序列可以证明 : 游程总
数r的期望和方差分别如下:
E(r) 2N1N2 1 N1 N2
D(r)
2N1N2 (2N1N2 N 2 (N 1)
1)
在大样本情况下(N1或N 2大于15)有 : Z r E(r)
第四节 时间序列数据的预处理
√一、动态数据的正态性检验 √二、动态数据的离群点 √ 三、动态数据的缺失值填充
四、动态数据的平稳性检验 五、动态数据的纯随机性检验
1
时间序列的预处理(续)

得 观 察 值 序
平稳性 检验
N
Y 纯随机 检验
N
Y分 析 结 束
列 差分 运算
拟合 ARMA
模型
四、 平稳性检验
14
-.382
.127 103.678
14
.000
15
-.030
.120 103.740
15
.000
16
.295
.113 110.506
16
.000
a. The underlying process assumed is independence (white n oi se ).
b. Based on the asymptotic chi-square approximation.
• 序列的非平稳包括均值非平稳和方差非平 稳。
• 均值非平稳序列平稳化的方法:差分变换。 • 方差非平稳序列平稳化的方法:对数变换、
平方根变换等。
3. 平稳性检验方法
➢ 非参数检验法 ➢ 特征根检验法 ➢ 单位根检验法
✓(1)通过时间序列的趋势图来判断
✓ (2)通过自相关函数(ACF)判断
图检验方法
(三)纯随机性检验
• 1.检验原理 • 2.假设条件 • 3.检验统计量 • 4.判别原则 • 5.应用举例
1. 检验原理: Barlett定理
• 如果一个时间序列是纯随机的,得到一个观察期
数为n 的观察序列,那么该序列的延迟非零期的
样本自相关系数将近似服从均值为零,方差为序 列观察期数倒数的正态分布
序列图;对于单变量序列图,可选择绘制线图或面积图,还 可选择在图中绘制序列的均值线;对多变量的序列图,可选
择将不同变量在同一时间点上的点用直线连接起来。
通过自相关函数(ACF)进一步判断
• 一个时间序列的样本自相关函数定义为:
( )( ) nk Xt X Xt k X
( ) k t 1
n
Xt X 2
1. Analyze—Nonparametric Tests—Runs
变量gnp进入“Test Variable list”栏 内 选中“cut point”栏中“mean”选项→OK
输出结果分析:因为P 值(sig.)极大,所以不拒绝 零假设,故不能拒绝原序列是平稳的。
时序图检验法
• 1)给出一个随机时间序列,首先可通过该序 列的时间路径图(时序图)来粗略地判断它是 否是平稳的。
非参数检验可以很方便的通过SPSS软件进行, 实例:用游程检验检验第一讲的数据的平稳性; 步骤如下: 1.打开SPSS输入数据 2.依次单击Analyze—Nonparametric Tests—Runs; 打开Runs对话框。 3.在原变量对话框中选择变量进入“Test Variable list”栏内 4.选中“cut point”栏中“mean”选项 5.单击“OK”按纽,开始进行统计分析。
Lag
ation
Std.Errora Value
df
Si g.b
1
-.006
.192
.001
1
.975
2
-.813
.188
18.738
2
.000
3
.044
.183
18.795
3
.000
4
.806
.179
39.057
4
.000
5
.000
.174
39.057
5
.000
6
-.683
.170
55.220
6
.000
优点:简便、直观。对于那些明显为非平稳的时间序 列,可以采用这种方法。
缺点:对于一般的时间序列是否平稳,不易用这种方 法判断出来。
(1)时序图检验(判断准则)
根据平稳时间序列均值、方差为常数的性质
,平稳序列的时序图应该显示出该序列始终在 一个常数值附近随机波动,而且波动的范围有 界、无明显趋势及无周期特征
若序列无趋势,但是具有季节性,那末对于按月采 集的数据,时滞12,24,36……的自相关系数达到最 大(如果数据是按季度采集,则最大自相关系数出现在 4,8,12, ……),并且随着时滞的增加变得较小。
若序列是有趋势的,且具有季节性,其自相关函数特 性类似于有趋势序列,但它们是摆动的,对于按月数 据,在时滞12,24,36,……等处具有峰态;如果时 间序列数据是按季节的,则峰出现在时滞4,8, 12, ……等处。
协方差函数 k E[ Xt Xtk ]
绘制自相关函数图的基本操作
(1)选择菜单Graph→TimeSeries→Autocorrelations。
(2)将需绘制的序列变量选入Variables框
(3)在Display框选择绘制哪种图形,其中 Autocorrelations表示绘制自相关函数图;Partial autocorrelations表示绘制偏自相 关函数图。一般可同时绘制两种图形。