基于TAR模型的太阳黑子非线性时间序列预测
- 格式:docx
- 大小:173.30 KB
- 文档页数:12
基于TAR 模型的太阳黑子非线性时间序列预测
摘要:太阳黑子数目的变化对地球的气候、农业、通信、导航等方面影响巨大因此对太阳黑子数目进行预测具有十分重要的意义。本文对1945-2005年的太阳黑子数据建立基于不同时间段的门限自回归模型(TAR),分析太阳黑子时间序列的变动特征并对未来10年的太阳黑子数进行预测。从模型诊断结果可以得出:TAR(2;3,5)模型能很好地拟合该太阳黑子的非线性时间序列,相应的预测值也比较精确。
关键词:太阳黑子 非线性时间序列 TAR 模型 预测
0 引言
太阳黑子的太阳活动中最基本的现象,它是在太阳的光球层桑发生的一种太阳活动,太阳黑子是表示太阳活动强弱的一项重要指标,它是典型的复杂时间序列,地磁变化、大气运动、气候异常、海洋活动、等都和太阳黑子数的变化有着不同程度的关系。对太阳黑子活动进行有效的预测以此来分析地球环境的变化有着十分重要的价值。因此,历来世界各国都十分重视对太阳黑子活动的预测工作,以便能够采取防范措施,避免意外的灾难性事故发生。任晶等(2014)建立了基于相空间重构的神经网络和神经网络的太阳黑子时间序列预测模,并在MATLAB 环境下进行预测仿真,仿真结果表明,建立的模型预测精度较好。向昌盛等(2011)提出了一种相空间重构和最小二乘支持向量机(LSSVM )参数的联合优化方法,实验结果表明联合优化方法预测精度比较好,而且优化速度更快。对于太阳黑子的预测文献中,运用向量自回归(TAR )模型进行预测的还比较少。
本文对1945-2005年的太阳黑子数据建立基于不同时间段的门限自回归模型(TAR),分析太阳黑子时间序列的变动特征并对未来10年的太阳黑子数进行预测。
1 TAR 模型
门限自回归模型作为一类非线性模型,能够解释金融数据中的非线性性质。它首先是由Tong(1980)提出的。门限自回归模型设定某一特定的时点,时间序列的运动方式从一种机制跳跃到了另一种机制,同时这种跳跃是离散的。门限自回归模型在拟合实际数据时具有较好的性质,但是由于建立门限自回归模型的步骤比较复杂,直到Ruey S.Tsay (1989)提出了相对来说比较简易的建模及检验方法后,这类模型才被人们广泛地应用。
一般地,对于时间序列{
} ,2,1,=t Y t 称为满足一个k 阶门限自回归模型(TAR),其门限变量为d t Z -,假设初始值),,,(110--j p t y y y 是已知的,如果其满足下式:
j d t j p t p j t j t j j t r Z r Y Y Y Y j j ≤<++++=-----1,22,11,0,,φφφφ
其中,∞=<<<=∞-k r r r 10;{}
k j r j ,,2,1, =表示门限;k 表示段数,是正整数,j 表示第j 段,k j ,,2,1 =;要求门限变量d t Z -在空间1-t F 上可测(即:d t Z -是1-t F 内元素的可测函数),在这里1-t F 是时刻t-1之前可用信息的域;参数d 被称为延迟变量,也是正整数;}{jt ξ是均值为0,方差为2j σ,独立的序列,k j ,,2,1 =,实际上对于相同的
j ,}{jt ξ服从独立同分布。们组上述条件的模型通常记为:),,,;(21k p p p k TAR 。
在实际应用中,由Tong(1983,1990)提出了各种状态下涉及若干含有分离高阶AR(p)过程的不同状态的TAR 过程。两状态的TAR 模型的一般形式:
⎪⎩⎪⎨⎧>++++≤++++=------r
Y e Y Y r
Y e Y Y Y d t t p t p t d t t p t p t t ,,2,211,20,21,111,10,12211σφφφσφφφ
两个子模型的自回归阶数不必相同,延迟参数d 可以大于最大的自回归阶数。这里存在由d t Y -的值定义的两个可分离状态。如果门限已知,则依据1-t Y 的值是否在门限之上或之下,分离观测值。然后用OLS 估计方法估计每段方程式,其滞后期长度d 根据AR 模型的方法确定,因此可以用t 检验对单个系数进行检验。在门限值未知的情况下,根据Chan (1993)提出的方法来获得门限r 的超一致估计,为了确保在门限两边有适当数量的观测值,从检索中排除了按大小排列的t Y 最高和最底部分各10%的值。然后,运用程序是r 取每一个观测值估计TAR 模型,其中相应残差平方和最小的回归方程含有门限的一致估计。
2 实证分析
2.1 数据来源及预处理
本文数据来源于R 软件TSA 包中数据文件名为spots 的数据,是1945年至2005年美国一年一度的网络观测的太阳活动的加权平均值。为降低数据的异方差性,对原始数据进行开放变换,使用开方变换后的数据进行建模。本文所有计算都借助R 语言完成。 2.2 非线性检验
非线性时间序列分析的研究热情大约源于20世纪70年代后期对实际数据表现出的非线性动态进行建模的要求。非线性时间序列模型通常展示出非常丰富的动态结构。实际上,很简单的一个确定性的非线性差分方程可以有以下意义上的混沌解:时间序列的解对初始值敏感,且看起来基于相关分析是难以将其与白噪声序列加以区分的。因此,非线性时间序列
分析也许可以提供更精确的预测,在状态空间的某些部分可能是非常重要的,从而对所研究数据的动态给出新颖的启示。门限模型是处理非线性时间序列的方法,所以建立门限模型之前要检验时间序列的是否具有非线性。 2.2.1 图解法非线性检验
在ARIMA 建模中,新息(误差)过程通常设定为服从独立同分布的正态分布。这一正态误差假设意味着平稳时间序列同时也是正态过程,即时间序列观测的任意有限集合服从联合正态分布。在作统计推断时,采用正态假设主要是为了方便。实际当中,可能要考虑具有非正态新息的ARIMA 模型。若维持正态误差假设,则非线性时间序列通常为非正态分布。因此,对于非线性的考察,可通过检验时间序列观测的任意有限集合是否服从联合正态分布来进行。二元正态分布的散点图应该与距离中心越远密度越低的椭圆形数据云相似。若异于这个模式(例如,数据云中存在大洞),则有可能表明数据是非正态的,而相关的过程是非线性的。
图1太阳黑子序列滞后回归图
图1是太阳黑子序列的滞后回归图。从图中可以看出,1阶至4阶滞后的散点图的中心明显存在大洞,表明数据必为非正态的。另外,对2阶至3阶滞后的回归函数的估计显出了很强的非线性,表明非线性的数据机制。下面用更精确的方式检验时间序列的非线
-5
5
10
15
20
246810
lag-1 regression plot
zlag(x, k)
o o o o
o o o
o o
o o o o o
o o o o o o o o o o o o o o o o o o o o o o o
o o o o o o o o o o o
o o o o o o o o o o o o -5
5
10
15
20
246810
lag-2 regression plot
zlag(x, k)
o o o o o o o
o
o o o o o
o o o o o o o o
o o o o o o o o o o o o
o o o o o o o o o o o o o o o o o o o o o o o o o o -5
5
10
15
20
246810
lag-3 regression plot
zlag(x, k)o
o o o o o
o
o o o o o o o o o o o o o o o o o o o o o o o
o o o o o o o o o o o o o o o o o o o o o o o o o o o -5
5
10
15
20
246810
lag-4 regression plot
zlag(x, k)
o o o o o o
o o o o
o o o o o o o o o o o o o o o o o o o o
o o o o o o o o o o o o o o o
o o o o o o o o o o o o -5
5
10
15
20
246810
lag-5 regression plot
o o
o o o
o o o o o o o o o
o o o o o o o o o o o o o o
o
o o o
o o o o o o o o o o o
o o o o o o o o o o o o -5
05
10
15
20
246810
lag-6 regression plot
o o o o o
o o o o o o o o o o o o o o o o o
o o o o
o o o o o o o o o o o o o o o o
o o o o o o o o o o o
o