非线性时间序列
- 格式:doc
- 大小:79.00 KB
- 文档页数:21
非线性趋势的时间序列
非线性趋势的时间序列通常具有曲线或曲折的形状,而不是直线或指数型的趋势。
这种时间序列可能表现出各种形式的非线性关系,如凸型、凹型、波动性等。
例如,一个非线性趋势的时间序列可能是一条波动上升的曲线,其中波峰和波谷交替出现,而不是沿着直线或指数型增长。
另一个例子是一条S 型曲线,表现为一段缓慢增长,随后加速上升,最终趋于饱和。
非线性趋势的时间序列具有更加复杂的关系,因此需要更高级的数据分析方法来识别和预测。
常见的方法包括多项式拟合、非参数回归、神经网络模型等。
通过这些方法,可以更好地理解和利用非线性趋势的时间序列数据。
基于多元局部多项式方法的非线性时间序列预测 摘 要:根据Takens 定理,把混沌时间序列构造为一组序列对,然后用多元局部多项式方法来预测其序列,这种核估计方法可以结合局域法与全局法的优点,使得预测的精度更高0 仿真结果表明,该方法非常有效。
关键词:非线性时间序列,多元局部多项式方法,核估计1. 引言混沌现象是自然界中广泛存在的一种不规则运动,是一种由确定的非线性动力系统生成的复杂行为。
该现象介于确定关系和随机关系之间,是对现有确定模式的推广。
因此,混沌时间序列的特性使其在信号处理、通信、控制、社会经济、生物医学等领域中有着越来越重要的应用。
随着混沌理论和应用技术研究的不断深入,混沌系统的建模和预测已成为近几年来的一个重要研究热点。
对于混沌时间序列的预测,现已有一些方法,主要分为局域法和全局法两类Farmer 和Sidorowich 于1987年提出了局域预测法,这类方法的特点是计算量小、简单易行,缺点是不能预测历史数据中没有的新点。
全局预测法可以克服这个缺点,目前人们常采用多项式模型、神经网络作为工具实现全局预测0 然而全局预测法存在两个主要问题:预测模型的未知参数多和建模所需要的样本点多。
为了克服这两种方法的各自缺点,本文采用类似于相空间重构的思想,使用一种新的非参数估计方法,即多元局部多项式方法来预测混沌时间序列0该方法在局域法和全局法的多项式模型之间建立桥梁,可以在样本不是太大的情况下使得预测度足够高,而且其计算量小、易于实现。
2.混沌时间序列的重构模型假设观测的混沌时间序列为{}(),1,2,x t t N = 。
对于这种非线性序列的预测,我们不能在时域上直接采用线性模型。
根据Takens 定理,混沌时间序列可以进行相空间重构后再进行处理。
现设延迟矢量和轨迹矩阵为12[,,]L X X X X = (1)式中((),(),((1))),(1,2,)T i X x i x i x i m i L ττ=++-= ,这里m 为嵌入维数,τ为延迟时间,(1)L N m τ=--。
-------------精选文档 -----------------近代时间序列分析选讲:一. 非线性时间序列二. GARCH 模型三. 多元时间序列四. 协整模型-------------精选文档 -----------------非线性时间序列第一章 .非线性时间序列浅释1.从线性到非线性自回归模型2.线性时间序列定义的多样性第二章 . 非线性时间序列模型1.概述2.非线性自回归模型3.带条件异方差的自回归模型4.两种可逆性5.时间序列与伪随机数第三章 . 马尔可夫链与 AR 模型1.马尔可夫链2.AR 模型所确定的马尔可夫链-------------精选文档 -----------------3.若干例子第四章 . 统计建模方法1.概论2.线性性检验3.AR 模型参数估计4.AR 模型阶数估计第五章 . 实例和展望1.实例2.展望第一章 .非线性时间序列浅释1.从线性到非线性自回归模型时间序列 {x t } 是一串随机变量序列 , 它有广泛的实际背景 , 特别是在经济与金融-------------精选文档 -----------------领域中尤其显著. 关于它们的从线性与非线性概念 , 可从以下的例子入手作一浅释的说明.考查一阶线性自回归模型---LAR(1):x t = x t-1 +e t ,t=1,2,(1.1)其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且e t与 {x t-1 ,x t-1 ,} 独立 .反复使用 (1.1) 式的递推关系 , 就可得到x t =x t-1 +e t=e =e =e ttt+x t-1+{ e t-1 +x t-2 } +e t-1 + 2 x t-2== e t +e t-1 + 2 e t-2+ +n-1 e t-n+1+n x t-n.(1.2)如果当 n时,n xt-n 0, (1.3) {e t + e t-1 + 2 e t-2++n-1 e t-n+1}j=0j et-j .(1.4)虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是 , 对以上的简单模型 , 不难相信 , 当| |<1 时 , (1.3)(1.4) 式成立 . 于是 , 当 | |<1时,模型LAR(1)有平稳解 , 且可表达为x t =j=0j e t-j.(1.5) 通过上面叙述可见求LAR(1) 模型的解有简便之优点 , 此其一 . 还有第二点 , 容易推广到 LAR(p) 模型 . 为此考查如下的 p 阶线性自回归模型 LAR(p):x t = 1 x t-1 + 2 x t-2 +...+p x t-p +e t ,t=1,2, (1.6) 其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且 e t与{x t-1 , x t-1 ,} 独立 .虽然反复使用(1.6) 式的递推式, 仍然可得到 (1.2) 式的类似结果, 但是 ,用扩张后的一阶多元 AR 模型求解时 , 可显示出与 LAR(1) 模型求解的神奇的相似. 为此记x t 1x t 1, U= 0X t = ,x t p 1 01 2 p1 0 0(1.7)A= ,0 00于是 (1.6) 式可写成如下的等价形式:X t =A X t-1 + e t U.(1.8) 反复使用此式的递推关系, 形式上仿照 (1.2) 式可得X t =AX t-1 +e t U= e t U+ e t-1 AU+A 2 x t-2==e t U+e t-1 AU+e t-2 A 2 U++e t-n+1 A n-1 U+A n x t-n .如果矩阵 A 的谱半径 (A的特征值的最大模) (A),满足如下条件(A)<1,(1.10)由上式可猜想到 (1.8) 式有如下的解 :X t =k=0 A k Ue t-k .(1.11)其中向量X t的第一分量x t形成的序列 {x t },就是模型 (1.6) 式的解 . 由此不难看出 , 它有以下表达方式x t =k=0k e t-k .(1.11)其中系数k 由(1.6)式中的 1 ,2 , ...,p确定 , 细节从略 . 不过 , (1.11) 式给了我们重要启发 ,即考虑形如x t =k=0k e t-k ,k=0k 2,(1.12)的时间序列类( 其中系数k 能保证(1.12)式中的x t有定义 ). 在文献中 , 这样的序列-------------精选文档 -----------------{x t } 就被称为线性时间序列.虽然以上给出了线性时间序列的定义, 以下暂时不讨论什么是非线性时间序列, 代之先讨论一阶非线性自回归模型---NLAR(1),以便与LAR(1) 模型进行比较分析 . 首先写出 NLAR(1)模型如下x t = (x t-1 )+e t ,t=1,2,(1.13)其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且e t与 {x t-1 ,x t-2 ,} 独立 , 这些假定与LAR(1) 模型相同 , 但是 ,(x t-1 )不再是 x t-1的线性函数 , 代之为非线性函数,比如-------------精选文档 -----------------(x t-1 )=x t-1 /{a+bx t-1 2}.此时虽然仍可反复使用(1.13) 式进行迭代, 但是所得结果是x t =(x t-1 ) +e t= e t +(x t-1 )= e t +( e t-1 +(x t-2 ))= e t +( e t-1 +( e t-2 + (x t-3 )))==e t +( e t-1 +( e t-2 ++(x t-n )) ).(1.14)根据此式 , 我们既不能轻易判断(x t-1 ) 函-------------精选文档 -----------------数满足怎样的条件时, 上式会有极限 , 也不能猜测其极限有怎样的形式.对于 p 阶非线性自回归模型x t = (x t-1 ,x t-2 ,,x t-p )+e t ,t=1,2, (1.15) 仿照 (1.6) 至 (1.9) 式的扩张的方法, 我们引入如下记号(x t 1 , x t 2 ,...,x t px t 1( x t-1 ,x t-2 , ,x t-p ),x t p 1(1.16)我们得到与 (1.15) 式等价的模型X t = (X t-1 ) +e t U, t=1,2,(1.17)但是 , 我们再也得不出(1.9) 至 (1.14) 式的结果 ,至此我们已将看出 , 从线性到非线性自回归模型有实质性差异 , 要说清楚它们 , 并不是很简单的事情 . 从数学角度而言 , 讨论线性自回归模型可借用泛函分析方法 , 然而, 讨论非线性自回归模型, 则要借用马尔可夫链的理论和方法 . 这也正是本讲座要介绍的主要内容 .2.线性时间序列定义的多样性现在简单叙述一下非线性时间序列定义的复杂性 , 它与线性时间序列的定义有关.前一小节中(1.12) 式所显示的线性时间序列 , 只是一种定义方式. 如果改变对系数k 的限制条件, 就会给出不同的定义. 更为重要的是 , 在近代研究中 , 将 (1.12) 式中的 i.i.d. 序列 {e t } 放宽为平稳鞅差序列, 这在预报理论中很有意义.无论引用哪一种线性时间序列定义, 都对相应的序列的性质有所研究, 因为其研究成果可用于有关的线性时间序列模型解的特性研究 . 事实上 , 已经有丰富的成果被载入文献史册 .依上所述可知 , 由于线性时间序列定义的多样性 , 必然带来非线性时间序列定义的复杂性 . 这里需要强调指的是 , 对于非线性时间序列 , 几乎没有文章研究它们的一般性质, 这与线性时间序列情况不同 . 于是人们要问 , 我们用哪些工具来研究非线性时间序列模型解的特性呢 ? 这正是本次演讲要回答的问题 . 确切地说 , 我们将介绍马尔可夫链 , 并借助于此来讨论非线性自回归模型解的问题 .第二章 . 非线性时间序列模型1.概论从(1.12) 式可见,一个线性时间序列 {x t }, 被 {e t } 的分布和全部系数i 所决定. 在此有无穷多个自由参数,这对统计不方便,因此人们更关心只依赖有限个自由参数的线性时间序列,这就是线性时间序列的参数模型. 其中最常用的如 ARMA 模型 . 对于非线性时间序列而言 , 使用参数模型方法几乎是唯一的选择 . 由于非线性函数的多样性 ,带来了非线性时间序列模型的多样性 . 但是 , 迄今为止被研究得较多 , 又有应用价值的非线性时序模型 , 为数极少 , 而且主要是针对非线性自回归模型 . 在介绍此类模型之前 , 我们先对非线性时序模型的分类作一概述 .通用假定 : {t }为i.i.d.序列,且E t =0, 而且t 与{x t-1 , x t-2 ,}独立 .可加噪声模型 :x t = (x t-1 ,x t-2 , )+t ,t=1,2, (2.1)其中( ) 是自回归函数. 当它仅依赖于有限个未知参数时 , 记此参数向量为 , 其相应的(2.1) 模型常写成x t = (x t-1 ,x t-2 , ; )+t ,t=1,2, (2.2)否则 , 称(2.1) 式称为非参数模型.关于 (2.1)(2.2)的模型的平稳性,要在下一章讨论 , 但是 , 它有类似于线性A R 模型的几个简单性质, 是重要的而且容易获得的, 它们是 :E(x t |x t-1 ,x t-2 , )=E{ (x t-1 ,x t-2 , )+t |x t-1 ,x t-2 ,}= (x=(xt-1t-1 ,x,xt-2t-2 ,⋯)+E(t |x t-1 ,x t-2 ,⋯),⋯)(2.3)var{x t |x t-1 , x t-2 , ⋯}E{[x t - (x t-1 ,⋯)] 2|x t-1 , x t-2 , ⋯}= E{t 2|x t-1 , x t-2, ⋯}= E t 2=2.(2.4)P{x t <x|x t-1 ,x t-2 , ⋯}= P{(x t-1 ,⋯)+t <x|x t -1 ,x t-2 , ⋯}= P{t <x-(x t-1 ,⋯)|x t-1 ,x t-2 , ⋯}=F (x-(x t-1 ,⋯)).(2.5)其中 F 是t 的分布函数.带条件异方差的模型:x t = (x t-1 ,x t-2 , )+S(x t-1 ,x t-2 , )t ,t=1,2, (2.6)其中( ) 和 S() 也有限参数与非参数型之分 , 这都是不言自明的 . 另外 , (2.6) 式显然不属于可加噪声模型. 但是 , 它比下面的更一般的非可加噪声模型要简单得多. 这可通过推广 (2.3)(2.4)(2.5)式看出,即有,E(x t |x t-1 ,x t-2 , )-------------精选文档 -----------------=E{ (x t-1 ,x t-2 ,⋯)+S(x t-1 ,x t-2 ,⋯)t |x t-1 ,x t-2 ,⋯}=(x t-1 ,x t-2 ,⋯)+S(x t-1 ,x t-2 ,⋯)E{t |x t-1 ,x t-2 ,⋯}= (x t-1 ,x t-2 ,⋯).(2.3) ’var{x t |x t-1 , x t-2 , ⋯}E{[x t - (x t-1 ,⋯)] 2 |x t-1 , x t-2 , ⋯}=E{S 2 (x t-1 ,x t-2 ,⋯)t 2|x t-1 , x t-2, ⋯}=S 2 (x t-1 ,x t-2 ,⋯)E{t 2|x t-1 , x t-2, ⋯}=S 2 (x t-1 ,x t-2 ,⋯) 2 .(2.4) ’P{x t <x|x t-1 ,x t-2 , ⋯}=P{(x t-1 ,⋯)+S(x t-1 ,⋯)t <x|x t-1 , x t-2, ⋯} = P{t <[x-(x t-1 ,⋯)]/S(x t-1 ,⋯)}=F ([x-(x t-1 ,⋯)]/S(x t-1 ,⋯)).(2.5) ’一般非性序模型:x t = (x t-1 ,x t-2 ,⋯;t ,t-1 ,⋯)t=1,2, ⋯(2.7) 其中( ⋯) 也有参数与非参数型之区, 也是不言自明的 . 然 , (2.7) 式既不是可加噪声模型 , 也不属于 (2.6) 式的条件异方差的模型 . 然 , 它可能具有条件异方差性. 相反 , 后两者都是(2.7) 式的特殊型 .虽说 (2.7) 式是更广的模型形式, 在文献中却很少被研究 . 只有双线性模型作为它的一种特殊情况 , 在文献中有些应用和研究结果出现 . 现写出其模型于后, 可供理解其双线性模型的含义x t =j=1 p j x t-j +j=1 q j t-j+i=1 P j=1 Q ij t-i x t-j .2.非线性自回归模型在前一小节中的 (2.1) 和 (2.2) 式就是非线性自回归模型 , 而且属于可加噪声模型类 . 在这一小节里 , 我们将介绍几种 (2.2) 式的常见的模型 .函数后的线性自回归模型:-------------精选文档 -----------------f(x t )= 1 f(x t-1 )+2f(x t-2 )+...+p f(x t- p )+t ,t=1,2, (2.8) 其中 f(.) 是一元函数 , 它有已知和未知的不同情况 , 不过总考虑单调增函数的情况, =( 1 , 2 ,,p )是未知参数. 在实际应用中 , {x t } 是可获得量测的序列.当 f(.) 是已知函数时 , {f(x t )} 也是可获得量测的序列 , 于是只需考虑 y t =f(x t ) 所满足的线性 AR 模型y t = 1 y t-1 + 2 y t-2 +...+p y t-p +t ,t=1,2, (2.9)-------------精选文档 -----------------此时可不涉及非线性自回归模型概念 . 在宏观计量经济分析中 , 常常对原始数据先取对数后 , 再作线性自回归模型统计分析 , 就属于此种情况 . 这种先取对数的方法 , 不仅简单 , 而且有经济背景的合理解释 ,它反应了经济增长幅度的量化规律 . 虽然在统计学中还有更多的变换可使用 , 比如 Box-Cox 变换 , 但是 , 由于缺少经济背景的合理解释,很少被使用 . 由此看来 , 当 f(.) 有实际背景依据时 , 可以考虑使用 (2.7) 式的模型 .当 f(.) 是未知函数时 , {f(x t )} 不是可量测的序列 , 于是只能考虑 (2.8) 模型 . 注意 f(.)是单调函数 , 可记它的逆变换函数为 f -1 (.), 于是由 (2.8) 模型可得-------------精选文档 -----------------x t = f -1 ( 1 f(x t-1 )+ 2 f(x t-2 )+...+p f(x t-p )+t ),t=1,2, (2.9) ’此式属于 (2.7) 式的特殊情况, 此类模型很少被使用 . 取而代之是考虑如下的模型x t = 1 f(x t-1 )+ 2 f(x t-2 )+...+p f(x t-p )+t ,t=1,2, (2.10) 其中 f(.) 是一元函数 , 也有已知和未知之分, 可不限于单调增函数. 此式属于 (2.1) 式的特殊情况 , 有一定的使用价值.当 (2.10) 式中的 f(.) 函数是已知时 , 此式还有更进一步的推广模型 ,-------------精选文档 -----------------x t = 1 f 1 (x t-1 ,⋯,x t-s )+ 2 f 2 (x t-1 ,⋯,x t-s )+...+p f p (x t-1 ,⋯,x t-s )+t ,t=1,2, ⋯(2.11) 其中 f k (⋯)(k=1,2,⋯,p)是已知的s元函数.例如 , 以后将要多次提到的如下的模型:x t = 1 I(x t-1 <0)x t-1 + 2 I(x t-10)x t-1 +t,t=1,2, ⋯(2.12) 其中 I(.) 是示性函数 . 此模型是分段性的, 是著名的TAR模型的特殊情况. 了有助于理解它 , 我写出它的分段形式:-------------精选文档 -----------------1 x1 t , x1 0,x t =, x t 1 t=1,2,2 x t 1 t0.请注意 , (2.8)(2.10) 和(2.11) 式具有一个共同的特征 , 就是未知参数都以线性形式出现在模型中 . 这一特点在统计建模时带来极大的方便 . 此类模型便于实际应用 . 但是 , 对于 {x t } 而言不具有线性特性 , 所以 , 讨论它们的平稳解的问题 , 讨论它们的建模理论依据问题 ,都需要借助于马尔可夫链的工具 .已知非线性自回归函数的模型:x t = (x t-1 ,x t-2 , ,x t-p ; )+t ,t=1,2,(2.13)-------------精选文档 -----------------其中( ) 是 p 元已知函数 , 但是其中含有未知参数=( 1 , 2 ,,p ). 一般说来, 在一定范围内取值.例如 ,x t = 1 x t 1t , t=1,2,1 2 x t2 1其中=( 1 , 2 )是未知参数, 它们的取值范围是:- < < ,0< .这里需要指出 , 使用上式的模型, 不仅要借助于马尔可夫链的工具, 而且在统计建模时遇到两种麻烦, 其一是参数估计的计算麻烦 , 二是确定( ) 函数的麻烦 . 一般来说 , 只有根据应用背景能确定() 函数时, 才会考虑使用此类模型.-------------精选文档 -----------------广义线性模型 (神经网络模型 ):x t = ( 1 x t-1 + 2 x t-2 ++p x t-p )+ t,t=1,2, (2.14)其中 (.) 是一元已知或未知函数, 参数=( 1 , 2 ,,p )总是未知的. 为保证模型的唯一确定性, 或者说是可识别性, 要对作些约定,其一,|| ||=1,其二,=( 1 , 2 ,,p )中第一个非零分量为正的 . 不难理解 , 若不加这两条约定,模型(2.14) 不能被唯一确定 .当 (.) 是一元已知函数时 , 与神经网络模型相通 .-------------精选文档 -----------------当 (.) 是一元未知函数时 , 与回归模型中的 PP 方法相通 .除了以上两类模型外, 还有 (2.1) 式的非参数自回归模型, 以及从统计学中引入的半参数自回归模型. 对它们的统计建模更困难 . 本讲座主旨在于介绍如何用马尔可夫链的工具, 描述非线性自回归模型的基本特性问题 , 对这类模型不再仔细讨论 .。
近代时间序列分析选讲:一. 非线性时间序列二. GARCH模型三. 多元时间序列四. 协整模型非线性时间序列第一章.非线性时间序列浅释1.从线性到非线性自回归模型2.线性时间序列定义的多样性第二章. 非线性时间序列模型1. 概述2. 非线性自回归模型3.带条件异方差的自回归模型4.两种可逆性5.时间序列与伪随机数第三章.马尔可夫链与AR模型1. 马尔可夫链2. AR模型所确定的马尔可夫链3. 若干例子第四章. 统计建模方法1. 概论2. 线性性检验3.AR模型参数估计4.AR模型阶数估计第五章. 实例和展望1. 实例2.展望第一章.非线性时间序列浅释1. 从线性到非线性自回归模型时间序列{x t}是一串随机变量序列, 它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的从线性与非线性概念, 可从以下的例子入手作一浅释的说明.考查一阶线性自回归模型---LAR(1): x t=αx t-1+e t, t=1,2,… (1.1)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-1,…}独立. 反复使用(1.1)式的递推关系, 就可得到x t=αx t-1+e t= e t + αx t-1= e t + α{ e t-1 + αx t-2}= e t + αe t-1 + α2 x t-2=…= e t + αe t-1 + α2e t-2+…+ αn-1e t-n+1 +αn x t-n. (1.2)如果当n→∞时,αn x t-n→0, (1.3){e t+αe t-1+α2e t-2+…+αn-1e t-n+1}→∑j=0∞αj e t-j . (1.4)虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是, 对以上的简单模型, 不难相信, 当|α|<1时, (1.3)(1.4)式成立. 于是, 当|α|<1时, 模型LAR(1)有平稳解, 且可表达为x t=∑j=0∞αj e t-j . (1.5)通过上面叙述可见求LAR(1)模型的解有简便之优点, 此其一. 还有第二点, 容易推广到LAR(p)模型. 为此考查如下的p阶线性自回归模型LAR(p):x t =α1x t-1+α2x t-2+...+αp x t-p +e t ,t=1,2,… (1.6)其中{e t }为i.i.d.序列,且Ee t =0, Ee t =σ2<∞,而且e t 与{x t-1, x t-1,…}独立.虽然反复使用(1.6)式的递推式, 仍然可得到(1.2)式的类似结果, 但是,用扩后的一阶多元AR 模型求解时, 可显示出与LAR(1)模型求解的神奇的相似. 为此记X t =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+--11p t t t x x x , U=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛001 , A=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛00000121 pααα, (1.7)于是(1.6)式可写成如下的等价形式:X t=A X t-1+ e t U. (1.8)反复使用此式的递推关系, 形式上仿照(1.2)式可得X t=AX t-1+e t U= e t U+e t-1AU+A2x t-2=⋯=e t U+e t-1AU+e t-2A2U+…+e t-n+1A n-1U+A n x t-n.如果矩阵A的谱半径(A的特征值的最大模)λ(A), 满足如下条件λ(A)<1, (1.10) 由上式可猜想到(1.8)式有如下的解: X t=∑k=0∞A k Ue t-k. (1.11)其中向量X t的第一分量x t形成的序列{x t}, 就是模型(1.6)式的解. 由此不难看出, 它有以下表达方式x t=∑k=0∞ϕk e t-k. (1.11)其中系数ϕk由(1.6)式中的α1,α2, ... ,αp 确定, 细节从略. 不过, (1.11)式给了我们重要启发, 即考虑形如x t=∑k=0∞ψk e t-k, ∑k=0∞ψk2<∞, (1.12)的时间序列类 (其中系数ψk能保证(1.12)式中的x t有定义). 在文献中, 这样的序列{x t}就被称为线性时间序列.虽然以上给出了线性时间序列的定义, 以下暂时不讨论什么是非线性时间序列, 代之先讨论一阶非线性自回归模型---NLAR(1), 以便与LAR(1)模型进行比较分析. 首先写出NLAR(1)模型如下x t=ϕ(x t-1)+e t, t=1,2,… (1.13)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞,而且e t与{x t-1,x t-2,…}独立, 这些假定与LAR(1)模型相同, 但是, ϕ(x t-1)不再是x t-1的线性函数, 代之为非线性函数, 比如ϕ(x t-1)=x t-1/{a+bx t-12}.此时虽然仍可反复使用(1.13)式进行迭代, 但是所得结果是x t=ϕ (x t-1) +e t= e t+ ϕ (x t-1)= e t+ ϕ ( e t-1+ ϕ (x t-2))= e t+ ϕ ( e t-1+ ϕ ( e t-2+ ϕ (x t-3))) =…=e t+ϕ ( e t-1+ ϕ ( e t-2+ …+ϕ (x t-n))…).(1.14)根据此式, 我们既不能轻易判断ϕ(x t-1)函数满足怎样的条件时, 上式会有极限, 也不能猜测其极限有怎样的形式.对于p阶非线性自回归模型x t =ϕ(x t-1,x t-2,…,x t-p )+e t ,t=1,2,… (1.15)仿照(1.6)至(1.9)式的扩的方法, 我们引入如下记号Φ( x t-1,x t-2,…,x t-p )≡⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+-----1121,...,,(p t t p t t t x x x x x ϕ, (1.16)我们得到与(1.15)式等价的模型X t =Φ(X t-1) +e t U, t=1,2,… (1.17)但是, 我们再也得不出(1.9)至(1.14)式的结果,至此我们已将看出, 从线性到非线性自回归模型有实质性差异, 要说清楚它们, 并不是很简单的事情. 从数学角度而言,讨论线性自回归模型可借用泛函分析方法, 然而, 讨论非线性自回归模型, 则要借用马尔可夫链的理论和方法. 这也正是本讲座要介绍的主要容.2. 线性时间序列定义的多样性现在简单叙述一下非线性时间序列定义的复杂性, 它与线性时间序列的定义有关. 前一小节中(1.12)式所显示的线性时间序列, 只是一种定义方式. 如果改变对系数 k的限制条件, 就会给出不同的定义. 更为重要的是, 在近代研究中, 将(1.12)式中的i.i.d.序列{e t}放宽为平稳鞅差序列, 这在预报理论中很有意义.无论引用哪一种线性时间序列定义, 都对相应的序列的性质有所研究, 因为其研究成果可用于有关的线性时间序列模型解的特性研究. 事实上, 已经有丰富的成果被载入文献史册.依上所述可知, 由于线性时间序列定义的多样性, 必然带来非线性时间序列定义的复杂性. 这里需要强调指的是, 对于非线性时间序列, 几乎没有文章研究它们的一般性质, 这与线性时间序列情况不同. 于是人们要问, 我们用哪些工具来研究非线性时间序列模型解的特性呢? 这正是本次演讲要回答的问题. 确切地说, 我们将介绍马尔可夫链, 并借助于此来讨论非线性自回归模型解的问题.第二章. 非线性时间序列模型1. 概论从(1.12)式可见,一个线性时间序列{x t}, 被{e t}的分布和全部系数 i 所决定. 在此有无穷多个自由参数,这对统计不方便,因此人们更关心只依赖有限个自由参数的线性时间序列,这就是线性时间序列的参数模型. 其中最常用的如ARMA模型. 对于非线性时间序列而言, 使用参数模型方法几乎是唯一的选择. 由于非线性函数的多样性, 带来了非线性时间序列模型的多样性. 但是, 迄今为止被研究得较多, 又有应用价值的非线性时序模型, 为数极少, 而且主要是针对非线性自回归模型. 在介绍此类模型之前, 我们先对非线性时序模型的分类作一概述.通用假定: {εt}为i.i.d.序列,且Eεt=0, 而且εt与{x t-1, x t-2,…}独立.可加噪声模型:x t=ϕ(x t-1,x t-2,…)+εt,t=1,2,… (2.1)其中ϕ(…)是自回归函数. 当它仅依赖于有限个未知参数时, 记此参数向量为α, 其相应的(2.1)模型常写成x t=ϕ(x t-1,x t-2,…;α)+εt,t=1,2,… (2.2)否则, 称(2.1)式称为非参数模型.关于(2.1)(2.2)的模型的平稳性, 要在下一章讨论, 但是, 它有类似于线性AR 模型的几个简单性质, 是重要的而且容易获得的, 它们是:E(x t|x t-1,x t-2,…)=E{ϕ(x t-1,x t-2,…)+εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…)+E(εt|x t-1,x t-2,…)=ϕ(x t-1,x t-2,…) (2.3)var{x t|x t-1, x t-2 , …}≡E{[x t-ϕ(x t-1,…)]2|x t-1, x t-2 , …}= E{εt2|x t-1, x t-2 , …}= Eεt2=σ2. (2.4)P{x t<x|x t-1,x t-2, …}= P{ϕ(x t-1,…)+εt<x|x t-1,x t-2, …}= P{εt<x-ϕ(x t-1,…)|x t-1,x t-2, …}=Fε(x-ϕ(x t-1,…)). (2.5)其中Fε是εt的分布函数.带条件异方差的模型:x t=ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)εt,t=1,2,… (2.6)其中ϕ(…)和S(…)也有限参数与非参数型之分, 这都是不言自明的. 另外, (2.6)式显然不属于可加噪声模型. 但是, 它比下面的更一般的非可加噪声模型要简单得多.这可通过推广(2.3)(2.4)(2.5)式看出, 即有,E(x t|x t-1,x t-2,…)=E{ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)E{εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…) .(2.3)’var{x t|x t-1, x t-2 , …}≡E{[x t-ϕ(x t-1,…)]2|x t-1, x t-2 , …}=E{S2(x t-1,x t-2,…)εt2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)E{εt2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)σ2.(2.4)’P{x t<x|x t-1,x t-2, …}=P{ϕ(x t-1,…)+S(x t-1,…)εt<x|x t-1, x t-2 , …}= P{εt<[x-ϕ(x t-1,…)]/S(x t-1,…)}=Fε([x-ϕ(x t-1,…)]/S(x t-1,…)).(2.5)’一般非线性时序模型:x t=ψ(x t-1,x t-2,…; εt, εt-1,…)t=1,2,… (2.7)其中ψ(…)也有参数与非参数型之区别, 这也是不言自明的. 显然, (2.7)式既不是可加噪声模型, 也不属于(2.6)式的带条件异方差的模型. 虽然, 它可能具有条件异方差性质. 相反, 后两者都是(2.7)式的特殊类型. 虽说(2.7)式是更广的模型形式, 在文献中却很少被研究. 只有双线性模型作为它的一种特殊情况, 在文献中有些应用和研究结果出现. 现写出其模型于后, 可供理解其双线性模型的含义x t=∑j=1pαj x t-j+∑j=1qβjεt-j+∑i=1P∑j=1Qθijεt-i x t-j.2. 非线性自回归模型在前一小节中的(2.1)和(2.2)式就是非线性自回归模型, 而且属于可加噪声模型类. 在这一小节里, 我们将介绍几种(2.2)式的常见的模型.函数后的线性自回归模型:f(x t)=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+ε,tt=1,2,… (2.8)其中f(.)是一元函数, 它有已知和未知的不同情况, 不过总考虑单调增函数的情况, α=(α1,α2,…,αp)τ是未知参数. 在实际应用中, {x t}是可获得量测的序列.当f(.)是已知函数时, {f(x t)}也是可获得量测的序列, 于是只需考虑y t=f(x t)所满足的线性AR模型y t=α1y t-1+α2y t-2+...+αp y t-p+εt,t=1,2,… (2.9)此时可不涉及非线性自回归模型概念. 在宏观计量经济分析中, 常常对原始数据先取对数后, 再作线性自回归模型统计分析, 就属于此种情况. 这种先取对数的方法, 不仅简单, 而且有经济背景的合理解释,它反应了经济增长幅度的量化规律. 虽然在统计学中还有更多的变换可使用, 比如Box-Cox变换, 但是, 由于缺少经济背景的合理解释, 很少被使用. 由此看来, 当f(.)有实际背景依据时, 可以考虑使用(2.7)式的模型.当f(.)是未知函数时, {f(x t)}不是可量测的序列, 于是只能考虑(2.8)模型. 注意f(.)是单调函数, 可记它的逆变换函数为f-1(.), 于是由(2.8)模型可得x t= f-1(α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt),t=1,2,…(2.9)’此式属于(2.7)式的特殊情况, 此类模型很少被使用. 取而代之是考虑如下的模型x t=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt,t=1,2,… (2.10)其中f(.)是一元函数, 也有已知和未知之分, 可不限于单调增函数. 此式属于(2.1)式的特殊情况, 有一定的使用价值.当(2.10)式中的f(.)函数是已知时, 此式还有更进一步的推广模型,x t =α1f 1(x t-1,…,x t-s )+α2f 2(x t-1,…,x t-s )+...+αp f p (x t-1,…,x t-s )+εt ,t=1,2,… (2.11)其中f k (…)(k=1,2,…,p)是已知的s 元函数.例如, 以后将要多次提到的如下的模型:x t =α1I(x t-1<0)x t-1+α2I(x t-1≥0)x t-1+εt ,t=1,2,… (2.12)其中I(.)是示性函数. 此模型是分段线性的, 是著名的TAR 模型的特殊情况. 为了有助于理解它, 我们写出它的分段形式:x t =.0,0,,111211≥<⎩⎨⎧++--t t t t x x x x εαεα t=1,2,…请注意, (2.8)(2.10)和(2.11)式具有一个共同的特征, 就是未知参数都以线性形式出现在模型中. 这一特点在统计建模时带来极大的方便. 此类模型便于实际应用. 但是, 对于{x t }而言不具有线性特性, 所以, 讨论它们的平稳解的问题, 讨论它们的建模理论依据问题,都需要借助于马尔可夫链的工具.已知非线性自回归函数的模型:x t =ϕ(x t-1,x t-2,…,x t-p ;α)+εt ,t=1,2,… (2.13)其中ϕ(…)是p 元已知函数, 但是其中含有未知参数α=(α1,α2,…,αp )τ.一般说来, α在一定围取值.例如,x t =tt t x x εαα++--212111, t=1,2,…其中α=(α1,α2)τ是未知参数, 它们的取值围是: -∞<α<∞, 0≤α<∞.这里需要指出, 使用上式的模型, 不仅要借助于马尔可夫链的工具, 而且在统计建模时遇到两种麻烦, 其一是参数估计的计算麻烦, 二是确定ϕ(…)函数的麻烦. 一般来说, 只有根据应用背景能确定ϕ(…)函数时, 才会考虑使用此类模型.广义线性模型(神经网络模型):x t=ϕ(α1x t-1+α2x t-2+…+αp x t-p)+εt,t=1,2,… (2.14)其中ϕ(.)是一元已知或未知函数, 参数α=(α1,α2,…,αp)τ总是未知的. 为保证模型的唯一确定性, 或者说是可识别性, 要对α作些约定, 其一, ||α||=1, 其二, α=(α1,α2,…,αp)τ中第一个非零分量为正的. 不难理解, 若不加这两条约定, 模型(2.14)不能被唯一确定.当ϕ(.)是一元已知函数时, 与神经网络模型相通.当ϕ(.)是一元未知函数时, 与回归模型中的PP方法相通.除了以上两类模型外, 还有(2.1)式的非参数自回归模型, 以及从统计学中引入的半参数自回归模型. 对它们的统计建模更困难. 本讲座主旨在于介绍如何用马尔可夫链的工具, 描述非线性自回归模型的基本特性问题, 对这类模型不再仔细讨论.。
非线性时间序列分析方法与模型时间序列分析是一种研究随时间变化的数据模式和趋势的统计方法。
在传统的时间序列分析中,线性模型被广泛应用,但是线性模型无法捕捉到一些复杂的非线性关系。
因此,非线性时间序列分析方法和模型的发展成为了研究的热点。
一、非线性时间序列分析方法的发展1.1 非线性时间序列分析的起源非线性时间序列分析方法的起源可以追溯到20世纪60年代。
当时,经济学家和统计学家开始发现一些经济和金融数据中存在着非线性关系,传统的线性模型无法很好地解释这些数据。
这引发了对非线性时间序列分析方法的研究兴趣。
1.2 常用的非线性时间序列分析方法随着研究的深入,许多非线性时间序列分析方法被提出和应用。
其中,最常用的方法包括:傅里叶变换、小波分析、自回归条件异方差模型(ARCH)、广义自回归条件异方差模型(GARCH)、支持向量机(SVM)等。
二、非线性时间序列模型的应用2.1 ARCH和GARCH模型ARCH和GARCH模型是用于建模金融时间序列数据的非线性模型。
ARCH模型通过引入条件异方差来捕捉金融数据中的波动性特征,而GARCH模型在ARCH 模型的基础上进一步考虑了波动性的长期记忆效应。
2.2 小波分析小波分析是一种将时间序列分解成不同频率的成分的方法。
通过小波分析,可以将时间序列的低频和高频成分分离出来,从而更好地理解时间序列的特征和趋势。
2.3 支持向量机支持向量机是一种机器学习方法,在非线性时间序列分析中得到了广泛应用。
支持向量机通过将时间序列映射到高维空间,并在该空间中构建超平面来进行分类和回归分析。
三、非线性时间序列分析方法的优势和局限性3.1 优势非线性时间序列分析方法能够更好地捕捉到数据中的非线性关系,提高模型的预测精度。
这对于金融市场的预测和风险管理具有重要意义。
3.2 局限性非线性时间序列分析方法的建模过程较为复杂,需要较大的计算量和数据量。
此外,非线性时间序列分析方法对初始条件较为敏感,对于数据的噪声和异常值较为敏感。
经济时间序列分各种模型分析经济时间序列分析是经济学中非常重要的一个研究领域。
对于经济时间序列,我们可以使用多种模型进行分析,以揭示其中的规律和趋势。
本文将介绍几种常见的经济时间序列模型。
首先,最常用的模型是自回归移动平均模型(ARMA)。
ARMA模型结合了自回归(AR)和移动平均(MA)两个部分,用于描述时间序列数据中的自相关性和滞后平均性。
通过对历史数据进行分析,我们可以建立ARMA模型,并预测未来的经济变化。
其次,自回归条件异方差模型(ARCH)是一种考虑时间序列数据波动性变化的模型。
在经济领域,波动性是一个非常重要的指标,因为它涉及到风险和不确定性。
ARCH模型基于时间序列数据内在的波动性特征,可以更好地描述经济变动过程中的波动性变化。
另外,向量自回归模型(VAR)是一种多变量时间序列模型。
与单变量时间序列模型不同,VAR模型可以同时考虑多个经济变量之间的相互关系和影响。
通过建立VAR模型,我们可以分析各个经济变量之间的因果关系,并进行经济政策的预测。
此外,状态空间模型是一种广义的时间序列模型,可以包含各种经济数据。
状态空间模型可以用来描述许多复杂的现象,例如经济周期、金融市场波动等。
通过建立状态空间模型,我们可以更全面地分析经济系统的结构和运行机制。
最后,非线性时间序列模型是一类适用于非线性数据的经济时间序列模型。
在现实经济中,很多经济变量的关系不能简单地用线性模型来描述。
非线性时间序列模型可以更准确地捕捉经济系统中的非线性关系,从而提供更精确的预测结果。
总之,经济时间序列分析可以使用多种模型进行分析。
从基本的ARMA模型到更复杂的VAR模型、ARCH模型、状态空间模型和非线性时间序列模型,每种模型都有其适用的领域和优势。
经济学家通过对时间序列数据的建模和分析,可以更好地理解经济变动的规律和趋势,并对未来经济发展进行预测和决策。
经济时间序列分析作为经济学中的一个重要分支,对于理解和预测经济变动具有极大的意义。
时间序列的相关性及复杂性研究时间序列的相关性及复杂性研究1.引言时间序列分析是一种重要的统计方法,用于研究时间上观测到的数据的模式和趋势。
时间序列数据包括了很多领域的观测结果,如气象数据、股票价格、经济指标等。
理解时间序列的相关性和复杂性对于预测未来发展趋势和制定合理的决策具有重要意义。
本文旨在探讨时间序列的相关性和复杂性,并讨论在实际应用中的含义和挑战。
2.时间序列的相关性分析时间序列的相关性分析用于确定两个或多个变量之间的关系。
常用的方法包括相关系数和协方差分析。
相关系数可以用于度量两个变量之间的线性关系强度,其值介于-1和1之间。
相关系数越接近1,表示两个变量之间的正相关性越强;越接近-1,表示两个变量之间的负相关性越强;接近0则表示两个变量之间的关系较弱。
在时间序列分析中,相关性分析可用于确定一个变量对另一个变量的滞后效应和因果关系。
例如,在经济领域中,人们常关注某一指标的变动对另一指标的影响,如通货膨胀对消费水平的影响。
通过相关性分析,可以发现两个变量之间的内在关联关系,并预测未来的变化趋势。
3.时间序列的复杂性研究时间序列的复杂性是指时间序列数据中存在的非线性、非平稳以及具有长记忆性等特征。
传统的时间序列分析方法,如自回归移动平均模型(ARMA)和自回归积分移动平均模型(ARIMA),假设时间序列的线性性和平稳性。
然而,实际的时间序列数据往往具有复杂性,这使得使用传统方法进行分析和预测存在局限性。
非线性是时间序列数据中最常见的复杂性特征之一。
非线性时间序列数据不能用线性模型来表示,因此需要采用非线性模型进行建模和分析。
非线性时间序列模型包括GARCH模型、支持向量机、神经网络等。
这些模型可以更准确地捕捉数据中的非线性关系,提高预测准确性。
非平稳是时间序列数据的另一个复杂性特征。
平稳时间序列具有固定的均值、方差和自协方差,使得模型的参数具有稳定性。
然而,许多时间序列数据在长期内呈现出明显的趋势或周期变化。
非线性时间序列预测模型研究第一章引言时间序列分析在许多领域中被广泛应用,它能够揭示数据中的趋势和周期性变化,并对未来的发展做出预测。
然而,很多现实世界的时间序列数据并不是线性的,包含着复杂的非线性关系。
因此,研究非线性时间序列预测模型成为当前的研究热点。
本章将首先介绍非线性时间序列预测模型的研究背景和意义,然后概述目前主要的非线性时间序列预测方法,并最后给出本文的研究内容和组织结构。
第二章非线性时间序列预测模型概述2.1 非线性时间序列的特点非线性时间序列数据与线性时间序列数据相比具有一些特殊的性质。
例如,非线性时间序列数据可能包含多个不同的周期性变化、季节性变化和趋势变化,同时还可能受到外部因素的影响。
此外,非线性时间序列数据还可能存在非平稳性和噪声干扰等问题。
2.2 非线性时间序列预测方法的分类目前,研究人员提出了许多非线性时间序列预测方法,这些方法可以根据其模型结构和预测方法分为不同的分类。
常见的非线性时间序列预测方法包括支持向量机、神经网络、深度学习和基于混沌理论的方法等。
2.3 非线性时间序列预测模型评价指标为了评估非线性时间序列预测模型的性能,研究人员提出了一系列的评价指标。
这些指标包括均方根误差、平均绝对百分比误差和相关系数等。
第三章支持向量机在非线性时间序列预测中的应用3.1 支持向量机的原理和模型支持向量机是一种基于统计学习理论的非线性分类和回归方法。
它通过寻找一个最优的超平面将样本分为不同的类别,从而实现对非线性时间序列的预测。
3.2 支持向量机在非线性时间序列预测中的应用案例本节将以股票市场的预测为例,介绍支持向量机在非线性时间序列预测中的应用。
通过使用支持向量机模型,可以对股票市场的波动进行有效的预测和分析。
3.3 支持向量机在非线性时间序列预测模型中的优缺点在使用支持向量机进行非线性时间序列预测时,虽然可以取得不错的预测效果,但也存在一些问题和限制。
本节将对这些问题和限制进行详细的讨论。
非线性时间序列分析方法综述引言时间序列分析是一种用于研究时间上连续观测数据的统计方法。
在传统的时间序列分析中,线性模型被广泛应用,但随着对非线性现象的认识不断增加,非线性时间序列分析方法逐渐受到关注。
本文将对非线性时间序列分析方法进行综述,包括非线性动力学方法、复杂网络方法和机器学习方法。
非线性动力学方法非线性动力学方法是研究非线性时间序列的一种重要方法。
其中,相空间重构是一个核心概念。
相空间重构通过将一维时间序列转化为高维相空间中的轨迹,揭示了时间序列中的非线性结构。
常用的相空间重构方法有延迟重构和嵌入维度选择。
延迟重构通过选择不同的延迟时间,将一维时间序列转化为多维相空间中的轨迹,从而恢复出时间序列中的非线性动力学信息。
嵌入维度选择是指确定相空间重构中的嵌入维度,常用的方法有自相关函数法和最小平均互信息法。
复杂网络方法复杂网络方法是一种基于图论的非线性时间序列分析方法。
它将时间序列数据转化为网络结构,通过研究网络的拓扑特性来揭示时间序列中的非线性关系。
常用的复杂网络方法包括小世界网络、无标度网络和模块化网络。
小世界网络描述了网络中节点之间的短路径长度和高聚集性特征,可以用来分析时间序列中的局部关联。
无标度网络描述了网络中节点的度分布呈幂律分布的特性,可以用来分析时间序列中的长尾分布。
模块化网络描述了网络中节点的聚类特性,可以用来分析时间序列中的模式和结构。
机器学习方法机器学习方法是一种基于统计学习理论的非线性时间序列分析方法。
它通过构建预测模型来揭示时间序列中的非线性关系。
常用的机器学习方法包括支持向量机、人工神经网络和随机森林。
支持向量机是一种基于结构风险最小化理论的分类器,可以用于时间序列的分类和回归分析。
人工神经网络是一种模拟大脑神经元工作原理的计算模型,可以用于时间序列的模式识别和预测分析。
随机森林是一种基于集成学习的分类器,可以用于时间序列的多样本预测和异常检测。
结论非线性时间序列分析方法是研究时间序列中非线性关系的重要工具。
近代时间序列分析选讲:一. 非线性时间序列二. GARCH模型三. 多元时间序列四. 协整模型非线性时间序列第一章.非线性时间序列浅释1.从线性到非线性自回归模型2.线性时间序列定义的多样性第二章. 非线性时间序列模型1. 概述2. 非线性自回归模型3.带条件异方差的自回归模型4.两种可逆性5.时间序列与伪随机数第三章.马尔可夫链与AR模型1. 马尔可夫链2. AR模型所确定的马尔可夫链3. 若干例子第四章. 统计建模方法1. 概论2. 线性性检验3.AR模型参数估计4.AR模型阶数估计第五章. 实例和展望1. 实例2.展望第一章.非线性时间序列浅释1. 从线性到非线性自回归模型时间序列{x t}是一串随机变量序列, 它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的从线性与非线性概念, 可从以下的例子入手作一浅释的说明.考查一阶线性自回归模型---LAR(1):x t=αx t-1+e t, t=1,2,…(1.1)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-1,…}独立. 反复使用(1.1)式的递推关系, 就可得到x t=αx t-1+e t= e t + αx t-1= e t + α{ e t-1 + αx t-2}= e t + αe t-1 + α2 x t-2=…= e t + αe t-1 + α2e t-2+…+ αn-1e t-n+1 +αn x t-n. (1.2)如果当n→∞时,αn x t-n→0, (1.3){e t+αe t-1+α2e t-2+…+αn-1e t-n+1}→∑j=0∞αj e t-j . (1.4)虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是, 对以上的简单模型, 不难相信, 当|α|<1时, (1.3)(1.4)式成立. 于是, 当|α|<1时, 模型LAR(1)有平稳解, 且可表达为x t=∑j=0∞αj e t-j . (1.5)通过上面叙述可见求LAR(1)模型的解有简便之优点, 此其一. 还有第二点, 容易推广到LAR(p)模型. 为此考查如下的p阶线性自回归模型LAR(p):x t =α1x t-1+α2x t-2+...+αp x t-p +e t ,t=1,2,… (1.6)其中{e t }为i.i.d.序列,且Ee t =0, Ee t =σ2<∞, 而且e t 与{x t-1, x t-1,…}独立.虽然反复使用(1.6)式的递推式, 仍然可得到(1.2)式的类似结果, 但是,用扩张后的一阶多元AR 模型求解时, 可显示出与LAR(1)模型求解的神奇的相似. 为此记X t =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+--11p t t t x x x , U=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛001 , A=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛00000121 pααα, (1.7)于是(1.6)式可写成如下的等价形式:X t=A X t-1+ e t U. (1.8)反复使用此式的递推关系, 形式上仿照(1.2)式可得X t=AX t-1+e t U= e t U+e t-1AU+A2x t-2=⋯=e t U+e t-1AU+e t-2A2U+…+e t-n+1A n-1U+A n x t-n.如果矩阵A的谱半径(A的特征值的最大模)λ(A), 满足如下条件λ(A)<1, (1.10)由上式可猜想到(1.8)式有如下的解:X t=∑k=0∞A k Ue t-k. (1.11)其中向量X t的第一分量x t形成的序列{x t}, 就是模型(1.6)式的解. 由此不难看出, 它有以下表达方式x t=∑k=0∞ϕk e t-k. (1.11)其中系数ϕk由(1.6)式中的α1,α2, ... ,αp确定, 细节从略. 不过, (1.11)式给了我们重要启发, 即考虑形如x t=∑k=0∞ψk e t-k, ∑k=0∞ψk2<∞, (1.12)的时间序列类(其中系数ψk能保证(1.12)式中的x t有定义). 在文献中, 这样的序列{x t}就被称为线性时间序列.虽然以上给出了线性时间序列的定义, 以下暂时不讨论什么是非线性时间序列, 代之先讨论一阶非线性自回归模型---NLAR(1), 以便与LAR(1)模型进行比较分析. 首先写出NLAR(1)模型如下x t=ϕ(x t-1)+e t,t=1,2,…(1.13)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-2,…}独立, 这些假定与LAR(1)模型相同, 但是, ϕ(x t-1)不再是x t-1的线性函数, 代之为非线性函数, 比如ϕ(x t-1)=x t-1/{a+bx t-12}.此时虽然仍可反复使用(1.13)式进行迭代, 但是所得结果是x t=ϕ (x t-1) +e t= e t+ ϕ (x t-1)= e t+ ϕ ( e t-1+ ϕ (x t-2))= e t+ ϕ ( e t-1+ ϕ ( e t-2+ ϕ (x t-3)))=…=e t+ϕ ( e t-1+ ϕ ( e t-2+ …+ϕ (x t-n))…).(1.14)根据此式, 我们既不能轻易判断ϕ(x t-1)函数满足怎样的条件时, 上式会有极限, 也不能猜测其极限有怎样的形式.对于p阶非线性自回归模型x t =ϕ(x t-1,x t-2,…,x t-p )+e t ,t=1,2,… (1.15)仿照(1.6)至(1.9)式的扩张的方法, 我们引入如下记号Φ( x t-1,x t-2,…,x t-p )≡⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+-----1121,...,,(p t t p t t t x x x x x ϕ, (1.16)我们得到与(1.15)式等价的模型X t =Φ(X t-1) +e t U, t=1,2,… (1.17)但是, 我们再也得不出(1.9)至(1.14)式的结果,至此我们已将看出, 从线性到非线性自回归模型有实质性差异, 要说清楚它们, 并不是很简单的事情. 从数学角度而言, 讨论线性自回归模型可借用泛函分析方法, 然而, 讨论非线性自回归模型, 则要借用马尔可夫链的理论和方法. 这也正是本讲座要介绍的主要内容.2. 线性时间序列定义的多样性现在简单叙述一下非线性时间序列定义的复杂性, 它与线性时间序列的定义有关. 前一小节中(1.12)式所显示的线性时间序列, 只是一种定义方式. 如果改变对系数 k的限制条件, 就会给出不同的定义. 更为重要的是, 在近代研究中, 将(1.12)式中的i.i.d.序列{e t}放宽为平稳鞅差序列, 这在预报理论中很有意义.无论引用哪一种线性时间序列定义, 都对相应的序列的性质有所研究, 因为其研究成果可用于有关的线性时间序列模型解的特性研究. 事实上, 已经有丰富的成果被载入文献史册.依上所述可知, 由于线性时间序列定义的多样性, 必然带来非线性时间序列定义的复杂性. 这里需要强调指的是, 对于非线性时间序列, 几乎没有文章研究它们的一般性质, 这与线性时间序列情况不同. 于是人们要问, 我们用哪些工具来研究非线性时间序列模型解的特性呢? 这正是本次演讲要回答的问题. 确切地说, 我们将介绍马尔可夫链, 并借助于此来讨论非线性自回归模型解的问题.第二章. 非线性时间序列模型1. 概论从(1.12)式可见,一个线性时间序列{x t}, 被{e t}的分布和全部系数 i 所决定. 在此有无穷多个自由参数,这对统计不方便,因此人们更关心只依赖有限个自由参数的线性时间序列,这就是线性时间序列的参数模型. 其中最常用的如ARMA模型. 对于非线性时间序列而言, 使用参数模型方法几乎是唯一的选择. 由于非线性函数的多样性, 带来了非线性时间序列模型的多样性. 但是, 迄今为止被研究得较多, 又有应用价值的非线性时序模型, 为数极少, 而且主要是针对非线性自回归模型. 在介绍此类模型之前, 我们先对非线性时序模型的分类作一概述.通用假定: {εt}为i.i.d.序列,且Eεt=0, 而且εt与{x t-1, x t-2,…}独立.可加噪声模型:x t=ϕ(x t-1,x t-2,…)+εt,t=1,2,…(2.1)其中ϕ(…)是自回归函数. 当它仅依赖于有限个未知参数时, 记此参数向量为α, 其相应的(2.1)模型常写成x t=ϕ(x t-1,x t-2,…;α)+εt,t=1,2,…(2.2)否则, 称(2.1)式称为非参数模型.关于(2.1)(2.2)的模型的平稳性, 要在下一章讨论, 但是, 它有类似于线性AR模型的几个简单性质, 是重要的而且容易获得的, 它们是:E(x t|x t-1,x t-2,…)=E{ϕ(x t-1,x t-2,…)+εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…)+E(εt|x t-1,x t-2,…)=ϕ(x t-1,x t-2,…) (2.3)var{x t|x t-1, x t-2 , …}≡E{[x t-ϕ(x t-1,…)]2|x t-1, x t-2 , …}= E{εt2|x t-1, x t-2 , …}= Eεt2=σ2. (2.4)P{x t<x|x t-1,x t-2, …}= P{ϕ(x t-1,…)+εt<x|x t-1,x t-2, …}= P{εt<x-ϕ(x t-1,…)|x t-1,x t-2, …}=Fε(x-ϕ(x t-1,…)). (2.5) 其中Fε是εt的分布函数.带条件异方差的模型:x t=ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)εt,t=1,2,…(2.6)其中ϕ(…)和S(…)也有限参数与非参数型之分, 这都是不言自明的. 另外, (2.6)式显然不属于可加噪声模型. 但是, 它比下面的更一般的非可加噪声模型要简单得多. 这可通过推广(2.3)(2.4)(2.5)式看出, 即有,E(x t|x t-1,x t-2,…)=E{ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)E{εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…) . (2.3)’var{x t|x t-1, x t-2 , …}≡E{[x t-ϕ(x t-1,…)]2|x t-1, x t-2 , …}=E{S2(x t-1,x t-2,…)εt2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)E{εt2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)σ2. (2.4)’P{x t<x|x t-1,x t-2, …}=P{ϕ(x t-1,…)+S(x t-1,…)εt<x|x t-1, x t-2 , …}= P{εt<[x-ϕ(x t-1,…)]/S(x t-1,…)}=Fε([x-ϕ(x t-1,…)]/S(x t-1,…)).(2.5)’一般非线性时序模型:x t=ψ(x t-1,x t-2,…; εt, εt-1,…)t=1,2,…(2.7)其中ψ(…)也有参数与非参数型之区别, 这也是不言自明的. 显然, (2.7)式既不是可加噪声模型, 也不属于(2.6)式的带条件异方差的模型. 虽然, 它可能具有条件异方差性质. 相反, 后两者都是(2.7)式的特殊类型. 虽说(2.7)式是更广的模型形式, 在文献中却很少被研究. 只有双线性模型作为它的一种特殊情况, 在文献中有些应用和研究结果出现.现写出其模型于后, 可供理解其双线性模型的含义x t=∑j=1pαj x t-j+∑j=1qβjεt-j+∑i=1P∑j=1Qθijεt-i x t-j.2. 非线性自回归模型在前一小节中的(2.1)和(2.2)式就是非线性自回归模型, 而且属于可加噪声模型类. 在这一小节里, 我们将介绍几种(2.2)式的常见的模型.函数后的线性自回归模型:f(x t)=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt,t=1,2,…(2.8)其中f(.)是一元函数, 它有已知和未知的不同情况, 不过总考虑单调增函数的情况, α=(α1,α2,…,αp)τ是未知参数. 在实际应用中, {x t}是可获得量测的序列.当f(.)是已知函数时, {f(x t)}也是可获得量测的序列, 于是只需考虑y t=f(x t)所满足的线性AR模型y t=α1y t-1+α2y t-2+...+αp y t-p+εt,t=1,2,…(2.9)此时可不涉及非线性自回归模型概念. 在宏观计量经济分析中, 常常对原始数据先取对数后, 再作线性自回归模型统计分析, 就属于此种情况. 这种先取对数的方法, 不仅简单, 而且有经济背景的合理解释,它反应了经济增长幅度的量化规律. 虽然在统计学中还有更多的变换可使用, 比如Box-Cox变换, 但是, 由于缺少经济背景的合理解释, 很少被使用. 由此看来, 当f(.)有实际背景依据时, 可以考虑使用(2.7)式的模型.当f(.)是未知函数时, {f(x t)}不是可量测的序列, 于是只能考虑(2.8)模型. 注意f(.)是单调函数, 可记它的逆变换函数为f-1(.), 于是由(2.8)模型可得x t= f-1(α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt),t=1,2,…(2.9)’此式属于(2.7)式的特殊情况, 此类模型很少被使用. 取而代之是考虑如下的模型x t=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt,t=1,2,…(2.10)其中f(.)是一元函数, 也有已知和未知之分, 可不限于单调增函数. 此式属于(2.1)式的特殊情况, 有一定的使用价值.当(2.10)式中的f(.)函数是已知时, 此式还有更进一步的推广模型,x t=α1f1(x t-1,…,x t-s)+α2f2(x t-1,…,x t-s)+...+αp f p(x t-1,…,x t-s)+εt,t=1,2,…(2.11)其中f k(…)(k=1,2,…,p)是已知的s元函数. 例如, 以后将要多次提到的如下的模型:x t =α1I(x t-1<0)x t-1+α2I(x t-1≥0)x t-1+εt ,t=1,2,… (2.12)其中I(.)是示性函数. 此模型是分段线性的, 是著名的TAR 模型的特殊情况. 为了有助于理解它, 我们写出它的分段形式:x t =.0,0,,111211≥<⎩⎨⎧++--t t t t x x x x εαεα t=1,2,…请注意, (2.8)(2.10)和(2.11)式具有一个共同的特征, 就是未知参数都以线性形式出现在模型中. 这一特点在统计建模时带来极大的方便. 此类模型便于实际应用. 但是, 对于{x t }而言不具有线性特性, 所以, 讨论它们的平稳解的问题, 讨论它们的建模理论依据问题,都需要借助于马尔可夫链的工具.已知非线性自回归函数的模型:x t =ϕ(x t-1,x t-2,…,x t-p ;α)+εt ,t=1,2,… (2.13)其中ϕ(…)是p 元已知函数, 但是其中含有未知参数α=(α1,α2,…,αp )τ.一般说来, α在一定范围内取值.例如,x t =tt t x x εαα++--212111, t=1,2,…其中α=(α1,α2)τ是未知参数, 它们的取值范围是: -∞<α<∞, 0≤α<∞.这里需要指出, 使用上式的模型, 不仅要借助于马尔可夫链的工具, 而且在统计建模时遇到两种麻烦, 其一是参数估计的计算麻烦, 二是确定ϕ(…)函数的麻烦. 一般来说, 只有根据应用背景能确定ϕ(…)函数时, 才会考虑使用此类模型.广义线性模型(神经网络模型):x t =ϕ(α1x t-1+α2x t-2+…+αp x t-p )+εt ,t=1,2,…(2.14)其中ϕ(.)是一元已知或未知函数, 参数α=(α1,α2,…,αp)τ总是未知的. 为保证模型的唯一确定性, 或者说是可识别性, 要对α作些约定, 其一, ||α||=1, 其二, α=(α1,α2,…,αp)τ中第一个非零分量为正的. 不难理解, 若不加这两条约定, 模型(2.14)不能被唯一确定.当ϕ(.)是一元已知函数时, 与神经网络模型相通.当ϕ(.)是一元未知函数时, 与回归模型中的PP方法相通.除了以上两类模型外, 还有(2.1)式的非参数自回归模型, 以及从统计学中引入的半参数自回归模型. 对它们的统计建模更困难. 本讲座主旨在于介绍如何用马尔可夫链的工具, 描述非线性自回归模型的基本特性问题, 对这类模型不再仔细讨论.。