时间序列分析——最经典的
- 格式:doc
- 大小:803.50 KB
- 文档页数:64
【时间简“识”】说明:本文摘自于经管之家(原人大经济论坛) 作者:胖胖小龟宝。
原版请到经管之家(原人大经济论坛) 查看。
1.带你看看时间序列的简史现在前面的话——时间序列作为一门统计学,经济学相结合的学科,在我们论坛,特别是五区计量经济学中是热门讨论话题。
本月楼主推出新的系列专题——时间简“识”,旨在对时间序列方面进行知识扫盲(扫盲,仅仅扫盲而已……),同时也想借此吸引一些专业人士能够协助讨论和帮助大家解疑答惑。
在统计学的必修课里,时间序列估计是遭吐槽的重点科目了,其理论性强,虽然应用领域十分广泛,但往往在实际操作中会遇到很多“令人发指”的问题。
所以本帖就从基础开始,为大家絮叨絮叨那些关于“时间”的故事!Long long ago,有多long?估计大概7000年前吧,古埃及人把尼罗河涨落的情况逐天记录下来,这一记录也就被我们称作所谓的时间序列。
记录这个河流涨落有什么意义?当时的人们并不是随手一记,而是对这个时间序列进行了长期的观察。
结果,他们发现尼罗河的涨落非常有规律。
掌握了尼罗河泛滥的规律,这帮助了古埃及对农耕和居所有了规划,使农业迅速发展,从而创建了埃及灿烂的史前文明。
好~~从上面那个故事我们看到了1、时间序列的定义——按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。
2、时间序列分析的定义——对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。
既然有了序列,那怎么拿来分析呢?时间序列分析方法分为描述性时序分析和统计时序分析。
1、描述性时序分析——通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。
2、统计时序分析(1)频域分析方法原理:假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动∙发展过程:1)早期的频域分析方法借助富里埃分析从频率的角度揭示时间序列的规律2)后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数3)20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段∙特点:非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性(2)时域分析方法∙原理:事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,这种相关关系通常具有某种统计规律。
时间序列分析中的ARIMA模型时间序列分析是一种对时间序列数据进行分析和预测的模型,在现代经济学、金融学、气象学、物理学、工业生产等领域中有着广泛的应用。
ARIMA模型是时间序列分析中最为基础和经典的模型之一,其对于时间序列的平稳性、趋势性及季节性进行分解后,通过自相关函数和偏自相关函数的分析,得出模型的阶数和参数,进而进行模拟、预测和检验等步骤。
一、时间序列分析简介时间序列通常是指在某个时间段内,观测某种现象的数值,如个人月收入、经济指标、气温等。
时间序列的基本特点有趋势性、季节性、周期性、自相关和非平稳性等。
时间序列分析的目的就是对序列进行建模,找出序列中的规律性和非规律性,并对序列进行预测。
时间序列建模的基础是对序列的平稳性进行分析,若序列在时间上呈现平稳性,则可以使用分析预测方法来建模;反之,若序列不满足平稳性的要求,则需要进行差分处理,将其转换为平稳时间序列,再进行建模。
二、ARIMA模型的概述ARIMA模型是自回归移动平均模型的简称,该模型由自回归模型(AR)和移动平均模型(MA)组成,是时间序列分析中最为经典的模型之一。
ARIMA模型是一种线性模型,对于简单的时间序列分析具有良好的解释性,同时模型的表现能力也比较强。
ARIMA模型对于时间序列的建模和预测主要涉及三个方面:趋势项(Trend)、季节项(Seasonal)和误差项(Error)。
趋势项指的是时间序列中的长期趋势,在某一个方向上呈现出来的变化;季节项指的是时间序列中呈现出来的周期性变化;误差项指的是时间序列的随机波动。
ARIMA模型通常用一个(p, d, q)的表示方式描述,其中,p是自回归项数,d是差分次数,q是滑动平均项数。
P 和q 分别定义了线性拟合时窗口函数的大小,模型的复杂度取决于 p,d 和 q 的选择。
ARIMA模型主要分为“定常”和“非定常”模型两大类。
在建模中,首先需要检验时间序列的平稳性,若时间序列不符合平稳性的要求,则需要进行差分操作,将其转化为平稳的时间序列。
时间序列的分析方法时间序列分析是指通过对时间序列数据进行统计学和数学模型的建立和分析,以预测和解释时间序列的未来走势和规律。
它是应用统计学和数学方法研究时间序列数据特点、规律、变化趋势,以及建立模型进行分析和预测的一种方法。
时间序列数据是按照时间顺序记录的数据,比如月度销售额、季度GDP增长率、年度股票收盘价等。
时间序列分析的目的是从历史数据中发现数据的模式,以便更好地理解现象、做出预测和制定决策。
时间序列分析主要有以下几种方法:1. 数据可视化方法数据可视化是分析时间序列数据的重要方法,可以通过绘制数据的折线图、柱状图、散点图等来观察数据的趋势、周期性、季节性等特点。
2. 描述性统计方法描述性统计是对时间序列数据的集中趋势、离散程度和分布形态进行描述的方法。
常用的描述性统计指标有均值、标准差、最大值、最小值等。
3. 平稳性检验方法平稳性是时间序列分析的重要假设,即时间序列在长期内的统计特性保持不变。
平稳性检验可以通过观察数据的图形、计算自相关函数、进行单位根检验等方法来判断时间序列是否平稳。
4. 时间序列分解方法时间序列分解是将时间序列数据分解为趋势成分、周期成分和随机成分的方法。
常用的时间序列分解方法有经典分解法和X-11分解法。
5. 自回归移动平均模型(ARMA)方法ARMA模型是时间序列的常用统计学模型,可以描述时间序列数据的自相关和滞后移动平均关系。
ARMA模型包括两个部分,AR(p)模型用来描述自回归关系,MA(q)模型用来描述移动平均关系。
6. 自回归积分滑动平均模型(ARIMA)方法ARIMA模型是ARMA模型的扩展,加入了差分操作,可以处理非平稳时间序列。
ARIMA模型通常用于对非平稳时间序列进行平稳化处理后的建模和预测。
7. 季节性模型方法对于具有明显季节性的时间序列数据,可以采用季节性模型进行分析和预测。
常用的季节性模型有季节性ARIMA模型、季节性指数平滑模型等。
8. 灰色模型方法灰色模型是一种适用于少量样本的时间序列建模和预测方法,它主要包括GM(1,1)模型和GM(2,1)模型。
时间序列分析方法时间序列分析是一种常见的统计分析方法,它研究的是定量和定性的数据的动态变化情况,能反映系统潜在变化的趋势和规律,并且能通过预测技术预测未来趋势。
时间序列分析是研究随时间变化的数据可靠性和有效性的重要工具,能够发现其中的趋势和变化规律,从而帮助企业和投资者更全面地了解各种现象,更好地进行决策和行为分析。
时间序列分析可以通过应用不同的统计方法来完成,例如自相关分析、序列回归分析、协整和非线性统计分析等。
1.自相关分析自相关分析(AutoRegressive Analysis)是分析时间序列上延迟自身的统计方法,主要是描述时间序列动态变化趋势和长时间趋势。
它主要利用某一特定时刻以前t个时刻的数据来预测该时刻的值,并用一个具有时间序列模型来计算,如指数移动平均(EMA)和ARMA (Autoregressive Moving Average)等。
自相关分析的优点是简单容易,能够充分发挥时间序列的短期显著特征,缺点是只能反映短期的趋势,无法发现和分析长期的趋势。
2.序列回归序列回归(Sequence Regression)是一种统计学方法,它根据时间序列的趋势,建立一种回归关系,利用某一特定时刻以前n个时刻的数据,预测该时刻的数值,并以此来表示时间序列的趋势,如线性回归、非线性回归等。
序列回归的优点是能够表示时间序列上一些重要的长期特征,缺点是忽略了时间序列上短期的变化特征。
3.协整分析协整分析(Cointegration Analysis)是指时间序列上两个或多个序列的滞后值的长期关系。
它通过检验两个序列的相关度分析系统的同步变化,检测出两个长期运动不相关的非零均值,并利用协整分析模型来预测未来的发展趋势。
协整分析的优点是能够发现时间序列上的长期趋势,缺点是忽略了短期变化特征,而且模型拟合效果不太好。
4.非线性统计分析非线性统计分析(Nonlinear Statistical Analysis)是时间序列分析的一种方法,它可以用来描述一个序列的非线性变化特性,如分析非线性的自相关系数、分析变量的越界规律、预测变量系统整体特性,如混沌理论等。
浅谈时间序列分析——以ARIMA为例时间序列分析是运用统计学中的方法,对一系列按时间顺序排列的数据进行分析和预测的一种方法。
它可以帮助我们理解时间序列数据的趋势、季节性、周期性和随机性等特征,进而进行预测和决策。
ARIMA模型是时间序列模型中最常用的一种,它的全称是自回归移动平均模型(AutoRegressive Integrated Moving Average Model)。
ARIMA模型通过对时间序列进行差分、自回归和移动平均等操作,建立了一个线性的预测模型。
主要分为三个部分:自回归(AR)、差分(Integrated)和移动平均(MA)。
首先,自回归过程是指时间序列的当前值与前几个值之间的线性关系。
例如,AR(1)模型表示当前值与前一个值之间存在线性关系。
自回归的阶数p代表了与前p个值相关的线性关系。
自回归过程可以表示为:Y(t)=c+ϕ1*Y(t-1)+…+ϕp*Y(t-p)+ε(t)其中,c是常数项,ϕ1,…,ϕp是模型的系数,Y(t)是时间序列的当前值,Y(t-1),…,Y(t-p)是前p个时刻的值,ε(t)是白噪声误差。
其次,差分过程是为了消除非平稳性,使得时间序列变得平稳。
差分操作简单地说就是对时间序列的当前值与前一个值之间的差。
差分的阶数d代表了操作的次数。
差分过程可以表示为:dY(t)=Y(t)-Y(t-1)然后,移动平均过程是指时间序列的当前值与前几个误差项之间的线性关系。
例如,MA(1)模型表示当前值与前一个误差项之间存在线性关系。
移动平均的阶数q代表了与前q个误差项相关的线性关系。
移动平均过程可以表示为:Y(t)=c+θ1*ε(t-1)+…+θq*ε(t-q)+ε(t)其中,c是常数项,θ1,…,θq是模型的系数,ε(t-1),…,ε(t-q)是前q个时刻的误差项,ε(t)是当前时刻的误差项。
综上所述,ARIMA模型就是将自回归、差分和移动平均三个过程结合起来建立一个线性预测模型,用于对时间序列进行分析和预测。
时间序列分析技巧例题和知识点总结时间序列分析是一种用于研究数据随时间变化规律的重要方法,在众多领域都有着广泛的应用,如经济学、金融学、气象学、工程学等。
通过对时间序列数据的分析,我们可以预测未来的趋势、发现周期性模式、识别异常值等。
接下来,让我们通过一些例题来深入理解时间序列分析的技巧,并对相关知识点进行总结。
一、时间序列的基本概念时间序列是按照时间顺序排列的一组数据点。
它可以是等间隔的,比如每小时、每天、每月的观测值,也可以是不等间隔的。
时间序列数据通常具有趋势性、季节性、周期性和随机性等特征。
二、常见的时间序列模型1、自回归模型(AR)自回归模型假设当前值与过去若干个值存在线性关系。
例如,一阶自回归模型 AR(1)可以表示为:$Y_t =\phi_1 Y_{t-1} +\epsilon_t$,其中$\phi_1$是自回归系数,$\epsilon_t$是随机误差项。
2、移动平均模型(MA)移动平均模型则认为当前值是由过去若干个随机误差项的线性组合构成。
一阶移动平均模型 MA(1)表示为:$Y_t =\epsilon_t +\theta_1 \epsilon_{t-1}$。
3、自回归移动平均模型(ARMA)ARMA 模型是 AR 模型和 MA 模型的组合,即同时考虑了序列的自相关性和随机性。
例如,ARMA(1,1)模型为:$Y_t =\phi_1 Y_{t-1} +\epsilon_t +\theta_1 \epsilon_{t-1}$。
4、自回归整合移动平均模型(ARIMA)对于非平稳的时间序列,需要先进行差分使其平稳,然后再应用ARMA 模型,这就是 ARIMA 模型。
三、时间序列分析的步骤1、数据可视化首先,绘制时间序列的折线图或柱状图,直观地观察数据的趋势、季节性和异常值。
2、平稳性检验平稳性是时间序列分析的重要前提。
常用的检验方法有单位根检验(如 ADF 检验),如果检验结果拒绝存在单位根,则序列是平稳的;否则,需要进行差分处理使其平稳。
【时间简“识”】说明:本文摘自于经管之家(原人大经济论坛) 作者:胖胖小龟宝。
原版请到经管之家(原人大经济论坛) 查看。
1.带你看看时间序列的简史现在前面的话——时间序列作为一门统计学,经济学相结合的学科,在我们论坛,特别是五区计量经济学中是热门讨论话题。
本月楼主推出新的系列专题——时间简“识”,旨在对时间序列方面进行知识扫盲(扫盲,仅仅扫盲而已……),同时也想借此吸引一些专业人士能够协助讨论和帮助大家解疑答惑。
在统计学的必修课里,时间序列估计是遭吐槽的重点科目了,其理论性强,虽然应用领域十分广泛,但往往在实际操作中会遇到很多“令人发指”的问题。
所以本帖就从基础开始,为大家絮叨絮叨那些关于“时间”的故事!Long long ago,有多long估计大概7000年前吧,古埃及人把尼罗河涨落的情况逐天记录下来,这一记录也就被我们称作所谓的时间序列。
记录这个河流涨落有什么意义当时的人们并不是随手一记,而是对这个时间序列进行了长期的观察。
结果,他们发现尼罗河的涨落非常有规律。
掌握了尼罗河泛滥的规律,这帮助了古埃及对农耕和居所有了规划,使农业迅速发展,从而创建了埃及灿烂的史前文明。
好~~从上面那个故事我们看到了1、时间序列的定义——按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。
2、时间序列分析的定义——对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。
既然有了序列,那怎么拿来分析呢?时间序列分析方法分为描述性时序分析和统计时序分析。
1、描述性时序分析——通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。
~2、统计时序分析(1)频域分析方法原理:假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动发展过程:1)早期的频域分析方法借助富里埃分析从频率的角度揭示时间序列的规律2)后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数3)20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段特点:非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性(2)时域分析方法原理:事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,这种相关关系通常具有某种统计规律。
目的:寻找出序列值之间相关关系的统计规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型预测序列未来的走势特点:理论基础扎实,操作步骤规范,分析结果易于解释,是时间序列分析的主流方法】楼主,说了半天,你终于到正题了,时域分析才是我们经常接触的,你赶紧说说怎么做吧?★时域分析方法的分析步骤:考察观察值序列的特征根据序列的特征选择适当的拟合模型根据序列的观察数据确定模型的口径检验模型,优化模型利用拟合好的模型来推断序列其它的统计性质或预测序列将来的发展时域分析方法的发展过程基础阶段——):1927年,AR模型:1931年,MA模型,ARMA模型核心阶段——和1970年,出版《Time Series Analysis Forecasting and Control》提出ARIMA模型(Box—Jenkins 模型)Box—Jenkins模型实际上是主要运用于单变量、同方差场合的线性模型完善阶段——异方差场合:Robert ,1982年,ARCH模型Bollerslov,1985年GARCH模型多变量场合:,1987年,提出了协整(co- integration)理论非线性场合:汤家豪等,1980年,门限自回归模型用哪些软件可以做时间序列分析呢?S-plus,Matlab,Gauss,TSP,Eviews 和SAS上述软件楼主觉得Eviews是基础版,Gauss是小众版,Matlab&S-pluss是正常小青年~~SAS,万能的软件BOSS啊~~~下一辑——时间序列的预处理!敬请关注!【时间简“识”】2.那些必不可少的预处理 - 计量经济学与统计软件 - 经管之家(原人大经济论坛)2012-7-27本帖最后由—经管之家(原人大经济论坛)胖胖小龟宝于 2014-12-12 09:12 编辑上一辑预告说啦~~本期的主题是时间序列的预处理~~序列在建模前到底要做哪些预处理呢首先,大伙都知道的平稳性检验是必须的!说到平稳,其实有两种平稳——宽平稳、严平稳严平稳相较于宽平稳来说,条件更多更严格,而我们时常运用的时间序列,大多宽平稳就够了~~什么是严平稳:是在固定时间和位置的概率分布与所有时间和位置的概率分布相同的随机过程。
这样,数学期望和方差这些参数也不随时间和位置变化。
(比如白噪声)什么是宽平稳:宽平稳是使用序列的特征统计量来定义的一种平稳性。
它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。
|两者关系:一般关系:严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立。
特例:不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列。
当序列服从多元正态分布时,宽平稳可以推出严平稳。
如何判断序列是平稳的咱们这次先从图形法上看(通常越是简单的方法,往往越能看到问题,图形给出的第一感觉也许就是真相哦~~~~)时序图,例如(eviews画滴):分析:什么样的图不平稳,先说下什么是平稳,平稳就是围绕着一个常数上下波动。
看看上面这个图,很明显的增长趋势,不平稳。
$我们还可以根据自相关和偏相关系数来查看:还以上面的序列为例:用eviews得到自相关和偏相关图,Q统计量和伴随概率。
分析:平稳的序列的自相关图和偏相关图不是拖尾就是截尾。
截尾就是在某阶之后,系数都为 0 ,怎么理解呢,看上面偏相关的图,当阶数为 1 的时候,系数值还是很大, . 二阶长的时候突然就变成了 . 后面的值都很小,认为是趋于 0 ,这种状况就是截尾。
再就是拖尾,拖尾就是有一个衰减的趋势,但是不都为 0 。
自相关图既不是拖尾也不是截尾。
以上的图的自相关是一个三角对称的形式,这种趋势是单调趋势的典型图形。
下面是通过自相关的其他功能如果自相关是拖尾,偏相关截尾,则用 AR 算法如果自相关截尾,偏相关拖尾,则用 MA 算法如果自相关和偏相关都是拖尾,则用 ARMA 算法, ARIMA 是 ARMA 算法的扩展版,用法类似。
一定有同学要问了:楼主检测出来不是平稳的怎么办啊(楼主:当然要把它整平稳啦~~)如果遇到数据检测出来不平稳,可以考虑使用差分这个最常用的办法(当然,还有好多种其他方法处理)还是上面那个序列,两种方法都证明他是不靠谱的,不平稳的。
确定不平稳后,依次进行1阶、2阶、3阶...差分,直到平稳位置。
先来个一阶差分:从图上看,一阶差分的效果不错,看着是平稳的。
在图形检验法中,我们能够较为直观的看到数据的一个大致变动趋势,如果它有周期或者上升等趋势,一般就不太平稳,需要做些处理,但图形始终是个主管判断为主的方法,这次,就来说说平稳检验的另一个方法:单位根检验(ADF检验)。
%ADF检验简介:检查序列平稳性的标准方法是单位根检验。
有6种单位根检验方法:ADF检验、DFGLS检验、PP检验、KPSS检验、ERS检验和NP检验,本节将介绍DF检验、ADF检验。
ADF检验和PP检验方法出现的比较早,在实际应用中较为常见,但是,由于这2种方法均需要对被检验序列作可能包含常数项和趋势变量项的假设,因此,应用起来带有一定的不便;其它几种方法克服了前2种方法带来的不便,在剔除原序列趋势的基础上,构造统计量检验序列是否存在单位根,应用起来较为方便。
ADF检验是在Dickey-Fuller检验(DF检验)基础上发展而来的。
因为DF检验只有当序列为AR(1)时才有效。
如果序列存在高阶滞后相关,这就违背了扰动项是独立同分布的假设。
在这种情况下,可以使用增广的DF检验方法(augmented Dickey-Fuller test )来检验含有高阶序列相关的序列的单位根。
检验步骤(一般进行ADF检验要分3步): 1 对原始时间序列进行检验,此时第二项选level,第三项选None.如果没通过检验,说明原始时间序列不平稳; 2 对原始时间序列进行一阶差分后再检验,即第二项选1st difference,第三项选intercept,若仍然未通过检验,则需要进行二次差分变换; 3 二次差分序列的检验,即第二项选择2nd difference ,第四项选择Trend and intercept.一般到此时间序列就平稳了! tips: 在进行ADF检验时,必须注意以下两个实际问题:(1)必须为回归定义合理的滞后阶数,通常采用AIC准则来确定给定时间序列模型的滞后阶数。
在实际应用中,还需要兼顾其他的因素,如系统的稳定性、模型的拟合优度等。
(2)可以选择常数和线性时间趋势,选择哪种形式很重要,因为检验显著性水平的 t 统计量在原假设下的渐近分布依赖于关于这些项的定义。
①若原序列中不存在单位根,则检验回归形式选择含有常数,意味着所检验的序列的均值不为0;若原序列中存在单位根,则检验回归形式选择含有常数,意味着所检验的序列具有线性趋势,一个简单易行的办法是画出检验序列的曲线图,通过图形观察原序列是否在一个偏离 0 的位置随机变动或具有一个线性趋势,进而决定是否在检验时添加常数项。
②若原序列中不存在单位根,则检验回归形式选择含有常数和趋势,意味着所检验的序列具有线性趋势;若原序列中存在单位根,则检验回归形式选择含有常数和趋势,意味着所检验的序列具有二次趋势。
同样,决定是否在检验中添加时间趋势项,也可以通过画出原序列的曲线图来观察。
如果图形中大致显示了被检验序列的波动趋势呈非线性变化,那么便可以添加时间趋势项。
本例所选择的基础数据是每日收盘价,上证指数日数据从 1990-12-19至2011-8-9,样本容量为5058,周数据从1990-12-21至2011-8-9,样本容量为1043,深证成指日数据从1991-4-3至 2011-8-9,样本容量为4998,周数据从1991-4-5至2011-8-9,样本容量为1070。
在证券市场的实证研究中,通常使用收益率即价格的变化而非价格本身,因为证券价格之间存在明显的序列相关性和趋势性,使得许多分析方法不能使用。
在本例中,所采用的数据为收盘价的对数收益序列。
在本例中,通过软件操作得到如下图:运用传统的ADF检验检验时间序列的平稳性,我们发现,上证、深证投资基金日、周收盘指数的对数收益率序列都是平稳的。