当前位置:文档之家› 统计应用中聚类分析和时间序列ARMI模型简介

统计应用中聚类分析和时间序列ARMI模型简介

一、聚类分析

1.概念:聚类分析的职能是建立一种分类方法,它是将一批样品或变量,按照它们在性质上的亲疏程度进行分类。或者说,聚类分析就是要找出具有相近程度的点或类聚为一类;
距离的种类很多,其中欧式距离在聚类分析中用得最广,它的表达式如下:
2.步骤:应用系统聚类法进行聚类分析的步骤如下:
①确定待分类的样品的指标;
②收集数据;
③对数据进行变换处理(如标准化或规格化);
④使各个样品自成一类,即n个样品一共有n类;
⑤计算各类之间的距离,得到一个距离对称矩阵,将距离最近的两个类并成一类;
⑥并类后,如果类的个数大于1,那么重新计算各类之间的距离,继续并类,直至所有样品归为一类为止;
⑦最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。
3.聚类分析的种类

二、ARIMA模型

(一) ARMA模型三种基本形式:自回归模型(AR:Auto-regressive),移动平均模型(MA:Moving-Average)和混合模型(ARMA:Auto-regressive Moving-Average)。
ARMA模型全称为自回归移动平均模型(Autoregressive Moving Average Model,简记ARIMA),是由博克思(Box)和詹金斯(Jenkins)于70年代初提出的一著名时间序列预测方法,所以又称为box-jenkins模型、博克思-詹金斯法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归, p为自回归项; MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。

ARIMA模型的基本思想

ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。现代统计方法、计量经济模型在某种程度上已经能够帮助企业对未来进行预测。


ARIMA模型预测的基本程序

(1)根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,经济运行的时间序列都不是平稳序列。
(2)对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。
(3)根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列

的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。
(4)进行参数估计,检验是否具有统计意义。
(5)进行假设检验,诊断残差序列是否为白噪声。
(6)利用已通过检验的模型进行预测分析。
白噪声(White noise):白噪声一个平稳的随机过程满足下列条件的随机过程称为白噪声,记为:
注:所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。直观上,一个平稳的时间序列可以看作一条围绕其均值上下波动的曲线。根据平稳时间序列分析的理论可知,当 时,该序列{Yt}是平稳的,此模型是经典的Box-Jenkins时间序列AR(1)模型。
因此,检验序列的非平稳性就变为检验特征方程是否有单位根,这就是单位根检验方法的由来 。
时间序列的非平稳性:是指时间序列的统计规律随着时间的位移而发生变化,即生成变量时间序列数据的随机过程的特征随时间而变化。
DF检验:统计学家Dickey、Fuller得到DF检验的临界值,并编制了DF检验临界值表供查。在进行DF检验时,比较t统计量值与DF检验临界值,就可在某个显著性水平上拒绝或接受原假设。
ADF检验:Augmented Dickey-Fuller检验(ADF检验):DF检验存在的问题是,在检验所设定的模型时,假设随机扰动项不存在自相关。但大多数的经济数据序列是不能满足此项假设的,当随机扰动项存在自相关时,直接使用DF检验法会出现偏误,为了保证单位根检验的有效性,人们对DF检验进行拓展,从而形成了扩展的DF检验(Augmented Dickey-Fuller Test),简称为ADF检验。
DF和ADF检验的步聚:
计算在原假设成立的条件下t统计量值,查DF检验临界值表得临界值,然后将t统计量值与DF检验临界值比较:
若t统计量值小于DF检验临界值,则拒绝原假设,说明序列不存在单位根;说明是平稳序列。
若t统计量值大于或等于DF检验临界值,则接受原假设,说明序列存在单位根;有单位根说明非平稳。
(二)平稳性检验方法
1. 单位根方法
2. 自相关函数法
3. DF检验方法
4. 如果该特征方程的所有根在单位圆外(根的模大于1),则AR(p)模型是平稳的。特征根z=1/j ,当|j|<1,则表示特征根大于1,说明是平稳的,否则是非平稳的。

相关主题
文本预览
相关文档 最新文档