当前位置:文档之家› 基于时间序列分析及Clementine软件的宝钢股价研究

基于时间序列分析及Clementine软件的宝钢股价研究

基于时间序列分析及Clementine软件的宝钢股价研究
基于时间序列分析及Clementine软件的宝钢股价研究

毕 业 论 文

二○一二 年 六

基于时间序列分析及Clementine软件的宝

钢股价研究

专业班级:数学与应用数学2008级1班姓名:XX

指导教师:XX

数学系

摘要

时间序列是按照时间顺序取得的一系列观测值,现实中的很多数据都是以时间序列的形式出现的:一个工厂每月生产的一系列货物数量,每周道路事故的一系列数据,每小时观察的药品生产产量。时间序列的例子在一些领域中是极丰富的,诸如经济,商业,工程等。时间序列分析典型的一个本质特征就是相邻观测值之间的依赖性。时间序列观测值之间的这种依赖特征具有重要的现实意义。时间序列分析所论及的就是对这种依赖性进行分析的技巧。要求对时间序列数据生成随机动态模型,并将这种模型用于重要的应用领域。

本文的主要内容是借助SPSS Clementine 软件研究宝山钢铁股票价格随时间的变化规律,并用时间序列分析的有关知识对其进行建模预测。本文分两部分:第一部分介绍时间序列分析的一些基本概念,如平稳过程、自相关函数、偏相关函数、白噪声等,然后对几种时间序列模型进行描述;另一部分借助SPSS Clementine 软件对宝山钢铁股价这一具体事例分别用专家建模、指数平滑建模和ARIMA建模并对股价进行短期预测,最后通过模型参数比较及预测值误差对比,找出最佳模型。在给案例建模的同时,将给出使用SPSS Clementine软件研究的具体过程。

关键词:时间序列;SPSS Clementine软件;宝钢股价;模型比较

Abstract

The time series is a sequence of observations taken sequentially in time. Many sets of data appear as time series in reality: a monthly sequence of the quantity of goods shipped from a factory, a weekly series of the number of traffic accidents, hourly observations made on the yield of a chemical process, and so on. Examples of time series abound in such fields as economics, business, engineering and so on. The nature of this dependenced among observations of a time series is of considerable practical interest. Time series analysis is concerned with techniques for the analysis of this dependence. This requires the development of stochastic and dynamic models for time series data and the use of such models in important areas of application.

The main task of this dissertation is to have a research on the law of the varying number of the stock price of the Baoshan iron and steel company. In this study, we will make the use of the software SPSS Clementine and create the models of the stock price by using the time series analysis. To begin with, this dissertation briefly introduces some basic concepts such as stationery process, autocorrelation function partial correlation functions and white noise about the time series analysis. In addition, this dissertation begins to talk in detail about several fundamental time series models and the properties of the ACF and PACF belonging to the four fundamental models. Then, with the help of the software SPSS Clementine, we will establish models by three measures on the times series of the stock price and forecast short-term price. Finally, the model parameters and predictive value of the price should be compared to identify the best model. In the case, the dissertation offers the process of the software modeling in detail.

Key words: the time series analysis; SPSS Clementine software; Baoshan iron and steel company stock price; model comparison

目录

第1章绪论 (1)

1.1时间序列的概念 (1)

1.2时间序列的应用 (1)

1.3本文的主要内容及安排 (2)

第2章基本概念 (3)

2.1 随机过程 (3)

2.2自协方差和自相关系数 (4)

2.3偏自相关函数 (5)

2.4白噪声过程 (7)

2.5均值、自协方差和自相关的估计 (8)

2.5.1样本均值 (8)

2.5.2样本自协方差函数 (9)

2.5.3 样本自相关函数 (11)

2.5.4 样本偏自相关函数 (12)

2.6 本章小结 (13)

第3章时间序列模型及Clementine软件介绍 (14)

3.1指数平滑模型 (14)

3.1.1 基本公式 (14)

3.1.2 指数平滑标准 (14)

3.2ARIMA模型 (15)

3.2.1自回归过程 (15)

3.2.2移动平均过程 (17)

3.2.3AR(p)过程和MA(q)过程的对偶关系 (17)

3.2.4自回归求和平稳模型 (19)

3.2.5 自回归、滑动平均、ARIMA模型性质比较 (20)

3.3模型识别与选择 (21)

3.3.1 模型识别的步骤 (21)

3.3.2 矩方法 (22)

3.3.3极大似然方法 (23)

3.3.4模型选择准则 (24)

3.3.5 模型简易选择 (25)

3.4 对Clementine软件的概述 (26)

3.4.1 Clementine的窗口 (26)

3.4.2数据流的基本管理和执行 (28)

3.5 本章小结 (29)

第4章基于Clementine软件的对宝钢股价建模分析 (30)

4.1对宝钢历年股价进行预处理 (30)

4.2 对宝钢最近2年股价进行建模分析 (31)

4.2.1 模型建立 (31)

4.2.2 模型分析及比较 (36)

结论 (42)

参考文献 (43)

致谢 (44)

基于时间序列分析及Clementine软件的宝

钢股价研究

第1章绪论

1.1时间序列的概念

时间序列(Time series) 从字面意思上看它是与时间相关的一组序列,针对某一种现象,在一个确定的统计指标下可以获得不同时间上的各个数据,将这些数据按照时间先后的顺序排列成一组序列,便构成了一组时间序列。时间也并非是唯一的观测度量,有时可以根据其他度量来观测,如空间。

时间序列法作为一种定量的数据预测方法,经过数十年的不断发展与完善,已被广泛应用于统计学研究中。

时间序列分析(Time series analysis) 是建立在随机过程与数理统计学理论基础上的一种统计方法,该方法适用于动态数据处理,以解决生产、经济中的实际问题为目的[1]。

1.2时间序列的应用

时间序列现象广泛存在于各个领域中:在农业领域,我们关注农产品的年产量及其价格等;在经济和商业领域,我们关注股票的日收盘价格、周利息率、月价格指数、季销售额和年利率等;在工程领域,我们观测声音、电流和电压等;在地球物理领域,我们记录湍流,一个地区的海浪和地球噪声等;在医学研究领域,我们测量脑电图和心电图追踪等;在气象学领域,我们观测每小时风速、每日温度和年度降雨量等;在质量控制领域,我们根据某目标值监测一个过程;在社会学领域,我们研究年度出生率、死亡率、事故发生率和各种犯罪率等。此外,时间序列被用于观测和研究的领域还有很多。

对时间序列的研究基于各种各样不同的目的,它们包括对数据生成机制的理解和描述,对未来值的预报,以及实现系统的最优化控制。时间序列其本质主要表现为:一组观察值之间是相互依赖或相关的;观测值是有序的。因此,以独立性假设为基础的统计方法和技术将不再适用,需要建

立有别于传统的新的统计方法。我们把用于时间序列统计的方法学称为时间序列分析[2]。

1.3本文的主要内容及安排

本文的主要目的是介绍时间序列分析相关的各种方法概念与模型,利用SPSS Clementine 软件研究宝山钢铁股票价格随时间的变化规律,并用时间序列的有关知识进行建模分析。本文的主要安排:

第一章:绪论,对本文的内容进行简要概述。

第二章:介绍时间序列的一些基本概念,如随机过程、平稳过程、自相关函数和偏相关函数、白噪声过程等。

第三章:介绍了案例中需要用到的几种模型,并进行简要对比;对SPSS Clementine 软件进行简单介绍。

第四章:通过宝山钢铁股价这一案例具体介绍使用Clementine软件建立时间序列模型的步骤与方法,并对模型参数进行分析比较,确定最佳模型。

对本文进行总结。

第2章 基本概念

2.1 随机过程

随机过程是以时间为标号的一组随机变量(,)Z t ω,其中ω属于某个样本空间,t 属于某个标号集。对于固定的t ,(,)Z t ω 是一个随机变量。对于给定的ω,(,)Z t ω 是t 的函数,我们把它称作样本函数或实现。所有可能实现的全体称为随机过程和时间序列分析。因此,一个时间序列就是来自某个随机过程的样本函数或实现。为了对时间序列分析有一个正确的认识,我们在本节引入了随机过程的一些基本概念。

假设指标集是所有整数的集合。考虑一个来自随机过程

{(,):0,1,2,}Z t t ω=±± 的有限随机变量集12{,,,}n t t t Z Z Z ,其n 维分布函数可

定义为

11

,,11(,,){:,,}t t n n

Z Z n t t n F x x P Z x Z x ω=≤≤ (2.1)

其中i x ,1,,i n = 是任意实数。如果其一维分布函数是时不变的,及对任意整数1t ,k 和1t k +有1

1

11()()t t k Z Z F x F x +=,这个过程称为依次分布一阶平稳。依

分布二阶平稳是指对于任意整数1t ,2t ,k ,1t k +和2t k +有

1

2

1

2

,12,12(,)(,)t t t k t k Z Z Z Z F x x F x x ++=成立;从而,依分布n 阶平稳是指

1

1

,,1,,1(,,)(,,)t t t k t k n

n

Z Z n Z Z n F x x F x x ++= (2.2)

对于任意n 元组 1(,,)n t t 和整数k 成立。若对任意整数n (1,2,)n = ,公式 (2.2) 成立,则该过程被称为严平稳过程。

对于实值过程{:0,1,2,}t Z t =±± ,定义该过程的均值函数为

()t t E Z μ= (2.3)

该过程的方差函数为

22()t t t E Z σμ=- (2.4)

1t Z 和2t Z 间的协方差函数为

12112212(,)()()t t t t t t Z Z t t E Z Z γμμ=-- (2.5)

1t Z 和2t Z 间的相关函数为

12(,)t t ρ=

(2.6)

对于一个严平稳过程,分布函数对于所有的t 都是一样的,若(||)t E Z <∞,则均值函数1μμ=,是一个常数。若2()t E Z <∞,则对所有的t ,有22t σσ=,也是一个常数,再进一步,由1

2

1

2

,12,12(,)(,)t t t k t k Z Z Z Z F X X F X X ++=对1t ,2t 和k 取

任意值时都成立,我们有

(2.7)

以及

(2.8) 令1t t k =-,2t t =,可以得到

(2.9)

以及

(2.10)

因此,对于前两阶矩有限的严平稳过程,t Z 和t k Z +之间的协方差和相关仅依赖于时间差k [3]。

2.2 自协方差和自相关系数

时间序列相邻值之间是有依赖性的,对于一个平稳过程{}t Z ,如果其时间间隔为k ,那么对于任意时间t ,t Z 和t k Z +之间的协方差都是相同的,我们将其称为滞后k 的自协方差,表达式如下

)-)(Z -(Z )Z ,(Z k t t k t t k μμγ++==E Cov (2.11)

t Z 和t k Z +之间的相关为

1212(,)(,)

t t t k t k γγ=++1212(,)(,)t t t k t k ρρ=++12(,)(,)(,)k t t t k t t t k γγγγ=-=+=12(,)(,)(,)k

t t t k t t t k ρρρρ=-=+=

k

k t t k t t k )

(Z )(Z )Z ,(Z γγρ=

=

++Var Var Cov (2.12) 其中,0k t t )(Z )(Z γ==+Var Var ,作为k 的函数,k γ称为自协方差函数,k ρ称为自相关函数(autocorrelation function 简称ACF ),因为它们描述同一过程中相距k 个时滞的t Z 和t k Z +之间的协方差和相关性。

平稳时间序列{}t Z 的自协方差函数列}{k γ与自相关函数列}{k ρ具有以下的性质:

(1) 对称性:k -k γγ=,k -k ρρ=;

(2) 非负定性:系列{,0,1,2,}k k γ= 与{,0,1,2,}k k ρ= 都是非负定序列,

即对任意正整数m ,????? ??=01-m 1-m 0m γγγγγ ,????

? ??=111-m 1-m m ρρρ 为非负定对称阵;

(3) 1 k 0k ≤≤ργγ,。

2.3 偏自相关函数

除了t Z 和t k Z +之间的自相关外,我们考察除去t Z 和t k Z +共同依赖的干预变量121,,,t t t k Z Z Z +++- 的影响后的相关。这种条件相关通常被称之为偏自相关[4]。

这里有两种方法推导:

第一种方法:记k ρ为t Z 和t k Z +之间的偏自相关,它等于()

t t Z ~

Z -和

()

k t k

t Z ~

Z

++-之间的普通自相关 (

)(

)[]

(

)

(

)

k

t k t t t k

t k t t t k Z ~

Z var Z ~Z var Z ~

Z ,Z ~Z Cov ++++----=ρ (2.13) 然后再计算各个分量。

第二种方法:考虑回归模型,其中因变量k t Z +来自于0均值的平稳过程,它关于之后k 个变量12,,,t k t k t Z Z Z +-+- 进行回归

k t t kk k t k k t k k t e Z Z Z Z +-+-++++++=φφφ 2211 (2.14)

其中ki φ代表第i 个回归系数,k t e +是0均值的误差项,并且与k

,,,j ,Z j k t 21 =-+不相关。

在 (2.14) 式回归方程的两边同乘j k t Z -+,并取期望得到

k j kk j k j k j ---+++=ρφρφρφρ 2211

对于k ,,,j 21=,我们有如下的方程组

112011-+++=k kk k k ρφρφρφρ

202112-+++=k kk k k ρφρφρφρ

02211ρφρφρφρkk k k k k k +++=--

对k =1,2,…依次运用Cramer 法则,有

111ρφ=

1

1

1

1

1

2

1

1

22ρρρρρφ=

1

1

1

1

1

1

2

1

121

3

12

2111

33ρρρρρρρρρρρρρφ=

1

11

11

1

3212

3

11

1221

1321

2

3

1

1

1221

ρρρρρρρρρρρρρρρρρρρρρρρρρφ

------------=

k k k k k k k k

k k k k k kk (2.15)

作为k 的函数,kk φ通常称为偏自相关函数(partial autocorrelation function 简称PACF )[5]。

2.4 白噪声过程

若{}t a 是一个不相关的随机变量序列,具有常值均值a t a E μ=)((通常假设为0)和常值方差()2

a t a Var σ=的确定分布,且对任意

()00==≠+k t k k a ,a Cov

,k γ,那么这个过程{}t a 称为白噪声过程。显然,白噪声过程是平稳的,并且其自协方差函数为

???≠==0

00 2k k a k σγ (2.16)

自相关函数为

?

??≠==0 00 1k k k ρ (2.17)

偏自相关函数为

?

??≠==0 00 1k k kk

φ (2.18) 根据定义,对任何过程都有0001ρφ==,所以我们提到的自相关和偏相关,仅涉及0k ≠时的k ρ和kk φ。在白噪声过程中的基本现象就是其ACF 与PACF 均等于零。

尽管白噪声过程在实际中很难发生,但它作为时间序列模型中的基本构建,扮演着一般向量和函数分析中正交集的角色。

2.5 均值、自协方差和自相关的估计

一个平稳时间序列可以被均值μ、方差2σ、自相关k ρ和偏自相关kk φ所描述。如果知道了所有可能实现的全体或者得到了多次独立实现,则能够计算出这些参数的精确值。然而,在大多数情况下,得到多次实现非常困难。大多数可利用的时间序列只由单个实现构成,不可能计算总体平均。不过,对于平稳过程,可以将总体平均由时间平均来代替。接下来,本节在优良的统计特性检测条件下,使用时间平均来估计均值、自协方差和自相关。

2.5.1 样本均值

对于单个实现的平稳过程,其均值()t E Z μ=的一个自然估计是简单均值

1

1n

t t Z Z n ==∑ (2.19)

它是n 个观测值的时间平均。问题变为上面的估计是否是一个有效的估计。显然

111

()()n t t E Z E Z n n n

μμ===?=∑ (2.20)

这意味着Z 是μ的无偏估计。同时也容易得到

(2.21)

其中令()k t s =-。因此,如果

0()221111

1ar()(,)n n n n

t s t s t s t s V

Z Cov Z Z n n γρ-======∑∑∑∑1

2

1(||)n k

k n

n k n

γρ

-=-=

-∑1

1||

(1)n k k n k n n

γρ-=-=

-

1

1||lim[(1)]n k n k n

k n ρ-→∞

=--

是有限的,则当n →∞时,ar()0V Z →,从而Z 是μ的一致估计。即在均方意义下有

11lim n

t n t Z n μ

→∞==∑

(2.22) 如果存在式 (2.22) 中的结果,则这个过程就是均值遍历的。该结果成立的一个充分条件是当k →∞时,0k ρ→。这是因为这个条件暗含着对于任意

0ε>,我们都可以找到一个正整数N ,使得对于所有的k N >,都有

||/4k ρε<。因此,对于(1)n N >+,有

11

10

12||||n n k k k n k n n ρρ--=-=≤∑∑ 1

0122||||N n k k k k N n n ρρ-==+=+∑∑ 021||2

N k k n ρε=≤+∑ ε≤ (2.23)

在此选取足够大的n 使得前式第三行第一项小于/2ε。因此,当k →∞时,

0k ρ→,我们有1

11lim 0n k n k n

n ρ-→∞=-=∑,这意味着在 (2.23) 式中有

lim ()0

n Var Z →∞

=

(2.24)

这些结论简单地说就是:当t Z 和t k Z +相隔足够远时,它们几乎不相关,一些新的有用的信息增加进来,使得时间平均接近总体平均[6]。 2.5.2 样本自协方差函数

对于单个实现,我们可以使用时间平均来估计自协方差函数k γ

(2.25)

1?()()

n k

k t t k t Z Z Z Z n γ-+==--∑

(2.26)

1

1

()()[()()][()()]

n k

n k t

t k t t k t t Z

Z Z Z Z Z Z Z μμμμ--++==--=------∑∑1

1

()()()()n k

n k

t t k t t t Z Z Z Z μμμμ--+===-----∑∑

21

()()()()n k

t k t Z Z n k Z μμμ-+=---+--∑

21

()()()()n k

t t k t Z Z n k Z μμμ-+=≈-----∑ (2.27)

其中,用()()n k Z μ--来近似1

()n k t t Z μ-=-∑和1

()n k

t k t Z μ-+=-∑。因此

(2.28)

(2.29)

显然,这两个估计都是有偏的。不考虑估计μ的效率()Var Z 后,k ??γ变成无偏的,而k ?γ

仍然是有偏的。一般地,k ??γ比k ?γ的估计偏差大,尤其是在k 相对于n 很大的情况下。因此,在时间序列分析中,对于给定的n ,常建议至多计算到n /4时的估计。若k →∞时,0k ρ→,则该过程是均值遍历的,并

且如 (2.24) 中显示的lim ()0n Var Z →∞

=,那么,估计k ??γ

和k ?γ都是接近无偏的。在某些情况下,因为k ??γ

和k ?γ都是有偏的,比较它们的均方误差更合适。对于某些类型的过程,k ?γ

和k ??γ有更小的均方误差。另外,像k γ一样,k ?γ总是半正定的,而k ??γ

却不一定。因此,可以采用式 (2.25) 中的k ?γ作为样本自相关函数去估计k γ的值[7]。

当过程是高斯过程时,Bartlett 得到了下面的近似结果

()()∑∞-∞

=-+++++?i k i j k i j i i j k k n ?,?Cov γγγγγγ

1 (2.30) 1

1??()()n k k t t k t Z Z Z Z n k γ-+==---∑()()Z Var n k n n

k E k

k k ??

? ??---?γγγ?()

()Z Var E k k -=γγ

??

以及

()()

∑∞

-∞

=-++?i k i k i i k n ?Var γγγγ

21 (2.31) 类似地,有

()

()∑∞

-∞

=-+++++-?i k i j k i j i i j k k k n ??,??Cov γγγγγγ

1 (2.32) 和

()

()

∑∞

-∞

=-++-?i k i k i i k k n ??Var γγγγ

21 (2.33) 因此,k ??γ

比k ?γ的方差大。事实上,从式 (2.33) 可以看出,对于较大的k ,k ??γ的方差()

k ??Var γ

会不稳定的估计。 接着,我们想知道什么时候过程是自协方差函数遍历的,即依均方有

1

1?lim lim ()()n k

k t t k k n n t Z Z Z Z n γγ-+→∞→∞==--=∑ (2.34) 对于任意给定的k ,由于样本自协方差?γ是k γ的渐近无偏估计,因此?k γ为均方一致以及该过程是自协方差遍历的一个充分条件是自协方差是绝对可和的,即||i γ∞

-∞<∞∑,并且有?lim ()0k n Var γ→∞

=。

2.5.3 样本自相关函数

对给定的一组观测到的时间序列12,,,n Z Z Z ,样本ACF 定义为

1

2

1

()()

???()n k

t t k k t k n

t

t Z Z Z Z Z

Z γργ-+==--==-∑∑ 0,1,2,k = (2.35)

其中1

/n

t t Z Z n ==∑是序列的样本均值。我们称?k ρ关于k 的图像为样本相关图。

对于平稳的高斯过程,Bartlett 得到,对于k >0和k+j >0,有

()()

∑∞-∞

=+-+---+++++--+?i i j k k k i i j k j k i i k k i j k i j i i j k k n ?,?Cov 22221ρρρρρρρρρρρρρρρ

(2.36) 对于较大的n ,k ?ρ

的分布近似于正态分布,其均值为k ρ,方差为 ()()

∑∞

-∞

=--++-+?i i k k i i k k i k i i k n ?Var 222241ρρρρρρρρρ

(2.37) 当k >m 时,0=k ρ,则Bartlett 的 (2.37) 式近似为

()()

2

222122211m k n

?Var ρρρρ

++++? (2.38) 在实际中,当(1,2,,)i i m ρ= 未知时,可以用它们的样本估计?i ρ来代替,并且有k ?ρ

的大滞后标准差为

?k S ρ=

(2.39)

为检验白噪声过程,我们使用

?k S ρ=

(2.40) 2.5.4 样本偏自相关函数

介绍计算样本偏自相关函数?kk

φ的一个递推算法: 以11

1??φρ=为起始,根据

1111,11??????1k

k kj k j

j k k k

kj j

j ρφρφφρ++-=++=-=

-∑∑ (2.41)

以及

1,1,1,1????k j kj k k k k j φφφφ++++-=-, 1,,j k = (2.42)

这个方法也可用于计算样本的理论偏自相关函数kk φ。

在原过程是白噪声序列的假设条件下,?kk

φ的方差可以近似表示为

()

n

?Var kk

1?φ (2.43)

因此,±可以作为检验白噪声过程假设的关于kk φ的临界限度。

2.6 本章小结

本章引入了一些为便于理解本文中讨论的时间序列模型所必须的基本概念。首先简单介绍随机过程、自协方差和自相关函数、偏相关函数、白噪声过程的概念与计算公式。接着讨论样本均值、自协方差、自相关和偏相关函数的估计。这样,便于阐释第3章中所介绍模型的采样现象,并提高对模型识别的评价。同时,这些概念对于理解在时间序列分析中使用的潜在逻辑简化线性过程是非常有用的。

第3章 时间序列模型及Clementine 软件介绍

3.1 指数平滑模型

在实际的生产预测中,指数平滑法作为一种常用的手段,也用于对经济发展趋势进行中短期的预测。在所有的预测方法中,指数平滑法是使用最频繁的一种。简单的全期平均法是对一组时间序列的全部过去数据加以利用,并对每个数据赋予相同的权值;移动平均法则不考虑时间间隔相距较远的数据,并在加权移动平均法的基础上赋予较新数据更大的权重;而指数平滑法兼顾了全期平均法和移动平均法,不舍弃以往的数据,仅仅给历史数据以逐渐减小的权重赋值,即随着数据的不断远离,赋予其逐渐收敛为零的权数[8]。 3.1.1 基本公式

指数平滑法的基本公式是

(3.1)

其中,t S 是时间t 的平滑值;t y 是时间t 的实际值;1t S -是时间t -1的平滑值;a 是平滑常数,其取值范围为[0, 1]。 3.1.2 指数平滑标准

(1) 简单:此模型适合于其中没有趋势或季节性的序列。其唯一的相关平滑参数是水平。简单的指数平滑模型非常类似于自回归阶数为0、差分阶数为1、移动平均阶数为1且没有常量的 ARIMA 模型。

(2) Holt's 线性趋势:此模型适合于其中有线性趋势但没有季节性的序列。其相关的平滑参数是水平和趋势,并且在此模型中,这些参数的值不会彼此限制。Holt's 模型比 Brown's 模型更加常用,但在计算大型序列的估计值时会花费更多的时间。Holt's 指数平滑模型非常类似于自回归阶数为0、差分阶数为2且移动平均阶数为2的 ARIMA 模型。

(3) Brown's 线性趋势:此模型适合于其中有线性趋势但没有季节性的序列。其相关的平滑参数是水平和趋势,但在此模型中,这些参数的值假设相等。因此,Brown's 模型是 Holt's 模型的特例。Brown's 指数平滑模型非常类似于自回归阶数为0、差分阶数为2且移动平均阶数为2的 ARIMA 模型,其第二阶移动平均的系数等于第一阶系数的平方的一半。

(4) 阻尼趋势:此模型适合于具有逐渐消失的线性趋势但没有季节性

1(1)t t t S a y a S -=?+-

应用时间序列分析习题答案解析整理

第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 2.2 (1)非平稳,时序图如下 (2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

2.3 (1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2)平稳序列 (3)白噪声序列 2.4 ,序列 LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。显著性水平=0.05 不能视为纯随机序列。 2.5 (1)时序图与样本自相关图如下

(2) 非平稳 (3)非纯随机 2.6 (1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机 第三章习题答案 3.1 解:1()0.7()()t t t E x E x E ε-=?+ 0)()7.01(=-t x E 0)(=t x E t t x ε=-)B 7.01( t t t B B B x εε)7.07.01()7.01(221Λ+++=-=- 229608.149 .011 )(εεσσ=-= t x Var 49.00212==ρφρ 022=φ 3.2 解:对于AR (2)模型: ?? ?=+=+==+=+=-3.05 .02110211212112011φρφρφρφρρφφρφρφρ 解得:???==15/115 /72 1φφ 3.3 解:根据该AR(2)模型的形式,易得:0)(=t x E 原模型可变为:t t t t x x x ε+-=--2115.08.0 2212122 ) 1)(1)(1(1)(σφφφφφφ-+--+-= t x Var 2) 15.08.01)(15.08.01)(15.01() 15.01(σ+++--+= =1.98232σ ?????=+==+==-=2209.04066.06957.0)1/(1221302112211ρφρφρρφρφρφφρ ?? ? ??=-====015.06957.033222111φφφρφ

时间序列分析——最经典的

【时间简“识”】 说明:本文摘自于经管之家(原人大经济论坛) 作者:胖胖小龟宝。原版请到经管之家(原人大经济论坛) 查看。 1.带你看看时间序列的简史 现在前面的话—— 时间序列作为一门统计学,经济学相结合的学科,在我们论坛,特别是五区计量经济学中是热门讨论话题。本月楼主推出新的系列专题——时间简“识”,旨在对时间序列方面进行知识扫盲(扫盲,仅仅扫盲而已……),同时也想借此吸引一些专业人士能够协助讨论和帮助大家解疑答惑。 在统计学的必修课里,时间序列估计是遭吐槽的重点科目了,其理论性强,虽然应用领域十分广泛,但往往在实际操作中会遇到很多“令人发指”的问题。所以本帖就从基础开始,为大家絮叨絮叨那些关于“时间”的故事! Long long ago,有多long?估计大概7000年前吧,古埃及人把尼罗河涨落的情况逐天记录下来,这一记录也就被我们称作所谓的时间序列。记录这个河流涨落有什么意义?当时的人们并不是随手一记,而是对这个时间序列进行了长期的观察。结果,他们发现尼罗河的涨落非常有规律。掌握了尼罗河泛滥的规律,这帮助了古埃及对农耕和居所有了规划,使农业迅速发展,从而创建了埃及灿烂的史前文明。 1 / 60

好~~从上面那个故事我们看到了 1、时间序列的定义——按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。 2、时间序列分析的定义——对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。 既然有了序列,那怎么拿来分析呢? 时间序列分析方法分为描述性时序分析和统计时序分析。 1、描述性时序分析——通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析 描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。 2 / 60

统计基础知识第五章时间序列分析习题及答案

第五章时间序列分析 一、单项选择题 1.构成时间数列的两个基本要素是( C )(2012年1月) A.主词和宾词 B.变量和次数 C.现象所属的时间及其统计指标数值 D.时间和次数 2.某地区历年出生人口数是一个( B )(2011年10月) A.时期数列 B.时点数列 C.分配数列 D.平均数数列 3.某商场销售洗衣机,2008年共销售6000台,年底库存50台,这两个指标是( C ) (2010年10) A.时期指标 B.时点指标 C.前者是时期指标,后者是时点指标 D.前者是时点指标,后者是时期指标 4.累计增长量( A ) (2010年10) A.等于逐期增长量之和 B.等于逐期增长量之积 C.等于逐期增长量之差 D.与逐期增长量没有关系 5.某企业银行存款余额4月初为80万元,5月初为150万元,6月初为210万元,7月初为160万元,则该企业第二季度的平均存款余额为( C )(2009年10) 万元万元万元万元 6.下列指标中属于时点指标的是( A ) (2009年10) A.商品库存量 B.商品销售量 C.平均每人销售额 D.商品销售额 7.时间数列中,各项指标数值可以相加的是( A ) (2009年10) A.时期数列 B.相对数时间数列 C.平均数时间数列 D.时点数列 8.时期数列中各项指标数值( A )(2009年1月) A.可以相加 B.不可以相加 C.绝大部分可以相加 D.绝大部分不可以相加 10.某校学生人数2005年比2004年增长了8%,2006年比2005年增长了15%,2007年比2006年增长了18%,则2004-2007年学生人数共增长了( D )(2008年10月) %+15%+18%%×15%×18% C.(108%+115%+118%)-1 %×115%×118%-1 二、多项选择题 1.将不同时期的发展水平加以平均而得到的平均数称为( ABD )(2012年1月) A.序时平均数 B.动态平均数 C.静态平均数 D.平均发展水平 E.一般平均数2.定基发展速度和环比发展速度的关系是( BD )(2011年10月) A.相邻两个环比发展速度之商等于相应的定基发展速度 B.环比发展速度的连乘积等于定基发展速度

应用时间序列分析第4章答案

河南大学: 姓名:汪宝班级:七班学号:1122314451 班级序号:68 5:我国1949年-2008年年末人口总数(单位:万人)序列如表4-8所示(行数据).选择适当的模型拟合该序列的长期数据,并作5期预测。 解:具体解题过程如下:(本题代码我是做一问写一问的) 1:观察时序图: data wangbao4_5; input x@@; time=1949+_n_-1; cards; 54167 55196 56300 57482 58796 60266 61465 62828 64653 65994 67207 66207 65859 67295 69172 70499 72538 74542 76368 78534 80671 82992 85229 87177 89211 90859 92420 93717 94974 96259 97542 98705 100072 101654 103008 104357 105851 107507 109300 111026 112704 114333 115823 117171 118517 119850 121121 122389 123626 124761 125786 126743 127627 128453 129227 129988 130756 131448 132129 132802 ; proc gplot data=wangbao4_5; plot x*time=1; symbol1c=black v=star i=join; run; 分析:通过时序图,我可以发现我国1949年-2008年年末人口总数(随时间的变化呈现出线性变化.故此时我可以用线性模型拟合序列的发展. X t=a+b t+I t t=1,2,3,…,60 E(I t)=0,var(I t)=σ2 其中,I t为随机波动;X t=a+b就是消除随机波动的影响之后该序列的长期趋势。

典型时间序列模型分析

实验1典型时间序列模型分析 1、实验目的 熟悉三种典型的时间序列模型: AR 模型,MA 模型与ARMA 模型,学会运用Matlab 工具对 对上述三种模型进行统计特性分析,通过对2阶模型的仿真分析,探讨几种模型的适用范围, 并且通过实验分析理论分析与实验结果之间的差异。 2、实验原理 AR 模型分析: 设有AR(2)模型, X( n)=-0.3X( n-1)-0.5X( n-2)+W( n) 其中:W(n)是零均值正态白噪声,方差为 4。 (1 )用MATLAB 模拟产生X(n)的500观测点的样本函数,并绘出波形 (2) 用产生的500个观测点估计X(n)的均值和方差 (3) 画出理论的功率谱 (4) 估计X(n)的相关函数和功率谱 【分析】给定二阶的 AR 过程,可以用递推公式得出最终的输出序列。或者按照一个白噪声 通过线性系统的方式得到,这个系统的传递函数为: 这是一个全极点的滤波器,具有无限长的冲激响应。 对于功率谱,可以这样得到, 可以看出, FX w 完全由两个极点位置决定。 对于AR 模型的自相关函数,有下面的公式: \(0) 打⑴ 匚⑴… ^(0) ■ 1' G 2 W 0 JAP) 人9-1)… 凉0) _ 这称为Yule-Walker 方程,当相关长度大于 p 时,由递推式求出: r (r) + -1) + -■ + (7r - JJ )= 0 这样,就可以求出理论的 AR 模型的自相关序列。 H(z) 二 1 1 0.3z , P x w +W 1 1 a 才 a 2z^

1. 产生样本函数,并画出波形 2. 题目中的AR过程相当于一个零均值正态白噪声通过线性系统后的输出,可以按照上面的方法进行描述。 clear all; b=[1]; a=[1 0.3 0.5]; % 由描述的差分方程,得到系统传递函数 h=impz(b,a,20); % 得到系统的单位冲激函数,在20点处已经可以认为值是0 randn('state',0); w=normrnd(0,2,1,500); % 产生题设的白噪声随机序列,标准差为 2 x=filter(b,a,w); % 通过线形系统,得到输出就是题目中要求的2阶AR过程 plot(x,'r'); ylabel('x(n)'); title(' 邹先雄——产生的AR随机序列'); grid on; 得到的输出序列波形为: 邹先雄——产生的AR随机序列 2. 估计均值和方差 可以首先计算出理论输出的均值和方差,得到m x =0 ,对于方差可以先求出理论自相 关输出,然后取零点的值。

第章时间序列预测习题答案

第10章时间序列预测

从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上升趋势。(2)年平均增长率为: 。 (3)。 下表是1981年—2000年我国油彩油菜籽单位面积产量数据(单位:kg / hm2)年份单位面积产量年份单位面积产量 1981 1451 1991 1215 1982 1372 1992 1281 1983 1168 1993 1309 1984 1232 1994 1296 1985 1245 1995 1416 1986 1200 1996 1367 1987 1260 1997 1479 1988 1020 1998 1272

1989 1095 1999 1469 1990 1260 2000 1519 (1)绘制时间序列图描述其形态。 (2)用5期移动平均法预测2001年的单位面积产量。 (3)采用指数平滑法,分别用平滑系数a=和a=预测2001年的单位面积产量,分析预测误差,说明用哪一个平滑系数预测更合适? 详细答案: (1)时间序列图如下: (2)2001年的预测值为: | (3)由Excel输出的指数平滑预测值如下表: 年份单位面积产量 指数平滑预测 a= 误差平方 指数平滑预测 a= 误差平方

a=时的预测值为: 比较误差平方可知,a=更合适。 下面是一家旅馆过去18个月的营业额数据 月份营业额(万元)月份营业额(万元) 1 295 10 473 2 28 3 11 470 3 322 12 481 4 35 5 13 449 5 28 6 14 544 6 379 15 601 7 381 16 587 8 431 17 644 9 424 18 660 (1)用3期移动平均法预测第19个月的营业额。 (2)采用指数平滑法,分别用平滑系数a=、a=和a=预测各月的营业额,分析预测误差,说明用哪一个平滑系数预测更合适? (3)建立一个趋势方程预测各月的营业额,计算出估计标准误差。

最新第22章-时间序列分析思考与练习参考答案

第22章时间序列分析 思考与练习参考答案 一、最佳选择题 1.欲消除时间序列中的线性趋势,应当对原始数据进行的处理是(D)。 A. 减去时间的线性函数 B. 加上时间的线性函数 C. 乘以时间的线性函数 D.除以时间的线性函数 E. 需首先明确是加法模型还是乘法模型 2. 系数(D)可以使指数平滑的预测结果跟踪序列发生新变化的效果最佳。 A. 0.2 B. 0.5 C. 0.7 D. 0.85 E. 0 3. 严平稳和宽平稳的条件主要区别在于(E)。 A. 前者要求均数恒定 B. 前者要求方差恒定 C.后者对均数水平不作要求 D.后者对方差的波动不作要求 E. 后者对分布函数不作要求 4. 如果序列的自相关函数拖尾,偏自相关函数截尾,则首先考虑的模型是(A)。 A. AR(p) B. MA(q) C. ARIMA(p,d,q) D.先作普通差分再决定 E. 先作季节差分再决定 5. 模型拟合的优劣,无法通过残差序列的下述(E)指标判断。 A. 自相关函数 B. 偏自相关函数 C. 周期图 D. 谱密度图 E. 方差 二、思考题 1. 以时域分析为例,说明时间序列分析的主要目的与步骤是什么。 答:主要目的:①用适当的模型概括时间序列资料发展演变的规律;②用适当的统计描述方法呈现时间序列资料蕴涵的信息;③对时间序列未来的取值水平进行预测。 主要步骤:①模型识别;②参数估计;③模型诊断;④预测应用。 2. 时域分析的结果可否对频域分析有指导意义?频域分析的结果又可否对时域建模有所启示?请自行搜集时间序列数据,在分析过程中尝试回答以上问题。 答:时域分析主要是利用在不同时间点上个体取值的自相关信息,例如逐日采集的时间序列分析资料,当天的取值水平总是与一周前的取值相关(自相关函数在lag=7处,经检验

数据分析-时间序列的趋势分析

数据分析-时间序列的趋势分析 无论是网站分析工具、BI报表或者数据的报告,我们很难看到数据以孤立的点单独地出现,通常数据是以序列、分组等形式存在,理由其实很简单,我们没法从单一的数据中发现什么,用于分析的数据必须包含上下文(Context)。数据的上下文就像为每个指标设定了一个或者一些参考系,通过这些参照和比较的过程来分析数据的优劣,就像中学物理上的例子,如果我们不以地面作为参照物,我们无法区分火车是静止的还是行进的,朝北开还是朝南开。 在实际看数据中,我们可能已经在不经意间使用数据的上下文了,趋势分析、比例分析、细分与分布等都是我们在为数据设置合适的参照环境。所以这边通过一个专题——数据的上下文,来总结和整理我们在日常的数据分析中可以使用的数据参考系,前面几篇主要是基于内部基准线(Internal Benchmark)的制定的,后面会涉及外部基准线(External Benchmark)的制定。今天这篇是第一篇,主要介绍基于时间序列的趋势分析,重提下同比和环比,之前在网站新老用户分析这篇文章,已经使用同比和环比举过简单应用的例子。 同比和环比的定义 定义这个东西在这里还是再唠叨几句,因为不了解定义就无法应用,熟悉的朋友可以跳过。 同比:为了消除数据周期性波动的影响,将本周期内的数据与之前周期中相同时间点的数据进行比较。早期的应用是销售业等受季节等影响较严重,为了消除趋势分析中季节性的影响,引入了同比的概念,所以较多地就是当年的季度数据或者月数据与上一年度同期的比较,计算同比增长率。 环比:反应的是数据连续变化的趋势,将本期的数据与上一周期的数据进行对比。最常见的是这个月的数据与上个月数据的比较,计算环比增长率,因为数据都是与之前最近一个周期的数据比较,所以是用于观察数据持续变化的情况。 买二送一,再赠送一个概念——定基比(其实是百度百科里附带的):将所有的数据都与某个基准线的数据进行对比。通常这个基准线是公司或者产品发展的一个里程碑或者重要数据点,将之后的数据与这个基准线进行比较,从而反映公司在跨越这个重要的是基点后的发展状况。 同比和环比的应用环境

第六章时间序列分析

第六章时间序列分析 重点: 1、增长量分析、发展水平及增长量 2、增长率分析、发展速度及增长速度 3、时间数列影响因素、长期趋势分析方法 难点: 1、增长量与增长速度 2、长期趋势与季节变动分析 第一节时间序列的分析指标 知识点一:时间序列的含义 时间序列是指经济现象按时间顺序排列形成的序列。这种数据称为时间序列数据。 时间序列分析就是根据这样的数列分析经济现象的发展规律,进而预测其未来水平。 时间数列是一种统计数列,它是将反映某一现象的统计指标在不同时间上的数值按时间先后顺序排列所形成的数列。表现了现象在时间上的动态变化,故又称为动态数列。 一个完整的时间数列包含两个基本要素: 一是被研究现象或指标所属的时间; 另一个是该现象或指标在此时间坐标下的指标值。 同一时间数列中,通常要求各指标值的时间单位和时间间隔相等,如无法保证相等,在计算某些指标时就涉及到“权”的概念。 研究时间数列的意义:了解与预测。 [例题·单选题]下列数列中哪一个属于时间数列(). a.学生按学习成绩分组形成的数列 b.一个月内每天某一固定时点记录的气温按度数高低排列形成的序列 c.工业企业按产值高低形成的数列 d.降水量按时间先后顺序排列形成的数列 答案:d 解析:时间序列是一种统计数列,它是将反映某一现象的统计指标在不同时间上的数值按时间先后顺序排列所形成的数列,表现了现象在时间上的动态变化。 知识点二:增长量分析(水平分析)

一.发展水平 发展水平是指客观现象在一定时期内(或时点上)发展所达到的规模、水平,一般用y t (t=1,2,3,…,n) 。 在绝对数时间数列中,发展水平就是绝对数; 在相对数时间数列中,发展水平就是相对数或平均数。 几个概念:期初水平y 0,期末水平y t ,期间水平(y 1 ,y 2 ,….y n-1 ); 报告期水平(研究时期水平),基期水平(作为对比基础的水平)。 二.增长量 增长量是报告期发展水平与基期发展水平之差,增长量的指标数值可正可负,它反映的是报告期相对基期增加或减少的绝对数量,用公式表示为: 增长量=报告期水平-基期水平 根据基期的不同确定方法,增长量可分为逐期增长量和累计增长量。 1.逐期增长量:是报告期水平与前一期水平之差,用公式表示为: △ = y n - y n-1 (i=1,2,…,n) 2.累计增长量:是报告期水平与某一固定时期水平(通常是时间序列最初水平)之差,用公式表示为: △ = y n - y (i=1,2,…,n)(i=1,2,…,n) 二者关系:逐期增长量之和=累计增长量 3.平均增长量 平均增长量是时间序列中的逐期增长量的序时平均数,它表明现象在一定时段内平均每期增加(减少)的数量。 一般用累计增长量除以增长的时期数目计算。 (y n - y )/n [例题·单选题]某社会经济现象在一定时期内平均每期增长的绝对数量是()。 a.逐期增长量 b.累计增长量 c.平均增长量 d.增长速度 答案:c 解析:平均每期增长的绝对数量是平均增长量。 知识点三:增长率分析(速度分析) 一.发展速度

时间序列分析ARMA模型实验

基于ARMA模型的社会融资规模增长分析 ————ARMA模型实验

第一部分实验分析目的及方法 一般说来,若时间序列满足平稳随机过程的性质,则可用经典的ARMA模型进行建模和预则。但是, 由于金融时间序列随机波动较大,很少满足ARMA模型的适用条件,无法直接采用该模型进行处理。通过对数化及差分处理后,将原本非平稳的序列处理为近似平稳的序列,可以采用ARMA模型进行建模和分析。 第二部分实验数据 2.1数据来源 数据来源于中经网统计数据库。具体数据见附录表5.1 。 2.2所选数据变量 社会融资规模指一定时期内(每月、每季或每年)实体经济从金融体系获得的全部资金总额,为一增量概念,即期末余额减去期初余额的差额,或当期发行或发生额扣除当期兑付或偿还额的差额。社会融资规模作为重要的宏观监测指标,由实体经济需求所决定,反映金融体系对实体经济的资金量支持。 本实验拟选取2005年11月到2014年9月我国以月为单位的社会融资规模的数据来构建ARMA模型,并利用该模型进行分析预测。 第三部分 ARMA模型构建 3.1判断序列的平稳性 首先绘制出M的折线图,结果如下图:

图3.1 社会融资规模M曲线图 从图中可以看出,社会融资规模M序列具有一定的趋势性,由此可以初步判断该序列是非平稳的。此外,m在每年同时期出现相同的变动趋势,表明m还存在季节特征。下面对m的平稳性和季节性·进行进一步检验。 为了减少m的变动趋势以及异方差性,先对m进行对数化处理,记为lm,其时序图如下: 图3.2 lm曲线图

对数化后的趋势性减弱,但仍存在一定的趋势性,下面观察lm的自相关图 表3.1 lm的自相关图 上表可以看出,该lm序列的PACF只在滞后一期、二期和三期是显著的,ACF随着滞后结束的增加慢慢衰减至0,由此可以看出该序列表现出一定的平稳性。进一步进行单位根检验,由于存在较弱的趋势性且均值不为零,选择存在趋势项的形式,并根据AIC自动选择之后结束,单位根检验结果如下: 表3.2 单位根输出结果 Null Hypothesis: LM has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic - based on SIC, maxlag=12) t-Statistic Prob.*

时间序列分析案例

《时间序列分析》案例案例名 称:时间序列分析在经济预测中的应用内容要 求:确定性与随机性时间序列之比较设计作 者:许启发,王艳明 设计时 间:2003年8月

案例四:时间序列分析在经济预测中的应用 一、案例简介 为了配合《统计学》课程时间序列分析部分的课堂教学,提高学生运用统计分析方法解决实际问题的能力,我们组织了一次案例教学,其内容是:对烟台市的未来经济发展状况作一预测分析,数据取烟台市1949—1998年国内生产总值(GDP)的年度数据,并以此为依据建立预测模型,对1999年和2000年的国内生产总值作出预测并检验其预测效果。国内生产总值是指一个国家或地区所有常住单位在一定时期内生产活动的最终成果,是反映国民经济活动最重要的经济指标之一,科学地预测该指标,对制定经济发展目标以及与之相配套的方针政策具有重要的理论与实际意义。在组织实施时,我们首先将数据资料印发给学生,并讲清本案例的教学目的与要求,明确案例所涉及的教学内容;然后给学生一段时间,由学生根据资料,运用不同的方法进行预测分析,并确定具体的讨论日期;在课堂讨论时让学生自由发言,阐述自己的观点;最后,由主持教师作点评发言,取得了良好的教学效果。 经济预测是研究客观经济过程未来一定时期的发展变化趋势,其目的在于通过对客观经济现象历史规律的探讨和现状的研究,求得对未来经济活动的了解,以确定社会经济活动的发展水平,为决策提供依据。 时间序列分析预测法,首先将预测目标的历史数据按照时间的先后顺序排列,然后分析它随时间的变化趋势及自身的统计规律,外推得到预测目标的未来取值。它与回归分析预测法的最大区别在于:该方法可以根据单个变量的取值对其自身的变动进行预测,无须添加任何的辅助信息。 本案例的最大特色在于:它汇集了统计学原理中的时间序列分析这一章节的所有知识点,通过本案例的教学,可以把不同的时间序列分析方法进行综合的比较,便于学生更好地掌握本章的内容。 二、案例的目的与要求 (一)教学目的 1.通过本案例的教学,使学生认识到时间序列分析方法在实际工作中应用的必要性和可能性; 2.本案例将时间序列分析中的水平指标、速度指标、长期趋势的测定等内容有机的结合在一起,以巩固学生所学的课本知识,深化学生对课本知识的理解; 3.本案例是对烟台市的国内生产总值数据进行预测,通过对实证结果的比较和分析,使学生认识到对同一问题的解决,可以采取不同的方法,根据约束条件,从中选择一种合适的预测方法; 4.通过本案例的教学,让学生掌握EXCEL软件在时间序列分析中的应用,对统计、计量分析软件SPSS或Eviews等有一个初步的了解; 5.通过本案例的教学,有助于提高学生运用所学知识和方法分析解决问题的能力、合作共事的能力和沟通交流的能力。 (二)教学要求 1.学生必须具备相应的时间序列分析的基本理论知识; 2.学生必须熟悉相应的预测方法和具备一定的数据处理能力; 3.学生以主角身份积极地参与到案例分析中来,主动地分析和解决案例中的问题; 4.在提出解决问题的方案之前,学生可以根据提供的样本数据,自己选择不同的统计分析方法,对这一案例进行预测,比较不同预测方法的异同,提出若干可供选择的方案;

应用时间序列分析 第5章

佛山科学技术学院 应用时间序列分析实验报告 实验名称第五章非平稳序列的随机分析 一、上机练习 通过第4章我们学习了非平稳序列的确定性因素分解方法,但随着研究方法的深入和研究领域的拓宽,我们发现确定性因素分解方法不能很充分的提取确定性信息以及无法提供明确有效的方法判断各因素之间确切的作用关系。第5章所介绍的随机性分析方法弥补了确定性因素分解方法的不足,为我们提供了更加丰富、更加精确的时序分析工具。 5.8.1 拟合ARIMA模型 【程序】 data example5_1; input x@@; difx=dif(x); t=_n_; cards; 1.05 -0.84 -1.42 0.20 2.81 6.72 5.40 4.38 5.52 4.46 2.89 -0.43 -4.86 -8.54 -11.54 -1 6.22 -19.41 -21.61 -22.51 -23.51 -24.49 -25.54 -24.06 -23.44 -23.41 -24.17 -21.58 -19.00 -14.14 -12.69 -9.48 -10.29 -9.88 -8.33 -4.67 -2.97 -2.91 -1.86 -1.91 -0.80 ; proc gplot; plot x*t difx*t; symbol v=star c=black i=join; proc arima; identify var=x(1); estimate p=1; estimate p=1 noint; forecast lead=5id=t out=out; proc gplot data=out; plot x*t=1 forecast*t=2 l95*t=3 u95*t=3/overlay; symbol1c=black i=none v=star; symbol2c=red i=join v=none; symbol3c=green I=join v=none;

时间序列分析课后习题答案

第9章 时间序列分析课后习题答案 第10章 (1)30× 31.06×2 1.05= 30× = (万辆) (2 117.11%== (3)设按%的增长速度n 年可翻一番 则有 1.07460/302n == 所以 n = log2 / = (年) 故能提前年达到翻一番的预定目标。 第11章 (1)以1987年为基期,2003年与1987年相比该地区社会商品零售额共增长: %86.2313186.213186.31%)8.61(%)2.81(%)101(5 5 5 ==-=-+?+?+ (2)年平均增长速度为 1%)8.61(%)2.81(%)101(15 555-+?+?+==% (3) 2004年的社会商品零售额应为 509.52)0833.01(307=+?(亿元) 第12章 (1)发展总速度%12.259%)81(%)101(%)121(3 43=+?+?+ 平均增长速度=%9892.91%12.25910 =- (2) 8.561%)61(5002 =+?(亿元) (3)平均数∑====41 5 .1424570 41j j y y (亿元), 2002 年一季度的计划任务: 625.1495.142%105=?(亿元)。 第13章 (1)用每股收益与年份序号回归得 ^ 0.3650.193t Y t =+。预测下一年(第11年)的每 股收益为488.211193.0365.0? 11=?+=Y 元 (2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长元。是一个较为适合的投资方向。 第

(2)t T t ?+=63995.09625.8

时间序列及分析

时间序列 (一)时间序列及其分类 同一现象在不同时间上的相继观察值排列而成的序列称为时间序列。例如,下表就是我国国内生产总值、人口等在不同时间上得到的观察值排列而成的序列。 由表可以看出,时间序列形式上由现象所属的时间和现象在不同时间上的观察值两部分组成。根据所处的观察时间不同,现象所属的时间可以是年份、季度、月份或其他任何时间形式。现象的观察值根据表现形式不同有绝对数、相对数和平均数等。因此,从观察值的表现形式上看,时间序列可分为绝对数时间序列、相对数时间序列和平均数时间序列等。 由一系列绝对数按时间顺序排列而成的序列称为绝对数时间序列。它是时间序列中最基本的表现形式,用于反映现象在不同时间上所达到的绝对水平。绝对数时间序列根据观察值所属的时间状况不同,可以分为时期序列和时点序列。例如,表中的国内生产总值序列就是时期序列。时期序列中的观察值反映现象在一段时期内的活动总量,并且各观察值通常可以直接相加,用于反映现象在更长一段时期内的活动总量。表中的年末总人口序列属于时点序列,时点序列中的观察值反映现象在某一瞬间时点上的总量,它是在某一时点上统计得到的,序列中的各观察值通常不能相加。由绝对数时间序列可以派生出相对数和平均数时间序列,它们分别是由一系列相对数和平均数按时间顺序排列而成的。例如,表中的人口自然增长率序列就是相对数时间序列,居民消费水平序列则是平均数时间序列。 时间序列的描述性分析包括水平分析和速度分析两方面的内容。 (二)时间序列的水平分析 1.序时平均数 在时间序列中,我们用i t表示现象所属的时间,i Y表示现象在不同时间上观察值。i Y也称为现象在时间i t上的发展水平,它表示现象在某一时间上所达到的一种数量状态。若观察的时间范围为1t,2t,…,n t,相应的观察值表示为1Y,2Y,…,3Y,其中1Y称为最初发展水平,n Y称为最末发展水平;若对两个观察值进行比较时,把现在的这个时期称为报 告期,用于比较的过去的那个时期称为基期。 序时平均数是现象在不同时间上的观察值的平均数。它可以概括性地描述出现象在一段时期内所达到的一般水平。在证券市场上,对股票价格或股票价格指数的分析中常用到序时

第八章 时间序列分析

第八章时间序列分析与预测 【课时】6学时 【本章内容】 § 时间序列的描述性分析 时间序列的含义、时间序列的图形描述、时间序列的速度分析 § 时间序列及其构成分析 时间序列的构成因素、时间序列构成因素的组合模型 § 时间序列趋势变动分析 移动平均法、指数平滑法、模型法 § 时间序列季节变动分析 [ 原始资料平均法、趋势-循环剔除法、季节变动的调整 § 时间序列循环变动分析 循环变动及其测定目的、测定方法 本章小结 【教学目标与要求】 1.掌握时间序列的四种速度分析 2.掌握时间序列的四种构成因素 3.掌握时间序列构成因素的两种常用模型 4.掌握测定长期趋势的移动平均法 5.了解测定长期趋势的指数平滑法 6.; 7.掌握测定长期趋势的线性趋势模型法 8.了解测定长期趋势的非线性趋势模型法 9.掌握分析季节变动的原始资料平均法 10.掌握分析季节变动的循环剔出法 11.掌握测定循环变动的直接法和剩余法 【教学重点与难点】 1.对统计数据进行趋势变动分析,利用移动平均法、指数平滑法、线性模型法求得数 据的长期趋势; 2.对统计数据进行季节变动分析,利用原始资料平均法、趋势-循环剔除法求得数据 的季节变动; 3.对统计数据进行循环变动分析,利用直接法、剩余法求得循环变动。 【导入】 ; 很多社会经济现象总是随着时间的推移不断发展变化,为了探索现象随时间而发展变化的规律,不仅要从静态上分析现象的特征、内部结构以及相互关联的数量关系,而且应着眼于现象随时间演变的过程,从动态上去研究其发展变动的过程和规律。这时需要一些专门研究按照时间顺序观测的序列数据的统计分析方法,这就是统计学中的时间序列分析。 通过介绍一些时间序列分析的例子,让同学们了解时间序列的应用,并激发学生学习本章知识的兴趣。 1.为了表现中国经济的发展状况,把中国经济发展的数据按年度顺序排列起来,

时间序列分析第五章作业

时间序列分析第五章作业 班级:09数学与应用数学 学号: 姓名: 习题5.7 1、 根据数据,做出它的时序图及一阶差分后图形,再用ARIMA 模型模拟该序列的发展,得出 预测。根据输出的结果,我们知道此为白噪声,为非平稳序列,同时可以得出序列t x 模型 应该用随机游走模型(0,1,0)模型来模拟,模型为:,并可以预测到下一天 的收盘价为296.0898。 各代码: data example5_1; input x@@; difx=dif(x); t=_n_; cards ; 304 303 307 299 296 293 301 293 301 295 284 286 286 287 284 282 278 281 278 277 279 278 270 268 272 273 279 279 280 275 271 277 278 279 283 284 282 283 279 280 280 279 278 283 278 270 275 273 273 272 275 273 273 272 273 272 273 271 272 271 273 277 274 274 272 280 282 292 295 295 294 290 291 288 288 290 293 288 289 291 293 293 290 288 287 289 292 288 288 285 282 286 286 287 284 283 286 282 287 286 287 292 292 294 291 288 289 ; proc gplot ; plot x*t difx*t; symbol v =star c =black i =join; proc arima data =example5_1; identify Var =x(1) nlag =8 minic p = (0:5) q = (0:5); estimate p =0 q =0 noint; forecast lead =1 id =t out =results; run ; proc gplot data =results; plot x*t=1 forecast*t=2 l95*t=3 u95*t=3/overlay ; symbol1 c =black i =none v =star; symbol2 c =red i =join v =none; symbol3 c =green i =join v =none l =32; run ; 时序图:

第章时间序列分析课后习题答案

第9章 时间序列分析课后习题答案 第10章 (1)30× 3 1.06×2 1.05= 30×1.3131 = 39.393(万辆) (2117.11%== (3)设按7.4%的增长速度n 年可翻一番 则有 1.07460/30n == 所以 n = log2 / log1.074 = 9.71(年) 故能提前0.29年达到翻一番的预定目标。 第11章 (1)以1987年为基期,2003年与1987年相比该地区社会商品零售额共增长: %86.2313186.213186.31%)8.61(%)2.81(%)101(5 5 5 ==-=-+?+?+ (2)年平均增长速度为 1%)8.61(%)2.81(%)101(15 555-+?+?+=0.0833=8.33% (3) 2004年的社会商品零售额应为 509.52)0833.01(307=+?(亿元) 第12章 (1)发展总速度%12.259%)81(%)101(%)121(3 43=+?+?+ 平均增长速度= %9892.91%12.25910=- (2)8.561%)61(5002 =+?(亿元) (3)平均数∑====415 .1424570 41j j y y (亿元), 2002 年一季度 的计划 任务 : 625.1495.142%105=?(亿元)。 第13章 (1)用每股收益与年份序号回归得 ^ 0.3650.193t Y t =+。预测下一年(第11年)的每股收益 为488.211193.0365.0? 11=?+=Y 元 (2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长0.193元。是一个较为适合的投资方向。 第14章 (1)移动平均法消除季节变动计算表

时间序列分析基于R——习题答案

第一章习题答案 略 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 2.2 (1)非平稳,时序图如下 (2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

2.3 (1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2)平稳序列 (3)白噪声序列 2.4 ,序列LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。显著性水平=0.05 不能视为纯随机序列。 2.5 (1)时序图与样本自相关图如下

(2) 非平稳 (3)非纯随机 2.6 (1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机 第三章习题答案 3.1 ()0t E x =,2 1 () 1.9610.7 t Var x ==-,220.70.49ρ==,220φ= 3.2 1715φ=,2115 φ= 3.3 ()0t E x =,10.15 () 1.98(10.15)(10.80.15)(10.80.15) t Var x += =--+++ 10.8 0.7010.15 ρ= =+,210.80.150.41ρρ=-=,3210.80.150.22ρρρ=-= 1110.70φρ==,2220.15φφ==-,330φ= 3.4 10c -<<, 1121,1,2 k k k c c k ρρρρ--?=? -??=+≥? 3.5 证明: 该序列的特征方程为:32 - -c 0c λλλ+=,解该特征方程得三个特征根: 11λ=,2λ=3λ=

时间序列分析课后习题解答

第八章 时间序列分析 一、选择题 1.设(甲)代表时期数列;(乙)代表时点数列;(丙)代表几何序时平均数;(丁)代表“首末折半法”序时平均数。现已知1996~2000年某银行的年末存款余额,要求计算各年平均存款余额,需计算的是( D )。 A.甲、丙 B.乙、丙 C.甲、乙 D.乙、丁 2.某商业集团2000~2001年各季度销售资料如表8—1所示。 表8—1资料中,是总量时期数列的有( D )。 A.1、2、3 B.1、3、4 C.2、4 D.1、3 3.某地区粮食增长量1990~1995年为12万吨,1996~2000年也为12万吨。那么,1990~2000年期间,该地区粮食环比增长速度( D )。 A.逐年上升 B.逐年下降 C.保持不变 D.不能做结论 4.利用第2题数据计算零售额移动平均数(简单,4项移动平均),2001年第二季度移动平均数为( A )。 A.47.5 B.46.5 C.49.5 D.48.4 5.利用第3题数据计算2000年商品季平均流转次数(=零售额/库存额)( C )。 A.1.885 B.1.838 C.1.832 D.1.829 二、判断题 1.连续12个月逐期增长量之和等于年距增长量。(×) 2.计算固定资产投资额的年平均发展速度应采用几何平均法。(×) 3.用移动平均法分析企业季度销售额时间序列的长期趋势时,一般应取4项进行移动平均。(√) 4.计算平均发展速度的水平法只适合时点指标时问序列。(×) 5.某公司连续四个季度销售收入增长率分别为9%、12%、20%和18%,其环比增长速度为0.14%。(×) 三、计算题

1.某地区“九五”时期国内生产总值资料如表8—2所示。试计算该地区“九五”时期国内生产总值和各产业产值的平均发展水平。 表8—2 单位:百万元 解:国内生产总值和各产业产值均为时期指标,应采用时期指标序时平均数计算公式计算。 计算公式: 国内生产总值平均发展水平: 第一产业平均发展水平: 第二产业平均发展水平: 第三产业平均发展水平: 2.某企业2000年8月几次员工数变动登记如表8—3所示。试计算该企业8月份平均员工数。 表8—3 解:该题是现象发生变动时登记一次的时点序列求序时平均数,假设员工人数用Y来表示,则 ≈1260(人)该企业8月份平均员工数为1260人。 3.某企业2000年产品库存量数据如表8—4所示。试计算第一季度、第二季度、上半年、下半年和全年的平均库存量。 表8—4 单位:件

相关主题
文本预览
相关文档 最新文档