经典时间序列分析(2)
- 格式:ppt
- 大小:304.50 KB
- 文档页数:56
统计学中的时间序列时间序列(Time Series)是统计学中重要的研究对象之一,它描述了同一变量在不同时间点上的观测结果。
时间序列在许多领域都有广泛的应用,如经济学、金融学、气象学等。
通过对时间序列的分析,可以揭示出其中的规律和趋势,为决策和预测提供依据。
一、时间序列的基本概念时间序列是按照时间顺序排列的数据序列。
通常,时间序列中的观测值可以按照以下两个因素进行分类:1. 时间单位:观测点之间的时间间隔可以是固定的,如每日、每月、每年等,也可以是不规则的,如每小时、每分钟等。
2. 观测值类型:时间序列可以包含单变量(单个观测变量)或多变量(多个观测变量)。
二、时间序列的经典模型时间序列分析的目标是识别和建模数据中的模式和结构。
经典的时间序列模型包括以下几种:1. 自回归移动平均模型(ARMA):ARMA模型是将自回归模型(AR)和移动平均模型(MA)结合起来,它假设时间序列的当前观测值与过去的观测值和随机误差有关。
2. 自回归整合移动平均模型(ARIMA):ARIMA模型是在ARMA模型的基础上引入差分操作,用于消除时间序列的非平稳性。
3. 季节性模型:对于具有明显季节性变化的时间序列,可以采用季节性模型,如季节性ARIMA模型(SARIMA)。
4. 非线性模型:除了上述线性模型外,时间序列还可能具有非线性特征,因此可以采用非线性模型,如ARCH、GARCH模型等。
三、时间序列分析的方法时间序列分析主要包括以下几个步骤:1. 数据获取和预处理:从数据源获取时间序列数据,并对数据进行预处理,如处理缺失值、异常值等。
2. 数据可视化和描述性统计:通过绘制时间序列图、自相关图、偏自相关图等,对数据进行可视化和描述性统计,以了解数据的整体特征。
3. 模型识别和参数估计:根据观察到的时间序列图和自相关函数,选择适当的模型,并对模型的参数进行估计。
4. 模型检验和诊断:对所建立的模型进行检验,如检验模型的拟合优度、残差序列是否平稳等,并进行诊断,如检验残差是否具有自相关性等。
计量经济学中的时间序列分析时间序列分析是计量经济学中的重要内容之一,它主要研究特定变量随时间变化的规律性和趋势。
通过时间序列分析,我们可以更好地理解经济现象,预测未来变化趋势,制定合适的政策和策略。
本文将从时间序列的概念入手,介绍时间序列分析的基本原理、方法和应用。
一、时间序列的概念时间序列是按照时间顺序排列的一系列数据观测值的集合。
在计量经济学中,时间序列通常用来观察和研究某一经济变量在不同时间点上的变化情况。
时间序列数据可以是连续的,也可以是间断的,常见的时间单位包括年、季、月、周等。
通过对时间序列数据的分析,我们可以揭示出其中的规律性和特征。
二、时间序列分析的基本原理时间序列分析的基本原理是利用过去的数据来预测未来的发展趋势。
在时间序列分析中,常用的方法包括趋势分析、周期性分析、季节性分析和不规则波动分析。
趋势分析主要用来观察时间序列数据的长期变化趋势,周期性分析则是研究数据是否存在固定长度的周期性波动,季节性分析则是研究数据是否呈现出固定的季节性变化规律,而不规则波动分析则是研究一些随机因素对数据的影响。
三、时间序列分析的方法时间序列分析的方法有很多种,其中常用的包括移动平均法、指数平滑法、回归分析法、ARIMA模型等。
移动平均法通过计算连续几个期间的平均值来平滑数据,达到去除数据波动的目的;指数平滑法则是通过计算加权平均来对数据进行平滑处理,使得预测值更加准确;回归分析法则是通过建立经济模型来研究时间序列数据之间的关系,进行预测和分析;ARIMA模型则是一种时间序列的自回归与移动平均模型,可以对时间序列数据进行拟合和预测。
四、时间序列分析的应用时间序列分析在经济学、金融学、管理学等领域有着广泛的应用。
在经济学中,时间序列分析可以用来研究经济增长、通货膨胀、失业等经济现象的发展趋势;在金融学中,时间序列分析可以用来预测股票价格、汇率、利率等金融变量的变化情况;在管理学中,时间序列分析可以用来制定企业的生产计划和销售策略,提高企业的运营效率。
时间序列分析方法概述及应用时间序列分析是一种用于研究时间序列数据的统计方法,它涉及对时间序列的趋势、季节性和周期性等特性进行建模并进行预测。
本文将概述时间序列分析的基本方法,包括平滑方法、分解方法以及常用的时间序列模型,同时介绍时间序列分析在经济、金融、气象等领域的应用。
一、平滑方法平滑方法是最简单的时间序列分析方法之一,它通过移动平均或指数平滑技术来消除序列中的随机波动,以揭示序列的趋势。
其中,移动平均法通过计算一段时间内的均值来平滑序列,较少随机变动的影响。
指数平滑法则赋予更多的权重给最近的观测值,以更好地反映序列的变动趋势。
这些方法在预测短期波动趋势方面较为常用。
二、分解方法分解方法是将时间序列分解为趋势、季节性和随机成分的组合。
其中,趋势是指序列随时间变化的长期趋势;季节性则是指序列按照固定周期重复的短期波动。
常用的分解方法包括经典分解法和X-11季节性调整法。
经典分解法基于移动平均技术,将时间序列分解为趋势、季节性和残差成分。
X-11季节性调整法则是对时间序列中季节性的方法进行识别和去除,以得到季节调整后的数据。
三、时间序列模型时间序列模型是用数学模型来描述并预测时间序列的方法。
常见的时间序列模型包括AR模型、MA模型以及ARMA模型。
AR模型(自回归模型)是为了描述序列中当前值与过去的若干值之间的关系;MA 模型(滑动平均模型)是描述序列中当前值与过去的随机波动之间的关系;ARMA模型则是将AR模型和MA模型结合起来,以更好地描述时间序列的特性。
通过对时间序列建模,我们可以对未来的趋势和波动进行预测。
四、应用领域时间序列分析在许多领域都有广泛的应用。
在经济学中,时间序列分析可以用于分析经济指标的变动趋势、预测经济增长以及评估宏观经济政策的有效性。
在金融学中,时间序列分析可以用于预测股市指数的变动、评估风险以及制定投资策略。
此外,时间序列分析也被应用于气象、环境科学、医学等领域,以分析气象变化、环境污染水平以及流行病爆发的趋势。
时间序列的分析方法时间序列分析是指通过对时间序列数据进行统计学和数学模型的建立和分析,以预测和解释时间序列的未来走势和规律。
它是应用统计学和数学方法研究时间序列数据特点、规律、变化趋势,以及建立模型进行分析和预测的一种方法。
时间序列数据是按照时间顺序记录的数据,比如月度销售额、季度GDP增长率、年度股票收盘价等。
时间序列分析的目的是从历史数据中发现数据的模式,以便更好地理解现象、做出预测和制定决策。
时间序列分析主要有以下几种方法:1. 数据可视化方法数据可视化是分析时间序列数据的重要方法,可以通过绘制数据的折线图、柱状图、散点图等来观察数据的趋势、周期性、季节性等特点。
2. 描述性统计方法描述性统计是对时间序列数据的集中趋势、离散程度和分布形态进行描述的方法。
常用的描述性统计指标有均值、标准差、最大值、最小值等。
3. 平稳性检验方法平稳性是时间序列分析的重要假设,即时间序列在长期内的统计特性保持不变。
平稳性检验可以通过观察数据的图形、计算自相关函数、进行单位根检验等方法来判断时间序列是否平稳。
4. 时间序列分解方法时间序列分解是将时间序列数据分解为趋势成分、周期成分和随机成分的方法。
常用的时间序列分解方法有经典分解法和X-11分解法。
5. 自回归移动平均模型(ARMA)方法ARMA模型是时间序列的常用统计学模型,可以描述时间序列数据的自相关和滞后移动平均关系。
ARMA模型包括两个部分,AR(p)模型用来描述自回归关系,MA(q)模型用来描述移动平均关系。
6. 自回归积分滑动平均模型(ARIMA)方法ARIMA模型是ARMA模型的扩展,加入了差分操作,可以处理非平稳时间序列。
ARIMA模型通常用于对非平稳时间序列进行平稳化处理后的建模和预测。
7. 季节性模型方法对于具有明显季节性的时间序列数据,可以采用季节性模型进行分析和预测。
常用的季节性模型有季节性ARIMA模型、季节性指数平滑模型等。
8. 灰色模型方法灰色模型是一种适用于少量样本的时间序列建模和预测方法,它主要包括GM(1,1)模型和GM(2,1)模型。
时间序列模型及其应用分析时间序列是一系列时间上连续的数据点所组成的序列,其中每个数据点都表示了某一特定时刻的某个特征。
这些数据点可以是均匀间隔的,也可以是不均匀间隔的。
时间序列模型是对时间序列数据进行分析和预测的一种方法,它可以用来预测未来的趋势、季节性以及周期性变化等。
时间序列模型应用广泛,包括经济学、金融学、气象学、生态学、医学等领域。
时间序列分析的三个方面时间序列模型的分析过程可以分为三个方面:描述性分析、模型建立和模型预测。
描述性分析是对时间序列数据进行探索性的分析,以了解数据的整体特征。
常用的描述性统计学方法有均值、方差、标准差、自相关和偏自相关函数等。
作为对比,我们还可以对比不同时间序列数据之间的相关性、差异性等指标。
模型建立则是对时间序列进行拟合,以找出可以描述时间序列数据模式的数学模型。
时间序列数据的核心特征是时间的序列性质,因此模型的选择需要充分考虑到时间因素。
常用的时间序列模型包括AR、MA、ARMA、ARIMA和季节性模型等。
这些模型可以用自回归、移动平均、季节性变量等手段描述时间序列中可能出现的趋势和周期性变化。
预测也是时间序列模型分析的重要一环,它可以帮助我们预测未来的趋势和变化。
预测分析通常需要对历史数据进行处理、建立模型、进行模型检验和预测。
预测结果应当与实际值进行比较,以评估预测模型的准确性和可靠性。
常规时间序列分析方法:ARMA模型ARMA模型是一个经典时间序列预测模型。
ARMA模型的基本思想是把时间序列变成可以预测的序列,根据历史数据样本建立恰当的模型,预测未来数据的值。
ARMA模型由自回归过程(AR)和移动平均过程(MA)组成,AR过程考虑的是某一时刻的过去的信息对当前时刻的影响,MA过程关注的是随机变量的移动平均值对当前随机变量的影响。
ARMA模型的具体表现形式是:$$ Y_t = \alpha_1 Y_{t-1} + \alpha_2 Y_{t-2} + ... +\alpha_p Y_{t-p} + \epsilon_t + \beta_1 \epsilon_{t-1} + \beta_2 \epsilon_{t-2}+ ... +\beta_q \epsilon_{t-q} $$其中,Yt表示时间序列的实际值,α1到αp表示历史数据对当前时刻的影响,εt到εt-q表示误差项,β1到βq表示误差项对当前时刻的影响。
时间序列的分解分析时间序列分解分析是一种对时间序列数据进行分析和预测的方法,能够揭示时间序列数据中的趋势、季节性和不规则成分。
本文将介绍时间序列分解分析的基本原理、方法和应用,并结合实例进行详细阐述。
一、时间序列分解分析的基本原理时间序列是指按照时间顺序排列的一系列观测数据。
时间序列分解分析是将时间序列数据分解为趋势、季节性和不规则成分,以便更好地了解和预测数据的变化规律。
时间序列分解分析的基本原理是将时间序列数据表示为多个相互独立的成分之和,即y(t) = T(t) + S(t) + I(t)其中,y(t)表示时间序列数据,在某一时间点t的取值;T(t)表示趋势成分,描述数据随时间的长期变化趋势;S(t)表示季节性成分,描述数据在一定周期内的周期性变化;I(t)表示不规则成分,描述数据中的随机波动。
二、时间序列分解分析的方法1. 加法模型和乘法模型时间序列分解分析可以采用加法模型或乘法模型。
加法模型适用于季节性变化相对稳定、幅度相对固定的数据;乘法模型适用于季节性变化幅度随时间变化的数据。
加法模型可以表示为y(t) = T(t) + S(t) + I(t)乘法模型可以表示为y(t) = T(t) × S(t) × I(t)2. 移动平均和中心移动平均时间序列分解分析中常用的方法是移动平均和中心移动平均。
移动平均是用一组连续的数据点的平均值来代表该数据点,以平滑数据的波动;中心移动平均是将每个数据点替换为该数据点前后一段时间内数据的平均值。
通过移动平均和中心移动平均可以得到趋势成分的估计值。
3. X-11分析X-11分析是一种常用的季节性调整方法,适用于季节性变化相对稳定的时间序列数据。
X-11分析逐步消除季节性、趋势和不规则成分,得到经过季节性调整后的时间序列数据。
三、时间序列分解分析的应用时间序列分解分析是一种重要的时间序列分析方法,被广泛应用于经济学、金融学、气象学、环境科学等领域。
计量经济学中的时间序列分析计量经济学是应用经济学中比较基础的分支,主要研究经济学中的定量分析和增长趋势。
其中,时间序列分析作为计量经济学重要的一部分,被广泛运用于宏观经济学中的经济周期、经济增长率、通货膨胀以及个人收入等诸多领域。
时间序列分析是计量经济学中一种基本的研究方法,主要使用统计学技术处理时间序列数据,得出未来预测、检验理论假设和描述历史趋势等信息。
时间序列数据的重要性在于,它们反映了一个经济变量随着时间推移的变化规律。
这些数据可以被用来研究经济变量展现的时间趋势和季节性变化等。
因此,时间序列分析在宏观经济的长期趋势研究、短期波动分析、周期特征查验和经济结构变革判断等方面有重要的应用。
在时间序列分析中,经济变量随着时间的推移体现的规律通常被归纳为趋势、季节性、循环、随机波动四个方面。
趋势是一个时间序列中最为基本的成分,反映一项宏观经济变量的长期变化趋势,其普遍存在的原因可能是技术进步、人口变动、自然要素影响等等因素。
而季节性则是一项经济变量随着时间的相对固定的短期变化,反映的是因为季节性因素的影响而生的波动现象。
循环则是周期波动的一种体现,代表着长达数年的经济波动和周期性变化。
随机波动是时间序列中不可预测的无法被规律分析的随机性波动成分。
这种波动通常受到一些令人难以预测的特殊事件的影响,比如自然灾害、政府重大决策等。
时间序列分析方法有很多种,其中包括经典的时间序列分析方法,如白噪声检验、趋势分析、季节性分析、循环分析等。
同时也包括新兴的技术,如自回归移动平均模型(ARMA)、广义自回归条件异方差模型(GARCH)、立方样条获取非线性趋势和神经网络等。
这些方法涉及的内容比较复杂,因此初学者在学习中需要认真掌握这些方法和工具,并理解它们在数据处理和预测中的应用和限制。
总结而言,计量经济学中的时间序列分析是经济变量随时间推移表现出来的一种基本变化规律的统计学分析方法。
在宏观经济分析、政策研究、市场营销等方面有着广泛的应用。
Booth School of Business,University of ChicagoBusiness41202,Spring Quarter2012,Mr.Ruey S.TsaySolutions to MidtermProblem A:(34pts)Answer briefly the following questions.Each question has two points.1.Describe two improvements of the EGARCH model over the GARCHvolatility model.Answer:(1)allows for asymmetric response to past positive or negative returns,i.e.leverage effect,(2)uses log volatility to relax parameter constraint.2.Describe two methods that can be used to infer the existence of ARCHeffects in a return series,i.e.,volatility is not constant over time.Answer:(1)The sample ACF(or PACF)of the squared residuals of the mean equation,(2)use the Ljung-Box statistics on the squared residuals.3.Consider the IGARCH(1,1)volatility model:a t=σt t withσ2t =α0+β1σ2t−1+(1−β1)a2t−1.Often one pre-fixesα0=0.Why?Also,suppose thatα0=0and the1-step ahead volatility prediction at the forecast origin h is16.2%(annualized),i.e.,σh(1)=σh+1=16.2for the percentage log return.What is the10-step ahead volatility prediction?That is,what isσh(10)?Answer:(1)Fixingα0=0based on the prior knowledge that volatility is mean reverting.(2)σh(10)=16.2.4.(Questions4to8)Consider the daily log returns of Amazon stockfrom January3,2007to April27,2012.Some summary statistics of the returns are given in the attached R output.Is the expected(mean) return of the stock zero?Why?Answer:The data does not provide sufficient evidence to suggest that the mean return is not zero,because the95%confidence interval con-tains zero.5.Let k be the excess kurtosis.Test H0:k=0versus H a:k=0.Writedown the test statistic and draw the conclusion.1Answer:t-ratio =9.875√24/1340=73.79,which is highly significant com-pared with χ21distribution.6.Are there serial correlations in the log returns?Why?Answer:No,the Ljung-Box statistic Q (10)=10.69with p-value 0.38.7.Are there ARCH effects in the log return series?Why?Answer:Yes,the Ljung-Box statist of squared residuals gives Q (10)=39.24with p-value less than 0.05.8.Based on the summary statistics provided,what is the 22-step ahead point forecast of the log return at the forecast origin April 27,2012?Why?Answer:The point forecast r T (22)=0because the mean is not signif-icantly different from zero.[Give students 1point if they use sample mean.]9.Give two reasons that explain the existence of serial correlations in ob-served asset returns even if the true returns are not serially correlated.Answer:Any two of (1)bid-ask bounce,(2)nonsynchronous trading,(3)dynamic dependence of volaitlity via risk premuim.10.Give two reasons that may lead to using moving-average models inanalyzing asset returns.Answer:(1)Smoothing (or manipulation),(2)bid-ask bounce in high frequency returns.11.Describe two methods that can be used to compare different modelsfor a given time series.Answer:(1)Information criteria such as AIC or BIC,(2)backtesting or out-of-sample forecasting.12.(Questions 12to 14)Let r t be the daily log returns of Stock A.Assume that r t =0.004+a t ,where a t =σt t with t being iid N(0,1)random variates and σ2t =0.017+0.15a 2t −1.What is the unconditionalvariance of a t ?Answer:Var(a t )=0.0171−0.15=0.02.13.Suppose that the log price at t =100is 3.912.Also,at the forecastorigin t =100,we have a 100=−0.03and σ100=pute the21-step ahead forecast of the log price (not log return)and its volatility for Stock A at the forecast origin t =100.Answer:r 100(1)=0.004so that p 100(1)=3.912+0.004=3.916.Thevolatility forecast is σ2100(1)= 0.017+0.15(−0.03)2=pute the 30-step ahead forecast of the log price and its volatilityof Stock A at the forecast origin t =100.Answer:p 100(30)=3.912+0.004×30=4.032and the voaltility is the unconditional stantard error √0.02=0.141.15.Asset volatility has many applications in finance.Describe two suchapplications.Answer:Any two of (1)pricing derivative,(2)risk management,(3)asset allocation.16.Suppose the log return r t of Stock A follows the model r t =a t ,a t =σt t ,and σ2t =α0+α1a 2t −1+β1σ2t −1,where t are iid N(0,1).Under whatcondition that the kurtosis of r t is 3?That is,state the condition under which the GARCH dynamics fail to generate any additional kurtosis over that of t .Answer:α1=0.17.What is the main consequence in using a linear regression analysis whenthe serial correlations of the residuals are overlooked?Answer:The t -ratios of coefficient estimates are not reliable.Problem B .(30pts)Consider the daily log returns of Amazon stock from January 3,2007to April 27,2012.Several volatility models are fitted to the data and the relevant R output is attached.Answer the following questions.1.(2points)A volatility model,called m1in R,is entertained.Write down the fitted model,including the mean equation.Is the model adequate?Why?Answer:ARCH(1)model.r t =0.0018+a t ,a t =σt t with t being iidN(0,1)and σ2t =7.577×10−4+0.188a 2t −1.The model is inadequatebecause the normality assumption is clearly rejected.2.(3points)Another volatility model,called m2in R,is fitted to the returns.Write down the model,including all estimated parameters.3Answer:ARCH(1)model.r t=4.907×10−4+a t,a t=σt t,where t∼t∗3.56with t∗vdenoting standardized Student-t distribution with v degreesof freedom.The volatility equation isσ2t =7.463×10−4+0.203a2t−1.3.(2points)Based on thefitted model m2,test H0:ν=5versus H a:ν=5,whereνdenotes the degrees of freedom of Student-t distribution.Perform the test and draw a conclusion.Answer:t-ratio=3.562−50.366=−3.93,which compared with1.96is highlysignificant.If you compute the p-value,it is8.53×10−5.Therefore, v=5is rejected.4.(3points)A third model,called m3in R,is also entertained.Writedown the model,including the distributional parameters.Is the model adequate?Why?Answer:Another ARCH(1)model.r t=0.0012+a t,a t=σt t,where t are iid and follow a skew standardized Student-t distribution with skew parameter1.065and degrees of freedom3.591.The volatility equationisσ2t =7.418×10−4+0.208a2t−1.Ecept for the insigicant mean value,thefitted ARCH(1)model appears to be adequate based on the model checking statistics shown.5.(2points)Letξbe the skew parameter in model m3.Does the estimateofξconfirm that the distribution of the log returns is skewed?Why?Perform the test to support your answer.Answer:The t-ratio is1.065−10.039=1.67,which is smaller than1.96.Thus,the null hypothesis of symmetric innovations cannot be rejected at the 5%level.6.(3points)A fourth model,called m4in R,is alsofitted.Write downthefitted model,including the distribution of the innovations.Answer:a GARCH(1,1)model.r t=0.0017+a t,a t=σt t,where t are iid and follow a skew standardized Student-t distribution with skew parameter1.101and degrees of freedom3.71.The volatility equationisσ2t =1.066×10−5+0.0414a2t−1+0.950σ2t−1.7.(2points)Based on model m4,is the distribution of the log returnsskewed?Why?Perform a test to support your answer.Answer:The t-ratio is1.101−10.043=2.349,which is greater than1.96.Thus,the distribution is skew at the5%level.48.(2points)Among models m1,m2,m3,m4,which model is preferred?State the criterion used in your choice.Answer:Model4is preferred as it has a smaller AIC value.9.(2points)Since the estimatesˆα1+ˆβ1is very close to1,we consideran IGARCH(1,1)model.Write down thefitted IGARCH(1,1)model, called m5.Answer:r t=a t,a t=σt t,whereσ2t =3.859×10−5+0.85σ2t−1+0.15a2t−1.10.(2points)Use the IGARCH(1,1)model and the information providedto obtain1-step and2-step ahead predictions for the volatility of the log returns at the forecast origin t=1340.Answer:From the outputσ21340(1)=σ21341=3.859×10−5+0.85×(0.02108)2+0.15(.146)2=0.00361.Therefore,σ21340(2)=3.859×10−5+σ2 1340(1)=0.00365.The volatility forecasts are then0.0601and0.0604,respectively.11.(2points)A GARCH-M model is entertained for the percentage logreturns,called m6in the R output.Based on thefitted model,is the risk premium statistical significant?Why?Answer:The risk premium parameter is−0.112with t-ratio−0.560, which is less than1.96in modulus.Thus,the risk premium is not statistical significant at the5%level.12.(3points)Finally,a GJR-type model is entertained,called m7.Writedown thefitted model,including all parameters.Answer:This is an APARCH model.The model is r t=0.0014+a t,a t=σt t,where t are iid and follow a skew standardized Student-tdistribution with skew parameter1.098and degrees of freedom3.846.The volatility equation isσ2 t =7.583×10−6+0.0362(|a t−1|−0.478a t−1)2+0.953σ2t−1.13.(2points)Based on thefitted GJR-type of model,is the leverage effectsignificant?Why?Answer:Yes,the leverage parameterγ1is signfiicantly different from zero so that there is leverage effect in the log returns.5Problem C.(14pts)Consider the quarterly earnings per share of Abbott Laboratories(ABT)stock from1984.III to2011.III for110observations.We analyzed the logarithms of the earnings.That is,x t=ln(y t),where y t is the quarterly earnings per share.Two models are entertained.1.(3points)Write down the model m1in R,including residual variance.Answer:Let r t be the log earnings per share.Thefitted model is=0.00161.(1−B)(1−B4)r t=(1−0.565B)(1−0.183B4)a t,σ2a2.(2points)Is the model adequate?Why?Answer:No,the Ljung-Box statistics of the residuals give Q(12)=25.76with p-value0.012.3.(3points)Write down thefitted model m2in R,including residualvariance.Answer:Thefitted model is=0.00144.(1−B)(1−B4)r t=(1−0.470B−0.312B3)a t,σ2a4.(2points)Model checking of thefitted model m2is given in Figure1.Is the model adequate?Why?Answer:Yes,the model checking statistics look reasonable.5.(2points)Compare the twofitted model models.Which model ispreferred?Why?Answer:Model2is preferred.It passes model checking and has a smaller AIC value.6.(2points)Compute95%interval forecasts of1-step and2-step aheadlog-earnings at the forecast origin t=110.Answer:1-step ahead prediction:0.375±1.96×0.038,and2-step ahead prediction:0.0188±1.96×0.043.(Some students may use2-step ahead prediction due to the forecast origin confusion.)Problem D.(22pts)Consider the growth rate of the U.S.weekly regular gasoline price from January06,1997to September27,2010.Here growth rate is obtained by differencing the log gasoline price and denoted by gt in R output.The growth rate of weekly crude oil from January03,1997to September24,2010is also obtained and is denoted by pt in R output.Note that the crude oil price was known3days prior to the gasoline price.61.(2points)First,a pure time series model is entertained for the gasolineseries.An AR(5)model is selected.Why?Also,is the mean of the gtseries significantly different from zero?Why?Answer:An AR(5)is selected via the AIC criterion.The mean of g tis not significantly different from zero based on the one-sample t-test.The p-value is0.19.2.(2points)Write down thefitted AR(5)model,called m2,includingresidual variance.Answer:Thefitted model is=0.000326.(1−0.507B−0.079B2−0.136B3+0.036B4+0.086B5)g t=a t,σ2a3.(2points)Since not all estimates of model m2are statistically signifi-cant,we refine the model.Write down the refined model,called m3.Answer:Thefitted model is=0.000327.(1−0.504B−0.074B2−0.122B3+0.101B5)g t=a t,σ2a4.(2points)Is the refined AR(5)model adequate?Why?Answer:Yes,the Ljung-Box statistics of the residuals give Q(14)=10.27with p-value0.74,indicating that there are no serial correlationsin the residuals.5.(2points)Does the gasoline price show certain business-cycle behavior?Why?Answer:Yes,thefitted AR(5)polynomial contains compplex solutions.6.(3points)Next,consider using the information of crude oil price.Writedown the linear regression model,called m4,including R2and residualstandard error.Answer:Thefitted linear regression model isg t=0.287p t+ t,σ =0.0184,and the R2of the regression is33.66%.7.(2points)Is thefitted linear regression model adequate?Why?Answer:No,because the residuals t are serially correlated based onthe Ljung-Box test.78.(3points)A linear regression model with time series errors is enter-tained and insignificant parameters removed.Write down thefinalmodel,including allfitted parameters.Answer:The model is(1−0.404B−0.164B2−0.096B3+0.101B5)(g t−0.191p t)=a t,σ2=0.000253.a9.(2points)Model checking shows that thefittedfinal model has noresidual serial correlations.Based on the model,is crude oil pricehelpful in predicting the gasoline price?Why?Answer:Yes,because thefitted coefficient of p t is signficantly differentfrom zero.10.(2points)Compare the pure time series model and the regression modelwith time-series errors.Which model is preferred?Why?Answer:The regression model with time series error is preferred as ithas a smaller AIC criterion.8。
2.6 案例分析1:中国人口时间序列模型(file:b2c1)4681012145055606570758085909500Y-0.2-0.10.00.10.20.35055606570758085909500DY图2.11 中国人口序列(1949-2000) 图2.12 中国人口一阶差分序列(1950-2000)从人口序列图可以看出我国人口总水平除在1960和1961两年出现回落外,其余年份基本上保持线性增长趋势。
47年间平均每年增加人口1451.5万人,年平均增长率为17.5‰ 。
由于总人口数逐年增加,实际上的年人口增长率是逐渐下降的。
把47年分为两个时期,即改革开放以前时期(1949—1978)和改革开放以后时期(1978—1996),则前一个时期的年平均增长率为20‰,后一个时期的年平均增长率为13.4‰。
从人口序列的变化特征看,这是一个非平稳序列。
见人口差分序列图。
建国初期由于进入和平环境,同时随着国民经济的迅速恢复,人口的年净增数从1950年的1029万人,猛增到1957年的1825万人。
由于粮食短缺,三年经济困难时期是建国后我国惟一一次人口净负增长时期(1960,1961),人口净增值不但没有增加,反而减少。
随着经济形势的好转,从1962年开始人口年增加值迅速恢复到1500万的水平,随后呈连年递增态势。
1970年是我国历史上人口增加最多的一个年份,为2321万人。
随着70年代初计划生育政策执行力度的加强,从1971年开始。
年人口增加值逐年下降,至1980年基本回落到建国初期水平。
1981至1991年人口增加值大幅回升,主要原因是受1962—1966年高出生率的影响(1963年为43.73‰)。
这种回升的下一个周期将在2005年前后出现,但强势会有所减弱。
从数据看,1992年以后,人口增加值再一次呈逐年下降趋势。
由于现在的人口基数大于以往年份,所以尽管年增人口仍在1千万人以上,但人口增长率却是建国以来最低的(1996年为10.5‰)。