33时间序列分析
- 格式:docx
- 大小:300.87 KB
- 文档页数:13
《时间序列分析》习题解答�0�2习题2.3�0�21考虑时间序列12345…201判断该时间序列是否平稳2计算该序列的样本自相关系数kρ∧k12… 6 3绘制该样本自相关图并解释该图形. �0�2解1根据时序图可以看出该时间序列有明显的递增趋势所以它一定不是平稳序列�0�2即可判断该时间序是非平稳序列其时序图程序见后。
�0�2 时间序描述程序data example1 input number timeintnxyear01jan1980d _n_-1 format time date. cards 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 proc gplot dataexample1 plot numbertime1 symbol1 cblack vstar ijoin run�0�2�0�2�0�22当延迟期数即k本题取值1 2 3 4 5 6远小于样本容量n本题为20时自相关系数kρ∧计算公式为number1234567891011121314151617181920time01JAN8001J AN8101JAN8201JAN8301JAN8401JAN8501JAN8601JAN870 1JAN8801JAN8901JAN9001JAN9101JAN9201JAN9301JAN9 401JAN9501JAN9601JAN9701JAN9801JAN99121nkttktknttX XXXXXρ�6�1∧�6�1�6�1≈�6�1∑∑ 0kn4.9895�0�2注20.05125.226χ接受原假设认为该序列为纯随机序列。
�0�2解法三、Q统计量法计算Q统计量即12214.57kkQnρ∑�0�2�0�2�0�2�0�2�0�2�0�2�0�2�0�2�0�2�0�2查表得210.051221.0261χ�6�1由于Q统计量值4.57Q小于查表临界值即可认为接受原假设即该序列可视为纯随机序列为白噪声序列 5表2——9数据是某公司在2000——2003年期间每月的销售量。
高三英语统计学分析单选题60题及答案1.The average score of a class is calculated by adding all the scores and dividing by the number of students. This is an example of _____.A.meanB.medianC.modeD.range答案:A。
本题考查统计学基本概念。
A 选项mean(平均数)是通过将所有数据相加再除以数据个数得到的,符合题干描述。
B 选项median((中位数)是将数据从小到大排列后位于中间位置的数。
C 选项mode(众数)是数据中出现次数最多的数。
D 选项range(极差)是数据中的最大值与最小值之差。
2.In a set of data, if there is a value that occurs most frequently, it is called the _____.A.meanB.medianC.modeD.range答案:C。
A 选项mean 是平均数。
B 选项median 是中位数。
C 选项mode 众数是出现次数最多的值,符合题意。
D 选项range 是极差。
3.The middle value in a sorted list of data is called the _____.A.meanB.medianC.modeD.range答案:B。
A 选项mean 是平均数。
B 选项median 中位数是排序后位于中间的数,符合题干描述。
C 选项mode 是众数。
D 选项range 是极差。
4.The difference between the highest and lowest values in a set of data is known as the _____.A.meanB.medianC.modeD.range答案:D。
人工智能基础(习题卷28)第1部分:单项选择题,共50题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]在线性回归中,对回归系数的显著性检验采用()A)Z检验B)T检验;$F检验C)χ2检验答案:B解析:2.[单选题]人和机器最大的区别是什么?A)能动性B)人性C)思维D)计算答案:B解析:3.[单选题]启发式搜索是寻求问题( )解的一种方法A)最优B)一般C)满意D)最坏答案:C解析:4.[单选题]Prolog语言的三种基本语句是: 。
A)顺序、循环、分支B)陈述、询问、感叹C)事实、规则、询问D)肯定、疑问、感叹答案:C解析:5.[单选题]聚类方法主要选择( ),可以起到去除凸起点云的目的,为后续计算抓取点带来更准确的结果。
A)靠拢B)分离C)区域生长D)标注答案:B解析:6.[单选题]常见的图像预处理方法不包括( )。
A)图像降噪B)图像增强解析:图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,主要包 括去噪、对比度增强。
图像尺寸归一化也是为了增强对比度。
图像标注是图像处理方法。
7.[单选题]下面说法正确的是?A)梯度下降有时会陷于局部极小值,但EM算法不会。
B)SVM对噪声鲁棒。
C)当训练数据较多时更容易发生过拟合。
D)给定n个数据点,如果其中一半用于训练,另一半用于测试,则训练误差和测试误差之间的差别会随着n的增加而减小。
答案:D解析:8.[单选题]电力、石、天然气以及水利部门对无人机最普遍的应用是( )。
A)测绘B)监测C)架线与选线D)救援答案:C解析:9.[单选题]Jupyter notebook的记事本文件扩展名为:A)mB)pyC)pycD)ipynb答案:D解析:10.[单选题]有一个 28x28 的图片,并使用输入深度为 3 和输出深度为 8 在上面运行一个 3x3 的卷积神经网络。
注意,步幅是 1,你正在使用相同的填充(padding)当使用给定的参数时,输出特征图的尺寸是多少?( )A)13 宽、13 高、8 深B)28 宽、28 高、8 深C)13 宽、28 高、8 深D)28 宽、13 高、8 深答案:B解析:11.[单选题]下列哪一个不是神经网络的代表()A)卷积神经网络B)递归神经网络C)残差网络D)xgboost算法答案:D解析:xgboost算法属于决策树12.[单选题]植保无人机植保作业的时候,以下哪项是不需要事前确认的( )。
第九章 时间序列分析第三节 趋势变动分析一、时间序列构成要素与模型时间序列的形成是各种不同的因素对事物的发展变化共同起作用的结果。
这些因素概括起来可以归纳为四类:长期趋势因素、季节变动因素、循环变动因素和不规则变动因素。
由此造成客观事物的变动呈现出四种不同的状态:第一,长期趋势变动。
长期趋势因素是在事物的发展过程中起着主要的、决定性作用的因素,这类因素使得事物的发展水平长期沿着一定的方向发展,使事物的变化呈现出某种长期的变化趋势。
例如,中国改革开放以来,经济是持续增长的,表现为国内生产总值逐年增长的态势。
第二,季节变动。
季节变动或称季节波动,是指某些现象由于受自然条件和经济条件的变动影响,而形成在一年中随季节变动而发生的有规律的变动。
如羽绒服装的销售量由于季节的影响而呈现出淡、旺交替变化的周期性变动;某些农产品加工企业,由于受原材料生长季节的影响,其生产也出现周期性变动等等。
第三,循环变动。
循环变动是指一年以上的周期性变化,其波动是从低到高再从高到低的周而复始的一种有规律的变动。
循环波动不同于趋势变动,它不是沿着单一的方向持续运动,而是升降相间、涨落交替的变动;它也不同于季节变动,季节变动有比较固定的规律,且变动周期长度在一年以内,而循环变动则无固定规律,变动周期多在一年以上,且周期长短不一。
第四,不规则变动。
不规则变动也有人称之为随机漂移,属于序列中无法确切解释、往往也无须解释的那些剩余波动。
引起事物发生不规则变动的因素多是一些偶然因素,由于它们的影响使事物的发展变化呈现出无规律的、不规则的状态。
时间序列构成分析就是要观察现象在一个相当长的时期内,由于各个影响因素的影响,使事物发展变化中出现的长期趋势、季节变动、循环变动和不规则变动。
形成时间序列变动的四类构成因素,按照它们的影响方式不同,可以设定为不同的组合模型。
其中,最常用的有乘法模型和加法模型。
乘法模型:Y = T·S·C·I (9-20)加法模型:Y = T+S+C+I (9-21)式中:Y:时间序列的指标数值T:长期趋势成分S:季节变动成分C:循环变动成分I:不规则变动成分乘法模型是假定四个因素对现象的发展的影响是相互作用的,以长期趋势成分的绝对量为基础,其余量均以比率表示。
1. 时间序列数据的基本特征不包括以下哪一项?A. 趋势性B. 季节性C. 周期性D. 随机性2. 下列哪种方法不适用于时间序列的平稳性检验?A. ADF检验B. KPSS检验C. 自相关函数(ACF)D. 方差分析(ANOVA)3. 在时间序列分析中,ARIMA模型中的"I"代表什么?A. 自回归B. 差分C. 移动平均D. 指数平滑4. 季节性分解方法中,哪种方法最常用?A. 加法模型B. 乘法模型C. 对数加法模型D. 对数乘法模型5. 在时间序列预测中,以下哪种方法属于机器学习方法?A. ARIMAB. 指数平滑C. 支持向量机(SVM)D. 移动平均6. 时间序列数据中的白噪声具有以下哪个特征?A. 均值为零B. 方差为零C. 自相关系数为零D. 互相关系数为零7. 在ARIMA模型中,p, d, q分别代表什么?A. 自回归阶数,差分阶数,移动平均阶数B. 差分阶数,自回归阶数,移动平均阶数C. 移动平均阶数,差分阶数,自回归阶数D. 自回归阶数,移动平均阶数,差分阶数8. 时间序列分析中的平稳性意味着什么?A. 序列的均值和方差随时间变化B. 序列的均值和方差不随时间变化C. 序列的自相关系数随时间变化D. 序列的互相关系数随时间变化9. 在时间序列分析中,以下哪种模型适用于非平稳序列?A. AR模型B. MA模型C. ARMA模型D. ARIMA模型10. 时间序列数据的自相关函数(ACF)用于衡量什么?A. 序列与滞后序列之间的相关性B. 序列与未来序列之间的相关性C. 序列与随机序列之间的相关性D. 序列与固定序列之间的相关性11. 在时间序列分析中,偏自相关函数(PACF)用于衡量什么?A. 序列与滞后序列之间的直接相关性B. 序列与未来序列之间的直接相关性C. 序列与随机序列之间的直接相关性D. 序列与固定序列之间的直接相关性12. 时间序列分析中的季节性调整通常使用哪种方法?A. 移动平均B. 指数平滑C. 季节性分解D. 差分13. 在时间序列分析中,以下哪种方法适用于长期趋势的提取?A. 移动平均B. 指数平滑C. 季节性分解D. 差分14. 时间序列数据中的周期性波动通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步15. 在时间序列分析中,以下哪种方法适用于短期预测?A. ARIMAB. 指数平滑C. 季节性分解D. 差分16. 时间序列数据中的趋势性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步17. 在时间序列分析中,以下哪种方法适用于非线性时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 神经网络18. 时间序列数据中的季节性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步19. 在时间序列分析中,以下哪种方法适用于长期预测?A. ARIMAB. 指数平滑C. 季节性分解D. 差分20. 时间序列数据中的随机性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步21. 在时间序列分析中,以下哪种方法适用于非平稳时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 差分22. 时间序列数据中的趋势性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步23. 在时间序列分析中,以下哪种方法适用于非线性时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 神经网络24. 时间序列数据中的季节性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步25. 在时间序列分析中,以下哪种方法适用于长期预测?A. ARIMAB. 指数平滑C. 季节性分解D. 差分26. 时间序列数据中的随机性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步27. 在时间序列分析中,以下哪种方法适用于非平稳时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 差分28. 时间序列数据中的趋势性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步29. 在时间序列分析中,以下哪种方法适用于非线性时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 神经网络30. 时间序列数据中的季节性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步31. 在时间序列分析中,以下哪种方法适用于长期预测?A. ARIMAB. 指数平滑C. 季节性分解D. 差分32. 时间序列数据中的随机性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步33. 在时间序列分析中,以下哪种方法适用于非平稳时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 差分34. 时间序列数据中的趋势性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步35. 在时间序列分析中,以下哪种方法适用于非线性时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 神经网络36. 时间序列数据中的季节性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步37. 在时间序列分析中,以下哪种方法适用于长期预测?A. ARIMAB. 指数平滑C. 季节性分解D. 差分38. 时间序列数据中的随机性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步39. 在时间序列分析中,以下哪种方法适用于非平稳时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 差分40. 时间序列数据中的趋势性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步41. 在时间序列分析中,以下哪种方法适用于非线性时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 神经网络42. 时间序列数据中的季节性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步43. 在时间序列分析中,以下哪种方法适用于长期预测?A. ARIMAB. 指数平滑C. 季节性分解D. 差分44. 时间序列数据中的随机性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步45. 在时间序列分析中,以下哪种方法适用于非平稳时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 差分46. 时间序列数据中的趋势性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步47. 在时间序列分析中,以下哪种方法适用于非线性时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 神经网络48. 时间序列数据中的季节性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步49. 在时间序列分析中,以下哪种方法适用于长期预测?A. ARIMAB. 指数平滑C. 季节性分解D. 差分50. 时间序列数据中的随机性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步51. 在时间序列分析中,以下哪种方法适用于非平稳时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 差分52. 时间序列数据中的趋势性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步53. 在时间序列分析中,以下哪种方法适用于非线性时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 神经网络54. 时间序列数据中的季节性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步55. 在时间序列分析中,以下哪种方法适用于长期预测?A. ARIMAB. 指数平滑C. 季节性分解D. 差分56. 时间序列数据中的随机性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步57. 在时间序列分析中,以下哪种方法适用于非平稳时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 差分58. 时间序列数据中的趋势性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步59. 在时间序列分析中,以下哪种方法适用于非线性时间序列?A. ARIMAB. 指数平滑C. 季节性分解D. 神经网络60. 时间序列数据中的季节性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步61. 在时间序列分析中,以下哪种方法适用于长期预测?A. ARIMAB. 指数平滑C. 季节性分解D. 差分62. 时间序列数据中的随机性通常由什么引起?A. 经济周期B. 季节变化C. 随机事件D. 技术进步答案1. D2. D3. B4. B5. C6. A7. A8. B9. D10. A11. A12. C13. A14. A15. B16. D17. D18. B19. A20. C21. A22. D23. D24. B25. A26. C27. A28. D29. D30. B31. A32. C33. A34. D35. D36. B37. A38. C39. A40. D41. D42. B43. A44. C45. A46. D47. D48. B49. A50. C51. A52. D53. D54. B55. A56. C57. A58. D59. D60. B61. A62. C。
调研过程方法这里有50种调研过程方法,并展开详细描述。
1. 访谈法:通过与受访者深入交流,了解他们的想法、经历和观点。
2. 观察法:观察人们的行为和环境,从中获取信息和洞察。
3. 问卷调查:设计并发送调查问卷,收集受访者的意见和反馈。
4. 专家访谈:与领域内的专家进行面对面交流,获取专业见解和建议。
5. 焦点小组讨论:邀请一组人集中讨论特定话题,收集多样的意见和观点。
6. 实地考察:亲自到调研对象所在的地方进行考察和观察。
7. 数据分析:利用统计数据和趋势分析来了解市场情况和发展趋势。
8. 现场调查:在特定地点进行问卷调查或观察,直接获取相关反馈和数据。
9. 抽样调查:根据一定的抽样方法,从总体中选取代表性样本进行调研。
10. 文献综述:对相关文献进行梳理和整合,获取已有研究成果和观点。
11. 网络调研:通过互联网平台进行调研,收集线上用户的意见和反馈。
12. 历史回顾:通过回顾历史事件和资料,了解相关情况和发展趋势。
13. 整群调查:对特定群体进行全面的调查和分析,揭示整体情况。
14. 随机抽样:使用随机数或随机抽样工具,从总体中进行随机化选取。
15. 广告调查法:通过广告传播媒体来了解受众的反馈和偏好。
16. 交叉调查:在不同地点、不同时间对同一问题进行多次调查,验证结果的一致性。
17. 电话访谈:通过电话与受访者进行深入交流和调查。
18. 社交媒体分析:通过分析社交媒体平台内容和反馈,了解用户的态度和需求。
19. 可视化调研:利用图表、地图等可视化手段展示调研结果,增加易懂性。
20. 语境分析:分析受访者所处的社会、文化、地理环境,对调研结果进行解读。
21. 产品测试:让受访者尝试使用产品或服务,收集他们的使用体验和意见。
22. 市场调查:通过对市场规模、竞争状况等方面进行调查,了解市场情况。
23. 地图实验:通过绘制地图等方式展现数据,揭示空间分布规律。
24. 情景模拟:构建特定情景,观察受访者在不同情境下的反应。
第一章习题答案略第二章习题答案2.1答案:(1)不平稳,有典型线性趋势(2)1-6阶自相关系数如下(3)典型的具有单调趋势的时间序列样本自相关图2.2答案:(1)不平稳(2)延迟1-24阶自相关系数(3)自相关图呈现典型的长期趋势与周期并存的特征2.3答案:(1)1-24阶自相关系数(2)平稳序列(3)非白噪声序列2.4计算该序列各阶延迟的Q统计量及相应P值。
由于延迟1-12阶Q统计量的P值均显著大于0.05,所以该序列为纯随机序列。
2.5答案(1)绘制时序图与自相关图(2)序列时序图显示出典型的周期特征,该序列非平稳(3)该序列为非白噪声序列2.6答案(1)如果是进行平稳性图识别,该序列自相关图呈现一定的趋势序列特征,可以视为非平稳非白噪声序列。
如果通过adf检验进行序列平稳性识别,该序列带漂移项的0阶滞后P值小于0.05,可以视为平稳非白噪声序列(2)差分后序列为平稳非白噪声序列2.7答案(1)时序图和自相关图显示该序列有趋势特征,所以图识别为非平稳序列。
(2)单位根检验显示带漂移项0阶延迟的P值小于0.05,所以基于adf检验可以认为该序列平稳(3)如果使用adf检验结果,认为该序列平稳,则白噪声检验显示该序列为非白噪声序列如果使用图识别认为该序列非平稳,那么一阶差分后序列为平稳非白噪声序列2.8答案(1)时序图和自相关图都显示典型的趋势序列特征(2)单位根检验显示该序列可以认为是平稳序列(带漂移项一阶滞后P值小于0.05)(3)一阶差分后序列平稳第三章习题答案 3.10101()0110.7t E x φφ===--() 221112() 1.96110.7t Var x φ===--() 22213=0.70.49ρφ==()12122221110.490.7=0110.71ρρρφρρ-==-(4) 3.21111222211212(2)7=0.515111=0.30.515AR φφφρφφφρφρφφφ⎧⎧⎧=⎪=⎪⎪⎪--⇒⇒⎨⎨⎨⎪⎪⎪=+=+⎩⎩⎪⎩模型有:,2115φ=3.312012(1)(10.5)(10.3)0.80.15()01t t t t t tt B B x x x x E x εεφφφ----=⇔=-+==--,22121212()(1)(1)(1)10.15=(10.15)(10.80.15)(10.80.15)1.98t Var x φφφφφφ-=+--+-+--+++=()1122112312210.83=0.70110.150.80.70.150.410.80.410.150.70.22φρφρφρφρφρφρ==-+=+=⨯-==+=⨯-⨯=() 1112223340.70.15=0φρφφφ====-()3.41211110011AR c c c c c ⎧<-<<⎧⎪⇒⇒-<<⎨⎨<±<⎪⎩⎩() ()模型的平稳条件是 1121,21,2k k k c c k ρρρρ--⎧=⎪-⎨⎪=+≥⎩() 3.5证明:该序列的特征方程为:320c c λλλ--+=,解该特征方程得三个特征根:11λ=,2λ=3λ=无论c 取什么值,该方程都有一个特征根在单位圆上,所以该序列一定是非平稳序列。
3.3 时间序列分析3.3.1 时间序列概述1. 基本概念(1) 一般概念:系统中某一变量的观测值按时间顺序 (时间间隔相同)排列成一个数值序列,展示研究对象在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律。
它是系统中某一变量受其它各种因素影响的总结果。
(2) 研究实质:通过处理预测目标本身的时间序列数据,获得事物随时间过程的演变特性与规律,进而预测事物的未来发展。
它不研究事物之间相互依存的因果关系。
(3) 假设基础:惯性原则。
即在一定条件下,被预测事物的过去变化趋势会延续到未来。
暗示着历史数据存在着某些信息,利用它们可以解释与预测时间序列的现在和未来。
近大远小原理(时间越近的数据影响力越大)和无季节性、无趋势性、线性、常数方差等。
(4) 研究意义:许多经济、金融、商业等方面的数据都是时间序列数据。
时间序列的预测和评估技术相对完善,其预测情景相对明确。
尤其关注预测目标可用数据的数量和质量,即时间序列的长度和预测的频率。
2. 变动特点(1) 趋势性:某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向,但变动幅度可能不等。
(2) 周期性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。
(3) 随机性:个别为随机变动,整体呈统计规律。
(4) 综合性:实际变化情况一般是几种变动的叠加或组合。
预测时一般设法过滤除去不规则变动,突出反映趋势性和周期性变动。
3. 特征识别认识时间序列所具有的变动特征,以便在系统预测时选择采用不同的方法。
(1) 随机性:均匀分布、无规则分布,可能符合某统计分布。
(用因变量的散点图和直方图及其包含的正态分布检验随机性,大多数服从正态分布。
)(2) 平稳性:样本序列的自相关函数在某一固定水平线附近摆动,即方差和数学期望稳定为常数。
样本序列的自相关函数只是时间间隔的函数,与时间起点无关。
其具有对称性,能反映平稳序列的周期性变化。
特征识别利用自相关函数ACF p k= 丫k丫o 其中丫k是y t的k阶自协方差,且p o=1、-1< p k<1 o平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋近于0,前者测度当前序列与先前序列之间简单和常规的相关程度,后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。
实际上,预测模型大都难以满足这些条件,现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。
4. 预测类型(1) 点预测:确定唯一的最好预测数值,其给出了时间序列未来发展趋势的一个简单、直接的结果。
但常产生一个非零的预测误差,其不确定程度为点预测值的置信区间。
(2) 区间预测:未来预测值的一个区间,即期望序列的实际值以某一概率落入该区间范围内。
区间的长度传递了预测不确定性的程度,区间的中点为点预测值。
(3) 密度预测:序列未来预测值的一个完整的概率分布。
根据密度预测,可建立任意置信水平的区间预测,但需要额外的假设和涉及复杂的计算方法。
5. 基本步骤(1) 分析数据序列的变化特征。
(2) 选择模型形式和参数检验。
(3) 利用模型进行趋势预测。
(4) 评估预测结果并修正模型。
3.3.2 随机时间序列系统中某一因素变量的时间序列数据没有确定的变化形式,也不能用时间的确定函数描述,但可以用概率统计方法寻求比较合适的随机模型近似反映其变化规律。
(自变量不直接含有时间变量, 但隐含时间因素)1. 自回归AR(p)模型(R:模型的名称P :模型的参数)(自己影响自己,但可能存在误差,误差即没有考虑到的因素)(1) 模型形式(£ t越小越好,但不能为0:£为0表示只受以前丫的历史的影响不受其他因素影响)y t = i y t-i + © 2y t-2 + ........... + © p y t-p + £ t式中假设: y t 的变化主要与时间序列的历史数据有关,与其它因素无关;£ t 不同时刻互不相关,£ t 与y t 历史序列不相关。
式中符号: p 模型的阶次,滞后的时间周期,通过实验和参数确定;y t当前预测值,与自身过去观测值y t-i、…、y t-p是同一序列不同时刻的随机变量,相互间有线性关系,也反映时间滞后关系;y t-1 、y t-2 、……、y t-p 同一平稳序列过去p 个时期的观测值;© i、© 2、..... 、©p自回归系数,通过计算得出的权数,表达y t依赖于过去的程度,且这种依赖关系恒定不变;£t随机干扰误差项,是0均值、常方差C〈独立的白噪声序列,通过估计指定的模型获得。
(2) 识别条件当k>p 时,有© k=0 或© k 服从渐近正态分布N(0,1/n) 且(| ©k|>2/n )的个数w 4.5%,即平稳时间序列的偏相关系数© k为p步截尾,自相关系数r k逐步衰减而不截尾,则序列是AR(p)模型。
实际中,一般AR过程的ACF函数呈单边递减或阻尼振荡,所以用PACF函数判别(从p阶开始的所有偏自相关系数均为0)。
(3) 平稳条件—阶:| © l|<1 0 二阶:© l+© 2<1、© 1- © 2<1、| © 2|<1 0^ 越大,自回归过程的波动影响越持久。
(4) 模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量相互独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性等造成的困难02. 移动平均MA(q)模型(1) 模型形式y t = £t- 9 1 £t-1 - 9 2 £t-2 - ........................... - 9 p £t-p(2) 模型含义用过去各个时期的随机干扰或预测误差的线性组合来表达当前预测值0AR(p)的假设条件不满足时可以考虑用此形式。
总满足平稳条件,因其中参数9取值对时间序列的影响没有AR模型中参数p 的影响强烈,即这里较大的随机变化不会改变时间序列的方向0(3) 识别条件当k>q时,有自相关系数r k=0或自相关系数r k服从N(0,1/n(1+2刀r2i)1/2)且(|r k|>2/n 1/2(1+2刀r:)"2)的个数w 4.5%,即平稳时间序列的自相关系数r k为q步截尾,偏相关系数© k逐步衰减而不截尾,则序列是MA(q)模型。
实际中,一般MA过程的PACF函数呈单边递减或阻尼振荡,所以用ACF函数判别(从q阶开始的所有自相关系数均为0) o(4) 可逆条件一阶:| 9 1|<1 。
二阶:| 9 2|<1 、9 1+9 2<1。
当满足可逆条件时,MA(q)模型可以转换为AR(p)模型3. 自回归移动平均ARMA(p,q)模型(1) 模型形式y t = © 孑甘+ © 2y t-2 + .... + © p y t-p + £t- 9 1 £t-1 - 9 2 £t-2 - - 9 p £t-p 式中符号:p 和q 是模型的自回归阶数和移动平均阶数;©和9是不为零的待定系数;£ t独立的误差项;y t是平稳、正态、零均值的时间序列。
(2) 模型含义使用两个多项式的比率近似一个较长的AR多项式,即其中p+q 个数比AR(p)模型中阶数p小。
前二种模型分别是该种模型的特例。
一个ARMAJ程可能是AR与MA过程、几个AR过程、AR与ARMA 过程的迭加,也可能是测度误差较大的AR过程。
(3) 识别条件平稳时间序列的偏相关系数© k和自相关系数r k均不截尾,但较快收敛到0,贝U该时间序列可能是ARMA(p,q)模型。
实际问题中,多数要用此模型。
因此建模解模的主要工作是求解p、q 和©、9的值,检验£ t 和y t的值。
(4) 模型阶数AIC准则:最小信息准则,同时给出ARMA模型阶数和参数的最佳估计,适用于样本数据较少的问题。
目的是判断预测目标的发展过程与哪一随机过程最为接近。
因为只有当样本量足够大时,样本的自相关函数才非常接近母体的自相关函数。
具体运用时,在规定范围内使模型阶数从低到高,分别计算AIC值,最后确定使其值最小的阶数是模型的合适阶数。
模型参数最大似然估计时AIC=(n-d)log c 2+2(p+q+2) 模型参数最小二乘估计时AIC=nlog c 2+(p+q+1)logn 式中:n为样本数,c 2为拟合残差平方和,d、p、q为参数。
其中:p、q范围上线是n较小时取n的比例,n较大时取logn的倍数。
实际应用中p、q 一般不超过2。
4. 自回归综合移动平均ARIMA(p,d,q)模型(1) 模型识别平稳时间序列的偏相关系数© k和自相关系数r k均不截尾,且缓慢衰减收敛,则该时间序列可能是ARIMA(p,d,q)模型。
(2) 模型含义模型形式类似ARM(p,q )模型,但数据必须经过特殊处理。
特别当线性时间序列非平稳时,不能直接利用ARMAp,q )模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中 d 一般不超过2。
若时间序列存在周期性波动,则可按时间周期进行差分,目的是将随机误差有长久影响的时间序列变成仅有暂时影响的时间序列。
即差分处理后新序列符合ARMA(p,q)模型,原序列符合ARIMA(p,d,q) 模型。
333建模解模过程1. 数据检验检验时间序列样本的平稳性、正态性、周期性、零均值,进行必要的数据处理变换。
(1)作直方图:检验正态性、零均值。
按图形Graphs—直方图Histogram的顺序打开如图3.15所示的对话框。
图3.15将样本数据送入变量Variable 框,选中显示正态曲线Display normal curve图 3.18 项,点击OK 运行,输出带正态曲线的直方图,如图 3.16所示图 3.16从图中看出:标准差不为1、均值近似为0,可能需要进行数据变换。
(2)作相关图:检验平稳性、周期性。
按图形Graphs —时间序列Time Series —自相关Autocorrelations 的顺序打开如图3.17所示的对话框。
图 3.17将样本数据送入变量 Variable 框,选中自相关 Autocorrelations 和偏自相 关PartialAutocorrelations 项,暂不选数据转换 Transform 项,点击设置项Options ,出现如图3.18所示对话框。