第四章非平稳时间序列的确定性分析实验报告
- 格式:doc
- 大小:262.50 KB
- 文档页数:9
第四章:非平稳序列的确定性分析题目一:()()()()()()()12312123121231ˆ14111ˆˆ2144451.1616T T T T T T T T T T T T T T T T T T T T T xx x x x xx x x x x x x x x x x x x x x -------------=+++⎡⎤=+++=++++++⎢⎥⎣⎦=+++ 题目二:因为采用指数平滑法,所以1,t t x x +满足式子()11t t t x x x αα-=+-,下面式子()()11111t t t t t tx x x x x x αααα-++=+-⎧⎪⎨=+-⎪⎩ 成立,由上式可以推导出()()11111t t t t x x x x αααα++-=+-+-⎡⎤⎣⎦,代入数据得:2=5α. 题目三:()()()21221922212020192001ˆ1210101113=11.251ˆ 1010111311.2=11.04.5ˆˆˆ10.40.6.i i i xxxx x x x x αα-==++++=++++===+-=⋅∑(1)(2)根据程序计算可得:22ˆ11.79277.x= ()222019181716161ˆ2525xx x x x x =++++(3)可以推导出16,0.425a b ==,则425b a -=-. 题目四:因为,1,2,3,t x t t ==,根据指数平滑的关系式,我们可以得到以下公式:()()()()()()()()()()()()()()()221221 11121111 1111311. 2t t t t t tt x t t t x t t αααααααααααααααααααα----=+-------=-+---+--+++2+, ++2+用(1)式减去(2)式得:()()()()()221=11111.t t tt x t αααααααααααα-------------所以我们可以得到下面的等式:()()()()()()122111=11111=.t t t tt x t t αααααααα+-----------------()111lim lim 1.ttt ttxt tααα+→∞→∞----==题目五:1. 运行程序:最下方。
实验四 非平稳序列的确定性分析一、实验目的:熟悉REG 过程和AUTOREG 过程,并进行时间序列线性趋势拟合。
熟悉NLIN 过程,并使用其进行时间序列非线性趋势拟合。
二、实验内容习题爱荷华州1984-1979年非农产品季度收入数据散点图(如下所示图1)图1由图分析确定拟合的非线性回归为tt x at b =+,则,相关命令如下:proc nlin data = example4_6 METHOD =gauss;model x=a*t+b**t;parameters a= b=;=t;=t*b**(t-1); output predicted =xhat out =result; run ;(1) 迭代过程(如图所示图2)图2(2)收敛状况(如图所示图3)图3(3)估计信息摘要(如图所示图4)图4(4)主要统计量(如图所示图5)图5(5) 参数信息摘要(如图所示图6)图6由此得到拟合模型为23.0107 1.0653t t x t ε=++(6) 近似相关矩阵(如图所示图7)图7为了看出拟合效果,将原序列值和拟合效果联合作图。
命令如下proc gplot data =result;plot x*t=1 xhat*t=2/overlay ;symbol1 c =black i =none v =star;symbol2 c =red i =join v =none; run ; quit ;(如图8所示)图8我们可以看出拟合效果不错 习题习题某地区1962-1970年平均每头奶牛的月度产奶量数据散点图(如下所示图9)图9由图分析确定拟合的非线性回归为t x at bt =+,则,相关命令如下:data example4_1; input x@@;t=_n_;cards;589 561 640 656 727 697 640 599 568 577 553 582 600 566 653 673 742 716 660 617 583 587 565 598 628 618 688 705 770 736 678 639 604 611 594 634 658 622 709 722 782 756 702 653 615 621 602 635 677 635 736 755 811 798 735 697 661 667 645 688 713 667 762 784 837 817 767 722 681 687 660 698 717 696 775 796 858 826 783 740 701 706 677 711 734 690 785 805 871 845 801 764 725 723 690 734 750 707 807 824 886 859 819 783 740 747 711 751 ;proc autoreg data=example4_1;model x=t;output out=result p=xcap;结果如下(图10)图10拟合图如下(图11)图11习题某城市1980年1月至1995年8月每月屠宰生猪数量散点图如下(图12)图12实验小结:这次实验我学会了SAS系统中REG(回归)过程与AUTOREG(自回归)过程都可以进行时间序列线性趋势拟合。
应用时间序列分析实验报告27708281449,1,2,3,,60t t X t l t =-++=⎧⎪SAS程序如下:data example1;input x@@;time=1949+_n_-1;cards;54167 55196 56300 57482 58796 60266 61465 6282864653 65994 67207 66207 65859 67295 69172 7049972538 74542 76368 78534 80671 82992 85229 8717789211 90859 92420 93717 94974 96259 97542 98705100072 101654 103008 104357 105851 107507 109300 111026 112704 114333 115823 117171 118517 119850 121121 122389 123626 124761 125786 126743 127627 128453 129227 129988 130756 131448 132129 132802;proc gplot data=example1;plot x*time=1;symbol1c=black v=star i=join;run;proc autoreg data=example1;model x=time;output out=out p=example1_cup;run;proc gplot data=out;plot x*time=1 example1_cup*time=2/overlaysymbol2 c=red v=none i-join w=21=3;run;7、(1)时序图如下:—11拟合序列图:剔除季节效应后的时序图有非常显著的线性递增趋势。
SAS程序如下:(1)symbol c=black i=join v=star; run;(2)data example2;input x@@;time=intnx ('month','01jan1962'd,_n_-1);format time date;cards;589 561 640 656 727 697 640 599 568 577 553 582600 566 653 673 742 716 660 617 583 587 565 598628 618 688 705 770 736 678 639 604 611 594 634658 622 709 722 782 756 702 653 615 621 602 635677 635 736 755 811 798 735 697 661 667 645 688713 667 762 784 837 817 767 722 681 687 660 698717 696 775 796 858 826 783 740 701 706 677 711734 690 785 805 871 845 801 764 725 723 690 734750 707 807 824 886 859 819 783 740 747 711 751;proc gplot data=example2;plot x*time=1;symbol1c=red I=join v=star;run;(3)data example2;input x@@;t=intnx ('monthly','1jan1962'd,_n_-1);cards;589 561 640 656 727 697 640 599 568 577 553 582600 566 653 673 742 716 660 617 583 587 565 598628 618 688 705 770 736 678 639 604 611 594 634658 622 709 722 782 756 702 653 615 621 602 635677 635 736 755 811 798 735 697 661 667 645 688713 667 762 784 837 817 767 722 681 687 660 698717 696 775 796 858 826 783 740 701 706 677 711734 690 785 805 871 845 801 764 725 723 690 734750 707 807 824 886 859 819 783 740 747 711 751;proc x11 data=example2;monthly date=t;var x;output out=out b1=x d10=season d11=adiusted d12=trend d13=irr;data out;set out;estimate=trend*season/100;proc gplot data=out;plot x*t=1 estimate*t=2/overlay;plot adjusted*t=1trend*t=1irr*t=1;symbol1c=black i=join v=star;symbol2c=red i=join v=none w=2l=3;run;(4)data example4_7;input x @@;t=intnx ('quarter','1jan1962'd,_n_-1);format t aa4.;cards;589 561 640 656 727 697 640 599 568 577 553 582600 566 653 673 742 716 660 617 583 587 565 598628 618 688 705 770 736 678 639 604 611 594 634658 622 709 722 782 756 702 653 615 621 602 635677 635 736 755 811 798 735 697 661 667 645 688713 667 762 784 837 817 767 722 681 687 660 698717 696 775 796 858 826 783 740 701 706 677 711734 690 785 805 871 845 801 764 725 723 690 734750 707 807 824 886 859 819 783 740 747 711 751;proc x11 data=example4_7;quarterly date=t;var x;output out=out b1=x d10=season d11=adjusted d12=trend d13=irr;data out;set out;estimate=trend*sesson/100;proc gplot data=out;plot season*t=2 adjusted*t=2 trend*t=2 irr*t=2;plot x*t=1 estimate*t=2/overlay;symbol1i=spline v=star h=1cv=blue ci=red;symbol2i=spline v=star h=1cv=red ci=green;run;8、时序图如下:从图中曲线可以看出,数据并没有周期性或者趋向性规律,并且每月的生猪的屠宰量大约在80000上下波动。
运用SAS对谷物产量进行分析—、摘要利用SAS软件(程序见附录)判断谷物产量数据为平稳序列且为非白噪声序列,然后先后通过模型的识别、参数的估计、模型的优化、残差白噪声检验,确定AR(1)模型拟合时间序列显著有效。
由于时间序列之间的相关关系,且历史数据对未来数据有一定的影响,对未来5期的谷物生产量进行预测。
二、理论准备首先判断序列的随机性和平稳性。
通过随机性检验,判断该序列是否为白噪声序列,如果是白噪声序列,就认为该随机事件没有包含任何值得提取的有用信息,我们就应该终止分析。
通过平稳性检验,序列可以分为平稳序列和非平稳序列。
如果序列平稳,通过相关计算进行模型拟合,并利用过去行为对将来行为进行预测,达到预测效果。
如果序列为非平稳,再确定模型为非平稳序列中四大类模型中的哪种种模型或者几种模型对序列的综合影响,通过把序列转化为平稳序列,再进一步分析。
三、数据选取本实验采用某地区连续74年的谷物产量(单位:千吨),如下所示:0.97 0.45 1.61 1.26 1.371.43 1.321.23 0.84 0.89 1.18 1.33 1.21 0.98 0.91 0.61 1.23 0.97 1.10 0.74 0.80 0.810.80 0.600.59 0.63 0.87 0.36 0.81 0.91 0.77 0.96 0.93 0.95 0.65 0.98 0.70 0.86 1.320.88 0.680.78 1.25 0.79 1.19 0.69 0.92 0.86 0.86 0.85 0.90 0.54 0.32 1.40 1.14 0.690.91 0.680.57 0.94 0.35 0.39 0.45 0.99 0.84 0.62 0.85 0.730.66 0.76 0.63 0.32 0.170.46四、数据进行平稳性与纯随机性的检验与判别(一)序列的纯随机性检验tutocorrelation Check for Uhite NoiseTo Chi-Fr)Lag Square OF ChiSq ........ ......... ........... A utocorrelations ....................629川 6 t.lltl 0.3630.26t 0.227 9.21! 0.20?图1序列延迟6阶LB检验结果序列纯随机性检验结果显示延迟6阶LB检验统计量的P值小于1%勺显著性水平0.0001,说明序列之间蕴含着很强的相关信息,即该序列是非随机性序列,为非白噪声。
时间序列分析课程实验报告一、上机练习P1241.拟合线性趋势12.79 14.02 12.92 18.27 21.22 18.81 25.73 26.27 26.75 28.73 31.71 33.95程序:data xiti1;input x;t=_n_;cards;12.79 14.02 12.92 18.27 21.22 18.81 25.73 26.27 26.75 28.73 31.71 33.95 ;proc gplot data=xiti1;plot xt;symbol c=red v=star i=join;run;proc autoreg data=xiti1;model x=t;output predicted=xhat out=out;run;proc gplot data=out;plot xt=1 xhatt=2/overlay;symbol2c=green v=star i=join;run;运行结果:分析:上图为该序列的时序图;可以看出其具有明显的线性递增趋势;故使用线性模型进行拟合:x t=a+bt+I t;t=1;2;3;…;12分析:上图为拟合模型的参数估计值;其中a=9.7086;b=1.9829;它们的检验P值均小于0.0001;即小于显著性水平0.05;拒绝原假设;故其参数均显著..从而所拟合模型为:x t=9.7086+1.9829t.分析:上图中绿色的线段为线性趋势拟合线;可以看出其与原数据基本吻合..2.拟合非线性趋势1.85 7.48 14.29 23.02 37.42 74.27 140.72265.81 528.23 1040.27 2064.25 4113.73 8212.21 16405.95 程序:data xiti2;input x;t=_n_;cards;1.85 7.48 14.29 23.02 37.42 74.27 140.72265.81 528.23 1040.27 2064.25 4113.73 8212.21 16405.95;proc gplot data=xiti2;plot xt;symbol c=red v=star i=none;run;proc nlin method=gauss;model x=abt;parameters a=0.1 b=1.1;der.a=bt;der.b=atbt-1;output predicted=xh out=out;run;proc gplot data=out;plot xt=1 xht=2/overlay;symbol2c=green v=none i=join;run;运行结果:分析:上图为该时间序列的时序图;可以很明显的看出其基本是呈指数函数趋势慢慢递增的;故我们可以选择指数型模型进行非线性拟合:x t=ab t+I t;t=1;2;3;…;12分析:由上图可得该拟合模型为:x t=1.03091.9958t+I t分析:图中的红色星号为原序列值;绿色的曲线为拟合后的拟合曲线;可以看出原序列值与拟合值基本上是重合的;故该拟合效果是很好的..3.X—11过程40777 41778 43160 4589741947 44061 44378 4723743315 43396 44843 4683542833 43548 44637 4710742552 43526 45039 4794043740 45007 46667 4932544878 46234 47055 5031846354 47260 48883 5260548527 50237 51592 5515250451 52294 54633 5880253990 55477 57850 61978程序:data xiti3;input x;t=intnx'quarter';'1jan1978'd;_n_-1;format t yyq4.;cards;40777 41778 43160 4589741947 44061 44378 4723743315 43396 44843 4683542833 43548 44637 4710742552 43526 45039 4794043740 45007 46667 4932544878 46234 47055 5031846354 47260 48883 5260548527 50237 51592 5515250451 52294 54633 5880253990 55477 57850 61978;proc gplot data=xiti3;plot xt;symbol c=red v=star i=join;run;proc x11 data=xiti3;quarterly date=t;var x;output out=out b1=x d10=season d11=adjusted d12=trend d13=irr; data out;set out;estimate=trendseason/100;proc gplot data=out;plot xt=1 estimatet=2/overlay;plot adjustedt=1 trendt=1 irrt=1;symbol1c=red i= join v=star;symbol2c=black i= none v=star;run;运行结果:分析:上图为该序列的时序图;可以很明显的看出其具有长期增长趋势;且具有季节波动;故我们用X-11过程进行拟合..分析:上图为季节调整后的序列值时序图..分析:上图为趋势拟合值序列时序图..分析:上图为不规则波动值的时序图..分析:上图中的红色线段为原序列值;黑色星星为拟合值;可以由图中看出该拟合值与原序列值基本上是重合的;故该拟合效果很好..4.Forecost过程程序:data xiti4;input x;t=1949+_n_-1;cards;40777 41778 43160 4589741947 44061 44378 4723743315 43396 44843 4683542833 43548 44637 4710742552 43526 45039 4794043740 45007 46667 4932544878 46234 47055 5031846354 47260 48883 5260548527 50237 51592 5515250451 52294 54633 5880253990 55477 57850 61978;proc gplot data=xiti4;plot xt;symbol c=red v=star i=join;run;proc forecast data=xiti4 method=stepar trend=2 lead=5 out=out outfull outest=est;id t;var x;run;proc gplot data=out;plot xt=_type_/href=2008;symbol1i=join v=star c=black;symbol2i=join v=none c=green;symbol3i=join v=none c=red;symbol4i=join v=none c=red;run;分析:由该序列的时序图可知;其具有长期趋势;且含有季节效应;趋势特征基本为线性趋势;即trend=2.分析:由上表可以很明显的看到每一年的与序列值、预测值;还有预测的后面六期预测值的95%置信区间..分析:此表为预测过程中相关参数及拟合效果;可以看到RSQUARE=0.9574111;拟合效果很好..分析:上图为预测效果图;其中绿色的线段表示预测值;红色的代表预测的5期值的95%置信区间;黑色的为原序列;可以看出其预测效果很好..二、课后习题7.某地区1962-1970年平均每头奶牛的月度产奶量数据单位:磅具体数据详见书P123 589 561 640 656 727 697 640 599 568 577 553 582600 566 653 673 742 716 660 617 583 587 565 598628 618 688 705 770 736 678 639 604 611 594 634658 622 709 722 782 756 702 653 615 521 602 635677 635 736 755 811 798 735 697 661 667 645 688713 667 762 784 837 817 767 722 681 687 660 698717 696 775 796 858 826 783 740 701 706 677 711734 690 785 805 871 845 801 764 725 723 690 734750 707 807 824 886 859 819 783 740 747 711 7511绘制该序列的时序图;直观考察该序列的特点..程序:data lianxi1;input x;t=intnx'month';'1jan1962'd;_n_-1;format t date.;cards;589 561 640 656 727 697 640 599 568 577 553 582600 566 653 673 742 716 660 617 583 587 565 598628 618 688 705 770 736 678 639 604 611 594 634658 622 709 722 782 756 702 653 615 521 602 635677 635 736 755 811 798 735 697 661 667 645 688713 667 762 784 837 817 767 722 681 687 660 698717 696 775 796 858 826 783 740 701 706 677 711734 690 785 805 871 845 801 764 725 723 690 734750 707 807 824 886 859 819 783 740 747 711 751;proc gplot data=lianxi1;plot xt;symbol c=red v=star i=join;run;分析:由上图的时序图可以很明显的看出该序列具有长期的增长趋势;且具有明显的季节效应..2使用因素分解方法;拟合该序列的发展;并预测下一年该地区奶牛的月度产奶量..程序:proc forecast data=lianxi1 method=stepar trend=2lead=12out=out outfull outest=est;id t;var x;run;data out;set out;t=intnx'month';'1jan1962'd;_n_-1;proc gplot data=out;plot xt=_type_;symbol1i=join v=star c=black;symbol2i=join v=none c=green;symbol3i=join v=none c=red;symbol4i=join v=none c=red;run;分析:上图绿色的为拟合趋势图;后面的12个月就为所预测的1年的奶牛产奶量;上下两条红色的线为95%执行区间;黑色的为原序列时序图;故可以看出该拟合趋势和原序列基本重合;故后面的预测结果也比较可信..3使用X-11方法;确定该序列的趋势..程序:proc x11 data=lianxi1;monthly date=t;var x;output out=out b1=x d10=season d11=adjusted d12=trend d13=irr;data out;set out;estimate=trendseason/100;proc gplot data=out;plot xt=1 estimatet=2/overlay;plot adjustedt=1 trendt=1 irrt=1;symbol1c=red i= join v=star;symbol2c=black i=join v=star;run;分析:上图中;红色的代表原序列;黑色的代表拟合的序列;可以看出除了在66年1月份左右有一点区别外;其余的基本上都与原序列重合;故该拟合效果很好..8.某城市1980年1月至1995年8月每月屠宰生猪数量单位:头数据详见书P123选择适当地模型拟合该序列的发展;并预测1995年9月至1997年9月该城市生猪屠宰数量.. data lianxi2;input x;t=intnx'month';'1jan1980'd;_n_-1;format t date.;cards;76378 71947 33873 96428 105084 95741 110647 100331 94133 10305590595 101457 76889 81291 91643 96228 102736 100264 103491 9702795240 91680 101259 109564 76892 85773 95210 93771 98202 97922100306 94089 102680 77919 93561 117032 81225 88357 106175 91922 104114 109959 97880 105386 96479 97580 109490 110191 90974 98981 107188 94177 115097 113696 114532 120110 93607 110925 103312 120184 103069 103351 111331 106161 111590 99447 101987 85333 86970 100561 89546 89265 82719 79498 74846 73819 77029 78446 86978 7587869571 75722 64182 77357 63292 59380 78332 72381 55971 6975085472 70133 79125 85805 81778 86852 69069 79556 88174 6669872258 73445 76131 86082 75443 73969 78139 78646 66269 7377680034 70694 81823 75640 75540 82229 75345 77034 78589 7976975982 78074 77588 84100 97966 89051 93503 84747 74531 9190081635 89797 81022 78265 77271 85043 95418 79568 103283 9577091297 101244 114525 101139 93866 95171 100183 103926 102643 108387 97077 90901 90336 88732 83759 99267 73292 78943 94399 9293790130 91055 106062 103560 104075 101783 93791 102313 82413 83534 109011 96499 102430 103002 91815 99067 110067 101599 97646 104930 88905 89936 106723 84307 114896 106749 87892 100506;proc gplot data=lianxi2;plot xt;symbol c=red v=star i=join;run;proc forecast data=lianxi2 method=stepar trend=1lead=24out=out outfull outest=est;id t;var x;run;data out;set out;t=intnx'month';'1jan1980'd;_n_-1;proc gplot data=out;plot xt=_type_;symbol1i=join v=star c=black;symbol2i=join v=none c=green;symbol3i=join v=none c=red;symbol4i=join v=none c=red;run;分析:上图为该时间序列的时序图;可以很明显的看出该序列无长期趋势;但在每一年当中由季节性变化..分析:上图为预测的2年趋势图;红色的为95%置信区间;其中由绿色线与黑色线的情况可知该拟合效果还是比较可信的;基本的趋势大致是一样..三、实验体会针对不同的问题;首先要根据原序列的时序图分析后得到大致的拟合方案;然后才进行拟合..只有自己动手做了之后;才会发现不同的方法拟合出来的效果是不一样的;有时也需要我们对不同的方法进行拟合;最后选择自己认为最好的方法..同时在做的过程中也会出现一些问题;这就需要我们找出问题在哪里;然后给与解决..总之;通过此次试验;我还是学到了很多..。
实验二:非平稳时间序列模型检验一、实验课题非平稳时间序列模型检验经济理论认为,消费支出主要由可支配收入决定,即消费与可支配收入之间存在长期均衡关系,现实经济生活中,消费与可支配收入之间是否真的存在长期均衡关系呢?若存在,其长期均衡关系和短期非均衡关系的具体形式如何?这里以1980-2014年为分析期,分析中国实际城镇居民人均消费支出和可支配收入之间的关系。
二、实验目的与要求1.理解单位根检验方法和协整检验步骤2.理解误差修正模型的应用价值3.理解如何运用单位根检验和协整检验分析非平稳时间序列变量的动态关系,期望架起一座从学习到应用的桥梁,更好地理解理论基础的重要性和实际应用价值,培养学生动手操作能力和独立思考能力三、实验主要仪器和设备电脑,笔,笔记本四、实验原理单位根检验原理协整检验原理误差修正模型五、实验方法与步骤方法:借助EVIEWS软件进行检验步骤:1.单位根检验:检验原序列是否为平稳时间序列,否则继续处理数据2.模型的OLS回归3.协整检验:如果变量均是同阶单整,建立回归模型,并检验残差序列的平稳性4.设立误差修正模型5.诊断检验并解释实证结果File→New→Workfile Create→Start date:1980 End date:2014→OkQuick→Empty Group→复制粘贴人均消费支出(y)和人均可支配收入(x)的数据同时选中x和y→Open→as GroupView→Graph Options→OK可以看出人均消费支出x和人均可支配收入y之间拥有相同的趋势检验lnx和lny两个变量都是同阶单整使用ADF单位根检验法进行检验检验顺序:情况Ⅲ→情况Ⅱ→情况ⅠCommand输入new series lny=log(y)new series lnx=log(x)创建lny和lnx点击lnx→View→Unit root Test→Level Trend and interceptd →Prob>0.05,检验情况Ⅱ选择Level Interceptd→Prob>0.05,检验情况Ⅰ选择Level None→Prob>0.05因为三种情况P值都>0.05,所以进行一阶差分,然后进行检验选择1st difference Trend and intercept→有一项的Prob>0.05,检验情况Ⅱ选择1st difference Intercept→所有prob都<0.05,符合情况Ⅱ同样的方法可以得到lny在一阶差分下符合情况Ⅱ,所以lnx和lny是同阶单整的选中lnx和lny→Open→as Equation Estimation→输入lny c lnx→Proc→Make Residual Series→命名为ecm接下来证明lny和lnx组成的时间序列是否平稳选中lnx和lny→Open→as Equation Estimation→输入lny c lnx Method选择COINTREG-CR→确定View→Cointegration Tests 选择Engle-Granger协整分析方法从分析结果可以看出lny和lnx构成的时间序列是平稳的,证明lny和lnx具有协整关系接下来进行误差修正设立误差修正模型同时选中lnx和lny→Open→as Equation Estimation→输入d(lny) c d(lnx) d(lnx(-1)) d(lny(-1)) ecm(-1)误差修正同时选中lnx和lny→Open→as Equation Estimation→输入d(lny) c d(lnx) ecm(-1)从图中可以看出emc(-1)的Coefficient值,这是ecm系统中的修正速度系数,反映了系统内变量对出现均衡偏差情况的调整速度,值为-0.860141,说明系统内的修正反应强烈。
38. 非平稳时间序列的确定性分析之杨若古兰创作实际中大多数时间序列是非平稳的,对非平稳时间序列的分析方法次要有两类:确定性分析和随机性分析.确定性分析——提取非平稳时间序列明显的规律性(持久趋势、季节性变更、周期性),目的是:①克服其它身分影响,单纯测度出单一确定身分对序列的影响;②推断各种确定性身分彼此之间彼此感化关系及它们对序列的综合影响.随机性分析——分析非平稳时间序列由随机身分导致的随机动摇性.(一)趋势分析有的时间序列具有明显的持久趋势,趋势分析就是要找出并利用这类趋势对序列发展做出合理猜测.1. 趋势拟合法即把时间作为自变量,响应的序列观察值作为因变量,建立序列值随时间变更的回归模型.分为线性拟合和非线性拟合.2. 平滑法利用修匀技术,消弱短期随机动摇对序列的影响,使序列平滑化,从而显示出持久趋势变更的规律.(1)挪动平均、加权挪动平均已知序列值x1, …, xt1, 猜测xt的值为称为n期挪动平均值,n的拔取带有必定的经验性,n过长或过短,各有益弊,也能够根据均方误差来拔取.普通最新数据更能反映序列变更的趋势.是以,要突出新数据的感化,可采取加权挪动平均法:其中,.(2)二次挪动平均对应线性趋势,挪动平均拟合值有滞后性,可以采取二次挪动平均加以改进:对挪动平均值再做一次挪动平均.(3)指数平滑法指数平滑法是一种对过去观察值加权平均的特殊方式,观测值时间越远,其权数呈指数降低.一次指数平滑法可用于对时间序列进行修匀,以清除随机动摇.猜测公式为:其中α∈(0, 1)为平滑常数,为第t期平滑猜测值,初始猜测值(通常取最初几个实测数据的均值).普通来说,时间序列有较大的随机动摇时,宜选择较大的α值,以便能较快跟上近期的变更;也能够利用猜测误差选择.(4)二次、三次指数平滑法即对一次指数平滑后的序列再做一次指数平滑,但不是直接将二次指数平滑值作为猜测值,而是利用其来求出方程参数,利用滞后偏差的规律来建立直线趋势模型.计算公式:,其中,m为猜测超前期数,取.(5)霍尔特双参数线性指数平滑法设α, β∈(0, 1)为参数,为趋势增量.用趋势增量来批改,清除了滞后性,对数据进行平滑:用指数平滑法估计趋势增量,对相邻两次平滑之差做批改,再加上前期趋势增量,对趋势进行平滑:计算超前m期的猜测值:初值的拔取:, .(二)时间序列的分解一、Gramer分解定理1963年,Gramer在Wald分解定理的基础上,得到了Gramer分解定理:任一时间序列{Xt}都可以分解为叠加的两部分:由多项式决定的确定性趋势成分,平稳的零均值误差成分,即其中,为均值白噪声序列,B为延迟算子,且即均值序列反映了{Xt}受到的确定性影响,而反映了{Xt}受到的随机影响.Gramer定理说明任何一个序列的动摇都可以视为同时受到了确定性影响和随机性影响的综合感化.平稳时间序列请求这两方面的影响都是波动的,而非平稳时间序列发生的机理就在于它所受到的这两方面的影响至多有一方面是不波动的.二、时间序列的结构方式非平稳时间序列(xt)的确定性身分分为4种:(1)趋势变更身分(Tt)——表示出某种倾向,上升或降低或水平;(2)季节变更身分(St)——周期固定的动摇变更;(3)轮回变更身分(Ct)——周期不固定的动摇变更;(4)不规则身分(εt)——随机动摇,由很多不成控的身分影响而惹起的变更.时间序列{Xt}的结构方式有三种:(1)加法模式:xt=Tt+St+Ct+εt(2)乘法模式:xt=TtStCtεt(3)混合模式:xt=TtStCt+εt上述模式中,趋势变更Tt是基础,其它变更与趋势变更结合,构成序列{ xt}. 在加法模式中,各变更身分均与xt 的单位不异;在乘法模式中,Tt与xt有不异的单位,其它身分的变更均数比例值;在混合模型中,Tt、εt与xt有不异的单位,St和Ct是比例值.各式中的随机身分εt,均假定为独立的、方差不变的、均值为0的白噪声序列.在这些假定下,对时间序列进行分解.三、时间序列的传统分解法步调1. 分解出持久趋势身分与轮回身分设序列的季节长度为4(一年分为4季).由假定E(εt)=0,故只需对序列xt作挪动长度为4的挪动平均,就可清除季节和随机动摇的影响(因为随机动摇有正动摇和负动摇,一做平均,正负动摇就彼此抵消,随机动摇影响就接近于零).记挪动平均值为:则挪动平均后的序列,即为序列的趋势身分和轮回身分.类似地,若序列按月份周期,则取12.2. 分解季节身分与随机身分考虑乘法模式xt=TtStCtεt,则两边同除以得只含季节身分与随机身分.是以,它含有确定季节身分所必须的信息.若它的比值大于100%,就意味着序列的实际值xt 比滑动平均值TtCt要大(该季度的季节性与随机性高于平均数,反之低于平均数),反之要小.3. 从Stεt平分解季节身分St即保存季节性,清除随机性,可以采纳了按季节平均的方法,将前面得到的序列Stεt逐年逐季排列起来,然后将各年的不异季节的Stεt相加起来,再进行平均.4. 从TtCt序列平分解出Ct序列TtCt包含了趋势身分与轮回身分,要把这两者分离出来,首先要确定一种能最好地描述数据的持久趋势变更的曲线类型.趋势变更曲线,可能有以下几品种型:(1)线性趋势:Tt=a+bt(2)指数曲线:Tt=αeβt(3)S型曲线:属于何种趋势曲线,要根据序列的数值进行判断,并应用最小二乘法,估计出有关参数.确定了趋势身分Tt后,可以用下式计算出轮回指数Ct:Ct也环绕100%动摇,若Ct低(高)于100%,则意味着第t年的经济活动水平低(高)于所丰年份的平均水平.四、温特线性和季节性指数平滑既含有线性趋势和季节性的数据进行处理和猜测,使用温特(Winter)线性和季节性指数平滑方法,模型方式为:xt=St(Tt+εt)判断数据是否有季节性,粗略判断可以直接观察时序图,更好的方法是解析法,即通过研讨数据序列的自相干性判断.温特方法由三个基础的平滑公式和一个猜测方程构成,每个平滑公式都含有一个平滑系数:整体平滑公式:趋势平滑公式:季节的平滑公式:猜测公式:其中,α, β, γ是三个分歧的平滑系数,Tt是清除季节身分后的趋势平滑值,xt是序列的实际值,ht是趋势添加或减少量序列,St是季节调整因子,τ是季节的长度(如一年中的月数12或季度数4),l是向前猜测期数,是向前l期的猜测值.整体平滑和趋势平滑公式是序列xt清除季节身分St 后,霍尔特双参数α和β线性指数平滑法.季节平滑公式是序列xt清除趋势身分Tt后,季节指数的加权平均修匀值.以当前观察的季节指数xt/ Tt和上期季节指数Stτ进行γ加权平均.对于乘法模型来说,季节指数环绕1动摇,可能大于1,也可能小于1.在拟合模型时可以通过求解最小的均方误差MSE得到三个平滑系数的具体值.猜测公式是利用拟合模型短期向前猜测l期的猜测值公式.(三)季节调整——PROC X11过程X11过程是根据美国国情调查局编制的时间序列季节调整过程X11改编的,可以对月度或季度时间序列进行季节调整.其基来源根基理就是时间序列的确定性身分分解方法.X11过程是基于如许的假定:任何时间序列都可以拆分成持久趋势动摇Tt、季节动摇St、不规则动摇εt的影响.又有经济学家发此刻经济时间序列中交易日Dt也是一个很次要的影响身分(日历天数的构成分歧而惹起的变动).是以,任一时间序列可以分解乘法模型xt=TtStDtεt或加法模型xt=Tt+St+Dt+εt.因为宏观调控部分次要关注的是序列的持久趋势动摇Tt的规律,所以X11过程次要目的是要从原序列中剔除季节影响、交易日影响和不规则动摇影响,得到尽可能精确的持久趋势规律.而采纳的方法就是前文的身分剔除法和平滑技术.X11过程不依附任何模型,普遍采取挪动平均法:用多次短期中间挪动平均法清除不规则动摇,用周期挪动平均清除趋势,用交易周期挪动平均清除交易日的影响.在全部过程中总共要用到11次挪动平均,所以得名为X11过程.基本语法:proc x11 data=数据集 </可选项> ;monthly 选项列表;quarterlly选项列表;arima 选项列表;macurves 选项;output out=数据集 </选项列表>;pdweights 变量tables表名列表;var变量列表;by 变量;id变量列表;说明:(1)monthly或quarterly语句是必不成少的,用来说明数据集是月度序列还是季度序列;(2)pdweights和macurves语句只能与monthly语句一路用,分别用来指定礼拜几的权重和月份的滑动平均长度;(3)tables语句控制各种表格的输出.output语句语句控制生成out=后指定的数据集;(4)proc x11语句的可选项:outtdr=数据集名——输出交易日回归的结果(B15表和C15表中的内容)到数据集;outstb=数据集名——输出波动季节性检验的结果(表D8中的内容)到数据集;outex——把在arima处理过程中猜测的观察加到out=输出数据集中;(5)arima语句及可选项X11方法用一系列中间化滑动平均来估计季节成分,但在起始和结尾处只能用非对称权重.非对称权重可导致季节因子估计禁绝,有了新数据当前就可能形成大的更改.加拿大统计局开发了一种X11ARIMA方法来处理该成绩.使用arima语句,就是对在var语句中指定的序列利用X11ARIMA方法.该方法从原始数据估计一个arima模型(使用用户指定的模型,或者通过五个事后定义的arima模型当选择一个最优的),然后用此模型把序列外推一年或几年.再根据这个耽误了序列进行季节调整,此时原序列的尾部就可用对称权重了.backcast=n——指定序列反向外推的年数,默认为0;chicr=值——指定BoxLjung拟合缺乏卡方检验时所用的明显水平值,默认为0.05.原假设为预定的模型(共5个)无拟合缺乏;forecast=n——指定预告的年数,默认为1;mape=值——指定平均绝对误差的临界值,取值在1到100之间,默认为15.mape值作为接受还是拒绝一个模型的临界值.模型的mape值小于临界值说明模型可用,反之模型被拒绝.mape值的计算公式如下:其中,n=36(最初三年的月数)或12(最初三年的季度数),xt为原始序列的最初三年的观察值.maxiter=n——指定估计过程最多答应的迭代次数,n取值为1到60之间,默认为15;method=cls | uls | ml——指定估计方法,分别为条件最小二乘法、无条件最小二乘法、最大似然估计;model=(P=n1 Q=n2 SP=n3 SQ=n4 DIF=n5 SDIF=n6)——指定arima模型.P和SP暗示普通的和季节的自回归过程(AR)阶数;Q和SQ暗示普通的和季节的挪动平均过程(MA)阶数,DIF和SDIF暗示普通的和季节的差分阶数;季节s=12(对应monthly)或4(对应quarterly).例如,指定一个(0,1,1)(0,1,1)s模型,暗示(P,DIF,Q)(SP,SDIF,SQ)s模型.假设考虑月度序列s=12,且E(xt)=μ,则具体模型方式为:ovdifcr=值——指定对5个事后定义模型进行过度差分检验时所用的临界值.取值范围在0.8到0.99之间,默认为0.9.五个模型都有一个季节MA因子,最多两个非季节因子(模型2、4、5).有季节差分和非季节差分.以模型2例,那么具体模型方式为:若θ3=1,则等式两边可以消去(1B12)项,得到低阶模型.类似地,如果θ1+θ2=1,则又可以消去(1B)项,得到低阶模型.因为参数估计肯定有误差,请求小于1是分歧理的.是以,过度差分检验的请求为:大于0.9应拒绝此模型.transform=(log) | (a**b)——答应在对模型进行估计之前进步前辈行用户指定的一些变换,发生预告值后再变换回本来的取值.(log)是天然对数变换,(a**b)是乘方变换:xt=(xt+a)b.(6)macurves语句该语句只适用于月度数据,为任一月份指定估计季节因子:月份=选项值.例如:macurves jan=’3’ feb=’3x5’ mar=stable;’3’——3期挪动平均;’3X3’、’3X5’、’3X9’——3×3、3×5(挪动平均,5期挪动平均再做3次挪动平均)3×9挪动平均;’stable’——所有值的平均值作为恒定的季节因子;(7)monthly语句月度时间序列数据集必须使用monthly语句.次要选项为:additive——指定进行加法模型季节调整.默认为乘法模型;charts=standard | full | none——指定生成的图表类型.默认为standard,生成12月度季节性图表和趋势起伏图表;full选项,还额外输出不规则项和季节因子的图表;none选项,不输出任何图表;data=日期变量名start=mmmyyend=mmmyy——指定要处理的部分时间序列数据的起止时间,例如:monthly date=date start=jan90 end=dec99;exclude=值——在交易日回归时把偏离均值超出指定值倍数的尺度差的不规则值排除在外.取值在0.1到9.9之间,默认为2.5;pmfactor=月份身分变量——用于调整曾经晓得特殊缘由的月份数据,例如,某公司1月份罢工,发卖额sales 比平常降低了约50%,这是一个缘由已知的一次性事件,应当事后批改该月份的发卖额,才干排除罢工的影响.在原时间序列数据集中设置一个反映月份身分的新变量x,其他月份的新变量x值都设定为100,即sales=sales/x×100=sales (发卖额不必调整);1月份的新变量值x设定为50,即sales=sales/x×100=2×sales,发卖额还原成经验值,示例:monthly date=date pmfactor=x;fullweight=值——设定观察值距离均值小于指定值倍数的尺度差,将赋予观察值的权数为最大值1.缺省值为1.5.zeroweight=值——设定观察值距离均值大于指定选项值倍数的尺度差,将赋予观察值的权数为最小值0.缺省值为2.5.选项zeroweight=的值必须大于选项fullweight=的值.观察值距离均值落入fullweight=值和zeroweight=值之间,将被赋予0到1之间的一个线性分级的权重值.printout=standard | long | full | none——指定打印哪些表格.(8)quarterly语句季度时间序列数据集必须使用quarterly语句,其次要选项和用法与monthly类似.季度时间值的格式为:1999年第一季度为’99Q1’.(9)pdweights语句用来指定礼拜一到礼拜七的权重值,只能用于月度数据.选项格式为:礼拜几=权重值.这些权重值是用来计算先验交易日因子,而先验交易日因子是在季节调整过程之前对原始序列进行批改的.只需给出绝对权重,X11过程会主动调整到相加之和为7.例如:pdweights sun=0.1 mon=0.9 tue=1 wed=1 thu=1 fri=0.7 sat=0.3;(10)tables语句tables语句用来指定打印一些额表面格.例如,如果省略选项printout=,上面语句只打印终极季节因子和终极季节调整过的序列.tables d10 d11;(11)output语句用来生成包含指定表格的输出数据集,输出数据集名由选项out=给出.对每一张要进入输出数据集的表格,由选项:表格名=新变量名列表,来指定.上面是一个var语句和output语句的示例:var z1 z2 z3;output out=out_x11 b1=x1 d11=t1 t2 t3;首先var语句指定输入数据集中三个数值型变量z1、z2和z3分别进行季节调整过程分析.选项b1=x1指定对变量z1进行分析,结果b1表格存入到新变量x1中;选项d11=t1 t2 t3指定对三个数值变量z1、z2、z3进行分析,三个结果b11表格分别存入到新变量t1、t2、t3中.例1对1993-中国社会花费品96个月份零售总额的时间序列数据:使用X11过程进行季节调整,假设先不考虑日历效应和不须要对数据进行任何事后的调整.因为没有交易日的影响,我们考虑使用乘法模型xt=TtStεt.代码:data sales;input sales @@;date = intnx( 'month', '01jan1993'd, _n_1 );format date monyy5.;datalines;2774.7 2805 2627 2572 2637 2645 2597 2636 28543029 3108 3680;run;procx11 data=sales;monthly date=date;var sales;arima maxit=60;tables d11;output out=out b1=series d10=season d11=adjustedd12=trend d13=irr;procprintdata=out;run ;title'Monthly Retail Sales Data';procsgplotdata=out;seriesx=date y=series / markersmarkerattrs=(color=red symbol='asterisk')lineattrs=(color=red)legendlabel="original" ;seriesx=date y=adjusted / markersmarkerattrs=(color=blue symbol='circle')lineattrs=(color=blue)legendlabel="adjusted" ;yaxislabel='Original and Seasonally Adjusted Time Series';run;title'Monthly Seasonal Factors (in percent)';procsgplotdata=out;seriesx=date y=season /markersmarkerattrs=(symbol=CircleFilled) ;run;title'Monthly Retail Sales Data (in $1000)';procsgplotdata=out;seriesx=date y=trend /markersmarkerattrs=(symbol=CircleFilled) ;run;title'Monthly Irregular Factors (in percent)';procsgplotdata=out;seriesx=date y=irr /markersmarkerattrs=(symbol=CircleFilled) ;run;运转结果及说明:日期变量date从intnx()函数获得从1993年1月1日开始每过一个月的时间.intnx()函数有3个参数:参数1是指定等时间间隔’month’,还可以取’day’、’week’、’quarter’、’year’等;参数2指定参照时间’01jan1993’;参数3是指定开始的时间指针_n_k,k为整数.k取正值(负值),开始时间为参照时间向将来(过去)拨k期.调用季节调整X11过程之前,应当先绘制原始时间序列的散点图(略,见后面原始序列与调整序列对比图),直观判断一下是否存在确定性季节动摇,以便确定能否调用X11过程.如果的确存在季节性动摇,还须要判断一下季节性的时间周期为月份还是季节.本例是月度数据,必必要用monthly date=date语句.X11 过程季节调整 sales概述表arima语句的感化是把时间序列耽误,使得序列尾部可以使用对称挪动平均方法,用以解决减少对序列尾部的更正.对时间序列耽误的模型,从五个事后定义的模型中择优采取(也能够用model=来本人定义).参数maxit=60指定估计过程最多答应迭代60次,特别是对于高阶arima模型,缺省值最多答应迭代15次可能不敷.调用arima语句时主动从五个事后定义的模型当选择的最优模型,输出结果标明选择了模型5:(2,1,2)(0,1,1)s,并给出了模型参数的估计值.可得arima模型的具体表达式为:用它耽误1年(12个月)的时间序列值.对此模型残差进行拟合缺乏的BoxLjung 卡方检验,卡方值为17.51 ,自在度为19 ,响应概率为0.56>0.05,不克不及拒绝模型残差拟合充分的原假设.对此模型过度差分检验,二阶MA参数值之和为0.06(0.0570263)小于0.9尺度,是以,该模型不存在过度差分成绩.对该模型用最初三年的原始序列来检验平均绝对误差MAPE原则,计算结果为1.49 %小于临界值15.00 %,是以该模型的误差是在可以接受的范围内.最初要特别留意,此模型很多参数值的t检验并没有通过,t值太小,其实不克不及拒绝这些参数值为0的原假设,例如MU、MA1,1和MA2,1参数值t检验所计算的t值.另外从直观上也能够看出这些参数值都很小(接近0).但该模型曾经是五个事后定义模型中最优的.tables d11语句指定打印d11表格,它输出终极的季节调节后的序列.output语句把部分结果输出到out数据集,表b1中的原序列值输出到series,表d10中的终极季节因子输出到season,表d11中的终极季节调节后的序列值输出到adjusted,表d12中的终极趋势起伏值输出到trend,表d13中的终极不规则序列值输出到irr.终极季节调整后每月的发卖额、每月发卖额的总和、每月发卖额的平均值和尺度差.输出数据集out.原序列与清除季节效应后的调整序列对比图使用多次挪动平均和迭代方法求出的终极季节因子,终极季节因子好象在缓慢地减小,而在原始序列中却没有这么明显.零售额剔除季节效应以后,使用挪动平均方法拟合的序列趋势,有非常明显的线性递增趋势.清除了季节和趋势身分后,残差序列很不规则,说明季节和趋势信息提取很充分,是以,用X11过程来拟合中国社会花费品零售总额序列的掌控还是比较精确的.。
第三章平稳时间序列分析选择合适的模型拟合1950-2008年我国邮路及农村投递线路每年新增里程数序列,见表1:表1 1950-2008年我国邮路及农村投递线路每年新增里程数序列单位:万公里一、时间序列预处理(一)时间序列平稳性检验1.时序图检验(1)工作文件的创建。
打开EViews6.0软件,在主菜单中选择File/New/Workfile, 在弹出的对话框中,在Workfile structure type中选择Dated-regular frequency(时间序列数据),在Date specification下的Frequency中选择Annual(年度数),在Start date中输入“1950”(表示起始年份为1950年),在End date中输入“2008”(表示样本数据的结束年份为2008年),然后单击“OK”,完成工作文件的创建。
(2)样本数据的录入。
选择菜单中的Quick/Empty group(Edit Series)命令,在弹出的Group对话框中,直接将数据录入,并分别命名为year(表示年份),X(表示新增里程数)。
(3)时序图。
选择菜单中的Quick/graph…,在弹出的Series List中输入“year x”,然后单击“确定”,在Graph Options中的Specifi中选择“XYLine”,然后按“确定”,出现时序图,如图1所示:图1 我国邮路及农村投递线路每年新增里程数序列时序图从图1中可以看出,该序列始终在一个常数值附近随机波动,而且波动的范围有界,因而可以初步认定序列是平稳的。
为了进一步确认序列的平稳性,还需要分析其自相关图。
2.自相关图检验选择菜单中的Quick/Series Statistics/Correlogram...,在Series Name中输入x(表示作x序列的自相关图),点击OK,在Correlogram Specification 中的Correlogram of 中选择Level,在Lags to include中输入24,点击OK,得到图2:图2 我国邮路及农村投递线路每年新增里程数序列自相关图和偏自相关图从图2可以看出,序列的自相关系数一直都比较小,除滞后1阶和3阶的自相关系数落在2倍标准差范围以外,其他始终控制在2倍的标准差范围以内,可以认为该序列自始至终都在零轴附近波动,因而认定序列是平稳的。
《结合小波分析的非平稳时间序列预测方法研究》篇一一、引言在众多领域中,时间序列数据的分析与预测扮演着至关重要的角色。
传统的平稳时间序列分析方法在面对非平稳时间序列时往往显得捉襟见肘。
非平稳时间序列具有复杂的动态变化特性,因此需要更加先进的预测方法来捕捉其内在的规律。
近年来,小波分析作为一种有效的信号处理工具,在非平稳时间序列预测中得到了广泛的应用。
本文旨在研究结合小波分析的非平稳时间序列预测方法,以提高预测的准确性和可靠性。
二、非平稳时间序列的特点与挑战非平稳时间序列是指时间序列的统计特性随时间发生变化。
这种变化可能是由于外部因素的干扰、内部机制的变化或者数据的采集方式等多种原因导致的。
由于其复杂性和动态性,非平稳时间序列的预测难度远大于平稳时间序列。
传统的预测方法往往无法有效捕捉非平稳时间序列的内在规律,导致预测结果的不准确和不可靠。
三、小波分析原理及其在非平稳时间序列中的应用小波分析是一种基于小波函数的信号处理方法。
它通过将信号分解为不同频率和时间的子信号,从而实现对信号的细致分析和处理。
在非平稳时间序列中,小波分析可以有效地捕捉到时间序列在不同时间段的局部特征,从而为预测提供更加准确的信息。
在非平稳时间序列预测中,小波分析的应用主要包括以下几个方面:1. 数据预处理:通过小波变换对原始数据进行去噪和压缩,提高数据的信噪比,为后续的预测模型提供高质量的数据输入。
2. 特征提取:小波变换可以将非平稳时间序列分解为不同频率和时间段的子信号,从而提取出数据中的关键特征信息,为预测模型提供更加准确的输入特征。
3. 模型构建:结合小波变换的结果,可以构建更加精确的非平稳时间序列预测模型。
通过选择合适的小波基函数和分解层数,可以实现对时间序列的细致分析和处理,从而提高预测的准确性。
四、结合小波分析的非平稳时间序列预测方法研究本研究结合小波分析的方法,对非平稳时间序列进行预测。
具体步骤如下:1. 数据预处理:使用小波变换对原始数据进行去噪和压缩,提取出关键特征信息。
一、实验目的本次实验旨在通过时间序列分析方法,对一组实际数据进行建模、分析和预测。
通过学习时间序列分析的基本理论和方法,提高对实际问题的分析和解决能力。
二、实验内容1. 数据来源及预处理本次实验所使用的数据集为某地区近十年的年度GDP数据。
数据来源于国家统计局,共包含10年的数据。
2. 数据可视化首先,我们将使用Excel软件绘制年度GDP的时序图,观察数据的基本趋势和周期性特征。
3. 平稳性检验根据时序图,我们可以初步判断数据可能存在非平稳性。
为了进一步验证,我们将使用ADF(Augmented Dickey-Fuller)检验对数据进行平稳性检验。
4. 模型选择由于数据存在非平稳性,我们需要对数据进行差分处理,使其变为平稳序列。
然后,根据自相关函数(ACF)和偏自相关函数(PACF)图,选择合适的模型。
5. 模型参数估计使用最大似然估计法(MLE)对所选模型进行参数估计。
6. 模型拟合与检验将估计出的模型参数代入模型,对数据进行拟合,并计算残差序列。
接着,使用Ljung-Box检验对残差序列进行白噪声检验,以验证模型的有效性。
7. 预测利用拟合后的模型,对未来几年的GDP进行预测。
三、实验过程及结果1. 数据可视化通过Excel绘制年度GDP时序图,发现数据呈现明显的上升趋势,但同时也存在一定的波动性。
2. 平稳性检验对数据进行一阶差分后,使用ADF检验进行平稳性检验。
结果显示,差分后的序列在5%的显著性水平下拒绝原假设,说明序列是平稳的。
3. 模型选择根据ACF和PACF图,选择ARIMA(1,1,1)模型。
4. 模型参数估计使用MLE法对ARIMA(1,1,1)模型进行参数估计,得到参数值:- AR系数:-0.864- MA系数:-0.652- 常数项:392.4765. 模型拟合与检验将估计出的模型参数代入模型,对数据进行拟合,并计算残差序列。
使用Ljung-Box检验对残差序列进行白噪声检验,结果显示在5%的显著性水平下拒绝原假设,说明模型拟合效果较好。
第四章非平稳时间序列建模实验报告
下表为1993-2000年中国社会消费品零售总额的数据。
表4-1 1993-2000年全国社会消费品零售总
额单位(亿元)
资料来源:国家统计局网站
根据以上数据,下面用Eviewis6.0对1980-2012年我国社会消费零售品总额的月度数据进行确定性分析,并对2001年月度数据进行预测。
1. 绘制时序图
图4-1 1993-2000年中国社会消费品零售总额时序图
从时序图可以看出序列中既有长期趋势又有季节波动,故以下对其进行季节
调整。
2.季节调整
在数据窗口中选择“Proc/Seasonal Adjustment/Moving Average Methods”,出现季节调整对话框,选择Ratio to moving Average选项,季节因子命名为
sa,如图4-3所示。
图4-2 季节调整操作
图4-3 季节调整方法选择对话
框
12个月的季节调整因子如下图所示:
图4-4 12个月的季节调整因子
经季节调整后的序列SSA时序图如下:
图4-5 经季节调整后的序列SSA
3.趋势拟合
在命令栏中输入:LS SSA C @TREND,对经季节调整后序列进行趋势拟合。
结果如下图所示:
图4-6 经季节调整后序列进行趋势拟合
4.长期趋势预测
将样本期改为1993.1至2001.12,在命令栏中输入LS SSA C @TREND,在结果窗口中点Forecast,得到以下扩展时间区间后的长期趋势值SSAF预测值。
图4-7 扩展时间区间后预测长期趋势值SSAF
将趋势拟合序列SSAF与序列SSA进行比较,如下:
图4-8 趋势拟合序列SSAF与序列SSA的时序图
5.对长期趋势预测进行季节调整
在主窗口选择“Quick/Generate Series”,设定sf=ssaf*sa。
图4-9 经季节调整预测2001年12个月的零售总额值经季节调整后2001年12个月的零售总额预测值如下图所示:
图4-10 2001年12个月零售总额预测值
经季节调整后的1993年至2001年个月度零售总额预测值如下图所示:
图4-11 预测序列趋势图
经原序列S与预测序列SF进行比较,可见经过长期趋势和季节调整处理后序列的预测值与原序列拟合效果非常好。
如下图所示:
图4-12 预测序列与原序列的时序图
最终确定1993-2000年中国社会消费品零售总额序列拟合模型为:
其中,Xt ,为原序列,St为季节指数如表4-2所示,Tt为长期趋势,It为包含没有能够提取完的相关信息的残差。
表4-2 季节指数
月份季节指数月份季节指数
1 1.047729 7 0.932064
2 0.997587 8 0.929475
3 0.962778 9 0.985026
4 0.943209 10 1.011190
5 0.947349 11 1.051079
6 0.962394 12 1.274102
用原序列值除以季节指数,再减去长期趋势拟合值之后的残差可以视作随机波动的影响。
本例残差图如下:
图4-13 残差图
残差图显示残差序列仍然存在一定的相关性。
这说明我们拟合的这个模型还没有把原序列中蕴含的相关信息充分提取出来,这是确定性分析方法常见的缺点。