基于ARMA模型和灰色预测模型的邮政业务总量预测
- 格式:doc
- 大小:118.50 KB
- 文档页数:9
基于残差融合的ARMA-GM(1,1)模型茶叶产量预测吕海侠;赵景惠;傅霞【摘要】因茶叶产量数据波动大,样本数据统计量相对较少,统计特征并非十分明显的特点,传统的基于统计原理的ARMA模型建模预测效果较差.利用灰色系统建模原理对ARMA模型的残差序列建立GM(1,1)模型,形成残差融合的ARMA-GM(1,1)模型.该模型既能保证数据的统计特征又能将残差的振荡序列充分反映,提高模型的预测精度,拓展ARMA模型的使用范围.结果表明,基于残差融合的ARMA-GM(1,1)模型比ARMA模型、灰色GM(1,1)模型具有更高的预测精度.【期刊名称】《甘肃科学学报》【年(卷),期】2018(030)005【总页数】5页(P24-28)【关键词】茶叶;灰色预测;振荡序列;融合【作者】吕海侠;赵景惠;傅霞【作者单位】陕西工业职业技术学院基础部,陕西咸阳 712000;北京交通大学经济管理学院,北京 100044;陕西工业职业技术学院基础部,陕西咸阳 712000【正文语种】中文【中图分类】O213茶叶源于中国,在古代,茶叶是被作为祭品使用的。
但从春秋后期开始被人们作为菜食,在西汉中期被发展为药用,西汉后期扩展为朝宫高级饮料,民间作为大量普通饮料是在西晋以后。
迄今发现最早人工种植茶叶的遗迹在浙江余姚的田螺山遗址,已有将近6 000余年的种植历史。
饮茶始于中国。
叶革质,长圆形或椭圆形,可以用开水直接泡饮,依据品种和制作方式以及产品外形分成6大类。
依据季节采制可分为春茶、夏茶、秋茶、冬茶。
以各种毛茶或精制茶叶再加工形成再加茶,包括分为花茶、紧压茶、萃取茶、药用保健茶、茶食品、含茶饮料等。
研究证明,茶叶中富含有儿茶素、胆甾烯酮、咖啡碱、肌醇、叶酸、泛酸等成分,可以增进人体健康。
茶叶饮品-茶被誉为“世界三大饮料之一”。
随着我国进一步扩大改革开放,茶叶已经从中国走向了全世界,已成为世界饮料市场三分天下有其一的重要品种[1]。
基于灰色ARIMA模型的河南省物流需求预测研究马巧云;邹相林;郭柯楠【摘要】以货物周转量作为衡量物流需求的指标,构建灰色ARIMA组合预测模型,对1978—2017年河南省货物周转量数据进行分析,并对河南省2018—2020年的货物周转量进行了预测.结果表明,灰色ARIMA组合预测模型精度满足要求,河南省货物周转量呈现增长趋势,这表明河南省物流产业规模持续增长,河南省的经济发展趋势持续向好.【期刊名称】《河南科学》【年(卷),期】2019(037)007【总页数】10页(P1171-1180)【关键词】GM(1,1)模型;ARIMA模型;物流需求;预测【作者】马巧云;邹相林;郭柯楠【作者单位】河南农业大学信息与管理科学学院,郑州 450002;河南农业大学信息与管理科学学院,郑州 450002;河南农业大学信息与管理科学学院,郑州 450002【正文语种】中文【中图分类】F252.21目前,我国经济发展已进入“新常态”,电子商务等新兴行业对物流的需求越来越大,“一带一路”和“长江经济带”等国家战略的提出,增强了我国与周边国家的经济联动性,推动了各省市地区经济协同发展,完善了国内物流基础设施建设,促进了我国物流业的快速发展.河南省地处中原,是我国具有重要战略地位的综合交通枢纽,更是“一带一路”国家战略中的重要衔接点,具有得天独厚的物流发展条件.河南省经济也正处于快速发展阶段,必然会促使河南省物流需求量的增长.而物流产业快速发展也必然会促进经济的发展,因此物流需求与经济的发展密切相关.在我国新的经济形势下,提高物流发展水平对经济的发展意义重大[1].通过对河南省物流需求的预测,我们可以在一定程度上为河南省今后物流发展规划提供参考. 目前,可以用来预测物流需求量的方法有很多,如马尔可夫链[2]、神经网络法[3-5]、时间序列法[6]、多元回归分析法[7-9]、支持向量机模型[10-12]、模糊集理论[13]、灰色预测法[14-15]等.以往的研究多以原始数据直接建模,但却忽略了数据本身的随机性,这种随机性可能来自于政策的限制、数据采集方法的差异、统计区域的范围不同等.如果单纯运用一种模型进行预测,预测结果在很大程度上可能会存在较大误差,满足不了人们对预测精度的期望.因此,为减小预测结果的误差,现在的研究多偏向于运用多模型组合预测[16-19].组合预测是把不同的方法采用不同的方式结合在一起进行预测,并且使预测结果最优的方法,尤其是灰色理论模型与多元回归模型、ARIMA模型、BP神经网络模型等的组合预测模型得到了广泛认可.传统的灰色模型适用于小样本、少数据情况下的数据预测[20],但在大数据时代,随着数据的增多、波动性的增大及复杂度的提升,灰色预测模型精度越来越差;而ARIMA模型可以将非平稳的时间序列经过差分转化为平稳时间序列,然后再对时间序列进行预测分析[21].因此,本文在运用灰色GM(1,1)模型的基础上,特别引入了ARIMA模型,建立了灰色ARIMA组合预测模型对河南省物流需求进行预测分析.本文以河南省地区生产总值(GDP)近似表示河南省经济发展水平,通过计算对比GDP与货运量和货物周转量之间的关联度大小,分析两者与经济发展的密切程度,由结果得出货物周转量与GDP之间联系更密切.因此本着可操作性原则,本文选择以河南省货物周转量作为衡量河南省物流需求的指标,对河南省物流需求进行预测分析[22].构建灰色ARIMA 组合预测模型对1978—2017年河南省货物周转量数据进行分析,并对河南省2018—2020年的货物周转量进行了预测.结果表明,灰色ARIMA组合预测模型精度满足要求,预测结果符合实际物流产业发展的增长趋势,也从侧面反映了我省经济持续向好的发展趋势.1 灰色ARIMA模型的原理1.1 灰色GM(1,1)预测模型灰色系统理论是由邓聚龙教授于1982年提出的一种用来解决信息不完备系统的新数学方法.该理论的研究对象是现实世界中普遍存在的、“部分信息已知,部分信息未知”的“小样本”、“贫信息”不确定性系统,通过对已知的“部分信息”的生成开发,提取其中有价值的信息,来准确把握系统运行行为及其演化规律[20].GM(1,1)模型作为灰色预测理论的核心模型,被广泛应用于工业、农业、水文、能源和经济等领域,成功解决了大量的实际问题.GM(1,1)模型的基本原理是先对原始数据序列进行预处理,通过数据的预处理弱化数据的随机性,生成一个新的数据序列,并且新数据序列更能反映原数据的规律性;再按照新的数据序列的变化趋势建立预测模型,得到拟合数据,然后对预测出的拟合数据进行还原,得到模型最终预测结果.1.2 ARIMA模型原理差分自回归移动平均模型(Auto Regressive Integrated Moving Average Model-ARIMA)又称博克斯-詹金斯模型,它是一种时间序列分析模型,其原理是将非平稳的原始序列经过d 阶差分转化为平稳序列,同时综合考虑预测变量的过去值、当前值和误差值,对d 阶差分后的序列建立ARIMA模型进行回归分析,从而有效地提高模型的预测精度[23].则d 阶差分变换后的ARIMA的一般模型可以表示为:式中:ωt 为时间序列在t 时刻的观测值;为自回归阶数为移动平均项数.1.3 灰色ARIMA组合模型灰色ARIMA 组合模型主要由灰色GM(1,1)模型和ARIMA 模型组合而成.在构建灰色ARIMA 组和预测模型前,需要先进行关联度分析,计算对比GDP 与货运量和货物周转量之间的关联度大小,分析两者与GDP之间联系的密切程度,选定预测变量指标.然后建立GM(1,1)模型对关联分析后选定的指标数据进行预测,并计算灰色预测误差,然后构建预测值误差序列的ARIMA预测模型,最后对两种模型的预测值进行求和,得出指标的预测值[24].具体步骤如下.1)进行灰色关联度分析.分别计算GDP与货运量和GDP与货物周转量的关联度大小,选择与GDP关联度大的指标作为衡量物流需求的指标.2)设原始指标数据序列为,建立灰色GM(1,1)预测模型对原始数据序列进行拟合,得拟合序列Xˆ(0),并用残差检验法对灰色预测结果进行检验.3)对拟合序列Xˆ(0)求误差序列E1(0):得到序列E2(0).5)计算误差序列的平稳性,并对误差序列做ADF 检验,确定差分阶数d.6)建立ARIMA模型,并得出自相关和偏相关函数图,根据自相关分析法作平稳序列模型类型和模型阶数的初步识别,参照表1,然后再经AIC准则判定,找到模型一步误差最小值对应的p、q,选定最优模型,并用该模型得到误差预测序列Eˆ2(1).表1 相关性特征Tab.1 Relevance characteristics模型自相关函数偏相关函数模型自相关函数偏相关函数模型自相关函数偏相关函数AR(p)拖尾p阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾7)对进行差分还原得到序列,再把序列还原成原始数列的预测序列,其中还原公式为:8)模型适应性检验.对ARIMA模型残差序列进行白噪声检验,若未通过,则重新回到步骤(5)直至得到最优模型.据,即9)将灰色模型预测的结果Xˆ(0)与修正过后的ARIMA模型预测的结果相加,得出最后组合模型的数2 河南省物流需求预测的灰色ARIMA组合模型本文选择GDP、货运量和货物周转量对河南省物流需求进行预测分析.相关指标数据主要来源于历年《河南省统计年鉴》,整理如表2所示.表2 河南省物流需求预测相关指标原始数据Tab.2 Raw data of logistics demand forecast with related indicators in Henan Province年份地G区D 生P/产亿总元值货运量/万t货(物亿周t·转km量)/年份地G区D生P/产亿总元值货运量/万t货(物亿周t·转km量)/1978162.9218 176508.41 19984 308.2458 1501 452.74 1979190.0917 533529.0019994 517.9459 2181 432.08 1980229.1617 047547.6520005 052.9960 6781 476.51 1981249.6916 403563.4520015 533.0165 1911 573.28 1982263.3019 847617.7720026 035.4868 3971 649.22 1983327.9521 579674.2220036 867.7069 6891 891.73 1984370.0423 908702.7020048 579.4273 7962 107.26 1985451.7435 642838.22200510 621.5678 8272 282.60 1986502.9136 436881.90200612 412.8686 6082 415.89 1987609.6039 5391 020.81200715 076.21101 4102 729.30 1988749.0938 3571 079.26200818 097.05138 3925 215.84 1989850.7138 2451 157.63200919 590.35169 6436146.09 1990934.6538 1111 169.44201023 222.91202 4707 141.82 19911 045.7339 9231 199.31201127 098.62240 9658 471.07 19921 279.7544 0181 302.34201229 797.13272 2409 436.42 19931 660.1847 3471 337.03201332 423.55184 6697 205.05 19942 216.8350 9881 432.97201435 198.65200 6267 367.09 19952 988.3753 5821 538.82201537 278.20192 7156 916.89 19963 634.6955 9201 603.52201640 471.79205 3857 336.28 19974041.0956 1131 547.18201744 988.16229 4008 160.34本文所构建的河南省物流需求预测的灰色ARIMA组合预测模型算法流程图如图1所示.图1 灰色ARIMA组合模型预测流程图Fig.1 Prediction flow chart of gray ARIMA combination model2.1 灰色关联分析物流的整个过程环节多而散,因此目前没有一个统一的指标来度量物流需求规模.但在物流所有环节中,运输环节贯穿于物流活动的整个过程,是物流过程中实现位移的必备环节,所以在物流需求的研究中多是以货运量或者货物周转量来表示其发展规模. 因此,本文在构建组合预测模型之前,通过计算对比GDP 与货运量和货物周转量之间的关联度大小来判断采用两者中的哪一个作为衡量物流需求的指标更合适.令GDP、货运量、货物周转量分别为X0,X1,X2.由表2数据可知,X0,X1,X2 已为等长度1-时距序列,2)计算X0,X1 的相对关联度r01.第一步:求X0,X1 的初值象,得第二步:求X′0,X′1 的始点零化象,得3)计算X0 和X1 的综合关联度ρ01.方法同上,可求得序列X0 和X2 的绝对关联度、相对关联度和综合关联度分别为:由GDP 与货运量和货物周转量之间的关联度分析得出,河南省货物周转量与GDP 之间的联系更密切,由此,可以选择河南省货物周转量作为衡量河南省物流需求量的指标.两者关联度几近60%,可以认为河南省物流需求的发展在很大程度上会影响河南省经济发展.合理预测河南省物流需求,并针对物流发展过程中可能出现的问题制定相应的政策措施,从而更好地促进物流业向好发展,进而促进我省经济快速发展.2.2 灰色ARIMA组合模型预测本文以货物周转量作为衡量河南省物流需求量的指标,从《河南统计年鉴》中选择1978—2017年河南省货物周转量数据作为研究对象,构建组合预测模型对1978—2017年的数据进行拟合,并对2018—2020年的河南省货物周转量进行预测,预测过程如下.2.2.1 灰色GM(1,1)模型预测过程1)原始序列的初始化:3)1-AGO的紧邻均值序列生成:4)发展系数和灰色作用量的计算: a=-0.08,b=280.40.5)得出灰色GM(1,1)模型模拟值拟合序列,计算误差序列6)灰色GM(1,1)模型预测值与实际值拟合过程如图2所示,对2018—2020年货物周转量的预测结果如表3所示.表3 2018—2020年河南省货物周转量预测值Tab.3 Forecast value of goods turnover in Henan Province from 2018 to 2020亿t·km年份201820192020灰色模型预测值9 148.119 915.1910 746.59图2 货物周转量实际值与灰色预测值拟合图Fig.2 Fitting chart of actual value and grey forecast value of goods turnover由图2可明显看出,模型预测误差较大,分析其原因可知,存在环境随机因素如统计方法的变化等的影响,使灰色预测结果产生较大误差.2.2.2 建立误差序列的ARIMA模型灰色GM(1,1)模型预测结果误差较大,建立误差序列的ARIMA模型,对灰色预测产生的灰色预测误差数据序列进行预测分析,过程如下.1)将灰色误差序列进行非负处理.误差序列最小值为=932.15,非负处理后得到序列2)ADF检验.可以明显看出序列为非平稳序列,对其二阶差分序列进行ADF检验,检验结果如表4所示,可以看出在显著性水平0.05 下,拒绝存在单位根的原假设,说明序列的二阶差分序列是平稳序列,因此d=2.表4 ADF检验表Tab.4 ADF testAugmented Dickey-Fuller test statistict-5.S3t8a3t i s6t i8c0 0 P.0 ro 0 b0. *1 Test critical values: 1%level-3.661 661 5%level-2.960 411 10%level-2.619 1603)模型识别与定阶.二阶差分之后的序列平稳,即可确定ARIMA(p,d,q)模型中d=2.继续分析差分序列的自相关图和偏自相关图,并对差分序列拟合ARMA 模型,确定p 和q 的取值.自相关-偏自相关检验如表5.自相关图和偏自相关均拖尾,根据AIC最小准则,确定模型为ARIMA(2,2,2).4)模型参数估计与建立.由ARIMA(2,2,2)模型进行回归,该模型的最小二乘估计结果为:表5 自相关-偏相关函数表Tab.5 Autocorrelation-partial correlation function diagram注:“*”表示相关系数,其数量表示系数大小,以此来表示自相关函数(ACF)或偏自相关函数(PACF)的拖尾或截尾性,并以此判断序列阶数.AutocorrelationPartial CorrelationACPACQ-StatProb****|. |****|. |-0.460-0.4603.349 30.067.|. |**|. |0.045-0.2116.671 00.036.|. |.*|. |0.189-0.0828.230 60.041.|*. |.|*. |0.112-0.2699.358 90.053****|. |****|. |-0.416-0.39918.187 00.003.|*. |**|. |-0.218-0.24018.666 00.005.|. |**|. |0.079-0.21121.672 00.003.|. |.*|. |0.052-0.07424.117 00.002.|. |.|*. |-0.0380.09124.119 00.004.|. |**|. |-0.030-0.26924.264 00.007.|. |**|. |-0.0090.16924.292 00.012.|. |**|. |-0.011-0.21924.295 00.019.|. |.|. |-0.0040.09124.315 00.028.|. |.*|. |-0.000-0.03324.316 00.042.|. |.*|. |0.003-0.14124.439 00.058.|. |.|. |0.026-0.09324.684 00.076并且模型所有解释变量的参数估计值在0.01的显著性水平下都是显著的.5)模型适应性检验.模型的适应性检验,实质是对模型残差序列进行白噪声检验.残差序列的自相关-偏自相关检验结果如表6所示,残差序列不存在自相关,为白噪声序列,因此ARIMA(2,2,2)模型是适合的模型.表6 残差序列的自相关-偏自相关函数表Tab.6 Autocorrelation-partial autocorrelation function diagram of residual sequence注:“*”表示相关系数,其数量表示系数大小,以此来表示自相关函数(ACF)或偏自相关函数(PACF)的拖尾或截尾性,并以此判断序列阶数.AutocorrelationPartial CorrelationACPACQ-StatProb.|. |.|. |-0.037-0.0370.04750.827.|. |.|.|0.0000.0020.04750.977.|. |.|. |-0.0440.0440.11740.990.|. |.|.|0.0020.0020.11750.998**|. |**|. |-0.113-0.1130.61820.987**|. |**|.|0.1050.1181.07220.983.|. |.|. |-0.029-0.0431.10880.993.|. |.|. |-0.031-0.0471.14990.997.|. |.|. |0.0550.0311.24980.999.*|. |.*|. |-0.083-0.0981.56690.999.|. |.*|. |-0.048-0.0701.60960.999.|. |.*|. |-0.058-0.0531.64241.000.|. |.*|. |-0.047-0.0841.76701.000.|. |.|.|0.0210.0031.79281.000.*|. |.*|. |-0.059-0.0882.01521.000.|*. |.|.|0.0730.0252.37771.0006)运用该模型拟合1978—2017年的灰色预测误差修正值,并预测2018—2020年的预测误差值,拟合效果如图3所示,从预测结果看,ARIMA(2,2,2)模型的预测效果较好,因此建立的模型是有效的.图3 修正误差的实际值与预测值拟合图Fig.3 Fitting figure of actual error value and predicted error value2.2.3 组合模型预测结果将ARIMA预测模型还原后的预测数据加上灰色模型预测数据,即为灰色ARIMA组合模型最终的预测结果. 灰色模型和灰色ARIMA 组合模型拟合过程如图4 所示. 运用组合模型对2018—2020年河南省货物周转量进行预测,预测结果如表7所示.图4 1978—2020年度原始数据与预测数据拟合图Fig.4 Fitting chart of original data and forecast data from 1978 to 2020表7 2018—2020年河南省货物周转量预测值Tab.7 Forecast value of goods turnover in Henan Province from 2018 to 2020亿t·km年份201820192020灰色模型预测值9 148.119 915.1910 746.59组合模型预测值99 405.1310487.3511 178.03河南省货物周转量从1978年到2007年稳步增长,而在2008年数据却猛增近一倍,之后呈现快速增长特征,到2012年发展达到顶峰,在2013年至2014年有所回落,2015年重新呈现增长态势.出现数据统计拐点是因为2008年的数据为公路水路运输量专项调查数据,所以2008年数据出现猛增;在2013年交通部门采用新的统计方法,因为统计口径变化,使数据统计出现波动.从图4中可以明显看出,在拟合过程中,灰色GM(1,1)模型的拟合结果是一条近似平滑的曲线,表明该模型只能反映序列数据总的变化趋势,模型的预测误差较大,无法反映序列数据的变化细节.而灰色ARIMA组合模型在反映序列趋势变化的同时,也能充分反映序列中数据的细节变化,能有效地减少预测过程中存在的环境随机因素的影响,比如统计方法变化、统计数据口径变化等的影响,因此拟合结果与原始数据更加接近,拟合精度明显优于单一的灰色GM(1,1)模型,且预测效果也更加稳定.3 结语本文以河南省地区生产总值(GDP)近似表示河南省经济发展水平.首先,通过计算河南省的GDP与货运量和货物周转量之间的关联度大小,说明我省的物流发展状况在很大程度上可以反映经济的发展状况,并且可以通过对物流需求的预测来反映物流行业的发展趋势.本文选择河南省货物周转量作为衡量河南物流需求的指标,构建灰色ARIMA组合模型对河南省1978—2017年货物周转量数据进行分析,并对2018—2020年河南省货物周转量进行预测.由模型预测结果可知,河南省货物周转量呈现增长趋势,这表明河南省物流产业规模持续增长,这也预示着未来河南省的经济发展势头持续向好.【相关文献】[1]刘钻扩,辛丽,曹飞飞.21世纪海上丝绸之路物流绩效对中国机电产品出口的影响[J].华东经济管理,2018,32(11):52-59.[2]GAGLIARDI F,ALVISI S,KAPELAN Z,et al.A probabilistic short-term water demand forecasting model based on the Markov chain[J].Water,2017,9(7):507-522.[3]伍星华.基于GSO-GNNM模型的区域物流需求预测[J].科技管理研究,2015,35(11):212-216.[4]TSAI T H,LEE C K,WEI C H.Neural network based temporal feature models for short-term railway passenger demand forecasting[J].Expert Systems with Applications,2009,36:3728-3736.[5]LAU H C W,HO G T S,ZHAO Y.A demand forecast model using a combination of surrogate data analysis and optimal neural network approach[J].Decision Support Systems,2013,54(3):1404-1416.[6]潘和平,张承钊.FEPA-金融时间序列自适应组合预测模型[J].中国管理科学,2018,26(6):26-38.[7]胡泽文,武夷山.科技产出影响因素分析与预测研究——基于多元回归和BP 神经网络的途径[J].科学学研究,2012,30(7):992-1004.[8] SATMAN M H,DIYARBAKIRLIOGLU E.Reducing errors-in-variables bias in linear regression using compact geneticalgorithms[J].Journal of StatisticalComputation&Simulation,2014,85(16):3216-3235.[9]胡小建,张美艳,卢林.物流需求预测模型构建[J].统计与决策,2017(19):185-188. [10]蔡超敏,凌立文,牛超,等.国内猪肉市场价格的EMD-SVM集成预测模型[J].中国管理科学,2016,24(S1):845-851.[11]丁璐璐,耿立艳.基于灰关联分析的最小二乘支持向量机物流需求预测[J].物流技术,2013,32(10):130-132,135.[12]耿立艳.基于GRA与KPCA的LSSVM物流需求预测[J].交通运输系统工程与信息,2015,15(1):137-142.[13]GUO H Y,PEDRYCZ W,LIU X D.Fuzzy time series forecasting based on axiomatic fuzzy set theory[J].Neural Computing&Applications,2018,3:1-12.[14]马国丰,周乔乔.基于灰色马尔科夫预测的PPP项目特许期调整模型研究[J].科技管理研究,2018,38(17):224-232.[15]李夏培.基于灰色线性组合模型的农产品物流需求预测[J].北京交通大学学报(社会科学版),2017,16(1):120-126.[16]李巧侠.基于参数化三角范数的铁路货运量选择集成预测[J].河南科学,2016,34(1):55-61.[17] AL-DEEK e of vessel freight data to forecast heavy truck movements atseaports[J].Transportation Research Record:Journal of the Transportation Research Board,2002,1804(1):217-224.[18]XIAO Y,LIU J J,HU Y,et al.A neuro-fuzzy combination model based on singular spectrum analysis for air transport demand forecasting[J].Journal of Air Transport Management,2014,39:1-11.[19] PEIHUA FU,YAJIE LI.Application of combined model in forecasting logistic volume of a port[C]//International Conference on Intelligent Computation Technology and Automation,May 11-12,2010,Changsha,A:IEEE Computer Society,2010(1):742-745.[20]刘思峰,郭天榜,党耀国,等.灰色系统理论及其应用[M].北京:科学出版社,2017:92-97.[21]YUAN C Q,LIU S F,FANG Z paris on of China’s primary energy consumption forecasting by using ARIMA(the autoregressive integrated moving average)model and GM(1,1)model[J].Energy,2016,100:384-390.[22]武孟飞,李炳军.基于GM(1,1)灰色预测模型的物流产业发展研究——以河南省经济增长背景为例[J].河南科学,2018,36(8):1305-1312.[23]陈荣,梁昌勇,陆文星,等.面向旅游突发事件的客流量混合预测方法研究[J].中国管理科学,2017,25(5):167-174.[24]李蕾,李超,丁雪辰,等.我国执业(助理)医师需求集成预测——基于GM、ARIMA和VAR模型的实证研究[J].管理评论,2018,30(3):171-178.。
基于ARMA模型的公路货运量预测及分析
随着国家经济水平的提高和物流行业的发展,公路货运量的重要性日益突出。
货运量
的预测对于物流企业的经营和管理至关重要,因此,本文基于ARMA模型对公路货运量进行预测。
首先,对数据进行了收集和整理。
本文所用数据为2010年到2019年间的公路货运量,包括总体和月度货运量数据。
通过数据的分析,可以看出公路货运量总体呈持续增长趋势,但增长速度有所减缓。
月度货运量呈现出季节性变化,夏季货运量相对较高,冬季货运量
相对较低。
接下来,进行了ARMA模型的建立。
ARMA模型是一种常用的时间序列预测方法,它结
合了自回归模型(AR)和移动平均模型(MA),是一种广义的自回归移动平均模型。
首先,对数据进行ADF检验,判断数据是否是平稳的。
然后,利用自相关图(ACF)和偏自相关图(PACF)对数据进行初步的识别和模型选择。
最后,根据部分自相关图(PACF)和自回归
方程、移动平均方程,确定模型的p和q值,并进行模型的拟合和检验。
最终,预测结果表明ARMA模型具有一定的预测精度。
总体货运量预测表明,未来几年中公路货运量将有所增长,但增长速度将逐渐放缓。
月度货运量预测表明,夏季货运量仍
将保持较高水平,冬季货运量预计将逐渐增加。
本文的研究结果可以为物流企业的运营和管理提供参考,对于对公路物流发展趋势有
一定的指导作用。
同时,此研究也为基于ARMA模型的货运量预测提供了一种有效的分析方法,为类似问题的研究提供了借鉴和参考。
时序数据分析方法综述时序数据分析是指对时间序列数据进行建模、分析和预测的一种方法。
时间序列数据是按照时间顺序排列的数据集合,它是许多领域中常见的数据类型,例如金融、经济、气象和交通等。
时序数据分析可以帮助我们了解数据的趋势、周期性和相关性,从而做出更准确的预测和决策。
1.基本统计方法:基本统计方法是时序数据分析的起点,它可以帮助我们了解数据的基本特征和分布情况。
基本统计方法包括均值、方差、标准差、最小值、最大值等指标的计算,以及对数据的可视化分析,如折线图、柱状图和箱线图等。
2.时间序列模型:时间序列模型是对时序数据进行建模和预测的一种方法。
常见的时间序列模型包括自回归平均移动平均模型(ARMA)、自回归集成移动平均模型(ARIMA)、季节性自回归集成移动平均模型(SARIMA)、指数平滑法(ES)和灰色预测模型等。
这些模型可以捕捉到时序数据中的趋势、周期性和季节性等特征,从而进行预测和分析。
3.神经网络模型:神经网络模型是一种强大的时序数据建模方法,它可以处理非线性和复杂的时间序列关系。
常见的神经网络模型包括循环神经网络(RNN)、长短期记忆网络(LSTM)和门控循环单元(GRU)等。
这些模型可以学习时间序列数据中的长期依赖关系和非线性规律,从而提高预测的准确性。
4.波动性分析:波动性分析是对时序数据中波动性进行研究和分析的方法。
常见的波动性分析方法包括波动率计算、频谱分析和小波分析等。
这些方法可以帮助我们了解数据的波动性、周期性和噪声成分,从而进行风险分析和决策。
5.频域分析:频域分析是一种将时序数据转化到频域进行分析的方法。
常见的频域分析方法包括傅里叶变换(FFT)和功率谱分析等。
这些方法可以帮助我们了解数据的频率成分和周期性变化,从而进行信号分析和滤波处理。
6.异常检测:异常检测是对时序数据中异常值进行识别和分析的方法。
常见的异常检测方法包括均方差控制图、灰色关联度分析和支持向量机(SVM)等。
ARMA-BP物流需求预测模型及应用刘凤春;赵亚宁;董新雁;刘源铄;乔鹏;谢志远;王立亚;张春英【期刊名称】《河北联合大学学报(自然科学版)》【年(卷),期】2018(040)003【摘要】Based on the real time and uncertainty of logistics demand ,the fusion time series autoregressive-moving average model ARMA and BP Neural network were proposed ,and the logistics demand forecasting ARMA-BP model was modelled , An ARMA-BP combined prediction algorithm for predicting freight transport was proposed .Based on the logistics transportation data of Tangshan in recent years ,using ARMA model ,BP model and ARMA-BP model ,the logistics data were predicted .The results show that the ARMA-BP model has higher precision and practical value than the traditional prediction model .%基于物流需求的实时性和不确定性,提出融合时间序列自回归-滑动平均模型A RM A和BP神经网络,构建了物流需求预测ARMA -BP模型,提出预测货物运输的ARMA -BP结合预测算法.以唐山市近几年物流运输数据为研究对象,分别运用ARMA模型、BP模型和ARMA -BP模型对物流数据进行预测分析,结果表明,与传统预测模型相比,ARMA -BP模型预测精度更高,具有一定的实用价值.【总页数】9页(P120-128)【作者】刘凤春;赵亚宁;董新雁;刘源铄;乔鹏;谢志远;王立亚;张春英【作者单位】华北理工大学迁安学院,河北唐山 063000 ;华北理工大学理学院,河北唐山 063210;华北理工大学理学院,河北唐山 063210;华北理工大学理学院,河北唐山 063210;华北理工大学理学院,河北唐山 063210;华北理工大学理学院,河北唐山 063210;华北理工大学理学院,河北唐山 063210;华北理工大学理学院,河北唐山 063210【正文语种】中文【中图分类】TP391【相关文献】1.灰色预测模型在煤矿物流需求预测上的应用 [J], 郭健2.ARMA-BP物流需求预测模型及应用 [J], 刘凤春;赵亚宁;董新雁;刘源铄;乔鹏;谢志远;王立亚;张春英;;;;;;;;3.灰色预测模型在煤矿物流需求预测上的应用 [J], 张世伟4.ARMA-BP组合模型在某高速铁路轨道不平顺预测中的应用 [J], 常燕龙5.ARMA-BP组合模型在某高速铁路轨道不平顺预测中的应用 [J], 常燕龙因版权原因,仅展示原文概要,查看原文内容请购买。
定量预测方法包括定量预测方法是一种通过数学模型和统计分析来预测未来事件或现象的方法。
定量预测方法可以应用于各种领域,如经济学、金融学、管理学等,并且在实际决策中起着重要的作用。
下面将介绍几种常用的定量预测方法。
1. 时间序列分析:时间序列分析是一种通过对现有数据的观察和理解,来预测未来数据的方法。
它基于时间上的依赖性,通过分析数据的趋势、季节性和周期性等特征,构建数学模型,从而对未来进行预测。
时间序列分析方法包括移动平均法、指数平滑法和ARIMA模型等。
2. 回归分析:回归分析是一种通过建立变量之间的关系模型,来预测因变量值的方法。
它通过观察和分析自变量和因变量之间的关系,并建立数学方程来描述这种关系。
回归分析方法包括简单线性回归、多元线性回归和逻辑回归等。
3. 神经网络:神经网络是一种模仿人类神经系统结构和功能的数学模型,能够通过训练和学习来预测未来事件或现象。
神经网络通过多个节点(神经元)之间的连接和传递信号,构建一个复杂的非线性函数关系来进行预测。
神经网络方法包括前馈神经网络、循环神经网络和深度学习等。
4. 时间序列回归模型:时间序列回归模型是一种将时间序列数据和回归分析相结合的方法,用于预测未来事件或现象。
它通过同时考虑时间上的依赖性和自变量对因变量的影响,建立数学模型进行预测。
时间序列回归模型包括自回归滑动平均模型(ARMA)、自回归积分滑动平均模型(ARIMA)和灰色模型等。
5. 蒙特卡洛模拟:蒙特卡洛模拟是一种基于概率统计原理的数值计算方法,通过生成大量随机样本来模拟预测结果。
它根据已知的分布函数和参数,随机抽取样本,并进行模拟计算,从而得到预测结果的概率分布。
蒙特卡洛模拟可以用于估计风险、评估投资回报等。
除了上述常用的定量预测方法,还有其他一些方法如决策树、支持向量机、贝叶斯网络等。
每种方法都有其适用的场景和特点,选择合适的方法需要考虑数据的性质、模型的复杂度和预测的准确性等因素。
基于ARIMA简单季节模型的河南省快递业务量预测李贞贞【摘要】本文对发展迅速的快递行业进行研究,选取河南省月度快递业务量,考虑到月度快递业务量的趋势性、季节效应,通过建立ARIMA简单季节模型对快递业务量进行预测.结果表明,该模型预测效果较好.【期刊名称】《价值工程》【年(卷),期】2019(038)017【总页数】3页(P271-273)【关键词】时间序列分析;ARIMA模型;快递业务量【作者】李贞贞【作者单位】郑州师范学院,郑州450044【正文语种】中文【中图分类】F259.1;F2240 引言随着电子商务的兴旺、蓬勃发展,消费者的购物方式悄然发生了变化,网购成为了重要的购物方式。
购物方式的变化带动了快递行业的迅猛发展。
对于快递行业的企业,业务量的变化对人员管理、投资决策等产生重要影响,因此快递业务量的预测对企业的经济决策有着重要参考依据。
为了有较高的预测精度,需要对业务量时间序列数据进行有效合理分析、挖掘,建立业务量预测模型。
对于快递业务量的分析,学者采用了不同的模型和方法进行了分析,如灰色预测模型、组合预测、时间序列分析模型等等。
对于数据较少的,可采用灰色预测模型。
洪琼[1]等根据江苏省2009至2017年规模以上企业快递业务量年度数据,用灰色预测模型GM(1,1)对其进行预测,认为江苏省的快递市场需求的增长势头迅猛。
孙丽[2]基于我国2008至2014年我国快递业务量数据运用GM(1,1)模型进行拟合,拟合精度较高。
可运用该模型对业务量进行预测。
对于时间跨度较长的数据,考虑到快递业务量具有长期趋势性、季节性、短期波动等特点,建立模型时需要考虑其特点,商丰瑞等[3]利用SARIMA模型对我国月度快递业务量进行预测分析;张仲斐等[4]利用四大快递公司的季度跨国快递业务量数据建立了基于ARIMA模型,该模型短期预测效果良好。
也有学者尝试运用组合预测的方式进行预测。
王惠婷等[5]利用我国1995年至2016年的年度快递业务量,建立了二次指数平滑模型、多项式曲线预测模型、ARIMA模型等,进行组合预测,预测精度好。
时序预测的基本原理介绍时序预测是指根据过去的数据和规律,预测未来的趋势或结果。
它在很多领域都有着重要的应用,比如气象预测、股票市场分析、交通流量预测等。
在这篇文章中,我们将介绍时序预测的基本原理和一些常用的方法。
时序数据的特点时序数据是按照时间顺序排列的数据集合。
它的特点在于具有时间相关性,即当前时刻的数据受到过去时刻数据的影响。
另外,时序数据通常具有周期性、趋势性和周期性等特征。
这些特点使得时序数据的预测相比其他数据更加复杂。
基本原理时序预测的基本原理是通过建立数学模型来描述过去数据之间的关系,并利用这个模型对未来数据进行预测。
这个数学模型可以是线性的,也可以是非线性的,可以是一阶的,也可以是高阶的。
根据实际情况选取适当的模型非常重要。
常用的方法时序预测有很多经典的方法,下面介绍几种常用的方法。
1. 移动平均法移动平均法是一种简单的时间序列预测方法。
它的基本思想是利用过去几个时期的数据来计算平均值,然后将这个平均值作为未来时期的预测值。
移动平均法可以有效地平滑数据,减小随机波动,但是无法捕捉趋势和季节性。
2.指数平滑法指数平滑法是一种基于加权平均的方法。
它的核心思想是将过去所有的数据按照指数递减的加权系数进行平滑处理,最后得到未来时期的预测值。
指数平滑法适用于数据变化比较缓慢的情况,但是对于复杂的时序数据效果不佳。
3.时间序列分解法时间序列分解法是一种将时序数据按照趋势、季节和随机成分进行分解的方法。
通过对这三个成分分别建模,然后将它们组合在一起得到最终的预测结果。
时间序列分解法适用于具有明显趋势和季节性的数据,但是对于高度非线性的数据效果有限。
4.自回归移动平均模型(ARMA)自回归移动平均模型是一种基于时间序列自相关和滞后项的预测方法。
它将时序数据的自相关和滞后项建模,然后利用这个模型对未来数据进行预测。
ARMA 模型适用于平稳和非季节性的时序数据,但是对于非平稳和有明显季节性的数据效果不佳。
基于ARMA模型和灰色预测模型的邮政业务总量预测上传日期:2009年10月16日编辑:现代经济编辑部点击:318次
胡芳芳
(首都经济贸易大学统计学院,北京100070)
摘要:邮政业务是个复杂的社会经济系统,本文分别采取A R M A模型以及灰色预测模型G M(1,1)对邮政业务总量进行预测,并比较了两种模型的预测精度,并对2009-2011年全国邮政业务总量进行了预测。
关键词:A R M A模型;灰色预测模型;邮政业务;预测精度
中图分类号:F618文献标识码:A文章编号:1671-8089(2009)08-0032-04
一、基于A R M A模型的邮电业务总量预测
A R M A模型是一类常用的随机时序模型,由博克斯(
B o x)、詹金斯(J e n k i n s)创立,亦称B-J方法。
它是一种精度较高的时序短期预测方法,其基本思想是:某些时间序列是依赖于时间t的一族随机变量,构成该时序的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以有相应的数学模型近似描述。
通过对该数学模型的分析研究,能够更本质地认识时间序列的结构与特征,达到最小方差意义下的最优预测。
本文利用1949-2005年全国邮电业务总量历史数据,建立A R M A模型进行拟合,并对2006-2008年数据进行预测,最后对2006-2008年邮电业务总量真实值与预测值进行比较分析。
(一)序列的平稳性检验。
建立A R M A模型之前需检验序列的平稳性,只有平稳序列才能建立A R M A模型。
原序列y z非平稳,为减小序列的波动,对y z取对数形成新的序列l y z,经检验,l y z仍非平稳,须对l y z序列进行逐期差分以消除趋势,差分后序列为
i l y z。
再检验i l y z的平稳性,进行单位根检验,检验结果如图1所示:
图1单位根检验结果
可以看出,检验统计量值为-3.578351,小于给定置信水平下的临界值,则认为序列i l y z不存在单位根,为平稳序列。
(二)模型的识别与建立。
自相关函数和偏自相关函数是识别A R M A模型最主要的工具,在E v i e w s中,通常利用样本的自相关和偏自相关分析图进行模型识别与定阶。
平稳序列i l y z的自相关-偏自相关分析图如图2:
图2平稳序列i l y z的自相关-偏自相关分析图
由图可以看出,偏自相关系数在后很快地趋于0,所以取;自相关系数在
后很快趋于0,所以。
于是建立A R M A(1,6)模型。
A R M A(1,6)模型的参数估计结果为:
(三)模型检验。
参数估计后,应该对A R M A模型的适合性进行检验,即对模型的残差
序列进行白噪声检验。
对残差序列进行检验,检验结果以及残差序列的自相关-偏自相关分析图如图3所示:
图3残差序列的自相关-偏自相关分析图
从图中可以看出,残差序列的自相关系数均落入随机区间,表明残差序列是纯随机的。
(四)模型的预测。
本文使用1997-2005年的邮政业务总量真实值与模型拟合值进行拟合精度分析,以及利用2006-2008年邮政业务总量真实值逾模型预测值进行预测精度分析。
表1模型预测结果
模型拟合平均相对误差为0.0819,模型预测平均相对误差为0.1268。
二、基于G M(1,1)模型的邮政业务总量预测
灰色预测法式一种对含有不确定因素的系统进行预测的方法,是对既含有已知信息又含有不确定信息的系统进行预测,就是对在一定范围内变化的、与时间有关的灰色过程进行预测。
灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成又较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来的发展趋势状况。
(一)模型的建立。
设时间序列有个观察值,,通过累加生成新序列,则模型相应的微分方程为:
(1)
式中,,为发展灰数,为内生控制灰数。
设为待估参数向量,则,利用最小二乘法求解,得:
,其中,,
解方程则有:(2)
求解预测值:将代入(2)式可得模型的计算值,通过
将预测值还原,得到相应的预测值。
(二)模型的检验。
对模型的预测精度进行检验是建构预测分析必不可少的步骤。
常用的检验方法有残差检验法、后残差检验法及关联度分析法。
1、残差检验法:
根据预测模型可知,第年预测值与原始值的误差表示为:
若相对误差记为,称为平均相对误差,给定,当成立时,称模型为残差合格模型。
2、后残差检验:
记时刻残差,则残差均值,残差
的方程,设原始方差为,则可得:
(1)后残差比值:,对于给定的,当时,称模型为均方差比合格模型;
(2)小误差概率:,对于给定的当
时,称模型为小误差概率合格模型。
表2模型的精度标准
(3)关联度检验:
绝对误差为:
关联系数:
在最大差百分比取50%时,关联度大于0.6便满意了。
(三)邮政业务总量预测。
以1997-2005年邮政业务总量来构建灰色预测G M(1,1)模型,并对模型精度进行检验。
记1997-2005年全国邮政业务总量的时间序列为:
根据(1),(2)式得到预测模型:
表3模型预测结果
表4模型的精度检验结果表
从模型的精度检验结果来看,除了平均相对误差以外,其他几项指标均达到了理想状态,下面建立改进残差模型。
对残差项建立G M(1,1)模型,将预测模型加上残差预
测模型变得修正预测模型:
表5模型预测结果
表6模型的精度检验结果表
从模型的精度检验结果来看,平均相对误差有所提高。
,即
G M(1,1)可以适合中长期预测。
以下为2006-2008年邮政业务总量预测结果:
表7预测结果
模型拟合平均相对误差为0.0549,模型预测平均相对误差为0.0605。
下表为
A R M A(1,6)模型和G M(1,1)模型1997-2005年拟合平均相对误差以及2006-2008年的预测平均相对误差之间的比较。
表8模型预测精度对比
可见,不管是在拟合历史数据方面,还是在预测未来数据方面,G M(1,1)灰色预测模型效果均好于A R M A模型。
三、2009-2011年邮政业务总量预测
由于G M(1,1)在预测未来数据方面精度好于A R M A模型,下面利用1997-2008年邮政业务总量数据建立G M(1,1)模型,并对2009-2011年的邮政业务总量进行预测分析。
预测结果如下:
表9预测结果
图4预测结果
四、总结
由预测结果可知,2009年我国邮政业务总量将比2008年增长22.8%,之后每年将以超过25%的速度增长。
参考文献:
[1]易丹辉.数据分析与E v i e w s应用.中国统计出版社,2002
[2]徐国祥.统计预测和决策.第二版.上海财经大学出版社,2005
作者简介;胡芳芳(1985年-),女,籍贯:江西南昌,学位:在读硕士二年级,首都经济贸易大学统计学院,研究方向:精算与风险分析。