ARIMA与SVM混合模型在害虫预测中的应用
- 格式:doc
- 大小:269.00 KB
- 文档页数:9
农业病虫害预测与防控智能化系统第1章绪论 (3)1.1 农业病虫害预测与防控的意义 (3)1.1.1 保证粮食安全 (4)1.1.2 提高农产品质量 (4)1.1.3 促进农业可持续发展 (4)1.2 智能化系统在农业病虫害预测与防控中的应用 (4)1.2.1 数据采集与分析 (4)1.2.2 病虫害预测模型构建 (4)1.2.3 防控策略优化 (4)1.2.4 农业生产管理决策支持 (4)第2章农业病虫害基本知识 (5)2.1 病虫害分类与发生规律 (5)2.1.1 真菌性病害 (5)2.1.2 细菌性病害 (5)2.1.3 病毒性疾病 (5)2.1.4 害虫侵害 (5)2.1.5 线虫病害 (5)2.1.6 非生物因素引起的病虫害 (5)2.2 病虫害影响因素分析 (5)2.2.1 气候因素 (6)2.2.2 土壤因素 (6)2.2.3 农业生产措施 (6)2.2.4 生态环境 (6)2.3 病虫害监测与预警技术 (6)2.3.1 病虫害调查与监测 (6)2.3.2 遥感技术 (6)2.3.3 气象预报技术 (6)2.3.4 模型预测技术 (6)2.3.5 预警系统 (6)第3章数据采集与处理技术 (7)3.1 农业病虫害数据采集方法 (7)3.1.1 传统数据采集方法 (7)3.1.2 现代遥感技术 (7)3.1.3 传感器技术 (7)3.2 数据预处理技术 (7)3.2.1 数据清洗 (7)3.2.2 数据标准化与归一化 (7)3.2.3 数据整合与融合 (7)3.3 数据分析与挖掘方法 (7)3.3.1 描述性统计分析 (7)3.3.2 机器学习与模式识别 (8)3.3.4 深度学习技术 (8)第4章病虫害预测模型构建 (8)4.1 统计预测模型 (8)4.1.1 时间序列分析模型 (8)4.1.2 线性回归模型 (8)4.1.3 逻辑回归模型 (8)4.2 机器学习预测模型 (8)4.2.1 决策树模型 (8)4.2.2 随机森林模型 (9)4.2.3 支持向量机模型 (9)4.3 深度学习预测模型 (9)4.3.1 卷积神经网络模型 (9)4.3.2 循环神经网络模型 (9)4.3.3 深度信念网络模型 (9)4.3.4 对抗网络模型 (9)4.3.5 融合模型 (9)第5章病虫害防控策略制定 (9)5.1 防控策略概述 (9)5.2 防控措施优化方法 (10)5.2.1 预防措施 (10)5.2.2 治理措施 (10)5.2.3 监测措施 (10)5.3 防控效果评估 (10)第6章智能化系统设计与实现 (11)6.1 系统架构设计 (11)6.1.1 整体架构 (11)6.1.2 数据层 (11)6.1.3 服务层 (11)6.1.4 应用层 (11)6.2 系统功能模块设计 (11)6.2.1 数据处理模块 (11)6.2.2 模型预测模块 (11)6.2.3 防控策略模块 (11)6.3 系统开发与实现 (12)6.3.1 开发环境 (12)6.3.2 系统实现 (12)6.3.3 系统部署 (12)第7章智能识别与诊断技术 (12)7.1 图像处理与特征提取 (12)7.1.1 图像预处理 (12)7.1.2 特征提取 (12)7.2 深度学习在病虫害识别中的应用 (13)7.2.1 卷积神经网络(CNN) (13)7.3 病虫害诊断方法研究 (13)7.3.1 支持向量机(SVM) (13)7.3.2 集成学习 (13)7.3.3 深度学习方法 (13)第8章预测与防控系统应用案例 (14)8.1 案例一:水稻病虫害预测与防控 (14)8.1.1 案例背景 (14)8.1.2 系统应用 (14)8.1.3 应用效果 (14)8.2 案例二:小麦病虫害预测与防控 (14)8.2.1 案例背景 (14)8.2.2 系统应用 (14)8.2.3 应用效果 (14)8.3 案例三:果树病虫害预测与防控 (14)8.3.1 案例背景 (14)8.3.2 系统应用 (15)8.3.3 应用效果 (15)第9章农业病虫害防控政策与措施 (15)9.1 我国病虫害防控政策概述 (15)9.1.1 政策背景 (15)9.1.2 政策目标 (15)9.1.3 政策措施 (15)9.2 农业病虫害防控措施实践 (15)9.2.1 监测预警体系构建 (15)9.2.2 绿色防控技术应用 (16)9.2.3 农药、化肥减量使用 (16)9.3 防控政策与措施优化建议 (16)9.3.1 政策优化 (16)9.3.2 措施优化 (16)9.3.3 社会共治 (16)第10章智能化系统在农业病虫害防控中的前景与挑战 (16)10.1 农业病虫害防控智能化发展趋势 (16)10.2 面临的挑战与问题 (17)10.3 未来研究方向与展望 (17)第1章绪论1.1 农业病虫害预测与防控的意义农业病虫害预测与防控是保障粮食安全和农产品质量的重要环节。
基于ARIMA模型和CNN-LSTM组合模型的全球气温预测
分析
严迅;铁承城;鄢薇;何杰艳;管春春;吕井明
【期刊名称】《科技与创新》
【年(卷),期】2024()2
【摘要】全球气温预测研究对于国家环境健康状况评价、环境问题分析和预防污
染物浓度管理具有重大价值。
为有效提升温度预报准确率,首次引入了ARIMA(自
回归移动平均模型)模型进行温度预测,而后又给出了一个基于卷积层神经网络(Convolutional Neural Networks,CNN)和长短期记忆神经网络(Long Short-Term Memory,LSTM)相结合的温度预报模型。
利用CNN卷积层和池化层为特征提取模块,从而获得了数据特征;将重构信息注入LSTM网络中挖掘气温的时序特征。
结果表明,与单独使用LSTM、CNN进行预测及使用ARIMA模型预测相比,CNN-LSTM模型预测结果具有更高的准确率。
【总页数】4页(P19-22)
【作者】严迅;铁承城;鄢薇;何杰艳;管春春;吕井明
【作者单位】贵州理工学院
【正文语种】中文
【中图分类】X144
【相关文献】
1.基于ARIMA-SVM组合模型的创业板股票价格预测分析
2.基于ARIMA与线性回归组合模型的汽车销量预测分析
3.基于ARIMA模型和LSTM神经网络的全球气温预测分析
4.基于GM(1,1)-ARIMA组合模型的宁波港口物流需求预测分析
5.基于ARIMA-GM(1,1)组合模型的河南省卫生总费用及其构成预测分析
因版权原因,仅展示原文概要,查看原文内容请购买。
ARIMA和ARIMA-SVM组合模型在江苏省艾滋病发病预测中的应用ARIMA和ARIMA-SVM组合模型在江苏省艾滋病发病预测中的应用随着全球艾滋病问题的日益突出,各国对于艾滋病的防控工作也越加重视。
江苏省作为我国经济发达地区之一,其对于艾滋病疫情的监测与防控工作显得尤为重要。
艾滋病发病预测是疫情监测中的重要环节,可以为政府和相关机构提供参考,制定合理的防控策略。
本文将介绍ARIMA和ARIMA-SVM组合模型在江苏省艾滋病发病预测中的应用。
首先,我们需要了解ARIMA模型。
ARIMA模型是时间序列分析中常用的模型之一,它可以用来描述时间序列的内在规律和趋势。
ARIMA模型包含自回归(AR)、差分(I)和移动平均(MA)三个部分。
ARIMA模型的预测是基于历史数据的统计特征,可以预测未来一定时间内的趋势和波动。
在江苏省艾滋病发病预测中,我们可以利用ARIMA模型来建立艾滋病的发病模型。
首先,我们需要收集江苏省过去一段时间内的艾滋病发病数据,包括每月的新发病例数。
然后,我们可以对这些数据进行分析,观察其是否具有趋势和季节性。
如果数据存在趋势和季节性,我们可以对其进行差分处理,使其成为平稳序列。
接下来,我们可以选择合适的ARIMA模型,通过拟合历史数据来得到模型参数,并进行预测。
然而,ARIMA模型也存在一些缺点,比如对于非线性和复杂的数据模式,其预测效果可能并不理想。
为了克服这些问题,我们可以引入ARIMA-SVM组合模型。
SVM(支持向量机)是一种常用的机器学习算法,可以用于分类和回归问题。
ARIMA-SVM组合模型结合了ARIMA模型和SVM模型的优势,可以更准确地进行艾滋病发病预测。
在ARIMA-SVM组合模型中,我们首先利用ARIMA模型对艾滋病发病数据进行建模和预测,得到ARIMA预测值。
然后,我们将ARIMA预测值作为输入,利用SVM模型进行再次预测。
最终,我们可以得到ARIMA-SVM组合模型的预测结果,并与实际数据进行比较和评估。
电力系统中的电力负荷预测方法电力负荷预测是电力系统运行和调度中至关重要的一项任务。
准确的电力负荷预测有助于实现电力系统的平衡和稳定运行,同时也可以优化电力资源的调配和运行成本。
本文将介绍一些电力系统中常用的电力负荷预测方法,并探讨它们的优缺点以及适用场景。
一、传统时间序列模型1. ARIMA模型ARIMA模型是一种广泛使用的时间序列分析方法。
它基于历史负荷数据,通过拟合自回归(AR)、差分(I)和移动平均(MA)的线性组合来建立模型。
ARIMA模型常用于短期负荷预测,可以应对季节性和趋势性变化。
2. SARIMA模型SARIMA模型是ARIMA模型的拓展,增加了季节性调整。
在电力负荷预测中,许多季节性因素如节假日和天气条件都会影响负荷变化。
SARIMA模型可以更好地捕捉这些季节性影响,提高预测准确性。
二、机器学习方法1. 支持向量机(SVM)SVM是一种常用的机器学习方法,可以用于回归问题的负荷预测。
SVM通过将负荷数据映射到高维特征空间来寻找最优的超平面,从而进行负荷预测。
SVM具有较好的泛化能力和鲁棒性,适用于不同场景中的负荷预测。
2. 神经网络模型神经网络模型是一种基于深度学习的负荷预测方法。
通过构建多层神经元之间的连接,并使用大量的负荷数据进行训练,神经网络模型可以捕捉到更复杂的负荷变化规律。
它在长期和短期负荷预测中表现出色,并能自动发现和适应新的负荷模式。
三、混合方法1. 组合模型组合模型是将多个预测模型进行集成的方法。
通过将不同模型的预测结果进行加权融合,组合模型可以综合利用各个模型的优势,提高预测精度。
常见的组合方法包括加权平均和模型堆叠。
2. 智能优化算法智能优化算法如遗传算法、粒子群算法等可以结合传统时间序列模型或机器学习模型,通过调整模型参数以求得更好的负荷预测结果。
这些算法能够全局搜索最优解,并且具有一定的自适应能力。
总结起来,电力负荷预测方法可以从传统的时间序列模型、机器学习方法和混合方法三个方面进行探讨。
基于ARIMA模型的矿井灾害预测方法研究翟小伟;周翔;宋波波;郝乐【期刊名称】《煤炭技术》【年(卷),期】2024(43)6【摘要】矿井灾害频发是影响我国煤炭产业发展的重要问题之一,灾前预警技术是目前应对这一问题的主要方法。
为进一步提升矿井灾害监测预警能力,提出了基于ARIMA模型的矿井灾害预测方法研究。
通过确立灾害风险监测指标构建了安全态势评估指标体系,基于时序预测法建立了灾害预测评估模型,经模型定阶及训练等过程确定最佳ARIMA预测模型参数。
通过研究模型残差的正态性分布从而得到预测模型可靠度,将ARIMA(10,0,0)模型与时间序列拟合后进行自相关图和偏自相关图分析,得到了风险灾害未来短期预测结果;提出了“红橙黄蓝绿”5级灾害预警等级和准则,并进行了现场应用试验,结果证明,ARIMA模型对未来值的预测具有较高准确性,系统能及时对灾害进行预测和分级响应,可实现对矿井灾害的风险判别和预测预警。
【总页数】4页(P165-168)【作者】翟小伟;周翔;宋波波;郝乐【作者单位】西安科技大学安全科学与工程学院;西安科技大学陕西省煤火灾害防控重点实验室;陕西高校青年创新团队-矿山应急救援创新团队【正文语种】中文【中图分类】F126.1;TD7【相关文献】1.基于ARIMA乘积季节模型的矿井涌水量预测研究2.基于ARIMA-GRNN组合模型的中国交通伤死亡预测模型的方法学研究及公共政策分析3.基于ARIMA-GRU模型的地面沉降预测方法研究4.钨制品价格波动特征与预测方法应用研究——基于ARIMA-SVM-LSTM组合模型的分析5.基于XGBoost ARIMA方法的PM_(2.5)质量浓度预测模型的研究及应用因版权原因,仅展示原文概要,查看原文内容请购买。
第38卷第2期 计算机应用与软件Vol 38No.22021年2月 ComputerApplicationsandSoftwareFeb.2021基于ARIMA和LSTM混合模型的时间序列预测王英伟 马树才(辽宁大学经济学院 辽宁沈阳110036)收稿日期:2019-07-24。
王英伟,博士,主研领域:大数据,人工智能。
马树才,教授。
摘 要 由于现实中的时间序列通常同时具有线性和非线性特征,传统ARIMA模型在时间序列建模中常表现出一定局限性。
对此,提出基于ARIMA和LSTM混合模型进行时间序列预测。
应用线性ARIMA模型进行时间序列预测,用支持向量回归(SVR)模型对误差序列进行预测,采用深度LSTM模型对ARIMA模型和SVR模型的预测结果组合,并将贝叶斯优化算法用于选择深度LSTM模型的超参数。
实验结果表明,与其他混合模型相比,该模型在五种不同时间序列预测中能够有效提高预测精度。
关键词 ARIMA模型 SVR模型 深度LSTM模型 贝叶斯优化算法 时间序列预测中图分类号 TP302.7 文献标志码 A DOI:10.3969/j.issn.1000 386x.2021.02.047TIMESERIESFORECASTINGBASEDONARIMA_DLSTMHYBRIDMODELWangYingwei MaShucai(InstituteofEconomics,LiaoningUniversity,Shenyang110036,Liaoning,China)Abstract Becausereal worldtimeseriesusuallycontainbothlinearandnonlinearpatterns,traditionalARIMAmodelhasalimitedperformanceinthetimeseriesmodeling.Inviewofthis,weproposeARIMA_DLSTMhybridmodelfortimeseriesforecasting.LinearARIMAmodelwasusedfortimeseriespredictionfirstly,andthensupportvectorregression(SVR)wasusedforerrorseriesprediction.ThedeepLSTMmodelwasintroducedtocombinetheforecastsofARIMAmodelandSVRmodel,andBayesianoptimizationalgorithmwasadoptedtoobtaintheoptimalhyper parameterofdeepLSTMmodel.TheexperimentalresultsoffivetimeseriesforecastingshowthatARIMA_DLSTMmodelcaneffectivelyimprovethepredictionaccuracycomparedwithotherhybridmodels.Keywords ARIMAmodel SVRmodel DeepLSTMmodel Bayesianoptimizationalgorithm Timeseriesforecasting0 引 言时间序列预测在众多领域有广泛应用,如金融、经济、工程和航空等,并成为机器学习领域的重要研究课题[1]。
基于 SVM-ARIMA的大坝变形预测模型沈寿亮;刘天祥;宋锦焘;姜彦作;梁睿斌【期刊名称】《人民黄河》【年(卷),期】2014(000)005【摘要】大坝变形的实测值序列是一个非线性、非平稳的时间序列,支持向量机引入核函数后能有效解决非线性问题,因此可用支持向量机对大坝变形进行预测。
为了提高预测精度,进一步对残差序列进行分析,通过ARIMA模型对残差序列进行预测,建立了SVM-ARIMA组合模型。
将大坝变形时间序列分为趋势项和误差项,分别用SVM和ARIMA模型进行预测,综合两项结果得到模型的预测值。
结合实测资料对模型进行检验,结果表明组合模型精度较高。
【总页数】3页(P99-101)【作者】沈寿亮;刘天祥;宋锦焘;姜彦作;梁睿斌【作者单位】河海大学水文水资源与水利工程科学国家重点实验室,江苏南京210098; 河海大学水资源高效利用与工程安全国家工程研究中心,江苏南京210098; 河海大学水利水电学院,江苏南京210098;河海大学水文水资源与水利工程科学国家重点实验室,江苏南京210098; 河海大学水资源高效利用与工程安全国家工程研究中心,江苏南京210098; 河海大学水利水电学院,江苏南京210098;河海大学水文水资源与水利工程科学国家重点实验室,江苏南京210098; 河海大学水资源高效利用与工程安全国家工程研究中心,江苏南京210098; 河海大学水利水电学院,江苏南京210098;河海大学水文水资源与水利工程科学国家重点实验室,江苏南京210098; 河海大学水资源高效利用与工程安全国家工程研究中心,江苏南京210098; 河海大学水利水电学院,江苏南京210098;河海大学水文水资源与水利工程科学国家重点实验室,江苏南京210098; 河海大学水资源高效利用与工程安全国家工程研究中心,江苏南京210098; 河海大学水利水电学院,江苏南京210098【正文语种】中文【中图分类】TV698.1【相关文献】1.基于EEMD-LSTM-MLR的大坝变形组合预测模型 [J], 马佳佳;苏怀智;王颖慧2.基于贝叶斯优化LightGBM的大坝变形预测模型 [J], 高治鑫;包腾飞;李扬涛;王一兵3.基于FCM-XGBoost的大坝变形预测模型 [J], 杨晨蕾;包腾飞4.基于GP-XGBoost的大坝变形预测模型 [J], 徐韧;苏怀智;杨立夫5.基于小波分解的SVM-ARIMA农产品价格预测模型 [J], 曹霜;何玉成因版权原因,仅展示原文概要,查看原文内容请购买。
昆虫学报Ac t a En to m olog ic a Sinica,Sep te mb er 2010,53(9):1055-1060ISSN 0454 6296基金项目:湖南省教育厅科学研究资助项目(10C0803)作者简介:向昌盛,男,1971年生,湖南怀化人,博士研究生,副教授,研究方向为昆虫生物信息,E m ai:l cx5243879@sohu .co m 收稿日期Recei ved :2010 02 04;接受日期A ccepted :2010 07 05ARI M A 与S V M 组合模型在害虫预测中的应用向昌盛1,2,周子英3(1.湖南农业大学东方科技学院,长沙410128;2.湖南农业大学生物安全技术学院,长沙410128;3.湖南农业大学资源环境学院,长沙410128)摘要:害虫发生是一种复杂、动态时间序列数据,单一预测模型都是基于线性或非线性数据,不能同时捕捉害虫发生的线性和非线性规律,很难达到理想的预测精度。
本研究首先采用差分自回归移动平均模型对昆虫发生时间序列进行线性建模,然后采用支持向量机对非线性部分进行建模,最后得到两种模型的组合预测结果。
将组合模型应用到松毛虫D endroli m us punctat us 发生面积的预测,实验结果表明组合模型的预测精度明显优于单一模型,发挥了两种模型各自的优势。
组合模型是一种切实可行的害虫预测预报方法。
关键词:害虫;松毛虫;发生预测;时间序列;支持向量机;差分自回归移动平均模型中图分类号:Q968 文献标识码:A 文章编号:0454 6296(2010)09 1055 06Applicati on of AR I MA and S VM hybri d m odel i n pest forecastX I A NG Chang Sheng 1,2,Z HOU Zi Y i n g 3(1.Co llege of O ri e nt Science &Techno l o gy ,H unan Agricu ltural Un i v ersity ,Changsha 410128,Ch i n a ;2.B i o safety Science and Techno logy Co llege ,H unan Agricu ltural Un i v ersity ,Changsha 410128,Ch i n a ;3.College o f Resources &Environm en,t Hunan Agricu ltural Un i v ersity ,Changsha 410128,Chi n a)Abstract :The data of pest occurrence are co m plicated and unpr ed i c tab l e tm i e series .The li n ear or non linear features of pest tm i e seri e s ca n not be capt u red based on si n g l e predicti o n mode.l A ne w hybri d for ecasti n g m odel based on autoregressi v e i n tegrating m ov i n g average (AR I M A )and support vector m achi n e (SV M )is proposed i n this paper .AR I M A m ode lwas used to pr ed i c t t h e li n ear co mponent while SVM m odelwas used for the non li n ear resi d ual co m ponent of pest tm i e series ,and t h en the hybrid forecasti n g resu lts were obtained .The predicti o n perfor m ances of the method w ere tested on D endroli m us punct a tus occurrence area .The resu lts sho w that the hybrid mode,l wh i c h co mbines the respective advantages of both linear and non linearm odels ,has better accuracy tha n a ny si n gle mode.l H ybri d m odel is a good and effective method for pest forecasti n g .K ey w ords :Pest i n sects ;Dendroli m us punctatus ;occurrence fo recas;t ti m e series ;SVM;ARI M A m odel1 引言预测预报是害虫综合防治的重要组成部分,是一项监测害虫未来种群变动趋势的重要工作,也是有效地控制害虫发生发展的依据,它根据害虫种群过去和现在的变化规律、调查取样和气象预报等资料,借助统计学原理和方法,建立数学模型,分析害虫发生资料,研究其变化规律以及预报因子与预报对象之间关系,为综合控制害虫危害提供科学的依据。
基于ARIMA与SVR滚动残差模型组合的股票预测基于ARIMA与SVR滚动残差模型组合的股票预测1.引言股票预测一直是金融领域的重要课题之一。
准确地预测股票价格对于投资者制定合理的投资策略、降低风险以及获得良好的收益至关重要。
随着数据分析和机器学习的迅速发展,基于统计模型的股票预测方法受到了广泛关注。
2.ARIMA模型与SVR模型简介2.1 ARIMA模型ARIMA(自回归积分滑动平均模型)是一种经典的时间序列预测模型,广泛应用于金融市场的预测中。
ARIMA模型基于对时间序列的自回归(AR)和滑动平均(MA)部分的建模,通过时间序列的差分来处理非平稳性,从而达到对未来趋势的预测。
2.2 SVR模型支持向量回归(Support Vector Regression,SVR)是基于支持向量机(Support Vector Machine,SVM)理论的回归模型。
SVR通过找到一个最优超平面,使得样本点到该超平面的函数间隔最小,并且在给定的容错范围内尽可能将样本点分布在超平面两侧。
SVR适用于非线性问题,能够处理高维数据。
3.基于ARIMA与SVR滚动残差模型组合的思路传统的投资策略一般是基于技术分析和基本面分析,但这些方法对于不同市场环境的适应性较差。
因此,我们提出了一种基于ARIMA与SVR模型组合的股票预测方法。
具体思路如下:(1)首先,使用ARIMA模型对股票价格时间序列进行建模和预测,得到初始预测值。
(2)接下来,将ARIMA模型的预测残差作为SVR模型的输入特征,以及对应的实际股票价格作为输出标签,训练SVR模型。
(3)使用训练好的SVR模型对未来一段时间的股票价格进行预测,得到SVR模型的预测值。
(4)最后,将ARIMA模型的初始预测值与SVR模型的预测值进行组合,得到最终的股票价格预测结果。
4.实验设计与结果分析我们选取了某A股股票的历史交易数据作为实验数据,使用Python编程语言实现了基于ARIMA与SVR滚动残差模型组合的股票预测方法,并与传统的ARIMA模型进行了比较。
ARIMA与SVM混合模型在害虫预测中的应用向昌盛1,周子英2,武丽娜2(1. 湖南农业大学东方科技学院,长沙410128;2. 湖南农业大学资源环境学院,长沙410128)摘要:害虫发生是一种复杂且难以预测的时间序列数据,传统预测方法都是基于线性模型,忽略了害虫发生的非线性因子,导致预测精度不高。
本研究用ARIMA模型对昆虫发生时间序列进行线性建模,然后采用SVM对昆虫发生时间序列的非线性部分进行建模,最后得到两种模型的综合预测结果。
将组合模型应用到松毛虫发生面积的预测,实验结果表明该组合模型相对于单模型的预测具有更高的精度,发挥了2种模型各自的优势。
关键词:支持向量机;害虫;预测;时间序列中图分类号:S763.3 S431 文献标识码: AApplication in Pest Forecasting Based on ARIMA and SVM Hybrid ModelXiang Chang-sheng1, Zhou Zi-ying2, Wu Li-na2(1. College of Orient Science & Technology, Hunan Agricultural University, Changsha, Hunan, 410128;2. College of Resources & Environment, Hunan Agricultural University, Changsha, Hunan, 410128) Abstract:The data of pest occurrence is complicated and unpredictable time series, the nonlinear factor of pest time series often overlooked in tradition prediction. A new hybrid forecasting model based on ARIMA and SVM is proposed in this paper, ARIMA model was used to predict the linear component while SVM model for the nonlinear residual component of pest time series, then the hybrid forecasting results is obtained. The prediction performances of the method are tested on Dendrolimus punctatus occurrence, the results show that the hybrid model, which takes advantage of the unique strength of the two models in linear and nonlinear modeling, has better accuracy than the single model.Key words: support vector machines; pest; forecast; time series1 前言害虫预测预报是害虫综合防治的重要组成部分,是一项监测害虫未来种群变动趋势的重要工作,也是有效地防治和控制害虫发生发展的依据,它根据害虫种群过去和现在的变化规律、调查取样和气象预报等资料,借助统计学原理和方法,建立数学模型,分析害虫发生资料,研究其变化规律以及预报因子与预报对象之间关系,然后进行预报。
近年来许多学者应用时间序列分析方法研究害虫种群动态变化并进行预测分析[],最具代表性的时间分析方法为差分自回归移动平均(autoregressive integrating moving average,ARIMA),ARIMA模型极具弹性,融合了时间序列分析和回归分析的优点,由于害虫的发生是受到多种因素的影响的,是一种非常复杂的自然现象,其发生在空间上既有全域性又有区域性,在时间上又表现出无序的不稳定性、有序的规律性和周期性,这样基于线性模型的ARIMA无法捕捉害虫发生过程中的非线性数据的信息,从而导致预测精度不高[1]。
80年代以来,非线性的神经网络算法产生,为害虫发生的预测预报的深入研究开拓了新的空间[2-4],然而神经网络是基于经验风险最小化原则,要求数据样本大,但实际的昆虫历史数据属于小样本数据,往往不能满足大样本这一要求,所以在预测过程中容易出现结果过拟合、泛化能力不强等现象。
基于结构风险最小化的支持向量机(Support Vector Machines ,SVM ),是一种新的机器学习方法,较好地解决了小样本、非线性、过拟合、维数灾和局极小等问题,且泛化推广能力优异,在病虫害预测领域里取得了不错的预测结果[5]。
基于著名的M-竞争理论[6],为了有效地利用各种模型的优点,一些学者利用组合预测方法来进行时间序列预测研究[7,8],实证结果表明,相对于单个的各种模型,组合模型大大提高了预测精度,表明组合预测模型能够较大限度地利用各种预测样本信息,比单个预测模型考虑问题更系统、更全面,因而能够有效地减少单个预测模型过程中存在的环境因素的影响,从而提高了预测的精度。
目前,通过ARIMA 和SVM 组合预测方法进行害虫发生预测还鲜有文献报到,本研究提出了一种基于ARIMA 和SVM 组合模型的害虫发生预测新方法—ARIMA-SVM 。
ARIMA 模型描述历史数据的线性关系,SVM 捕捉数据的非线性规律,对辽宁朝阳市松毛虫发生面积进行仿真实验,来验证ARIMA-SVM 模型的有效性和可行性。
2ARIMA 和SVM 的概述2.1 ARIMA 模型时间序列分析是处理动态数据的一种有效的参数化时域分析方法,ARIMA 是一种精确度较高的线性时间序列预测方法,是20世纪70年代美国学者鲍克斯·乔瑞(Georage Box)和英国统计学家詹肯·格威勒姆(Gwilym Jenkins)所建立的鲍克斯-詹姆(B-J)方法的进一步发展和改进[9],它把回归分析应用于时间序列,又不同于通常因果分析中的普通最小二乘法。
ARIMA 模型预测方程可以表示为:011121122(1)k yk yk pyk p k k k q k qy θϕϕϕεθεθεθε------=+++++----式中:k y 为样本值;(1,2,,)i i p ϕ= 和(1,2,,)j j q θ= 为模型参数;k ε为随机误差,它的均值为0。
ARIMA 时间序列预测的建模过程如下:(1)样本平稳化处理:建立ARIMA 模型要求时间序列是平稳随机过程,因此在建模之前必须检验时间序列数据的平稳性,如果数据序列是非平稳的,如存在一定的增长或下降趋势等,则需对数据进行差分处理;(2)模型定阶:ARIMA(p ,d ,q)模型定阶的方法主要有4种:样本自相关函数(Auto Correlation Function ,ACF)和偏自相关函数(Partial Auto Correlation Function ,PACF)定阶法、最小化最终预测误差(Final Prediction Error ,FPE)法、最小艾卡信息量准则(Aikake Information Criterion ,AIC)以及艾卡信息量修正准则(Aikake InformationCorrected Criterion ,AICC);(3)模型检验:在进行定阶和参数估计后,对所建立的模型适用性进行检验,若模型误差是白噪声,则建模获得通过,否则需要重新进行定阶和参数估计;(4)预测:对平稳化的时间序列进行预测。
2.2 SVM 原理根据给定K 个样本数据集{(, ), =1, 2, , },i i x y i k k 为样本个数,回归算法[10]的基本思想是通过一个非线性映射Φ,将数据i x 映射到高维特征空间F ,并在这个空间进行线性回归,具体表现形式如下:()T ()x b(2)f x ω=Φ+式中ω为超平面的权值向量,b 为偏置量。
回归估计通常采用在训练集上最小化经验风险得到,所使用的损失函数有平方误差和绝对值误差等形式,但支持向量机使用一种新的损失函数形式,称之为ε不敏感损失函数(ε-insensitive cost function )。
ε可用下式描述:|()||()|((),)(3)0|()|i i i i i i i i f x y f x y l f x y f x y εεεε---≥⎧=⎨-<⎩为了使训练集上获得的回归模型具有更好的推广能力,不但要考虑经验风险的最小化,同时还要设法降低模型的复杂度。
在这种理念指导下,SVR 回归实际上就是求解一个优化问题:**,,,11min ()(4)2i i lTi i w b i c ξωωξξ==++∑ 约束条件如下:**1,,(5)0,0i i ii i i i i y w x b w x b y i k εξεξξξ-⋅-≤+⎧⎪⋅+-≤+=⎨⎪≥≥⎩式中i ξ、*i ξ为松弛变量,分别表示在误差ε约束下()()Ti i f x x b ω-Φ+()的训练误差的上限和下限;ε为回归允许的最大误差,控制支持向量的个数和泛化能力,其值越大,支持向量越少;c 为一正常数,是函数回归模型的复杂度和样本拟合精度之间的折衷,其值越大,拟合程度越高;这样相应支持向量回归估计函数为:*1()()()(6)li i i i f x a a k x x b==--+∑由于任意满足泛函Mercer 条件的对称函数均可作为核函数,但是对于特定的问题,如何选择最合适的核,一直是困扰研究者的一个难点,针对此问题,很多研究和实验表明[11],当缺少过程的先验知识时,选择高斯核函数比选择其它核函数效果好。
本研究核函数采用高斯核函数,高斯核函数定义如下:221(,)exp()(7)||||i i k x x x x δ-=-回归函数变为:*2211()()exp()(8)||||li i i i f x a a bx x δ=-=-+-∑其中l 为支持向量数,i x 为作为支持向量的样本子向量,x 为待预测因子向量,i a ,*i a ,b 为建立SVM 模型待确定的系数,δ为核参数的宽度。
3ARIMA-SVM 模型3.1 ARIMA-SVM 原理大量研究表明,害虫发生系统是一个动态复杂系统,害虫灾害发生具有不均匀性、差异性、多样性、突发性、随机性、可预测性和规律性等复杂性的特点。