基于粗糙集的粮食产量组合预测模型
- 格式:pdf
- 大小:175.59 KB
- 文档页数:4
精细化农业中粮食产量预测模型的研究粮食产量预测对于精细化农业的发展非常重要。
通过精确地预测粮食产量,农民可以做出更好的决策,优化种植方案,合理分配资源,并最大化农田的产出。
这样的预测还可以帮助政府和企业做出合理的供需规划,确保粮食市场的稳定和可持续发展。
因此,研究精细化农业中粮食产量预测模型是当今农业科学的重要课题之一。
粮食产量预测模型要考虑的因素众多,包括气象条件、土壤质量、农作物品种、病虫害影响等。
为了提高粮食产量预测的准确性和可靠性,研究者们采用了多种数据分析和机器学习技术。
以下将介绍几种常用的精细化农业中粮食产量预测模型。
1. 多元线性回归模型多元线性回归模型是一种常见的统计方法,用于分析连续因变量和多个自变量之间的线性关系。
在粮食产量预测中,可以将产量作为因变量,而气象数据、土壤性质和农作物品种等作为自变量。
通过对历史数据进行回归分析,可以建立一个预测模型。
然而,多元线性回归模型的可靠性和准确性受限于建模时所选取的自变量,需要根据具体情况进行适当的选择。
2. 时间序列模型时间序列模型是一种将时间因素考虑在内的预测方法。
对于粮食产量预测,时间序列模型可以考虑历史产量数据的趋势、季节周期和周期性波动等因素来进行预测。
常见的时间序列模型包括ARIMA模型、指数平滑模型和季节性分解模型。
这些模型可以根据历史数据进行参数拟合,并预测未来一段时间内的粮食产量。
然而,时间序列模型对数据的平稳性和周期性有一定的要求,需要对数据进行预处理和调整。
3. 人工神经网络模型人工神经网络模型是一种模拟人类神经系统的计算模型,广泛应用于各个领域的预测和优化问题。
在精细化农业中,人工神经网络模型可以通过对大量的产量数据和相关因素进行训练,从而预测未来的产量。
人工神经网络模型具有良好的非线性拟合能力和适应性,可以自动学习数据之间的复杂关系。
然而,人工神经网络模型的训练和调整过程相对复杂,需要大量的数据和计算资源。
4. 集成模型为了进一步提高粮食产量预测的准确性,研究者们还尝试了不同模型的集成。
樊㊀超ꎬ郭亚菲ꎬ曹培格.基于小波变换的GM(1ꎬ1)-ARIMA组合模型对粮食产量的预测[J].江苏农业科学ꎬ2019ꎬ47(1):221-224.doi:10.15889/j.issn.1002-1302.2019.01.053基于小波变换的GM(1ꎬ1)-ARIMA组合模型对粮食产量的预测樊㊀超ꎬ郭亚菲ꎬ曹培格(河南工业大学信息科学与工程学院ꎬ河南郑州450001)㊀㊀摘要:为提高粮食产量的预测精度ꎬ针对粮食产量的数据特点ꎬ提出了在小波变换的基础上ꎬ结合GM(1ꎬ1)模型与ARIMA模型的优点ꎬ建立GM(1ꎬ1)-ARIMA组合预测模型ꎮ首先ꎬ通过小波变换对非平稳序列进行分解ꎬ得到近似分量和细节分量ꎻ针对各分量序列的不同特征ꎬ采用灰色GM(1ꎬ1)模型对近似分量进行趋势预测ꎬ为进一步提高趋势信号的预测精度ꎬ使用灰色GM(1ꎬ1)模型对预测序列进行残差修正ꎻ然后ꎬ采用ARIMA预测模型对分离出的细节分量进行预测ꎻ最后ꎬ通过小波重构得到粮食产量的预测值ꎮ预测结果表明ꎬ基于小波变换的GM(1ꎬ1)-ARIMA模型的拟合平均误差为0.69%ꎬ通过对2011 2014年粮食产量的预测ꎬ其预测平均误差低于1%ꎬ为粮食产量预测提供了一种新的技术途径ꎮ㊀㊀关键词:粮食产量ꎻ预测ꎻ小波分析ꎻGM(1ꎬ1)模型ꎻARIMA模型㊀㊀中图分类号:S126㊀㊀文献标志码:A㊀㊀文章编号:1002-1302(2019)01-0221-04收稿日期:2017-09-06基金项目:河南省科技攻关项目(编号:162102210198)ꎻ国家粮食公益项目(编号:201413001)ꎻ河南省自然科学基金(编号:162300410062)ꎮ作者简介:樊㊀超(1976 )ꎬ男ꎬ河南郑州人ꎬ博士ꎬ副教授ꎬ研究方向为粮食信息处理ꎮE-mail:anfan2003@163.comꎮ㊀㊀粮食作为一种特殊的商品备受人们关注ꎬ它的产量始终是一个国家经济发展的大问题ꎬ粮食丰收为经济平稳发展和社会的和谐与稳定提供了有力支撑ꎮ预测粮食产量的变化趋势对国家粮食安全㊁政策宏观调控有着重要意义ꎬ因此粮食产量的预测显得尤为重要ꎮ粮食产量预测历来受到各国政府和学者的普遍关注ꎬ目前主要采用遥感技术预测法㊁气象产量预测法[1]㊁动力学生长模拟法㊁元回归分析法和神经网络预测法等预测模型[2-3]ꎮ然而大量研究表明ꎬ粮食产量是一个动态㊁非线性复杂系统ꎬ具有随机性和突变性的特点ꎬ因此难以建立准确的数学模型ꎮ采用这些传统预测方法均存在一些不足ꎬ如所需数据量大㊁预测周期短等ꎬ并且传统的单一模型只能描述粮食产量的片段信息ꎬ不能较详细地描述其变化规律ꎬ导致粮食产量预测与实际值之间差距较大ꎮ传统GM(1ꎬ1)模型能较准确地反映序列的增长趋势ꎬ但在处理变化跳跃性较大的非平稳数据时ꎬ易产生较大误差ꎻ而传统ARIMA模型虽然能够较好地反映序列的随机波动因素ꎬ但会出现数据丢失和精度降低的问题ꎮ针对以上情况ꎬ本研究将小波变换应用到时间序列分析之前ꎬ提出了基于小波变换的GM(1ꎬ1)-ARIMA的组合预测模型ꎬ采用小波分解将原始数据分解为低频近似信号和高频细节信号ꎻ采用GM(1ꎬ1)处理低频平稳信号ꎬ采用ARIMA模型处理高频细节信号ꎮ最后将各级预测值进行叠加ꎬ从而得到最终的产量预测值ꎮ预测结果表明ꎬ该模型能够较好地反映粮食产量的变化特征ꎬ预测精度高于单一传统预测模型ꎬ使得粮食产量预测结果更加准确ꎮ1 原理及方法1.1㊀GM(1ꎬ1)模型简介GM(1ꎬ1)模型是对原始序列进行一次累加生成ꎬ使生成的数据序列呈现一定规律ꎬ然后通过建立一阶微分方程模型ꎬ求得拟合曲线[4]ꎮ其建模如下:(1)设时间序列模型有n个观测值:X(0)=[X(0)(1)ꎬX(0)(2)ꎬ ꎬX(0)(n)]ꎮ(1)㊀㊀(2)通过累加生成新序列:X(1)=[X(1)ꎬX(1)(2)ꎬ ꎬX(1)(n)]ꎮ(2)㊀㊀(3)对序列X(1)进行微分运算得:dX(1)dt+aX(1)=bꎮ(3)式中:a为发展灰度ꎬb为内生控制系数ꎮ令a^=(a/b)ꎬa^为待估参数向量ꎬ用最小二乘法对其求解ꎬ得预测模型:X(1)(k+1)=X(1)(0)-ba[]e-ak+ba(k=1ꎬ2ꎬ ꎬn)ꎮ(4)1.2㊀ARIMA模型简介将AR和MA模型进行组合ꎬ便构成了用于描述平稳随机过程的自回归滑动平均(ARMA)模型ꎬARIMA(pꎬdꎬq)模型是指时间序列d阶差分后自相关系数最高阶为pꎬ移动平滑系数最高阶为qꎬ其实质就是ARMA模型与差分运算的组合[5-6]ꎬ其数学表达式为:㊀㊀yt=φ1yt-1+φ2yt-2+ +φpyt-p+φt-θ1φt-1-θ2φt-2- -θqφt-qꎮ(5)式中:p为自回归模型阶数ꎻq为滑动平均模型的阶数ꎻφi(i=1ꎬ2ꎬ ꎬp)㊁θj(j=1ꎬ2ꎬ ꎬq)为模型的待定系数ꎻφi为残差ꎻyt122 江苏农业科学㊀2019年第47卷第1期为观测值ꎮ引入向后时移算子Bꎬ定义Biyt=yt-1ꎬ上式可以简写为:Φ(B)yt=Θ(B)φtꎮ(6)式中:Φ(B)和Θ(B)分别为m和n阶多项式:Φ(B)1-a1B- -amBmΘ(B)=1-b1B- -bnBn}ꎮ(7)1.3㊀小波变换小波变换是对傅里叶变换的一种延伸与补充ꎬ它采用正交基对信号进行分解[7-10]ꎬ离散小波变换由一系列参数组成ꎮcj(k)=<Xꎬφjt(t)>ꎻdj(k)=<Xꎬψjk(t)>ꎮ(8)式中:cj(k)为近似分量ꎻdj(k)为细节分量ꎻjꎬkɪZꎻ尺度函数φjt(t)由母小波φt通过平移与伸缩后得到ꎮφjk=2-j/kφ(2-jt-k)ꎮ(9)㊀㊀φjk(t)是一个低通滤波器ꎬ可分离出信号中的低频成分ꎮ本研究使用Mallat算法进行小波多尺度分解ꎬ将aj看作待分解的序列ꎬ根据分解算法有:aj+1=Hajdj+1=Gdj{ꎬj=0ꎬ1ꎬ2ꎬ ꎬnꎬnɪNꎮ(10)式中:H和G分别为低通滤波器和高通滤波器ꎬN为自然数ꎮMallat算法可以将信号逐层分解ꎬ每一层分解的结果是将上层分解得到的低频信号再分解成低频和高频两部分ꎮ最终分解为一个低频的近似分量和若干高频细节分量ꎮ近似分量反映了原始序列的变化趋势ꎬ细节分量反映了原序列发生扰动的动态因素ꎮ分解后的序列重构算法为:aj-1=ajH∗+djG∗ꎬj=0ꎬ1ꎬ2ꎬ ꎬnꎮ(11)式中:H∗和G∗分别为H和G的对偶算子ꎮ小波变换在处理非平稳序列时ꎬ不同的基函数和阶数得到的处理效果不同ꎬ根据粮食产量数据序列的特点ꎬ本研究采用db5小波对原始产量序列进行3层分解ꎮ2㊀基于小波变换的GM(1ꎬ1)-ARIMA预测模型的建立由于粮食产量序列具有复杂性㊁随机性和非平稳性等特点ꎬ导致使用传统的预测方法对其进行预测时会受到很大的影响和制约ꎮ本研究提出了基于小波变换的GM(1ꎬ1)-ARIMA组合预测方法ꎬ模型原理如图1所示ꎮ㊀㊀本研究选取1977 2010年的中国粮食产量数据为拟合数据ꎬ选取2011 2014年的数据用于预测ꎮ图2是19772010年的粮食产量数据ꎬ可以看出中国粮食总产量为非平稳序列ꎬ波动较大ꎮ2.1㊀小波分解若直接对原始序列进行预测ꎬ则不能有效提取序列中的确定性信息ꎬ因此对原始数据进行小波多尺度分解ꎬ如图3所示ꎮ㊀㊀其中ꎬA是原始序列的近似序列ꎬ反映了数据的大趋势ꎻc1㊁c2和c3是原始序列的细节序列ꎬ反映了序列的细小波动ꎮ分解后的各序列波形如图4和图5所示ꎮ由此可见ꎬ趋势信号变化较为平稳ꎬ反映了原始序列的总体变化趋势ꎬ因此采用灰色GM(1ꎬ1)模型进行预测ꎬ而细节序列的随机性较强ꎬ不具有规律性ꎬ因此采用ARIMA模型对其进行预测ꎮ2.2㊀基于GM(1ꎬ1)模型的趋势序列预测模型的建立GM(1ꎬ1)模型预测的实质是以指数型曲线去拟合原始数据ꎬ由图4可知ꎬ经过小波分解后得到的低频近似序列表现为一条较平滑的曲线ꎬ可更好地发挥GM(1ꎬ1)模型的优势ꎮ对低频近似序列建立灰色GM(1ꎬ1)预测模型ꎬ此时得到预测曲线和原始曲线的拟合结果如图6所示ꎮ㊀㊀从图6可以看出ꎬ灰色GM(1ꎬ1)预测模型能够较为准确地反映序列的递增趋势ꎮ进一步对所构建的模型进行检验ꎬ相对误差的计算公式为:e=A(0)(k)-A^(k)A(0)(k)ˑ100%ꎬk=1ꎬ2ꎬ ꎬnꎮ(12)222 江苏农业科学㊀2019年第47卷第1期式中:A(0)(k)表示经小波分解出的趋势序列在k时刻的实际值ꎻA^(k)表示在k时刻经GM(1ꎬ1)模型预测的预测值ꎮ经测算发现ꎬ对低频近似序列建立灰色GM(1ꎬ1)模型ꎬ所得的模型拟合值与实际值相对误差平均值为1.75%ꎮ为了进一步提高预测精度ꎬ本研究在此基础上对近似序列的预测值进行残差修正ꎮ为了进一步提高预测精度ꎬ本研究在此基础上对近似序列的预测值进行残差修正ꎮ获取趋势序列的残差值ꎬ对残差序列重新建立GM(1ꎬ1)模型并得到残差预测值ꎮ具体方法如下:利用趋势序列的原始数据A(0)与其经过GM(1ꎬ1)建模所得的预测序列A^(0)之差作为残差序列ꎬ即:E(0)(k)=A(0)(k)-A^(0)(k)ꎬk=1ꎬ2ꎬ ꎬnꎮ(13)㊀㊀利用灰色模型建模方法ꎬ得到残差序列E(0)的GM(1ꎬ1)预测模型E^(1):E^(1)(k+1)=E(0)(1)-bεaε[]e-aεk+bεaεꎬk=1ꎬ2ꎬ ꎬnꎮ(14)式中:aε为发展灰度ꎬbε为内生控制系数ꎮ最后将残差修正模型与趋势预测模型相加ꎬ得到修正后的预测模型A^(1)ꎬ即:A^(1)=A^(0)+E^(1)ꎮ(15)㊀㊀经残差修正后的模型ꎬ其拟合值和原始值的相对误差平均值降为1.02%ꎬ预测精度得到了较好的改善ꎮ2.3㊀基于ARIMA模型的细节序列预测模型的建立ARIMA模型可以描绘一个随机变化的动态系统ꎬ根据状态之间的连续性确定系统的未来发展趋势ꎬ经小波分解后的高频细节信号具有随机性(图5)ꎬ因此适用于ARIMA模型描述ꎮ对细节序列C1㊁C2和C3选用一阶差分ꎬ分别进行ARIMA(pꎬ1ꎬq)预测ꎮ以细节序列C1为例ꎬ建立它的ARIMA预测模型ꎬ步骤如下:对细节序列C1进行一阶差分后ꎬ首先利用Box-Jenkins模型法进行初步识别ꎬ该方法是根据样本的自相关函数㊁偏相关函数统计特性初步判断序列所适应的模型类型ꎮ图7为细节序列C1的自相关函数和偏相关函数ꎬ从图中可以看出自相关函数和偏相关函数均具有拖尾性ꎬ符合ARIMA模型ꎮ然后采用赤池信息(AIC)来确定模型的阶数ꎬ该准则运用式(16)的统计量来评价模型的好坏:AIC=-2L/n+2K/nꎮ(16)式中:L是对数似然值ꎬn是观测值数目ꎬK是被估计的参数个数ꎮK越小意味模型越简洁ꎬL越大意味着模型越精确ꎮ因此ꎬAIC准则要求其越小越好ꎬ取其最小统计量所对应的阶数建立模型ꎮ经测算当p=2ꎬq=3时的AIC值最小ꎬ从而确定模型形式为ARIMA(2ꎬ1ꎬ3)ꎮ利用模型对数据进行拟合得到图8ꎬ可知ARIMA(2ꎬ1ꎬ3)模型能较好地描述原序列的波动趋势ꎬ可用于对细节序列C1的趋势预测ꎮ细节序列C2㊁C3的ARIMA模型的建立方法与C1类似ꎬ在此不再赘述ꎮ3 试验及分析基于1977 2010年粮食产量数据ꎬ分别使用GM(1ꎬ1)预测模型和本研究提出的基于小波变换的GM(1ꎬ1)-ARIMA预测模型对我国粮食产量建立预测模型ꎬ所得模型的拟合误差如图9所示ꎮ322江苏农业科学㊀2019年第47卷第1期㊀㊀由图9可以得到以下2点结论:(1)相对于单一的GM(1ꎬ1)模型ꎬ本研究所提出的模型具有更小的预测误差ꎮ通过计算ꎬ本研究算法的平均拟合误差为0.69%ꎬ而GM(1ꎬ1)模型的平均拟合误差为1.72%ꎬ相比而言ꎬ由于ARIMA模型更注重于描述随机细节的变化ꎬ而粮食产量虽然受到很多因素的随机干扰ꎬ但其总体变化具有很强的趋势性ꎬ故此ꎬ使用单一的ARIMA模型的预测误差最大ꎮ由此可见ꎬ本研究算法在反映粮食产量趋势变化的同时充分考虑随机因素的影响ꎬ因此算法的拟合误差明显减小ꎬ拟合精度较高ꎻ(2)相比于单一GM(1ꎬ1)模型ꎬ本研究所提算法的拟合误差变化范围较小ꎮ例如ꎬ本研究算法的拟合误差变化范围为0.12%~1.2%ꎬ而GM(1ꎬ1)模型的拟合误差范围为0.1%~2.6%ꎬARIMA模型的拟合误差范围为3.73%~8.9%ꎮ因此ꎬ本研究所用方法的预测误差变化幅度更小ꎬ算法具有更高的预测稳定性ꎮ在此基础上ꎬ利用上述2个模型对我国2011 2014年的粮食产量进行预测ꎬ预测结果如表1所示ꎮ从表1的预测指标可以看出ꎬ基于小波变换的GM(1ꎬ1)-ARIMA预测模型4年平均预测误差低于1%ꎬ预测精度明显优于灰色GM(1ꎬ1)预测模型ꎬ其预测精准度的提高在于粮食产量受到各种因素影响而呈现随机性㊁复杂性和非平稳性ꎬ通过小波分解重构可得到近似分量和细节分量ꎬ针对近似分量和细节分量的不同特性采取合适的预测模型进行预测ꎬ这样既能够更好地凸显灰色GM(1ꎬ1)模型处理平稳序列的能力ꎬ又能够发挥ARIMA模型对细节信息描述的优点ꎮ本研究所提方法能够更好地适应粮食产量序列ꎬ预测结果更加可靠㊁准确ꎮ表1㊀2011 2014年粮食产量预测年份实际粮食产量(万t)GM(1ꎬ1)模型ARIMA模型本研究算法预测值(万t)误差(%)预测值(万t)误差(%)预测值(万t)误差(%)201157120555682.7547894.3577241.0201258958563314.4540908.2593140.6201360194571055.15384810.4604380.4201460703578894.65430510.5614241.14㊀结论粮食安全事关国家的经济实力和社会保障能力ꎬ粮食产量的准确预测对于经济社会的全面健康发展和社会稳定具有重要意义ꎮ考虑到粮食产量受多种因素影响ꎬ波动大ꎬ呈高度非线性的特点ꎬ本研究利用小波分解对原始粮食产量序列进行分解重构ꎬ有效地将那些突变分解出来ꎬ提高了数据稳定性ꎻ分离出的低频近似信号能较准确地反映粮食产量的趋势ꎬ表现为一条较平滑的曲线ꎬ采用灰色GM(1ꎬ1)模型进行建模ꎬ可以更好地发挥GM(1ꎬ1)预测模型的优势ꎻ细节信号随机性波动较大ꎬ具有短相关非平稳的特征ꎬ因此利用ARIMA模型进行预测ꎮ近似分量与细节分量的预测值经过组合叠加得到最终的粮食产量预测值ꎮ本研究提出的基于小波变换的GM(1ꎬ1)-ARIMA模型的组合预测模型ꎬ能够充分利用历史数据赋予的信息ꎬ不仅能反映出粮食产量的发展趋势ꎬ而且可以较好地反映出粮食产量的变化特征ꎬ有效提高了粮食产量的预测精度ꎬ为粮食产量的短期预测提供了有益的技术参考ꎮ参考文献:[1]王建林ꎬ王宪彬ꎬ太华杰.中国粮食总产量预测方法研究[J].气象学报ꎬ2000ꎬ58(6):738-744.[2]丁晨芳.组合模型分析方法在我国粮食产量预测中的应用[J].农业现代化研究ꎬ2007ꎬ28(1):101-103.[3]何延治.基于时间序列分析的吉林省粮食产量预测模型[J].江苏农业科学ꎬ2014ꎬ42(10):478-479.[4]候彦林ꎬ郑宏艳ꎬ刘书田ꎬ等.粮食产量预测理论㊁方法及应用[J].农业资源与环境学报ꎬ2014ꎬ31(3):205-211. [5]樊㊀超ꎬ杨㊀静ꎬ杨铁军ꎬ等.基于小波变换的灰度模型-人工神经网络(GM-ANN)组合的粮食产量预测模型[J].江苏农业科学ꎬ2016ꎬ44(12):390-393.[6]樊㊀超ꎬ郭亚菲ꎬ曹培格ꎬ等.基于主成分分析的粮食产量极限学习机预测模型研究[J].粮食加工ꎬ2017ꎬ42(2):1-5. [7]田中大ꎬ李树江ꎬ王艳红ꎬ等.基于小波变换的风电场短期风速组合预测[J].电工技术学报ꎬ2015ꎬ30(9):112-120. [8]何一韬ꎬ朱永忠.改进小波-ARMA分频模型在径流预测中的应用[J].云南民族大学学报(自然科学版)ꎬ2016ꎬ25(2):145-151.㊀[9]赵建忠ꎬ徐廷学ꎬ李海军ꎬ等.基于小波分析的导弹装备备件需求组合预测[J].电子学报ꎬ2014ꎬ42(3):417-423.[10]李㊀祥ꎬ彭㊀玲ꎬ邵㊀静ꎬ等.基于小波分解和ARMA模型的空气污染预报研究[J].环境工程ꎬ2016ꎬ34(8):110-114.422 江苏农业科学㊀2019年第47卷第1期。
粗糙集理论的模型构建方法及其预测性能评估引言:粗糙集理论是一种基于不完全信息的数据分析方法,它可以处理不确定性和模糊性问题,并在决策和预测中发挥重要作用。
本文将介绍粗糙集理论的模型构建方法以及如何评估其预测性能。
一、粗糙集理论的模型构建方法1. 粗糙集理论的基本概念粗糙集理论最基本的概念是等价关系和上近似集、下近似集。
等价关系是指在给定条件下,某个对象的属性值相同,上近似集是指在给定条件下,某个对象的属性值不确定,下近似集是指在给定条件下,某个对象的属性值确定。
通过等价关系和近似集,可以对数据进行粗糙划分。
2. 特征选择特征选择是粗糙集理论中的一个重要步骤,它通过选择最重要的特征来减少数据集的维度。
特征选择可以基于信息增益、相关性等指标进行,选取具有较高区分度的特征。
3. 粗糙集约简粗糙集约简是指通过删除冗余的属性,减少数据集的复杂性,提高数据处理的效率。
约简的目标是找到最小的等价类,使得约简后的数据集仍能保持原始数据集的重要信息。
4. 粗糙集分类模型构建粗糙集分类模型构建是通过学习已知类别的样本,建立一个分类模型,用于对未知类别的样本进行分类。
常用的分类算法有基于规则的分类算法、基于决策树的分类算法等。
二、粗糙集理论的预测性能评估1. 交叉验证交叉验证是一种常用的评估粗糙集模型性能的方法。
它将数据集划分为训练集和测试集,通过训练集训练模型,再通过测试集评估模型的预测性能。
常见的交叉验证方法有k折交叉验证、留一交叉验证等。
2. ROC曲线ROC曲线是一种评估分类模型性能的图形化方法。
它以真正例率(True Positive Rate)为纵轴,假正例率(False Positive Rate)为横轴,通过绘制不同阈值下的真正例率和假正例率,可以评估模型在不同阈值下的预测性能。
3. 混淆矩阵混淆矩阵是一种评估分类模型性能的表格方法。
它以实际类别和预测类别为行列,通过统计真正例、假正例、真负例、假负例的数量,可以计算出模型的准确率、召回率、F1值等指标。
组合预测模型在东北地区粮食产量预测中的应用组合预测模型在东北地区粮食产量预测中的应用采用最优加权方法,建立了基于灰色预测模型、灰色马尔科夫预测模型及逻辑斯蒂预测模型的组合模型;并根据东北地区1949-2008年粮食产量资料,利用组合模型预测了该地区未来10年的粮食产量.结果得到,灰色预测、马尔科夫预测、逻辑斯蒂预测和组合预测方法的预测粮食产量的平均相对百分误差分别为:12.74%,3.02%,13.29%,2.87%,结果证明组合预测模型可以较好地提高粮食产量的预测精度.通过组合模型预测结果表明,到2015年东北地区的粮食产量可以达到1.25亿t,可以完成该地区增产150亿kg粮食的任务,到2018年,粮食产量预计可达1.38亿t,东北地区增粮潜力巨大.作者:姚作芳刘兴土杨飞闫敏华孙丽鲁新蕊 YAO Zuo-fang LIU Xing-tu YANG Fei YAN Min-hua SUN Li LU Xin-rui 作者单位:姚作芳,YAO Zuo-fang(中国科学院东北地理与农业生态研究所,吉林,长春,130012;中国科学院研究生院,北京,100049)刘兴土,闫敏华,孙丽,鲁新蕊,LIU Xing-tu,YAN Min-hua,SUN Li,LU Xin-rui(中国科学院东北地理与农业生态研究所,吉林,长春,130012)杨飞,YANG Fei(中国科学院地理科学与资源研究所,北京,100101) 刊名:华北农学报 ISTIC PKU英文刊名:ACTA AGRICULTURAE BOREALI-SINICA 年,卷(期):2009 24(z2) 分类号:S11~+5 关键词:组合预测模型最优加权法粮食产量 Combinatorial predicting model Optimal weighted method Food production。
Food Science And Technology And Economy粮食科技与经济2023 年6月第48卷 第3期Jun . 2023V ol.48, No.3党的二十大报告提出,全方位夯实粮食安全根基,牢牢守住“18亿亩耕地红线”,确保中国人的饭碗牢牢端在自己手中。
现在国际局势持续动荡,自然灾害肆虐,粮食产量、安全问题再次成为了人们关注的问题。
粮食生产是粮食安全的基础,但最近几年,我国粮食生产受到耕地面积退化和化肥过量施用导致环境污染等问题的严重威胁[1]。
改革开放以来,我国各地区的粮食产量出现过多次波动,这是因为粮食产量受到众多因素的影响。
基于此,本文选取了我国31个省市区2020年相关粮食产量的截面数据来探究各地区粮食产量的影响因素,通过分析回归模型方程,并结合现在粮食生产所面临的诸多问题,提出增加粮食产量的建议。
1 相关文献回顾粮食是人民生存之本,经济发展之柱,对稳定社会、经济具有重要的作用。
影响粮食生产的因素有很多,目前国内学者用不同的方法和模型来进行探究,主要有粗糙集理论、对数均值迪氏指数法、主成分分析法和多元线性回归模型4种。
欧阳浩等[2]选取1996—2012年的数据,利用粗糙集理论对广东省粮食产量的影响因子进行了分析,研究发现化肥用量、水库总量和人均经营耕地面积对粮食产量影响较大。
周志刚等[3]采用对数均值迪氏指数法来分析。
结果表明,各个影响因子具有阶段性,但总的来说,播面单产和复种指数表现的是增长效应,且播面单产对粮食增长的贡献比复种指数的大;种植结构和耕地面积表现的是减量效应,且种植结构变化带来的粮食减产要比耕地面积变化带来的粮食减产多得多。
李心慧等[4]采用主成分分析法定量分析了影响粮食单产的主要因素,发现塑料薄膜的使用量、中国省域粮食产量影响因素分析和亚晴,李 治(河南工业大学 经济贸易学院,河南 郑州 450001)摘要:粮食生产水平对一个地区和一国的经济发展具有重大的战略意义。
组合预测方法及其在粮食产量预测中的应用
组合预测方法是指将多种预测方法结合起来,综合利用各种预测方法的优点和不足,从而提高预测精度和可靠性的方法。
组合预测方法可以包括统计学方法、机器学习方法、时间序列分析方法等,其具体应用方法可以根据实际预测对象和需求进行选择和调整。
在粮食产量预测中,组合预测方法可以结合多种因素和模型,包括但不限于:
基于经验模型和统计模型的预测方法,如趋势分析法、灰色预测法、ARIMA模型等。
基于机器学习的预测方法,如神经网络模型、支持向量机模型、随机森林模型等。
基于专家经验和先验知识的预测方法,如层次分析法、模糊综合评价法等。
在应用组合预测方法时,需要综合考虑各种预测方法的优缺点,选择适合当前预测对象和需求的预测方法进行组合。
在粮食产量预测中,可以根据历史数据、气象数据、土壤数据、种植面积数据等因素进行分析和建模,从而进行预测和评估。
同时,在实际应用过程中,需要不断优化和更新预测模型,以确保预测的准确性和可靠性。
总之,组合预测方法在粮食产量预测中具有广泛的应用前景,可以提高预测精度和可靠性,为农业生产和粮食安全提供重要支持和保障。
2005年11月农业机械学报第36卷第11期基于粗糙集的粮食产量组合预测模型3郑文钟 何 勇 【摘要】 为预测粮食总产量,建立了基于粗糙集的粮食产量组合预测模型。
通过建立预测模型与预测对象的关系数据模型,离散化属性数据值来建立知识表达系统和决策表,并依据粗糙集理论计算出预测对象对预测模型的依赖度、预测模型的重要度以及组合预测模型中各单一模型的权系数。
利用浙江省粮食总产量的历史数据建立了粮食产量组合预测模型,分析表明所建模型有较好的预测效果。
关键词:粮食 产量 预测 粗糙集中图分类号:O 211167;T P 311文献标识码:AStudy on I n tegra ted Foreca sti ng M ethods for Gra i nY ield Ba sed on Rough Set TheoryZheng W enzhong H e Yong(Z hej iang U n iversity )AbstractCom b ined fo recasting of grain yield based on rough set theo ry w as p u t fo rw ard in o rder to enhance the p recisi on of p redicti on resu lt of grain yield .T he relative data m odel betw een fo recast ob jective and fo recast m odel ,and know ledge system and decisi on tab le w as estab lishedresp ectively by m ean s of converting con tinuou s attribu te values in to discrete attribu te values .T hen ,the w eigh t of com b inati on fo recast w as calcu lated by com p u ting bo th dep endence and sign ificance of betw een fo recast m odel and fo recast ob jective acco rding to esti m ating dep endence and sign ificance of attribu tes in rough set theo ry .F inally ,the com b ined fo recasting m odel of grain m odel w as estab lished in term s of statistic of grain yield from 1980to 2002in Zhejiang P rovince ,Ch ina ,and resu lts of analysis show s that the com b ined fo recasting m odel has h igher fo recasting p recisi on .Key words Grain ,Y ield ,Fo recast ,Rough set theo ry收稿日期:200411053国家自然科学基金资助项目(项目编号:39770432)和浙江省自然科学基金资助项目(项目编号:398274)郑文钟 浙江大学生物系统工程与食品科学学院 副教授 博士生,310029 杭州市何 勇 浙江大学生物系统工程与食品科学学院副院长 教授 博士生导师 通讯作者 引言在粮食总产量的预测中,可采用不同预测方法,不同的预测方法能够提供不同的有用信息,要综合利用各种预测方法所提供的信息,科学的做法是将各种不同方法进行适当组合,从而形成组合预测方法。
因此,组合预测方法是提高粮食产量预测效果的一种有效方法。
1 组合预测方法分析组合预测方法的最大特点就是能够充分有效地利用各种模型所含的独立有用的预测信息,并使多种预测模型同时对同一预测对象进行预测成为可能,从而提高预测效果。
组合预测方法利用数学语言描述如下:假设有m 种预测模型对同一预测对象进行预测,则由这m 种单一预测模型构成的组合预测模型为yδt =∑mi =1k i yδ(i )t (1)式中 yδt ——t 时刻组合预测模型的预测值yδ(i )t ——t 时刻第i 种预测模型的预测值(i =1,2,…,m )k i ——第i 种预测模型的权系数(i =1,2,…,m ),∑mi =1k i =1,且k i ≥0组合预测方法按其综合手段的不同特点可以分为权重合成和区域合成两大类型,其中权重合成的研究应用较广。
关于权重合成的组合预测,目前有很多研究方法。
大致有以下几种:最优组合预测方法、变权组合预测方法,以及利用不同的数学方法来求解权重的方法。
至今已用于粮食产量的组合预测方法主要有最优组合预测方法和拟合误差平方和等方法[1~3]。
由于组合预测模型中权系数的取值一方面影响预测效果;另一方面反映各预测模型在组合预测方法中的重要度,而重要度是粗糙集理论(rough set ,简称R S )的核心内容之一[4]。
鉴于此,本文利用粗糙集中的属性重要度来确定粮食产量各单一预测模型的权重,进而建立组合预测模型。
2 基于粗糙集的粮食产量组合预测模型粗糙集是一种刻划不完整和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[5]。
它无须提供问题所需处理的数据集合之外的任何先验信息,仅根据观测数据删除冗余信息,分析不完整知识的程度——粗糙度、属性间的依赖度与重要度,导出分类或决策规则。
211 建立基于粗糙集的组合预测模型21111 建立关系数据模型由式(1)可知,组合模型预测值是由各单一模型预测值加权而得,因而可将组合预测模型中的单一模型的拟合值视为条件属性C ,而将预测对象的观测值Y 视为决策属性D 。
条件属性集与决策属性集可分别表示为C ={y δ(1),y δ(2),…,y δ(m )},D ={y }。
定义u t =(yδ(1)t ,y δ(2)t ,…,y δ(m )t ,y t )(t =1,2,…,n ),其中(yδ(1)t ,y δ(2)t ,…,y δ(m )t )和y t 分别是t 时刻各单一预测模型的拟合值和预测对象的历史数据,则论域U ={u 1,u 2,…,u n }也称为样本集合。
由观测期内各单一模型的拟合值和历史数据一起构成的二维数据表就是关于组合预测模型的关系数据模型,表中的每一行描述一个对象,每一列描述对象的一种属性。
21112 建立知识表达系统和决策表要分析各单一模型的重要度,需要利用属性对论域分类,分类的前提是将属性值离散化,属性值离散化后便可建立知识表达系统。
由于粗糙集理论中属性依赖度和重要度的评价是建立在离散数据表基础上的,因而首先需要对连续值进行离散化,转化为决策表后再进行后继分析,这也是粗糙集理论实际应用中的一个重要环节。
目前有关连续数据离散化的典型方法主要有分别基于分级聚类法、遗传算法、条件信息熵和自组织神经网络(SOM )等离散方法。
许多文献应用表明,SOM 的输出情况可反映样本数据分布的大体本质特征,并将样本属性量化到一个合理的结果[4]。
为此本文采用SOM 网络对样本数据离散化,进而建立知识表达系统。
由论域、条件属性和决策属性构成的知识表达系统可表示为S =(U ,A ,C ,D ),其中,A =C ∪D ,C ∩D = 。
通常将具有条件属性和决策属性的知识表达系统称为决策表,决策表中的每一行表示一种决策规则。
论域中对象根据决策规则的不同被划分到不同决策类中。
21113 计算各模型的权系数[6,7](1)计算决策属性集D 对条件属性集C 的依赖度ΧC (D )= PO S C (D )U(2)式中 U ——集合U 的基数或势,对于有限集合表示集合中包含元素的个数PO S C (D )——决策属性D 关于条件属性C 的正域(2)删除第i 种预测模型,计算决策属性集D 对条件属性集C -{c i }的依赖度ΧC -{c i }(D )= PO S C -{c i }(D ) U (i =1,2,…,m )(3)(3)计算第i 种预测模型在全部预测模型中的重要度ΛDC -{c i }(c i )=ΧC (D )-ΧC -{c i }(D ) (i =1,2,…,m )(4)(4)计算第i 种预测模型的权系数k i =ΛDC -{c i }(c i )∑mi =1ΛDC -{c i }(c i ) (i =1,2,…,m )(5)21114 建立组合预测模型在求出各单一模型权系数k i 后,即可利用式(1)对各单一模型进行加权组合,从而得到组合预测模型。
212 粮食产量组合预测模型与分析现以浙江省粮食总产量为对象,依据上述步骤,利用其粮食产量的历史数据建立基于粗糙集的粮食产量组合预测模型。
67农 业 机 械 学 报2005年 21211 组合预测模型中单一模型的建立当把时间因素看作影响粮食总产量的各种因素的综合时,就可建立粮食产量随时间变化的预测模型。
由于一元线性回归是各种回归法中最基本的方法,其它各种回归法均由它演变发展而得,许多非线性预测问题经过一定的数学变换后,都可以转化成线性形式来处理。
其主要特点是当有足够的数据点(至少20个点)时,既适用于短期预测,也适用于中长期预测[8]。
因此,在建立模型过程中,根据浙江省粮食产量的变化趋势,确定以一元线性回归模型、指数模型、对数模型、双曲线模型和倒指数模型作为基础模型建立组合预测模型。
根据浙江省1980~2002年粮食总产量的统计资料[9],建立5个单一预测模型:模型1 yδ(1)t=172115843-2010736t模型2 yδ(2)t=175215991×019853t模型3 yδ(3)t=171913329-10613530ln t模型4 yδ(4)t=144118738e0.1034t模型5 1yδ(5)t=010007-0100009t以上各式中,yδ(i)t(i=1,2,…,5)为粮食总产量。
粮食产量历史数据及各个模型拟合值见表1。
表1 浙江省1980~2002年粮食总产量历史数据、单个模型与组合模型拟合值Tab.1 Sta tistic of gra i n y ield and foreca st va lues of each m odel fro m1980to2002i n Zhej i ang Prov i nce年份粮食总产量万t单个模型拟合值模型1模型2模型3模型4模型5组合模型拟合值19801435150170115117261741719133159819816161691714129 19811419150168114417011271645161151814015121711672134 19821712150166113616761171602149149214514801961642124 19831583150164112916511441571190147916414651571671105 19841817100162112216271071548116147210114561501594158 19851621130160111416031071528177146619414501511573186 19861605110158110715791411512138146313414461261554137 19871589100156110015561111498118146016414431091535181 19881553160154019215331151485165145815414401641517198 19891575150152018515101531474145145618614381681500172 19901586110150017714881251464131145514914371081483196 19911678180148017014661291455106145413514351751467161 19921553160146016314441661446154145313914341631451163 19931436120144015514231341438166145215714331671435196 19941404100142014814021341431132145118514321841420157 19951430190140014113811651424146145112214321111405143 19961516180138013313611271418101145016714311471390153 19971493153136012613411181411193145011814301901375183 19981435120134011913211401406118144917414301391361133 19991392196132011113011901400173144913514291931347102 20001217169130010412821691395154144819914291521332187 20011055168127919712631771390159144816714291141318188 2002942127125918912451121385186144813714281801305105 利用SOM网络将表1中的数据离散为4个等级,得到特征值后去代替属性值,便可建立关于组合预测的知识表达系统,见表2。