基于灰色系统的年降雨量预测模型探析
- 格式:pdf
- 大小:163.54 KB
- 文档页数:3
基于灰色模型GM(1,1)的长沙市年降雨量预测作者:王健来源:《卷宗》2015年第03期摘要:本文根据长沙地区1996年至2013年的年降雨量数据,采用灰色系统模型GM (1,1)对该地区的年降雨量预测并运用实测资料进行检验,结果表明预测精度是令人怀疑的,不宜采用灰色系统模型对长沙市进行年降雨量预测。
关键词:灰色系统;降雨量;预测;长沙市降雨量在水资源管理、洪涝灾害预报以及水情预报分析中有重要的作用。
现阶段关于降雨量预测的研究很多,从早期的线性预测发展到现在的非线性预测。
越来越多的数学工具被应用在这方面,包括自回归模型、人工神经网络、覆盖算法、模糊系统预测、马尔科夫预测、组合预测以及时间序列分析等。
这些方法都有各自的优势和适用条件,相应的样本数据的数量和原始数据的处理方法也有所不同。
然而,降水量的驱动因素十分复杂,包括地形、地貌、流域下垫面、气温和人类活动等多因素的影响,具有高度不确定性。
灰色系统理论认为:部分信息已知,部分信息未知的系统叫“灰色系统”。
水文系统就其本身而言具有灰色系统的一些基本特征,即水文系统中长期观测到的水文资料只是水文系统中极少的一部分,如有限年代的雨量、流量记录等;更有未知信息部分,如未来年代的雨量大小、流量丰枯,洪水、干旱的出现时刻以及水环境的前景变化等;因此,水文系统是一灰色系统,可用灰色系统理论对其进行分析、研究。
本文在GM(1,1)模型的基础上,对长沙市降雨量预测并运用长沙市降雨量的实测资料进行检验,结果表明预测精度不好,不宜采用灰色系统模型对长沙市进行年降雨量预测。
1 研究区概况长沙位于中国中南部的长江以南地区,湖南省的东部偏北。
地处洞庭湖平原的南端向湘中丘陵盆地过渡地带,与岳阳、益阳、娄底、株洲、湘潭和江西萍乡接壤。
总面积为11818平方公里,其中市区面积1938.5平方公里,建成区面积320平方千米(截至2011年7月)。
位于浏阳境内的大围山七星岭海拔1616米,为辖区最高处;岳麓山的云麓峰海拔300.8米,为城区至高点。
5.1.2 灰色系统GM(1,1)预测模型GM(1,1)模型的建立由于统计数据信息不完整,故有部分日用水量数据和70%以上的水厂日供水量数据采用曲线拟合法进行回归分析不能得到令人满意的结果,所以我们考虑用对信息质量要求不高的灰色系统分析法进行预测,建立GM(1,1)模型。
记)),(),...2(),1((n x x x x =其中)(i x 表示第i 年数值。
Step1:令)0(x 为GM (1,1)建模序列,表示灰导数(0)(0)(0)(0)((1),(2),...,())x x x x n =其中)()()0(k x k x =,...3,2,1=kStep2:令)1(x 为)0(x 的AGO 序列,对)0(x 作累加生成,即得到新的序列)1(x ,(1)(1)(1)(1)((1),(2),...,())x x x x n =(1)(0)(1)(1)x x =(1)(0)1()()km x k x m ==∑Step3:令)1(z 为)1(x 的均值(MEAN )序列,表示白化背景值(1)(1)(1)()0.5()0.5(1)z k x k x k =+- (5.9)(1)(1)(1)(1)((2),(3),...,())z z z z n =则得到GM(1,1)的灰微分方程模型为b k az k x =+)()()1()0( (5.10)式中:b a 、为待估计参数,分别称为发展灰度和内生控制灰度。
其中,∑∑∑∑∑∑∑∑∑∑∑===========---=----=n k nk n k n k n k n k n k n k n k n k n k k z k z n k x k z k z k z k z b k z k z n k x k z n k x k z a 222)1(2)1(22)0(22)1()1(2)1()1(222)1(2)1(2)0()1(22)0()1())(()()1()()()()()(;))(()()1()()()1()()( 经变换后得到)()()1()0(k az b k x -= (5.11)GM(1,1)模型的求解在(5.11)两端同时乘以ak e 得,(0)(1)()()ak ak ak e x k e az k e b +=即(1)()()ak ak t z k e be d C -=+⎰ ak b Ce a-=+ 将代入上式中,可得0(1)b C x a=- 于是得出时间函数(1)(1)x k +的估计值(1)0ˆ(1)[(1)]ak b b x k x e a a-+=-+ (5.12) 我们把上式(5.12)作为预测方程。
灰色关联度方法在灾害性天气评估中的应用研究灰色关联度方法在灾害性天气评估中的应用研究摘要:灾害性天气对人们的生产生活带来了巨大的威胁,因此对灾害性天气的评估具有重要的意义。
本文将灰色关联度方法应用于灾害性天气评估中,通过构建适当的模型,对灾害性天气进行评估。
研究结果表明,灰色关联度方法在灾害性天气评估中具有较高的可行性和准确性。
1. 引言灾害性天气是一种具有破坏性和危险性的气象现象,会导致巨大的财产损失和人员伤亡。
因此,对灾害性天气的评估非常重要。
传统的灾害性天气评估方法大多基于统计学的分析,但该方法存在不足之处。
灰色关联度方法是一种有效的评估方法,可在一定程度上解决现有方法的问题。
2. 灰色关联度方法概述灰色关联度方法是一种用于分析系统相互关系的方法,可以用于评估不同因素之间的关联度。
该方法首先将各个因素的数据进行标准化处理,然后计算各个因素与目标因素之间的关联度。
关联度越大,代表两者之间的关系越紧密。
3. 灰色关联度方法在灾害性天气评估中的应用3.1 数据准备对于灾害性天气的评估,需要收集大量的气象数据和相关的灾害性天气数据。
在收集数据时,需要确保数据的准确性和完整性。
3.2 数据预处理灰色关联度方法对数据的要求较高,需要对收集到的数据进行预处理。
预处理主要包括数据清洗、平滑处理和标准化处理。
3.3 灾害性天气评估模型构建基于灰色关联度方法,可以构建适当的模型对灾害性天气进行评估。
模型的构建需要确定评估指标和数据的权重。
评估指标应考虑灾害性天气的多个方面,如风速、降雨量、温度等。
然后,通过计算各个指标与目标因素之间的关联度,得到各个指标的权重。
最后,根据权重和关联系数,计算灾害性天气的评估值。
3.4 灾害性天气评估结果分析对于评估结果的分析,需要对模型进行合理性验证。
通过与实际观测数据进行比较,可以评估模型的准确性和可靠性。
同时,对评估结果进行综合分析,找出其规律和特点,为灾害性天气的预测和预警提供参考依据。
第7章 灰色预测方法 预测就是借助于对过去的探讨去推测、了解未来。
灰色预测通过原始数据的处理和灰色模型的建立,发现、掌握系统发展规律,对系统的未来状态做出科学的定量预测。
对于一个具体的问题,究竟选择什么样的预测模型应以充分的定性分析结论为依据。
模型的选择不是一成不变的。
一个模型要经过多种检验才能判定其是否合适,是否合格。
只有通过检验的模型才能用来进行预测。
本章将简要介绍灰数、灰色预测的概念,灰色预测模型的构造、检验、应用,最后对灾变预测的原理作了介绍。
7.1 灰数简介7.1.1 灰数一棵生长着的大树,其重量便是有下界的灰数,因为大树的重量必大于零,但不可能用一般手段知道其准确的重量,若用⊗表示大树的重量,便有[)∞∈⊗,0。
是一个确定的数。
海豹的重量在20~25公斤之间,某人的身高在1.8~1.9米之间,可分别记为 []25,201∈⊗,[]9.1,8.12∈⊗ 4. 连续灰数与离散灰数在某一区间内取有限个值或可数个值的灰数称为离散灰数,取值连续地充满某一区间的灰数称为连续灰数。
某人的年龄在30到35之间,此人的年龄可能是30,31,32,33,34,35这几个数,因此年龄是离散灰数。
人的身高、体重等是连续灰数。
5. 黑数与白数当()∞∞-∈⊗,或()21,⊗⊗∈⊗,即当⊗的上、下界皆为无穷或上、下界都为讨论方便,我们将黑数与白数看成特殊的灰数。
6. 本征灰数与非本征灰数本征灰数是指不能或暂时还不能找到一个白数作为其“代表”的灰数,比如一般的事前预测值、宇宙的总能量、准确到秒或微妙的“年龄”等都是本征灰数。
非本征灰数是指凭先验信息或某种手段,可以找到一个白数作为其“代表”的灰数。
我们称此白数为相应灰数的白化值,记为⊗~,并用()a ⊗表示以a 为白化值的灰数。
如托人代买一件价格100元左右的衣服,可将100作为预购衣服价格()100⊗的白化数,记为()100100~=⊗。
从本质上来看,灰数又可分为信息型、概念型、层次型三类。
灰色预测模型灰色预测是就灰色系统所做的预测. 所谓灰色系统是介于白色系统和黑箱系统之间的过渡系统,其具体的含义是:如果某一系统的全部信息已知为白色系统,全部信息未知为黑箱系统,部分信息已知,部分信息未知,那么这一系统就是灰箱系统. 一般地说,社会系统、经济系统、生态系统都是灰色系统.灰色系统理论认为对既含有已知信息又含有未知或非确定信息的系统进行预测,就是对在一定方位内变化的、与时间有关的灰色过程的预测. 尽管过程中所显示的现象是随机的、杂乱无章的,但毕竟是有序的、有界的,因此这一数据集合具备潜在的规律,灰色预测就是利用这种规律建立灰色模型对灰色系统进行预测.灰色预测模型只需要较少的观测数据即可,这和时间序列分析,多元回归分析等需要较多数据的统计模型不一样. 因此,对于只有少量观测数据的项目来说,灰色预测是一种有用的工具.一、GM(1,1)模型灰色系统理论是邓聚龙教授在1981年提出来的,是一种对含有不确定因素系统进行预测的方法. 通过鉴别系统因素之间发展趋势的相异程度,进行关联分析,并通过对原始数据进行生成处理来寻找系统的变化规律,生成较强规律性数据序列,然后建立相应微分方程模型,从而预测事物未来的发展趋势和未来状态. 目前使用最广泛的灰色预测模型是关于数列预测的一个变量、一阶微分的GM(1,1)模型.GM(1,1)模型是基于灰色系统的理论思想,将离散变量连续化,用微分方程代替差分方程,按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近,用生成数序列代替原始时间序列,弱化原始时间序列的随机性,这样可以对变化过程作较长时间的描述,进而建立微分方程形式的模型. 其建模的实质是建立微分方程的系数,将时间序列转化为微分方程,通过灰色微分方程可以建立抽象系统的发展模型. 经证明,经一阶线性微分方程的解逼近所揭示的原始时间数列呈指数变化规律时,灰色预测GM(1,1)模型的预测将是非常成功的.1.1 GM(1,1)模型的建立灰色理论认为一切随机量都是在一定范围内、一定时间段上变化的灰色量及灰色过程. 数据处理不去寻找其统计规律和概率分布, 而是对原始数据作一定处理后, 使其成为有规律的时间序列数据, 在此基础上建立数学模型.GM(1,1)模型是指一阶,一个变量的微分方案预测模型,是一阶单序列的线性动态模型,用于时间序列预测的离散形式的微分方程模型.设时间序列()0X有n 个观察值,()()()()()()(){}00001,2,,Xx x x n =,为了使其成为有规律的时间序列数据,对其作一次累加生成运算,即令()()()()101tn xt x n ==∑从而得到新的生成数列()1X,()()()()()()(){}11111,2,,Xx x x n =,新的生成数列()1X 一般近似地服从指数规律. 则生成的离散形式的微分方程具体的形式为dxax u dt+= 即表示变量对于时间的一阶微分方程是连续的. 求解上述微分方程,解为当t =1时,()(1)x t x =,即(1)c x a=-,则可根据上述公式得到离散形式微分方程的具体形式为 ()()()11a t u u x t x e a a --⎛⎫=-+ ⎪⎝⎭其中,ax 项中的x 为dxdt的背景值,也称初始值;a ,u 是待识别的灰色参数,a 为发展系数,反映x 的发展趋势;u 为灰色作用量,反映数据间的变化关系.按白化导数定义有0()()lim t dx x t t x t dt t→+-= 显然,当时间密化值定义为1时,当1t →时,则上式可记为1lim(()())t dxx t t x t dt→=+- 这表明dxdt是一次累减生成的,因此该式可以改写为 (1)(1)(1)()dxx t x t dt=+- 当t 足够小时,变量x 从()x t 到()x t t +是不会出现突变的,所以取()x t 与()x t t +的平均值作为当t 足够小时的背景值,即(1)(1)(1)1()(1)2xx t x t ⎡⎤=++⎣⎦将其值带入式子,整理得 (0)(1)(1)1(1)()(1)2x t a x t x t u ⎡⎤+=-+++⎣⎦ 由其离散形式可得到如下矩阵:(1)(1)(0)(1)(1)(0)(0)(1)(1)1(1)(2)2(2)1(2)(3)(3)2()1(1)()2x x x x x x a u x n x n x n ⎛⎫⎡⎤-+ ⎪⎣⎦⎛⎫ ⎪ ⎪ ⎪⎡⎤-+ ⎪⎣⎦ ⎪=+ ⎪ ⎪ ⎪⎪ ⎪⎝⎭ ⎪⎡⎤--+ ⎪⎣⎦⎝⎭令 (0)(0)(0)(2),(3),,()TY x x x n ⎡⎤=⎣⎦(1)(1)(1)(1)(1)(1)11(1)(2)211(2)(3)21(1)()12x x x x B x n x n ⎛⎫⎡⎤-+ ⎪⎣⎦ ⎪⎪⎡⎤-+⎣⎦ ⎪= ⎪ ⎪ ⎪⎡⎤--+ ⎪⎣⎦⎝⎭()Ta u α=称Y 为数据向量,B 为数据矩阵,α为参数向量. 则上式可简化为线性模型:Y B α=由最小二乘估计方法得()1T T a B B B Y uα-⎛⎫== ⎪⎝⎭上式即为GM(1,1)参数,a u 的矩阵辨识算式,式中()1TT B B B Y -事实上是数据矩阵B 的广义逆矩阵.将求得的a ,u 值代入微分方程的解式,则()1(1)()((1))a t u ux t x e a a--=-+其中,上式是GM(1,1)模型的时间响应函数形式,将它离散化得(1)(0)(1)ˆ()(1)a t u u xt x e a a --⎛⎫=-+ ⎪⎝⎭ 对序列()()1ˆxt 再作累减生成可进行预测. 即()(0)(1)(1)(0)(1)ˆˆˆ()()(1)(1)1a a t xt x t x t u x e ea --=--⎛⎫=-- ⎪⎝⎭ 上式便是GM(1,1)模型的预测的具体计算式. 或对()atux t cea-=+求导还原得 (0)(0)(1)ˆ()((1))a t uxt a x e a--=-- 1.2 GM(1,1)模型的检验GM(1,1)模型的检验包括残差检验、关联度检验、后验差检验三种形式.每种检验对应不同功能:残差检验属于算术检验,对模型值和实际值的误差进行逐点检验;关联度检验属于几何检验范围,通过考察模型曲线与建模序列曲线的几何相似程度进行检验,关联度越大模型越好;后验差检验属于统计检验,对残差分布的统计特性进行检验,衡量灰色模型的精度. ➢ 残差检验残差大小检验,即对模型值和实际值的残差进行逐点检验. 设模拟值的残差序列为(0)()e t ,则(0)(0)(0)ˆ()()()e t x t xt =- 令()t ε为残差相对值,即残差百分比为(0)(0)(0)ˆ()()()%()x t xt t x t ε⎡⎤-=⎢⎥⎣⎦令∆为平均残差,11()nt t n ε=∆=∑.设残差的方差为22S ,则[]22211()n t S e t e n ==-∑. 故后验差比例C 为21/C S S =,误差频率P 为{}1()0.6745P P e t e S =-<.对于,C P 检验指标如下表:检验指标好合格勉强不合格P >0.95 >0.80 >0.70 <0.70 C <0.35 <0.50 <0.65 >0.65表 1 灰色预测精确度检验等级标准一般要求()20%t ε<,最好是()10%t ε<,符合要求.➢ 关联度检验关联度是用来定量描述各变化过程之间的差别. 关联系数越大,说明预测值和实际值越接近.设 {}(0)(0)(0)(0)ˆˆˆˆ()(1),(2),,()Xt xx x n =⋯ {}(0)(0)(0)(0)()(1),(2),,()X t x x x n =⋯序列关联系数定义为(){}{}{}(0)(0)(0)(0)(0)(0)(0)(0)ˆˆmin ()()max ()(),0ˆˆ()()max ()()1,0x t x t x t x t t t x t x t x t x t t σξσ⎧-+-⎪≠⎪=⎨-+-⎪=⎪⎩ 式中,(0)(0)ˆ()()xt x t -为第t 个点(0)x 和(0)ˆx 的绝对误差,()t ξ为第t 个数据的关联系数,ρ称为分辨率,即取定的最大差百分比,0ρ<<1,一般取0.5ρ=.(0)()x t 和(0)ˆ()xt 的关联度为()11nt r t n ξ==∑精度等级 关联度均方差比值小误差概率好(1级) 0.90≥ 0.35≤ 0.95≥ 合格(2级) 0.80≥ 0.50≤ 0.80≥ 勉强(3级) 0.70≥ 0.65≤ 0.70≥ 不合格(4级)0.70< 0.65>0.70<表 2 精度检验等级关联度大于60%便满意了,原始数据与预测数据关联度越大,模型越好.➢ 后验差检验后验差检验,即对残差分布的统计特性进行检验. 检验步骤如下:1、计算原始时间数列(){}0(0)(0)(0)(1),(2),,()Xx x x n =的均值和方差()2(0)(0)2(0)11111(),()n n t t xx t S x t x n n ====-∑∑ 2、计算残差数列{}(0)(0)(0)(0)(1),(2),,()ee e e n =的均值e 和方差22s()2(0)2(0)21111(),()n n t t e e t S e t e n n ====-∑∑其中(0)(0)(0)ˆ()()(),1,2,,e t x t xt t n =-=为残差数列.3、计算后验差比值21C S S =4、计算小误差频率{}(0)1()0.6745P P e t e S =-<令0S =0.67451S ,(0)()|()|t e t e ∆=-,即{}0()P P t S =∆<.若对给定的00C >,当0C C <时,称模型为方差比合格模型;若对给定的00P >,当0P P >时,称模型为小残差概率合格模型.>0.95 <0.35 优 >0.80 <0.5 合格 >0.70 <0.65 勉强合格 <0.70>0.65不合格表 3 后验差检验判别参照表1.3 残差GM(1,1)模型当原始数据序列(0)X建立的GM(1,1)模型检验不合格时,可以用GM(1,1)残差模型来修正. 如果原始序列建立的GM(1,1)模型不够精确,也可以用GM(1,1)残差模型来提高精度.若用原始序列(0)X建立的GM(1,1)模型(1)(0)ˆ(1)[(1)]at u uxt x e a a-+=-+ 可获得生成序列(1)X 的预测值,定义残差序列(0)(1)(1)ˆ()()()e k x k x k =-. 若取k=t , t+1, …, n ,则对应的残差序列为{}(0)(0)(0)(0)()(1),(2),,()e k e e e n =计算其生成序列(1)()e k ,并据此建立相应的GM(1,1)模型(1)(0)ˆ(1)[(1)]e a k e ee eu u et e e a a -+=-+ 得修正模型(1)(0)(0)(1)(1)()()(1)e a k ak e e e u u u x t x e k t a e e a a a δ--⎡⎤⎡⎤+=-++---⎢⎥⎢⎥⎣⎦⎣⎦其中1()0k tk t k t δ≥⎧-=⎨≤⎩为修正参数.应用此模型时要考虑:1、一般不是使用全部残差数据来建立模型,而只是利用了部分残差.2、修正模型所代表的是差分微分方程,其修正作用与()k t δ-中的t 的取值有关.1.4 GM(1,1)模型的适用范围定理:当GM(1,1)发展系数||2a ≥时,GM(1,1)模型没有意义.我们通过原始序列()0i X 与模拟序列()0ˆiX 进行误差分析,随着发展系数的增大,模拟误差迅速增加. 当发展系数0.3a -≤时,模拟精度可以达到98%以上;发展系数0.5a -≤时,模拟精度可以达到95%以上;发展系数1a ->时,模拟精度低于70%;发展系数 1.5a ->时,模拟精度低于50%. 进一步对预测误差进行考虑,当发展系数0.3a -<时,1步预测精度在98%以上,2步和5步预测精度都在90%以上,10步预测精度亦高于80%;当发展系数0.8a ->时,1步预测精度已低于70%.通过以上分析,可得下述结论:1、当0.3a -<时,GM(1,1)可用于中长期预测;2、当0.30.5a <-≤时,GM(1,1)可用于短期预测,中长期预测慎用;3、当0.50.8a <-≤时,GM(1,1)作短期预测应十分谨慎;4、当0.81a <-≤时,应采用残差修正GM(1,1)模型;5、当1a ->时,不宜采用GM(1,1)模型.1.5 GM(1,1)模型实例分析例:则该学生成绩时间序列如下:()()(0)(0)(0)(0)(0)(1),(2),(3),(4)79,74.825,74.29,76.98X x x x x ==对(0)X作一次累加后的数列为()()(1)(1)(1)(1)(1)(1),(2),(3),(4)79,153.825,228.115,305.095X x x x x ==对(1)X做紧邻均值生成. 令(1)(1)(1)()0.5()0.5(1)Z k x k x k =+-,得()()(1)(1)(1)(1)(2),(3),(4)116.4125,151.47,150.1925Z z z z ==则数据矩阵B 及数据向量Y 为(1)(1)(1)(2)1116.41251(3)1151.471(4)1150.19251z B z z ⎡⎤--⎡⎤⎢⎥⎢⎥=-=-⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦,(0)(0)(0)(2)74.825(3)74.29(4)76.98x Y x x ⎡⎤⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦ 对参数列ˆ[,]Taa b =进行最小二乘估计,得 176.61ˆ()[,]0.0144T T T T a B B B Y B Y a u -⎡⎤====⎢⎥-⎣⎦即 0.0144a =-,76.61u = 则GM(1,1)模型为()()110.014476.61dx x dt-= 时间响应式为(1)0.0144ˆ(1)5399.13895320.1389xk e -+=- 当1k =时,我们取(1)(0)(0)ˆˆ(1)(1)(0)79xx x === 还原求出(0)X的模拟值. 由(0)(1)(1)ˆˆˆ()()(1)Xk x k x k =--,取2,3,4k =,得 ()()(0)(0)(0)(0)(0)ˆˆˆˆˆ(1),(2),(3),(4)79,74.281,74.3584,76.4513xx x x x == 通过预测,得到实际值与预测值如下表:实际值 预测值 相对误差()k ε 第一学期79 79 0 第二学期 74.825 74.2810 0.73% 第三学期 74.29 74.3584 0.0921% 第四学期76.9876.45130.7051%表 4 四学期的实际值与预测值的误差表因为()10%k ε<,那就可得学生的预测值,与现实值进行比较得出该模型精度较高,可进行预测和预报.我们对学生未来两个学期(也就是第五、六个学期)的成绩进行预测,分别为77.5602分和78.6851分.例:某大型企业1999年至2004年的产品销售额如下表,试建立GM(1,1)预测模型,并预测2005年的产品销售额。
基于数据挖掘降雨量建模和预测方法研究摘要:针对降雨测量仪在野外工作的特定需求,研究一种防堵塞降雨量实时监测系统.该系统通过雨滴传感器设定阈值判断是否降雨,并基于降雨信息控制舵机驱动活动挡板运动,在无雨时遮住降雨量测量仪,在降雨时将其打开,既不影响雨量计的正常工作,又可以减少其漏斗裸露在外的时间,大大减小异物堵塞的概率及其对雨量计的影响,本文对数据挖掘降雨量建模和预测方法进行分析,以供参考关键词:数据挖掘;降雨量建模;预测方法引言雨量信息的实时性和准确性是防汛抗旱正确指挥的前提,及时准确地获取降雨量信息可以帮助指挥部门实施有效的监控和预警.目前,气象观测中常用翻斗雨量计测量降雨强度和降雨量,其在野外工作时容易被异物堵塞导致不能正常工作,在偏远地方还需解决野外供电和数据远距离传输存储等问题.为解决这些问题,本文设计一种防堵塞降雨量实时监测系统,该系统在探测到降雨时打开测量仪上的挡板测量降雨量,雨停时自动关闭挡板,避免测量仪被堵塞,从而提高系统测量的准确性;采集的数据通过GPRS模块发送到云端,便于数据的查询和共享,方便不同用户的使用,提高数据的可靠性和利用率.1降雨量变化1.1降雨量变化研究的必要性全球和区域温度的上升将导致地球周期要素周期的变化。
作为水循环的一个重要组成部分,关于降雨变化的区域研究可以从不同角度解释全球变暖问题,这有助于了解全球和区域水循环对气候变化的影响,并为当地水分配和水文建模提供参考资料。
影响时间和空间降雨分布的因素包括地理位置、台风路径、气旋和其他天气因素,以及水体、地形和森林状况等基本地形条件。
如果我们从现有的长期降雨数据推断年降雨量变化的周期和趋势,并掌握降雨的时间分布情况,我们就可以预测未来的降雨趋势,并制定全年水资源分布计划,以尽量减少洪水的不利影响同样,如果了解降雨分布的时空特征,就可以了解不同区域的水量,优化区域水资源分布,并以综合方式规划信息的提供,以支持环境保护。
灰色GM(1,1)模型在干旱预测中的应用魏光辉【摘要】灰色系统理论及其建模原理,利用蚌埠市气象站27a的实测降水量资料建立灰色预测GM(1,1)模型,对干旱灾害进行预测,经残差与后验差检验分析,模型精度较高,平均达99.37%,使用实测资料检验,效果较理想,为蚌埠市抗旱及供水提供必要的预测信息.【期刊名称】《水科学与工程技术》【年(卷),期】2010(000)004【总页数】3页(P7-9)【关键词】干旱;灰色灾变预测;精度检验;GM(1,1)模型【作者】魏光辉【作者单位】新疆农业大学,水利与土木工程学院,乌鲁木齐,830052【正文语种】中文【中图分类】P338+.9灰色系统理论[1]是80年代初由我国著名学者邓聚龙教授提出的。
它把一般系统论、信息论、控制论的观点和方法延伸到社会、经济、生态等抽象系统,并结合数学方法,发展成为一套解决信息不完备系统即灰色系统的理论和方法。
应用该方法对各种自然灾害进行预测,是减轻灾害和作出科学决策的重要措施之一。
本文以蚌埠市气象站气象站27a的实测年降雨量资料,用灰色系统理论GM(1,1)对未来干旱灾害进行预测。
干旱预测严格说是异常值预测,主要是干旱灾害出现时间的预测,即干旱出现的年份。
预测过程是建立在实测数据和严格的数学基础上的,预测结果可作为在实际工作中的参考。
1 灰色系统预测模型理论灰色系统理论认为一切随机量都是在一定范围内、一定时段上变化的灰色量及灰色过程,对灰量数据通过一定方式处理后使其成为较有规律的时间序列数据,再建立模型[1]。
灰色系统GM(1,1)预测模型是一阶、一个变量的微分方程模型,适合于对系统行为特征值大小的发展变化进行预测。
灰色GM(1,1)模型[2-4]是将随机数经生成后变为有序的生成数据,然后建立微分方程,寻找生成数据的规律,再将运算结果还原的一种方法,其基础是数据的生成。
常用的生成方式有累加生成和累减生成。
1.1 GM(1,1)模型的数列预测原理设某原始序列:X(0)={X(0)(1),X(0)(2),…,X(0)(n)}对其进行一次累加生成,得到生成序列:则GM(1,1)模型相应的微分方程为:式中α为发展灰数,α的可容区为(-2,2);μ为内生控制灰数。
灰色预测模型灰色预测是就灰色系统所做的预测. 所谓灰色系统是介于白色系统和黑箱系统之间的过渡系统,其具体的含义是:如果某一系统的全部信息已知为白色系统,全部信息未知为黑箱系统,部分信息已知,部分信息未知,那么这一系统就是灰箱系统. 一般地说,社会系统、经济系统、生态系统都是灰色系统.灰色系统理论认为对既含有已知信息又含有未知或非确定信息的系统进行预测,就是对在一定方位内变化的、与时间有关的灰色过程的预测. 尽管过程中所显示的现象是随机的、杂乱无章的,但毕竟是有序的、有界的,因此这一数据集合具备潜在的规律,灰色预测就是利用这种规律建立灰色模型对灰色系统进行预测.灰色预测模型只需要较少的观测数据即可,这和时间序列分析,多元回归分析等需要较多数据的统计模型不一样. 因此,对于只有少量观测数据的项目来说,灰色预测是一种有用的工具.一、GM(1,1)模型灰色系统理论是邓聚龙教授在1981年提出来的,是一种对含有不确定因素系统进行预测的方法. 通过鉴别系统因素之间发展趋势的相异程度,进行关联分析,并通过对原始数据进行生成处理来寻找系统的变化规律,生成较强规律性数据序列,然后建立相应微分方程模型,从而预测事物未来的发展趋势和未来状态. 目前使用最广泛的灰色预测模型是关于数列预测的一个变量、一阶微分的GM(1,1)模型.GM(1,1)模型是基于灰色系统的理论思想,将离散变量连续化,用微分方程代替差分方程,按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近,用生成数序列代替原始时间序列,弱化原始时间序列的随机性,这样可以对变化过程作较长时间的描述,进而建立微分方程形式的模型. 其建模的实质是建立微分方程的系数,将时间序列转化为微分方程,通过灰色微分方程可以建立抽象系统的发展模型. 经证明,经一阶线性微分方程的解逼近所揭示的原始时间数列呈指数变化规律时,灰色预测GM(1,1)模型的预测将是非常成功的.1.1 GM(1,1)模型的建立灰色理论认为一切随机量都是在一定范围内、一定时间段上变化的灰色量及灰色过程. 数据处理不去寻找其统计规律和概率分布, 而是对原始数据作一定处理后, 使其成为有规律的时间序列数据, 在此基础上建立数学模型.GM(1,1)模型是指一阶,一个变量的微分方案预测模型,是一阶单序列的线性动态模型,用于时间序列预测的离散形式的微分方程模型.设时间序列()0X 有n 个观察值,()()()()()()(){}00001,2,,X x x x n =,为了使其成为有规律的时间序列数据,对其作一次累加生成运算,即令()()()()101tn xt x n ==∑从而得到新的生成数列()1X ,()()()()()()(){}11111,2,,X x x x n =,新的生成数列()1X 一般近似地服从指数规律. 则生成的离散形式的微分方程具体的形式为dxax u dt+= 即表示变量对于时间的一阶微分方程是连续的. 求解上述微分方程,解为(1)()a t u x t ce a--=+当t =1时,()(1)x t x =,即(1)uc x a=-,则可根据上述公式得到离散形式微分方程的具体形式为()()()11a t u u x t x e a a --⎛⎫=-+ ⎪⎝⎭其中,ax 项中的x 为dxdt的背景值,也称初始值;a ,u 是待识别的灰色参数,a 为发展系数,反映x 的发展趋势;u 为灰色作用量,反映数据间的变化关系.按白化导数定义有0()()limt dx x t t x t dt t→+-= 显然,当时间密化值定义为1时,当1t →时,则上式可记为1lim(()())t dxx t t x t dt→=+- 这表明dxdt是一次累减生成的,因此该式可以改写为 (1)(1)(1)()dxx t x t dt=+- 当t 足够小时,变量x 从()x t 到()x t t +是不会出现突变的,所以取()x t 与()x t t +的平均值作为当t 足够小时的背景值,即(1)(1)(1)1()(1)2x x t x t ⎡⎤=++⎣⎦将其值带入式子,整理得(0)(1)(1)1(1)()(1)2x t a x t x t u ⎡⎤+=-+++⎣⎦ 由其离散形式可得到如下矩阵:(1)(1)(0)(1)(1)(0)(0)(1)(1)1(1)(2)2(2)1(2)(3)(3)2()1(1)()2x x x x x x a u x n x n x n ⎛⎫⎡⎤-+ ⎪⎣⎦⎛⎫ ⎪ ⎪ ⎪⎡⎤-+ ⎪⎣⎦ ⎪=+ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪⎡⎤--+ ⎪⎣⎦⎝⎭令 (0)(0)(0)(2),(3),,()TY x x x n ⎡⎤=⎣⎦(1)(1)(1)(1)(1)(1)11(1)(2)211(2)(3)21(1)()12x x x x B x n x n ⎛⎫⎡⎤-+ ⎪⎣⎦ ⎪ ⎪⎡⎤-+⎣⎦ ⎪= ⎪ ⎪ ⎪⎡⎤--+ ⎪⎣⎦⎝⎭()Ta u α=称Y 为数据向量,B 为数据矩阵,α为参数向量. 则上式可简化为线性模型:Y B α=由最小二乘估计方法得()1T T a B B B Y uα-⎛⎫== ⎪⎝⎭上式即为GM(1,1)参数,a u 的矩阵辨识算式,式中()1T T B B B Y -事实上是数据矩阵B 的广义逆矩阵.将求得的a ,u 值代入微分方程的解式,则()1(1)()((1))a t u u x t x e a a--=-+其中,上式是GM(1,1)模型的时间响应函数形式,将它离散化得(1)(0)(1)ˆ()(1)a t u u xt x e a a --⎛⎫=-+ ⎪⎝⎭ 对序列()()1ˆxt 再作累减生成可进行预测. 即 ()(0)(1)(1)(0)(1)ˆˆˆ()()(1)(1)1a a t xt x t x t u x e e a --=--⎛⎫=-- ⎪⎝⎭ 上式便是GM(1,1)模型的预测的具体计算式.或对()at ux t ce a-=+求导还原得(0)(0)(1)ˆ()((1))a t uxt a x e a--=-- 1.2 GM(1,1)模型的检验GM(1,1)模型的检验包括残差检验、关联度检验、后验差检验三种形式. 每种检验对应不同功能:残差检验属于算术检验,对模型值和实际值的误差进行逐点检验;关联度检验属于几何检验范围,通过考察模型曲线与建模序列曲线的几何相似程度进行检验,关联度越大模型越好;后验差检验属于统计检验,对残差分布的统计特性进行检验,衡量灰色模型的精度. ➢ 残差检验残差大小检验,即对模型值和实际值的残差进行逐点检验.设模拟值的残差序列为(0)()e t ,则(0)(0)(0)ˆ()()()e t x t xt =- 令()t ε为残差相对值,即残差百分比为(0)(0)(0)ˆ()()()%()x t xt t x t ε⎡⎤-=⎢⎥⎣⎦令∆为平均残差,11()nt t n ε=∆=∑.设残差的方差为22S ,则[]22211()n t S e t e n ==-∑. 故后验差比例C 为21/C S S =,误差频率P 为{}1()0.6745P P e t e S =-<.对于,C P 检验指标如下表: 检验指标好 合格 勉强 不合格 P >0.95 >0.80 >0.70 <0.70 表 1 灰色预测精确度检验等级标准一般要求()20%t ε<,最好是()10%t ε<,符合要求.➢ 关联度检验关联度是用来定量描述各变化过程之间的差别. 关联系数越大,说明预测值和实际值越接近.设 {}(0)(0)(0)(0)ˆˆˆˆ()(1),(2),,()Xt x x x n =⋯ {}(0)(0)(0)(0)()(1),(2),,()X t x x x n =⋯序列关联系数定义为(){}{}{}(0)(0)(0)(0)(0)(0)(0)(0)ˆˆmin ()()max ()(),0ˆˆ()()max ()()1,0x t x t x t x t t t x t x t x t x t t σξσ⎧-+-⎪≠⎪=⎨-+-⎪=⎪⎩ 式中,(0)(0)ˆ()()x t x t -为第t 个点(0)x 和(0)ˆx 的绝对误差,()t ξ为第t 个数据的关联系数,ρ称为分辨率,即取定的最大差百分比,0ρ<<1,一般取0.5ρ=.(0)()x t 和(0)ˆ()xt 的关联度为 ()11nt r t n ξ==∑精度等级 关联度 均方差比值 小误差概率 好(1级) 0.90≥ 0.35≤ 0.95≥ 合格(2级) 0.80≥ 0.50≤ 0.80≥ 勉强(3级) 0.70≥ 0.65≤ 0.70≥ 不合格(4级) 0.70< 0.65> 0.70<表 2 精度检验等级关联度大于60%便满意了,原始数据与预测数据关联度越大,模型越好.➢ 后验差检验后验差检验,即对残差分布的统计特性进行检验. 检验步骤如下:1、计算原始时间数列(){}0(0)(0)(0)(1),(2),,()X x x x n =的均值和方差()2(0)(0)2(0)11111(),()n n t t xx t S x t x n n ====-∑∑ 2、计算残差数列{}(0)(0)(0)(0)(1),(2),,()e e e e n =的均值e 和方差22s ()2(0)2(0)21111(),()n n t t e e t S e t e n n ====-∑∑其中(0)(0)(0)ˆ()()(),1,2,,e t x t x t t n =-=为残差数列.3、计算后验差比值21C S S =4、计算小误差频率{}(0)1()0.6745P P e t e S =-<令0S =0.67451S ,(0)()|()|t e t e ∆=-,即{}0()P P t S =∆<.若对给定的00C >,当0C C <时,称模型为方差比合格模型;若对给定的00P >,当0P P >时,称模型为小残差概率合格模型.P C 模型精度 >0.95 <0.35 优 >0.80 <0.5 合格 >0.70 <0.65 勉强合格 <0.70 >0.65 不合格表 3 后验差检验判别参照表1.3 残差GM(1,1)模型当原始数据序列(0)X 建立的GM(1,1)模型检验不合格时,可以用GM(1,1)残差模型来修正. 如果原始序列建立的GM(1,1)模型不够精确,也可以用GM(1,1)残差模型来提高精度.若用原始序列(0)X 建立的GM(1,1)模型(1)(0)ˆ(1)[(1)]at u uxt x e a a-+=-+ 可获得生成序列(1)X 的预测值,定义残差序列(0)(1)(1)ˆ()()()e k x k xk =-. 若取k=t , t+1, …, n ,则对应的残差序列为{}(0)(0)(0)(0)()(1),(2),,()e k e e e n =计算其生成序列(1)()e k ,并据此建立相应的GM(1,1)模型(1)(0)ˆ(1)[(1)]e a k e ee eu u et e e a a -+=-+ 得修正模型(1)(0)(0)(1)(1)()()(1)e a k ak e e e u u u x t x e k t a e e a a a δ--⎡⎤⎡⎤+=-++---⎢⎥⎢⎥⎣⎦⎣⎦其中1()0k tk t k tδ≥⎧-=⎨≤⎩为修正参数.应用此模型时要考虑:1、一般不是使用全部残差数据来建立模型,而只是利用了部分残差.2、修正模型所代表的是差分微分方程,其修正作用与()k t δ-中的t 的取值有关.1.4 GM(1,1)模型的适用范围定理:当GM(1,1)发展系数||2a ≥时,GM(1,1)模型没有意义.我们通过原始序列()0i X 与模拟序列()0ˆiX 进行误差分析,随着发展系数的增大,模拟误差迅速增加. 当发展系数0.3a -≤时,模拟精度可以达到98%以上;发展系数0.5a -≤时,模拟精度可以达到95%以上;发展系数1a ->时,模拟精度低于70%;发展系数 1.5a ->时,模拟精度低于50%.进一步对预测误差进行考虑,当发展系数0.3a -<时,1步预测精度在98%以上,2步和5步预测精度都在90%以上,10步预测精度亦高于80%;当发展系数0.8a ->时,1步预测精度已低于70%.通过以上分析,可得下述结论:1、当0.3a -<时,GM(1,1)可用于中长期预测;2、当0.30.5a <-≤时,GM(1,1)可用于短期预测,中长期预测慎用;3、当0.50.8a <-≤时,GM(1,1)作短期预测应十分谨慎;4、当0.81a <-≤时,应采用残差修正GM(1,1)模型;5、当1a ->时,不宜采用GM(1,1)模型.1.5 GM(1,1)模型实例分析()()(0)(0)(0)(0)(0)(1),(2),(3),(4)79,74.825,74.29,76.98X x x x x ==对(0)X 作一次累加后的数列为()()(1)(1)(1)(1)(1)(1),(2),(3),(4)79,153.825,228.115,305.095X x x x x == 对(1)X 做紧邻均值生成. 令(1)(1)(1)()0.5()0.5(1)Z k x k x k =+-,得()()(1)(1)(1)(1)(2),(3),(4)116.4125,151.47,150.1925Z z z z ==则数据矩阵B 及数据向量Y 为(1)(1)(1)(2)1116.41251(3)1151.471(4)1150.19251z B z z ⎡⎤--⎡⎤⎢⎥⎢⎥=-=-⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦,(0)(0)(0)(2)74.825(3)74.29(4)76.98x Y x x ⎡⎤⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦ 对参数列ˆ[,]T aa b =进行最小二乘估计,得 176.61ˆ()[,]0.0144T T T T a B B B Y B Y a u -⎡⎤====⎢⎥-⎣⎦即 0.0144a =-,76.61u = 则GM(1,1)模型为()()110.014476.61dx x dt-= 时间响应式为(1)0.0144ˆ(1)5399.13895320.1389xk e -+=- 当1k =时,我们取(1)(0)(0)ˆˆ(1)(1)(0)79xx x === 还原求出(0)X 的模拟值. 由(0)(1)(1)ˆˆˆ()()(1)Xk x k x k =--,取2,3,4k =,得 ()()(0)(0)(0)(0)(0)ˆˆˆˆˆ(1),(2),(3),(4)79,74.281,74.3584,76.4513xx x x x == 通过预测,得到实际值与预测值如下表:实际值 预测值相对误差()k ε 第一学期79 79 0 第二学期 74.825 74.2810 0.73% 第三学期 74.29 74.3584 0.0921% 第四学期76.9876.45130.7051%表 4 四学期的实际值与预测值的误差表因为()10%k ε<,那就可得学生的预测值,与现实值进行比较得出该模型精度较高,可进行预测和预报.我们对学生未来两个学期(也就是第五、六个学期)的成绩进行预测,分别为77.5602分和78.6851分.例:某大型企业1999年至2004年的产品销售额如下表,试建立GM(1,1)预测模型,并预测2005年的产品销售额。