城市用水量预测模型及应用
- 格式:pdf
- 大小:2.05 MB
- 文档页数:2
城市供水量的预测模型一. 实验任务:现在有某城市连续 7 年(2000-2006年)1月份的总用水量历史记录(单位:万吨),为方便安排生产调度计划,某供水公司需根据供水记录估计2007年1月份的供水量。
试根据已有数据建立数学模型来预测 2007 年 1 月份城市的计划供水量。
表1 2000-2006年1月份某城市的总用水量(单位:万吨) 年份2000 2001 2002 2003 2004 2005 2006 用水量 4032.41 4186.0254 4296.9866 4374.852 4435.2344 4505.4274 4517.6993二.算法的过程:本实验通过Lagrange 插值法来建立数学模型,其基本原理如下: 对给定的n+1个节点x0 , x1,x2,…,xn 及对应的函数值y0 , y1,y2,…,yn ,利用n 次Lagrange 插值多项式,插值区间内任意x 的函数值y 的近似值。
其中: )())(()()())(()()(110110n k k k k k k n k k k x x x x x x x x x x x x x x x x x l --------=+-+- 算法程序如下:)(0x l y y k n k k ∑==function Lagelangrichazhifa(x,y,p)%拉格朗日插值法代码%已知数据点的x坐标向量(年份):x%已知数据点的y坐标向量(月用水量):y %插值点的x坐标(年份):p%求得的在p处的插值(月用水量):zz=0;s=1;A=size(x);n=A(2);for i=2:ns=s*(p-x(i))/(x(1)-x(i));endL(1)=s*y(1);L(1);for k=2:ns=1;for i=1:k-1s=s*(p-x(i))/(x(k)-x(i));ends;for i=k+1:ns=s*(p-x(i))/(x(k)-x(i));endL(k)=s*y(k);endfor i=1:nz=z+L(i);enddisplay('该处应用拉格朗日插值法得到插值为:')z调试:代码调试完成无错误后其保存文件为Lagelangrichazhifa.m,然后在命令窗口输入:x=[2000 2001 2002 2003 2004 2005 2006];y=[4032.41 4186.0254 4296.9866 4374.852 4435.2344 4505.4274 4517.6993];p=2007;Lagelangrichazhifa(x,y,p)得到如下结果:z = 4.0903e+003在MA TLAB上运行后的结果为(截图):分析结果:通过拉格朗日插值法建立数学模型预测得2007年1月份该城市总用量为4090.3万吨,教材用三次样条插值法预测得总体预测情况得2007年1月份该城市总用量为4378.1万吨,相差不超过6.6%,总体实验情况良好。
基于大数据分析的城市用水量预测模型研究随着人口的增加和城市化的不断推进,城市供水管道面临着越来越大的压力。
为了保证城市的供水安全和水资源利用的高效性,需要对城市的用水量进行定点监测和分析,并建立科学的用水预测模型。
基于大数据的分析是目前最受欢迎的分析方法之一,它能够帮助城市管理者更准确地预测城市用水量,以便合理分配城市的水资源,维持城市的正常运行。
一、大数据在城市用水量预测中的应用随着技术的不断进步,城市用水监测系统日益完善,大量的监测数据也不断积累。
基于大数据的分析可以对这些数据进行深度挖掘,发掘数据中的规律和趋势,从而提供高质量的预测结果。
在城市用水量预测中,大数据技术主要有以下几个方面的应用:1. 数据采集数据采集是大数据分析的第一步,也是非常关键的一步。
城市用水监测系统可以通过传感器收集各个采集点的用水情况,并将其存储在数据库中。
大数据技术可以实时监测水质,追踪用水量的变化,分析用水的原因和趋势,进而做出准确的预测。
2. 数据清洗数据采集后,需要对采集到的数据进行清洗,去除异常值和噪声,处理空值和缺失值。
这样可以保证数据的一致性和可靠性,提供可供分析的数据集。
例如,可以使用数据挖掘技术对数据进行降维处理,压缩数据的维度,减少数据的冗余程度,使数据更具有解释性,从而使得结果更为准确。
3. 模型构建在数据清洗之后,就可以建立合适的预测模型了。
目前,常用的预测模型有时间序列分析、神经网络模型、回归分析等。
这些模型都可以用于城市用水量的预测。
例如,可以将数据分为训练集和测试集,利用训练集对模型进行训练,然后用测试集来验证训练结果。
在模型评估时,可以使用交叉验证技术,将数据集分成若干份,每次利用其中的一份作为测试集,其余数据作为训练集,以避免过拟合。
4. 预测分析预测分析是大数据分析的最后一步。
基于预测模型,可以对未来的城市用水量进行预测。
同时,通过对预测结果的分析,可以发现用水的规律和趋势,进一步提高预测的准确率。
城市供水量预测摘要本文首先对数据进行详细分析,发现用水量数据以1年为周期呈时间周期规律,并有上升趋势,温度历史数据也呈时间周期规律,温度和用水量之间无明显规律。
价格因素对数据的增长突出表现为减缓制约作用。
在分析的过程中对数据表中水量的两个奇异点以平均值替代,温度则模拟温度趋势函数,利用趋势函数预测值替代。
从题目问题入手,对于数据的预测必须考虑时间数据、温度因素和价格因素对预测数据的影响,提取每年1月的数据进行预测,数据表的时间序列关系从横向可利用趋势向外延伸预测,纵向可利用季节变动预测,温度与待预测数据之间利用相关性分析和回归分析处理,最后对3个预测加权组合,得到数据的组合预测模型。
针对问题一、二,分别考虑日数据的预测和月统计数据的预测,日数据横向采用一次指数平滑法,纵向采用季节比例预测法,月数据采用一次指数平滑法和灰色GM(1,1)模型进行预测,对温度因素进行相关性分析和回归分析,价格因素在问题一、二中视其体现在时间序列的增长因子中,最后综合考虑各模型建模的立足点,运用最优加权组合模型和经验加权组合模型提高预测精度。
针对问题三价格调整,按照一、二预测模型的思想,考虑价格因素制约季节比例模型中的趋势增长指数,建立制约函数进行回归分析,以目标规划思想求解调整价格,另外也提出预测城市用水量可支出总金额,建立总金额与目标用水量的关系得到调整价格。
通过预测,我们得到2007年1月城市用水量的预测结果为:74.5909*10吨;一号水厂的供水量预测结果为:72.8185*10吨;二号水厂的供水量预测结果为:71.7497*10吨。
2007年8月调价参考价格为:5.41元。
本文最大的特点是把握数据的自身特点,从多立足点对数据进行分析预测,针对不同的实际情况作出相应调整,运用简单的预测方法达到现代算法和复杂算法的预测效果,对情况复杂但具有一定规律的数据的处理和预测有一定参考意义。
关键词:城市用水量;数据分析;时间序列;组合模型;季节比例分析一、问题的提出随着经济发展,城市规模不断扩大,给水系统的供需矛盾更加突出,城市水量紧缺的现象越来越普遍。
收稿日期:2004202219基金项目:中欧科技合作第五框架项目(ICA4-2001-10182)作者简介:侯煜 (19732),男,河南郑州人,郑州市自来水公司工程师。
同济大学环境科学与工程学院市政工程专业在读硕士研究生。
文章编号:100423918(2004)0420502203城市日用水量的自回归模型(AR)预测方法侯煜 , 刘遂庆, 陶 涛(同济大学环境科学与工程学院,上海 200092)摘 要:介绍了利用自回归模型(AR )预测城市日用水量的方法,阐述了AR 模型的阶数和自回归系数的求解,并结合工程实例,预测出某城市日用水量,达到了较好的预测效果。
关键词:自回归模型;预测;日用水量中图分类号:TU 991.31 文献标识码:A城市日用水量的科学预测是供水系统优化调度的一项前提工作。
由于城市用水量变化的复杂性,解释性预测一般无法建立包含详尽的影响用水量变化因素的分析模型,目前常用的是采用时间序列分析。
时间序列法认为预测变量只依赖于本身的历史观测数据及观测模式,通过序列数据的特征分析找出其变化规律并外推出未来的值(包括指数平滑法,自回归模型AR ,移动平均模型MA ,自回归移动平均混合模型ARMA 等)。
(变量x t 是关于其自身既往值的回归),进行城市日用水量的预测。
1 时间序列平稳性的判别 如果已知某一时间序列x 1,x 2,…,x t …,那么这个时间序列的自回归模型AR 为:x t -μ=φ1(x t -1-μ)+φ2(x t -2-μ)+…+φp (x t -p -μ)+e t (1)μ—时间序列的平均数;φi —自回归系数;p —自回归模型的阶数;e t —估计误差。
总体的平均数μ不知道,可以用这个时间序列前n 个时期的平均数x 来代替。
x =1n∑nt =1xt(2)因为AR 模型的建立基于平稳时间序列数据(时间序列的平稳性是指一个时间序列的统计特征不随时间推移而变化),所以先要用自相关分析来判别该时间序列是否平稳时间序列,如果不是,可用差分的方法把它转化为平稳时间序列。
1:任务:首先收集数据,然后以插值法为基础对收集到的关于城市供水量预测模型的数据进行计算和处理,由此得出一个关于城市供水量预测的结论。
2:过程:1:提出问题:现在有某城市 7 年的历史记录,记录中给出了日期,每日用水量(吨/日) ;当日的最高温度和最低温度;一号水厂和二号水厂日供水量. 请充分地利用这些数据建立数学模型给出1.预测 2007 年 1 月份城市的计划供水量.2.预测 2007 年 1 月份城市中每个水厂的计划供水量.3.由于水资源的匮乏,必须要节约水资源.除制定法规和加强宣传外,提高水价格也是节水的主要措施.采用每年调一次水价的措施,希望2007 年 8 月份的供水量不超过 5045 万吨,请确定合理的水价调整方案.2:算法过程:二次曲线模型(Quadratic): y = b0 + b1t + b2t 2三次曲线模型(Cubic): y = b0 + b1t + b2t 2 + b3t 3对数曲线模型(Logarithmic): y = b0 + b1 ln t生长曲线模型(Growth): y = eb0 +b1t曲线模型(S-curve): y = eb 0 +b1 t幂指数曲线模型(Power): y = b0t b1求解上述回归方程时,需对 R 2 ,F 值和 P 值统计量进行分析.GM(1,1)模型. 记 x = ( x(1), x(2),...x(n)), 其中 x(i ) 表示第i 年数值. Step1:令 x ( 0) 为 GM(1,1)建模序列,表示灰导数 x (0) = ( x (0) (1), x (0) (2),..., x (0) (n)) 其中 x ( 0) (k ) = x(k ) , k = 1,2,3... Step2:令 x (1) 为 x ( 0) 的 AGO 序列,对 x ( 0) 作累加生成,即得到新的序列 x (1) , x (1) = ( x (1) (1), x (1) (2),..., x (1) (n)) x (1) (1) = x (0) (1) -6- x (1) (k ) = ∑ x (0) (m) m =1 k Step3:令 z (1) 为 x (1) 的均值(MEAN)序列,表示白化背景值 z (1) (k ) = 0.5 x (1) (k ) + 0.5 x (1) (k 1) z (1) = ( z (1) (2), z (1) (3),..., z (1) (n)) (5.9) 则得到GM(1,1)的灰微分方程模型为 x ( 0) (k ) + az (1) (k ) = b (5.10)式中: a,b 为待估计参数,分别称为发展灰度和内生控制灰度. 其中, a= ∑ z (1) (k )∑ x ( 0) (k ) (n 1)∑ z (1) (k ) x (0) (k ) k =2 k =2 n n n (n 1)∑ z (k ) (∑ z (k )) (1) 2 (1) k =2 k =2 n n n n n k =2 n ; 2 b= ∑ z (1) (k )∑ z (1) (k ) 2 ∑ z (1) (k )∑ z (1) (k )x ( 0) (k ) k =2 k =2 k =2 k =2 (n 1)∑ z (1) (k ) 2 (∑ z (1) (k )) 2 k =2 k =2 n n 经变换后得到 x ( 0) (k ) = b az (1) (k ) (5.11) GM(1,1)模型的求解模型的求解在(5.11)两端同时乘以 eak 得, eak x (0) (k ) + e ak az (1) (k ) = e ak b 即z (1) (k ) = e ak ∫ (beak d t + C ) = Ce ak + 将代入上式中,可得 b a b a C = x 0 (1) 于是得出时间函数 x (1) (k + 1) 的估计值 -7- b b x (1) (k + 1) = [ x 0 (1) ]e ak + a a (5.12) 通过累加求和的方法可以计算出 2007 年 1 月份一,二号水厂的计划供水量为 2840.37 万吨和 1766.92 万吨,水厂预测供水总量4607.29 万吨. 若用前七年 1 月份的用水总量和两个水厂供水总量预测 2007 年 1 月份的总供水量和两个水厂供水总量,作回归分析得到如下方程: y = 40196180.3 + 2592441ln t 1 月份一号水厂总计划供水量预测方程: (5.13) y = 23718972.3 + 1341046t 157162t 2 + 7332.389t 3 1 月份二号水厂总计划供水量预测方程: (5.14) y = 14816050.4 + 664617t 44109.8t 2 (5.15) 此方法计算出 2007 年1 月份计划总供水量为 4558.70 万吨, 与累加求和得到的一月份总供水量的相对误差约为 0.5%; 2007 年 1 月份一水厂计划供水量为 2814.32 万吨, 与累加求和得到的一月份一水厂计划供水量的相对误差约为 0.92%; 2007 年 1 月份二水厂计划供水量为1731.00 万吨, 与累加求和得到的一月份二水厂计划供水量的相对误差约为 2%.计算机程序n=7;g0=[1297080, 1369760.4, 1313812.48, 1407886.2, 1449868.8, 1364580, 1469586.902];x0=sqrt(g0);x1=zeros(1,n);x1(1)=x0(1);for i=2:n,x1(i)=x1(i-1)+x0(i);endfor i=1:n-1,z1(i)=(x1(i+1)+x1(i))/2;endC=sum(z1);D=x1(n)-x1(1);E=sum(z1.*x0(2:n));F=sum(z1.^2);deta_a=C*D-(n-1)*E;deta=(n-1)*F-C^2;deta_b=D*F-C*E;a=deta_a/deta;b=deta_b/deta;for k=0:19,x2(k+1)=(x0(1)-b/a)*exp(-a*k)+b/a; endx3(1)=x0(1);for k=1:19,x3(k+1)=x2(k+1)-x2(k);end3:上机调试过程:调试程序的过程中因为自己对程序编写过程中出现常识性的错误,对程序的不熟悉,以及不能正确的运用matlab软件,导致问题频出,程序出错,无法得出计算结果。
运用线性回归及GM模型预测城市用水量摘要:本文通过采用多元线性回归的方法,得到相对最优的回归预测模型。
再通过利用GM(1,1)模型,预测出规划年每个变量的值,代入多元回归模型,这样充分利用了两种模型的优点,从而合理预测城市用水量,达到预测精度高,结果更为合理可靠。
关键词:多元线性回归;GM(1,1)模型;预测;城市用水量城市用水量的大小关系着城市的发展。
如何比较准确地预测城市用水量,是政府在城市发展过程中必须解决的极为重要的问题。
由于影响城市用水量的因素比较多,而诸多因子间又存在着相关关系,因此,能够尽可能使它们全面反映问题的信息量。
所以,城市用水量的预测可以采用综合指标法、平均增长率法等进行经验类推可以取得较好的研究结果。
但是,在城市发展进程中,由于受到一些变化因素的影响,其市场数据存在不规则的变化,采用历史数据类推则达不到理想的效果。
本文采用多元线性回归法与GM(1,1)模型耦合进行城市用水量预测,充分利用两种模型的优点,从而达到较好的预测结果。
1 多元线性回归模型(MLR)设有组观测数据,分别为:假设这组数据满足以下关系式:(1)(2)其中,是()个有待估计的参数,称为总体回归参数;是个相互独立的随机变量,其均值都为0,方差为,即遵从同一正态分布,这就是多元线性回归的数学模型。
2GM(1,1)模型灰色预测模型(GM)通过对原始数据进行生成处理,使其呈指数趋势变化,建立指数微分方程,最终得到预测模型。
而灰色预测主要是对原始数据的处理和灰色模型的建立、发现、掌握系统发展规律,对系统的未来状态作出科学的定量预测。
设为非负序列,为的1-AGO序列,为的紧邻均值生成序列,,则称(5)为灰色微分方程(6)的白化方程,则1.白化方程的解为(7)2. 的时间响应序列为(8)3.取,则(9)4.还原值(10)3 试验数据统计影响城市用水量的因素很多,例如人口、经济、工业、供水能力、人均日生活用水量、固定资产值等等。