基于支持向量机的水质预测应用实例_张秀菊
- 格式:pdf
- 大小:342.02 KB
- 文档页数:5
支持向量机在水质监测中的应用支持向量机(Support Vector Machine,SVM)是一种常用的机器学习算法,它在分类和回归问题上具有广泛的应用。
而在水质监测中,支持向量机同样发挥着重要的作用。
首先,支持向量机在水质监测中的应用可以帮助我们对水质进行准确的分类。
水质监测是保障水资源安全的重要环节,而水质的分类对于判断水质是否合格至关重要。
支持向量机通过构建合适的分类超平面,将不同水质的样本点分开,从而实现对水质的分类。
其次,支持向量机在水质监测中的应用还可以帮助我们预测水质的变化趋势。
水质的变化受到多种因素的影响,如气候、人类活动等。
通过收集历史水质数据,并结合支持向量机的回归分析方法,可以建立水质变化的预测模型。
这样,我们可以提前了解水质的变化趋势,采取相应的措施,保障水质的安全。
此外,支持向量机在水质监测中的应用还可以帮助我们识别水质异常。
水质异常往往意味着潜在的水质问题,可能对人类健康和环境造成危害。
通过对水质监测数据的分析,结合支持向量机的异常检测算法,可以及时发现水质异常,并采取相应的措施进行处理,以保障水质的安全。
另外,支持向量机在水质监测中的应用还可以帮助我们优化监测方案。
传统的水质监测方法通常需要大量的人力、物力和财力投入,而且监测结果的准确性和实时性也存在一定的问题。
而通过支持向量机的模型建立和优化算法,可以在一定程度上减少监测点的数量,提高监测效率和准确性。
这样,我们可以更加合理地安排监测资源,提高水质监测的效益。
综上所述,支持向量机在水质监测中的应用具有重要的意义。
它可以帮助我们准确地对水质进行分类,预测水质的变化趋势,识别水质异常,优化监测方案。
通过支持向量机的应用,我们可以更好地保障水资源的安全,为人类的生活和环境的可持续发展提供有力的支持。
因此,进一步研究和应用支持向量机在水质监测中的方法和技术具有重要的意义。
支持向量机在水质评价及预测中的应用研究的开题报告一、选题背景随着环境污染的日益加剧,水质成为人们关注的热点之一。
而水质评价及预测是水环境管理、水资源保护和修复的基础,因此,研究水质评价及预测具有重要的理论价值和现实意义。
支持向量机作为一种重要的机器学习算法,在分类、回归、预测等方面具有广泛应用。
然而,支持向量机在水质评价及预测方面的应用研究相对较少。
二、选题意义针对当前水质评价及预测方法存在的问题,开展支持向量机在水质评价及预测中的应用研究,具有如下意义:1.丰富水质评价及预测方法。
支持向量机具有高准确率、强泛化能力、适应性强等特点,在水质评价及预测中能够很好地解决多维、非线性、样本数据较少或噪声干扰较多等问题,丰富了水质评价及预测方法。
2.提高水质管理的效率。
支持向量机模型预测水质污染的趋势及未来出现的可能性,便于对污染源进行防控和干预治理,提高水质管理的效率。
3.促进水环境保护和修复。
支持向量机可对水质污染源进行有效的空间、时间和源头控制,提高水环境保护和修复水平,使水资源得到合理利用。
三、研究内容和方法本研究拟开展支持向量机在水质评价及预测中的应用研究,通过以下研究内容:1.收集并处理相关数据。
收集水质监测数据,包括水中化学氧需求、总磷、总氮、溶解氧等指标。
对数据进行预处理,包括缺失值处理、特征选择等操作。
2.建立支持向量机模型。
在建立支持向量机模型时,需要进行训练集和测试集划分、特征标准化、参数设置等步骤。
考虑到常规支持向量机模型对数据量的要求和计算复杂度较高的问题,本研究将借鉴降维算法等技术对支持向量机进行改进和优化。
3.模型评价和应用。
通过模型评价,包括准确率、召回率、F1值等指标来评价模型性能。
最终应用模型预测未来的水质状况,并对预测结果进行分析和解释。
四、研究计划本研究将在半年内完成以上研究内容,具体计划如下:第一阶段(1个月):收集及整理水质监测数据,进行预处理。
第二阶段(2个月):建立支持向量机模型。
基于支持向量机的鄱阳湖环湖区需水预测模型
张日俊;董增川;郭慧芳
【期刊名称】《水电能源科学》
【年(卷),期】2010()4
【摘要】基于三峡水库对鄱阳湖环湖区水文情势变化的重要影响,并针对鄱阳湖环湖区水生态环境为江西省经济发展的重要保障和支持,采用适合小样本训练的支持
向量机(SVM)模型预测了鄱阳湖环湖区未来规划年的需水量,分别从核函数的选择、模型参数观察了误差曲线变化,最终寻求了适合本地区的SVM模型。
预测结果表明,该模型可正确预测鄱阳湖环湖区的需水趋势,为实现该区的经济社会可持续性发展
奠定了基础。
【总页数】3页(P22-23)
【关键词】鄱阳湖;需水预测;支持向量机;小样本;模型
【作者】张日俊;董增川;郭慧芳
【作者单位】河海大学水文水资源学院;浙江水利水电专科学校
【正文语种】中文
【中图分类】TV213.4
【相关文献】
1.湖区农户湿地保护与移民建镇意愿的影响因素——基于鄱阳湖区农户调查问卷[J], 康兰媛;朱红根
2.环鄱阳湖区旅游产业升级问题研究——基于价值链理论的视角 [J], 徐佳佳
3.基于主体功能区的土地利用分区研究——以环鄱阳湖区为例 [J], 李彦;赵小敏;欧名豪
4.基于Shift-Share的环鄱阳湖区旅游产业的关联效应及发展对策 [J], 张礼萍; 刘念
5.基于主成分分析的支持向量机需水预测模型及其应用 [J], 郭亚男;吴泽宁;高建菊因版权原因,仅展示原文概要,查看原文内容请购买。
支持向量机在水质监测预测与治理中的应用步骤与方法随着工业化进程的加快和人口的增长,水资源的污染问题日益严重,给人们的生活和环境带来了巨大的威胁。
水质监测预测与治理成为了当今社会亟待解决的重要问题之一。
在这个过程中,支持向量机(Support Vector Machine,SVM)作为一种强大的机器学习算法,被广泛应用于水质监测预测与治理中。
支持向量机是一种非常有效的分类和回归算法,其核心思想是寻找一个最优的超平面,将不同类别的数据点分隔开来。
在水质监测预测中,支持向量机可以通过学习历史水质数据,建立一个预测模型,对未来水质进行预测,从而及时采取相应的治理措施。
首先,进行数据收集和预处理是支持向量机应用于水质监测预测的第一步。
我们需要收集大量的水质监测数据,包括水质指标、水源地特征等。
在收集到数据后,需要对数据进行预处理,包括数据清洗、特征选择和数据标准化等。
这些步骤可以提高支持向量机模型的准确性和稳定性。
接下来,选择合适的核函数和参数是支持向量机应用于水质监测预测的关键步骤。
核函数是支持向量机的核心,它可以将低维的输入空间映射到高维的特征空间,从而使得数据在特征空间中更容易分隔。
常用的核函数有线性核函数、多项式核函数和径向基函数等。
在选择核函数的同时,还需要调整相应的参数,如惩罚系数C 和核函数的参数γ等。
通过交叉验证等方法,可以选择最优的核函数和参数组合。
然后,进行支持向量机模型的训练和评估。
在训练过程中,我们将历史水质数据作为输入,利用支持向量机算法学习数据的特征和规律,建立一个预测模型。
在评估过程中,我们将模型应用于测试数据集,计算模型的准确性和泛化能力。
常用的评估指标包括准确率、召回率和F1值等。
最后,根据支持向量机模型的预测结果,制定相应的水质治理措施。
根据预测结果,我们可以判断水质是否达到标准要求,如果不达标,就可以及时采取相应的治理措施,如增加水处理设备、改善污水排放等。
通过不断优化和迭代,可以提高水质监测预测与治理的效果。
支持向量机法在灌区节水改造工程评价中的应用
随着水资源的日益短缺和水环境问题的加剧,灌区节水改造工程已经成为当今中国水
资源管理和可持续水利发展中不可缺少的一环。
在灌区节水改造工程的评价中,支持向量
机法已经被广泛应用。
本文将介绍支持向量机法在灌区节水改造工程评价中的应用及其优势。
支持向量机法是一种基于函数间隔和几何间隔的模式识别方法,具有非线性、高精度、泛化能力强等优点。
在灌区节水改造工程评价中,支持向量机法可以用于预测、分类、回
归等各个方面。
下面分别介绍其应用。
1.预测
在灌区节水改造工程中,预测各种指标的变化趋势是十分重要的。
比如,对于灌区节
水改造工程前后的水资源利用率、经济效益等指标,使用支持向量机法可以有效地预测出
其变化的趋势。
此外,支持向量机法还可以用于预测各种环境变量的变化趋势,如土壤含
水率、气温等,以便灌区节水改造工程的合理规划。
2.分类
在灌区节水改造工程中,不同的项目具有不同的特点和需求,因此需要对其进行分类。
使用支持向量机法可以对不同的项目进行分类,以便更好地进行管理和评估。
比如,可以
将灌区节水改造项目分为节水灌溉、水资源调配等不同的类型,并对其进行统一管理和评估。
3.回归
在灌区节水改造工程中,使用支持向量机法进行回归分析可以对其经济效益、水资源
利用效益等指标进行评估。
通过分析前后数据的差异,可以对灌区节水改造工程的效果进
行评价。
支持向量机法可以有效地分析大量数据,挖掘出数据的非线性关系,为灌区节水
改造工程客观、准确地评估提供依据。
支持向量机在环境监测中的应用案例分析引言:环境监测是保护和改善生态环境的重要手段,而支持向量机(Support Vector Machine,简称SVM)作为一种机器学习算法,在环境监测中的应用也越来越受到关注。
本文将通过分析几个实际案例,探讨SVM在环境监测中的应用价值。
一、水质监测水质监测是环境监测的重要方面之一。
在水质监测中,SVM可以通过对水质数据进行训练,建立一个分类模型,用于判断水质是否达标。
例如,可以将不同水质指标(如溶解氧、氨氮、总磷等)作为输入特征,将水质的类别(合格或不合格)作为输出标签,通过SVM算法进行训练和预测。
这样,当有新的水质数据输入时,就可以利用训练好的模型进行判断,及时发现水质异常情况。
二、大气污染预测大气污染是城市环境监测的重要内容之一。
通过收集大量的大气污染数据(如PM2.5、PM10、SO2、NO2等),可以建立一个SVM回归模型,用于预测未来一段时间内的大气污染水平。
通过对历史数据的分析和学习,SVM可以找到不同污染指标之间的关系,并进行有效的预测。
这样,政府和相关部门可以提前做好应对措施,减少大气污染对人体健康和环境的影响。
三、土壤污染识别土壤污染是农业和工业发展中面临的重要问题之一。
利用SVM算法,可以通过采集不同地点的土壤样本数据,建立一个分类模型,用于识别土壤是否受到污染。
通过对土壤样本的化学成分、重金属含量等指标进行分析,SVM可以对土壤样本进行分类,判断是否存在污染。
这样,农民和农业部门可以根据土壤污染情况,采取相应的措施,保护农作物的生长和人体健康。
四、噪声监测城市噪声是影响人们生活质量的一个重要因素。
通过使用SVM算法,可以对噪声数据进行分类和预测,帮助相关部门制定噪声治理措施。
例如,可以将不同时间段的噪声数据作为输入特征,将噪声级别(如轻度、中度、重度)作为输出标签,通过SVM算法训练一个分类模型。
这样,当有新的噪声数据输入时,就可以利用训练好的模型进行判断,及时采取措施,减少噪声对人们的干扰。
支持向量机法在灌区节水改造工程评价中的应用
支持向量机(Support Vector Machine, SVM)是一种监督学习算法,可以用于分类和回归问题。
它在灌区节水改造工程评价中的应用主要体现在以下几个方面:
1. 水资源利用效率评价:支持向量机可以通过建立一个高维特征空间,通过最大化
类间间隔来实现分类,从而对灌区的水资源利用效率进行评价。
可以通过将灌溉量、作物
需水量、灌溉面积等指标作为特征,将灌区划分为高效利用、中等利用和低效利用三个类别,从而评价不同灌区的水资源利用效率。
2. 优化灌溉方案:支持向量机可以通过学习已有的灌溉方案和相应的灌溉效果,建
立一个回归模型,从而实现灌溉方案的优化。
可以通过将不同的灌溉指标(如土壤含水量、作物蒸腾量等)作为特征,将灌溉量作为目标变量,通过支持向量机训练模型,预测出最
适合当前环境条件的灌溉量。
3. 灌区水资源平衡评估:支持向量机可用于评估灌区内水资源的平衡情况,即进水
量和出水量之间的差异。
通过将不同的水资源流向(如进水量、灌溉用水量、排水量等)
作为特征,将水资源平衡情况(如正平衡、负平衡、零平衡等)作为目标变量,通过支持
向量机进行建模和预测,从而评估灌区水资源平衡的状况。
支持向量机在灌区节水改造工程评价中具有广泛的应用前景,可以不仅可以评价灌区
的水资源利用效率,优化灌溉方案,评估水资源平衡状况,还可以实现灌区水资源的调度,提高整体灌区的节水效益,实现可持续发展。
支持向量机法在灌区节水改造工程评价中的应用
首先,支持向量机法可以用于对灌溉效率进行预测。
在灌区节水改造工程中,提高灌溉效率是非常重要的一个目标。
通过收集大量的相关数据,例如灌水时长、灌水用水量、土壤温度、土壤湿度等,可以构建一个支持向量机模型,该模型可以较为准确地预测灌溉效率。
根据模型预测结果,可以对灌区进行有针对性的改造,提高灌溉效率。
其次,支持向量机法可以用于对供水系统进行优化。
灌区节水改造工程中,优化供水系统是提高灌溉效率和水资源利用率的重要手段。
通过对供水系统的运行数据进行分析和建模,可以得到各个参数之间的关系,进而构建一个支持向量机模型。
这个模型可以用于对供水系统进行优化,例如强化管网的连接、提高管道的水压稳定性等。
综上所述,支持向量机法在灌区节水改造工程评价中具有非常广泛的应用场景,可以用于灌溉效率的预测、供水系统的优化以及灌区水资源的管理等方面,可以帮助灌区节水改造工程实现有效节水、提高水资源利用率和保障农业生产的目标。
PCA-SS-LSSVM算法研究董超;胡艳珍;李晨光【摘要】近年来,支持向量机被广泛地运用于许多行业进行分类、预测分析工作,并取得了很好的效果.虽然标准支持向量机在解决小样本、非线性及高维模式识别中表现出许多特有的优势,但仍存在一定的不足,如计算速度慢、精度不高、资源占用多等.针对上述问题,在总结研究相关算法优缺点基础上,提出了一种新型的组合算法,即PCA-SS-LSSVM算法.结果表明该算法能有效弥补标准支持向量机的不足,具有更好的适应性和应用可行性.【期刊名称】《制造业自动化》【年(卷),期】2017(039)007【总页数】5页(P88-91,105)【关键词】支持向量机;分散搜索算法;主成分分析【作者】董超;胡艳珍;李晨光【作者单位】天津理工大学天津市复杂系统控制理论及应用重点实验室,天津300384;天津理工大学天津市复杂系统控制理论及应用重点实验室,天津 300384;中国石油化工股份有限公司天津分公司,天津 300271【正文语种】中文【中图分类】TP181支持向量机是Corinna Cortes和Vapnik于1995年提出的一种具有很强自学习能力的算法。
其比神经网络具有更好的泛化能力、模型精度不会因使用者的知识差异而不同以及能避免局部最优等优势,因而在许多行业得到了广泛的应用。
例如2016年广东电网有限责任公司电力调度控制中心的王宁等人使用支持向量机回归组合模型对中长期降温负荷进行了预测[1]。
2016年湖南大学的喻胜华、龚尚花利用Lasso和支持向量机对粮食价格进行了预测[2]。
2016年华南理工大学周璇等人使用小波分解和支持向量机对办公建筑空调负荷进行了预测[3]。
2015年吉林大学生物与农业工程学院的任顺等人将支持向量机应用于叶绿素荧光预测光能利用效率的研究中[4]。
2015年河海大学的张秀菊等人利用支持向量机对水质进行了预测[5]。
虽然标准支持向量机有很多优势,能够解决很多行业的预测、分类问题,但是其仍然存在一些弊端。
支持向量机在饮用水水源地水质评价中的应用龙必能【摘要】采用回归支持向量机(SVR)和分类支持向量机(SVM)对饮用水水源地水质进行评价.针对支持向量机学习参数难以确定的不足,利用粒子群优化(PSO)算法寻优支持向量机学习参数,提出PSO-SVR及PSO-SVM评价模型,以文山州2014年13个饮用水水源地水质评价为例进行实例研究.结果表明:利用PSO算法寻优支持向量机学习参数可有效提高模型的评价精度和泛化能力.PSO-SVR及PSO-SVM模型对实例水质评价结果相同,各具特点和优势,均可用于相关水质综合评价.【期刊名称】《人民珠江》【年(卷),期】2016(037)005【总页数】5页(P85-89)【关键词】水质评价;粒子群优化算法;支持向量机;参数优化;饮用水水源地【作者】龙必能【作者单位】云南省水文水资源局文山分局,云南文山663099【正文语种】中文【中图分类】X824客观、科学地评价饮用水水源地水质对于保障饮用水源安全、开展水源规划、水源地防污治污以及实行最严格水资源管理制度均具有重要意义。
目前,水质综合评价方法主要有指数法[1]、主成分分析法[2]、层次分析法[3]、灰色关联法[4]、模糊法[5]、BP神经网络法[6]、支持向量机法[7]、集对分析法[8]以及投影寻踪法[9]等,均在水质综合评价中取得了积极的应用效果。
其中,支持向量机由于其优良的“理论全局最优”、“克服维数灾”等特点在各行业领域具有广泛的应用。
其应用类型分为回归支持向量机(Support Vector Regression,SVR)和分类支持向量机(Support Vector Machines,SVM)。
在实际应用中,合理选取支持向量机学习参数对于模型的性能有着关键性影响,传统试凑等选取支持向量机学习参数的方法已不能满足实际应用需求。
基于此,现采用SVR及SVM对饮用水水源地水质进行综合评价,利用粒子群优化(Particle Swarm Optimization,PSO)算法搜索支持向量机学习参数,提出PSO-SVR及PSO-SVM评价模型,以文山州2014年13个饮用水水源地水质评价为例进行实例研究,旨在为饮用水水源地水质综合评价提供参考。
文章编号:1007-2284(2015)01-0085-05基于支持向量机的水质预测应用实例张秀菊1,安 焕1,赵文荣1,张琴玲2(1.河海大学水文与水资源学院,南京210098;2.芜湖水文水资源局,安徽芜湖241000) 摘 要:水质预测作为水环境污染控制的重要手段,能够预测水质的变化趋势,从而有效地控制水质恶化情况。
分析了支持向量机的回归理论和算法;构建了支持向量机水质预测模型。
应用实例以通州区新江海河站点为研究对象,取NH3-N浓度和TP浓度为时间序列样本,运用支持向量回归机的理论与方法,构造预测模型,并利用Libsvm软件包和MATLAB软件进行水质预测。
从整体预测效果来看,其预测结果能较好地反映水质情况。
关键词:水环境;水质预测;支持向量机;回归理论 中图分类号:TV213.4 文献标识码:AAn Application Example of Water Quality Prediction Based on Support Vector MachinesZHANG Xiu-ju1,AN Huan1,ZHAO Wen-rong1,ZHANG Qin-ling2(1.College of Hydrology and Water Resources,Hohai University,Nanjing 210098,China;2.Wuhu Hydrology and Water Resources Bureau,Wuhu 241000,Anhui Province,China)Abstract:As an important means of water environmental pollution control,water quality prediction can predict the change trend ofwater quality so as to control water deterioration effectively.This paper analyses regression theory and algorithm of Support VectorMachine,and establishes Support Vector Machine model for water quality prediction.We take Xinjianghai River of Tongzhou Dis-trict as a research example,and the concentration of NH3-N and TP as time series samples,and establishes a model to predict wa-ter quality by using the theory and method of Support Vector Regression and taking advantage of Libsvm software and MATLABsoftware.From the perspective of overall prediction results,it shows that prediction results of Support Vector Machine model canreflect water quality situation well.Key words:water environment;water quality prediction;support vector machine;regression theory收稿日期:2014-04-29基金项目:中央高校基本科研业务费专项资助项目(2011B01814);江苏省水利科技资助项目(2010015)。
作者简介:张秀菊(1971-),女,博士,副教授,研究方向为水资源规划与管理。
E-mail:xjzh03@sina.com。
我国水污染严重,水环境治理迫在眉睫。
水质预测是水环境治理的主要研究内容之一,建立数学模型,系统准确地进行水质预测,是进行水污染控制的有效手段。
污染物进入水体后,在随水流迁移过程中受到水文、物理、化学、生物等因素的影响,引起污染物的输移、混合、分解和衰减[1]。
根据已经掌握的资料和监测数据,研究水质预测影响因子之间的关系、建立水质预测模型。
通过可靠的水质预测模型,可以根据监测数据等条件计算出水体中的污染物浓度及其随时间发展的变化情况,从而用来预测和控制水质,掌握水质现状及其发展趋势,分析水环境污染原因和危害性[2],减小各方面的损失。
因而水质预测模型对水质预测分析和水环境污染防治管理具有十分重要的意义。
1 水质预测模型研究现状国内外学者上个世纪开始用水质模型来研究水质。
早在1925年,美国科学家Streeter和Phelps研究俄亥俄河污染问题时建立了一维河流水质模型;其后,前苏联Bel等根据简化的和统计的模型来讨论各种水动力弥散理论、边界与初始条件的形式,以及弥散系数与水流速度和渗透介质几何形状关系的理论[3];Fried[4]研究了经典模型与水动力弥散方程,提出了考虑固体物质与孔隙分界面上浓度与浓度梯度跳跃变动的新水动力弥散模型;1979年,美国麻省理工学院提出了多目标规划理论和水质数学模型。
随着人工智能算法的兴起,人工神经网络在水质预测方面也发展迅速。
58中国农村水利水电·2015年第1期国内对水质模型的研究起步相对较晚。
20世纪80年代初,杨天行、王秉忱等人在《湘江重金属水环境容量研究》中建了“湘江重金属随水-悬浮物-底泥态建立的迁移转化联合模型”。
随后一些学者尝试用指数平滑法进行水质预测,预测结果接近于实际,适用于中短期的预测。
灰色系统分析法对于信息不完整(或不完全)情况,具有良好的适用性,其中邓聚龙教授创建的灰色系统理论预测模型GM(1,1)模型及其改进型在水质预测中得到较为广泛的运用[5]。
总的来说,当前的水质预测方法大致可以分为5类:数理统计预测方法、灰色系统理论预测法、神经网络模型预测法、水质模拟模型预测法、混沌理论预测法[6]。
根据监测数据与水质参数之间的映射关系,可分为两类:一是建立显式关系,其本质上是通过建立线性模型来进行预测,实现起来较容易,但模型可靠性较差。
二是建立隐式关系,如人工神经网络方法;这些方法也存在一些问题,比如如何确定网络结构的问题、过拟合与欠拟合问题、局部极小点问题等[7]。
因此,有限样本情况下的学习机器理论研究逐渐成熟起来,形成了较完善的理论体系———统计学习理论。
支持向量机(Support Vector Machine,SVM)是基于统计学习理论发展起来的一种新类型的机器学习方法,是结构风险最小化准则的具体实现,已成为当今的研究热点之一。
2 支持向量机理论2.1 支持向量机发展现状支持向量机是由AT&T贝尔实验室的Vapnik[8]及其研究小组于1995年根据统计学理论提出来的一类新型的机器学习方法。
它采用核函数思想,把非线性空间的问题转换到线性空间,降低了算法的复杂度,具有较强的学习泛化能力,该方法是求解一个二次型寻优的问题,采用结构风险最小化原则,从理论上得到的是全局最优解,能够在对小样本学习的基础上对其他样本进行快速、准确的拟合预测。
由于SVM有较完备的理论基础和较好的学习性能,在解决有限样本、非线性、过学习及高维模式识别问题中表现出许多特有的优势,成为当前的研究热点问题之一,并在很多领域都得到了成功应用。
总之,无论在理论基础上还是在应用前景上,SVM都具有很大的优越性。
水质预测问题的实质是水质参数回归的问题[9],因此新兴的机器学习支持向量机能够解决水质预测问题。
本文基于这一出发点,利用支持向量回归机的理论与方法,并利用Libsvm软件包和MATLAB软件进行水质预测,详细研究了支持向量机的理论与方法,探讨将支持向量机算法应用于水环境的水质预测的可行性,并运用于实际问题的研究,为水资源规划和可持续开发利用提供了决策依据和技术支持。
2.2 支持向量机回归理论用SVM预测水质的基本思想是:给定一组水质训练样本集的训练集(xi,yi)(i=1,2,…,n),其中xi∈Rn,yi∈R,通过一个非线性映射φ将样本数据从样本空间映射到高维特征空间进行线性回归,从而求解出一个包含多种因素影响的水质最优回归函数[10]。
在最优回归函数中采用适当的核函数k(xi,x)代替高维空间中的向量内积φ(xi)·φ(x)就可以实现φ非线性变换后的线性拟合,得到最优回归函数为:f(x)=∑i∈SV(αi-α*i)k(xi,x)+b(1)式中:αi、α*i为拉格朗日乘子;b为回归阈值;SV为支持向量。
模型建立过程中还需要选择核函数、损失函数和确定SVM参数。
核函数的选择是支持向量机理论研究的一个核心问题。
目前常用的几种核函数的选择主要还是根据经验来选取,没有一个针对特定问题选择最佳核函数的有效办法。
只有在选择了核函数后,才能对惩罚参数C进行调整,所以核函数的选择对支持向量机的性能在不同的应用领域有不同的影响。
在实际应用中,径向基(Radial Basis Function,RBF)核函数是目前在支持向量机中被应用得最广泛的一种核函数。
对于初学者来说,RBF核无疑是优先考虑的核函数之一。
故本研究选择了RBF核函数建模;选择RBF核函数K(x,y)=e-γ|x-y|2,损失函数选取ε不敏感损失函数c(x,y,f(x))=^c(y-f(x)),SVM参数包括惩罚参数C、不敏感参数ε和RBF核参数γ。
基于支持向量机的回归模型建立过程见图1。
图1 基于支持向量机的回归模型建立过程Fig.1 Establishment of regression model basedon Support Vector Machine2.3 支持向量机算法步骤(1)数据归一化。
为了消除输入变量之间由于量纲和数值大小的差异而造成的影响,避免模型计算时出现病态,将模拟数据标准化到[0,1]区间,然后将标准化后的数据作为模型的输入值。
其标准化公式为:x′i=(xi-minxi)/(maxxi-minxi)(2)式中:x′i为第i项评价因子xi的规范化处理值。
(2)输入输出变量设置。
通过编号m时的前k个编号的历史数据来预测编号m时的NH3-N值,即估计动态系统[11]:ym=f(xm-1,xm-2,…,xm-k)(3)式中:ym为编号m时的污染物浓度值;k为滞后编号数,这样整个系统的输入就是某编号m时的前k个编号至前1个编号的污染物浓度值,而输出则是编号m时的污染物浓度值(表1)。