区域经济中长期预测的支持向量回归方法
- 格式:pdf
- 大小:530.90 KB
- 文档页数:10
基于 SVM 的“弹性系数-投入产出”电力需求预测分析模型董力通;谭显东;刘伟国;刘海波【摘要】Based on the fact that the demand of electricity must be reasonably forecast, which is an important basis to ensure the power grid planning and industrial development, in order to optimize industrial structure and promote energy conservation and emission reduction, there are many uncertain factors to change the medium and long-term electricity demand, considering the effects of multiple factors on the elastic coefficient of the electric power economic development, according to the input-output model, a forecasting model was constructed using the algorithm of support vector machine(SVM). Using electricity demand and GDP, taking the industrial structure of data in 2000-2009 as samples, the total electricity demand in 2010 was forecast. The results show that compared with elastic coefficient regression forecasting and ordinary common SVM forecasting method, the forecasting accuracy of the total electricity demand increases by 8.90% and 3.98%, respectively.%基于合理预测电力需求,是保证电网规划与产业发展合理性的重要依据,在我国优化产业结构、推进节能减排的环境下,电力中长期需求的变化面临更多不确定因素,考虑多个因素对电力经济发展弹性系数的影响,按照投入产出模型,运用支持向量机算法构建预测模型.以2000- 2009年我国电力需求及GDP,产业结构的数据为样本,预测2010年的电力需求总量.通过与普通弹性系数回归预测、普通支持向量机预测方法对比,电力需求总量预测精度分别提高8.90%和3.98%.【期刊名称】《中南大学学报(自然科学版)》【年(卷),期】2012(043)006【总页数】4页(P2441-2444)【关键词】电力需求;弹性系数;投入产出;支持向量机【作者】董力通;谭显东;刘伟国;刘海波【作者单位】华北电力大学经济与管理学院,北京,102206;国网北京经济技术研究院,北京,100052;国网能源研究院,北京,100052;国家电网公司,北京,100031;华北电力大学经济与管理学院,北京,102206;国网北京经济技术研究院,北京,100052【正文语种】中文【中图分类】F426合理预测电力需求对于制定电力规划、电力建设具有重要意义。
空间数据挖掘算法及预测模型一、引言空间数据挖掘算法及预测模型是地理信息系统(GIS)领域的重要研究方向。
随着遥感技术的发展和传感器网络的普及,获取了大量的空间数据,如地理位置信息、气象数据、人口统计数据等。
这些数据在城市规划、环境监测、交通管理等方面起着重要的作用。
本文将介绍空间数据挖掘算法及预测模型的基本概念、常见方法和应用案例。
二、空间数据挖掘算法1. 空间数据挖掘概述空间数据挖掘是从空间数据库中发现特定模式和关系的过程。
它可以帮助我们理解地理空间中的变化和关联性。
空间数据挖掘算法可以分为聚类、分类、关联规则挖掘等多个方面。
2. 空间数据聚类算法空间数据聚类是将相似的空间对象归类到同一组或簇中的过程。
常见的聚类算法有基于密度的聚类算法(如DBSCAN)、基于网格的聚类算法(如STING)、基于层次的聚类算法等。
这些算法可以帮助快速识别出地理空间中的热点区域、异常值等。
3. 空间数据分类算法空间数据分类是根据不同的属性和特征将地理空间对象进行分类的过程。
常用的分类算法有决策树、支持向量机(SVM)、人工神经网络等。
通过使用这些算法,可以对地理空间对象进行自动分类和识别,如土地利用类型、植被覆盖类型等。
4. 空间数据关联规则挖掘算法空间数据关联规则挖掘是在地理空间中发现不同空间对象之间的相关性和关联关系。
常见的关联规则挖掘算法有Apriori、FP-growth等。
这些算法可以帮助我们发现地理空间中的相关性模式,如犯罪与社会经济因素之间的关系。
三、空间数据预测模型1. 空间数据模型概述空间数据模型是对地理空间对象进行描述和建模的一种方法。
常见的空间数据模型有基于图的数据模型、基于栅格的数据模型、基于矢量的数据模型等。
这些模型可以帮助我们对地理空间中的实体和属性进行建模和分析。
2. 空间数据预测模型空间数据预测模型是基于历史数据和现有数据对未来空间情况进行预测的一种方法。
常见的空间数据预测模型有回归分析、时间序列分析、人工神经网络等。
第27卷第11期2021年11月计算机集成制造系统Vol.27No.11 Computer Integrated Manufacturing Systems Nov.2021DOI:10.13196/j.cims.2021.11.016基于Kriging模型的自适应多阶段并行代理优化算法乐春宇,马义中+(南京理工大学经济管理学院,江苏南京210094)摘要:为了充分利用计算资源,减少迭代次数,提出一种可以批量加点的代理优化算法。
该算法分别采用期望改进准则和WB2(Watson and Barnes)准则探索存在的最优解并开发已存在最优解的区域,利用可行性概率和多目标优化框架刻画约束边界。
在探索和开发阶段,设计了两种对应的多点填充算法,并根据新样本点和已知样本点的距离关系,设计了两个阶段的自适应切换策略。
通过3个不同类型算例和一个工程实例验证算法性能,结果表明,该算法收敛更快,其结果具有较好的精确性和稳健性。
关键词:Kriging模型;代理优化;加点准则;可行性概率;多点填充中图分类号:O212.6文献标识码:AParallel surrogate-based optimization algorithm based on Kriging model usingadaptive multi-phases strategyYUE Chunyu,MA Yizhong+(School o£Economics and Management,Nanjing University of Science and Technology,Nanjing210094,China) Abstract:To make full use of computing resources and reduce the number of iterations,a surrogate-based optimization algorithm which could add batch points was proposed.To explore the optimum solution and to exploit its area, the expected improvement and the WB2criterion were used correspondingly.The constraint boundary was characterized by using the probability of feasibility and the multi-objective optimization framework.Two corresponding multi-points infilling algorithms were designed in the exploration and exploitation phases and an adaptive switching strategy for this two phases was designed according to the distance between new sample points and known sample points.The performance of the algorithm was verified by three different types of numerical and one engineering benchmarks.The results showed that the proposed algorithm was more efficient in convergence and the solution was more precise and robust.Keywords:Kriging model;surrogate-based optimization;infill sampling criteria;probabil让y of feasibility;multipoints infill0引言现代工程优化设计中,常采用高精度仿真模型获取数据,如有限元分析和流体动力学等E,如何在优化过程中尽可能少地调用高精度仿真模型,以提高优化效率,显得尤为重要。
基于遗传算法参数优化的最小二乘支持向量机财务困境预测作者:赵冠华李玥赵娟来源:《科学与管理》2011年第05期摘要:传统支持向量机应用于财务困境预测时,需要求解复杂的二次规划问题,求解难度大。
而最小二乘支持向量机模型可以将二次规划问题变成一个线性方程组来求解,有效降低了模型求解的难度。
尤其是将遗传算法应用于最小二乘支持向量机模型参数和核参数的优化时,显著提高了模型预测的正确率。
本文从沪深两市随机抽取了2002年-2007年252家A股上市公司作为研究样本,并把研究样本分为两组,对这两组样本数据分别进行了短期及中长期预测。
实证结果表明,基于遗传算法的最小二乘支持向量机模型的预测效果不但好于传统统计类Logit模型,也优于传统支持向量机模型。
短期预测效果显著优于中长期预测效果,训练样本数直接影响到模型的预测效果,二者呈正相关关系。
关键词:遗传算法;最小二乘支持向量机;参数优化;短期预测;中长期预测1、引言随着我国市场经济体制改革的进一步深化和全球经济一体化的加快,尤其是全球金融危机带来的巨大冲击,加之我国经济发展中存在的诸多矛盾,使得我国企业面临着巨大的财务风险。
在这种激烈的竞争环境中,如何协助企业及时、有效地规避和分散财务风险,就成了理论界和实务界探讨的热点问题。
为了能对企业未来的财务状况及时做出预测,各国学者运用不同的预测变量、采用各种数学工具和方法,建立了大量的财务预警模型。
早期的财务困境预测模型主要是传统统计类预测模型,代表性成果主要有:Fitzpatrick[1]、Beaver[2]的一元判别分析模型;Altman[3]的多元判别分析模型;Ohlson[4]的Logit回归模型;Theodossiou[5]的累积求和模型。
近年来,随着计算机技术和人工智能的发展,出现了一些新兴的人工智能型财务预警模型,代表性成果主要有:Odom[6]、Coats & Fant[7]、Charalambous etc.[8]以及国内学者杨淑娥[9]的人工神经网络模型;Varetto Franco[10]、Shin & Lee[11]的遗传算法模型;Franeis EH[12]、Dimitras AI[13]的粗集理论模型。
基于机器学习算法的时间序列预测研究随着人们对数据的需求不断增加,机器学习技术受到了越来越多的关注。
其中,基于机器学习算法的时间序列预测也成为了十分热门的研究方向。
本文将对其进行一定的探讨和阐述。
一、时间序列预测的背景与意义时间序列是指按时间顺序排列的一组观测值,它们之间存在着某种依赖或相关性。
时间序列分析与预测是一种常见的统计分析方法,它可以将历史数据作为依据,预测未来的数据变化趋势。
时间序列预测技术可以应用于经济、自然科学、社会科学等领域,能够帮助人们更好地了解事物的发展规律和趋势。
此外,在商业决策、市场营销和金融投资等领域,时间序列预测也具有重要的作用。
二、基于机器学习算法的时间序列预测研究方法传统的时间序列预测方法通常采用的是统计模型或者模拟模型,比如ARIMA、VAR、GARCH等。
虽然这些方法具有较高的精度和可解释性,但是它们往往需要对数据分布和参数设定进行假设,而这些假设未必与真实数据完全一致。
并且,在数据处理方面也面临着挑战,因为时间序列数据往往包含着噪声与季节性,存在不可预见的波动。
相比而言,基于机器学习算法的时间序列预测方法则不需要对数据分布和参数做明确的假设,随着数据量的增加,它们可以不断学习和优化预测模型。
因此,机器学习算法的时间序列预测方法具有更灵活的性能,能够更好地处理时间序列数据中的噪声和波动。
常见的基于机器学习算法的时间序列预测方法包括:回归分析、神经网络、支持向量机、决策树等。
下面将介绍其中几种具有代表性的方法。
1.回归分析回归分析是一种常用的机器学习算法,它通过分析历史数据的相关关系,来建立预测模型。
时间序列预测中的回归分析通常采用线性回归、多元回归等方法。
这些方法可以对变量之间的线性关系进行建模,并且可以通过回归系数来衡量变量之间的影响程度。
不过,在时间序列预测中,回归分析可能会出现过拟合和欠拟合的情况,需要进行适当的优化。
2.神经网络神经网络是一种模仿大脑神经元连接方式的计算模型。
基于机器学习的金融数据分析研究摘要:随着互联网技术和信息技术的迅速发展,在互联网金融的大背景下,金融数据处理问题已经不仅仅局限于传统的数理统计方法,而更多的与机器学习领域的各种信息处理方法相结合,并取得了一些有重要意义的研究成果。
本文将主要研究机器学习中的支持向量回归算法和时间序列模型用于建立预测模型的绩效问题,也就是针对金融数据分析和预测准确度的问题。
关键词:机器学习;支持向量机;金融数据项目简介:2015 年保定市科技局研究项目“基于机器学习的金融数据分析研究” ,课题编号:15ZG026、金融数据分析的背景及意义长期以来专家学者们都希望能够找到使误差更接近零的分析预测方法,以使投资目标函数在利益尽量大的时候风险尽量最小。
所以,人们不得不努力的研究更新、更有效、泛化能力更强的数据分析预测模型。
当前的金融市场业务繁多,和业务形成正比关系的各类信息系统众多,这些管理系统也产生海量的各类金融数据,如何对金融市场进行有效地、及时地预测与分析,则成为企业、银行和现代投资者所追求的目标。
现代投资者不再仅仅关注于股票的基本面信息,而是更多的需要深层次的挖掘大规模金融数据内在的联系,从而获取更多的信息。
在现实的金融市场中,普通的投资者很难掌握市场的全部有效信息,所以他们迫切的需要从可以得到的各类相关数据中挖掘出金融市场潜在的信息。
然而现行的大量分析方法并不能对已有的数据进行大规模的开发和利用,所以并不能满足金融市场投资者的需求。
投资者的这种迫切的需要将金融数据与机器学习的方法紧密联系在起。
金融市场由于其所包含的不可测因素非常多,所以我们可以将其看作是一个非线性的、非结构化的复杂系统。
而机器学习方法作为智能信息处理的重要组成部分,在其他领域已经被证明可以有效地解决这种非线性问题。
二、最小二乘支持向量回归算法最小二乘支持向量算法 (LSSVM )是将标准支持向量算法中的不等式约束化成等式约束而得到的。
对于线性回归,设样本为n 维向量,某区域的l 个样本及其值表示为:对于非线性回归,同样使用一个映射$把数据映射到高维特征空间,再在高维特征空间进行线性回归,关键是选取适当的核函数k (x, y),使得对于AR(n)模型来说,Xt仅仅与Xt-1, Xt-2, , Xt-n,有n阶动态性,因此拟合AR (n)模型的过程就是使相关序列独立化的过程。
基于GM-SVM模型的中长期电力组合预测模型研究杨再鹤,向铁元武汉大学电气工程学院Email: sailing_logosun@,湖北省武汉市摘要:中长期负荷预测受到诸多因素的影响,传统负荷预测方法显示出明显的不足。
本文在应用了灰色预测模型和支持向量机模型的基础上,建立了基于预测误差指标的以误差绝对值和达到最小的线性组合预测模型。
然后与方差倒数法确定权重的组合预测方法进行了对比分析,得出了预测误差绝对值和达最小作为指标来刻画预测精度更具稳健性。
通过算例分析表明所提出方法明显提升了预测精度,提高了预测模型的可靠性关键词:灰色预测模型;支持向量机;组合预测;误差绝对值;负荷预测The research of Combination Model for Medium and Long Term Load Forecasting based on GM-SVM ModelYang Zaihe, Xiang TieyuanCollege of Electrical Engineering, Wuhan UniversityEmail: sailing_logosun@, WuhanAbstract: Many factors have influence on medium and long term load forecasting, so the traditional forecasting method is inadequate. Based on the foundation of the grey model and support vector machines, the linear combination forecasting model which achieves the minimum sum of absolute error is described. And a load forecast empirical example has shown that compared with combination forecasting model based on the method of variance reciprocal weighting, the proposed method can achieve higher prediction accuracy and more robust, which is more suitable for medium and long term load forecasting.Keywords:Grey Model; support vector machines; combination forecasting model;absolute error; load forecasting1 引言电力系统中长期负荷预测对于电力系统的规划与运行十分重要,其预测的精确性和有效性对于社会发展与经济规划产生重要的影响。
需求预测方法常用的物资需求预测方法主要包括基于时间序列模型的移动平均预测法、指数平滑预测法、趋势外推预测法等;基于因果分析模型的回归分析预测法,基于统计学习理论以及结构风险最小原理的支持向量机预测方法,基于人工智能技术的人工神经网络算法;归纳如图1:图1:物资需求预测方法一、 时间序列法1.定义:将预测对象按照时间顺序排列起来,构成一个所谓的时间序列,从所构成的这一组时间序列过去的变化规律,推断今后变化的可能性及变化趋势、变化规律,就是时间序列预测法;2.概况:时间序列法主要考虑以下变动因素:①趋势变动,②季节变动,③循环变动,④不规则变动; 若以S S ,S S ,S S ,S S 表示时间序列的季节因素S S ,长期趋势波动、季节性变动、不规则变动.则实际观测值与它们之间的关系常用模型有加法模型:乘法模型:混合模型:时间序列预测一般反映三种实际变化规律:趋势变化、周期性变化、随机性变化;3.时间序列常用分析方法:移动平均法、指数平滑法、季节变动法等1移动平均法①简单移动平均法:将一个时间段的数据取平均值作为最新时间的预测值;该时间段根据要求取最近的;例如:5个月的需求量分别是10,12,32,12,38;预测第6个月的需求量;可以选择使用3个月的数据作为依据;那么第6个月的预测量Q=32+12+383=27;②加权移动平均法:将每个时段里的每组数根据时间远近赋上权重;例如:上个例子,3个月的数据,可以按照远近分别赋权重,,;那么第6个月的预测量Q=0.2×32+0.3×12+0.5×38=29只是在简单移动平均的基础上考虑了不同时段影响的权重不同,简单移动平均默认权重=1. 2指数平滑法基本思想:预测值是以前观测值的加权和,且对不同的数据给予不同的权数,新数据给予较大的权数,旧数据给予较小的权数;指数平滑法的通用算法:t t t t I S T x ++=t t t t I S T x ⋅⋅=)())t t t t tt t t I T S x b I T S x a +⋅=+⋅=指数平滑法的基本公式:St=aYt+1-aSt-1 式中,St--时间t的平滑值;Yt--时间t的实际值;St-1--时间t-1的平滑值;a--平滑常数,其取值范围为0,1具体方法:一次指数平滑、二次指数平滑、三次指数平滑;方法的选取:指数平滑方法的选用,一般可根据原数列呈现的趋势来确定;当时间数列无明显的趋势变化,可用一次指数平滑预测;如呈现直线趋势,选用二次指数平滑法;若实际数据序列呈非线性递增趋势,采用三次指数平滑预测方法;如呈现抛物线趋势,选用三次指数平滑法;或者,当时间序列的数据经二次指数平滑处理后,仍有时,应用三次指数平滑法;3季节变动法根据季节变动特征分为:水平型季节变动和长期趋势季节变动①水平型季节变动: 是指时间序列中各项数值的变化是围绕某一个水平值上下周期性的波动;若时间序列呈水平型季节变动,则意味着时间序列中不存在明显的长期趋势变动而仅有季节变动和不规则变动;季节指数=各年同季月平均数/总平均数季节变差=各年同季月平均数总平均数②长期趋势季节变动:是指时间序列中各项数值一方面随时间变化呈现季节性周期变化,另一方面随着时间变化而呈现上升或下降的变化趋势;季节指数=各年同季月平均数/趋势值季节变差=各年同季月平均数趋势值季节变动预测的方法很多,应用时应根据季节变动的类型选择适应的预测方法若时间序列呈长期趋势季节变动,则意味着时间序列中不仅有季节变动、不规则变动,而且还包含有长期趋势变动;4趋势外推法趋势外推预测法是一种通过逻辑推理分析,以期达到预测效果的预测方法;其主要以事物发展的规律性为假设前提,即认为只要能够正确地了解并且掌握事物历史及现有的发展状态,就能够遵循其发展规律来预测事物的未来发展趋势;趋势外推预测方法是一种探索型的预测方法,其主要适用于预测那些时间序列随着单位时间的增加或者减少,出现变化大致相同的长期需求预测; 4.时间序列建模时间序列是同类型指标值按时间顺序排列而形成的数列;很多行业特别是金融行业会产生大量的时间序列,如经济数据、股市数据等;要从这些数据中得到有用的数据,需要采用数据挖掘的技术,而建模是影响数据挖掘效果的一个重要因素,对于时间序列数据而言更是如此;以下是时间序列建模的常用方法;典型的时间序列模型有ARMA,HMM等基于模型的表示方法;1.隐Markov模型HMMmatlab求解隐马尔可夫模型Hidden Markov Model,HMM是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程;其难点是从可观察的参数中确定该过程的隐含参数;然后利用这些参数来作进一步的分析,例如模式识别;HMM是一种不完全数据的统计模型,这种模型既能反映对象的随机性,又能反映对象的潜在结构,便于利用对象的结构与局部联系性质等方面的知识,以及对研究对象的直观与先验的了解;HMM理论的主要内容包括3个基本问题及其算法:1 评估问题:前向2 解码问题: Viterbi算法3 学习问题: Baum-Welch算法向前向后算法12.自回移动平局模型ARMA可以用SPSS和matlab求解ARMA用于对平稳时间序列的建模,是一类基于自相关的时间序列分析模型;ARMA模型是AR模型和MA模型的综合,描述了系统对过去自身状态的记忆和系统对过去时刻进入系统的噪声的记忆;近年来,许多成果将ARMA模型与时间序列挖掘方法相结合,用于研究时间序列的预测、分类、聚类以及相似查找等;ARMA模型的基本思想是,时间序列数据的当前值x,不仅受当前干扰的影响,还与历史数据以及历史干扰紧密相关;一旦时间序列的这种自相关性能够被定量确定,就可以对其建立合适的ARMA模型;综上所述,没有一个模型能普遍适用于不同的应用,实际中的时间序列建模方法都是与特定应用相关的,由于应用的关注角度不同,实际的时间建模方法也有显着的差异;二、因果分析法1.定义:是根据事物之间的因果关系来事物的发展和变化,通过对需求预测目标有直接或间接影响因素的分析找出其变化的规律,并根据这种变化规律来确定预测值;因果关系模型用于研究不同变量之间的相关关系,用一个或多个自变量多括时间的变化来描述因变量的变化;2.因果关系模型与时间序列模型不同:它不仅可以从事短期预测,而且还可以从事中、长期预测,也可以预测宏观、中观、微观问题;3.因果关系模型包括:回归分析、经济计量模型、投入产出模型、灰色系统模型、系统动力学等;①回归分析方法回归分析预测法是基于因果分析的预测方法,其主要通过分析与预测事物有关的现象的变化趋势,从因果关系出发,探究预测事物及其相关影响因子间的相互联系,通过回归方程的构建,来预测未来需求;按照回归模型中自变量的多少,回归分析预测模型可以划分为一元以及二元回归模型两大类;a 一元回归预测模型一元回归预测模型是指通过采用最小二乘法,寻找唯一自变量与因变量之间经验公式的预测方法;其首先需要确定唯一自变量,即找出影响预测目标的关键因素,然后通过最小二乘法求出回归方程系数,最后还需进行显着性检验,即对回归方程中自变量与因变量的密切程度进行检验;b多元回归预测模型一元回归预测模型是影响因素通过关键影响因素作为唯一自变量来解释因变量的变化的预测方法,但在实际情况中,致使因变量变化的因素可能涉及多个,这就需要引入多元回归预测模型来完成预测的实现了,通过引用若干个影响因子作为自变量来解释因变量的变化趋势;虽然,多元回归的原理与一元回归模型没有区别,但是在计算上却更为复杂,不仅需要考虑所有自变量与因变量之间的相关性检验,还需要研究自相关、偏相关、多变量共相关等问题;②经济计量法经济计量法是经济分析与数学方法相结合的一种预测方法;通常将描述预测对象有关主要变量相互关系的一组联立方程式称为经济计量模型;特点:经济系统,而不是单个经济活动;相互依存、互为因果,而不是单向因果关系;必须用一组方程才能描述清楚;经济计量模型的方程形式:单方程计量经济学模型,是用单一方程描述某一经济变量与影响该变量变化的诸因素之间的数量关系;它适用于单一经济现象的研究,揭示其中的单向因果关系;联立方程模型则用多个方程描述经济系统中诸因素之间的数量关系;它适用于复杂经济现象的研究,在复杂的经济现象中,诸因素之间是相互依存、互为因果的;单一方程式:例如:Y=X1+X2+X3 联立方程式:例如:Y1=X1;Y2=Y1+X2+X3;Y3=Y2+X2③投入产出分析法投入产出分析法是反映经济系统各部分如各部门、行业、产品之间的投入与产出间的数量依存关系,并用于经济分析、政策模拟、经济预测、计划制定和经济控制等的数学分析方法;它是经济学与数学相结合的产物,属交叉科学;在收集资料确定本期企业投入产出平衡表基础上,可以计算出各种消耗系数;假设企业设备和技术条件不变的条件下,就可以根据投入产出表建立的综合平衡模型进行预测应用,为计划管理、生产安排提供信息依据;常见的有以下两种应用:a已知计划期内各种自产产品总产量列向量X,求最终产品量列向量Y,以及为确保计划完成所必须准备的各种外购资源消耗总量的矩阵H;b已知计划期内最终产品计划任务矩阵Y,计算计划期内各产品的总产量列向量X,以及确保计划完成所必须提供的各种外购资源H矩阵;④灰色预测模型定义:灰色系统是指相对于一定的认识层次,系统内部的信息部分已知,部分未知,即信息不完全,半开放半封闭的;灰色预测是对灰色系统进行的预测,其特点是预测模型不是唯一的;一般预测到一个区间,而不是一个点;预测区间的大小与预测精度成反比,而与预测成功率成正比;通常灰色预测所用的模型为GM1,1,该模型基于随机的原始时间序列,经累加生成新的时间序列,其中所呈现的规律用一阶线性微分方程的解来逼近,从而得到预测方程;适用于:中长期预测;应用:在预测应用上,如气象预报、地震预报、病虫害预报等,国内学者做出了许多有益的研究;优势:所需样本少,样本不需要有规律性分布,更能动态地反映系统最新的特征,这实际上是一种动态预测模型;预测准确度高;3支持向量机预测模型支持向量机SVM方法是一种小样本的机器学习算法,其是在统计学习理论以及结构风险最小原则的基础上探讨所得的一种算法;通过对有限样本信息的分析研究,在模型复杂性针对特定训练样本的学习精度以及学习能力准确识别样本的能力之间寻求一个最佳平衡点,以获得最佳的推广能力;其核心思想是通过非线性变换将输入空间变换到一个高维空间,然后在新空间中求取最好的线性分类面,非线性变换的完成主要是依靠准确定义合适的内积函数,其最优分离超平面,如图2所示;图2:最优分离超平面支持向量机算法优点较多,包括计算便捷、通用性强等;但其也存在一定的缺陷,即无法对大规模训练样本实施运算,因为支持向量机算法是通过二次规划来进行求解的,二次规划求解过程中要涉及多阶矩阵的计算问题,当阶数过大的条件下,将会在很大程度上损耗计算机的存储空间且增加机器的运算时间;4BP神经网络模型BP神经网络模型,是目前神经网络学习模型中最具代表性、应用最普遍的模型;BP神经网络架构是由数层互相连结的神经元组成,通常包含了输入层、输出层及若干隐藏层,各层包含了若干神经元;神经网络便于依照学习法则,透过训练以调整连结链加权值的方式来完成目标的收敛;所得的神经网络构架结构基本形式.BP神经网络的神经采用的传递函数一般都是SigmoidS壮弯曲型可微函数,是严格的递增函数,在线性和非线性之间显现出较好的平衡,所以可实现输入和输出间的任意非线性映射,适用于中长期的预测;优点是逼近效果好,计算速度快,不需要建立数学模型,精度高;理论依据坚实,推导过程严谨,所得公式对称优美,具有强非线性拟合能力;缺点是无法表达和分析被预测系统的输入和输出间的关系,预测人员无法参与预测过程;收敛速度慢,难以处理海量数据,得到的网络容错能力差,算法不完备易陷入局部极小;三、新产品市场需求预测模型巴斯模型巴斯模型基础假设及适用条件1.巴斯模型假设:新产品在市场上扩散速度会受到两种方式的影响:一种是大众传播媒介,另一种是口碑传播;2.巴斯模型的适用条件:1企业已经引入了新产品或者新技术,并且已经观察到它最初几个时期的销售情况;2企业还没有引入该产品或者新技术,但是该产品或者技术在某些方面同已有一些销售历史的某种现有产品或技术很相似;巴斯模型有几个关键的假设条件,巴斯模型最重要的假设条件极其可能的扩展如下:1市场潜量保持恒定;2支持新产品的营销策略不影响新产品的采用过程;3消费者决策过程是二元的只有“接受”和“不接受”两种答案;4q的值在新产品的整个生命周期里保持固定不变;5模仿常具有积极作用;6创新产品的采用不受其他创新是否被采用的影响;7该创新产品不存在重复购买或者替代购买;。
2006年4月系统工程理论与实践第4期
文章编号:1000.6788(2006)04.0097—07区域经济中长期预测的支持向量回归方法肖健华1’2,林健3,刘晋3
(1.五邑大学智能技术与系统研究所,广东江门529020;2.北京航空航天大学经济管理学院,北京100083;3.五邑大学管理学院,广东江f-i529020)
摘要:分析了区域经济发展特性以及中长期经济预测的特点,对当前经济预测方法存在的不足进行了阐述,指出:由于区域经济系统中存在高度的非线性、耦合性和时变性,使得现有的经济预测方法难以胜任.介绍了支持向量回归算法,并在此基础上,提出了基于支持向量回归的方法对区域经济进行中长期预测的思路,并建立了相应的数学模型.以广东省江门市作为应用对象,说明了该模型的有效性.关键词:支持向量回归;统计学习理论;区域经济;中长期预测中图分类号:TPl81文献标识码:A
ASVR--basedModelforRegionalEconomyMedium--termand
Long・termForecast
XIAOJian—hual”,LINJian3,LIUJin3
(1.InstituteofIntelligentTechnologyandSystems,WuyiUniversity,Jiangmen529020,China;2.SchoolofEconomicsand
Management,
BeihangUniversity,Beijing100083,China;3.SchoolofManagement,wuyiUniversity,Jiangmen529020,China)
Abstract:Basedontheanalysisofcharacteristicsofregionaleconomyandforecastingmethodsformedium-termandlong-termeconomicdevelopment,drawbacksofcurrentforecastingmethodswereexplainedasthatthosemethodsare
notsuitableforforecastingmedium-termandlong—termeconomicdevelopmentduetoitsnonlinearity,coupling
and
dynamicity.Asupportvectorregressionalgorithmwasbeenintroduced,andthenanideaofforecastingmedium—termandlong-termregionaleconomybasedonthealgorithmwasexplainedandamathematicmodelbasedontheideawas
proposed.Atlast,anexperimentwasconductedtoverifytheproposedmodelontheeconomicdatasetofJiangmen,
Guangdong.Keywords:supportvectorregression(SVR);statisticlearningtheory(SLT);regionaleconomy;medium-term;
long—termfomeast
1引言经济发展的中长期预测,一般是指五年以上经济发展趋势的预测,旨在为一个国家或一个区域的中远景规划提供科学的依据.就经济发展预测而言,与国家宏观经济发展规律相比,区域经济的发展存在自身的特点.首先是波动性大,而且所研究的区域越小波动性越大,有时甚至一个企业的兴衰、降雨量的多少等都可能对一个区域的经济发展产生很大的影响;其次是系统的相对独立性和开放流动性,单个区域的独立性相对较小,各个区域各有侧重,某个区域经济必然与其它的区域经济形成互补.当然,区域经济的发展预测也具备一般经济系统预测的共同特性…:非线性,区域经济系统是众多确定性因素和非确定性因素交互作用下的非线性系统;强耦合性,反映经济发展的各种指标、构成经济系统的各行业、各部门等无不密切关联,每一个指标或行业的变化都会导致其它指标或行业的变化;时变性,经
收稿13期:2004—10.10资助项目:国家自然科学基金(70471074);中国博士后科学基金(2005038042)作者简介:肖健华(1970一),男,汉族,江西永新人,博士后,副教授,主要研究方向:智能信息处理,复杂经济系统建模,E.mail:jianhuaxiao@tom.com;林健(1958一),男,汉族,福建福州人,博士生导师,五邑大学校长,主要研究方向为复杂系统建模与仿真;刘晋(1956一),女,湖北孝感人,博士,教授,主要研究方向为管理决策支持系统.
万方数据98系统工程理论与实践2006年4月济系统是一个动态的开放系统,反映其运行规律的数学模型始终在不断的变化中.在对区域经济的发展进行预测时,必须充分考虑上述各种因素,尤其是蕴含在指标数据上的非线性、时变性和不确定性作用关系.建立在计量经济学理论基础上的各种经济预测模型,大部分属于线性模型.线性模型在发挥巨大作用的同时,也逐渐显露出它的缺点,即很难把握经济系统中的非线性现象,最终必然造成预测结果的较大误差.为弥补这一缺陷,经济领域的一些研究工作者对线性模型进行了修正,如建立分段线性模型和变参数线性模型等,但结果往往不理想瞳].以神经网络为代表的非线性建模方法,一度给经济预测带来了希望,理论上也证明了在选择适当的隐层数及相应的神经元数目下,前馈神经网络能以任意精度逼近任意非线性函数.然而在实际应用中,由于神经网络存在的一些缺陷,使得神经网络应用到实际经济系统的发展预测中还存在一定问题.这些缺陷包括:网络结构不能保证最优化;训练算法存在局限,收敛速度得不到保障,且容易陷入局部最优;对训练样本的数量与质量要求较高;基于经验风险最小化的优化目标,不能保证泛化性能‘3|.由Vapnik提出的统计学习理论(StatisticLearningTheory,SLT)Ho发展而来的核方法(KernelMethod,
KM)b],实现了数据空间与特征空间之间的非线性映射,可以有效地将数据空间中的各种非线性操作演变为特征空间中相应的线性操作,进而大大地提高了非线性处理能力.作为核方法的一种,支持向量回归(SupportVectorRegression,SVR)在非线性回归中具备非常优秀的性能№J.更为难能可贵的是,SVR建立在结构风险最小化的优化目标上,很大程度上改善了神经网络在非线性拟合上存在的不足.本文首先介绍SVR算法,进而对广东省江门市的经济发展历史数据进行了分析,在此基础上提出基于SVR的区域经济中长期预测方法,并建立了相应的数学模型.
2支持向量回归算法考虑给定的n个学习样本(Xi,Y;),XiER。,YiER,i=1,2,…,n,线性回归的目标就是求回归函数.厂(X)=(W・X)+b.(1)式中:WER。,bER,(W・X)为形与x的内积.在以往的学习算法中,优化目标是使经验风险即样本损失函数L(Xi)L(Xi)=g(Y;一f(X。)).(2)的累积R。。(,)最小化,如最dx-"乘法,所求的(W,b)应满足
minR。。。(,)=∑(Yi一-厂(X;))2.(3)
然而,统计学习理论指出,经验风险最小并不能保证期望风险最小¨].在结构风险最小化的优化目标下,线性回归方程式(1)中的参数(W,b)应满足
minQ(W,b)=寺II形||2+衄。。,(,).(4)
上式中的||形lI2/2反映了回归函数.厂(x)的泛化能力,C为惩罚因子.式(4)表明,结构风险最小化能够折
中考虑回归函数的经验风险和泛化能力,因此,回归函数具有更好的性能.式(2)中常用的损失函数L(五)包括二次函数、Huber函数、Laplace函数和e一不敏感函数等.其中e一不敏感函数能够忽略e范围内的回归误差
£。,’,一,。五,—,:;二二{主;:季:.c5,£c(’2iI,,i一,(五)I—s,l≥i一>(≤)I;£。(5’
比较适合于经济数据处理.如果,IY;一(W・Xi)一bI<e(i=1,2,…,凡)成立,对应图1中外面两条直线所围区域内的样本点,即
所有样本的损失函数都为0,因此有R。。(f)=0,式(4)可改写为:
万方数据第4期区域经济中长期预测的支持向量回归方法rainQ(形,b)=百1
lI形Il
2,
s.t.扎一(形・置)一b≤e,(肜・Xi)+6一儿≤e.显然,约束条件式(7)和式(8)并不总能得到满足,此时则必须弓松弛因子£I>0和车jI>0,如图1所示,在£一不敏感损失函数下(4)的优化问题变为阳’71
minQ(形,6)=告Il训2+C∑(£+e?),一i=1
s.t.Y‘一(形・Xi)一6≤e+毫,(IV・xi)+6一),f≤e+车?,£,车?≥0.
(10)图1不敏感函数下的线性回归示意图
(11)(12)引入参数ai,口?,砩,叩?≥o,构造Lagrange函数对上述优化问题进行求解
£:=百1lI形II2+C∑(毛+s:)一∑a;(e+£一y;+(形・置)+6)一
∑a:(e+拿:+Yi一(形・Xi)“)一∑("qi£i;+叩蔫).(13)
考虑到上式关于IV,6,£,手?取极小,因此对L关于形,6,£,}?求偏导,并令它们等于0筹=o一塞∽q)=o,(14)
券=o一形=塞㈠一口?)Xi,…)
筹=o—c叫哪-0,(16)
暑=o—c_“_0.(17)
将式(14)~式(17)代入式(13),得到对偶优化问题maxQ(%a?)=一告∑(口;一口?)(d,一a?)(置,葺)一e∑(口i+口j)+∑y;(口i一口?),(18)
s.t.∑(口i一口:)=0,(19)0≤口;,a:≤C.(20)由上述优化方程,可求出口;和a7.实际上只有一部分口;一口?≠o‘4【,与之对应的样本(Xi,,,i)称为支持向量(SupportVector,SV).进一步由式(1)和式(15)得到回归方程,
,(x)=∑(ai—O/i+)(x;・x)+6.(21)根据KKT条件,任选一支持向量,上式中6依下式计算f62,,;一(形‘置)_e,ai∈(o,㈣.(22)
【6=Y;一(形・Xi)+£,d?∈(0,C)
将式(15)代入七式得
・Xi)一£,口i∈(0,C)・置)+£,口:∈(0,C)(23)巧
瓦口
口一一a口。∑川。∑川一一yy== 万方数据