基于灰色理论与支持向量机组合的旅游数据预测模型研究
- 格式:pdf
- 大小:169.01 KB
- 文档页数:2
《几个预测方法及模型的研究》篇一一、引言随着科技的发展,预测已经渗透到生活的各个领域。
从天文学到气候学,从金融投资到社会经济发展,预测在多个方面起着关键的作用。
预测不仅仅需要收集大量数据,而且还要依赖于合适的预测方法和模型。
本文将深入探讨几个常用的预测方法及模型。
二、数据驱动的预测方法1. 时间序列分析模型时间序列分析模型是最常用的预测方法之一,常用于金融市场和经济领域等的时间趋势预测。
通过研究数据的变动模式,分析周期性变化等因素,可以对未来数据进行估计。
主要的时间序列分析模型包括ARIMA(自回归移动平均)模型和SARIMA (季节性自回归移动平均)模型等。
2. 回归分析模型回归分析模型是利用一个或多个自变量与因变量之间的关系进行预测。
这种方法可以用于各种领域,如房价预测、销售量预测等。
通过收集历史数据,建立自变量和因变量之间的数学关系,从而对未来进行预测。
三、机器学习模型1. 神经网络模型神经网络是一种模拟人脑神经元网络的算法,常用于处理复杂的非线性问题。
在预测领域,神经网络可以通过学习大量的历史数据,找到输入和输出之间的复杂关系,从而实现较为准确的预测。
2. 支持向量机(SVM)模型支持向量机是一种基于统计理论的机器学习算法,常用于分类和回归问题。
在预测领域,SVM可以用于找到最优的分类边界或回归函数,以实现较高的预测准确率。
四、其他预测方法1. 灰色预测模型灰色预测模型主要用于解决数据不完全或不确定性较高的预测问题。
通过建立灰色微分方程,对数据进行处理和分析,从而得到较为准确的预测结果。
2. 专家系统预测法专家系统预测法是一种基于专家知识和经验的预测方法。
通过收集专家的知识和经验,建立专家系统,然后利用系统进行预测。
这种方法在许多领域都得到了广泛的应用。
五、结论《几个预测方法及模型的研究》篇二一、引言随着科技的飞速发展,预测技术已经成为许多领域中不可或缺的一部分。
从经济预测、天气预报到医学诊断,预测方法及模型的应用日益广泛。
民航机场旅客吞吐量灰色预测的PGM(1,2)模型研究杜云郑顺文指导老师:杨丽安然(中国民用航空学院天津 300300)摘要:本文应用灰色GM(1,1)模型对民航机场旅客吞吐量进行了预测研究,得到了有价值的规律和结论。
同时,本文以灰色GM(1,2)模型为基础,提出了适用于灰色系统数列预测的PGM(1,2)模型,并将其应用于对民航机场旅客吞吐量进行预测研究,结果表明:PGM(1,2)预测模型曲线能反映民航机场旅客吞吐量的变化规律,预测精度很高。
为实现民航机场旅客吞吐量的短、中、长期的准确预测提供了科学的依据和方法。
关键词:灰色预测;PGM(1,2)模型;民航机场旅客吞吐量;1 引言随着我国经济的飞速发展,人民生活水平的显著提高,各行各业都显示出良好的发展势头,中国民航业也同样拥有着很大的发展机遇。
旅客运输是民航运输主要业务之一,对民航机场旅客吞吐量进行短、中、长期的准确预测的研究对民航建设有着重要的意义。
短期预测(指对未来1-2年的预测)可以指导民航机场近期运输业务的计划和运力安排,做好运输服务。
而中、长期预测(指对未来3-5年、5-15年的预测)则是机场规划、建设的依据,以决定机场分期建设的规模,控制机场的最终用地范围。
民航机场旅客吞吐量预测是一件复杂的工作,城市对航线格局下某机场业务量与该地区的社会、经济情况密切相关,地区经济发展的快慢、地区政策的变化都会直接影响航空业务量的变化。
目前航空运输预测的基本方法主要是定性预测法、平均预测法和回归分析法。
资料[1]显示这些方法对短期预测的结果能满足管理要求(即预测相对误差≤12%)。
而对中、长期的预测则是非常困难的,只能通过对历史资料的分析、研究,参考、借鉴国外机场发展的过程做出预测,因此,准确度较差,有时甚至是失败的。
这将导致机场规划建设的决策失误。
例如:珠海机场、绵阳机场就是由于预测不准确造成所建航站楼规模过大,长期不能有效利用,从而造成资金的浪费。
灰色系统模型(Grey Model,GM)一:解决的关键问题 (所谓灰色系统是指部分信息已知而部分信息未知的系统,灰色系统所要考察和研究的是对信息不完备的系统,通过已知信息来研究和预测未知领域从而达到了解整个系统的目的)灰色系统模型作为一种预测方法广泛应用于工程控制,经济管理,社会系统等众多领域。
二:GM(1,1)模型(一):对原始序列累加处理一次累加生产序列②(即1-AGO序列),表示为其中,一次累加序列(1)X 的第k 项由原序列的前k 项和产生,即: 由(1)X 的相邻项平均得到(1)X 的紧邻均值生成序列(1)z ,表示为:根据上述序列,有灰色系统模型GM(1,1)的基本形式:(二)构造GM(1,1)模型方程组的矩阵形式,并求解参数 GM(1,1)模型的微分方程基本形式:(三)求的时间响应序列,累减得到原序列的预测值(四)模型检验残差的均值、方差分别为:21S C S 称为均方差比值,对于给定的00C ,当0C C 时,称模型为均方差比合格模型;1(()0.6745)p p k S 称为小误差概率,对于给定的00P ,当0P P 时,称模型为小误差概率合格模型。
一般均方差比值C 越小越好(因为C 小说明S 小,1S 大,即残差方差小,原始数据方差大,说明残差比较集中,摆动幅度小,原始数据比较分散,摆动幅度大,所以模拟效果好,要求2S 与1S 相比尽可能小),以及小误差概率p 越大越好,给定000,,,C p 的一组取值,就确定了检验模型模拟精度的一个等级,常用的精度等级见表1。
软件DPS 的分析结果也提供了C 、p 的检验结果。
(五)残差修正模型(六)建立新陈代谢GM(1,1)进行动态预测在实际建模过程中,原始数据序列的数据不一定全部用来建模。
我们在原始数据序列中取出一部分数据,就可以建立一个模型。
一般说来,取不同的数据,建立的模型也不一样,即使都建立同类的GM(1,1)模型,选择不同的数据,参数a,b的值也不一样。
基于机器学习的旅游景区日客流量预测方法研究国内外文献综述目录基于机器学习的旅游景区日客流量预测方法研究国内外文献综述 (1)1 国内研究现状 (1)1.1 旅游客流量预测问题研究现状 (1)1.2 深层神经网络在时间序列预测方面的研究现状 (3)2 国外研究现状 (4)2.1 旅游客流量预测问题研究现状 (4)2.2 深层神经网络在时间序列预测方面的研究现状 (4)参考文献 (5)1 国内研究现状1.1 旅游客流量预测问题研究现状早期对于旅游需求预测的研究主要集中在长期和中期预测,如年度、季度、以及月度客流的预测。
韩兆洲等人构建了以消费者预期指数、城镇居民人均可支配收入、接待过夜游客数量三个指标滞后值为输入变量的GA-LSSVR 模型和季节调整的ARIMA 模型以及基于GIOWHA 算子的组合模型,对广东省接待的过夜游客流量进行预测[1]。
此外,灰色预测方法在旅游需求的预测方面也得到了大量的研究和应用,其主要思想是通过分析和挖掘时间序列之间的内在关联性,建立微分方程组来进行预测。
相比于传统的Box-Jenkins 方法,灰色预测方法的限制条件少,计算较快,且不需要进行平稳性检验和白噪声检验。
在对旅游需求的预测和计算方面,周廷慰利用数列灰预测方法和经过改进的灰色马尔科夫模型预测了安徽入境的旅游人数及其外汇收入,并对结果进行了详细的分析和对比[2];李丹建立了基于灰色系统组合模型优化后的平常日客流量预测模型,以安徽黄山景区的平常日客流量数据为例进行预测,取得了较好的预测效果[3];赵欢采用分形自回归滑动平均(ARFIMA)模型,结合灰色预测FGM(1,1)模型,对2001 年到2018 年的广东省游客人数数据集进行了分析和预测,发现该预测方法的应用能显著提高长期预测结果的可靠性和准确度[4]。
不过,这些比较经典的时间序列预测方法主要集中在数据内在变化规律的回归分析以及对时间序列变化趋势的预测和外推上,没有充分考虑可能影响游客量的各种相关因素,并且对非线性系统的数据处理和分析能力也比较差。
灰色预测模型理论及其应用灰色系统理论认为对既含有已知信息又含有未知或非确定信息的系统进行预测,就是对在一定方位内变化的、与时间有关的灰色过程的预测. 尽管过程中所显示的现象是随机的、杂乱无章的,但毕竟是有序的、有界的,因此这一数据集合具备潜在的规律,灰色预测就是利用这种规律建立灰色模型对灰色系统进行预测.灰色预测模型只需要较少的观测数据即可,这和时间序列分析,多元回归分析等需要较多数据的统计模型不一样. 因此,对于只有少量观测数据的项目来说,灰色预测是一种有用的工具.本文主要围绕灰色预测GM(1,1)模型及其应用进行展开。
一、灰色系统及灰色预测的概念1.1灰色系统灰色系统产生于控制理论的研究中。
若一个系统的内部特征是完全已知的,即系统的信息是充足完全的,我们称之为白色系统。
若一个系统的内部信息是一无所知,一团漆黑,只能从它同外部的联系来观测研究,这种系统便是黑色系统。
灰色系统介于二者之间,灰色系统的一部分信息是已知的,一部分是未知的。
区别白色和灰色系统的重要标志是系统各因素间是否有确定的关系。
特点:灰色系统理论以“部分信息已知、部分信息未知”的“小样本”、“贫信息”不确定型系统的研究对象。
1.2灰色预测灰色系统分析方法是通过鉴别系统因素之间发展趋势的相似或相异程度,即进行关联度分析,并通过对原始数据的生成处理来寻求系统变动的规律。
生成数据序列有较强的规律性,可以用它来建立相应的微分方程模型,从而预测事物未来的发展趋势和未来状态。
灰色预测是用灰色模型GM(1,1)来进行定量分析的,通常分为以下几类:(1) 灰色时间序列预测。
用等时距观测到的反映预测对象特征的一系列数量(如产量、销量、人口数量、存款数量、利率等)构造灰色预测模型,预测未来某一时刻的特征量,或者达到某特征量的时间。
(2) 畸变预测(灾变预测)。
通过模型预测异常值出现的时刻,预测异常值什么时候出现在特定时区内。
(3) 波形预测,或称为拓扑预测,它是通过灰色模型预测事物未来变动的轨迹。
灰色预测模型原理灰色预测模型(Grey Prediction Model)是一种基于灰色系统理论和数学建模方法的预测模型。
灰色系统理论是我国学者黄金云教授于1982年提出的一种系统理论,它是研究非确定性和不完备信息系统的一种新方法,可用于研究多变量、小样本和非线性系统。
灰色预测模型主要基于灰色数学建模方法,通过对已知的部分序列数据进行建模和预测,来推测未知的序列数据趋势。
它适用于研究数据量小、信息不完备、非线性关系复杂的系统。
下面将简要介绍灰色预测模型的原理、模型建立过程以及一些应用案例。
1. 灰色预测模型的原理灰色预测模型的核心思想是通过对已知数据进行灰色关联度的度量,从而建立出合适的数学模型,进行未来数据的预测。
其基本原理可以概括为以下五个步骤:(1)建立灰色微分方程:根据原始数据的特点,确定合适的灰色微分方程,通常使用一阶或高阶灰色微分方程。
(2)求解灰色微分方程:根据所选择的灰色微分方程,求解其参数,得到模型的特征参数。
(3)模型检验:检验所建立的灰色预测模型的拟合程度和误差是否符合要求。
(4)进行灰色关联度分析:根据已知数据的变化规律,计算各个因素的灰色关联度,确定相关因素的重要性。
(5)进行预测:利用建立好的灰色预测模型,对未来的数据进行预测和分析,得出预测值。
2. 模型建立过程灰色预测模型的建立过程中,通常包括以下几个步骤:(1)数据的建立与处理:对原始数据进行筛选、预处理和归一化处理,以满足模型的要求。
(2)建立灰色微分方程:从已知数据中提取主要特征,并根据数据的特点选择合适的灰色微分方程。
(3)求解灰色微分方程:根据所选的灰色微分方程,通过累加生成序列、求解参数等方法,得到模型的特征参数。
(4)模型的检验:根据已知数据的拟合程度和误差范围,评估所建立的灰色预测模型的准确性和可靠性。
(5)模型的应用与预测:利用已建立的模型进行未来数据的预测和分析,得出预测结果。
3. 应用案例灰色预测模型在实际应用中具有广泛的应用范围,以下是一些常见的应用案例:(1)经济领域:用于对经济指标、市场需求、价格变动等进行预测,为经济决策提供参考。
基于GIOWA算子的中国国内旅游人数预测作者:***来源:《荆楚理工学院学报》2020年第05期摘要:采用指数平滑法、抛物线模型和多元回归模型三种单項预测模型对1994~2018年我国国内旅游人数数据进行拟合预测,然后利用广义诱导有序加权平均算子将三种单项预测模型进行组合,分别探讨了λ=1,λ=0,λ=-1,λ=1/2时的组合预测结果,结果显示,组合预测的精度和效度完全高于各个单项预测结果;利用组合预测模型对未来3年我国国内旅游人数进行预测,未来三年我国国内旅游人数将会以6%左右的涨幅增加。
关键词:GIOWA算子;旅游人数;组合预测中图分类号:F592.7 文献标志码:A 文章编号:1008-4657(2020)05-0021-080 引言旅游业是第三产业的重要组成部分,改革开放以来,我国的旅游市场规模稳步扩大,发展前景十分可观,既能带动经济发展,扩大就业,还可以提升当地基础设施的建设和公共交通的建设。
然而,由于2020年初的新冠肺炎疫情,各地采取严格的隔离措施,封锁海关、取消航班,对各国各地的旅游业产生了严重影响。
合理估计疫情引起的损失,规划和发展国内旅游业,需要更精准的预计未来的旅游人数。
1969年,Bates J M等[1]对组合预测方法进行了比较系统的研究,引起了广泛关注。
随后国内外学者在最优组合预测方法的基本理论、组合预测权重的计算、以及非负权重预测方法等方面展开了大量研究[2-5]。
在利用组合预测方法进行预测方面,我国学者的研究也有很多,熊巍等[6]选择指数平滑法、季节性差分自回归滑动平均模型(Seasonal Autoregressive Integrated Moving Average,SARIMA)、反向传播(Back Propagation,BP)神经网络模型和灰色系统模型,利用误差平方和倒数最小的准则确定权重构建组合预测模型,对农产品的市场价格进行了预测。
刘智禄等[7]通过灰色系统模型(Grey Model,GM)和BP神经网络的组合模型预测西安市2018~2020年的房价。
航班延误预测对旅客出行时间的影响研究赵凯欣,姚㊀擎摘㊀要:随着生活水平的提高,航班起飞是否延误对旅客出行产生重要影响㊂文章将经验模态分解(EMD)与支持向量回归(SVR)算法结合对航班延误数据进行预测,实验结果表明该算法能够很好地预测航班延误情况,这对旅客的出行时间安排起到一定指导作用㊂关键词:经验模态分解;支持向量回归;航班延误;预测一㊁引言我国社会水平的提高使得飞机等出行工具的受众范围越来越广,而无法避免的航班延误情况不仅影响旅客出行时间㊁满意度,还会损害航空公司声誉,甚至对航空事业的发展产生巨大的负面影响㊂近年来,国内外学者对航班延误预测问题进行了广泛的研究㊂2012年,Ding等人提出一种基于危险模型理论和灰色模型理论的综合预测模型,指出组合模型比单一模型预测更合理可靠;2015年,罗赟骞等人采用支持向量机回归方法建立航班到港延误预测模型,差分进化算法能以较高概率获得最优预测模型;2017年,张甜等人基于灰色预测模型建立我国航班延误总量和航班延误因素的时间数列GM(1,1)模型,经检验模型的预测精度可靠;2020年,宋捷等人提出基于深度学习的航班起降延误预测方法,动态预测落地延误,验证模型预测准确性㊂文章利用经验模态分解与支持向量回归结合的算法预测航班延误问题㊂二㊁智能算法介绍(一)经验模态分解支持向量回归在处理非线性和非平稳时间序列方面存在局限性㊂而经验模态分解(EMD)可以有效地处理复杂的序列㊂EMD是基于特征时间尺度的航班延误数据进行信号分解,没有任何基函数㊂EMD可以将复杂信号分解为几个不同频率的固定IMF(本征模函数)分量和余项Rn㊂分解出的IMF必须满足以下两个条件:(1)在整个时间范围内,局部极限点和过零点的数量必须相等或最多相差1;(2)信号的任意时刻,由极大值点插值所构造的上包络线和极小值点构成的下包络线均值为零㊂假设航班延误时间序列为x(t),则算法如下:(1)识别出x(t)所有的极值点,分别使用三次样条插值法对极值点进行拟合,形成上下包络线㊂(2)计算上下包络线的平均值为m1(t),原始数据序列x(t)减去平均值可得到新数据序列y(t),获得:x(t)-m1(t)=y(t)(1)(3)根据IMF必须满足的两个条件判断y(t)是否为IMF分量㊂通常,y(t)不是IMF分量序列,有必要重复(1)㊁(2)步骤,直到平均值趋于零为止,才能获得第一个imf1分量㊂(4)将imf1与x(t)分离以去除高频分量,得到新的循环信号:x(t)-imf1=r1(2)(5)将r1作为原始信号,重复上述步骤以获取第二个IMF分量imf2㊂然后重复n次,得到n个IMF分量(imfn=rn),当rn满足终止条件(通常rn成为单调函数)时循环结束,得到n个IMF分量和残余分量rn㊂(6)原始信号x(t)可表示为:x(t)=ðni=1imfi+rn(3)rn称为残差函数(也称为趋势项),它表示信号的平均趋势㊂(二)支持向量回归支持向量机在解决模式识别,分类和回归分析问题方面具有独特优势,支持向量回归(SVR)是支持向量机问题在回归领域的推广㊂SVR基本原理是将原始数据映射到高维特征空间,再通过线性回归在高维空间中寻求最优回归超平面,从而实现预测数据的目的㊂假设训练样本集:D=x1,y1(),x2,y2(), xm,ym(){}xiɪRn,yiɪR(4)公式(4)中,xiɪRn表示样本集自变量,yiɪR表示样本集因变量㊂使用非线性映射将数据x1,x2, xm{}映射到高维空间并进行拟合,得到一个回归函数:fx()=ωTx+b(5)公式(5)中,ω和b为待确定的参数;ω为权重向量;b为偏置项㊂现引入不敏感损失函数ε和松弛变量ξ,ξ∗,将求解ω和b的问题转化为优化问题,即:min12 ω 2+cðmiξi+ξ∗i()s.t.yi- ω㊃xi⓪-b£ε+ξiω㊃xi⓪+b-yi£ε+ξ∗iξi,ξ∗iȡ0,i=1,2, mìîíïïïï(6)05财经论坛Һ㊀引用拉格朗日乘子αi,αi∗,将上述问题(6)转化为对偶问题并进行求解㊂得到最终SVR表达式,即:KRBFxi,x()=exp(-xi-x 22σ2)(7)公式(7)中,Kxi,x()是核函数,而径向基函数(RBF)是SVR中常用的核函数,其对样本要求低㊁应用广泛㊁灵活性高[7]㊂定义为:KRBFxi,x()=exp(- xi-x 22σ2)(8)三㊁实验与分析(一)数据处理实验数据来源于飞常准APP㊂出港准点航班:实际起飞时间-计划起飞时间<30分钟㊂(二)实验图例1.EMD分解示意图图1㊀EMD分解示意图2.SVR-EMD预测利用SVR对5个IMF进行预测,SVR对于IMF1高频段预测效果不佳,但是对于IMF2-IMF5预测效果基本一致㊂经验模态分解具有完备性,经过EMD分解叠加出原始信号,EMD方法是可恢复的可逆的㊂3.预测结果图2㊀EMD-SVR预测趋势图2显示,EMD-SVR能大致预测航班延误趋势,但对于延误时间较长的数据并不能有效预测㊂这与实验数据偏少等因素有关系,后期将对大量数据进行实验㊂四㊁结语(1)实验结果显示,SVR-EMD可有效预测航班延误时间,这为旅客出行安排提供参考㊂(2)航班延误是机场协调安排航班起落的重要影响因素,预测实验结果为机场协调安排提供参考㊂(3)下一步实验将SVR预测实验与EMD-SVR预测实验比较㊂参考文献:[1]DingJ,LiH.TheForecastingModelofFlightDelayBasedonDMT-GMTMode[J].PhysicsProcedia,2012,33:395-402.[2]罗赟骞,陈志杰,汤锦辉,朱永文.采用支持向量机回归的航班延误预测研究[J].交通运输系统工程与信息,2015,15(1):143-149.[3]张甜,赵智.基于灰色预测国内航班延误模型研究[J].价值工程,2017,36(28):24-27.[4]宋捷,杨磊,胡明华,等.基于深度学习的航班起降延误预测方法[J].航空计算技术,2020,50(3):30-34.[5]刘鲲鹏,白云川,李泽华,等.基于EMD的内燃机滚动轴承故障诊断[J].内燃机与配件,2018(6).[6]刘斌,毕小熊,党军朋,等.基于支持向量回归的变电站蓄电池退化趋势预测[J].电源学报,2020,18(6):207-214.[7]朱艳萍,包文杰,涂晓彤,等.改进的经验小波变换在滚动轴承故障诊断中的应用[J].噪声与振动控制,2018(1).作者简介:赵凯欣,姚擎,中国民用航空飞行学院㊂15。
基于灰色关联和SVR 的短时交通状态预测模型文檀亚宁,刘智颖,王子浪 (华北理工大学)摘要:高速公路作为当前的主流出行方式受到人们热议,自动驾驶车辆和合作车辆的加入能否有效增加交通通行能力成为问题的关键,为高速公路主线运行管理及匝道交通控制提供决策依据。
本研究首先应用灰色关联理论,分析自动驾驶车辆和合作车辆组成比例对高速公路通行能力的影响,发现车流中的自动驾驶车辆和合作车辆比例与车流平均速度存在较强的关联性,并且呈正相关。
其次建立引入自动驾驶车辆和合作车辆比例影响因素的基于回归支持向量机模型的高速公路短时交通状态预测模型,最后通过实测数据及对比试验验证了模型的可行性与准确性。
结果表明:本研究设计的支持向量机预测模型具有较为准确的预测效果,均方误差为0.02049,决定系数为0.53000;与未引入自动驾驶车辆和合作车辆比例的预测方案相比,均方误差减少0.12,决定系数增大0.21。
关键词:交通工程;短时交通状态预测;灰色关联度;回归支持向量机;高速公路问题背景与分析高速公路是运输效率高、通行能力大、具备全控制条件且方便及时的汽车高速通行道路[1]。
高速公路的普及,世界上发达地区高速公路网不断扩大,我国高速公路出行方式也变得较为普遍。
自动驾驶技术的兴起受到人们的热议,自动驾驶能否有效地改善交通状况成为问题的关键。
为了适应21世纪高速发展的需求,专家提出了运用自动驾驶技术提高高速公路通行能力的解决方案。
但人们并不清楚自动驾驶与现有交通流相互作用的影响,因此本文提出了相关课题。
灰色关联高速公路的车辆运行特征受到道路特性、驾驶员特性、环境特性等诸多因素影响,呈现出随机性、不确定性高的特点,高速公路基本路段的交通流量变化模型可以视为灰色系统。
本文运用灰色关联理论分析交通流车辆构成对高速公路年平均交通量的影响情况[2]。
灰色关联度的表达式为:灰色关联度的范围在[0,1]之间,越接近1,其关联程度越大[3],本研究将关联度的相关性气强度分为四个等级:弱(0,0.25)、较弱(0.25,0.5)、较强(0.5,0.75)、强(0.75,1)。