基于聚类分析的非参数回归短时交通流预测方法
- 格式:pdf
- 大小:951.13 KB
- 文档页数:7
《基于轨迹大数据的短时交通流预测技术研究》一、引言随着城市化进程的加快和交通工具的日益丰富,交通问题已成为人们关注的焦点。
准确预测短时交通流变化情况对于智能交通系统(ITS)的建设和管理具有重要意义。
传统交通流预测方法往往受限于数据量和处理速度,难以满足实时、准确预测的需求。
而基于轨迹大数据的短时交通流预测技术则具有更高的精确度和更快的响应速度,能够更好地适应现代交通系统的需求。
本文旨在探讨基于轨迹大数据的短时交通流预测技术的原理、方法及实践应用。
二、轨迹大数据在交通流预测中的应用轨迹大数据是指通过GPS、传感器等设备收集到的各种交通工具的运行轨迹数据。
这些数据包含了丰富的时空信息,为短时交通流预测提供了重要的数据支持。
通过对轨迹大数据的分析和处理,可以提取出交通流量的时空分布特征,进而对未来一段时间内的交通流量进行预测。
在短时交通流预测中,轨迹大数据的应用主要体现在以下几个方面:1. 数据采集与预处理:通过GPS、传感器等设备收集各种交通工具的运行轨迹数据,并进行数据清洗、格式转换等预处理工作,以便后续分析。
2. 特征提取:从轨迹数据中提取出交通流量的时空分布特征,包括交通流量、速度、方向等。
3. 模型构建:根据提取的特征,构建短时交通流预测模型。
常用的模型包括基于统计的方法、机器学习方法和深度学习方法等。
4. 预测与评估:利用构建的模型对未来一段时间内的交通流量进行预测,并对预测结果进行评估,以便不断优化模型。
三、短时交通流预测技术的方法与实现1. 基于统计的短时交通流预测方法:该方法主要依据历史交通流量数据和统计学原理,对未来一段时间内的交通流量进行预测。
常用的统计方法包括时间序列分析、回归分析等。
2. 机器学习在短时交通流预测中的应用:机器学习方法可以通过学习历史交通流量数据的特征和规律,建立更为复杂的模型,提高预测精度。
常用的机器学习方法包括支持向量机、随机森林、神经网络等。
3. 深度学习在短时交通流预测中的应用:深度学习能够从海量数据中自动提取有用的特征信息,建立更为准确的模型。
第47卷第4期2019年4月Vol.47No.4April2019华南理工大学学报(自然科学版)Journal of South China University of Technology(Natural Science Edition)doi:19.19191/j.issn.1900-565X.190489基于K-meann聚类组合模型的公交线路客流短时预测陈维亚潘鑫方晓平十(中南大学交通运输工程学院,湖南长沙410075)摘要:预测公交线路短时客流是实现公交动态调度的关键技术.文中通过分析客流特性,构建了基于K-meann聚类算法的组合预测模型.首先利用K-meann算法将短时客流数据按照时变特征的相似度划分为不同聚类,然后为每类客流数据分别建立最小二乘支持向量机、BP神经网络、自回归滑动平均模型,并考虑天气因素的影响,用遗传算法优化模型参数,对比预测结果,从中选择每个聚类的最佳预测模型构成组合模型.最后以长沙市194路公交客流数据作为实例进行预测分析,结果显示:客流数据时变特征对模型具有选择性,K-meann聚类组合模型能够更好地根据不同时段客流数据的时变特征进行分类,因而有利于提高预测绩效;考虑了天气因素的K-meann聚类组合模型能进一步提高公交线路的短时预测绩效.关键词:公交线路客流;短时预测;K-means聚类算法;组合预测模型中图分类号:U491.1+4文章编号:1904-565X(2219)44-0403-05短时客流预测是实现公交动态调度的关键技术.公交短时客流与中长期客流预测服务目的不同,要求也有差异•中长期客流主要服务于静态调度计划的制定与资源优化配置,需要掌握日平均客流水平、峰值及其变化趋势,因而时段划分通常以小时、日为单位•短时客流预测主要服务于动态调度和即时信息服务,要求快速反应,时段划分通常以分钟为单位,实际操作中通常为6~30 mm[1].与中长期客流相比,短时客流的时变性、不确定性更显著,因此,对二者的预测在方法上也存在差异,很多适合于中长期客流预测的模型不一定适应短时客流预测•预测方中,时分于影响因素调查与筛选、多重共线性等难点而得到广泛应用⑵,如常用的自回归滑动平均模型(ARMA)和自回归积分滑动平均模型(ARIMA).这类方法通过保留时间序列的主要运动趋势的同时消除次要运动来达到降低噪声的目的[0-],但平滑方法不对时的理分,变平滑处理,可能使很多有用信息被消除;为识别复杂非线性系统的特性,神经网络[6-].支持向量机[5]等方法被广泛应用于客流预测•城市公交线路客流数据含有多种波动致因成分,给单一预测方法带来挑战,考虑采用将不同致因成分分离的组合预测方法是一种有效解决问题的思路.时间序列分解组合预测方法的工作方式是将原始序列按照不同方式进行分解得到不同子序列,并对每个子序列分别用不同模型预测后再合成•常用的时间序列分解技术包括小波分析金训、经验模态收稿日期:2019-09-22基金项目:国家自然科学基金资助项目(61920192);湖南省自然科学基金资助项目(2019JJ2605);湖南省交通厅课题(201723)Foundation items:Supported by the National Natural Science Foundation of Chinn(61920192)and the Natural Science Foundation of Hunan Proviace(201/JJ2607)作者简介:陈维亚(19010,男,博士,副教授,主要从事交通运输规划与管理研究.E-mail^yceea©.et通信作者:方晓平(1964-0,女,博士,教授,主要从事交通运输规划与管理、物流经济等研究.E-mail:fannxp@84华南理工大学学报(自然科学版)第47卷分解U1-12]和聚类算法U3-14.经验模态分解波分属频域分解•经验模态分解的结果能够充分地号本身所固有的非非平稳特征,对号具有很好的自力,分解过程不需人为干预可自动完成,但存在边缘效应问题,如不加以处理会严分解质量;小波分解的于小波基的选择,小波基的选择和分解层数的设置不同会导致分解结果的大不相同[⑸.聚类算法根据似度聚类分解,然后将原始分成不同的子或类,再针对各子或类分别预测后再合成,从而平稳的客流,因此也理过程中.文中以公交客流IC卡象,在客流特性分析的基础上,提出基于K-means聚类算法的短时客流预测组方法•先通过K-means算法将客流聚类,然后对每个聚类分别建立3个预测,通的预测结果每的预测模,将每的预测组合以实现公交客流短时预测.考虑本地变,组合将考虑的1客流数据来源及聚类分析于长沙市104路公交线路2012年6-7月的IC卡交,以33min为观测尺度,绘出1-4周的客流量变化,见图0日期图11-4周的客流量变化图Fig.11-4weekly passenger demand changa chart1可知,客流变化具有的期性,分别以期•小周期以,每日(不管是工是非工)的客流量的高、平峰、低峰时段,不同时段客流量差异较大,且早高峰客流量高于晚高峰,工客流高于非工•大周期以,每周的工之间的波形结构、近;非工之间的波形、峰值也似,但是工的客流波形、峰值与非工之间差别.以往的客流预测研究对数据进行拆分时,一般地将其分为高峰时段和非高峰时段,这种・分类的不足之处主要是高峰时择传统经验.IKmaass聚类是一种分类,可以无监地的结特征,根似将数据集划分成目的子集.因此文中采用K-meass聚类算法将工作日客流分为多种不同模式的聚类•IKmeans聚类算法是的基于距离的聚类算,象距离越近,似•文中选用欧式距离各对象之间的距离,聚:步骤1以33min为尺度把工划分为34个时段(5:34—22:34),将2个月工的客流:集处理成客流样本集合k1,o,--,33l,其中心代表第d个时段的客流量;步骤0从数据中随机选择%个对象作为初始聚中;步骤4计算每个对象到聚类中心的欧式距离,根离划分聚;步骤4再次计算每个聚类中;步骤5大侈,则停止;否则,3和4.于K-mease算要事先确定类%,这也是K-mease算法的,因此文中先选择多个%值,用DBI(Dnvies-Bouldin Iddx)系数以及STDI(Standard Deviation Based Indax)口6系验各%值下的聚类有效性•DB(二mn(+(1)k厂1'Dpq)式中:S°和Sg表示第〃类和第g类内的元素与质心的差叽第卩类和第g类质的距离•式(1)中分子似度越大,分大各聚似度•因聚质量,说明聚类结果越有效.+(£山一3||STDI二-------f*mn2)P=1U=1(2)式中耳是类卩的质心,是所有样本的质心,u是类卩的第u个样本,◎是类p的样本数•STDI系数的分子各方差,分子越大,表示各聚相似度;分各方差之,分,似度越大•因此,STDI值越大,说明聚类结果越有效.第4期陈维亚等:基于K-means聚类组合模型的公交线路客流短时预测06聚类分析9-7周的工作日数据,当聚类数%分别为2,3,…,7时,DBI系数和STDI系数见表/ Table9Coefficiems of differeai clusterinn results表】聚类检验系数聚类数DBI系数STDI系数20.95790.412530.69790.968340.56530.755760.46650.255460.50430.512570.52530.7942由表】可知,当聚类数为5时,DBI系数和STDI 系数同时达到最优,因此合适的聚类数目为5,聚类结果见表2-表2最优聚类数的时段划分结果Tabe2Tima division resultu of optimal clusterinn numbae 聚类编号时段聚类95:f0—6:f9;21:f0—20:f0聚26:f0—6:f0;19:f9—01:f0聚319:00—9:0;19:3—19:0聚类46:f0—7:00;J:。
短时交通流预测模型综述引言:随着城市化进程的加快和交通拥堵问题的日益严重,短时交通流预测成为了交通管理和规划的重要工具。
通过准确地预测交通流量,交通部门可以根据预测结果来制定合理的交通管理措施,提高交通效率,缓解交通拥堵,为居民提供更加便捷的出行环境。
本文将综述目前常用的短时交通流预测模型,以便读者对该领域有更全面的了解。
一、基于统计模型的短时交通流预测基于统计模型的短时交通流预测方法是最早应用的预测方法之一。
这种方法通过对历史交通数据进行统计分析,建立数学模型来预测未来的交通流量。
常用的统计模型包括回归模型、ARIMA模型等。
这些模型通过分析交通流量与时间、天气等因素的关系,来预测未来的交通流量。
尽管这类模型在一定程度上能够准确预测交通流量,但是由于模型的线性假设和对历史数据的依赖性,对于复杂的交通流量变化往往预测效果较差。
二、基于人工神经网络的短时交通流预测人工神经网络是一种模拟人脑神经系统的计算模型,可以通过学习和自适应来预测未来的交通流量。
这种方法的优势在于可以对非线性关系进行建模,并且对于历史数据的依赖性较低。
常用的人工神经网络模型包括BP神经网络、RBF神经网络等。
这些模型通过对历史交通数据的学习和训练,来预测未来的交通流量。
然而,人工神经网络模型需要大量的训练数据,并且对网络结构和参数的选择较为敏感,往往需要较长的训练时间和计算资源。
三、基于机器学习的短时交通流预测机器学习是一种通过对大量数据进行学习和自适应来预测未来的交通流量的方法。
与传统的统计模型和人工神经网络相比,机器学习方法能够处理更复杂的非线性关系,并且对于历史数据的依赖性较低。
常用的机器学习方法包括支持向量机、决策树、随机森林等。
这些方法通过对历史交通数据的学习和训练,来预测未来的交通流量。
机器学习方法在短时交通流预测中取得了很好的效果,并且在实际应用中得到了广泛的应用。
四、基于深度学习的短时交通流预测深度学习是一种基于人工神经网络的机器学习方法,可以通过多层次的神经网络结构来提取和学习更高级别的特征。
非参数回归模型非参数回归模型非参数回归模型也叫多元回归模型,它是一种脱离于混沌理论的多条路段分析方法。
它是对当前路段和几条相邻路段的交通流信息对当前路段进行交通流预测的单条路段分析的扩展。
它不需要先验知识,只需要有足够的历史数据即可。
它的原理是:在历史数据库中寻找与当前点相似的近邻,并根据这些近邻来预测下一时间段的流量。
该算法认为系统所有的因素之间的内在联系都蕴含在历史数据中,因此直接从历史数据中得到信息而不是为历史数据建立一个近似模型。
非参数回归最为一种无参数、可移植、预测精度高的算法,它的误差比较小,且误差分布情况良好。
尤其通过对搜索算法和参数调整规则的改进,使其可以真正达到实时交通流预测的要求。
并且这种方法便于操作实施,能够应用于复杂环境,可在不同的路段上方便地进行预测。
能够满足路网上不同路段的预测,避免路段位置和环境对预测的影响。
随着数据挖掘技术左键得到人们的认可和国内外学者的大量相关研究,使得非参数回归技术在短时交通流预测领域得到广泛应用。
非参数回归的回归函数()X g Y =的估计值()X g n 一般表示为:()()∑==n i i i i n Y X W X g 1其中,Y 为以为广策随机变量;X 为m 维随机变量;(Xi,Yi )为第i 次观测值,i=1,...,n ;Wi(Xi)为权函数.非参数回归就是对g(X)的形状不加任何限制,即对g (X )一无所知的情况下,利用观测值(Xi,Yi ),对指定的X 值去估计Y 值。
由于其不需要对系统建立精确的数学模型,因此比较适合对事变的、非线性的系统进行预测,符合对城市交通流的预测,同时可以与历史平均模型实现优缺点的互补。
K 近邻法Friedman 于1977年提出了K 近邻法。
其并不是让所有的数据都参与预测,而是以数据点到X 点的距离为基础,甲醛是只有离X 最近的K 个数据被用来估计相应的g(X)值。
可以引入欧式空间距离d ,然后按这个距离将X1,X2,...,Xn 与X 接近的程度重新排序:Xk1,...,Xkn,取权值如下:Wki(X:X1,...,Xn)=ki,i=1,..,n将与X 最近的前K 个观测值占有最大的权K=1,其余的观测值赋予权值k=0.最终得到应用于短时交通流预测的K 近邻法可表示为:()()()()K t V t V g t V K i i ∑=+==+111 其中,K 为所选取最邻近元素的个数,取值大小依赖于数据。
基于局部加权学习的短时交通流预测研究的开题报告一、研究背景交通流预测一直是交通领域中一个重要的问题,并且其准确性对于交通控制和规划具有重要意义。
传统的短时交通流预测方法包括回归分析、时间序列分析和神经网络等。
然而,这些方法存在着一些不足,例如:回归分析和时间序列分析依赖于稳定可靠的历史数据,而神经网络需要大量的训练数据才能达到较好的预测效果。
为了解决这些问题,局部加权学习(Locally Weighted Learning,LWL)在近年来引起了广泛关注。
该方法是一种非参数回归方法,可以在不使用全局函数的情况下近似来自非线性或非平稳数据集的局部函数,因此可以使用不完整的数据集进行预测。
二、研究目的和意义本研究旨在探究局部加权学习在短时交通流预测中的效果,并将其与传统的预测方法进行比较分析。
研究结果有望对于改善城市交通流预测精度和交通控制具有一定的参考价值。
三、研究内容和方法1.研究内容(1)对局部加权学习进行深入研究,了解其基本原理和算法流程。
(2)通过分析交通流预测的实际应用场景,确定研究的预测对象和预测指标。
(3)构建局部加权学习模型,并通过实验数据进行模型训练和验证。
(4)与传统的短时交通流预测方法进行比较分析,评估局部加权学习在交通流预测中的效果优劣。
2.研究方法(1)文献调研法:通过查阅相关文献,了解局部加权学习的基本概念、发展历程和研究现状。
(2)实验研究法:采集实际的交通流数据,构建局部加权学习模型,并进行模型训练和验证。
(3)比较分析法:将局部加权学习与传统的短时交通流预测方法进行比较分析,评估其在交通流预测中的效果。
四、预期成果(1)掌握局部加权学习的基本原理和实现方法,以及其在交通流预测中的应用。
(2)针对实际交通流数据建立的局部加权学习模型,并评估模型的预测精度。
(3)将局部加权学习与传统的预测方法进行比较,分析其效果优劣。
五、研究计划(1)10月份:完成研究框架和开题报告,并对文献进行综述。
基于非参数回归的城轨实时进出站客流预测谢俏;李斌斌;何建涛;姚恩建【摘要】为准确预测城轨实时进出站客流,构建基于非参数回归的实时进出站客流预测模型.首先,对不同特征日分时进出站客流量进行对比分析,据此构建历史数据库;其次,通过计算历史分时数据的相关系数,并设置阈值对分时客流数据间的相关性进行判断,从而确定合适的非参数模型状态向量;再次,根据K近邻样本与预测目标的客流量差异性,设计基于权重加权的预测算法;最后利用广州市城轨客流数据对预测模型进行精度分析,对全网站点多天的预测结果显示:全天平均绝对百分比误差均在2%以下,分时平均绝对百分比误差均在14%以下,表明模型具有较高的预测精度和良好的适用性.%The short-term fluctuations of passenger flows should be responded quickly with the help of real-time forecasts to guarantee safe transportation.A non-parametric regression model is established to accurately forecast the real-time entrance and exit passenger flows in urban rail transit stations.Firstly,the time-sharing data for entrance and exit passenger flows of different days are compared and analyzed to lay a foundation for the construction of historical database.Secondly,the appropriate state vector for the non-parametric model is defined by calculating the self-correlation coefficient of historical time-share passenger flow data and setting the threshold value of correlation to judge the data dependency.Thirdly,the forecasting algorithm is designed according to the entrance and exit passenger flows' difference between K-nearest neighbor samples and prediction objectives.Finally,the data of entrance and exit passenger flows collected from Guangzhou metrosystem is used for the case study,and the result shows that the mean absolute percentage errors for the day and time-sharing passenger flows are successfully limited to 2% and 14% respectively,which demonstrates that the forecasting accuracy of the proposed model is satisfactory.【期刊名称】《都市快轨交通》【年(卷),期】2017(030)002【总页数】6页(P32-36,41)【关键词】城市轨道交通;进出站客流;实时预测;K近邻;非参数回归【作者】谢俏;李斌斌;何建涛;姚恩建【作者单位】广州地铁集团有限公司,广州510030;北京交通大学交通运输学院,北京100044;广州地铁集团有限公司,广州510030;北京交通大学交通运输学院,北京100044【正文语种】中文【中图分类】U231随着城市轨道交通网络格局的逐步形成,网络客流规模持续攀升,地铁运营压力日益凸显。
聚类算法在交通流量预测中的应用研究在城市化进程不断加快的今天,城市交通问题日益突出。
预测交通流量是重要的交通管理任务之一,有效的交通流量预测可以帮助智能交通系统、城市规划和交通管理等领域做出更加准确的决策。
聚类算法因其强大的数据挖掘能力和适用性,在交通流量预测中得到了广泛的应用。
本文将从交通流量预测的需求出发,介绍聚类算法在交通流量预测中的应用研究。
一、交通流量预测的需求对于城市交通管理部门来说,及时准确地掌握道路交通流量信息是非常重要的。
交通管理决策需要建立在对未来交通流量的准确预测之上,这样才能更好地规划交通路线、优化道路资源配置、调节交通流量等。
传统的交通流量预测方法往往采用基于时间序列分析或者人工神经网络等方法,但这些方法对于预测精度的要求很高,对于大规模的复杂交通网络,效果并不理想。
因此,如何提高交通流量预测的准确率,一直是交通管理部门和科研人员需要攻克的难题。
二、聚类算法在交通流量预测中的应用聚类算法是一种非监督学习算法,其主要目的是将数据对象根据相似性分成不同的类别。
在交通流量预测中,聚类算法被广泛应用于交通网络分析、出行行为识别、路段流量预测等方面。
1.交通网络分析交通网络分析是交通流量预测的前提,也是其中最关键的一步。
在交通网络中,每个路段都与其他路段相互连接,而交通流量预测所需要的数据几乎全部来自于这些相互连接的路段。
聚类算法可以应用于交通网络的拓扑结构分析中,找出那些最具相似性的路段,对这些路段的交通流量和速度进行聚合,提高交通流量预测的准确性。
2.出行行为识别出行行为识别是通过分析用户的出行数据,了解用户的出行习惯和需求,从而实现出行路线规划、出行模式预测等交通管理任务。
聚类算法可以将用户的出行数据分成不同的类别,根据用户的出行规律预测其未来的出行模式。
比如,将公交出行、步行出行、驾车出行等分类,预测用户在某个时间段内采取何种交通出行方式。
3.路段流量预测路段流量预测是交通流量预测的核心。
聚类算法在交通流分析中的应用研究随着城市交通的日益繁忙和交通工具的不断增加,交通流分析日益成为研究的重点。
聚类分析以其在数据降维、分类和预测等方面的优异表现,在交通流分析中得到了广泛应用。
本文将从聚类算法在交通流分析中的应用研究出发,探讨聚类算法(包括k-means、DBSCAN、谱聚类等)在交通流量和路况预测方面的应用,丰富交通流分析研究领域的内容,为城市交通管理提供参考。
第一部分:简介交通流分析研究起源于十九世纪末的交通运输工程学,当时交通流量主要考虑的是车流量与车辆速度。
如今,随着信息技术的发展以及交通设备、数据采集设备的应用,交通流量分析已经升级为平面、立体交通流量分布、路况监测等方面的预测和研究。
由于交通流入住的不稳定性,交通监测不可避免地涉及到一定的不确定性,同时在数据预测中,传统的线性模型由于其拟合不足、过度拟合等缺陷,经常出现误差较大的问题。
本文第一部分将介绍聚类算法在交通流分析中的应用研究,说明聚类算法的特点和应用场景。
第二部分:聚类算法的基本理论及算法实现聚类算法是一种无监督学习方法,常用于将样本划分成若干组(聚类),使得组内差异尽可能小,而组间差异尽可能大。
聚类算法(k-means、DBSCAN、谱聚类等)的基本理论及算法实现也有较大区别。
在选取聚类算法时,需结合需求,进行分类考虑。
本文第二部分将介绍k-means、DBSCAN、谱聚类的基础理论和算法实现,并探讨它们在交通流分析中的应用。
第三部分:聚类算法在交通流量预测中的应用在交通流量预测方面,聚类算法也得到了广泛应用。
交通流量预测的研究主要分为两个方面:一是通过历史交通数据预测未来的交通流量,二是通过实时数据预测畅通的交通路线。
而聚类算法在这两方面都有应用。
(1) 历史交通数据分析预测:通过对历史交通数据进行预测,可以初步预测未来交通的流量及拥挤程度,从而为城市交通规划、交通计算提供依据。
聚类算法被广泛应用于交通流量预测中,通过对历史数据的聚类处理,得到具有代表性的交通流量模型,从而增强预测效果,提高预测精度。
短时交通流预测模型综述
短时交通流预测模型是交通领域中的一个重要研究方向,其主要目的是通过对交通流量、速度、密度等参数的预测,为交通管理和规划提供科学依据。
本文将对短时交通流预测模型进行综述。
短时交通流预测模型可以分为基于统计学方法和基于机器学习方法两类。
基于统计学方法的模型主要是通过对历史数据的分析和建模,来预测未来的交通流量、速度等参数。
其中,常用的方法包括时间序列分析、回归分析、灰色预测等。
这些方法的优点是模型简单、易于理解和实现,但是对数据的要求较高,需要有足够的历史数据来支撑模型的建立和预测。
基于机器学习方法的模型则是通过对大量数据的学习和训练,来建立预测模型。
常用的机器学习方法包括神经网络、支持向量机、决策树等。
这些方法的优点是可以自动提取数据中的特征,对数据的要求较低,能够处理非线性和复杂的交通流预测问题。
但是,机器学习方法需要大量的数据和计算资源来训练模型,同时模型的可解释性较差,难以理解模型的内部机制。
除了基于统计学和机器学习的方法外,还有一些其他的方法被用于短时交通流预测,如基于模糊逻辑的方法、基于遗传算法的方法等。
这些方法各有优缺点,需要根据具体问题和数据来选择合适的方法。
短时交通流预测模型是交通领域中的一个重要研究方向,其应用范
围广泛,包括交通管理、交通规划、智能交通系统等。
不同的预测方法各有优缺点,需要根据具体问题和数据来选择合适的方法。
未来,随着数据采集和处理技术的不断发展,短时交通流预测模型也将不断地得到改进和完善。
Vol 21 No 3公 路 交 通 科 技2004年3月JOURNAL OF HIGHWAY AND TRANSPORTATION RESE ARCH AND DE VELOPMENT文章编号:1002 0268(2004)03 0082 04交通流预测方法综述刘 静,关 伟(北京交通大学,北京 100044)摘要:实时交通流预测是智能运输系统研究的一个重要问题。
为此,建立了许多预测模型,有历史平均模型、时间序列模型、卡尔曼滤波模型、非参数回归模型、神经网络模型和组合模型等。
总结评述现存的各类模型,提出交通流预测研究领域今后可能的发展趋势。
关键词:交通流预测中图分类号:U491 112 文献标识码:AA Summary of Traffic Flow Fo recasting MethodsLI U Jing,GU AN Wei(Beijing Jiaotong University,Beijing 100044,China)Abstract:Real ti me traffic flow forecasting is one of important issues of ITS research Some forecasting models includi ng his tory average, time series,Kalman fil tering,non parametric regression,neural networks and syn thetic model,etc,have been established Review of these existing forecasting models,and probable frequency of traffic flow forecasting research field is presentedKey words:Traffic flow forecasting0 引言随着社会经济和交通事业的发展,交通拥挤和交通事故等诸多交通问题越来越凸现出来,成了全球共同关注的难题。
短时交通流预测模型综述摘要:分析短时交通流预测的意义,对国内外的研究方法和主要成果进行详细的阐述、分析、归类,主要包括基于传统统计分析的预测模型、非参数回归预测模型、基于非线性理论的预测模型、智能预测模型等4种单一预测模型和组合预测模型,对各类模型复杂性、精度、适用性进行逐一分析。
短时交通流预测研究领域在未来一段时间内发展趋势是数据来源多样化、混沌理论和深度学习深度发展,组合预测模型多样化,预测精度不断提高。
关键词:短时交通流;预测;小波分析;神经网络;综述;0 引言城市高峰拥堵给人们的出行带来极大不便的同时也制约着城市经济的发展。
对短时交通流进行实时精准的预测是交通控制与交通诱导的前提,是当前国内外交通工程领域所研究的热门问题之一,其主要问题是如何以历史与实时的交通数据信息为依据,采用合适的方法去滚动预测未来短时间内交通流的状态,一般认为短时交通流的预测时间间隔为5~15min。
受外部不确定因素的干扰,短时交通流往往不是线性变化,准确预测的难度很大,一些学者借鉴其他领域的预测方法和模型预测短时交通流,由最初的简单的解析数学方法的模型演变为计算机算法对短时交通流的预测进行研究,预测的精度大有提高。
不同交通状态下,单一预测方法很难确保都能有很好的拟合效果和预测精度,一些学者开始对不同的预测模型分析、组合,组合预测是目前国内外最常用的预测方法。
1单一预测模型1.1基于传统统计分析的预测模型这类预测模型比较简单,依据历史数据,假设预测的数据和历史数据变化特性一致,该类模型主要包括历史平均模型、时间序列模型和卡尔曼滤波模型等。
历史平均模型无需复杂的建模计算,将全期历史数据平均值作为预测结果,但其没有考虑交通流的波动性,预测精度较差,对于突发的和复杂的交通状况,此种方法就不能处理了。
时间序列模型在参数模型中运用广泛,其中自回归积分滑动平均模型(ARIMA模型)应用最为广泛,卡尔曼滤波采用的状态空间模型灵活性很高,故对平稳数据和非平稳数据的处理均可运用。
基于聚类分析的非参数回归短时交通流预测方法——刘洋马寿峰27基于聚类分析的非参数回归短时交通流预测方法*刘洋
马寿峰
(天津大学管理与经济学部天津300072)
摘要大部分非参数回归预测算法并不对交通流历史数据进行区分,而是将全部历史流量数据建立模式库进行分析。基于交通流的现实特征,提出基于聚类分折的非参数回归短时交通流预测方法,首先根据流量分布特点运用聚类分析将其分类成不同的流量模式,然后选择匹配待预测时刻的流量模式作为样本数据库运用非参数回归进行预测。实例计算结果表明,其预测精度优于传统非参数回归方法。关键词短时交通流预测;聚类分析;非参数回归中图分类号:U491文献标志码:Adoi:10.3963/i.issn1674—4861,2013.02,007
O引言智能交通系统近年发展迅猛,交通控制和诱导成为当今社会交通领域的一大课题,解决这一问题的前提是采用精度高、时效性强的方法对交通流进行准确预测。现存的预测方法大致可分为2类:第1类是传统的基于数理统计模型的预测方法,如ARIMA模型[1。2j、自适应权重联合模型[2]、卡尔曼滤波模型[11等,这些预测方法基于数理统计模型,计算简便,但是由于交通流的随机性与非线性,实际情况下,很难建立精确且符合交通流特征的数学模型,尤其无法克服随机干扰因素的影响。近年来,交通流预测开始逐渐依赖于第2类智能交通流预测方法,如神经网络方法[34、支持向量机方法[5]、非参数回归方法[6。71等。神经网络具有自学习自适应等优点,炱天鹂[8]针对传统预测方法准确性低、预测时间长等问题将遗传算法和神经网络相结合,提高了交通量的预测精度,张敬磊[91提出的1种基于RBF和ARIMA网络非线性组合模型的短时交通流预测方法组合发挥了2种方法的预测优势。非参数回归是近几年兴起的1种适合不确定性的、非线性的动态系统的建模方法,其基本思想是:从交通流数据中寻找不同的“模式”、即交通流的当前状态和未来状态的固定对应关系并建立模式库,然后通过在模式库中寻找与当前状态相似的历史状态,并把与当前点匹配的历史状态应用于状态预测,具有可移植性强和预测精度高等特点,适应短时交通流预测。1995年Smithcto第1次将其应用在短时交通流预测上,这之后很多学者提出了改进方法,王晓原[1妇将小波分析算法和非参数回归结合,先将交通流数据分解重构得到光滑的交通信号曲线,提升了非参数回归的预测效果。贾宁u23针对提高搜索速度和关键参数的优化设置2个问题,提出使用KD树作为模式库的存储结构,能够有效提高搜索速度,使预测性能进一步提高,这些预测方法在一定程度上满足了交通流预测的需要。从预测原理上讲,非参数回归预测就是通过模式匹配的方法,利用交通流的当前状态(自变量)来估计交通流参数的未来值(因变量),因此自变量的选取是非参数固归预测方法应用中1个十分重要的问题[7]。在交通流预测中,一般有2种代表性思路。1)时间关联。例如,利用待预测位置前推若于个周期的交通流量来预测未来的交通流量,这种选取方法的依据是交通流变化趋势的重复性。2)空问关联。例如,该位置上游某点的当前流量,来预测该位置的未来流量,这种思路的依据是交通流的空间变化性质。在实际应用中,具体应用哪种策略需要根据
收稿日期:2012—1031修回日期:2013-0327*国家自然科学基金项目(批准号:70971094)、教育部博士点基金项目(批准号:20090032110033.20090032120032)资助第一作者简介:刘洋(1989),硕士生.研究方向:智能交通、交通系统工程.E—mail:liuyan989@tju.edu.Cll
万方数据28交通信息与安全2013年2期第31卷总175期
待预测道路的实际情况来选择。在高速公路交通流预测中,由于交通流信息采集设备一般间隔较远,大多只安装在高速公路的出入口附近,因此空间关联策略由于受到数据因素的限制,很难采用,因此只能以时间关联策略为主。在目前提出的方法中,通行的做法是将收集的所有历史流量数据构造为样本数据库,然后采用预测路段前N个时刻的流量作为状态向量。但是,根据交通科学的原理,不同日期(例如:工作日和周末)的交通流量分布有明显的差异,如果忽视这一现实特点,对提高预测精度是不利的。因此,本文根据不同日期流量模式分布不同的原理,将聚类分析和非参数回归相结合,提出了基于聚类分析的非参数回归短时交通流预测方法,即先根据不同时间的交通流数据特点将流量数据进行分类,再选择匹配待预测时刻流量模式的类别作为样本数据库运用非参数回归进行预测,更好地考虑了交通流的现实特点和规律,使短时交通流预测的精度有所提高。1基于聚类分析的非参数回归短时交通流预测方法不同日期道路状况、天气情况下,人们出行需求等都有很大差异,导致流量在不同日期的分布具有不同的特点。例如人们在节假日由于工作产生的出行需求大大降低,而因为旅游的出行增加,流量模式和非节假日必然不同。如图1、2对比所示,图1为天津市高速公路九宣闸站2011年3月3日的流量数据,3月3日为普通工作日,图2为九宣闸站2011年10月1日国庆节的流量数据,数据均来自天津市高速公路信息管理中心的实测数据。图1和图2虽然都具有早高峰和晚高峰,但是国庆节的高峰值所在时间早于3月3日。从流量值上看,国庆节的最高值在220辆左右,是3月3日的最高值2倍以上。器Ⅻ啷埕o__Nn寸呐卜。。ao._“寸”∞卜q。小H“n。。。。。。。。。百开百……“““图12011年3月3日流量Fig.1ThetrafficflowofMarch3,20J1由图1可见,不同日期之间,交通流量在ld当中的分布差异很大,从3月3日数据中发现的流量模式,直接应用于国庆节流量的预测势必会产生很大的误差。因此在交通流预测中,需要根据不同类型的交通流量分布去分别建立不同的交通流量模式库。因此,如何区分流量模式的类别对于预测精度有很大影响。凭经验直接分类不能科学准确地将交通流量分布区分,应该采用聚类分析方法根据流量相似程度分类。
吕苫g昌吕g吕若詈言========旦戈罱划焉时间
图22011年国庆节流量
Fig.2Thetrafficflow。fNationalDay,2011
1.1K-means聚类方法聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程,符合短时交通流预测对予流量模式分类的要求,本文选择K—means聚类方法。K—means算法采用距离作为相似性的评价指标。该算法认为簇是由距离较近的对象组成的,它要求同一聚类中的对象相似度较高,不同聚类中的对象相似度较小。流程如下:1)初始化。设定聚类数(K),随机选择某些样本点作为初始聚类中心;2)循环,按就近原则将其余记录向聚类中心聚集,计算出各个类新的聚类中心位置,并用它们重新进行聚类,反复循环直至聚类中心位置收敛。K—means聚类方法需要预先设定类别个数(K),K值的选择对于之后聚类结果好坏以及预测的效果有直接影响。类别过少或过多都不能准确的表现出样本特性,无益于提升预测精度,类别太少会掩盖“同一类”样本中实际存在的差别;类别太多则无法抽象出“不同类别”问存在的共同特征,且可能导致预测流程繁琐或者某个类别中数据不足的情况。K值的设定应满足同一类中的对象相似程度较高,不同类中的对象相似程度较低。在进行交通流预测时,各类中的对象指的是不同日期流量的时间序列,本文选择这些时间序列之间的欧式距离作为衡量相似程度高低的标准,计算方法如下。
万方数据基于聚类分析的非参数回归短时交通流预测方法——刘洋马寿峰
29
d=为了满足以上聚类要求,可选择类间距离/类际距离作为评价K值优劣的指标。类间距离指的是同l类中每个数据和这个类中其他所有数据均值的欧式距离的和,用来表示同1类内部的距离大小,设为tntraDistance。类际距离指的是将每1类的每个数据和其他各类中数据均值的欧式距离的和,用来表示不同类之间的距离大小,设为InterDistance。IntraDistance/InterDistance越小,聚类效果越好。因此,在运用K—means聚类区分流量模式时,只需预先设定几个符合实际情况的K值,分别进行聚类,然后计算IntraDistance/InterDis—tance,选择该指标较小的结果作为聚类结果,根据聚类结果分别建立数据库,为预测交通流做准备。1.2基于聚类分析的非参数回归短时交通流预测方法框架基于聚类分析的非参数回归短时交通流预测方法框架见图3。图3基于聚类分析的非参数回归短时交通流预测方法框架Fig.3Frameofnon—parametricregressionshort—termtrafficflowforecastingmethodbasedclusteranalysis由图3可知,预测流程如下:1)基于聚类分析建立模式库:非参数回归预测的准确程度和效率很大程度上取决于模式库的质量。模式库并不是越大越好,1个质量较好的数据库应该包含研究道路的所有状态,而又不存在过多数据冗余。为了区分不同日期的交通流量模式,应将以天为单位的历史流量时间序列作为对象,运用上述K—means聚类方法将其分为几类,然后对不同类中的历史数据分别建立模式库。2)定义状态向量和数据相似性:状态向量是指能够描述当前状态的几个分量组成的1个向量,在预测交通流时一般选择预测路段前Ⅳ个时刻的流量时间序列;数据相似性的定义指根据何种标准评价当前点和历史数据库中的点的相似度,一般选用欧式距离作为相似性指标。3)选择样本数据库:将待预测时刻前N个时刻的流量时间序列作为表征流量模式的向量,计算该向量与流程1中建立的各数据库中的聚类中心点同时间的N个时刻组成的时间序列之问的相似性。选择相似性最小的库作为样本数据库。4)近邻机制的建立:近邻机制是如何根据数据相似性来判断历史数据库中的点是否是当前状态的近邻,一般有最小K近邻法和核近邻法u5)定义预测算法:近邻点找到以后,如何利用这些近邻点预测下1个时刻的预测变量的值。常用的方法有:求平均值,加权平均法等。综上,基于聚类分析的非参数回归短时交通流预测方法是指将历史数据库中的交通流数据运用聚类分析的方法区分为流量模式不同的几个类别,在有交通流预测需求时,基于模式识别的思想,选定流量模式最近似的类别作为样本数据库,然后采用非参数回归方法进行计算得到预测结果。该方法有以下特点:1)该方法的数据首先经过聚类处理对不同交通流状态进行区分,使在交通流预测时考虑到不同时间的交通流特点不同的现实特征;2)选择非参数回归作为预测方法,具有可移植性和高适应性,当需要采用该方法在其他路段或站点进行预测时,只需将数据库更换即可。另外,车辆保有量和区间需求量的变化是对交通流预测结果的1个影响因素,由于车辆保有量和区间需求量一般是1个长期因素,它在短时间内变化较小,因此定期将新数据更新到非参数回归的模式库中可以较好地减小两者对预测结果的影响。