交通状态判别
- 格式:doc
- 大小:449.22 KB
- 文档页数:13
第一章绪论1.1 研究背景1.1.1问题的提出改革开放以来,随着我国现代化、城市化进程的加速,交通拥挤问题也逐渐产生并日益严重。
近20年,内地民用汽车年平均增长率为13.3%,私人汽车年平均增长率高达23.7% 。
其中,北京作为人口超过2000万人、机动车500万辆的特大城市,交通拥堵已成为制约城市发展的主要问题,2010年10月的美国《外交政策》一书更是将北京列为世界五大拥堵城市之首。
城市交通拥挤已严重阻碍中国城市经济及空间布局结构的良性发展,在社会各个方面造成负面效应,具体表征为时间延误、能源浪费、大气污染及情绪影响等。
这些负面效应使得社会外部成本增高,危害了人类的经济利益和健康安全,更不符合建设和谐交通的目的。
因此,从科学的角度对城市道路拥挤的根本原因进行深入分析显得格外重要。
这不是单纯地统一增加道路基础设施建设、扩大路网规模来满足不断增长的交通需求量,而是通过拥挤识别确定城市不同道路的拥挤度来实施不同的解决措施。
建立完善的、符合我国国情的交通拥挤识别体系并合理运用成为当务之急。
1.1.2 研究意义我国是一个人口众多的发展中国家。
自1991年以来,我国的经济发展速度持续超过10%,而持续的经济增长使得人民对交通的需求扩大。
汽车产量增大,人民的购买力上升,人民的配车率提高,私人小汽车的数量快速增长,城市的交通需求与交通供给出现了不平衡状况,导致了城市尤其是大城市严峻的交通拥挤问题。
因此,此次研究的目的就是通过分析交通指挥中心的固定检测器采集和实地考察的交通数据,在交通拥挤识别体系下,计算出有效的道路实时动态交通信息,根据获取的数据信息实时、准确地为管理者制定合理有效的交通拥挤疏导策略。
1.2国内外研究现状1.2.1拥挤识别研究现状到目前为止,国内外对很多学者研究开发了许多的 ACI 算法。
加利福尼亚算法。
通过比较邻近检测站之间的交通参数数据,对可能存在的突发交通事件进行判别,由此确定交通拥挤的发生。
第一章绪论1.1研究背景1.1.1问题的提出改革开放以来,随着我国现代化、城市化进程的加速,交通拥挤问题也逐渐产生并日益严重。
近20年,地民用汽车年平均增长率为13.3%,私人汽车年平均增长率高达23.7% 。
其中,作为人口超过2000万人、机动车500万辆的特大城市,交通拥堵已成为制约城市开展的主要问题,2010年10月的美国“外交政策“一书更是将列为世界五大拥堵城市之首。
城市交通拥挤已严重阻碍中国城市经济及空间布局构造的良性开展,在社会各个方面造成负面效应,具体表征为时间延误、能源浪费、大气污染及情绪影响等。
这些负面效应使得社会外部本钱增高,危害了人类的经济利益和安康平安,更不符合建立和谐交通的目的。
因此,从科学的角度对城市道路拥挤的根本原因进展深入分析显得格外重要。
这不是单纯地统一增加道路根底设施建立、扩大路网规模来满足不断增长的交通需求量,而是通过拥挤识别确定城市不同道路的拥挤度来实施不同的解决措施。
建立完善的、符合我国国情的交通拥挤识别体系并合理运用成为当务之急。
1.1.2研究意义我国是一个人口众多的开展中国家。
自1991年以来,我国的经济开展速度持续超过10%,而持续的经济增长使得人民对交通的需求扩大。
汽车产量增大,人民的购置力上升,人民的配车率提高,私人小汽车的数量快速增长,城市的交通需求与交通供应出现了不平衡状况,导致了城市尤其是大城市严峻的交通拥挤问题。
因此,此次研究的目的就是通过分析交通指挥中心的固定检测器采集和实地考察的交通数据,在交通拥挤识别体系下,计算出有效的道路实时动态交通信息,根据获取的数据信息实时、准确地为管理者制定合理有效的交通拥挤疏导策略。
1.2国外研究现状1.2.1拥挤识别研究现状到目前为止,国外对很多学者研究开发了许多的 ACI 算法。
加利福尼亚算法。
通过比拟邻近检测站之间的交通参数数据,对可能存在的突发交通事件进展判别,由此确定交通拥挤的发生。
此算法于 1965-1970 年间,由加利福尼亚洲运输部开发。
第一章绪论1.1 研究背景1.1.1问题的提出改革开放以来,随着我国现代化、城市化进程的加速,交通拥挤问题也逐渐产生并日益严重。
近20年,内地民用汽车年平均增长率为13.3%,私人汽车年平均增长率高达23.7% 。
其中,北京作为人口超过2000万人、机动车500万辆的特大城市,交通拥堵已成为制约城市发展的主要问题,2010年10月的美国《外交政策》一书更是将北京列为世界五大拥堵城市之首。
城市交通拥挤已严重阻碍中国城市经济及空间布局结构的良性发展,在社会各个方面造成负面效应,具体表征为时间延误、能源浪费、大气污染及情绪影响等。
这些负面效应使得社会外部成本增高,危害了人类的经济利益和健康安全,更不符合建设和谐交通的目的。
因此,从科学的角度对城市道路拥挤的根本原因进行深入分析显得格外重要。
这不是单纯地统一增加道路基础设施建设、扩大路网规模来满足不断增长的交通需求量,而是通过拥挤识别确定城市不同道路的拥挤度来实施不同的解决措施。
建立完善的、符合我国国情的交通拥挤识别体系并合理运用成为当务之急。
1.1.2 研究意义我国是一个人口众多的发展中国家。
自1991年以来,我国的经济发展速度持续超过10%,而持续的经济增长使得人民对交通的需求扩大。
汽车产量增大,人民的购买力上升,人民的配车率提高,私人小汽车的数量快速增长,城市的交通需求与交通供给出现了不平衡状况,导致了城市尤其是大城市严峻的交通拥挤问题。
因此,此次研究的目的就是通过分析交通指挥中心的固定检测器采集和实地考察的交通数据,在交通拥挤识别体系下,计算出有效的道路实时动态交通信息,根据获取的数据信息实时、准确地为管理者制定合理有效的交通拥挤疏导策略。
1.2国内外研究现状1.2.1拥挤识别研究现状到目前为止,国内外对很多学者研究开发了许多的 ACI 算法。
加利福尼亚算法。
通过比较邻近检测站之间的交通参数数据,对可能存在的突发交通事件进行判别,由此确定交通拥挤的发生。
随机森林算法在交通状态判别中的应用近来,由于城市交通拥堵问题的持续加剧,研究者们越来越重视对交通状态的预测和识别技术的研究。
随机森林(RF)算法是目前最有效的一种分类算法,它是一种在模式识别和机器学习领域中广泛应用的集成学习算法。
本文将介绍随机森林算法在交通状态判别中的应用,并分析随机森林算法在此领域的优缺点以及可能的发展前景。
首先,让我们了解一下随机森林算法。
随机森林算法是一种基于决策树的集成学习算法,它可以将多个决策树组合成一个整体,以达到实现更高精度分类和回归目标的目的。
它由大量的决策树组成,每个决策树从不同的训练集采样,每个决策树都可以独立地运行,并最终将各自的结果汇总在一起,输出最终的结果。
这一算法可以有效减少分类和回归任务的错误,这也是它被广泛应用于复杂分类和回归问题中的原因。
随机森林算法可以应用于交通状态判别,它可以有效判断城市交通现状,例如是否拥堵,是否有事故发生等。
为此,研究者们使用随机森林算法对交通路况进行多元分析。
通过采集实时的交通数据,如车流量、速度、间距等,运用随机森林算法来预测一段路段的具体的交通状态,从而为交通管理者提供实际的帮助。
由于随机森林算法在交通状态判别中的优点,它已经被成功地应用于交通状态判别的一些实际应用中,例如城市道路拥堵分析、交通状态预测和交通安全检测等可以更好地利用随机森林算法获得准确的结果。
据报道,一些城市已经开始采用随机森林算法来预测交通流量,以更有效地解决城市拥堵问题。
此外,有越来越多的研究者将随机森林算法与其他算法结合起来,以提高在交通状态判别中的准确性。
例如,与其他机器学习算法(如神经网络)结合,可以进一步提高随机森林算法在交通状态判别中的准确性,从而更有效地进行交通状态识别。
总之,随机森林算法可以有效应用于交通状态判别,它具有准确性高、易于实现和计算量小等特点,能够有效地解决城市交通拥堵和安全问题。
未来,随着研究者们继续研究并结合其他机学习算法,随机森林算法将在交通状态判别领域中有更大的发展空间。
交通状态判别一、案例背景介绍随着机动车保有量的不断上升,城市的快速发展在促进经济繁荣、社会进步的同时,也不可避免的带来了交通拥堵问题。
在交通发展的过程当中,交通拥堵是诸多问题中产生频率最高、影响最大、持续时间最长的一个。
交通拥堵增加了人们上下班的时间代价和精神压力,降低了城市运行效率,还给国民经济带来不可估量的经济损失。
交通拥堵的产生从表面看是由城市现有的路网资源与实际的出行需求之间的矛盾导致,而根本原因是城市路网规划不合理,与城市当前发展之间的失衡造成路网负荷增加、交通运行稳定性下降。
为了实现对交通秩序的实时监测和控制,城市道路和高速公路两侧布置了大量的交通数据检测器,每天可以产生千万级别的数据。
这些交通数据体量巨大、数据结构多种多样、价值丰富却又密度低,具有大数据的典型特征。
近年来,针对这些海量的交通数据如何建立有效的分析和处理流程,从中挖掘出有价值的信息,成为智能交通系统的重点研究方向。
二、多模型建模理论多模型建模方法就是对训练数据建立多个子模型,把子模型对测试数据的分析通过某种方法结合,形成最后的分析结果。
单模型结构是对非线性系统建立数学模型时的最基本方法,一般先对样本数据使用不同的理论建立一系列不同的模型,从中选择性能最优或次优的模型参与实际的应用。
对于复杂的非线性系统,单模型是一种整体上的近似解。
Bates和Granger于1969年首次提出将多个数学模型连接以提高模型的预测能力、提高系统鲁棒性的方法,自此以后多模型建模方法在时间序列分析、状态预测估计、化工预警控制等多个领域得到广泛的研究和应用。
在模型的训练过程中,通常需要收集较多的样本数据以保证神经网络对实际生产过程的充分反映。
如果样本规模较大,神经网络的结构比较庞大、训练时间加长,实际训练中先对样本聚类分析得到规模较小的子集,理论上每个样本子集的学习速度将会加快且网络结构更加紧凑,总时间也会降低。
另外,当样本数目较大时,部分数据在距离意义上相邻较近,对应的输出在距离意义上却较远,这样的样本虽然仍可以使用单个神经网络学习,但是学习之后模型的泛化能力较差。
基于京津塘高速数据的K-mean交通状态判别方法的研究摘要:近年来,随着道路网络的逐步成熟和道路交通需求量的进一步增加,与交通事件无关的常发性交通拥挤越来越严重。
交通高峰期的持续时间不断延长,高峰期出现交通拥挤的路段不断增加,严重影响了道路交通的安全性和运行效率,因此,常发性交通拥挤也逐渐成为交通监控的重要内容之一。
以发现道路上的突发交通事件为目的AID方法研究,已经扩展成为对道路上所有交通拥挤状态自动判别方法的研究。
并且,交通状态判别有重要的意义所在,它可以对交通管理者实时了解路网交通状态变化的信息,及时采取对策,疏导交通、减少拥挤,提高交通安全保障,使有限的路网时空资源发挥最大的效率而提供帮助。
京津塘高速是连接北京和天津的主要道路交通干道,承担了两个城市间的大部分道路交通运输,它的交通状态在相当程度上反应了两城市之间交通状态与出行质量。
本文以京津塘高速某段下行行车道线圈传感器数据为基础,研究了基于K-mean的交通状态判别方法研究交通状态预测方法,主要的研究工作如下:文章首先对京津塘高速公路2009年4月的下行行车道交通数据用excel进行了处理,并应用K-mean分析方法对此交通流基础特征数据进行分析,最后用matlab编程实现,得到用于交通状态判断的参照标准,并画出关于车流量,车流密度和平均速度的数据图,以及它们三者之间的三维关系图。
关键词:道路交通状态;自动判别;智能交通系统一、引言如何应对城市现代化带来的交通问题,是城市交通管理者面对的需要解决的十分迫切的问题。
国内外实践经验证明,单纯依靠修建道路基础设施是不能很好的解决城市交通问题,现代化的交通管理起着非常重要的作用。
发达国家交通经验实践表明,采用智能交通系统(ITS)是解决交通拥堵、减少交通事故、防止交通污染、提高交通管理水平的最有效的方法和手段。
交通状态分析和判别能够从全局角度实时地反应路网的服务水平,是交通控制系统与交通流诱导系统协同的重要依据。
首先,由于它反映了交通流客观运行状态可以向交通管理者提供准确地交通运行状况信息,并可以作为交通控制系统的输人参数优化区域路网;其次,由于交通状态能够反映出行者的心理,在确定诱导策略及发布交通信息时,科学地进行交通状态分析可以更好的被出行者所接受。
交通状态的判别可以对道路基础信息采集系统采集到的各类交通数据进行分析,根据他们的变化趋势得出目前交通系统的运行状况。
通常来说,一个交通状态判别系统包括数据获取、数据准备、数据规约、数据转换、数据比较、实时状态判断等过程。
在这个过程中,系统将采集到的基础数据经过一定处理后与一个既定的交通状态判断标准进行比较,从而判别出目前交通系统处于何种状态。
得到以密度为主要参数的判别结果后将其提供给交通系统的管理者和决策者,他们针对不同的情况做出相应的交通控制、管理和诱导措施。
二、背景近年来,随着道路网络的逐步成熟和道路交通需求量的进一步增加,与交通事件无关的常发性交通拥挤越来越严重。
交通高峰期的持续时间不断延长,高峰期出现交通拥挤的路段不断增加,严重影响了道路交通的安全性和运行效率,因此,常发性交通拥挤也逐渐成为交通监控的重要内容之一。
以发现道路上的突发交通事件为目的AID方法研究,已经扩展成为对道路上所有交通拥挤状态自动判别方法的研究。
进行交通状态判别,其意义在于对交通管理者实时了解路网交通状态变化的信息,及时采取对策,疏导交通、减少拥挤,提高交通安全保障,使有限的路网时空资源发挥最大的效率而提供帮助。
国外最早开发并投入使用的道路交通状态判别算法是以判别突发交通事件为主要功能的加利福尼亚算法。
这种算法开发于1965~1970年之间,最初用于洛杉矶公路管理控制中心。
加州算法通过比较邻近监测站之间的交通参数数据,主要是比较环行线圈检测器获得到占有率数据,对可能存在的突发交通事件进行判别。
经过实践和进一步的深入研究,开发了10种基于最初的加州算法的改进算法,其中加州#7算法和加州#8算法效果最好。
Cook(1974)开发了一种双指数平滑(DES)算法,用于对突发交通事件的判别。
这种方法以交通参数数据的双指数平滑值作为预测值,通过比较交通参数数据的预测值和实测值来构造一个跟踪信号,当该跟踪信号超过预定的阈值时,可触发突发交通事件警报。
Persaud(1990)根据突变理论开发了McMaster算法。
使用大量的拥挤和非拥挤交通状态下的流量--占有率历史数据,开发一个流量--占有率分布关系模板,通过将观测数据之间的关系与模板进行两次比较,判断是否发生了交通拥挤以及发生的是偶发性拥挤还是常发性拥挤,这种算法第一次将过大交通需求引起的常发性拥挤作为分析判断的对象。
Blosseville、Morin (1993)发现使用视频图像处理进行突发交通事件判别比基于感应线圈的判别算法有很多独特的优点。
感应线圈只能采集某一地点的交通流数据,而视频图像处理技术还可以提供更有用的交通流信息。
除了可以提供形成时间、平均行程速度和停止车辆信息外,这种技术还可以准确地发现发生在路肩上的事件。
数据挖掘(Data Mining,DM)是20世纪末兴起的数据分析技术,可以从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中的,人们事先不知道的,但又是潜在有用的信息和知识。
聚类方法是适合交通状态数据分类的一种数据挖掘方法。
基于聚类分析的交通状态量化方法是根据交通检测器所采集道路上交通流的基础数据为基础,通过对这些数据的分析处理,运用交通工程理论和数据挖掘等技术,从它们的基础交通数据中找出这些道路各自的特点,最后由聚类分析方法,根据每种交通状态其中的样本具有的一定的相似性和不同状态之间的样本具有相异性,得到适合不同道路的合理交通状态分类。
也是本文后面将要采用的算法。
综上所述,早期的判别算法主要以突发交通事件为研究对象,大部分都以感应线圈采集的交通流量、占有率和地点速度等交通数据为基础,所采用的数据技术主要包括决策树、动机分析、平滑滤波等常规方法。
随着时间的推移,交通状态判别的研究内容和研究手段都有了很大的变化。
一方面,交通需求与交通供给之间的矛盾不断深化,常发性交通拥挤也成为交通管理的重点之一;另一方面,信息采集技术和信息处理技术的进步,为判别方法研究提供了更有力的技术基础。
经过近40年的发展,模糊理论、专家系统、模式识别、人工神经网络等人工智能技术已经成为交通状态判别算法设计的重要手段。
三、数据处理与分析1. 交通流参数交通流是整体的、宏观的概念,通过对大量观测数据的分析,发现交通流具有一定的特征性倾向,为此提出了交通流特性的概念。
交通流特性是指交通流运行状态的定性、定量特征。
用来描述和反映交通流特性的物理量称为交通流参数。
用于描述交通状态的交通流参数主要包括交通量、速度、交通密度、占有率等。
(1)交通量交通量(volume)又称流量,是指单位时间内,通过道路指定地点或断面的车辆数。
交通量不是一个静止不变的量,具有随时间和空间变化而变化的特征。
度量城市交通特性的一种方法是在道路系统内一系列的位置上观察交通量在时间和空间上的变化规律,并绘出交通流等值图。
当交通量超过某一水平时,就认为发生拥挤。
然而,这种判断存在的问题是同一流量水平可以对应两种截然不同的交通状态,因此这种参数应该与其它方法相结合,而不是单独使用。
(2)速度速度是描述交通流状态的第二个基本参数,它是指车辆在单位时间内通过的距离。
由于道路交通流是由多种车辆组成的复杂系统,因此存在多种速度概念。
从微观上看,每个车辆都有瞬时速度和在特定时间段内的平均行驶速度和平均行程速度。
瞬时速度(也称为即时速度、地点速度)是车辆通过某一地点时(或在某一时刻)的瞬间速度,可用作道路设计、交通管制和规划的依据。
单个车辆的平均行驶速度是指车辆通过特定长度路段时路段长度与所用的行驶时间之比,其中,行驶对象不包括由于各种原因发生的车辆停驶时闯。
由于车辆的平均行驶速度不考虑车辆在运行过程中的停车延误,不能准确反映车辆的运行特性,因此这个概念很少得到实际应用。
车辆的平均行程速度则是指车辆通过特定长度路段时路段长度与所用的全部时间之比。
由于考虑了可能产生的停车延误,所以这种速度概念能够更好地体现车辆在特定路段、特定时间段的运行状态。
从宏观来看,交通流的平均速度有在特定地点的时间平均速度(平均地点速度)和在特定路段上的区间平均速度(平均行程速度)之分。
时间平均速度是在观测时间内通过某截面所有车辆地点速度的算术平均值,而区间平均速度是观测距离与车辆通过该距离所用平均行程时间的商。
前者体现了交通流在特定观测地点处的运行状况,后者体现了交通流在特定路段空间上的运行状况,当这两种速度值明显低于正常值时,表明观测地点或观测路段的交通处于拥挤状态。
(3)交通流密度交通流密度是指在某一瞬间,单位道路长度上存在的车辆数,即K=N/L式中:K——交通密度(辆/km·车道);N——车辆数(辆);L——观测路段长度(km)。
在通常情况下,交通流量大,交通密度也大。
但当道路交通十分拥挤、车流处于停滞状态时,交通流量近似等于零,而此时的交通密度却接近于最大值。
因此,单纯使用交通流量指标难以表示交通流的实际状态,而采用交通密度指标能够做出较好的评价。
尽管交通密度能够直观地表明交通状态的性质,但由于数据的采集难度大,这个参数的实际应用是很有限的。
(4)占有率占有率包括空间占有率和时间占有率两个概念。
在道路的一定路段上,车辆总长度与路段总长度之比称为空间占有率,通常以百分数表示。
空间占有率直接反映了交通密度的高低,但更能表明道路被实际占用的情况。
与交通密度相似,由于这个交通参数数据的直接获取存在较大的难度,因此实际上一般不被采用。
时间占有率是指在一定的观测时间T内,交通检测器被车辆占用的时间总和与观测时间长度的比值。
2. 原始数据的Excel处理我们小组选择了京津塘高速2009年4月中,下行行车道的一组数据,其中,共有43037组数据,包含了从4月1号到4月30号的每天从早上0点到晚上24点每隔1分钟所测的所有数据。
其中可能会由于通信中断、设备暂时性故障等软件或硬件方面的原因产生一些错误的非正常数据(如车道占有率为100%,车流量却为0的情况)。
为避免其影响分析过程及结果,需要对其进行筛选、剔除。
经处理后,最后保留了40811组数据(处理后的数据表格已附在作业文件夹中)。
对剩下的这些数据,分别计算所对应的每分钟时刻的车流量,平均速度和密度,计算公式分别如下:(1)车流量公式为:*2.5Volume LorryCount CarCount=+画出车流量对时间变化曲线:(2)平均速度公式为:=Speed**2.5**2.5LorryCount LorrySpeed CarCount CarCourt Speed LorryCount CarCount+=+ 画出平均速度对时间变化曲线:(3)密度在上述步骤中已经得出了车流量与平均速度,可以直接用这两个参数相比计算出一个密度参数:*601Volume Density Speed= 但是由于平均速度计算时误差很大所以仍要由车道占有率计算密度2,二者取加权平均。