道路交通事故灰色马尔可夫预测模型_李相勇
- 格式:pdf
- 大小:150.90 KB
- 文档页数:4
基于事件树分析法机理——“428”胶济铁路重大交通事故1 引言当前铁路发展迅速,由此也带来了事故频发的困境,铁路交通事故严重威胁着城市交通系统的稳定运营以及区域正常生活的稳定。
如何预防、预测事故,降低事故发生频率,是专家学者广泛关注的问题。
2008年4月28日发生的“428”胶济铁路重大交通事故给我们带来了沉痛的打击,该事故成为了一个典型的铁路事故案例。
本文以该事故为例,运用系统工程原理中的事件树分析法对事故进行了定性的分析。
2事故介绍2008年4月28日,百年胶济铁路发生一场悲剧:当日凌晨4时41分,北京至青岛的T195次下行到胶济线周村至王村区间时,客车尾部第9节至第17节车厢脱轨,与上行的烟台至徐州的5034次旅客列车相撞,致使机车和五节车厢脱轨,造成重大人员伤亡。
这场灾难已夺去72人的生命,另外还有416人受伤。
3 事件树分析事件树分析(ETA)是从一个初始事件开始,按顺序分析事件发展过程中各个环节的成功与失败情况,是一种时序逻辑的事故分析方法。
它以一初始事件为起点,按照事故的发展顺序,分阶段一步步地进行分析。
每一事件可能的后续事件只能取完全对立的两种状态中的一种,即成功或失败、正常或故障、安全或危险等,并逐步向事故形成结点发展,直至达到系统故障或事故为止。
由于所分析的情况是用树状图表示的,故称之为事件树。
该方法已在多个领域得到应用,是适用于安全生产及科学管理的有效方法。
3.1 事件树的编制1、确定初始事件事件树分析是一种系统地研究作为危险源的初始事件如何与后续事件形成时序逻辑关系而最终导致事故的方法。
正确选择初始事件十分重要。
初始事件是事故在未发生时,其发展过程中的危害事件或危险事件,如机器故障、设备损坏、能量外逸或失控、人的误动作等。
可以用两种方法确定初始事件:∙根据系统设计、系统危险性评价、系统运行经验或事故经验等确定;∙根据系统重大故障或事故树分析,从其中间事件或初始事件中选择。
基于SSA-LightGBM 的交通流量调查数据趋势预测①徐 磊, 孙朝云, 李 伟, 杨荣新(长安大学 信息工程学院, 西安 710064)通讯作者: 徐 磊, E-mail: *****************摘 要: 为了解决传统模型和机器学习模型对周期时间序列预测效果欠佳的问题, 本文以韩城高速公路交通流量调查数据为数据集, 提出了SSA-LightGBM 交通流量调查数据预测模型. 对韩城高速数据进行当量计算, 然后对当量数据进行奇异谱分解得到周期项和随机项, 对周期项进行信号重建, 利用LightGBM 预测随机项, 最后将预测随机项与周期延拓信号进行叠加得到最终的高速当量预测数据. 同时与XGBoost 和LightGBM 预测结果作对比, SSA-LightGBM 预测结果与真实值最为贴近, 且MAE 、RMSE 和R 2均优于XGBoost 和LightGBM 模型. 该结果对我国高速公路交通调查数据未来的变化趋势预测研究具有很好的指导意义, 可以为我国高速公路的整修和养护提供很好的参考价值.关键词: 奇异谱分析; LightGBM 模型; 机器学习; 高速交通量调查数据; 预测引用格式: 徐磊,孙朝云,李伟,杨荣新.基于SSA-LightGBM 的交通流量调查数据趋势预测.计算机系统应用,2021,30(1):243–249. /1003-3254/7750.htmlTraffic Volume Survey Data Trend Prediction Based on SSA-LightGBMXU Lei, SUN Zhao-Yun, LI Wei, YANG Rong-Xin(School of Information Engineering, Chang’an University, Xi’an 710064, China)Abstract : In order to solve the problem that the traditional model and the machine learning model have poor performance in predicting the periodic time series, this study proposes the SSA-LightGBM prediction model which takes the Hancheng expressway traffic volume survey data as the data set. First, the Passenger Car Unit (PCU) of Hancheng expressway data is calculated. Second, the singular spectral analysis is applied on the PCU data to obtain periodic and random terms, the periodic term is reconstructed, and then the LightGBM is used to predict the random term. Finally, the predicted random term and the periodic extension signal are superimposed to obtain the prediction data of final expressway PCU. At the same time, compared with the prediction results of XGBoost and LightGBM model, the prediction results of SSA-LightGBM are closest to the true values, and MAE , RMSE and R 2 are better. This result has a good guiding significance for the research of the forecast on future change trend of our country’s expressway volume survey data, and provides a good reference value for the renovation and maintenance of our country’s expressways.Key words : Singular Spectrum Analysis (SSA); LightGBM model; machine learning; traffic volume survey station data; prediction计算机系统应用 ISSN 1003-3254, CODEN CSAOBNE-mail: ************.cn Computer Systems & Applications,2021,30(1):243−249 [doi: 10.15888/ki.csa.007750] ©中国科学院软件研究所版权所有.Tel: +86-10-62661041① 基金项目: 陕西省交通运输厅交通科研项目(18-22R); 国家重点研发计划(2018YFB1600202); 高新技术研究培育项目(300102240201)Foundation item: Research Project of Transport Department, Shaanxi Province (18-22R); National Key Research and Development Program of China (2018YFB1600202); Cultivation Project of High Technology Research (300102240201)收稿时间: 2020-06-02; 修改时间: 2020-06-30; 采用时间: 2020-07-10; csa 在线出版时间: 2020-12-31随着国民经济的发展, 我国机动车数量快速增长,道路拥堵时常发生, 高速公路作为我国公路的楷模, 其服务水平比一般的道路更好. 交通流量调(交调)数据是研究高速公路通行能力的重要参考指标, 为了提高高速公路的服务水平, 对高速公路进行更好的整修和养护, 亟需加强对交调数据的预测研究.预测研究的关键在于预测模型的建立, 提高预测结果精准度的重要方法便是选择合适有效的预测模型.序列预测通常分为时间序列预测和多元回归预测, 目前在国内外研究中, 大多是通过传统的神经网络方法对序列进行预测. 例如, Zhou等人针对传统数学统计方法的局限性等问题建立BP神经网络预测模型, 通过将BP算法与指数平滑和线性回归方法进行比较, 最后证明了BP算法预测结果能为企业制定库存计划提供更好的建议[1]. 成云等人针对现阶段城市道路交通流预测精度不高的局限性, 提出了一种基于差分自回归滑动平均和小波神经网络组合模型的预测方法来进行交通流预测, 最后证明了组合模型可以提高交通流预测精度[2]. Zhang等人为了更准确的预测交通流量, 实现交通控制和交通拥堵管理, 提出了一种基于XGboost 和LightGBM算法的组合预测模型, 实验结果表明组合模型比单个模型有更高的预测精度[3]. Wu等人针对2008–2018年云南省货运数据及其影响因素建立了灰色神经网络模型, 对云南的货运量进行了预测, 并将其与BP神经网络预测结果进行比较最后证明了灰色神经网络具有更好的预测效果[4,5]. Li等人考虑到植物蒸腾量对温室自动灌溉具有重要的作用, 在2020年建立了随机森林回归模型, 通过整合植物和环境参数建立植物蒸腾量预测模型, 该研究为温室种植蔬菜高效生产和智能灌溉提供了科学参考, 为节约水资源也提供了一种有效途径[6].上述方法中无论是采用单纯的数学模型还是采用机器学习模型对长期的周期性比较强的数据均不能实现精准预测, 只能粗略的显示数据的大致走向, 局部详细的信息表现较差, 因此本文考虑到高速公路交调数据具有很强的周期性等特点提出了基于SSA-LightGBM 的预测模型.1 研究数据选取及算法流程本文针对陕西省高速公路展开研究, 对韩城高速公路进行实地考察调研, 以韩城高速7~8月1344条交调数据进行研究.1.1 数据介绍表1为韩城高速交调数据表(前5行数据). 从表中可以看出交调数据一共由观察日期、小时、观测站名称、观测里程、中小客流量、大客车流量、小货车流量、中货车流量、大货车流量、特大货车流量、集装箱流量组成.表1 韩城高速交调数据表观测日期小时观测站名称观察里程中小客车流量大客车流量小货车流量中货车流量大货车流量特大货车流量集装箱流量2 019.07.011韩城18710514622 019.07.012韩城18371114512 019.07.013韩城18411412702 019.07.014韩城18390100402 019.07.015韩城1856020000为了使不同交通工具组成的交通流能够在同样的尺度下进行分析, 使其具有可比性, 在分析计算通行能力和服务水平时, 需要将各类车辆交通量换算成标准机动车当量, 需要用到车辆换算系数, 如表2所示, 这里只考虑汽车, 将其分为3档: 小型车、中型车、大型车, 其中小型车又分为中小客车和小型货车, 折算系数为1; 中型车分为大客车和中型货车, 折算系数为1.5;大型车分为大型货车、特大货车和集装箱车, 大型货车折算系数为3, 特大货车和集装箱车折算系数为4.表2 折算系数参考表车型一级分类二级分类参考折算系数汽车小型车中小客车1小型货车1中型车大客车 1.5中型货车 1.5大型车大型货车3特大货车4集装箱车4计算机系统应用2021 年 第 30 卷 第 1 期1.2 数据展示通过对韩城高速交调数据进行换算, 如图1对机动车当量进行可视化, 展示了2019年7月1日–2019年8月25日韩城高速公路交调数据当量变化. 从图中可以清晰的看出除了少数天呈现极小或者极大的情况,其他天数整体呈现周期状态. 当量=小型车×1+中型车×1.5+大型货车×3+特大货车×4+集装箱车×4.19-07-0119-07-0219-07-0419-07-0519-07-0719-07-0819-07-1019-07-1219-07-1319-07-1519-07-1619-07-1819-07-2019-07-2119-07-2319-07-2419-07-2619-07-2719-07-2919-07-3119-08-0119-08-0319-08-0419-08-0619-08-0819-08-0919-08-1119-08-1219-08-1419-08-1519-08-1719-08-1919-08-2019-08-2219-08-2319-08-25图1 韩城高速交调当量变化图1.3 算法流程图本文的算法流程图如图2所示对原始数据进行整合, 计算出高速公路交调数据机动车当量, 然后对原始数据利用奇异普分解方法(SSA)进行数据分解, 得到周期信号和随机信号, 再利用机器学习模型(LightGBM)对随机项进行预测, 将预测结果和周期延伸信号结合得到最终的预测结果. 另一方面利用XGBoost 、LightGBM 等单独的机器学习方法对当量数据进行预测, 最后将预测结果同SSA-LightGBM 方法得到的结果进行对比分析, 比较不同模型的预测效果.图2 算法流程图2 SSA-LightGBM 预测模型原理2.1 奇异谱分解(SSA)奇异谱分解(Singular Spectrum Analysis, SSA)是通过分解原序列中的时间主分量, 得到不同层次上的分量序列, 然后将分解出来的低频视为序列变化的长期趋势, 最终得到数据序列的最佳谐波个数, 以此确定时间序列的周期信号.本文将奇异谱分解分为4个步骤, 分别是:Y (T )=((y 1),···,(y T ))X 1,···Xn ,(Xi =(y i ,···,y i +m −1),n =T −m +1)X =[X 1,···,Xn ]=(x i j )n ,m i ,j =1=y 1y 2···y m y 2y 3···y m +1......···...y n y n +1···y T(1)嵌入. 选择适当的窗口长度m , 将一维时间序列转换为多维时间序列: , 得到轨迹矩阵, 即:.(X T X )νi =λi νi σi =√λi µi =1σiX νi σµ(2)奇异值分解. 通过对矩阵SVD 分解, 得到XX T的L 个特征值. 具体步骤是: 将X 转置得到X T , 然后利用XX T 得到方阵, 再利用方阵的性质求得矩阵的特征值[7–9], 即利用, 求得, .即是奇异值, 是奇异向量.σ1,σ2,···,σN σi /N∑k =1σk =p (i )(3)分组. 假设有N 个奇异值, 定义第i个奇异值的方差贡献率为, 由大到小选择前M 个奇异值, 使其方差贡献率之和大于一定阈值.(4)确定最佳谐波个数. 利用前M 个奇异值的方差贡献率之和大于一定阈值(0.85)来确定最佳谐波个数M . 当P (i )≥0.85时, 我们认为此时的i 即为最佳的谐波个数, 即M =i . 然后利用三角函数的性质将数据构造成周期函数.2.2 周期项和随机项的确定{y t ,t =1,2,···,N }y t =p t +x t p t x t p t 设为时间序列, 若将其看作由周期项和随机项组成, 可以用组合模式描述, 其中为周期项, 为随机项. 的表达式如下:a k =(2/N )t =1y t cos(2πkt /N ),k =0,1,···,M b k =(2/N )N ∑t =1y t sin(2πkt /N ),k =0,1,···,M其中, M 为谐波个数, , 2.3 LightGBM 模型LightGBM 是一种梯度Boosting 框架, 使用基于决2021 年 第 30 卷 第 1 期计算机系统应用策树的学习算法, 具有快速、高效、支持并行化学习、可以处理大规模数据等优点.(1)梯度提升.梯度提升是在不断的迭代过程中, 对模型不停的增加子模型, 同时保证最终的损失函数值在不断的下降. GBDT是一种梯度提升决策树, 是由多个决策树组成, 利用最速下降的近似方法, 即利用损失函数的负梯度在当前模型的值作为我们回归提升树算法的残差的近似值, 来拟合一个回归树[10–12].假设我们每一个单独的子模型为f i(x), 我们的复合模型为:损失函数为L[F m(x),Y], 每一次对模型中添加新的子模型后, 使得我们的损失函数不断朝着0发展.(2) LightGBM原理LightGBM是在传统的梯度提升树(GBDT)上使用直方图优化(Histogram)算法, 先把连续的特征值离散化成k个整数, 同时构造一个宽度为k的直方图. 在遍历数据的时候, 根据离散化后的值作为索引在直方图中累积统计量, 当遍历一次数据后, 直方图累积了需要的统计量, 然后根据直方图的离散值, 遍历寻找最优的分割点. 同时使用带深度限制的Leaf-wise的叶子生长策略, 经过一次数据可以同时分裂同一层的叶子, 容易进行多线程优化, 也好控制模型复杂度, 不容易过拟合[13–15]. 表3给出LightGBM模型主要参数含义.表3 LightGBM模型参数含义模型参数含义learning_rate学习率num_leaves叶子数量, 默认为31max_bin feature将存入的bin的最大数量n_estimators迭代次数bagging_fraction每次迭代时用的数据比例objective模型所选回归任务feature_fraction每次迭代中随机选择一定比例的参数来建树3 SSA-LightGBM模型预测分析3.1 对数据进行奇异谱分解此处将2019年的7月1日到2019年8月25日的1344条数据分为两部分, 利用前70%的941条数据预测后30%的403条数据并将其与对应的真实数据进行对比. 对前部分数据进行奇异谱分析时选取的窗口长度为200, 可以得到方差贡献率图(见图3). 从图中可以看出, 当i≥56时, P(i)≥85%, 满足本文的数据处理要求, 即当显著谐波个数M为56时, 对应个三角函数信号能表征序列的最主要趋势.11325374961738597109121133145157169181193谐波个数i (个)图3 方差贡献率图然后, 可构造周期函数, 得到图4. 周期函数对应的公式为:a k=(2/N)N∑t=1y t cos(2πkt/N),k= 0,1,···,M b k=(2/N)N∑t=1y t sin(2πkt/N),k=0,1,···,M式中, M为谐波个数56,,7-17-27-47-57-77-87-17-117-137-147-167-177-197-217-227-247-257-277-287-37-318-28-38-58-78-8当量周期函数图4 周期函数对比图x t=y t−p t表4详细介绍了周期函数Pt中每一个参数的具体含义和取值. 根据周期函数的性质, 利用周期不变性对周期函数进行延伸得到2019年8月9日到8月25日周期函数延拓图(图5). 然后由交调当量原始数据减去周期项(), 可得到图6所示的随机项.表4 周期函数各参数含义参数意义P t t时刻周期函数对应的函数值, 即t时刻对应的周期交调当量值a0周期函数初始值, 此处为588.737 4a k/b k不同谐波个数对应的正余弦函数的系数y t t时刻的交调当量数值M周期函数的谐波个数, 其值等于方差贡献率大于0.85时刻的i值此处为56N当量序列的长度, 此处为1344计算机系统应用2021 年 第 30 卷 第 1 期本文采用LightGBM 机器学习方法对交调当量随机项数据进行预测, 表5为LightGBM 模型常用参数的取值, 其他参数均采用默认. 图7中曲实线为交调当量随机项前941条数据, 后面虚线为使用LightGBM 预测的403条随机当量数据.4 预测效果评价我们将SSA-LightGBM 模型得到的2019年8月9日到8月25日周期函数延拓结果和随机项预测值相叠加得到最终交调当量预测值(见图8, 红色曲线). 为了验证SSA-LightGBM 模型的预测效果, 本文还分别用XGBoost 和LightGBM 机器学习方法对数据进行了预测(利用2019年7月1日到8月8日的数据预测2019年8月9日到8月25日的数据). 由于这2种模型为单纯机器学习预测方法, 且不是本文的研究对象, 故此处不详细描述各种方法的预测过程. 将不同预测模型得到的预测结果与韩城交调当量的原数据进行对比, 得到图8. 图中黑色曲线为韩城高速交调数据的原数据, 红色曲线为SSA-LightGBM 模型的预测结果, XGBoost 和LightGBM 模型的预测结果分别对应蓝色和绿色虚线.从图中可以发现, 单独使用XGBoost 和LightGBM 模型得到的曲线整趋势能表示原始数据, 但是整体均低于原始数据不能完整的表示当量的局部特征. 只有橙色虚线SSA-LightGBM 模型预测的结果能够实现高精度稳定预测2019年8月9日到8月25日交调当量变化趋势.另外, 本文还采用常用的平均绝对值误差(MAE )、均方根误差(RMSE )和相关系数(R 2)分析评价了不同模型预测结果的精度(表6), 各指标的公式、含义及评价标准见表7.从表中可以发现本文的模型MAE 和RMSE 均低于XGBoost 和LightGBM 模型说明模型的稳定性和平均误差优于单独的机器学习模型, R 2大于另外两个模型说明预测效果好相关性强.07-0107-0207-0407-0607-0707-0907-1107-1207-1407-1607-1807-1907-2107-2307-2407-2607-2807-3007-3108-0208-0408-0508-0708-0908-1108-1208-1408-1608-1708-1908-2108-2208-24周期函数周期延伸图5 周期函数延拓图时间2019-07-012019-07-022019-07-032019-07-042019-07-052019-07-062019-07-072019-07-082019-07-102019-07-112019-07-122019-07-132019-07-142019-07-152019-07-162019-07-172019-07-192019-07-202019-07-212019-07-222019-07-232019-07-242019-07-252019-07-262019-07-282019-07-292019-07-312019-07-302019-08-022019-08-012019-08-032019-08-042019-08-062019-08-072019-08-08图6 交调当量随机项表5 LightGBM 模型参数取值模型参数learning_ratenum_leavesmax_>binn_estimatorsbagging_fractionobjective feature_fraction取值0.23507000.9regression0.252021 年 第 30 卷 第 1 期计算机系统应用019-07-01019-07-02019-07-04019-07-05019-07-07019-07-08019-07-10019-07-12019-07-13019-07-15019-07-16019-07-18019-07-20019-07-21019-07-23019-07-24019-07-26019-07-27019-07-29019-07-31019-08-01019-08-03019-08-04019-08-06019-08-08019-08-09019-08-11019-08-12019-08-14019-08-15019-08-17019-08-19019-08-20019-08-22019-08-23019-08-25随机项LightGBM 预测图7 随机项预测结果时间2019-08-092019-08-092019-08-102019-08-102019-08-112019-08-112019-08-112019-08-122019-08-122019-08-132019-08-132019-08-142019-08-142019-08-152019-08-152019-08-162019-08-162019-08-162019-08-172019-08-172019-08-182019-08-182019-08-192019-08-192019-08-202019-08-202019-08-212019-08-212019-08-222019-08-222019-08-222019-08-232019-08-232019-08-242019-08-242019-08-252019-08-25原始数据SSA-LightGBM XGBoostLightGBM图8 不同模型预测结果对比图表6 各模型评价指数评价指标/模型SSA-LightGBMXGBoost LightGBM MAE 49.4981.068 5122.456 8RMSE60.2599.078 0143.178 4R 20.887 50.695 80.364 7表7 评价指标模型评价指标公式意义MAE(平均绝对误差)MAE =1n n∑i =1|x i −x p |计算值与真实值之间的平均绝对误差, MAE 越接近0, 模型越准确RMSE (均方根误差)RMS E =1n n ∑i =1(x i −x p )2计算值与真实值之间的均方根误差,RMSE 越接近0,模型越准确R 2(线性相关系数)R 2=1−RS S TS S =1−n ∑i(x i −x p )2n∑i(x i −−x i )2因变量与自变量之间的线性相关系数, R 2越接近1,模型越准确综上, 无论是直观的曲线对比(图8), 还是数学统计方法(表6), 均证明SSA-LightGBM 模型可以高精度、高稳定性地预测2019年8月韩城高速交调数据当量变化趋势. 我们可以使用该模型对全国的高速公路交调数据进行预测, 这对我国高速公路更好的休整和养护以及服务水平的提升具有重要的参考价值.5 结论由于传统的时间序列预测模型和单独的机器学习模型对周期性比较强的时间序列预测存在一定弊端,本文采用SSA-LightGBM 模型进行预测, 以韩城高速2019年7月到8月两个月1344条交调数据为例, 以前70%的数据作为模型的训练集, 以后30%的数据作为验证集. 将结果与单纯的机器学习模型XGBoost 和LightGBM 模型进行对比, 发现本文提出的模型预测结果更接近真实值, 同时该模型的MAE 、R 2和RMSE 均优于其他两个模型, 表明本文的模型可以很好地预测韩城高速交调当量数据, 这对该地区高速公路的整修扩建、养护具有一定的指导意义.计算机系统应用2021 年 第 30 卷 第 1 期参考文献Zhou H, Ding DY, Li YL, et al. Research on inventory demand forecast based on BP neural network. Information Technology, 2016, 40(11): 38–41.1成云, 成孝刚, 谈苗苗, 等. 基于ARIMA和小波神经网络组合模型的交通流预测. 计算机技术与发展, 2017, 27(1): 169–172.2Zhang M, Fei X, Liu ZH. Short-term traffic flow prediction based on combination model of XGboost-LightGBM. Proceedings of 2018 International Conference on Sensor Networks and Signal Processing. Xi’an, China. 2018. 322–327. 3Wu RL, Xu WH, Shen WZ. Research on forecast model of freight in Yunnan Province based on gray neural network. Logistics Sci-Tech, 2019, 42(8): 13–16, 19.4Yang ZY. Rural logistics demand forecast based on gray neural network model. Proceedings of 2018 4th World Conference on Control, Electronics and Computer Engineering. Jinan, China. 2018. 322–327.5Li L, Chen SW, Yang CF, et al. Prediction of plant transpiration from environmental parameters and relative leaf area index using the random forest regression algorithm. Journal of Cleaner Production, 2020, 261: 121136. [doi: 10.1016/j.jclepro.2020.121136]6张清亮. 基于奇异值分解与深度递归神经网络的齿轮剩余寿命预测方法研究[硕士学位论文]. 重庆: 重庆大学, 2018. 7Ibrahim SJA, Thangamani M. Enhanced singular value 8decomposition for prediction of drugs and diseases with hepatocellular carcinoma based on multi-source bat algorithm based random walk. Measurement, 2019, 141: 176–183. [doi: 10.1016/j.measurement.2019.02.056]Montesinos-López OA, Montesinos-López A, Crossa J, et al.A singular value decomposition Bayesian multiple-trait andmultiple-environment genomic model. Heredity, 2019, 122(4): 381–401. [doi: 10.1038/s41437-018-0109-7]9Zhang SH, Dong XG, Xing Y, et al. Analysis of influencing factors of transmission line loss based on GBDT algorithm.Proceedings of 2019 International Conference on Communications, Information System and Computer Engineering. Haikou, China. 2019. 179–182.10张潇, 韦增欣, 杨天山. GBDT组合模型在股票预测中的应用. 海南师范大学学报(自然科学版), 2018, 31(1): 73–80. 11余登武, 罗永平. 基于GBDT-Ridge的短期电力负荷预测.新型工业化, 2019, 9(6): 23–26, 33.12Zhang J, Mucs D, Norinder U, et al. LightGBM: An effective and scalable algorithm for prediction of chemical toxicity—Application to the Tox21 and mutagenicity data sets. Journal of Chemical Information and Modeling, 2019, 59(10): 4150–4158. [doi: 10.1021/acs.jcim.9b00633]13叶志宇, 冯爱民, 高航. 基于深度LightGBM集成学习模型的谷歌商店顾客购买力预测. 计算机应用, 2019, 39(12): 3434–3439.14张振, 曾献辉. 基于CNN-LightGBM模型的高速公路交通量预测. 信息技术与网络安全, 2020, 39(2): 34–39.152021 年 第 30 卷 第 1 期计算机系统应用。
黑龙江交通科技HEILONGJIANG JIAOTONG KEJI201年第11期(总第309期)No. 11,201(Sum No. 309)基于GIS 的城市道路交通事故黑点鉴别王丽雅,李晓雯(吉林大学交通学院,吉林长春 10022)摘 要:结合GIS 系统与交通事故数据,对事故数据的属性信息和空间位置进行融合,采用以事故发生次数为主、事故严重程度为辅的方法对事故黑点的鉴别进行了研究。
使用基于ArcGIS 的核密度分析工具利用事故点的危险程度近似服从正态分布的特点,实现多个事故点的危险程度的重叠,从而可以得到城市道路的真实危险情况。
并对长春市经济技术开发区的交通 事故数据进行了前述处理,验证了前述方法的有效性。
关键词:GIS ;交通事故黑点;鉴别;核密度分析;城市道路中图分类号:U471.81 文献标识码:A文章编号:1008 - 3383(202)11 -021 -031随着社会经济快速发展、居民收入不断提高, 机动车保有量持续增加,道路机动化程度日益提高,道路交通安全问题也日益突出。
有关统计数据 显示,世界各国每年有近12万人死于交通事故。
在交通事故发生地中,城市道路占据多数。
传统的事故黑点鉴别方法多是将各事故作为离散孤点,仅 依靠事故发生次数定义黑点。
这种方法虽然简单 通俗,但也存在不足之处,如没有考虑事故严重程度(以事故伤亡人数、财产损失等衡量)的不同对道 路安全造成的不同影响。
为此,本文综合考虑事故 发生次数和事故严重程度两方面,对传统事故黑点 鉴别方法进行改进,基于GIS 实现对城市道路事故的鉴别。
2道路交通事故黑点研究综述交通事故黑点(以下简称事故黑点)是指,在多种因素共同影响下,统计时间内(通常为1到3年) 交通事故发生频率显著高于其他点的事故点,或与 其他点相比具有更高潜在风险的事故点。
对事故黑点进行鉴别,便于找出城市道路上具有显著安全隐患的路段,对其进行再次规划或重建,有利于降 低交通事故发生的非系统性风险,从而减少交通事 故的 。
第41卷第6期2020年12月大连交通大学学报JOURNAL OF DALIAN JIAOTONG UNIVERSITYVol. 41 No. 6Dec. 2020文章编号:1673- 9590( 2020) 06- 0018- 05基于Vissim 的高速公路网应急事件仿真郭瑞军,刘森(大连交通大学交通运输工程学院,辽宁大连116028) **收稿日期:2020-03-22基金项目:辽宁省社科规划基金资助项目(L15BJY005)作者简介:郭瑞军(1977-),男,副教授,博士,主要从事交通运输系统分析的研究E-mail :ijguo@ 163. com.摘要:针对传统交通流理论等数学模型对于解决复杂交通问题的局限性,运用Vissim 仿真软件进行路网搭建,对道路交通紧急事件的应急处置方案进行选优以缓解拥堵•利用假定的0D 流量,设定在高峰时段中大连市内某交叉路网出现事故导致车道关闭,其后通过Vissim 输出延误、平均车速、排队长度、流量、行程时间等参数,来评估应急疏导措施对其他的干道以及匝道的影响,并以此来评价应急处置措施, 通过对比两种方案的参数结果,最终选取了经过改进的仿真方案3作为最优解决方案,结果显示方案3 不仅缓解了大窑湾高速的拥堵,同时也减少了大窑湾高速事故引起的皮长高速与沈海高速的排队堵塞.关键词:道路交通紧急事件;应急处置;Vissim 模拟;措施评价文献标识码:ADOI : 10. 13291/j. cnki. djdxac. 2020. 06. 004高速公路突发事件是指因气候、地质、地壳运 动等自然因素引发的自然灾害或人为灾害突发,危及到高速公路辖区路段及沿线周边地区群众的生命财产安全,影响正常社会、生活和工作秩序的 事件⑴•高速公路突发事件的紧急救援系统是高 速公路管理的重要组成部分,及时且适当的应急 处置可减少甚至避免相关人员伤亡与经济损失. 张奕等⑷设计并实现了基于地理信息系统(Geo-graphic Information System , GIS )的高速公路突发事件应急资源调度系统,可根据事故等级以及事 故种类预测所需应急资源•郝倩妮⑶基于灾害性 天气下驾驶员可视距离和路面摩阻系数的变化,提出一种基于可变限速系统的限速对策,采用动 态的车速控制降低灾害性天气高速公路事故多发路段的安全风险•许秀⑷通过探讨交通事故影响空间扩散的关联因素与扩散状态,提出交通事故 分级方法,结合交通事故分级划分事故影响区,同 时根据各阶段影响因素的不同,分别构造交通事故持续时间各阶段的预测模型•郑来等⑸提出基 于高速公路天然节点的大区段划分方法•构建了 处理大区段内指标异质性的模型变量,采用负二项回归方法建立了大区段条件下的交通事故预测 模型•金书鑫等同定量确定点、线、面3个层次的 事故影响区,结合其交通量、车速、通行能力数据以及交通事故现场状况分析,能快速确定事故影 响区范围提高事故处置效率•王顺豪等⑺提出了 基于ANP 的高速公路应急预案评估模型,并通过 模糊综合评价法进行评价.综上所述,应急交通疏散作为规避或减轻灾害性事件危害,是避免受到二次伤害的必要手段,是研究道路网应急事件管理的重要部分.复杂交通事件具有偶发性、不可预测性的特点,无法用简单抽象的交通流理论、波动理论等数 学模型描述时,交通仿真的作用就更为突出•针对 现有国内高速公路事故路段具体应急案例研究数 量的不足且较少采用交通仿真分析方法的问题,本文基于Vissim 仿真软件,将事先构建的高速事 故交通运行状况可视化,对设定的不同应急疏散措施进行评价对比,通过分析不同方案缓解拥堵 的程度,来防止由于疏导不当带来的附加拥堵,并 降低涉及车辆的事故成本.第6期郭瑞军,等:基于Vissim的高速公路网应急事件仿真191交通紧急事件仿真的构建及性质11构建路网选取大连市内的大窑湾、丹大、皮长、沈海四条设计速度120km/h的高速公路所形成的交叉路网为研究对象.如图1所示,在路网的六个入口处各设置一个交通小区,皮长高速入口处设置第一与第四小区,丹大高速入口处设置第三与第五小区,沈海高速入口处设置第二与第六小区,并对六个小区进行路径划分及相对流量的设定,各条道路上的交通流流量如表1所示.图1路网概况图表1路网交通分布表辆/h皮长1小区沈海2小区丹大3小区皮长1小区0405789沈海2小区5940367丹大3小区248620皮长4小区2465145290丹大5小区18181584沈海6小区135210270皮长4小区丹大5小区沈海6小区皮长1小区965540189沈海2小区137********丹大3小区4652325330皮长4小区012844丹大5小区530528沈海6小区2602350本研究采用8次不同的随机种子进行模拟,通过对得到的仿真结果求平均值来得到比较所用的数据.Vissim输出的行程时间和平均车速数据离散程度较小,延误的离散程度较大,因此在以后的疏导方案比较中将会进行多次随机仿真并求均值.12架构公路网紧急事件假定紧急事件:在大窑湾高速出市方向发生一起两辆载有危险品的大型货车相撞并侧翻的交通事故,导致最外侧两车道封闭,单车道通行,事故状态下的运行效果如图2所示,图中标点处为大窑湾高速事故地点,现场聚集大量的救援人员和救援设备,该方向全面降速运行.图2事故后路网运行情况13评价指标的获取本文的评价指标的获取主要依靠仿真的输出结果,因而需要在仿真数字路网中设置检测器,本次研究需要设置的检测器有行程时间检测器,排队长度检测器,数据采集点.1.3.1目标路段的延误为了输出目标路段的延误,行程时间检测器设置在连接南北两个区域的干道,大窑湾高速公路上,具体设置情况如图3所示.图3行程时间检测器设置情况图事故影响大窑湾高速入口匝道出现排队的情况,导致沈海高速出市方向运行受阻,实际运行速度下降,具体情况如表2所示.大窑湾高速入口处排队影响了沈海高速出市方向的平均车速,导致事故后的平均车速较事故前下降75.91%.20大连交通大学学报第41卷表2事故前后指标对比行程时间/S延误时间/s沈海高速平均车速/(km•h-1)大窑湾高速平均车速/(km•h-1)事故前7.37 3.6665.3874.25事故后27.2315.6533.2917.891.3.2目标路段的排队情况排队是从上游路段/连接器的排队计数器的设置位置开始计数,直至排队状态下的最后一辆车•如果排队计数器设置在多车道路段上,它将记录所有车辆的排队信息,并报告最大排队度.600仿真秒过后由表3可见,大窑湾高速匝道入口处,仿真过程中每个时间间隔内所出现的最大的排队长度为162m,车辆在通过排队路段时最多需停车3次.在大窑湾高速路段每个时间间隔内出现的最大排队长度为32m,车辆在通过排队路段时最多需停车2次.表3大窑湾高速匝道入口处排队长度及停车次数检测器编号时间S平均队长/m最大队长/m停车次数200125114004516236004842952000310 34002322600356322由于Vissim使用随机种子,来仿真车辆到达的泊松分布,具有一定的随机性,因此需要通过求平均值来排除随机性,处理后的排队数据表4所示表4大窑湾高速入口处排队长度及停车次数检测器编号时间S平均队长/m最大队长/m停车次数200031014002322600483.2125.34 4.092000.2333.750 3400 1.7933.252600354.2533.26 2.172应急处理方案的效果及对比2.1高速公路应急处置从紧急事件处置时间上划分,高速公路抢修、处置时间在24h以上时,为I级预警,介于12h 和24h之间时,为II级预警,介于6h和12h之间时,为皿级预警,小于6h,为IV级预警⑻.本次研究是处于I级预警的情况下,由严重的交通事故引发的交通拥堵短时间内无法自行消散,处置过程为高速公路沿线的视频监控系统发现事故存在,将事故报告给辽宁省交通厅突发事件应急工作指挥中心,应急指挥中心判定该事件属于严重的交通事故会导致短时间内无法消散的交通拥堵,故启动I级预警响应.本次研究设置了如下几种处置方案,方案1:封闭大窑湾高速发生事故的两条车道单车道通行;方案2:在第6交通小区出口处以不同比例进行分流•具体的分流比例将在下文详细介绍.方案1的对大窑湾高速以及沈海高速的影响已经探讨完毕,这里将着重介绍方案1对皮长高速的东行方向的影响.经Vissim多次随机种子模拟求平均值,得出采用方案1时对皮长高速东行的影响如表5所示.表5方案1对皮长高速西行方向的影响数据种类行程时间/s延误/s平均车速/(畑・肝1)疏导后14.37 2.4751.31事故前13.510.9157.13由表5可见,方案1对皮长高速西行方向的影响较小.方案2:封闭大窑湾高速出市方向,并对从第6交通小区出发的交通流进行分流,具体分流措施如图4所示,删除了原有的从第6交通小区出发转入大窑湾高速的路径,将这条路径上原来0.6的相对流量分配到其余的路径上,重新分配后,从第6小第6期郭瑞军,等:基于Vissim的高速公路网应急事件仿真21区出发共有3条路径,路径1是沿沈海高速直行,相对流量为0.6,路径2是先沿沈海高速直行后右转进入跨线桥,驶入皮长高速,相对流量为0.35,路径3是直接右转进入丹大高速,相对流量0.05.多次仿真后该疏导方案得到输出结果如表6所示.表6方案1、2对皮长高速和沈海高速影响对比延误/s平均车速/(km・h1)平均排队长度/m 方案113.5157.13354.25沈海高速方案216.8361.57382.00方案1 3.6665.38483.25皮长高速方案210.9052.830综上可见,方案2在缓解大窑湾高速的事故拥堵和排队上采用了较为激进的方法一封闭大窑湾高速,但是这一做法将大量的交通量分流到了沈海高速和皮长高速,造成了以上路段的延误增加,平均车速下降,尤其在沈海高速与皮长高速东行方向交汇的匝道上造成了较严重的排队.因此,在接下来的仿真方案中应该在大窑湾高速上分配适量的交通量,以缓解疏导措施为沈海、皮长高速所带来的压力.2.2仿真方案改进正如前文所介绍,封闭大窑湾高速为皮长高速和丹大高速带来较大的交通压力,因此在方案3中将为大窑湾高速分配一定的交通量.经多次仿真输出的指标如表7所示.表7方案3对沈海高速的影响数据种类延误/S平均车速/(km・h-i)平均排队长度/in 沈海高速12.1749.370皮长高速 1.0159.20225.332.3对比评价最优方案已经确定,现在进行汇总对比分析,具体情况见表8、表9.表8各方案影响情况数据种类延误/S平均车速/(km•h1)平均排队长度/m方案115.5617.89356方案2封闭封闭封闭大窑湾高速方案39.3223.92252不采取措施13.2116.73372方案1 2.4751.31273.20方案216.8341.55382.00皮长高速方案3 2.5161.57225.33不采取措施14.3545.38312.54方案1 3.6665.38483.25方案210.9052.830沈海高速方案312.1749.370不采取措施 4.5262.3544.62表9各方案疏散效果对比由各表可见,方案3由于较好的分配了经沈方案1方案2方案3海高速绕行的比例,相比其他两个方案在缓解大皮长高速好差好窑湾高速的拥堵的同时,也减少了大窑湾高速事沈海高速差一般好故对皮长、沈海两条高速的拥堵,由此可得最优方大窑湾高速差好一般案为方案3.22大连交通大学学报第41卷3结论利用Vissim仿真软件,选取在大连市内沈大、丹大、皮长、大窑湾四条高速公路的交叉路网进行仿真路网搭建,设定在某个高峰时段,大窑湾高速出市方向发生两辆大型货车相撞侧翻,导致封闭两条车道,本文设置了三种应急方案,通过Vissim输出了事故情况下的各种指标得到以下结论:方案1降低了沈海高速出市方向的平均车速,同时增加了大窑湾高速匝道入口处排队长度.方案2将交通量分流到了沈海高速和皮长高速,造成其路段延误增加,平均车速下降,尤其在沈海高速与皮长高速东行方向交汇的匝道上造成较严重的排队.方案3在方案2的基础上为大窑湾高速分配一定的交通量,通过对比各个疏导方案的延误、平均车速、平均排队长度,并与不采取任何措施的情况进行对比分析•最后确定了在缓解沈海、大窑湾高速延误上都有较好效果的方案3.参考文献:[1]邓长春,陈耀林.浅析高速公路突发公共事件及应急策略[J].东方企业文化,2012(5):119.[2]张奕,卜凡亮.高速公路突发事件应急资源调动系统[J].信息技术,2020,44(2):1-6.[3]郝倩妮.灾害性天气高速公路事故多发路段限速对策[J].山西交通科技,2018(4):139-141.[4]许秀.事故条件下高速公路网应急交通组织方法研究[D].南京:东南大学,2016.[5]郑来,何莎莉.高速公路大区段交通事故预测模型研究[J]•公路交通科技,2017,34(7):108-114.[6]金书鑫,王建军,徐媲谷.区域高速路网交通事故影响区划分及交通诱导[J].长安大学学报(自然科学版),2017,37(2):89-98.[7]王顺豪,万瑛莹,彭引.基于网络层次分析法的高速公路应急预案评估[J].四川建筑,2018,38(1):79-82.[8]康省桢,徐勇,王宜伟,等.我国高速公路突发事件应急处置现状研究[J].工业安全与环保,2008(1):40-42.Emergency Simulation of Expressway Network based on VissimGUO Ruijun,LIU Miao(School of Traffic and Transportation Engineering,Dalian Jiaotong University,Dalian116028,China)Abstract:In view of the limitations of traditional traffic flow theory and other mathematical models for solving complex traffic problems,the VISSIM simulation software is used to build the road network,and the emergency response plan for road traffic emergencies is selected to alleviate congestion.The assumed OD flow is used to set the lane closure caused by an accident of an intersection road network in Dalian during the peak period. Then,the impact of emergency evacuation measures on other main roads and ramps is evaluated by the parameters of delay,average speed,queue length,flow and travel time of the Vissim output,and the emergency disposal measures are evaluated by comparing the parameters of the two schemes.Finally,the improved simulation scheme3is selected as the optimal solution.The conclusion shows that scheme3can alleviate the congestion of Dayaowan expressway with reduced queue congestion of PI Chang Expressway and Shen Hai Expressway caused by the Dayaowan expressway accident.Keywords:road traffic emergency;emergency disposal;Vissim simulation;evaluation。
高速公路分、合流区事故分析模型及事故影响因素曹梦迪; 廉福绵; 孟祥海【期刊名称】《《公路交通技术》》【年(卷),期】2019(035)005【总页数】8页(P124-131)【关键词】交通工程; 高速公路分合流区; NB模型; ZINB模型; MENB模型; 事故影响因素分析【作者】曹梦迪; 廉福绵; 孟祥海【作者单位】哈尔滨工业大学交通科学与工程学院哈尔滨 150090; 中交公路规划设计院有限公司北京 100088【正文语种】中文【中图分类】U491.3高速公路行驶车辆的分流、合流是引起交通事故的重要诱因之一。
目前高速公路分、合流区安全性影响因素研究多集中于对事故严重程度进行分析。
研究表明,随交通流量、主线车道数、匝道车道数的增加,合流区的交通事故往往比分流区更严重[1];而主线车道与匝道的连接类型、限速差值[2-3]会影响分流区的交通安全性。
Deogratias Eustace等[4-5]发现高速公路合流区左转匝道比右转匝道有更高的事故倾向。
Joe Bared等[6]提出减速车道长度与事故率密切相关。
孟祥海等[7]采取后侵入时间(PET)进行单因素方差分析,发现分、合流区不同车道上的交通安全性无显著差异。
郭唐仪等[8]以线形指标和匝道交通特性为解释变量,建立了泊松对数正态模型,并通过弹性分析确定诱导事故的关键因素为运行速度变化率和匝道长度。
交通事故数属于离散变量,早期研究中采用泊松分布[9]标定事故分析模型,但当事故数方差明显大于均值,体现出较强的“过度离散性”时,泊松模型不再适用,Hauer等人[10]提出依据负二项回归分布对事故次数进行研究,孟祥海[11]运用负二项模型构建高速公路路段的事故预测模型,实现对路段安全状况的评价。
事故数据中存在大量“0”值时,Kumara等人[12]利用零膨胀负二项模型以减小误差。
近年来,有些学者[13-14]借助随机效应负二项回归、混合效应负二项回归构建事故分析模型。
基于“险情+避让”模型的交通事故责任认定理论徐斯逵;马社强【摘要】将交通事故发生过程归结为"交通险情出现"和"险情避让失败"两个环节,构建交通事故责任认定的"险情+避让"理论模型;在揭示交通事故形成机理的基础上,将交通过错行为分为主动型、被动型和避险能力缺失型三类;以社会相当性理论、信赖原则、最后避免机会理论和高度注意义务理论作为法理基础,提出了运用交通险情的危险性和险情避让的可能性评判当事人过错行为对交通事故所起作用和"形态决定作用"的评判方法。
【期刊名称】《中国人民公安大学学报(自然科学版)》【年(卷),期】2011(017)004【总页数】5页(P78-82)【关键词】交通事故;责任认定;险情避让;认定规则;形态决定作用【作者】徐斯逵;马社强【作者单位】江苏省公安厅交通巡逻警察总队,江苏南京210024;中国人民公安大学交通管理工程系,北京100038【正文语种】中文【中图分类】D035.370 引言交通事故责任认定的核心,是对当事人行为与事故之间的因果关系和作用大小作出评判。
20世纪80年代初期,我国基于“路权理论”的交通事故责任认定理论才现雏形,所衍生的“路权原则”和“安全原则”曾被广泛应用于交通事故责任认定的实践。
路权原则以是否违反路权作为认定当事人责任的依据,认为侵犯路权的一方一般要负主要以上责任,未侵犯路权的一方一般负次要以下责任。
实践证明,侵犯他人路权的行为有时并不是发生事故的主要原因;即使是同样的侵犯路权行为,在不同的交通事故中作用也并不完全相同。
安全原则由于过于宽泛,最后成了“欲加之罪何患无辞”的借口,只要想给当事人定责任,“未确保安全”就是最好的理由。
显然,路权原则和安全原则并不能正确反映当事人过错行为与交通事故之间的因果关系及作用大小。
自进入21世纪以来,随着我国机动车数量迅猛增加,城市化水平的快速提高,机动车交通风险分配的“信赖原则”日益受到汽车时代的认可和推广。
因此,在我国机动车快速发展的大背景下,构建与之相适应的道路交通事故责任认定理论就显得非常有意义。
文章编号:1673-0291(2023)03-0061-09DOI :10.11860/j.issn.1673-0291.20220141第 47 卷 第 3 期2023 年 6 月Vol .47 N o .3Jun. 2023北京交通大学学报JOURNAL OF BEIJING JIAOTONG UNIVERSITY基于监控视频的隧道交通冲突预测方法贾磊a ,b , 李清勇a ,b , 俞浩敏a ,b(北京交通大学a.交通数据分析与挖掘北京市重点实验室,b.智慧高速铁路系统前沿科学中心,北京 100044)摘要:基于宏观交通特征进一步理解交通冲突机制,提出一种基于监控视频的隧道交通冲突预测方法,以实现对隧道交通安全的风险预警.通过在车辆轨迹数据中检测出交通冲突事件及对应的宏观交通特征,使用二分类模型验证支持向量机、决策树、多层感知机和随机森林等模型预测交通冲突的可行性,建立交通状态与交通冲突的关联关系.研究结果表明:该预测方法使用的交通状态变量对交通冲突的发生概率均有显著性贡献.随机森林模型能够根据20 s 时间单元采集的交通状态参数有效预测交通冲突的发生风险,预测准确率可达到97%.关键词:交通安全;碰撞时间;交通冲突预测;隧道风险;机器学习中图分类号:U491 文献标志码:AMethod for predicting traffic conflicts intunnels based on monitoring videosJIA Lei a,b , LI Qingyong a,b , YU Haomin a,b(a.Beijing Key Lab of Traffic Data Analysis and Mining, b.Frontiers Science Center for Smart High -speed RailwaySystem, Beijing Jiaotong University, Beijing 100044, China )Abstract :To gain a deeper understanding of the traffic conflict mechanism based on macroscopic traffic characteristics, this paper proposes a tunnel traffic conflict prediction method based on surveillance video to provide risk warnings for tunnel traffic safety. By detecting traffic conflict events and corresponding macroscopic traffic features in the vehicle trajectory data, a binary classification model is used to verify the feasibility of traffic conflict prediction using support vector machines, decision trees, multilayer percep⁃trons, and random forests. Consequently, the correlation between traffic states and traffic conflicts is es⁃tablished. The study shows that the traffic state variables used in the prediction method significantly con⁃tribute to the probability of traffic conflicts. The random forest model can effectively predict the risk of traf⁃fic conflicts based on the traffic state parameters collected in 20 seconds, with a prediction accuracy of up to 97%.Keywords : t raffic safety ; time -to -collision ; traffic conflict prediction ; tunnel risk ; machine learning 隧道是公路路网中的关键交通设施,可以减少路线规划上的旅行时间,提高出行者的便利性.与收稿日期:2022-10-13;修回日期:2023-01-17基金项目:中央高校基本科研业务费专项资金(2022JBQY007);国家自然科学基金(62276019)Foundation items : Fundamental Research Funds for the Central Universities (2022JBQY007);National Natural Science Foundation of China(62276019)第一作者:贾磊(1986—),男,山西临汾人,博士. 研究方向为人工智能及应用. email :*****************.cn.通信作者:李清勇(1979—),男,湖南涟源人,教授,博士,博士生导师. email :*************.cn.引用格式:贾磊,李清勇,俞浩敏.基于监控视频的隧道交通冲突预测方法[J ].北京交通大学学报,2023,47(3):61-69.JIA Lei , LI Qingyong , YU Haomin. Method for predicting traffic conflicts in tunnels based on monitoring videos [J ]. Journal of Beijing Jiaotong University ,2023,47(3):61-69.(in Chinese )北京交通大学学报第 47 卷在开阔道路上不同,隧道内驾驶员会由于隧道封闭、黑暗和单调的环境引起焦虑,驾驶员隧道中驾驶需要更高的注意力和更大的脑力负荷[1].同时,在隧道中发生事故的后果往往比在开阔道路上的破坏性和灾难性更大.隧道中更狭窄、更有限的空间阻碍了事故后的救援和疏散,这可能会导致车辆拥堵、发生车祸,或者随后发生更大的次生事故.鉴于隧道存在的潜在危险,有必要对隧道交通安全进行评价,来研究识别与事故风险相关的重要因素.在传统的交通安全评价工作中,交通事故数据被用来研究宏观交通状态(交通量、速度、占用率)与碰撞频率或严重程度之间的关系[2-3].基于交通事故数据的研究结果对于更好地理解事故发生机制具有重要意义.但是以交通事故作为指标的评估模型存在样本少且数据采集滞后的问题,统计数据存在广泛的误统漏报,造成数据统计分析结果的不真实、不准确.部分研究工作[4-5]使用间接安全指标作为评估交通安全性能的替代方法,其中最具有代表性的是基于碰撞时间(Time-to-Collision, TTC)的交通冲突监测指标[6].在公路隧道的安全评价方面,有部分研究工作[7-9]开展预测事故频率的研究,对与碰撞风险相关的因素开展研究.Ma等[10]利用高速公路隧道事故记录信息,建立了预测事故的逻辑回归分类评定模型,研究季节、时间、事故地点、隧道长度和恶劣天气等与事故严重程度显著相关的因素.Huang 等[11]利用分类回归树模型对高速公路隧道的事故严重程度的风险因素进行研究,得出危险驾驶行为、事故时间、事故等级和车辆类型等因素显著影响事故严重程度.随着新兴传感器技术的发展,相关研究[12-14]提出基于微观轨迹数据来开展交通安全评价的方法.但是轨迹数据通常需要专业的软件从交通视频中提取,提取过程需要对视频进行多种视觉处理方法的操作,耗时长且需要离线完成,无法满足对交通安全实时评估的要求[15].为了满足交通安全实时评价的要求,本文提出了一种基于实时交通状态数据预测隧道内发生交通冲突的方法,更适用于对隧道交通安全的实时评价.在实验部分,通过离线收集轨迹数据,检测出交通冲突和对应的交通状态,用机器学习方法建立并验证交通冲突与交通状态的关联关系,实现对交通安全的实时评价.本研究旨在将交通冲突与动态交通流特性联系起来,从宏观交通特征的角度理解交通冲突机制.在隧道安全监测应用中,以摄像机监测路段为对象,以20 s为时间单位将监控摄像机动态采集的交通状态作为交通冲突预测模型的输入变量.通过对隧道所有摄像机使用安全预测模型,可动态预测每个摄像机监控路段发生交通冲突的概率,实现对隧道交通运行风险实时量化监测,从而实现对整个隧道的风险预警.1交通冲突预测模型1.1预测模型定义交通冲突为两辆车按照当前状态继续行驶将发生交通碰撞的“接近碰撞”情况[16],比交通事故发生更为频繁,可以为安全评估提供更丰富的信息.与严重依赖历史碰撞数据的传统方法相比,基于交通冲突的安全分析可以在实际碰撞发生之前识别到危险,能够更及时地对交通安全状态进行评估.基于碰撞时间的交通冲突计算方法是最常用的评价交通安全的微观指标[17-18].碰撞时间为目标车辆与前车在保持当前运动状态下,继续运动直到发生碰撞所需要的时间[6].车辆碰撞时间TTC n表示为TTC n=ìíîïïïïp n+1-p n-l nv n-v n+1v n>v n+1∞ v n≤v n+1(1)式中:p n和v n为目标车辆在隧道内的行驶距离和速度;p n+1和v n+1为前车在隧道内的行驶距离和速度;l n为与车型相关的车辆车身长度.将摄像机监控路段发生交通冲突的判定准则表示为Y(TTC n)∈{0,1},则交通冲突判定Y(TTC n)表示为Y(TTC n)=ìíî1 TTC n<TTC*0 TTC n≥TTC*(2)式中:当监控路段存在至少一辆目标车辆的TTC n 小于TTC*,则判断目标车辆与前车发生交通冲突.在对交通冲突的国内外研究分析中,碰撞时间阈值TTC*可被设定为1~4 s[19-20].通过上、下游视频检测器采集的交通状态变量TS(t),对上、下游摄像机之间的路段是否发生交通冲突进行预测,交通冲突预测可表示为Y(TTC n)=f(TS(t))(3)式中:交通冲突预测使用机器学习模型f(⋅),由视频检测器采集的交通状态变量TS(t)作为模型的输入.基于监控视频预测隧道发生交通冲突的方法如图1所示.1.2交通状态随着对交通冲突预测实时性要求的提高,交通状态变化的随机性和不确定性越来越强.在视频检测器得到的众多交通状态参数中,需要选择与交通62贾磊等:基于监控视频的隧道交通冲突预测方法第 3 期冲突耦合相关的特征参数建立交通冲突预测模型.交通量是单位时间通过道路某断面的车辆数目,属于交通流的基本特征.同时,交通流的交通组成影响道路的通行能力和服务水平,研究使用小型车辆、中大型车辆和危化品车辆的车型占比来表示交通流的交通组成.车道检测器采集的交通量Q ,P car 为小型车的车型占比,P truck 为中大型车的车型占比,P hm 为危化品车辆的车型占比,可表示为Q =N 20×3×60(4)P car =N carN 20×100%(5)P truck =N truckN 20×100%(6)P hm =N hmN 20×100%(7)式中:N 20为以20 s 为时间单元统计经过车道检测器断面的车辆总数量,,N car 为小型车的数量,N truck 为中大型车的数量,N hm 为危化品车辆的数量.通过目标检测、多目标跟踪、车辆重识别和逆透视空间变换等视频处理技术[21-22],可采集到摄像机监控范围内车辆的轨迹信息.为避免提取的运动轨迹受到随机误差的影响,对车辆运动轨迹进行平滑处理,点(x i ,y i ,t i )和点(x i +m ,y i +m ,t i +m )为采用均值滤波法处理后的坐标.车辆在隧道空间通过两个坐标点的车辆速度v i 可表示为v ii +m i(8)式中: x i 、y i 和t i 为监控中第i 帧视频转换的隧道空间横坐标、纵坐标和时间; x i +m 、y i +m 和t i +m 为第i +m 帧视频转换的隧道空间横坐标、纵坐标和时间.在获取到单个车辆通过车道检测器的车辆速度后,对20 s 时间单元经过车道检测器断面的车辆进行统计,交通流的平均车速V mean 可表示为V mean =1N 20∑n =1N v n(9)式中:v n 为第n 辆车的平均速度.使用车速标准差来表示交通流中车辆速度的离散程度.车速标准差V sd 是在统计时间内交通流中所有车辆的个体速度偏离交通流平均速度的平均值,车速标准差V sd 可表示为V sd =(10)通过对交通状态的各特征进行定义说明,对车道检测器在交通冲突发生的前20s 时间单元所采集到的交通状态变量定义为TS (t )=(N time ,N loc ,Q ,V mean ,V sd ,P car ,P truck ,P hm ).交通冲突发生的时间和隧道内的空间位置也是交通冲突发生的重要因素.通过定义时间编号N time 和空间编号N loc 表示发生交通冲突的时间、空间特征.N time 表示以15 min 为时间单元的交通冲突发生时间段编号,N loc 为摄像机检测器在隧道的位置编号.1.3 交通冲突预测模型交通冲突预测以实时交通状态数据为主要模型输入,通过训练和区分冲突与非冲突状态下的不同交通流特性来捕捉交通冲突的前兆特征,使用分类算法建模区分冲突与非冲突,从而实现对交通冲突预测.因此,基于交通流状态对交通冲突进行预测可以按照二分类问题进行建模[23].按照机器学习的主要类别,分别从分类器方法和集成方法中选择代表性的机器学习模型对交通冲突进行预测. 随机森林(Random Forests ,RF )[24] 预测方法与支持向量机(Support Vector Machine ,SVM )[25]、多层感知机(Multi -Layer Perceptron ,MLP )[26]、分类决策树(Decision Tree ,DT )[27]方法相比,其预测效果和性能稳定性优于单一算法,运行速度也比深度学习等更复杂的方法更快.随机森林是由一系列树型分类器组合成的分类器,每棵树对输入向量的决策结果进行投票决定最优分类[28].随机森林抽取随机样本子集并训练生成决策树的方法如图2所示.图2中,随机森林决策树生成方法共包含4个步骤.步骤1:采集并建立交通冲突数据集VisInt -Conflict -TTC ,从训练样本集中用Bootstrap 自助抽样法随机采样选取N 个子训练样本集(样本集A , 样本集B ,…,样本集N ),并相应的建立N 棵分类决策树.步骤2:在分类树的每个节点上随机地从M 个指标中选取m 个分割指标进行分割.图1 交通冲突预测问题形式化Fig.1 Formalization of traffic conflict prediction problem63北京交通大学学报第 47 卷步骤3:以节点基尼指数为节点分割标准来确定最优分割,重复步骤2遍历建立的N 棵分类树.步骤4:由步骤3确定每颗分类树的最优分割分类指标,从而生成N 棵分类树形成随机森林.运用模型进行交通冲突预测分类时,需把待测样本集输入到训练完毕的RF 各分类树中,各叶子节点上的分类结果即为该棵分类树的交通冲突预测结果.为得到整个随机森林对样本集的冲突预测结果,平均各棵分类树叶子节点上的分类结果表示为p (c )=∑k =1NP (c |k )(11)式中:k 为当前节点的分支属性;c 为交通冲突的预测类别;P (c |k )概率函数是分类决策树上在k 节点处预测类别为c 的概率.在决策树从根节点向下不断递归分割的过程中,选取最小的基尼值作为此节点的分割标准,确定节点指标为最优分割分类指标.节点基尼指数Gini (k )描述了节点的不纯度,Gini (k )可表示为Gint (k )=1-∑c =1C []P (c |k )2(12)式中: C 为预测总类别.Gini (k )为0时,表示在k 节点处的样本数据为同一分类级别,Gini (k )越大,表明在k 节点处的样本数据越趋于均匀分布,能获得的有用分类信息越少.1.4 交通冲突预测流程本文提出了一个从隧道监控场景多路监控视频中提取车辆运行轨迹,并对交通冲突进行预测研究的技术框架.整体框架按照运动轨迹采集、交通特征提取、交通冲突检测、交通冲突预测的步骤开展研究工作,研究流程如图3所示.图3中,首先通过目标检测、车型分类、多目标跟踪视频检测方法,检测得到车辆在单个摄像机的图像坐标.使用坐标变换将图像坐标转换成地面坐标,得到车辆在隧道空间的运动轨迹.使用车辆重识别方法来实现多摄像机下的车辆身份识别,采集到车辆通行整个隧道的运行轨迹.其次,计算交通冲突对应路段位置的视频检测器所采集的交通状态变量TS (t ),作为交通冲突预测模型的输入.然后,通过计算前车-后车轨迹数据得到实时的碰撞时间,建立基于碰撞时间的交通冲突判定准则,检测交通冲突发生的时间和路段位置,作为交通冲突预测模型的输出.最后, 建立交通状态参数特征与交通冲突的关联性,基于交通状态特征参数对交通冲突状态进行预测.2 实验结果及分析2.1 数据采集与处理在研究实验部分,选取山西省S50高速临县3号隧道的14个摄像机用于数据采集.该隧道的限速在70 km/h ,摄像机的安装间距为150 m ,可提供600万像素分辨率的监控视频.研究中采集了24 h 隧道监控视频并进行了离线处理.通过目标检测、多目标跟踪、车辆重识别、逆透视变换等视频处理技术[21-22],获取了27 842辆车在隧道通行的轨迹数据,用于进一步检测交通冲突事件.经过与隧道车辆运动状态进行现场测试对比,车辆在隧道空间的轨迹定位精度能够达到1 m ,车辆速度的采集精度能够达到90%,实验数据精度可以支撑对交通冲突预测的研究任务.按照交通冲突数据处理方法[29],将处理得到的车辆与前车的碰撞时间在连续变化中最小值的时刻t 作为零时刻,其对应的前20 s 时间单元的冲突时间段集合为t 20.在剩余的时间段,按照20 s 时间单元获取非冲突时间段集合.交通冲突数据集处理方法如图4所示.图2 随机森林决策树生成方法Fig.2 Method for generating random forest decision tree图3 交通冲突预测流程图Fig.3 Flowchart of traffic conflict prediction64贾磊等:基于监控视频的隧道交通冲突预测方法第 3 期图4中,将交通冲突阈值设置TTC *设置为1 s [19-20],对离线处理获取的车辆轨迹进行交通冲突检测建立VisInt -Conflict -TTC 数据集,包括5 652个交通冲突正样本、3 6619个交通冲突负样本,并按照7∶3的比例划分为训练集和测试集.为进一步分析涉及危化品车辆交通冲突的分布状态,将交通冲突类型划分为涉及危化品车辆的5种车型的交通冲突和非涉及危化品车辆的4种车型的交通冲突.交通冲突车辆跟驰类型分布统计结果如表1所示.由表1可知,发生在左车道的交通冲突是右车道的2.26倍,非涉及危化品的交通冲突占到交通冲突总数的97.49%,交通冲突分布规律与隧道交通状态和管理规则保持一致.2.2 评价指标为了评估所提出的机器学习方法的交通冲突预测性能,使用机器学习领域的技术评价指标对模型进行测评,包括准确性A 、查准率P 、查全率R 、综合评价指标F 1和ROC 曲线下面积(Area Under Curve ,AUC )[30],参数表示为A =T con +T non -cT con +F non -c +T non -c +F con(13)P =T con T con +F con(14)R =TPR =T conT con +F non -c(15)F 1=2⋅P ⋅R P +R(16)FPR =F conF con +T non -c(17)M con =T con +F non -c (18)N non -c =T non -c +F non -c(19)AUC =∑j ∈正样本rank (j )-M con ⋅(1+M con )2M con ⋅N non -c(20)式中:T con 表示对发生交通冲突的正确预测;T non -c 表示对非交通冲突状态的正确预测;F con 表示对发生交通冲突的错误预测;F non -c 表示对非交通冲突状态的错误预测;M con 为数据集中发生交通冲突的正样本数量;N non -c 为数据集中非交通冲突的负样本数量;TPR 为预测的真正例率;FPR 为预测的假正例率;rank (j )表示发生交通冲突样本j 在排序中的序号数.查准率P 和查全率R 是互为矛盾的指标,需要使用综合评价指标F 1来计算准确率和召回率的调和平均值,AUC 指标也用于对模型性能的综合评价,指标介于0到1之间,AUC 数值越接近1表示模型的预测性能越理想.2.3 实验结果使用SVM 、MLP 、DT 和RF 模型在VisInt -Conflict -TTC 数据集上进行对比实验,并结合数据集的特征对机器学习模型的参数进行配置.各模型的参数配置为: 支持向量机SVM 的核函数类型设置为径像核函数,核函数系数设置为样本特征数的倒数,停止训练的误差精度设置为0.001,错误项的惩罚系数设置为1;多层感知机MLP 的隐藏层设置为1层,隐藏层有100个神经元,激活函数设置为Relu 函数,优化器设置为机遇随机梯度Adam ,正则化项参数设置为0.000 1,初始学习率设置为0.001;分类决策树DT 的特征划分标准设置为特征最优划分点,最小样本划分数量设置为2,分类最少样本数设置为1;随机森林RF 的学习器数量设置为100,最小样本划分数量设置为2,分类最少样本数设置为1,样本采用自助采样法采样,叶子节点最小的样本权重和设置为0.按照数据集的交通冲突检测和数据处理方法,所获得的VisInt -Conflict -TTC 数据集正样本数量为5 652,负样本数量为36 619,正负样本比例为1∶6.5,数据集的正负样本不均衡.研究中进一步使用数据重采样方法对正样本进行过采样,使其正负样本数量均为36 619.重采样数据集命名为VisInt -Conflict -TTC -Resample.在原始数据集和重采样数据的4个机器学习模型实验结果如表2所示.图4 交通冲突数据处理方法示意Fig.4 Illustration of methods for processing traffic conflict data表1 交通冲突车辆跟驰类型分布Tab.1 D istribution of car -following types in traffic conflicts交通冲突类型非涉及危化品涉及危化品车辆跟驰类型(前车-后车)小型车-小型车小型车-中大型车中大型车-小型车中大型车-中大型车小型车-危化品车中大型车-危化品车危化品车-小型车危化品车-中大型车危化品车-危化品车左车道3 2971943804600000右车道28670266971635127415冲突数量3 5832646461 017635127415占比/%63.394.6711.4317.990.110.620.211.310.2665北京交通大学学报第 47 卷由表2可知,随机森林RF模型在原始数据集和重采样数据集均取得最优性能结果.RF模型在原始数据集上的准确率、查准率、查全率分别达到0.917、0.811和0.499,综合评价指标F1为0.618,AUC值为0.939.RF模型在重采样数据集上取得最佳性能,其准确率、查准率、查全率分别达到0.97、0.948和0.996,综合评价指标F1为0.971,AUC值为0.999,较原始数据集模型预测性能有显著的提升.RF模型能够有效预测交通冲突的发生风险,预测准确率可达到97%.原始数据集和重采样数据集的机器学习模型ROC曲线及AUC指标如图5所示.图5中,ROC曲线的X轴是假正例率FPR,当X 轴越接近零准确率越高,纵坐标Y轴是真正例率TPR,Y轴越大代表准确率越高.ROC曲线下方部分的面积被称为AUC指标.当需要评价预测方法或比较两个预测方法的性能时,使用AUC指标来进行检验.ROC曲线下方面积越大,AUC值越高,说明对交通冲突的预测准确率越高.由图5可知,随机森林与其他模型的对比中取得最佳的预测性能,所有模型的性能都通过对数据集的重采样方法得到改善.2.4参数分析为筛选出模型输入变量中影响交通冲突检测结果的重要因素,充分结合交通流的时空分布特性,对VisInt-Conflict-TTC数据集的交通冲突的时空分布规律进行分析.以15 min为时间单元将24 h划分为96个时间片段,以25 m为长度单元将所监测的2 100 m隧道划分为84个长度片段.数据集中隧道交通冲突数据的时空分布如图6所示.从图6隧道交通冲突时空分布数据可知,交通冲突在9:00-20:00的时间段发生的平均次数为其他时段的2.8倍,与该隧道交通流的时间运行特征一致.在隧道入口到洞内300 m范围内发生交通冲突的平均次数为其他位置的2倍.交通流的时间和空间特征将与交通冲突事件具有紧密关联性,在输入的交通状态变量中有必要选择时间和空间自变量参数来进行预测.为进一步确定所选取的交通状态变量与交通冲表2 VisInt-Conflict-TTC数据集的预测方法实验结果Tab.2 E xperimental results of prediction methods for VisInt-Conflict-TTC dataset数据集VisInt-Conflict-TTC VisInt-Conflict-TTC-Resample 方法SVMMLPDTRFSVMMLPDTRFA0.9100.9110.8980.9170.8590.8690.8240.970P0.8310.7180.7440.8110.8370.8640.8100.948R0.4120.5510.3740.4990.8930.8760.8470.996F10.5510.6240.4980.6180.8640.8700.8280.971AUC0.8850.9310.8930.9390.9330.9430.9060.999图5 机器学习模型的ROC曲线及AUC指标Fig.5 ROC curves and AUC metrics for machine learningmodels图6 隧道交通冲突数据时空分布Fig.6 Spatial and temporal distribution of tunnel trafficconflict data66贾磊等:基于监控视频的隧道交通冲突预测方法第 3 期突预测结果的相关性,开展交通状态变量对交通冲突预测的显著性分析.采用二元Logistic 回归分析方法,根据回归系数估计结果的显著性概率值,评估各变量对交通冲突的发生是否有显著贡献.显著性概率值p表示为p=e()βx+βx+…+βx…+βx1+e()βx+βx+…+βx…+βx(21)式中:x a(a=1,2,…,8)表示样本对应的交通状态输入变量;βb(b=1,2,…,8)是各交通状态变量的回归系数,反映各交通状态变量对交通冲突发生概率的影响程度.交通状态变量与交通冲突的显著性分析结果如表3所示.表3中,显著性概率值为协变量回归系数在零假设成立条件下发生的概率.当显著性概率值小于设置的显著性水平时,表明该协变量对因变量有显著性作用.设置的显著性水平为0.01,表3中各变量的显著性概率值均远小于0.01,表明各交通状态变量对交通冲突的发生概率均有显著性贡献.为确定交通状态的各变量之间的相关性,开展变量间的相关性测试,计算各个交通状态变量之间的相关系数,测试各个交通状态变量之间的共线性程度.交通状态变量间的相关性分析如表4所示.由表4可知,N time、N loc、Q、V mean、V sd变量之间为弱相关性.P car、P truck、P hm为不同的车型占比,其变量相关之间有强相关性.受危化品车辆的时间管控制度影响,可验证P car、P truck、P hm与N time变量有强相关性.进一步使用部分依赖图(Partial Dependence Plot, PDP)工具[31],分析模型中弱相关性参数变量之间的相关性. PDP参数变量相关性分析结果如图7所示.由图7可知,交通量Q越大,速度标准差V sd越大,发生交通冲突的概率越高.交通冲突在13:00-19:00时发生的概率高于其他时段,在隧道入口处发生交通冲突的概率较高,分析结果与交通冲突时空分布结果一致.通过对交通状态变量的影响分析,对预测模型在数据集的预测结果进行合理性解释.3结论1)在建立的隧道交通冲突数据集上验证了支持向量机、决策树、多层感知机和随机森林等4种机器学习模型,确定使用视频检测的交通流状态预测表3 交通状态变量与交通冲突的显著性分析Tab.3 S ignificance analysis of traffic state variables andtraffic conflict变量N time N loc Q V mean V sd P car P truck P hm回归系数-0.216-0.0430.379-0.0450.0862.5931.7802.290显著性概率3.60×10-51.62×10-252.86×10-635.34×10-604.88×10-2562.47×10-73.90×10-46.95×10-6表4 交通状态变量间的相关性分析Tab.4 C orrelation analysis of traffic state variables变量N time N loc V mean V sd Q P car P truck P hm N time1.00———————N loc-0.011.00——————V mean-0.01-0.241.00—————V sd-0.040.18-0.071.00————Q0.14-0.180.30-0.271.00———P car-0.920.04-0.350.01-0.281.00——P truck-0.950.03-0.280.04-0.260.991.00—P hm-0.930.03-0.270.04-0.260.970.981.00图7 PDP参数变量相关性分析Fig.7 correlation analysis of PDP parameter variables67。