基于模糊时间序列的车辆检测器数据修补方法研究
- 格式:doc
- 大小:6.94 KB
- 文档页数:3
基于T-S模糊神经网络的汽车故障诊断的研究柯喻寅;谢镔;吴卿【摘要】该文根据模糊神经网络的特性结合汽车故障诊断的技术,根据监控排放标准,采用个人手持式故障诊断仪获取数据流,T-S模糊逻辑与神经网络结合,训练模糊神经网络,进行故障诊断。
使用误差反馈算法和模糊理论训练神经网络,根据训练完成的T-S模型对汽车防抱死系统故障进行诊断。
体现了其诊断的准确性强和适用性广的特性。
%This paper is based on fuzzy neural network and fault diagnosis of automobile technology,according to the standard of OBDII,using personal handheld fault diagnosis instrument(PHFDI) to get the data flow,combining T-S fuzzy logic and neural networks,to train fuzzy neural networks,to achieve the fault ing the BP algorithm and fuzzy theory trains the neural network.Then T-S model neural network which be training completed diagnose the ABS of vehicle.It not only improves the accuracy of diagnosis,but also expands the scope of diagnosis.【期刊名称】《杭州电子科技大学学报》【年(卷),期】2012(032)002【总页数】4页(P41-44)【关键词】模糊神经网络;故障诊断;误差反馈;隶属函数【作者】柯喻寅;谢镔;吴卿【作者单位】杭州电子科技大学计算机应用技术研究所,浙江杭州310018;杭州电子科技大学计算机应用技术研究所,浙江杭州310018;杭州电子科技大学计算机应用技术研究所,浙江杭州310018【正文语种】中文【中图分类】TP3910 引言汽车安全性不仅是一个技术问题,在某种程度上更是一个严重的社会问题。
基于半监督模糊核聚类的汽车变速器早期故障检测方法研究的开题报告一、研究背景汽车变速器作为车辆的重要部件之一,在车辆的工作过程中发挥着至关重要的作用,其稳定可靠的运行直接影响着车辆的性能和安全性。
由于变速器工作过程中存在着复杂的机械结构以及各种作用力的作用,因此很容易出现各种故障。
目前,对于汽车变速器早期故障检测方法的研究主要集中在通过传感器检测变速器的振动、温度、压力、流量等指标,来判断变速器是否存在故障。
虽然这些指标能够反映变速器的运行状态,但是其纯监督的方法在数据标注方面存在着困难和成本高的问题。
因此,如何在半监督的情况下进行变速器早期故障检测,是一个值得研究的问题。
二、研究目的本研究旨在发展一种基于半监督模糊核聚类的汽车变速器早期故障检测方法,通过利用未标记数据来增加数据样本量,提升模型的准确性和可靠性,从而实现对变速器早期故障的检测。
三、研究内容本研究将开展以下内容:1. 分析汽车变速器故障的特征,挖掘其潜在的机制,为后续的建模工作提供理论支持。
2. 提出一种基于模糊聚类的汽车变速器早期故障检测模型,将未标注的数据进行聚类并根据聚类结果进行异常检测。
3. 设计一种基于核函数的优化算法,对模型进行训练和优化。
4. 在真实数据集上进行实验验证,评估模型的性能和可靠性,与其他现有的变速器故障检测方法进行比较。
四、研究意义本研究对于汽车变速器早期故障检测的研究具有重要的理论和应用意义,其主要意义如下:1. 探索一种基于半监督模糊核聚类的数据挖掘方法,不仅可以提高模型的检测效果,而且可以减少标注数据的成本。
2. 对于汽车制造企业,本研究可以提供一种新的汽车变速器早期故障检测方法,有助于及早发现变速器存在的潜在故障,提高车辆的性能和安全性。
3. 对于未来相关研究,本研究可以提供一种新的理论和方法,有助于推动机器学习和数据挖掘领域的发展。
五、研究方案1. 调研相关文献,分析变速器早期故障检测方法的研究现状和存在的问题。
基于非线性模糊特征的汽车故障挖掘算法
魏红娟
【期刊名称】《科技通报》
【年(卷),期】2013(29)4
【摘要】为了解决汽车故障诊断中的不确定性和建模问题,提出了一种基于非线性模糊关联特征的汽车故障挖掘算法,通过对汽车突发的各种故障中的非线性信息进行整理,在贝叶斯网络的学习能力和概率推理的基础上,加入模糊关联的推理机制,使得其对大量的非线性传感数据的分布特征,实现故障诊断系统的自适应,完成汽车故障特征的有效挖掘。
实验结果表明,该方法能为故障诊断提供准确和可靠的决策依据。
【总页数】3页(P97-99)
【关键词】故障诊断;模糊挖掘;贝叶斯网络
【作者】魏红娟
【作者单位】新乡学院计算机与信息工程学院
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.基于聚焦式模糊聚类算法的数据挖掘故障诊断方法 [J], 杨苹
2.基于模糊依赖度算法汽车故障诊断仿真研究 [J], 尹韶峰
3.基于特征模糊贴近的数据库约束挖掘算法 [J], 王勇;邹盛荣
4.基于模糊算法的纯电动汽车动力电池故障诊断研究 [J], 尹爱华;左付山;杨柳;李政原
5.基于模糊聚类的非线性系统模糊辨识算法 [J], 刘福才;马丽叶
因版权原因,仅展示原文概要,查看原文内容请购买。
车辆检测器异常数据清洗及修复方法研究作者:鲍东玉王军来源:《物联网技术》2015年第10期摘要:车辆检测器检测数据作为一种基础数据在交通领域具有重要的作用,其数据质量极大地影响着以其作为参考基础数据的交通规划、交通控制、交通行为分析等应用领域研究分析结论的准确性和合理性。
文章首先分析了车辆检测器异常数据的表现形式及产生原因,根据交通流理论及客观限制条件研究,提出了基础筛选、阈值筛选和基于交通流理论的筛选方法,并在此基础上,根据交通运行状态的统计相似性进行了研究和对比,选择了IQR法作为数据修复的方法。
从而在一定程度上解决了车辆检测器数据质量的问题。
关键词:车辆检测器数据;数据筛选;数据修复;四分位距IQR法中图分类号:TP274 文献标识码:A 文章编号:2095-1302(2015)10-00-020 引言车辆检测器是检测道路交通流运行参数的设备,是智能交通系统中的一个重要组成设备。
然而,在实际运用中,由于车辆检测器存在诸多应用选型不当、设备老化、恶劣环境影响、维护检修不到位等原因,其检测数据往往存在很多质量问题。
车辆检测器数据常被用于交通流状态描述及事件检测,交通流参数的统计分析在交通规划领域、交通控制领域、交通行为分析领域有着极其重要的基础数据支持作用。
因此,车辆检测器数据的质量与其在各应用领域的作用效果存在极大地影响。
如何筛选并修复车辆检测器数据中的异常数据,是车辆检测器数据应用的基础。
1 异常数据清洗方法研究1.1 主要筛选目标异常数据筛选的主要目标即发现车辆检测器数据记录中因设备性能、运行状态、检测环境异常所导致的异常数据,根据异常数据的表现形式,可将筛选目标分为四类。
(1)错误数据[1,2]。
数据记录出现不在最大值的上限范围内或字段之间不满足机理关系的现象,这是车辆检测器异常数据中出现频率最高的一种异常数据。
(2)冗余数据[3,4]。
冗余数据是指在检测时间段内存在相似或重复的数据记录,使实际记录数多于理论上应有的记录总数的数据。
《车辆轨迹数据清洗与质量评估的研究与应用》篇一一、引言随着科技的不断进步,车辆轨迹数据已成为现代交通管理和智能交通系统的重要组成部分。
这些数据涵盖了车辆的行驶路径、速度、时间等关键信息,对于交通流量分析、安全评估、交通规划等领域具有重要意义。
然而,由于多种因素的影响,车辆轨迹数据中可能存在大量噪声和异常数据,这些数据的质量直接影响到分析的准确性和可靠性。
因此,本文将深入探讨车辆轨迹数据的清洗与质量评估的相关研究及应用。
二、车辆轨迹数据概述车辆轨迹数据主要由车辆在行驶过程中所记录的时空信息组成,包括经度、纬度、速度、时间等。
这些数据通常由车载设备或路侧设备实时收集,并通过网络传输至数据中心进行存储和分析。
车辆轨迹数据具有高维度、动态变化、时空连续等特点,为交通管理和规划提供了丰富的信息来源。
三、车辆轨迹数据清洗的必要性由于多种原因,如设备故障、信号干扰、人为错误等,车辆轨迹数据中可能存在大量的噪声和异常数据。
这些数据不仅会影响到数据分析的准确性,还可能导致错误的决策和预测。
因此,对车辆轨迹数据进行清洗是必要的。
清洗过程主要包括去除无效数据、填补缺失值、修正错误数据等步骤,旨在提高数据的完整性和准确性。
四、车辆轨迹数据清洗的方法与技术针对车辆轨迹数据的特性,本文提出以下几种清洗方法与技术:1. 空间滤波:通过设定合理的空间范围和时间范围,过滤掉明显偏离正常行驶路径的数据。
2. 速度阈值法:根据道路限速和实际行驶情况设定速度阈值,去除超速或低速等异常数据。
3. 聚类分析:利用聚类算法对数据进行分类,识别出异常或无效的轨迹数据。
4. 机器学习方法:通过训练模型对数据进行异常检测和修复,提高数据的准确性。
五、车辆轨迹数据质量评估在完成清洗后,需要对数据进行质量评估。
本文提出以下几种评估方法:1. 完整性评估:检查数据的缺失值和异常值,评估数据的完整性。
2. 准确性评估:通过与实际交通情况进行对比,评估数据的准确性。
专利名称:一种交通时序数据的诊断和修复方法
专利类型:发明专利
发明人:杜镐,李妮,徐震辉,周俊杰,李德文,卢慕洁,王月申请号:CN202011338594.9
申请日:20201125
公开号:CN112380206A
公开日:
20210219
专利内容由知识产权出版社提供
摘要:本发明公开了一种交通时序数据的诊断和修复方法,方法包括以下步骤:S1:启动数据预处理算法采集数据;S2:通过历史数据与当前数据进行分析对比实现数据诊断;S3:使用历史数据对当前数据进行数据修复。
本发明提供一种可以处理多种不同来源和种类的交通时序数据,对数据进行诊断,将诊断后判断为缺失或者异常等级较高的数据进行修复,并对修复后数据的置信程度进行分析,最后输出带有标记的、更为可靠的数据的交通时序数据的诊断和修复方法。
申请人:浙江浙大中控信息技术有限公司
地址:310053 浙江省杭州市滨江区滨康路352号2号楼23-25层
国籍:CN
代理机构:杭州杭诚专利事务所有限公司
代理人:尉伟敏
更多信息请下载全文后查看。
第51卷第9期2017年9月浙江大学学报(工学版)Journal of Zhejiang University (Engineering Science)Vol. 51 No. 9Sep. 2017D G1:10. 3785/j. issn. 1008-973X. 2017. 09. 007基于时空相关性的交通流故障数据修复方法王薇12,程泽阳S刘梦依13,杨兆升12(.吉林大学交通学院,吉林长春130022; 2.吉林大学吉林省道路交通重点实验室,吉林长春130022;3.山东省交通规划设计院,山东济南250000)摘要:为及时对高速公路交通流故障数据进行有效修复,综合考虑交通流数据的时空特性,提出基于3D形函数的时空插值修复方法.以时间间隔、距离和时滞参数作为相关数据的提取依据,以高速公路实际数据对所提出方法进行验证;将实验结果与采用时间序列法、空间插值法、基于灰色残差G M模型以及基于统计相关分析的方法得到的结果进行对比.结果表明,该方法的修复结果优于时间序列法和空间插值法,并且修复误差低于其他方法.其中,与基于灰色残差G M模型和基于统计相关分析的方法相比,该方法的修复结果的均绝对误差分别降低了 21.33%和43. 54 %,均方根误差分别降低了12. 87%和35. 08%.该方法的修复结果的平均绝对值误差率比基于统计相关分析的方法降低了 40%.这表明研究中所提方法的修复精度更高,是一种有效的数据修复方法.关键词:交通流故障数据;时空特性;D形函数;修复结果;高速公路;修复精度中图分类号:U 491 文献标志码:A文章编号:1008 - 973X(2017)09 - 1727 - 08Repair method for traffic flow fault data based onspatial-temporal correlationWANG Wei1'2 , CHENG Ze-yang1, LIU Meng-yi1'3 , YANG Zhao-sheng1'2(1. College o f Transportation , J Uin U niversity,Changchun 130022,China;2. JiLin Provence K ey Laboratory o f Road T r a f fic,JiLin U niversity,Changchun 130(22,C hina;3. Shandong Provincial K ey Communications Planning and Design Institute,Jinan 250000,China)Abstract:Considering the spatial-temporal characteristics of the traffic flow data, a spatial-temporal interpolation repair method based on 3D shape function was proposed to effectively repair the freeway traffic flow tn time. The time triterval, distance and time delay parameters were chosen as the extracted evidences of the relevant data? and the proposed method was validated through the actual data of freeway; while,the time series method,the spatial triterpolation method, the method based on residualerror GM model and the method based on statistical correlation analysis were selected as comparative approaches. Results show that the repair results of the proposed method are better than the results by timeseries method and spatial triterpolation method; tn addition, the repair error is lower than other methods. Compared with the method based on residual error GM model and the method based on statistical correlation analysis, the absolute error of the proposed method are reduced by 21. 33 % and 43. 54% , respectively; the root-mean-square e rror are reduced by 12. 87% and 35. 08% respectively. The averageabsolute error rate of the proposed method are reduced by 40% compared with the method based on statistical correlation analysis, which illustrates that the repair precision of the proposed approach is more 收稿日期:2016—07 —16. 网址:w w w.Zjurnals. coni/eng/fileup/HTlVIL/201709 007 htni基金项目:国家科技支撑计划资助项目(2014B A G03B03);国家留学基金资助项目.作者简介:王薇(1977 —),女,副教授,博士,从事智能交通系统关键技术及理论研究.orcid. org/0000-0003-4494-4145.E-mail: wwei@通信联系人:刘梦依,女,助理工程师.(rcid. org/0000-0002-5664-4599. E-mail: 663112954@qq. com1728浙江大学学报(工学版)第51卷accurate and i t i s a kind of effective fault data repair approach.Key words:traffic flow fault data;spatial-temporal c haracteristics; 3D shape function;repair res freeway;repair precision从庞大的高速公路交通流数据集中获取有效信 息对于准确预测交通状态和改善交通具有重要作用.有关研究表明,目前高速公路交通流数据中主要 存在缺失、错误等故障情况,降低了数据质量,影响 了交通流预测的精度[].因此,如何有效地对故障数 据进行修复成了研究的热点.关于高速公路交通流故障数据修复方法的研究,已有一定的成果,其中研究较广的数据修复方法 包括时间序列分析法和空间插值法[2_6].时间序列分 析法主要依据交通流参数观测值与时间的相关性对 故障数据进行估计.空间插值法主要以空间维为研究视角,认为可以使用相邻地点检测数据来估计缺失数据.传统的空间插值方法对时空数据的分析通常以限定时间范围为前提,在交通领域对交通流数据进行特性分析时破坏了时空连续域的统一性.因 此,单纯对时间和空间数据进行时间序列分析或空间相关分析,均会造成时空数据大量有价值信息的丢失.从时空角度进行综合分析能够较好地解决数据信息丢失的问题,目前时空分析方法已成为多个 学科的研究重点[7_9].在交通领域中针对交通流数据时空特性的研究 大多基于数据驱动对其进行时空建模.陆化普等[0]提出了一种基于时空相关性的交通流故障数据修复 方法,将时空模型抽象为双层规划模型,并用数据驱 动法完成时空模型的标定,对修复方法进行了有效性验证.陆百川等[11]提出了一种基于改进的多尺度 主元分析的交通流数据修复模型,并结合时空相关特性计算故障数据的相关系数从而估算其真实值.邹晓芳[2]从交通流数据的时空特性出发提出了一种自适应权重的两阶段故障数据修复模型,并结合 北京市微波检测器数据进行了验证,结果表明该方 法具有较高的修复精度.此外,一些研究分别从交通 流数据的时空特性出发提出了基于灰色残差G M 模型、粗集理论、小波理论等的交通流故障数据修复 方法[13-15].以上方法虽然都对故障数据进行了较为有效的 修复,但随着大数据时代的来临,高效、准确的处理 需求使得传统的模型驱动策略难以展幵.例如:现有 的研究方法直接将空间位置时序数据代入分析,并 没有对该时间序列进行相关度估计便进行处理,而基于3D形函数的时空插值方法不仅能将时间维度 与空间维度综合考虑,还能计算数据的相关度,可以 有效地分析不规则数据集[16_18],这很好地解决了传统方法的弊端,使得数据的修复结果更加精确.基于 此,本研究提出一种综合考虑交通流数据时空相关性的3D形函数时空插值修复方法,并对高速公路交通流故障数据进行有效修复.13D形函数插值理论形函数在有限元法中指的是一单元内部的连续 函数,又称为试函数[19].形函数作为一种时空插值方法应用较为广泛.3D形函数主要以传统一维时间 和二维空间的时空域为例,将时间维度作为时空域的第三维进行扩展.3D形函数模型可以简化为一个 四面体单元,其函数可以用体积坐标法定义,如图1所示为简化后的3D形函数模型示意图.图1简化后的3D形函数模型Fig. 1 Simplified 3D shape function mo d e l在四面体单元A B C D中任意选取一点P,点P 与四面体的3个顶点构成4个内部四面体P B C D、P C A D、P A B D以及P B A C,其体积与原四面体体积之比用表示,则点P体积坐标为P(W A,W B,W c,W d),其中:1 x y z ^「1x yz第9期王薇,等.基于时空相关性的交通流故障数据修复方法[]浙江大学学报:工学版,2017,51(9): 1727 1734.1729式中 :V a b CDPBCDPCAD ^V^ABPD 分别为相应的四面体体积分别为空间四面体的3个维度,即3个 坐标轴.四面体中任意一点的参数值可由插值形函数[20] 表示:W (X ) = W a W (A ) +W B W (B ) +W CW (C )+W d W (D ).(1)式中:W Z 为该插值函数的系数,表示四面体中任意一 点的4个位置坐标,即相应的四面体体积与原四面体 体积之比.由于式(1)在三维空间有3个维度,若要对 三维空间四面体内部任意一点的函数值进行估计,则 至少需要4个离散点作为参考数据进行计算.2交通流时空相关数据分析2.1时间相关数据分析由于交通流时序数据的组织方式不同,可从环比 时间序列(指某一检测断面几天内的交通流数据时间 序列)和同比时间序列(指某一检测断面特定时间的 交通流数据时间序列)两方面进行时间相关性分析. 对于二维随机变量(X ,Y ),可用相关系数尺表示X 与Y 之间的相关程度[21]:R =cov (X ?Y )2,=1 —xi )—y ]-^)2 (y -m]2(2)式中:cov (X ,Y )为X 、Y 的协方差,&為、;、3i 分别 为x y 的方差和平均值.本研究选取山东高速公路威海段的交通流检测 数据进行时间相似性和周期性分析,数据选择的时间 范围为2014年10月20日至10月26日及接下来连 续4周每周三(特定时间)的检测数据,位置选取的是K 15 + 985断面的检测数据,则关于流量g 和时间^的序列图如图2、所示.依据式(2)分别计算交通流量环比和同比时间序 列的相关性大小,结果如表1、所示.由表1可知,周 一^到周五的父通流量相关程度均为90%左右,属于 高度相关,足以作为数据修复模型的参考数据.周六、 周日的交通流量相关程度在80%以上,认为具有较 强的相关性,也可作为数据修复模型的参考数据.但周一^到周五与周六、周日相比,由于交通流高峰时段 的起止时间不同,导致交通流数据序列间的相关程度仅有60%左右,表明该情况下交通流量间虽具有 一定的相关性,但其相关程度不足以作为修复模型的 参考数据.由表2可知,该检测断面连续4周每周特定 日期的交通流量相关程度均接近90%或在90%以上, 属于高度相关,足以作为数据修复模型的参考数据.图2山东高速公路一周内交通流数据时间相似性统计Fig. 2 T i m e similarity statistics of traffic flow in onew e e k of S h a n d o n g freeways图3山东高速公路特定时间交通流数据周期性统计Fig. 3Periodic statistics of traffic flow in specific time of S h a n d o n g freeways表1高速公路基本路段交通流量环比时间序列相似性分析结果Tab. 1 Similarity analysis results of traffic flow sequentiaf time series of basic road in freeways时间周一周二周三周四周五周六周日周一 1.00000. 901 40. 939 30.94070. 919 20. 662 70. 614 9周二0. 901 4 1. 000 00. 943 90.89990.93940.63900. 627 8周三0. 939 30. 943 9 1.00000.93590.93910.60590. 591 1周四0. 940 70. 899 90. 935 9 1.00000.93670.69460.6293周五0. 919 20. 939 40. 939 10.9367 1.00000. 718 90. 610 9周六0. 662 70. 639 00. 605 90.69460. 718 9 1.00000. 792 5周日0. 614 90. 627 80. 591 10.62930. 610 90.79251.0001730浙江大学学报(工学版)第51卷表2高速公路基本路段交通流量同比时间序列相似性分 析结果Tab. 2 Similarity analysis results of c o m p a r e d traffic flow time series of basic road in freeways时间第一周第二周第三周第四周第一周 1.00000. 941 10.91350.9217第二周0. 941 1 1.00000.89090.9029第三周0. 913 50. 890 9 1.00000.9152第四周0. 921 70. 902 90.9152 1.00002.2空间相关数据分析由高速公路交通流的运行特性可知,路段上、下 游间的纵向相关性显然高于相邻车道的横向相关性,因此选取山东高速公路威海段的3个相邻检测 断面的交通流时序数据进行统计分析:断面K12 + 875、K15 +985、K20 +793,分别表示上游、中间和 下游检测断面,则3个断面不同时刻的交通流量检测数据统计结果如图4所示.图4高速公路上、下游路段流量数据统计Fig. 4 Traffic flow statistics of upstream and d o w nstream roads in freeways由图4可知,高速公路基本路段上、下游相邻断 面间的交通流数据序列存在极强的相似性,但上、下 游间相似性存在一定的延时(上游断面与中游断面的延时为“1,中游断面与下游断面的延时为A^),称为交通流状态空间传播的时滞性.将传播延时“ 定义为时滞参数.断面a、纟的交通流数据为=和兄={x6,z}f,基于时滞参数的互相关系数为R=covT(X a,Xb)⑶式中:r为时滞参数,表示检测器断面Z与7处交通 状态空间传播的延迟时间,&a和为交通流时间序列数据的标准差,c o v(X a,X b)为基于时滞参数的协方差,计算公式如下:c〇V t(X a,Xb)=i nrN r[(Xa,t —P-xa )(Xb,t+r —Pxb )].⑷式中X a,,为断面a在“时刻的交通流时序数据,Xbjt+r面b在,+r时刻的交通时序数据,/x a和&分别表示X a和X b交通流数据序列的均值.选取上游与中游2个检测断面的交通流时序数 据进行统计分析,时间范围设定为(一5 m i n,5m i n),计算该范围内的互相关系数,并统计其随时 滞参数的变化情况,如图5所示.从图5可知,随着 时滞参数的变化,互相关系数呈现波动特性,相邻断 面交通流互相关系数在t=2时最大,t=0时互相 关系数没有达到最大,这是因为上、下游2个断面在 同一时刻的数据不能体现上、下游间交通流状态的传播性.图5交通流互相关系数随时滞参数的变化Fig. 5 C h a n g e of traffic flow relations coefficient with hysteresis parameters3基于3D形函数的交通流故障数据 时空修复模型3.1时空数据集构建基于3D形函数的时空修复模型主要针对交通 流故障数据时空插值修复的需求并结合检测器原始 数据类型定义.检测器对检测对象产生的数据集可表示为Data={Date,t,Distance post,Detector N o. Lane N o.q,v,o t}.例如:{2014/10/15 ,08: 05,14400, 0602,1,600, 75, 9}表示 2014 年 10 月15 日08:05 时刻 K14 + 400里程桩处“0602”检测器所采集的车道1的交通 流量为600 pcu/h,速度为75k m/h,时间占有率为 9%的数据集.3.2输入参量设计研究采用时间间隔(检测断面处故障数据与其他参考数据的间隔时间)、距离参数(两相邻检测器 断面的距离)和时滞参数描述交通流数据序列的相关度,由此确定模型的输入参量,3D形函数需要4个 参考数据序列一同构成时空相关数据组,因此输入 参量的设计步骤如下.1)确定时空相关数据组,与故障数据相关的时空相关数据组表示为R= {R l,R2,R.3,R4,},R.计算公式如下:第9期王薇,等.基于时空相关性的交通流故障数据修复方法[]浙江大学学报:工学版,2017,51(9): 1727 1734.1731Rij — {qi ,V ,〇ti ,t “j ,d ,,T“j },j —1,2,3,4. 式中:qz 、V 、0为第z 组数据中交通参数值,分别表示 流量、速度和时间占有率,a %为第i 组与第j 组数据 的时间间隔,d 为第z 组与第j 组数据所处断面间的 距离,T j 为第z 组与第j 组数据间的时滞参数.2)确定模型输入参量:Parameter , — {Parameter ,A t ,d,r }. (6)式中:Parameter 为流量q 、速度v 、时间占有率〇,t,d ,T 为时间间隔、距离、时滞参数的标准值.例如,当需修复的故障数据为交通流量q 时,模型输入 参量为qi — {,A t ,d ,,,t },j — 1,2,3,4.(7)3.3时空插值函数确定交通流故障数据时空修复方法的时空插值函数 模型可以表示为WWt)—W A (A t d t ) • W ,(A ) +W B A t, t ) • W r (B ) +W C A t, t ) • W r (C ) +WDW• W ^D ).(8)式中:点A 〜D 表示与故障数据时空相关的参考点,W 'i )表示点A 〜D 四参考点的交通参数属性值 q /v /o , W i (A t d %T )表示点A 〜D 四参考点位于四面体坐标中的坐标值,计算公式如下:wA iA /d ' ) — v P bcd / v A bcd ,'WB (Atf d ' T f)— V P c AD /V A b CD ,}(9)wC (A /d ' ,T )— v P abd / v A bcd ,W D (t ,,d ,,T ) — v P bac / v A bcd …v A BCD —V pc AD'1 At [ d \ t [ ~1 At2 d 2 t 21A t d T _1 At 4 d ’4 t 4 _-1At d T - 1A t d T 1 At 1 d 1 T _1 At 4 d 4 t 4 _V A bid — 1-1At d t -1A t d 2 t 1A t d 3 '3 _ 1A t d 4 t 4_-1At d T -1 At 1 t 1 t 11A t d 2 t 2_ 1 At 4 d 4 t 4 _4实例验证4.待插值故障数据来源以山东高速公路威海段K 10〜K 25路段为研究对象,以其路段及相关交通流数据序列为基础数据(检测器每5 m i n 检测到的流量数据),验证不同时 段模型的有效性,选取日期D中间车道的交通流量数据序列中连续10个时间点的数据(如图中虚线圆 圈内所示,对应的数据序号为136〜145)作为交通 流故障数据序列,则去除故障数据后的交通流原始 数据序列如图6所示.图6交通流故障数据序列确定Fig. 6 Determination of traffic flow failure data sequence4.2时空相关数据序列提取依据对高速公路基本路段交通流时间序列的相似性和周期性的分析,对故障数据序列某天前一周 及当天前两日(D -7、D -2和D -1)相同时段的时序 数据(数据序号为136 — 145)进行提取,结果如表3 所示.将所选故障数据序列所在断面记为X ,则上、 下游相邻两检测断面分别表示为X — 1和X + 1.针 对5 m i n 统计间隔的交通流数据所得对应的故障数 据空间相关数据序列如表4所示.通过基于3D 形 函数的时空插值方法对待插值的交通流故障数据时 间序列进行修复,并还原模型输出结果,修复后的交 通流数据结果如表5所示.图7修复后的交通流数据序列Fig. 7 Repaired traffic flow data sequence表3不同时间交通流故障数据时间序列Tab. 3 T i m e series of traffic flow fault data at different timet 11: 1011: 1511: 2011: 2511: 3011: 3511: 4011: 4511: 5011: 5512: 00D 厂7829010010590879379819488D -292939610084818580847470D 厂196988190827172778886701732浙江大学学报(工学版)第51卷表4故障数据空间相关数据序列Tab. 4 Spatial related data sequence of failure data数据序号时间点(X—1),—1数据序号时间点(X—1),_+1 13411 :058913611159313511:1010313711209713611:158613811258313711 :2099139113010513811 :259414011358913911 :308914 111408014011 :35961421145871411 1 :408314311508114211:4510014411559714311 :507714512:0010914411 :558614612:0588表5修复后的交通流数据结果Tab. 5 Results of repaired traffic flow data数据序号时间点修复结果13511109113611159813711209613811259013911309414011357914 111408814211458314311509514411558214512:00894.3对比分析选取基于空间相关的插值修复法和基于时间相 关的序列分析方法与研究所提方法进行对比.基于空间相关的修复法常用的是利用相邻车道数据进行 修复,主要利用相邻车道间历史数据的比例关系,通 过相同时刻相邻车道的实时数据对故障数据进行修复,以流量为例,计算公式[22]如下:<?i(k) =j ^k-(10)式中q,(k)为z时刻k车道的交通流量估计值q()表示z时刻k车道的交通流量历史值q()表示z时 刻j车道的交通流量实测值.由于故障数据序列为中 间车道,在提取相邻车道流量时序数据时,选取前一 天同一检测断面相同时刻的数据作为历史值.基于时间相关的序列分析方法常采用基于统计 与故障数据序列相关性较高的数据对进行修复,计 算公式[23]为q i d = ^j= 1R(d一j)q i d一j).(11)式中q(d)为第d天z时刻交通流量的估计值,R(d—j 为第d-j天与第d天交通流量数据的相关系数,E R表示所提取相关数据的相关系数之和,q,(d—j j表示第d—j天z时刻交通流量的值.最终计算得出时间序列法和空间插值法的修复 结果.为了进一步验证研究中所提方法的有效性,分 别选取基于灰色残差G M模型和文献[2]中提到 的基于统计相关分析方法进行对比,通过计算得出 这2种方法的交通流故障数据修复结果.最终得出 所有对比方法的修复结果,如表6所示.分别计算各 方法修复结果的均绝对误差(M A E)、均方根误差(R M S E)和平均绝对值误差率(M A P E),对比结果 如表7所示.分析表6可知,在几种修复结果中,单一的时间 序列法和空间插值法修复后的交通流比较分散,而 考虑时空特性的3种方法(灰色残差G M模型、基 于统计相关分析的方法以及时空插值法)修复后的 交通流分布更加均匀,每个时间序号对应的流量值变化不大,这更接近实际中的交通流数据.由此可见,考虑时空特性的交通流数据修复方法比单一的考虑时间特性和空间特性的方法更有效.分析表7可知,考虑时空特性的3种方法的修复误差远远低于表6各方法交通流故障数据修复结果Tab. 6 Repair results of traffic flow fault data of all m e t h o d s时间序号13513613713813914014 1142143144145时间点11:1011:1511 :2011 :2511 :3011 :351 1 :4011:4511 :5011 :5512: 00时间序列法9094928985808379848576空间插值法144829913687110969276100117灰色残差G M模型94951009193888786908286基于统计相关分析93100849193759081979592时空插值法9198969094798883958289第9期王薇,等.基于时空相关性的交通流故障数据修复方法[]浙江大学学报:工学版2017,51(9) :1727 - 1734.1733表7各方法修复结果的误差对比Tab. 7 Error comparison of the repair results of a l l methods 方法M A E R M S E M P A E 时间序列法 5. 27 6.650 06空间插值法17. 9222. 430 21灰色残差G M模型 3.00 3. 4 20 03基于统计相关分析4 184 590 05时空插值法 2.36 2 980 03时间序列法和空间插值法.这3种方法中修复误差最 低的是基于3D形函数的时空插值法;与灰色残差G M模型和基于统计相关分析的方法相比,时空插值 法的均绝对误差分别降低了 21. 33%和43. 54%,均 方根误差分别降低了 12. 87%和35. 08%,平均绝对 值误差率与灰色残差G M模型一致,但比基于统计相 关分析的方法降低了 40%.由此可见,所提出的交通 流故障数据修复算法是可行的,对高速公路交通流故 障数据具有较高的修复能力.5结语本研究综合考虑交通流数据的时空特性,提出 了一种基于3D形函数的时空插值修复方法,较好 地实现了对交通流故障数据的修复.实例验证结果 表明:本研究所提出的修复方法优于其他方法,不 仅降低了修复误差,还使得修复结果更接近实际.这 说明基于3D形函数的时空插值修复模型是一种有 效的数据修复方法,可用于高速公路交通流故障数据的修复.需要说明的是,本研究忽略了实际交通流 数据序列的缺失程度,且暂未考虑高速公路交通流状态的复杂动态变化特性对空间传播的影响,有待 后续研究.参考文献(References):[1]王英会.高速公路交通流异常数据识别及修复方法研究[D].北京:北京交通大学,201 5.W A N G Ying-hui. Research on identification and recovery m e t h o d for abnormal h i g h w a y traffic flow data [D].Beijing:BeijingJiaotongUniversity,2015.[]陆化普,屈闻聪,孙智源.基于S G滤波的交通流故障数据识别与修复算法[].土木工程学报,2015(5)23128.L U H u a-p u,Q U W c n-c o n g,S U N Zhi-yuan. Detection and repair algorithm of traffic erroneous data based on S-G filtering [].China Civil Engineering Journal,2015(5) :23 128.[3] S M I T H B,S C H E R P:R W, C O N K L1N J.Exploring i mputation techniques for missing data in transportation m a n a g e m e n t systems [].Transportation Research R ecor d,2003,1836(1 ):132 - 142.[]姜桂艳.道路交通状态判别技术与应用[M].北京:人民 交通出版社,2004: 9 14.[5] M I N W,W Y N T E'R L. Real-time road traffic predictionwith spatio-temporal correlations [].Transportation Research Part C:E m e r g i n g Technologies,2011,19(4):606 - 616.[]邹海翔,乐阳,李清泉,叶嘉安,等.基于K H g i n g插值的无检测器路段交通数据插补方法[].交通运输工程学报,2011,11(3): 118-126.Z O U Hai-xiang,L E Y a n g,L1 Q i n g-q u a n,Y E J i a-a n,et af Traffic data interpolation m e t h o d of non-dctcction road link based on Kriging interpolation [J]. Journal of Trafficand Transportation Engineering,2011,11(3):118 126.[]王佳璆.时空序列数据分析和建模[M].北京:科学出版社,2012.[]甘健胜,洪伟.基于时空数据的线性组合插值模型及其应用[].福建林学院学报,2006,26():38323.G A N Jian-sheng,H O N G Wei. Linear combination interpolation m o del based on panel data and its application [J]. Journal of Fujian College of Forestry,2006,26(4):318 323.[9]李莎,舒红,董林.基于时空变异函数的K r i g i n g插值及实现[].计算机工程与应用,2011,47(23) :25 26.L1 S h a,S H U H o n g,D O N G Lin. Research and realization of Kriging interpolation based on spatial-temporal variogram [].C o m p u t e r Engineering a n d Applications,201 1,47(3) :25 26.[10]陆化普,孙智源,屈闻聪.基于时空模型的交通流故障数据修正方法[].交通运输工程学报,201 5, 15(6):92 100.L U H u a-p u,S U N Zhi-yuan Q U W c n-cong. Repair m e t h o d of traffic flow malfunction data based on t e mporal-spatial model [J]. Journal of Traffic a nd Transportation Engineering 2015,15(6) :92 100.[11]陆百川,郭桂林,肖汶谦,等.基于多尺度主元分析法的动态交通数据故障诊断与修复[].重庆交通大学学报:自然科学版,2016(1 ): 134 - 137.L U Bai-chuan,G U O Gui-lin,X1A O W e n-q i a n,et a l.Fault diagnosing and modifying of d y n amic traffic data based on M S P C A[].Journal of Chongqing Jiaotong University:Natural Science,2016(01):134 - 137.[12]邹晓芳.城市快速路交通流故障数据修复方法研究[D].北京:北京京交通大学,2014.Z O U Xiao-fang. Research on repair m e t h o d s of urban expressway traffic flow fault data [D]. Beijing:Beijing Jiaotong University,2014.[13]王晓原,吴芳,朴基男.基于粗集理论的交通流丢失数据补齐方法[].交通运输工程学报,2008(5) :91 108.W A N G Xiao-yuan,W U F a n g,P1A O Ji-nan. Filling m e t h o d of missing data for traffic flow based on rough set theory [J]. Journal of Traffic a n d Transportation Engineering,2008 (5):91 108.[14]郭敏,蓝金辉,李娟娟,等.基于灰色残差G M(,N)模型的交通流数据恢复算法[].交通运输系统工程与信息,2012,12(1):42 47.1734浙江大学学报(工学版)第51卷G U O M i n,L A N Jin-hui, LI Juan-juan, ct al. T'rafficflow data recovery algorithm based on gray residualG M (1,N)model [J]. Journal of Transportation Systems Engineering and Information Technology,2012,12() :42 4 7.[15]陈淑燕,王炜,李文勇.实时交通数据的噪声识别和消噪方法JJ].东南大学学报,2006,36(2): 322 325.C H E N Shu-yan, W A N G Wei, LI Wen-yong. Noise recognition and noise reduction of real-time traffic data [J].Journal of Southeatt University,2006,36(2) :322 - 325. [16]LI L. Spatiotcmporal interpolation m e t h o d s in G I S[M ]. Lincoln:The University of Nebraska-Lincoln,2003.[17] LI L, Z H A N G X,H O L T J. B, T I A N J,et a l.Spatio-temporal interpolation methods for airpollution exposure[C]^Proceedings of t he Ninth Symposium on Abstraction,Reformulation and Approximation.[S. l. ] :[s. n. ] , 2011 :75 81.[18] R E V E S Z P Z,LI Y. M L P Q: a linear constraint databasesystem with aggregate operators [C]II Database Engineering and Applications Symposium 1997. IDEAS '97.Proceedings,[s.l.]: I E E E,1997: 132 — 137.[19]尹飞鸿.有限元法基本原理及应用[M].北京:高等教育出版社,2010.[0]尉桂兴.顾及时序平稳性的时空插值方法研究[D].南京:南京师范大学,2014.W E I Gui-xing. A spatio-temporal interpolation m e t h o dbased on the stationarity of time series[D]. Nanjing:Nanjing Normal University,2014.[1]王凯,冯晅,刘财.P e a r s o n相关系数法快慢横波波场分离[J].世界地质,2012,31 (2): 371 376.W A N G Kai, F E N G X u a n,I I U C a t W a v e filed separation of fast-slow shear w a v e s b y Pearson correlationcoefficient m e t h o d [J]. Global Geology,2012,31(2):371 376.[22] S M I T H B, C O N K L I N J. U s e of local lane distributionpatterns to estimate missing data values from trafficmonitoring systems [J]. Transportation Research Record,2002,1811(1) :50 56.[23] D A V S G A,N I H A N N L. U s i n g time-series designsto estimate changes in freeway level of service, despitemissing data [J ]. Transportation Research Part A:General,1984,18(5-6): 431 -438.(上接第1711页)[14]陈晓斌.坎儿其水库土石混合坝沥青砼心墙施工[].新疆水利,2000, 4: 28 31C H E N Xiao-bin. Construction of Kanerqi earth-rockfilld a m with asphatt concrete core [J]. Xinjiang Water Resources,2000,4: 28 31[15]孔宪京,邹德高.旁多水利枢纽大坝筑坝材料试验、有限元静动力分析及抗震安全评价研究[R].大连:大连 理工大学工程抗震研究所,2010.[16]孔宪京,邹德高.新疆下坂地水利枢纽工程拦河坝静力应力变形分析[R].大连:大连理工大学工程抗震研究所,2004.[17]孔宪京,邹德高.长河坝水电站砾石土心墙堆石坝防渗墙受力变形分析理论和方法研究[R].大连:大连理工大学工程抗震研究所,2009.[18]中华人民共和国水利部建设与管理司.水利水电工程混凝土防渗墙施工技术规范:S L174 —2014[S].北京:中国水利水电出版社,2014: 6.[19]郦能惠,米占宽,李国英,等.冶勒水电站超深覆盖层防渗墙应力变形性状的数值分析[J].水利水运工程学报,2004,1 :18 23.LI Neng-hui, M I Z h a n-k u a n,LI Guo-ying, et al N umerical analysis of stress deformation behavior of c oncrete d i a p hragm wall in supper-deep) overburdened layer of Yclc H y d r o p o w e r Station [J]. Hydro-Science and Engineering,2004,1: 18 23.[20] Z O U D G,X U B, K O N G X J,et al Numerical s i m ulation of the seismic response of the Zipingpu concrete face rockfill d a m during the W c n c h u a n earthquake based on a generalized plasticity model [J]. Computers andGeotechnics,2013,4 9 :11 1122.[1]张治军,饶锡保,龚壁卫,等.砂砾石与沥青混凝土接触面力学特性试验研究[J].长江科学院院报,2006,23(2) :38 4 1.Z H A N G Zhi-jun, R A O Xi-bao, G O N G Bi-wei, ct a l.Experimental study on mechanical behaviors of interface between asphalt-concrete and aggregate JJ]. Journal of Yangtze River S c i e n t i f i c Research Institute, 2006,23(2) :38 4 1.[2]傅华,章为民.坝基混凝土防渗墙与泥皮接触面试验研究[C]/|第一届中国水利水电岩土力学与工程学术讨论会.昆明:[s. n.],2006: 485 487.F U H u a,Z h a n g Wei-min. Experimental study on thecontact behavior between concrete cut-off wall in d a mfoundation between the slurry [C]I The f i r s t S y mposium of China WaterPower i n Gcomechanics and Geotechnical Engineering.K u n m i n g:[s. n. ],2006: 485 487.[23]邹德高,孔宪京,徐斌.GEOtcchnical D Y n a m i c Nonlin-carAnalysis — G E O D Y N A使用说明[R].大连:大连 理工大学工程抗震研究所,2008.[24] X U B, Z O U D G,L I U H B. Three-dimensional simulation of the construction process of the Zipingpu concrete face rockfill d a m based on a generalized plasticity model J J]. Computers and Geotechnics,2012, 43: 143 - 154. [5]朱伯芳.有限单元法原理与应用[M].北京:中国水利水电出版社,知识产权出版社,2009: 124 128.[6]傅少君,王曼.振冲碎石粧地基有限元分析的复合模型研究[J].岩土力学,2008, 29(2): 375 380.F U Shao-jun, W A NG M a n.Study on composite m odelfor vibro-rcplaccmcnt stone c o l u m n foundation by F E M[J]. Rock and S o i l Mechanics,2008,29(2)375 —380.。
论文题目:基于模糊故障树的汽车底盘系统故障诊断方法研究The studied of automobile chassis system fault diagnosis method based on the fuzzy fault tree目录摘要 (1)Abstract (1)1 引言 (2)2 模糊故障树分析基本理论 (2)2.1 故障树分析方法 (2)2.2 模糊数 (2)2.3 模糊故障树结构函数 (4)2.4 定性分析 (4)2.5 定量分析 (5)3 底事件的模糊概率重要度 (6)4 模糊故障树分析方法的实例验证 (6)4.1 驱动桥系统的模糊故障树分析 (6)4.1.1 驱动桥系统故障树的建立 (6)4.1.2 驱动桥模糊故障树的定性分析 (7)4.1.3 驱动桥模糊故障树的定量分析 (7)4.1.4 驱动桥底事件的模糊概率重要度分析 (8)4.2 液力自动变速器(AT)系统的模糊故障树分析 (9)4.2.1 液力自动变速器故障树的建立 (9)4.2.2 变速器模糊故障树的定性分析 (10)4.2.3 变速器模糊故障树定量分析 (10)4.2.4 变速器底事件的模糊概率重要度分析 (11)5 结论 (11)参考文献 (12)致谢.................................................... 错误!未定义书签。
基于模糊故障树的汽车底盘系统故障诊断方法研究摘要:由于汽车底盘系统机械结构复杂,使得汽车底盘系统故障具有复杂性、模糊性、不确定性等特点。
本文着重介绍了模糊故障树分析的基本理论,针对汽车底盘系统中的驱动桥故障和自动变速器故障发生概率具有模糊性和不确定性的特点,运用模糊故障树方法绘制出故障系统的故障树,并对它们各个环节发生故障时所遇到的各种模糊信息进行定量的分析。
试验证明,该方法能够使传统故障树同时分析处理随机不确定性和模糊不确定性的故障事件,有效的解决了汽车底盘故障具有复杂性、模糊性、不确定性的难题。
摘要:车辆检测器是交通管理中重要的数据采集工具,但在实际运用过程中,数据丢失问题往往影响其作用的发挥。
本研究旨在建立一个可实用于交通控制中心的车检器缺失数据修补模型,尝试以不同模型来预测并修补车辆检测器缺失的数据,并对比各种模型的修补效果。
文中提出了以arima结合模糊时间序列的交通流量预测方法以及使用arima进行短时间实时修补的方法,并获得了不错的效果。
关键词:交通流量预测;arima;模糊时间序列;车辆检测器
中图分类号:tp274 文献标识码:a 文章编号:2095-1302(2016)06-00-04
0 引言
车辆检测器是交通管理者掌握道路交通运行状况的重要工具。
但是,在实际运用过程中,车辆检测器常因环境、维护、性能等原因发生数据丢失的现象。
车辆检测器数据的丢失使得基于其所产生的控制和决策方案产生偏差甚至失效,无法彰显投资车辆检测器的应用价值。
车检器数据修补算法是辅助提高车检器检测稳定性与准确性的途径之一。
本研究利用时间序列以及模糊时间序列的相关理论,根据交通流运行特征在工作日和假日的差异将车检器数据分成工作日和假日两种模式进行预测分析,使其能够对短时间内缺失的数据进行及时修补。
并对比时间序列以及模糊时间序列两种方式进行数据修复的效果差异。
1 模型建立
数据为西安绕城高速单台车检器2014年全年数据,数据接收频率为每5分钟一次,理论上一天共288条数据记录。
1.1 数据预处理
数据预处理分为如下几项:
(1)首先将数据分为工作日和假日两种模式,再分别以arima、混合模式以及传统平均法进行修补效率的比较。
(2)因车检器数据常发生缺漏和异常值,本研究采用6sigma理论对数据进行离群值判定,即先计算同一模式(工作日、假日模式)下同一时刻流量均值,将平均值正负6倍标准差范围外的流量数据判为异常值。
(3)本研究将进行arima即时动态修补,以t-1时数据来预测t时的流量,持续验证峰值1小时内12条记录并计算绝对平均误差(mape)。
(4)本研究所使用的arima模型由spss18.0建立,模糊时间序列由matlab编写而成。
(5)模型以2/3的真实数据来建立(采用车检器2014年1~9月数据,剩下10~12月数据用来验证模式的准确性)。
1.2 arima的建立
本研究使用spss18.0的arima预测模型,将西安绕城高速车检器2014年1月1日至8月31日的流量数据切分为工作日与假日两种模式,具体研究步骤如下:
(1)利用自相关图(acf)来判断是否为平稳数列。
(2)图 1所示为工作日模式下交通流量的自相关图,由图可见,滞后阶数为5时,才进入置信界内,表示流量数据并非为一个平稳的时间序列,需要对数据进行差分处理。
图 2所示为假日模式下交通流量的自相关图,在其滞后阶数为7时才进入了置信界限内,数据亦需要差分处理。
具体操作如下:
(1)使用spss18.0中的expert modeler选出最佳arima(p,d,q)模型,工作日模式下的最佳arima(p,d,q)模型为arima(0,1,1),假日模式下的最佳模型是arima(1,1,1)。
(2)检查模型的r2与mape值是否能够充分解释变异数,bic值是否最低并且残差是否符合白噪声的假设。
依照统计学的衡量标准,mape值小于20%时为优良的修补模型,而模型的bic值则越小越好;r2表示模型的解释程度,r2值越高则解释变数的能力越高,表1所列为工作日模式的挑选准则,可以看出由expert modeler所得的模型四项准则皆为最优,比较的模型为符合残差接收白噪声假设的模型,其mape值为16.91%(越低越好),是三个模型里最好的,r2=0.938是最高的,代表可解释变数的程度最高,bic值越小表示模型为最佳估计模型,其bic值=4.92为三个模型中最低。
而表2所示为假日模式的挑选准则,同样是由expert modeler挑选出最适模型为最优模型,arima(1,1,1)各个适合度指标皆为最适,也都有符合残差接收白噪声,由此可知,可直接由expert modeler选取arima的最适模型,不需要采用传统的方式将所有模型进行测试。
将建立好的工作日与假日流量arima模型,选择输出一个完整日的流量数据来进行实际验证。
工作日模式下arima预测结果如图3所示。
假日模式下arima预测结果如图4所示。
1.3 结合模糊时间序列的arima模型
首先建立一个将max-min简化的模糊时间序列模型,以车检器数据中9月1日17:00至19:00每5 min流量为例,预测一个小时的流量数据。
示例流量数据表如表3所列。
(3)将时间分为24个子集合(a1、a2、…、a24)并计算各个集合的时间隶属度。
(4)使用加权平均法进行去模糊化计算。
(5)将工作日模式与假日模式下的arima预测值与模糊时间序列的计算结果进行对比。
工作日模式下arima的mape值为16.907%,而工作日模式下混合模型的mape值为13.248%,对比可知混合模型效果较好。
基于差分平稳化方法,本研究先以arima模型使其收敛,这样能够比单使用arima模型的效果好,而假日混合模型的mape值为10.698%,同样优于假日arima模型的17.145%。
可以发现假日模式的改善比工作日模式的改善幅度大,这种现象可以解释为工作日的流量变化较大,为一个双峰m型分布,而假日的流量图形基本为一个单峰分配,变化不剧烈,较符合模糊时间序列的梯度函数形态。
工作日混合模式的函数形态如图5所示。
假日混合模式的函数形态如图6所示。
传统平均法计算即当发生数据缺漏时,使用当前时刻前两条数据的平均值进行修复。
此方法计算简单,但当数据缺失较多时且流量即将到达波峰或波谷时则无法反映出流量变化,仅能输出一个接近平稳的序列。
随机选择数据,集中一天工作日与一天假日作平均法的计算,得到了工作日与假日的平均法mape值,结果如表4所示。
2 模型预测效果对比
未加入数据修正的arima模型预测值如表5所列。
由表 5可以发现,混合模型不管是在工作日流量或者是假日流量都表现的比arima模型效果好,依据衡量标准,mape值小于20% 即为优良的修补模型,arima模型与结合了arima与模糊时间序列的混合模型皆为效果可接受的修补模型,与平均法比较,资料修补的效果都优于现在所使用的方法。
由图可以发现,假日模式的改善比工作日模式的改善幅度大,是因为工作日的流量变化较大,为一个双峰m型分布,而假日的流量图基本为一个单峰分布,变化相对舒缓,较符合模糊时间序列的梯度函数形态。
工作日模式综合比较如图7所示。
假日模式综合比较如图8所示。
3 数据修补方法
3.1 以arima模型进行实时修复
为使模拟情境能够接近现实的缺失情况,本研究以西安绕城高速车检器工作日的早高峰前一个小时与早高峰一小时内的流量数据作为修补范围。
表5利用前5条数据记录模拟真实数据缺失情况,可以得知修补效果在10条记录内为可接受范围,在资料缺失比较数大于10条记录时,其修补效果会大幅度下降。
3.2 以arima模型混合历史数据进行实时修补
实际验证发现,如果以待修补时刻前5条历史数据进行基于arima的实时修补,会在第11条左右(即55 min前后)开始大幅衰退,以工作日的尖峰模拟找出可能的数据修复失效转折点,所得结果如表6所列。
发现数据修复效能转折点集中在10至12条数据左右,本研究利用此特点,尝试使用不同权重加入历史arima的方式来修正arima实时修补的误差。
具体做法为:第一条数据使用0.9×arima实时预测值+0.1×历史数据的arima预测值;第二条数据使用0.8×arima实时预测值+0.2×历史资料的arima预测值。
以此类推,直到第十条数据记录以后直接使用历史数据的arima来进行预测修补,如下式所示:
4 分析与总结
研究以arima(0,1,1)作为一个可接受的工作日流量修补模型,因其mape值小于20%,arima(1,1,1)可以作为一个假日流量修补模型。
研究结合了arima以及模糊时间序列,提出一个新的混合模型,其数据预测效果在工作日流量修补或是假日流量修补中都比arima 和传统平均法要好。
本研究试着使用建构好的arima(0,1,1)工作日模型与使用历史前5条数据提出一个即时数据修补模型,用一个相对简单的方式进行实验测试后,初步发现可以提升只使用了前5条数据的即时修补模型,利用逐步增加权重的方式加入以年历史数据构建完成的arima(0,1,1)工作日模型数据,为一个简单可行的修补方法。
同时,本研究尚有些不尽完善之处:本研究仅以单一车辆检测器来建立模型。
后续研究可考虑以网络或路段来讨论修补问题,也可以考虑建立流量、速度与密度的三大交通流理论要素的修补模型。
5 结语
本研究旨在建立一个可用于交通控制中心的数据修补模型,研究尝试以不同模型来预测并修补车辆检测器缺失数据,并对比各种模型的修补效果,提出了以arima结合模糊时间序列的应用方法以及使用arima进行短时间的实时修补,获得了不错的效果。