基于LIBSVM和时间序列的区域货运量预测研究
- 格式:pdf
- 大小:387.39 KB
- 文档页数:5
基于SSA-LightGBM 的交通流量调查数据趋势预测①徐 磊, 孙朝云, 李 伟, 杨荣新(长安大学 信息工程学院, 西安 710064)通讯作者: 徐 磊, E-mail: *****************摘 要: 为了解决传统模型和机器学习模型对周期时间序列预测效果欠佳的问题, 本文以韩城高速公路交通流量调查数据为数据集, 提出了SSA-LightGBM 交通流量调查数据预测模型. 对韩城高速数据进行当量计算, 然后对当量数据进行奇异谱分解得到周期项和随机项, 对周期项进行信号重建, 利用LightGBM 预测随机项, 最后将预测随机项与周期延拓信号进行叠加得到最终的高速当量预测数据. 同时与XGBoost 和LightGBM 预测结果作对比, SSA-LightGBM 预测结果与真实值最为贴近, 且MAE 、RMSE 和R 2均优于XGBoost 和LightGBM 模型. 该结果对我国高速公路交通调查数据未来的变化趋势预测研究具有很好的指导意义, 可以为我国高速公路的整修和养护提供很好的参考价值.关键词: 奇异谱分析; LightGBM 模型; 机器学习; 高速交通量调查数据; 预测引用格式: 徐磊,孙朝云,李伟,杨荣新.基于SSA-LightGBM 的交通流量调查数据趋势预测.计算机系统应用,2021,30(1):243–249. /1003-3254/7750.htmlTraffic Volume Survey Data Trend Prediction Based on SSA-LightGBMXU Lei, SUN Zhao-Yun, LI Wei, YANG Rong-Xin(School of Information Engineering, Chang’an University, Xi’an 710064, China)Abstract : In order to solve the problem that the traditional model and the machine learning model have poor performance in predicting the periodic time series, this study proposes the SSA-LightGBM prediction model which takes the Hancheng expressway traffic volume survey data as the data set. First, the Passenger Car Unit (PCU) of Hancheng expressway data is calculated. Second, the singular spectral analysis is applied on the PCU data to obtain periodic and random terms, the periodic term is reconstructed, and then the LightGBM is used to predict the random term. Finally, the predicted random term and the periodic extension signal are superimposed to obtain the prediction data of final expressway PCU. At the same time, compared with the prediction results of XGBoost and LightGBM model, the prediction results of SSA-LightGBM are closest to the true values, and MAE , RMSE and R 2 are better. This result has a good guiding significance for the research of the forecast on future change trend of our country’s expressway volume survey data, and provides a good reference value for the renovation and maintenance of our country’s expressways.Key words : Singular Spectrum Analysis (SSA); LightGBM model; machine learning; traffic volume survey station data; prediction计算机系统应用 ISSN 1003-3254, CODEN CSAOBNE-mail: ************.cn Computer Systems & Applications,2021,30(1):243−249 [doi: 10.15888/ki.csa.007750] ©中国科学院软件研究所版权所有.Tel: +86-10-62661041① 基金项目: 陕西省交通运输厅交通科研项目(18-22R); 国家重点研发计划(2018YFB1600202); 高新技术研究培育项目(300102240201)Foundation item: Research Project of Transport Department, Shaanxi Province (18-22R); National Key Research and Development Program of China (2018YFB1600202); Cultivation Project of High Technology Research (300102240201)收稿时间: 2020-06-02; 修改时间: 2020-06-30; 采用时间: 2020-07-10; csa 在线出版时间: 2020-12-31随着国民经济的发展, 我国机动车数量快速增长,道路拥堵时常发生, 高速公路作为我国公路的楷模, 其服务水平比一般的道路更好. 交通流量调(交调)数据是研究高速公路通行能力的重要参考指标, 为了提高高速公路的服务水平, 对高速公路进行更好的整修和养护, 亟需加强对交调数据的预测研究.预测研究的关键在于预测模型的建立, 提高预测结果精准度的重要方法便是选择合适有效的预测模型.序列预测通常分为时间序列预测和多元回归预测, 目前在国内外研究中, 大多是通过传统的神经网络方法对序列进行预测. 例如, Zhou等人针对传统数学统计方法的局限性等问题建立BP神经网络预测模型, 通过将BP算法与指数平滑和线性回归方法进行比较, 最后证明了BP算法预测结果能为企业制定库存计划提供更好的建议[1]. 成云等人针对现阶段城市道路交通流预测精度不高的局限性, 提出了一种基于差分自回归滑动平均和小波神经网络组合模型的预测方法来进行交通流预测, 最后证明了组合模型可以提高交通流预测精度[2]. Zhang等人为了更准确的预测交通流量, 实现交通控制和交通拥堵管理, 提出了一种基于XGboost 和LightGBM算法的组合预测模型, 实验结果表明组合模型比单个模型有更高的预测精度[3]. Wu等人针对2008–2018年云南省货运数据及其影响因素建立了灰色神经网络模型, 对云南的货运量进行了预测, 并将其与BP神经网络预测结果进行比较最后证明了灰色神经网络具有更好的预测效果[4,5]. Li等人考虑到植物蒸腾量对温室自动灌溉具有重要的作用, 在2020年建立了随机森林回归模型, 通过整合植物和环境参数建立植物蒸腾量预测模型, 该研究为温室种植蔬菜高效生产和智能灌溉提供了科学参考, 为节约水资源也提供了一种有效途径[6].上述方法中无论是采用单纯的数学模型还是采用机器学习模型对长期的周期性比较强的数据均不能实现精准预测, 只能粗略的显示数据的大致走向, 局部详细的信息表现较差, 因此本文考虑到高速公路交调数据具有很强的周期性等特点提出了基于SSA-LightGBM 的预测模型.1 研究数据选取及算法流程本文针对陕西省高速公路展开研究, 对韩城高速公路进行实地考察调研, 以韩城高速7~8月1344条交调数据进行研究.1.1 数据介绍表1为韩城高速交调数据表(前5行数据). 从表中可以看出交调数据一共由观察日期、小时、观测站名称、观测里程、中小客流量、大客车流量、小货车流量、中货车流量、大货车流量、特大货车流量、集装箱流量组成.表1 韩城高速交调数据表观测日期小时观测站名称观察里程中小客车流量大客车流量小货车流量中货车流量大货车流量特大货车流量集装箱流量2 019.07.011韩城18710514622 019.07.012韩城18371114512 019.07.013韩城18411412702 019.07.014韩城18390100402 019.07.015韩城1856020000为了使不同交通工具组成的交通流能够在同样的尺度下进行分析, 使其具有可比性, 在分析计算通行能力和服务水平时, 需要将各类车辆交通量换算成标准机动车当量, 需要用到车辆换算系数, 如表2所示, 这里只考虑汽车, 将其分为3档: 小型车、中型车、大型车, 其中小型车又分为中小客车和小型货车, 折算系数为1; 中型车分为大客车和中型货车, 折算系数为1.5;大型车分为大型货车、特大货车和集装箱车, 大型货车折算系数为3, 特大货车和集装箱车折算系数为4.表2 折算系数参考表车型一级分类二级分类参考折算系数汽车小型车中小客车1小型货车1中型车大客车 1.5中型货车 1.5大型车大型货车3特大货车4集装箱车4计算机系统应用2021 年 第 30 卷 第 1 期1.2 数据展示通过对韩城高速交调数据进行换算, 如图1对机动车当量进行可视化, 展示了2019年7月1日–2019年8月25日韩城高速公路交调数据当量变化. 从图中可以清晰的看出除了少数天呈现极小或者极大的情况,其他天数整体呈现周期状态. 当量=小型车×1+中型车×1.5+大型货车×3+特大货车×4+集装箱车×4.19-07-0119-07-0219-07-0419-07-0519-07-0719-07-0819-07-1019-07-1219-07-1319-07-1519-07-1619-07-1819-07-2019-07-2119-07-2319-07-2419-07-2619-07-2719-07-2919-07-3119-08-0119-08-0319-08-0419-08-0619-08-0819-08-0919-08-1119-08-1219-08-1419-08-1519-08-1719-08-1919-08-2019-08-2219-08-2319-08-25图1 韩城高速交调当量变化图1.3 算法流程图本文的算法流程图如图2所示对原始数据进行整合, 计算出高速公路交调数据机动车当量, 然后对原始数据利用奇异普分解方法(SSA)进行数据分解, 得到周期信号和随机信号, 再利用机器学习模型(LightGBM)对随机项进行预测, 将预测结果和周期延伸信号结合得到最终的预测结果. 另一方面利用XGBoost 、LightGBM 等单独的机器学习方法对当量数据进行预测, 最后将预测结果同SSA-LightGBM 方法得到的结果进行对比分析, 比较不同模型的预测效果.图2 算法流程图2 SSA-LightGBM 预测模型原理2.1 奇异谱分解(SSA)奇异谱分解(Singular Spectrum Analysis, SSA)是通过分解原序列中的时间主分量, 得到不同层次上的分量序列, 然后将分解出来的低频视为序列变化的长期趋势, 最终得到数据序列的最佳谐波个数, 以此确定时间序列的周期信号.本文将奇异谱分解分为4个步骤, 分别是:Y (T )=((y 1),···,(y T ))X 1,···Xn ,(Xi =(y i ,···,y i +m −1),n =T −m +1)X =[X 1,···,Xn ]=(x i j )n ,m i ,j =1=y 1y 2···y m y 2y 3···y m +1......···...y n y n +1···y T(1)嵌入. 选择适当的窗口长度m , 将一维时间序列转换为多维时间序列: , 得到轨迹矩阵, 即:.(X T X )νi =λi νi σi =√λi µi =1σiX νi σµ(2)奇异值分解. 通过对矩阵SVD 分解, 得到XX T的L 个特征值. 具体步骤是: 将X 转置得到X T , 然后利用XX T 得到方阵, 再利用方阵的性质求得矩阵的特征值[7–9], 即利用, 求得, .即是奇异值, 是奇异向量.σ1,σ2,···,σN σi /N∑k =1σk =p (i )(3)分组. 假设有N 个奇异值, 定义第i个奇异值的方差贡献率为, 由大到小选择前M 个奇异值, 使其方差贡献率之和大于一定阈值.(4)确定最佳谐波个数. 利用前M 个奇异值的方差贡献率之和大于一定阈值(0.85)来确定最佳谐波个数M . 当P (i )≥0.85时, 我们认为此时的i 即为最佳的谐波个数, 即M =i . 然后利用三角函数的性质将数据构造成周期函数.2.2 周期项和随机项的确定{y t ,t =1,2,···,N }y t =p t +x t p t x t p t 设为时间序列, 若将其看作由周期项和随机项组成, 可以用组合模式描述, 其中为周期项, 为随机项. 的表达式如下:a k =(2/N )t =1y t cos(2πkt /N ),k =0,1,···,M b k =(2/N )N ∑t =1y t sin(2πkt /N ),k =0,1,···,M其中, M 为谐波个数, , 2.3 LightGBM 模型LightGBM 是一种梯度Boosting 框架, 使用基于决2021 年 第 30 卷 第 1 期计算机系统应用策树的学习算法, 具有快速、高效、支持并行化学习、可以处理大规模数据等优点.(1)梯度提升.梯度提升是在不断的迭代过程中, 对模型不停的增加子模型, 同时保证最终的损失函数值在不断的下降. GBDT是一种梯度提升决策树, 是由多个决策树组成, 利用最速下降的近似方法, 即利用损失函数的负梯度在当前模型的值作为我们回归提升树算法的残差的近似值, 来拟合一个回归树[10–12].假设我们每一个单独的子模型为f i(x), 我们的复合模型为:损失函数为L[F m(x),Y], 每一次对模型中添加新的子模型后, 使得我们的损失函数不断朝着0发展.(2) LightGBM原理LightGBM是在传统的梯度提升树(GBDT)上使用直方图优化(Histogram)算法, 先把连续的特征值离散化成k个整数, 同时构造一个宽度为k的直方图. 在遍历数据的时候, 根据离散化后的值作为索引在直方图中累积统计量, 当遍历一次数据后, 直方图累积了需要的统计量, 然后根据直方图的离散值, 遍历寻找最优的分割点. 同时使用带深度限制的Leaf-wise的叶子生长策略, 经过一次数据可以同时分裂同一层的叶子, 容易进行多线程优化, 也好控制模型复杂度, 不容易过拟合[13–15]. 表3给出LightGBM模型主要参数含义.表3 LightGBM模型参数含义模型参数含义learning_rate学习率num_leaves叶子数量, 默认为31max_bin feature将存入的bin的最大数量n_estimators迭代次数bagging_fraction每次迭代时用的数据比例objective模型所选回归任务feature_fraction每次迭代中随机选择一定比例的参数来建树3 SSA-LightGBM模型预测分析3.1 对数据进行奇异谱分解此处将2019年的7月1日到2019年8月25日的1344条数据分为两部分, 利用前70%的941条数据预测后30%的403条数据并将其与对应的真实数据进行对比. 对前部分数据进行奇异谱分析时选取的窗口长度为200, 可以得到方差贡献率图(见图3). 从图中可以看出, 当i≥56时, P(i)≥85%, 满足本文的数据处理要求, 即当显著谐波个数M为56时, 对应个三角函数信号能表征序列的最主要趋势.11325374961738597109121133145157169181193谐波个数i (个)图3 方差贡献率图然后, 可构造周期函数, 得到图4. 周期函数对应的公式为:a k=(2/N)N∑t=1y t cos(2πkt/N),k= 0,1,···,M b k=(2/N)N∑t=1y t sin(2πkt/N),k=0,1,···,M式中, M为谐波个数56,,7-17-27-47-57-77-87-17-117-137-147-167-177-197-217-227-247-257-277-287-37-318-28-38-58-78-8当量周期函数图4 周期函数对比图x t=y t−p t表4详细介绍了周期函数Pt中每一个参数的具体含义和取值. 根据周期函数的性质, 利用周期不变性对周期函数进行延伸得到2019年8月9日到8月25日周期函数延拓图(图5). 然后由交调当量原始数据减去周期项(), 可得到图6所示的随机项.表4 周期函数各参数含义参数意义P t t时刻周期函数对应的函数值, 即t时刻对应的周期交调当量值a0周期函数初始值, 此处为588.737 4a k/b k不同谐波个数对应的正余弦函数的系数y t t时刻的交调当量数值M周期函数的谐波个数, 其值等于方差贡献率大于0.85时刻的i值此处为56N当量序列的长度, 此处为1344计算机系统应用2021 年 第 30 卷 第 1 期本文采用LightGBM 机器学习方法对交调当量随机项数据进行预测, 表5为LightGBM 模型常用参数的取值, 其他参数均采用默认. 图7中曲实线为交调当量随机项前941条数据, 后面虚线为使用LightGBM 预测的403条随机当量数据.4 预测效果评价我们将SSA-LightGBM 模型得到的2019年8月9日到8月25日周期函数延拓结果和随机项预测值相叠加得到最终交调当量预测值(见图8, 红色曲线). 为了验证SSA-LightGBM 模型的预测效果, 本文还分别用XGBoost 和LightGBM 机器学习方法对数据进行了预测(利用2019年7月1日到8月8日的数据预测2019年8月9日到8月25日的数据). 由于这2种模型为单纯机器学习预测方法, 且不是本文的研究对象, 故此处不详细描述各种方法的预测过程. 将不同预测模型得到的预测结果与韩城交调当量的原数据进行对比, 得到图8. 图中黑色曲线为韩城高速交调数据的原数据, 红色曲线为SSA-LightGBM 模型的预测结果, XGBoost 和LightGBM 模型的预测结果分别对应蓝色和绿色虚线.从图中可以发现, 单独使用XGBoost 和LightGBM 模型得到的曲线整趋势能表示原始数据, 但是整体均低于原始数据不能完整的表示当量的局部特征. 只有橙色虚线SSA-LightGBM 模型预测的结果能够实现高精度稳定预测2019年8月9日到8月25日交调当量变化趋势.另外, 本文还采用常用的平均绝对值误差(MAE )、均方根误差(RMSE )和相关系数(R 2)分析评价了不同模型预测结果的精度(表6), 各指标的公式、含义及评价标准见表7.从表中可以发现本文的模型MAE 和RMSE 均低于XGBoost 和LightGBM 模型说明模型的稳定性和平均误差优于单独的机器学习模型, R 2大于另外两个模型说明预测效果好相关性强.07-0107-0207-0407-0607-0707-0907-1107-1207-1407-1607-1807-1907-2107-2307-2407-2607-2807-3007-3108-0208-0408-0508-0708-0908-1108-1208-1408-1608-1708-1908-2108-2208-24周期函数周期延伸图5 周期函数延拓图时间2019-07-012019-07-022019-07-032019-07-042019-07-052019-07-062019-07-072019-07-082019-07-102019-07-112019-07-122019-07-132019-07-142019-07-152019-07-162019-07-172019-07-192019-07-202019-07-212019-07-222019-07-232019-07-242019-07-252019-07-262019-07-282019-07-292019-07-312019-07-302019-08-022019-08-012019-08-032019-08-042019-08-062019-08-072019-08-08图6 交调当量随机项表5 LightGBM 模型参数取值模型参数learning_ratenum_leavesmax_>binn_estimatorsbagging_fractionobjective feature_fraction取值0.23507000.9regression0.252021 年 第 30 卷 第 1 期计算机系统应用019-07-01019-07-02019-07-04019-07-05019-07-07019-07-08019-07-10019-07-12019-07-13019-07-15019-07-16019-07-18019-07-20019-07-21019-07-23019-07-24019-07-26019-07-27019-07-29019-07-31019-08-01019-08-03019-08-04019-08-06019-08-08019-08-09019-08-11019-08-12019-08-14019-08-15019-08-17019-08-19019-08-20019-08-22019-08-23019-08-25随机项LightGBM 预测图7 随机项预测结果时间2019-08-092019-08-092019-08-102019-08-102019-08-112019-08-112019-08-112019-08-122019-08-122019-08-132019-08-132019-08-142019-08-142019-08-152019-08-152019-08-162019-08-162019-08-162019-08-172019-08-172019-08-182019-08-182019-08-192019-08-192019-08-202019-08-202019-08-212019-08-212019-08-222019-08-222019-08-222019-08-232019-08-232019-08-242019-08-242019-08-252019-08-25原始数据SSA-LightGBM XGBoostLightGBM图8 不同模型预测结果对比图表6 各模型评价指数评价指标/模型SSA-LightGBMXGBoost LightGBM MAE 49.4981.068 5122.456 8RMSE60.2599.078 0143.178 4R 20.887 50.695 80.364 7表7 评价指标模型评价指标公式意义MAE(平均绝对误差)MAE =1n n∑i =1|x i −x p |计算值与真实值之间的平均绝对误差, MAE 越接近0, 模型越准确RMSE (均方根误差)RMS E =1n n ∑i =1(x i −x p )2计算值与真实值之间的均方根误差,RMSE 越接近0,模型越准确R 2(线性相关系数)R 2=1−RS S TS S =1−n ∑i(x i −x p )2n∑i(x i −−x i )2因变量与自变量之间的线性相关系数, R 2越接近1,模型越准确综上, 无论是直观的曲线对比(图8), 还是数学统计方法(表6), 均证明SSA-LightGBM 模型可以高精度、高稳定性地预测2019年8月韩城高速交调数据当量变化趋势. 我们可以使用该模型对全国的高速公路交调数据进行预测, 这对我国高速公路更好的休整和养护以及服务水平的提升具有重要的参考价值.5 结论由于传统的时间序列预测模型和单独的机器学习模型对周期性比较强的时间序列预测存在一定弊端,本文采用SSA-LightGBM 模型进行预测, 以韩城高速2019年7月到8月两个月1344条交调数据为例, 以前70%的数据作为模型的训练集, 以后30%的数据作为验证集. 将结果与单纯的机器学习模型XGBoost 和LightGBM 模型进行对比, 发现本文提出的模型预测结果更接近真实值, 同时该模型的MAE 、R 2和RMSE 均优于其他两个模型, 表明本文的模型可以很好地预测韩城高速交调当量数据, 这对该地区高速公路的整修扩建、养护具有一定的指导意义.计算机系统应用2021 年 第 30 卷 第 1 期参考文献Zhou H, Ding DY, Li YL, et al. Research on inventory demand forecast based on BP neural network. Information Technology, 2016, 40(11): 38–41.1成云, 成孝刚, 谈苗苗, 等. 基于ARIMA和小波神经网络组合模型的交通流预测. 计算机技术与发展, 2017, 27(1): 169–172.2Zhang M, Fei X, Liu ZH. Short-term traffic flow prediction based on combination model of XGboost-LightGBM. Proceedings of 2018 International Conference on Sensor Networks and Signal Processing. Xi’an, China. 2018. 322–327. 3Wu RL, Xu WH, Shen WZ. Research on forecast model of freight in Yunnan Province based on gray neural network. Logistics Sci-Tech, 2019, 42(8): 13–16, 19.4Yang ZY. Rural logistics demand forecast based on gray neural network model. Proceedings of 2018 4th World Conference on Control, Electronics and Computer Engineering. Jinan, China. 2018. 322–327.5Li L, Chen SW, Yang CF, et al. Prediction of plant transpiration from environmental parameters and relative leaf area index using the random forest regression algorithm. Journal of Cleaner Production, 2020, 261: 121136. [doi: 10.1016/j.jclepro.2020.121136]6张清亮. 基于奇异值分解与深度递归神经网络的齿轮剩余寿命预测方法研究[硕士学位论文]. 重庆: 重庆大学, 2018. 7Ibrahim SJA, Thangamani M. Enhanced singular value 8decomposition for prediction of drugs and diseases with hepatocellular carcinoma based on multi-source bat algorithm based random walk. Measurement, 2019, 141: 176–183. [doi: 10.1016/j.measurement.2019.02.056]Montesinos-López OA, Montesinos-López A, Crossa J, et al.A singular value decomposition Bayesian multiple-trait andmultiple-environment genomic model. Heredity, 2019, 122(4): 381–401. [doi: 10.1038/s41437-018-0109-7]9Zhang SH, Dong XG, Xing Y, et al. Analysis of influencing factors of transmission line loss based on GBDT algorithm.Proceedings of 2019 International Conference on Communications, Information System and Computer Engineering. Haikou, China. 2019. 179–182.10张潇, 韦增欣, 杨天山. GBDT组合模型在股票预测中的应用. 海南师范大学学报(自然科学版), 2018, 31(1): 73–80. 11余登武, 罗永平. 基于GBDT-Ridge的短期电力负荷预测.新型工业化, 2019, 9(6): 23–26, 33.12Zhang J, Mucs D, Norinder U, et al. LightGBM: An effective and scalable algorithm for prediction of chemical toxicity—Application to the Tox21 and mutagenicity data sets. Journal of Chemical Information and Modeling, 2019, 59(10): 4150–4158. [doi: 10.1021/acs.jcim.9b00633]13叶志宇, 冯爱民, 高航. 基于深度LightGBM集成学习模型的谷歌商店顾客购买力预测. 计算机应用, 2019, 39(12): 3434–3439.14张振, 曾献辉. 基于CNN-LightGBM模型的高速公路交通量预测. 信息技术与网络安全, 2020, 39(2): 34–39.152021 年 第 30 卷 第 1 期计算机系统应用。
支持向量机算法在交通领域的应用案例分析随着城市化进程的不断加快,交通问题日益突出。
如何高效地管理和优化交通系统成为了城市规划者和交通专家面临的重要挑战。
在这个背景下,支持向量机(Support Vector Machine,SVM)算法作为一种强大的机器学习工具,被广泛应用于交通领域的数据分析和决策支持中。
一、交通流量预测交通流量预测是交通领域中的一个重要问题,对于交通规划和交通管理具有重要意义。
传统的方法往往依赖于历史数据的统计分析,但是这种方法往往无法准确地预测未来的交通流量。
而支持向量机算法则可以通过对历史数据的学习,建立一个高效的预测模型。
以某城市的交通流量预测为例,我们可以收集到该城市不同道路的历史交通流量数据,包括每天的时间段和道路的车流量。
通过将这些数据输入到支持向量机算法中,我们可以训练一个模型,来预测未来的交通流量。
通过对比预测结果和实际数据,我们可以评估模型的准确性,并对交通管理进行优化。
二、交通事故预测交通事故是交通领域中的一个严重问题,对于保障交通安全和减少交通事故具有重要意义。
支持向量机算法在交通事故预测中的应用,可以帮助交通管理者预测交通事故的发生概率,并采取相应的措施来减少交通事故的发生。
以某高速公路的交通事故预测为例,我们可以收集到该高速公路的历史交通数据,包括每天的时间段、天气状况、车辆类型等信息,以及交通事故的发生情况。
通过将这些数据输入到支持向量机算法中,我们可以训练一个模型,来预测未来交通事故的发生概率。
通过对预测结果的分析,我们可以确定高发事故的时间段和地点,并采取相应的交通管理措施,如增加巡逻警力、改善路况等,以减少交通事故的发生。
三、交通拥堵预测交通拥堵是城市交通中的一个普遍问题,给人们的出行带来了极大的不便。
支持向量机算法在交通拥堵预测中的应用,可以帮助交通管理者预测交通拥堵的发生概率,并采取相应的措施来减少交通拥堵。
以某城市的交通拥堵预测为例,我们可以收集到该城市不同道路的历史交通数据,包括道路的通行速度、车辆密度等信息,以及交通拥堵的发生情况。
公路运输管理中的运输数据分析与模型研究数据是当今时代的核心资源之一,各行各业都在运用数据来指导决策、优化业务流程。
在公路运输管理领域,通过对运输数据进行精确的分析和建模,可以帮助管理者更好地制定策略、提高运输效率。
本文将探讨公路运输管理中的运输数据分析与模型研究。
一、运输数据分析公路运输过程中产生的数据主要包括货物运输量、运输时间、运输成本等。
通过对这些数据进行分析,可以了解运输情况、发现问题并制定相应的解决方案。
1.货物运输量分析货物运输量是一个重要的指标,通过对货物运输量的分析,可以评估运输需求和供应情况。
运输管理者可以根据货物运输量的变化,合理调配运力资源,提前做好准备,以满足不同时间段的运输需求。
2.运输时间分析运输时间是另一个关键指标,它反映了货物在运输过程中所需的时间。
通过对运输时间的分析,可以评估运输效率和服务质量。
如果发现运输时间较长或不稳定,管理者可以通过优化线路、调整运输模式等方式来提高运输效率。
3.运输成本分析运输成本是公路运输管理中需要重点考虑的因素之一。
通过对运输成本的分析,可以评估不同运输模式的经济效益,并找到成本支出的主要来源。
在实际操作中,管理者可以通过改进运输流程、降低成本项等方式来控制运输成本。
二、运输模型研究除了对运输数据进行分析外,还可以利用运输模型来预测、优化运输过程。
运输模型是基于数据分析的基础上建立起来的,它可以帮助管理者做出更加科学、合理的决策。
1.货物运输预测模型货物运输预测模型可以根据历史数据和相关影响因素,预测未来一段时间内的货物运输情况。
通过这个模型,管理者可以提前安排合适的运力资源,减少运输中的拥堵和滞留现象,提高货物的及时性和准确性。
2.运输路径优化模型运输路径优化模型可以通过对各种因素进行量化分析,找到最优的运输路径。
在实际操作中,管理者可以考虑路况、距离、运输成本等因素,利用运输路径优化模型来选择合适的路径,以提高运输效率和节约成本。
基于深度学习的交通流量预测与可视化方法研究近年来,随着城市交通的不断拥堵,交通流量预测与管理变得越来越重要。
为了解决这一问题,基于深度学习的交通流量预测与可视化方法逐渐成为研究的热点。
深度学习是一种机器学习的方法,通过建立多层神经网络来模拟人脑的学习过程。
它的出现为交通流量预测与可视化带来了新的机会和挑战。
传统的交通流量预测方法主要基于统计学模型,如ARIMA模型、SARIMA模型等,但这些模型往往无法应对复杂的交通流量变化模式。
而基于深度学习的方法可以自动地学习和提取交通数据中的复杂特征,从而更准确地预测交通流量。
基于深度学习的交通流量预测方法主要包括以下几个步骤。
首先,收集并清洗交通数据,包括交通流量、车速、路况等。
然后,构建深度学习模型,如循环神经网络(RNN)、长短期记忆网络(LSTM)等。
这些模型可以自动地学习交通数据中的时序依赖关系和非线性特征,从而更好地预测未来的交通流量。
最后,通过可视化技术将预测结果呈现给用户,帮助他们更好地理解和分析交通状况。
与传统的交通流量预测方法相比,基于深度学习的方法具有以下几个优势。
首先,它可以自动地学习和提取交通数据中的复杂特征,无需手工设计特征。
其次,它可以处理大规模的交通数据,并且具有较好的扩展性和泛化能力。
此外,基于深度学习的方法还可以结合其他数据源,如天气数据、社交媒体数据等,提高交通流量预测的准确性。
然而,基于深度学习的交通流量预测方法也存在一些挑战。
首先,深度学习模型需要大量的训练数据才能达到较好的效果。
其次,模型的训练和调优过程较为复杂,需要一定的专业知识和经验。
此外,深度学习模型的运行时间较长,不适用于实时交通流量预测。
综上所述,基于深度学习的交通流量预测与可视化方法在解决城市交通拥堵问题上具有重要的应用价值。
随着深度学习技术的不断发展和完善,相信这一方法在交通领域的应用将会越来越广泛。
交通量预测的方法
交通量预测是指利用历史交通数据、相关环境因素和算法模型来预测未来某一时段的交通流量水平。
以下是一些常用的交通量预测方法:
1. 统计方法:利用历史交通数据进行统计分析,如时间序列分析、回归分析等。
这些方法通常假设未来交通流量与过去的交通流量存在一定的关联性。
2. 基于模型的方法:通过建立数学或统计模型来预测交通量,常用的模型包括传统的线性模型(如线性回归模型)和非线性模型(如支持向量机、神经网络等)。
3. 基于时空关系的方法:考虑空间和时间上的相关性,如基于地理位置和交通网络拓扑结构的影响因素,利用相邻区域或路段的交通数据来预测目标区域或路段的交通量。
4. 基于机器学习和深度学习的方法:利用大量的历史交通数据进行训练,通过学习数据之间的特征和模式来预测未来交通量。
常用的机器学习方法包括决策树、随机森林等,深度学习方法主要是指神经网络模型。
5. 基于传感器数据的方法:通过各种交通传感器(如交通摄像头、车载传感器等)获取实时交通数据,并利用这些数据进行交通量预测。
这种方法通常比较准确,但对数据采集设备要求较高。
综合使用上述方法,可以提高交通量预测的准确性和可靠性。
不同的方法适用于不同的交通场景和数据特点,需要根据具体情况选择合适的方法。
libSVM的使用文档11. 程序介绍和环境设置windows下的libsvm是在命令行运行的Console Program。
所以其运行都是在windows的命令行提示符窗口运行(运行,输入cmd)。
运行主要用到的程序,由如下内容组成:libsvm-2.9/windows/文件夹中的:svm-train.exesvm-predict.exesvm-scale.exelibsvm-2.9/windows/文件夹中的:checkdata.pysubset.pyeasy.pygrid.py另外有:svm-toy.exe,我暂时知道的是用于演示svm分类。
其中的load按钮的功能,是否能直接载入数据并进行分类还不清楚,尝试没有成功;python文件夹及其中的svmc.pyd,暂时不清楚功能。
因为程序运行要用到python脚本用来寻找参数,使用gnuplot来绘制图形。
所以,需要安装python和Gnuplot。
(Python v3.1 Final可从此下载:/detail/33/320958.shtml)(gnuplot可从其官网下载:)为了方便,将gnuplot的bin、libsvm-2.9/windows/加入到系统的path中,如下:gnuplot.JPGlibsvm.JPG这样,可以方便的从命令行的任何位置调用gnuplot和libsvm的可执行程序,如下调用svm-train.exe:pathtest.JPG出现svm-train程序中的帮助提示,说明path配置成功。
至此,libsvm运行的环境配置完成。
下面将通过实例讲解如何使用libsvm进行分类。
2. 使用libsvm进行分类预测我们所使用的数据为UCI的iris数据集,将其类别标识换为1、2、3。
然后,取3/5作为训练样本,2/5作为测试样本。
使用论坛中“将UCI数据转变为LIBSVM使用数据格式的程序”一文将其转换为libsvm所用格式,如下:训练文件tra_iris.txt1 1:5.4 2:3.4 3:1.7 4:0.21 1:5.1 2:3.7 3:1.5 4:0.41 1:4.6 2:3.6 3:1 4:0.21 1:5.1 2:3.3 3:1.7 4:0.51 1:4.8 2:3.4 3:1.9 4:0.2……2 1:5.9 2:3.2 3:4.8 4:1.82 1:6.1 2:2.8 3:4 4:1.32 1:6.3 2:2.5 3:4.9 4:1.52 1:6.1 2:2.8 3:4.7 4:1.22 1:6.4 2:2.9 3:4.3 4:1.3……3 1:6.9 2:3.2 3:5.7 4:2.33 1:5.6 2:2.8 3:4.9 4:23 1:7.7 2:2.8 3:6.7 4:23 1:6.3 2:2.7 3:4.9 4:1.83 1:6.7 2:3.3 3:5.7 4:2.13 1:7.2 2:3.2 3:6 4:1.8……测试文件tes_iris.txt1 1:5.1 2:3.5 3:1.4 4:0.21 1:4.9 2:3 3:1.4 4:0.21 1:4.7 2:3.2 3:1.3 4:0.21 1:4.6 2:3.1 3:1.5 4:0.21 1:5 2:3.6 3:1.4 4:0.21 1:5.4 2:3.9 3:1.7 4:0.4……2 1:7 2:3.2 3:4.7 4:1.42 1:6.4 2:3.2 3:4.5 4:1.52 1:6.9 2:3.1 3:4.9 4:1.52 1:5.5 2:2.3 3:4 4:1.32 1:6.5 2:2.8 3:4.6 4:1.5……3 1:6.3 2:3.3 3:6 4:2.53 1:5.8 2:2.7 3:5.1 4:1.93 1:7.1 2:3 3:5.9 4:2.13 1:6.3 2:2.9 3:5.6 4:1.83 1:6.5 2:3 3:5.8 4:2.2……libsvm的参数选择一直是令人头痛的问题。
几类运量预测方法优缺点比较运量预测是指通过对过去的数据进行分析和建模,来预测未来一段时间内的运量变化趋势。
在现代交通运输管理和规划中,准确的运量预测是非常重要的,可以为决策者提供依据,帮助他们做出合理的调度和规划安排。
下面将介绍几种常见的运量预测方法的优缺点比较。
1.简单模型法简单模型法是指利用历史数据中的平均值或者移动平均值等简单统计方法进行预测。
这类方法计算简单,易于理解和操作,适用于数据较为稳定的情况。
然而,简单模型法忽略了数据的非线性、周期性和季节性等特征,无法准确地捕捉到数据的变化趋势,因此预测结果的准确性较低。
2.时间序列分析法时间序列分析法是根据历史数据中的趋势、季节性和随机性等特征,建立相应的数学模型,来预测未来的运量变化。
这类方法考虑了数据的时间依赖关系,可以较好地反映运量的变化趋势,并具有较高的精度。
然而,时间序列分析法对数据的平稳性和线性关系有一定要求,如果数据存在较强的非线性或者不平稳性,预测结果可能会出现偏差。
3.人工神经网络法人工神经网络法是一种模仿人脑神经元工作机制的建模方法,通过输入-处理-输出的过程对数据进行预测。
这类方法可以自动学习数据中的非线性和复杂关系,适用于各种类型数据的预测,具有较高的灵活性和准确性。
然而,人工神经网络法通常需要大量的样本数据进行训练,并且模型结构和参数设置比较复杂,需要专业的知识和技能。
4.支持向量机法支持向量机法是一种基于统计学习理论的模型方法,通过构建一个最优的超平面来进行数据分类和回归分析。
这类方法可以有效地处理高维数据和非线性问题,对数据分布的要求较低,具有较高的鲁棒性和泛化能力。
然而,支持向量机法需要选择合适的核函数和调整相应的参数,对于大规模数据的训练速度较慢。
总的来说,不同的运量预测方法各有优缺点,适用于不同的预测场景。
在实际应用中,可以根据数据的特点和需求的准确度要求选择适当的预测方法,或者结合多种方法进行综合预测,以提高预测准确性和稳定性。
1/flydreamGG/archive/2009/08.aspx/flydreamGG/archive/2009/08.aspxLibSVM学习(一)——初识LibSVM 收藏LibSVM是台湾林智仁(Chih-Jen Lin) 教授2001年开发的一套支持向量机的库,这套库运算速度还是挺快的,可以很方便的对数据做分类或回归。
由于libSVM程序小,运用灵活,输入参数少,并且是开源的,易于扩展,因此成为目前国内应用最多的SVM的库。
这套库可以从.tw/~cjlin/免费获得,目前已经发展到2.89版。
下载.zip格式的版本,解压后可以看到,主要有5个文件夹和一些c++源码文件。
Java ——主要是应用于java平台;Python ——是用来参数优选的工具,稍后介绍;svm-toy ——一个可视化的工具,用来展示训练数据和分类界面,里面是源码,其编译后的程序在windows文件夹下;tools ——主要包含四个python文件,用来数据集抽样(subset),参数优选(grid),集成测试(easy), 数据检查(checkdata);windows ——包含libSVM四个exe程序包,我们所用的库就是他们,里面还有个heart_scale,是一个样本文件,可以用记事本打开,用来测试用的。
其他.h和.cpp文件都是程序的源码,可以编译出相应的.exe文件。
其中,最重要的是svm.h和svm.cpp文件,svm-predict.c、svm-scale.c和svm-train.c(还有一个svm-toy.c在svm-toy文件夹中)都是调用的这个文件中的接口函数,编译后就是windows下相应的四个exe程序。
另外,里面的README 跟FAQ 也是很好的文件,对于初学者如果E文过得去,可以看一下。
下面以svm-train为例,简单的介绍下,怎么编译:(这步很简单,也没必要,对于仅仅使用libsvm库的人来说,windows下的4个exe包已经足够了,之所以加这步,是为了那些做深入研究的人,可以按照自己的思路改变一下svm.cpp,然后编译验证)我用的是VC 6.0,新建一个控制台(win32 console application)程序,程序名叫svm-train(这个可以随意),点击OK后,选择empty。
基于LSTM的船舶航迹预测模型随着全球贸易和航运的快速发展,船舶航迹预测成为了一个重要的研究课题。
准确预测船舶航迹可以帮助提高航运安全、减少燃油消耗、优化航线规划等。
近年来,深度学习技术的发展为船舶航迹预测提供了新的解决方案。
本文基于长短期记忆网络(LSTM)模型,提出了一种船舶航迹预测模型,并对该模型进行了实验验证。
LSTM是一种适用于序列数据的深度学习模型,具有记忆单元的循环结构,可以有效地捕捉序列数据的长期依赖关系。
在船舶航迹预测领域,LSTM模型具有以下优点:适应序列数据的时序性:船舶航迹数据具有较强的时间关联性,LSTM 模型可以通过捕捉历史数据中的长期依赖关系来预测未来航迹;学习能力:LSTM模型具有自适应学习能力,可以通过训练数据自动提取重要特征;预测精度高:LSTM模型的输出结果具有较高的预测精度,可以有效降低预测误差。
在船舶航迹预测研究中,LSTM模型的应用日益广泛。
如Kumar等(2019)基于LSTM模型对船舶运动轨迹进行了预测,并取得了较好的预测效果。
Arul等(2021)将LSTM模型应用于船舶航线规划,优化了航线设计方案,提高了航运安全。
在船舶航迹预测研究中,数据处理与预处理是建立预测模型的关键步骤之一。
对于船舶航迹数据,首先需要进行数据清洗,包括去除异常值、填补缺失值等。
进行特征提取,包括速度、航向、风速、浪高等多种特征。
这些特征可以从船舶航行状态、环境等多个方面来描述船舶航迹。
采用小波变换等方法对数据进行去噪处理,提高数据的可靠性。
在建立LSTM模型时,首先需要确定模型的参数,包括输入层、隐藏层和输出层的节点数、激活函数等。
本文采用PyTorch深度学习框架来构建LSTM模型,并采用Adam优化算法进行模型训练。
具体步骤如下:确定输入输出数据:将经过预处理的数据作为模型的输入,将船舶航迹作为模型的输出;构建LSTM模型:采用一维LSTM模型来处理时间序列数据,将输入数据按照时间顺序逐个输入到模型中;损失函数:采用均方误差(MSE)作为损失函数,用于衡量模型的预测精度;优化算法:采用Adam优化算法对模型进行训练,通过不断调整参数来降低损失函数的值,提高模型的预测精度。
6 Computer Engineering and Applications计算机工程与应用 基于LIBSVM和时间序列的区域货运量预测研究 曾 鸣 ,林磊 ,程文明 ZENG Ming ,LIN Lei ,CHENG Wenming
1.西南交通大学机械工程学院,成都610031 2.纽约州立大学布法罗分校土木工程学院,美国布法罗14260 1.School of Mechanical Engineering,Southwest Jiaotong University,Chengdu 61003 1,China 2.Civil,Structural and Environmental Engineering,University at Buffalo,the State University ofNew York,Buffalo 14260,USA
ZENG Ming,LIN Lei,CHENG Wenming.Research of regional freight volume forecasting based on LIBSVM and time series.Computer Engineering and Applications,2013,49(21):6-10.
Abstract:To the problem of excessive affecting factors and small sample size in regional freight volume forecasting,the LIBSVM support vector regression model and state space time series model with mutual information technique are proposed.In this approach, the MI is adopted to reduce the dimensionality of the high dimensional features,and then the new lower dimensional subspace is treated as the sample input to establish the LIBSVM support vector regression model and the state space time series mode1.The experimental results of Chongqing freight volume forecasting and comparative analysis show that the method can improve the prediction accuracy while accomplishing a valid forecast.and the relative error is about 0.06. Key words:Mutual Information(MI):Library for Support Vector Machines(LIBSVM)support vector regression;state space time series;regional freight volume;forecasting
摘 要:针对区域货运量预测中影响因素多、样本数量小的问题,提出了互信息MI与LIBSVM支持向量回归以及状态空 间时间序列相结合的预测方法,采用MI进行高维度特征降维后,以新的低维空间作为样本输入,分别建立LIBSVM支持 向量回归和状态空间时间序列预测模型。通过重庆市货运量预测实验结果及对比分析表明,该方法在进行有效预测的同 时能够改善预测精度,相对误差约为0.06。 关键词:互信息(MI);支持向量机程序库(LIBSVM)支持向量回归;状态空间时间序列;区域货运量;预测 文献标志码:A 中图分类号:U491.1+4 doi:l0.3778/j.issn.1002—8331.1303.0342
1 引言 区域货运量是反映地区运输需求的一项重要指标,同 时也是进行地区运输系统规划和管理的基础,其预测精度 和误差水平对整个区域的运输组织、规划、管理和决策等 都会产生十分重要的影响。因此,选择一种精度较高的预 测方法,对区域未来的货运量进行分析研究具有较强的理 论和实际意义。区域货运量产生的影响因素众多,不仅包 括该地区的运输系统供给,而且涵盖大量的区域经济因 素,同时各影响因素对整个区域货运量的影响程度也不尽 相同,使得区域货运量预测问题具有模糊性和高度非线性 的特点。此外,由于人力、物力以及技术等方面的限制,统 计过程常受到各种噪声干扰,一些区域的统计资料尚不完 备,无法获得足够多的样本,使得预测精度无法保证。
由此可见,区域货运量预测的关键在于解决高维度非 线性小样本预测问题。传统的货运量预测方法包括回归 分析法 、时间序列分析法 、因果分析法、弹性系数法,以 及综合这些方法的组合预测方法 等,然而这些方法所建 立的模型大都不能准确反映数据复杂的内部结构,造成信 息量丢失和结果失真。当前货运量预测大多采用模糊 、 小波分析 、灰色模型 以及神经网络[8-9t及其相应的改进, 如Bp[ ]、RBF[“】、广义回归神经网络以及这些方法的组合 。 虽然这些方法能够较好地解释数据非线性关系,但对于区 域货运量这类影响因素多、样本量较小的预测问题仍具有 很大局限性,不能保证其预测精度。为此,本文提出了将 MI与LIBSVM支持向量回归模型以及状态空间时间序列 模型相结合的预测方法,采用互信息(Mutual Information,
基金项目:国家留学基金委建设高水平大学研究生项目专项资金资助(留金发[201213013)。 作者简介:曾鸣(1985一),女,博士研究生,主要研究方向为物流工程;林磊(1986~),男,博士研究生,主要研究方向为运输系统工程; 程文明(1963一),男,教授,博士生导师,主要研究方向为物流工程、工业工程。E—mail:jiaoda12345@163.corn 收稿日期:2013—03—22 修回日期:2013—06.25 文章编号:1002—8331(2013)21—0006・05 CNKI出版日期:2013-06-27 http://www.cnki.net/kcms/detail/11.2127.TP.20130627.1102.001.html 曾 鸣,林磊,程文明:基于LIBSVM和时间序列的区域货运量预测研究 7 MI)方法在不减少货运量影响因素信息量条件下,进行综 合信息提取和降维,以解决信息冗余、噪声和维数过高的 问题。将所得低维空间作为输入,并在此基础上分别建立 (Library for Suppo ̄Vector Machines,LIBSVM)支持向 量回归预测模型以及状态空间时间序列预测模型。通过 重庆市货运量预测算例分析,验证了方法的有效性。 2综合信息提取及数据降维 高维度特征降维方法主要分为特征抽取和特征选择 两种类型。相对于主成分分析、非线性PCA网络、独立成 分分析等特征抽取方法涉及语义分析,特征选择方法选出 的特征集是原始特征集的子集,组成的新低维空间不改变 原始特征空间的性质,因此更容易实现且效果更为显著。 本文采用典型的特征选择方法互信息MI 对原始特征空 间进行降维。作为高维数据的分离度量方法,MI建立了高 维特征提取向量与输出分类信息之间的内在联系,是一种 有效的信息判据特征提取方法。 根据信息论 ,熵用以度量随机变量的不确定性,因此 信息类别tO=(09 ,∞ 一,∞ )的熵可以表示为: ( )=一∑P( )lb尸( ) (1) 信息类别与特征向量,=( , ,…, )的联合熵为: H(coIF)=一∑P(厂)f∑P(∞J厂)lbP( )1 (2) 根据定义,信息类别 与特征向量F之间的互信息可 由以下公式计算: (∞;F)=//(o,)+Ⅳ(F)一H( ;F) (3) ,(∞;F)=,(F;∞)= P(∞,F)lbj (4) 其中P(∞,f)为联合概率密度,P( )P(_厂)为边缘概率密 度。互信息值越大,表示变量间的相关度越高。 对于区域货运量而言,当其受到如政策变化、自然灾 害等一些特殊原因影响时,该区域货运量在所对应的预测 单位时问内,会产生剧烈增加或者减少。经分析,这种影响 的本质,仍由这些特殊原因引起的货运量相关影响因素大 幅变动所体现,并且这些影响因素对于最终预测结果通常 具有更为直接的影响。因此,为综合考虑此类区域货运量 预测问题,同时反映上述特点,决定引入判别因子 ,及调 整系数五 。 I I_maxI l (i=1,2,…,Ⅳ; =1,2,…,n一1) (5) 其中,=f表示第t个单位时间内第i个特征的值。调整系数: :f ,Q( f)j0,仃 :0;Q( )=0f:1,2,…,Ⅳ (6)0 “ l,Q(a )>0, ≤0 ~ ’一 … 其中Q )表示满足 >0的判别因子数量。 通过判别因子及调整系数的计算,使发生剧烈变化且 具有较大互信息值的影响因素,首选进入新的特征集合, 并以此首选特征为基础,计算确定其他选择特征,从而提 高预测结果的准确度。 以MIFS算法05]为基础,具体步骤如下: 第一步,初始化特征集合F,使其含有Ⅳ个特征,设置 集合A为空集。 第二步,计算判别因子Gi,i=1,2,…,Ⅳ及Q( )。当 Q(盯 )>0,口 >0,令相应调整系数 f=1;当Q(a )>0, f≤0, 令相应调整系数A =0;当Q(a )=0,则令所有调整系数 =1。 第三步,计算特征集合F中的每一个特征 ,i=1,2,…, Ⅳ与信息类别 之间含有调整系数的互信息A I(oJ;. ),i= 1,2,…,Ⅳ。 第四步,找出使 ,( ; )最大的首选特征 ,将其赋 给集合 的同时从原特征集合F中消除。 第五步,判断 =1,i=1,2,…,Ⅳ一1是否成立。若 成立,计算F中每个特征 ,i∈1,2,…,N一1与集合 中 的每一个元素之间的互信息,( ;口),找出使 ̄iZ(g-o;fi)一 ∑ ( ; )最大的特征 ,将其赋给集合A的同时从 原特征集合F中消除;若不成立,则令 .=1,i=1,2,…, N一1然后进行上述特征选择。重复以上贪心选择方法直 到找出所有k个特征,即l l=k。 第六步,输出含有全部所选择特征的集合 。
3预测模型 支持向量回归(Support Vector Regression,SVR)是 Vapnik 在1995年基于统计学习理论提出的一种机器学习 方法,它涵盖了支持向量机(SVM)的许多优点,在许多领 域得到广泛应用。支持向量机体现了结构风险最小化以 及泛化误差上界最小化的原则,其最初产生的目的是为了 解决分类问题。在1997年Vapnik提出不敏感损失函数后, 支持向量机方法的应用领域得以延伸,形成了支持向量回 归方法(SVR)用以解决非线性回归问题 。 状态空间时间序列模型与其他时间序列方法不同,它 以模型结构和组成成分分析为基础,当模型结构随着时间 发生变化时,具有很强的灵活性。同时,该模型能够很好 地处理观测值丢失的问题,并且通过将卡尔曼滤波引入最 终的预测,能够更直接地获得所需的估计值及标准差。 3.1 LIBSVM支持向量回归模型 支持向量回归方法为:给定数据点集{( Y),(x ,Y:),…, (Xn,Y )}cXx R,其中x表示输入模式空间,n表示总的训 练样本个数。根据数据点集可建立以下线性回归方程: f(x1=<∞,X>+6,∞∈X,b∈R,<,>表示 中的点积,b表 示标量阈值。假设一个不敏感损失函数s,允许计算值与 实际值之间存在一定范围或区间内的可忽略误差, 和b 可由下式进行计算: