200508_数据挖掘技术在铁路选线中的应用
- 格式:pdf
- 大小:103.13 KB
- 文档页数:4
铁路集团工作人员的数据挖掘与分析随着科技与信息技术的不断发展,数据挖掘与分析在各行各业中扮演着越来越重要的角色。
铁路集团作为一个庞大而复杂的组织,拥有大量的数据资源,因此,对于铁路集团的工作人员来说,掌握数据挖掘与分析技能,对于提高工作效率、优化运营管理具有重要意义。
1. 数据挖掘的定义及作用数据挖掘是一种从大量数据中主动发现并提取出有价值、实用、以前未知的信息的技术。
在铁路集团中,数据挖掘可以帮助工作人员挖掘出数据背后的规律、趋势和模式,为决策提供科学依据。
例如,通过分析旅客出行数据,可以预测节假日客流高峰,提前调配运力,优化列车运行计划,保证铁路的安全和效益。
2. 数据分析的必要性数据分析是通过对已收集的数据进行整理、加工、分析和判断,获取有关信息的过程。
对于铁路集团的工作人员来说,数据分析是对当前运营情况进行全面了解,快速发现问题和解决问题的手段。
通过数据分析,可以帮助工作人员发现潜在的风险因素,制定科学的预警机制,提高铁路运营的安全性和稳定性。
3. 数据挖掘与分析的技术工具在实施数据挖掘与分析过程中,工作人员需要掌握一些常用的技术工具,以便更好地处理和分析数据。
常用的数据挖掘与分析工具包括:统计学方法、机器学习算法、大数据平台等。
例如,通过使用机器学习算法,可以对铁路运行的各项指标进行预测,及早发现异常情况,以便及时采取措施应对。
4. 数据挖掘与分析在铁路集团中的应用案例a) 客流预测与调配:通过挖掘历史客流数据,结合天气、节假日等因素,工作人员可以对未来客流进行准确预测,并合理调配车次和车厢,提高客运效率。
b) 维修保养优化:通过对设备故障数据的分析,及时发现设备的维修需求,制定合理的保养计划,减少因设备故障而引发的运行延误。
c) 安全隐患排查:通过对事故发生的相关数据进行挖掘和分析,工作人员可以找出事故的共同特点和根本原因,及时制定措施,提高铁路运行的安全性。
5. 数据挖掘与分析在铁路集团中的挑战与对策尽管数据挖掘与分析在铁路集团中具有广泛的应用前景,但也面临一些挑战。
浙江理工大学学报,第25卷,第6期,2008年11月Journal of Zhejiang Sci2Tech U niversityVol.25,No.6,Nov.2008文章编号:167323851(2008)0620694206数据挖掘技术在铁路治安工作中的应用陈 杰1,汪玉兮1,张瑞林2,钱沄涛1,包伟江1(1.浙江大学计算机学院,杭州310012;2.浙江理工大学信息电子学院,杭州310018) 摘 要:在获取铁路车站治安信息的基础上,利用典型的关联规则算法Apriori及其改进算法Apriori Tid,对信息库中的数据进行了分析和验证,得出在治安违法案件中人、事、物之间的相互关系并以此预测未来铁路车站的治安情况。
以指导车站治安管理中对重点时段、重点区段和重点案情的警力安排,使得在警力紧缺的情况下,科学、合理地安排警力。
同时,笔者也对两种算法的效率进行了比较,Apriori Tid无论是在算法的精度还是时间复杂度方面都要优于Apriori算法。
关键词:数据挖掘;关联规则;Apriori算法;Apriori Tid算法中图分类号:TP311 文献标识码:A0 引 言数据挖掘技术[1]在很多重要领域中已有研究,但在公安系统中的应用研究较少,特别是在铁路公安治安工作中的应用尚处于初级阶段。
在人们的社会活动中,把铁路作为交通工具进行工作联系、商贸往来和民间交流等活动的人组成了庞大的旅客群体。
旅客的成分复杂、流动频繁,有各种违法犯罪人员混杂其中,易于发生违法犯罪行为和治安灾害事故[2]。
通过近几年公安信息化的建设,逐步建立起了以铁路公安为特色的公安信息数据库。
这种情况下,如何有效地把数据挖掘技术应用于铁路公安工作中,及时发现最新规则,以提高执法效率与快速反应能力,及时预防和打击犯罪行为,成为当前铁路公安工作中亟需进一步研究解决的问题,也是铁路公安信息化建设进一步发展的方向。
本文主要是采用关联规则Ap riori算法对铁路公安业务信息进行分析研究,建立数据模型,同时运用改进的Ap riori Tid算法,为各级领导,管理部门分析、发现、掌握铁路公安治安业务的动向与规律提供及时、准确的各种挖掘基础信息,并通过试验数据进行验证,给予合理的解释,为今后辅助决策和参考提供科学依据。
遥感技术在铁路勘察选线中的应用
张占忠
【期刊名称】《铁道勘察》
【年(卷),期】2005(031)001
【摘要】介绍了遥感技术的发展趋势和ERDAS IMAGINE软件系统,对遥感技术在铁路勘察选线应用中的生产作业流程、应用方法以及应用效果进行了探讨.
【总页数】3页(P44-46)
【作者】张占忠
【作者单位】铁道第一勘察设计院,陕西西安,710043
【正文语种】中文
【中图分类】U21
【相关文献】
1.卫星遥感技术在毛乌素沙漠集气干线选线中的应用 [J], 王军
2.遥感技术在铁路勘察体系中的功能定位研究 [J], 高山
3.遥感技术在库格铁路阿尔金山区地质选线中的应用 [J], 杨新亮
4.铁路勘察中遥感技术的应用 [J], 甄春相
5.遥感技术在黄土沟壑区管道选线中的应用研究 [J], 杨卫涛
因版权原因,仅展示原文概要,查看原文内容请购买。
大数据挖掘分析在铁路通信行业的应用分析作者:吴保德马治东崔俊峰来源:《中国科技博览》2019年第02期[摘要]目前铁路各个工种部门信息化建设呈现的是分散化,相互独立的信息化节点,例如利用物联网和前端探测手段实现的自动化管理但是没有系统的数据分析和数据挖掘,所以目前铁路行业的大数据网络并不全面,更多的只是简单的数据搜集。
从管理角度来说应为各个专业的相对独立对大数据网络的建设投资和管理相对不太容易。
但此文仅从技术层面对铁路行业信息化进行设想和展望。
[关键词]大数据挖掘分析;铁路通信;应用分析中图分类号:S62 文献标识码:A 文章编号:1009-914X(2019)02-0325-01一、大数据概要大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。
大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。
适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。
二、数据网建设1. 大数据处理之一:采集大数据的采集是指利用多个数据库来接收发自客户端(Web、App或者传感器形式等)的数据,并且用户可以通过这些数据库来进行简单的查询和处理工作。
通信,信号,供电,工务等专业在信息采集方向也同样做了很多采集系统例如通信的端口数据采集,供电的相关技术指标的采集以及信号相应的数据采集系统。
数据采集可以从设计开始通过广泛的布置信息采集器涉及管理部门报表中的主要技术指标。
2. 大数据处理之二:导入/预处理虽然采集端本身会有很多数据库,但是如果要对这些海量数据进行有效的分析,还是应该将这些来自前端的数据导入到一个集中的大型分布式数据库,或者分布式存储集群,并且可以在导入基础上做一些简单的清洗和预处理工作。
也有一些用户会在导入时使用来自Twitter的Storm来对数据进行流式计算,来满足部分业务的实时计算需求。
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在的有用信息和知识的过程。
它是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。
简而言之,数据挖掘其实是一类深层次的数据分析方法。
从这个角度数据挖掘也可以描述为:按企业制定的业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。
随着信息技术的迅速发展,数据库的规模不断扩大,从而产生了大量的数据。
为给决策者提供一个统一的全局视角,在许多领域建立了数据仓库。
但大量的数据往往使人们无法辨别隐藏在其中的能对决策提供支持的信息,而传统的查询、报表工具无法满足挖掘这些信息的需求。
因此,需要一种新的数据分析技术处理大量数据,并从中抽取有价值的潜在知识,数据挖掘技术由此应运而生。
数据挖掘技术也正是伴随着数据仓库技术的发展而逐步完善起来的。
通过数据挖掘我们可以进行估值,预言,相关性分组或关联规则,聚集,描述和可视化,复杂数据类型挖掘等事情。
数据挖掘技术从一开始就是面向应用的。
目前在很多领域,数据挖掘都是一个很时髦的词,尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业领域。
下面我们了解一下数据挖掘在交通运输方面的应用。
首先,数据挖掘可以为交通运输提供有力的决策支持。
随着经济的日益发展,汽车现在已是我们生活中必不可少的,所以交通运输业的发展将日益壮大,然而,决策信息将越来越重要,它可以改善交通环境(例如北京的单双号行车计划),为我们交通运输业提供方便,并且好的决策信息还可以提高汽车销量(例如一些新颖的并且吸引顾客的方法)。
第二,数据挖掘可以对交通运输业中的产品系进行管理。
它可以对用车群体进行分析,找到他们的规律,并对汽车市场进行分和市场进行分析并对顾客关析,了解他们的规律后,就可以为顾客提供更优质的服务,从而带来了可观的客户流量,并刺激了高利润产品的销售,从而提高经济效益。
城市轨道交通列车运行控制系统中的数据挖掘技术应用研究随着城市轨道交通的快速发展,如何提高运行效率和安全性成为了城市交通相关领域需要解决的重要问题。
数据挖掘技术作为一种利用大数据进行知识发掘的方法,在城市轨道交通列车运行控制系统中得到了广泛的应用。
本文将围绕该主题进行深入研究,探讨数据挖掘技术在城市轨道交通中的应用和展望。
首先,我们先了解一下城市轨道交通列车运行控制系统。
该系统是通过一系列的设备和算法来实现对列车运行的全程监控和控制的。
其中,数据挖掘技术能够利用各种数据源,通过运用机器学习和统计分析等方法,挖掘隐藏在大量数据中的信息和规律,为列车运行控制提供科学依据。
数据挖掘技术在城市轨道交通列车运行控制系统中有着广泛的应用。
首先,它可以通过分析大数据,实时监测列车的运行状态。
传感器等设备所产生的大量数据可以被数据挖掘技术收集和分析,从而实现对列车的位置、速度、载客量等关键信息的监控和预测。
这有助于运营人员及时掌握列车运行情况,及时做出相应的调度和安排,提高运行效率和减少延误。
其次,数据挖掘技术还可以通过对历史数据的挖掘,为运营决策提供支持。
通过分析历史数据,例如列车运行时间、晚点情况、人流量等,数据挖掘技术可以揭示出列车运行的规律和趋势。
这些信息可以帮助运营人员对未来的运行情况做出合理的预测,并制定相应的运营策略。
此外,对于乘客来说,数据挖掘技术也可以通过分析历史数据,提供智能推荐服务,例如乘客换乘方案、优惠信息等,为乘客提供更好的出行体验。
除了以上应用,数据挖掘技术在城市轨道交通列车运行控制系统中还有其他潜在的应用。
例如,数据挖掘技术可以通过分析乘客乘车需求和出行模式,优化列车的运行图和调度方案,减少拥堵和排队时间;通过对设备故障和维修记录的分析,提前预警和预防设备故障,提高系统的可靠性和稳定性;通过对乘客行为和社交信息的挖掘,改善乘客的安全感和满意度,提高服务质量。
然而,虽然数据挖掘技术在城市轨道交通列车运行控制系统中有着广泛的应用前景,但也面临着一些挑战。
数据挖掘技术在交通运输中的应用随着科技的发展和社会的进步,交通运输领域也在不断创新和改进。
作为一种强大的分析工具,数据挖掘技术在交通运输中的应用不断增多,可以有效解决一系列相关问题。
本文将探讨数据挖掘技术在交通运输中的应用,包括交通流量预测、交通事故预警和交通路线优化等方面。
一、交通流量预测准确的交通流量预测对于提高交通运输效率至关重要。
数据挖掘技术可根据历史交通数据、天气信息和道路状况等因素,构建模型预测未来的交通流量。
通过分析大规模的数据集,数据挖掘技术可以识别出影响交通流量的关键因素,包括日历日期、季节变化、节假日等。
利用这些因素,交通管理部门可以提前做出相应的调整,合理分配交通资源,从而减少交通拥堵。
二、交通事故预警交通事故是交通运输中一大致命隐患,也是人们关注的焦点之一。
利用数据挖掘技术,可以对各种交通事故数据进行深入分析,并建立相应的预警模型。
数据挖掘技术能够挖掘出导致交通事故的关联因素,如道路状况、驾驶员行为、天气等,提前发现潜在的事故隐患,并提供相应的警示和预防措施。
这种预警系统将为交通管理者提供重要的决策依据,为交通运输安全保驾护航。
三、交通路线优化交通路线的优化对于提高交通运输效率和节约能源具有重要意义。
数据挖掘技术可以利用历史交通数据和实时交通信息,通过分析驾驶者的行为模式和道路状况,为驾驶者提供最佳路线推荐。
此外,数据挖掘技术还可以识别出影响交通拥堵的关键因素,如道路施工、交通事件等,提供实时的拥堵推测和绕行建议,有效缓解交通压力。
四、城市交通规划数据挖掘技术也在城市交通规划中发挥着重要作用。
通过分析城市的交通数据,包括交通流量、车辆类型、出行目的等,数据挖掘技术能够帮助交通规划者更好地了解城市交通运行的特点和趋势。
基于这些分析结果,交通规划者可以制定更科学、更合理的城市交通规划,优化道路布局、公共交通线路等,提高交通运输的效率和便利性。
综上所述,数据挖掘技术在交通运输中的应用已经取得了显著的成果。
数据挖掘技术在交通运输中的应用前景随着科技的发展和社会的进步,交通运输行业也面临着新的挑战和机遇。
数据挖掘技术作为一种强大的工具,被广泛应用于各个领域,其中包括交通运输。
本文将探讨数据挖掘技术在交通运输中的应用前景。
首先,数据挖掘技术可以帮助交通管理部门预测交通流量和拥堵情况。
通过收集和分析历史交通数据,可以建立交通流量模型,并预测未来的交通状况。
这对于交通管理部门来说非常重要,可以帮助他们制定更有效的交通管理策略,减少交通拥堵,提高交通效率。
其次,数据挖掘技术可以帮助交通运输企业进行客流分析和需求预测。
通过分析乘客的出行数据和行为模式,可以了解他们的出行偏好和需求,从而优化运输服务。
例如,根据客流分析结果,交通运输企业可以调整班次和运力,提供更合理的运输方案,以满足乘客的需求。
此外,数据挖掘技术还可以在交通安全领域发挥重要作用。
通过分析交通事故数据和驾驶行为数据,可以识别出交通事故的潜在风险因素,并提出相应的预防措施。
例如,通过分析驾驶员的驾驶习惯和行为模式,可以发现驾驶员的不良驾驶行为,如超速、疲劳驾驶等,从而提醒驾驶员注意安全,减少交通事故的发生。
此外,数据挖掘技术还可以帮助交通运输企业进行运输网络优化。
通过分析运输网络的拓扑结构和交通流量数据,可以找出网络中的瓶颈和薄弱环节,并提出相应的优化方案。
例如,根据分析结果,可以调整路线规划,减少运输距离和时间,提高运输效率。
最后,数据挖掘技术还可以在智能交通系统中发挥重要作用。
通过收集和分析交通数据,可以实现交通信号灯的智能控制,优化交通流量。
同时,还可以实现智能导航系统,提供最佳的行车路线和实时交通信息,帮助驾驶员避开拥堵路段,减少通行时间。
综上所述,数据挖掘技术在交通运输中具有广阔的应用前景。
它可以帮助交通管理部门预测交通流量和拥堵情况,帮助交通运输企业进行客流分析和需求预测,提高交通安全水平,优化运输网络,以及实现智能交通系统。
随着技术的不断发展和数据的不断积累,数据挖掘技术在交通运输中的应用前景将更加广阔。
数据挖掘技术在交通行业中的应用研究一、引言交通行业是国民经济中重要的组成部分,具有重要的社会、经济、文化和政治意义。
为了提高交通运输的质量和效率,交通行业需要采用先进的数据技术来指导管理决策。
数据挖掘技术是现代计算机科学领域中的一种重要技术,在交通行业中的应用也越来越广泛。
本文将从数据挖掘技术的概念、交通行业的特点、交通数据挖掘的研究现状和交通数据挖掘的应用案例四个方面,探讨数据挖掘技术在交通行业中的应用研究。
二、数据挖掘技术的概念数据挖掘技术是指在大规模数据的情况下,利用计算机的算法和技术,从数据中自动发现有意义的、潜在的、先前未知的、可理解的模式或知识的过程。
数据挖掘技术包括分类、聚类、关联规则挖掘、时序模式挖掘、异常值检测、预测等。
三、交通行业的特点交通行业具有复杂性、动态性和随机性等特点。
在交通运输的整个过程中,需要不断收集和处理各种数据,包括路况数据、车辆数据、乘客数据、视频监控等。
这些数据具有海量性、跨越性和异构性等特点,需要进行有效地整合、分析和应用。
四、交通数据挖掘的研究现状交通数据挖掘的研究方向包括但不限于路况预测、车辆轨迹和行驶状态分析、交通事故分析、乘客行为分析等。
目前,许多学者和研究机构都在交通数据挖掘领域进行了具体研究。
1. 路况预测路况预测是交通数据挖掘中的一项重要研究内容。
通过利用历史数据,对未来的路况进行预测,可以为驾驶员提供实时的路况信息,提高车辆行驶的安全性和效率。
目前,常用的路况预测模型包括基于时间序列的方法、机器学习方法以及深度学习方法等。
2. 车辆轨迹和行驶状态分析车辆轨迹和行驶状态分析是指对车辆在行驶过程中的轨迹和状态进行分析,从中提取有用的信息。
这些信息可以用于道路规划、交通控制、车辆优化等方面,优化交通系统的整体性能。
3. 交通事故分析交通事故分析是交通数据挖掘领域的一个重要研究方向。
通过分析交通事故的原因、分布等情况,提高交通安全性,减少交通事故发生率。
摘要:本文全面分析了数据挖掘技术的整体概念理论,阐述了城市轨道交通信息系统的概念和发展态势,总结了城市轨道交通信息系统中数据挖掘技术的应用基础,从轨道交通运行评价、客流信息数据处理和设备维修检测三个维度研讨了数据挖掘技术在城市轨道交通信息系统中的具体应用。
关键词:数据挖掘;城市轨道交通;信息系统引言城市轨道交通线路新增和客流上涨,对城市轨道交通信息系统的智能化、自动化以及全面化发展提出了更高要求。
数据挖掘技术是现阶段基于数据库管理系统的新兴的网络信息技术,随着网络信息技术的不断成熟和发展,数据挖掘技术与计算机技术、数据库技术、机器学习、统计学管理、模式识别等进行了深入广泛的融合。
这就保证了数据挖掘技术在大数据信息管理、信息分析、信息提取以及事务管理中重要作用的发挥,有效解决了数据管理中复杂性和多样性引发的管理困难和障碍。
1. 数据挖掘技术的整体概念理论1.1 数据挖掘技术的基本概念数据挖掘技术是基于信息技术、网络技术、多媒体技术、大数据技术等应运而生的一种新型技术手段。
具体来说,数据挖掘技术是指在体量较大、数据信息不完备、数据信息随机的数据“库”中进行甄别、筛选、识别,并获取有用的数据信息或者资料信息[1]。
因为充分结合了大数据技术、网络技术、信息技术等,所以数据挖掘技术自身具有广泛性、多元性的特征,还将数据资料统计、模式判定技术、模糊数学、神经网络等融合其中,所以其本质属于多样化技术、多元化学科交叉而生成的一项技术[2]。
1.2 数据挖掘技术的具体划分根据数据挖掘技术的技术核心和组成,现阶段数据挖掘技术的类别主要从四个维度进行划分,即统计学理念、神经网络理论、数据资料库、人机交互。
从统计学理念来看,数据挖掘技术又包含了判定解析、遗传算法等内容;神经网络理论又将数据挖掘技术解构为竞争学习、自主神经网络等;数据库资料往往需要对数据挖掘技术过程进行全方位多角度的数据信息解析,且保证数据信息的可视化;人机交互主要针对的是机器学习实现数据挖掘。
路选线设计是根据需要从无数可能方案中选择最优或最满意方案的多目标决策过程。
在整个决策过程中如何充分获取和有效管理设计所需各种(数据)信息,以及从现有数据中提取有助于决策的模式和知识,是决定决策方案是否最优或最满意的关键。
在信息获取和管理方面,随着勘测、遥感、网络和计算机技术的发展,近年来得到长足发展,特别是随着铁路勘测设计一体化、智能化深入展开,基本实现了铁路线路设计韩春华:西南交通大学土木工程学院,博士研究生,四川 成都,610031易思蓉:西南交通大学土木工程学院,教授,博士生导师,四川 成都,610031吕希奎:西南交通大学土木工程学院,博士研究生,四川 成都,610031摘 要:介绍分类数据挖掘结合遥感图像在铁路选线中的应用,阐述利用数据挖掘实现遥感图像分类技术在铁路选线中的应用方式,对遥感图像分类在虚拟环境选线系统应用的体系结构、图像分类粒度与设计进程的关系进行讨论,提出虚拟环境选线系统实现遥感图像分类的具体方法。
关键词:数据挖掘;分类;遥感图像;虚拟环境;铁路选线铁资金项目:国家自然科学基金(50278082)基础数据快速获取和数字化,各种比例尺的地形图、水文地质图、遥感图像、数字地形模型,各种地形、地质、水文、人文地理等文字资料均能快速获取,且对获取数据的数据库和网络化管理研究方面也取得了一定成果。
但如何从现有的数据中自动提取有用模式和知识,以逐渐实现设计的自动化和智能化,提高决策科学性,却鲜有研究;尤其是如何从遥感图像这种快速获取选线设计所需资料的主要信息源中,直接提取选线设计所需知识以加快设计进程和自动化方面,至今还没有相应研究。
这就使得铁路选线设计出现这样一种尴尬局面:可以方便获取各种现成的数据信息,却不能充分利用既有资料革新线路设计方法。
在这方面可以借鉴不断普及的数据挖掘技术,实现知识和有用模式的提取。
1 遥感图像分类数据挖掘1.1 数据挖掘及数据分类技术数据挖掘是一种数据处理过程,它利用一种或多种计算机学习技术,从数据库的数据中自动分析和提取知识,其目的是确定数据的趋势和模式。
数据挖掘有很多方法或算法。
根据挖掘任务可分为分类知识发现、数据总结、数据聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常发现和趋势预测等 ;根据是否使用训练样本数据分为有监督类和无监督类;根据是否常用可以分成统计分析类、知识发现类和其他类型的数据挖掘技术三大类。
分类数据挖掘旨在根据样本数据寻求分类规则,然后根据该规则来确定某一非样本个体或对象是否属于某一特定的组或类;分类知识发现属于有监督学习。
根据采用的模型不同,数据挖掘分类方法有多种,研究和应用较多的有:决策树类、统计模型类、神经网络类、遗传算法类和粗糙集方法类。
1.2 遥感图像数据分类挖掘技术遥感图像分类是数据挖掘技术在遥感领域的具体应用,其核心任务是确定不同地物间的判别界面和判别准则,以达到大致区分遥感图像中多种地物的目的。
实现分类的主要依据是地物的光谱特征,即地物电磁波辐射的多波段测量值,这些测量值可以用作遥感图像分类的原始特征变量。
然而反映在遥感图像上的地物光谱特征要受到地形、大气散射、太阳高度和视角、地物的类别混合以及类内反射比的变化等因素影响,且遥感图像数据多、维数大、地物的表现形式复杂多样;单纯依靠光谱特征实现地物的准确分类是不现实的,尚需考虑地物纹理、空间特征和空间关系。
遥感图像的分类有监督(Supervised)分类和非监督(Unsupervised)分类两种。
非监督分类,从数据挖掘任务上来看属数据聚类,它按照特征矢量在特征空间中类别集群的特点进行分类,分类结果只是对不同类别达到了区分,而类别属性则只有事后对各类光谱响应曲线进行分析,或通过实地调查后才能确定。
监督分类从数据挖掘任务来看属分类知识发现,监督是在有先验知识的条件下进行的。
先选择训练样本,根据已知像元数据求出参数,确定各类判别函数的形式,然后利用判别函数对未知像元进行分类。
由于非监督分类的类别属性需事后确定,如果采用光谱曲线分析,因为遥感图像上光谱已受到多种因素的影响,因此分析难免出现差错;如果通过实地调查来确定,则需花费大量时间和人力,这对于时间紧迫的铁路线路可行方案研究是不适宜的,所以这里不介绍非监督分类方法。
数据挖掘的分类方法在遥感图像分类中都有应用,但遥感图像数据量大,像元光谱受多种因素影响,地物形式又多样化,遥感图像分类的复杂性要高得多。
因此在实现遥感图像分类的数据挖掘过程中,一方面需要对遥感图像进行一些专门处理,比如辐射校正、几何校正,以提高分类精度;另一方面需对既有的分类算法进行改进,引入纹理、空间特征、空间关系等方面的模式和知识,把知识工程、模糊数学、地理信息系统等理论和方法引入数据挖掘过程。
现有的遥感图像分类算法也正是按照这种方向发展的。
在现有的研究中已采用的分类方法有贝叶斯分类、决策树分类、人工神经网络分类、基于模糊理论的分类、基于知识的分类、支撑向量机的分类等。
分类利用的信息从单一利用光谱信息发展到了利用光谱、纹理、时相、角度等多种信息。
分类单元从基于像元的逐点分类到基于图斑的分类;分类类别上从每个像元有且仅有一个所属类别的硬分类到亚像元分类;分类信息源上从单源遥感影像分类到利用多源遥感影像融合的分类;数据挖掘使用的分类法从单分类器向复合分类器发展。
分类开始使用地理信息系统、知识工程等辅助工具,利用数字高程模型作为辅助信息。
2 遥感图像分类数据挖掘在铁路选线中的应用2.1 在铁路选线中的应用方式目前遥感图像并不直接应用于铁路选线设计中。
选线工程师只能采用间接的方式使用遥感图像,即只能使用航测、制图和地质人员从遥感图像上获得的图纸或文字资料。
尽管这相对于使用野外测设的地形图进行方案设计来说,已经大大缩短了设计进程,提高了设计精度,但是这种间接使用遥感图像的方式有明显缺陷:(1)大量的中间处理过程,浪费人力物力,加强了劳动强度,拉长了设计周期。
(2)由于计算机屏幕有限,使用电子等高线图设计线路方案存在因显示范围过小或无法看清等高线的弊病,因此限制了选线设计无纸化的实现。
显然使用纸质资料不仅增加了劳动工序,而且增加了设计成本。
(3)遥感图像经过多步骤处理,地物又是人工交互绘制的,生成的结果难免存在误差和错误,这就会降低设计精度,甚至导致局部方案设计不合理。
如果在经过三角测量、各种图像校正和增强的遥感图像上设计线路,由于使用三维地面模型外加正射影像纹理生成的真实感图像,不仅精度高,能灵活实现设计范围在宏观和微观之间灵活切换,同时加快了设计进程,降低了劳动强度,节约了设计成本。
借助数据挖掘技术,实现遥感图像的自动分类,在铁路选线中有两种应用方式:一是用于辅助制图人员识别各种地物,逐步实现地形图的快速、自动绘制;二是把遥感图像分类集成到铁路虚拟环境选线系统中,自动识别线路所经地区的各种地表或地下物体。
虚拟环境选线必将取代现有线路设计方法,对于铁路选线设计来说意义更为重大。
这里着重说明后一种应用方式。
2.2 在虚拟环境选线系统中的应用体系结构在虚拟环境选线系统中使用遥感图像数据挖掘分类技术的体系结构见图1。
结构设计基本思路是把影像分类同线路设计整合在一起,根据设计阶段和设计要求,以及交互设计或智能设计中线路的大体位置有选择地分类地物,而无需花费大量时间和精力,把所有地物分类并成图以后再供线路工程师使用,这样既可以节约大量时间和成本,又有针对性。
地物分类信息的利用流程是:首先将获取的遥感图像经三角测量、辐射校正和几何校正等处理后存入地理信息数据库中,建立像素与大地坐标的关系;在铁路虚拟环境选线系统中,工程师根据小比例的真实感图像人工点选主要控制点,然后在较大比例尺真实感图像上根据主要控制点进行交互式或智能化方案设计,设计过程中程序自动收集线路两侧一定坐标范围;遥感影像分类模块根据坐标范围从地理信息数据库获取影像的波谱数据挖掘技术在铁路选线中的应用 韩春华 等数据挖掘技术在铁路选线中的应用 韩春华 等特征、色调、纹理、空间布局等数据,使用一定数据挖掘分类算法,识别地物,然后把识别结果返回线路设计模块;线路设计模块把分类结果以图形界面形式显示给用户,并触发知识库,在交互设计时从知识库中搜索出针对性处理措施供工程师决策时参考,在使用智能模块自动实现设计时执行知识库中的设计操作;设计后对设计结果进行评估,若方案经济合理,则把方案信息存入工程数据库,同时将分类结果存入地理信息数据库,以备进一步方案比选和最后线路出图使用。
2.3 遥感图像的分类粒度与虚拟环境选线系统的设计进程在虚拟环境中进行线路设计,一方面采用了基于真实感图像的人机交互方式,另一方面与知识工程紧密结合,可以实现基于知识的自动或半自动选线设计。
这样就使得不同运输要求、速度目标值和主要技术标准的大量设计方案的快速比选成为可能。
这时不良方案的淘汰就显得十分重要,在由面到带、由带到线、逐步细化、逐步逼近的方案设计进程中,不适宜的方案应逐步淘汰掉。
每一步选择少量有进一步比选价值的方案进入下一步设计,如此才能在提高设计速度和节约设计成本的同时,不至于影响最后采用方案的合理性、经济性和科学性。
这里的设计进程同铁路建设程序的设计阶段没有必然联系,而是指在每一设计阶段设计方案逐步细化的过程。
当然随着设计阶段的加深,设计进程起始方案的细化程度就越高,可供细化的起始方案数量也越少。
这种设计方案逐步细化的设计进程机制,对需进行大量方案比选的工程预可行性研究和可行性研究设计阶段意义最为重大。
遥感图像的分类粒度也应同选线设计的进程相适应,提取与设计进程相适应的分类资料,无需过早提取细部数据,因为经过那里的方案或许根本不可能采用,这样细部资料的提取就是一种浪费。
比如在选定区域地面一级方案比选中,无需关心设计线与其他道路是否相交及交叉方式,也无需考虑设计线与零散居民点和小城镇的干扰因素;但是设计线与大面积水体(如湖泊、大江大河)、大面积的居民点或大中城镇、某种生态保护区的干扰问题就必须引起重视。
如果通过遥感图像的分类发现,设计线与某一大面积水体干扰过多,或者某一大城镇的距离太远,或无法避开某一密集居住区,则应给选线工程师提示这一信息,或者通过交互式修改方案,或者由智能处理模块自动修改,或者摒弃该备选方案。
2.4 在虚拟环境选线系统中的分类挖掘方法在虚拟环境选线系统中应用遥感图像分类数据挖掘技术,要紧密结合选线设计实际需要,同时应考虑遥感影像数据分类模块同系统其他模块的相对独立性。
这样一方面可以使系统在分类技术不成熟时能利用目视判读存入地理信息数据库的资料;另一方面有利于分类模块的单独研究开发,有利于及时借鉴遥感领域或其他遥感图像应用领域的新近研究成果来更新该模块。