基于XML的异构数据交换技术的研究
- 格式:pdf
- 大小:483.12 KB
- 文档页数:4
基于XML的企业异构数据交换技术的研究的开题报告标题:基于XML的企业异构数据交换技术的研究一、研究背景目前,企业信息化发展迅速,信息系统的异构性问题十分突出,不同部门、不同业务系统之间存在大量的数据交换需求,如何实现企业间数据快速可靠、高效传输是一个急需解决的问题。
XML技术的出现为数据交换提供了更多的可能。
二、研究目的与意义本研究旨在探究基于XML的企业异构数据交换技术,分析其技术特点和应用场景,研究如何解决企业数据异构性问题,从而实现不同部门、不同业务系统之间的数据交换和共享。
这将有助于提升企业信息化水平,提高企业数据处理效率和准确性,促进企业数据业务的快速发展。
三、研究内容与方法本研究主要内容包括:1. XML技术基础介绍;2. 企业数据异构性问题的分析与解决方案探究;3. 基于XML的企业异构数据交换技术的设计与实现;4. 方案的评估与应用实例。
研究方法采用文献调研法、案例分析法和实验研究法,借助各种工具和开发平台(如XMLSpy和IBM MQ Series等),系统分析研究对象的特点和需求,提出相应的解决方案和技术实现方法,并通过实验验证其效果和可行性。
四、预期成果1.掌握XML技术的基本原理和方法,了解其在企业数据交换中的应用;2. 分析和解决企业数据异构性问题,寻求科学有效的数据交换方案;3. 设计和实现基于XML的企业异构数据交换方案,并进行实验验证;4. 得出合理的评估结论和应用建议,提高企业数据交换效率和可靠性。
五、论文结构安排本文共分为六个部分:第一部分是绪论,主要介绍研究背景、目的与意义、内容和方法、预期成果等内容;第二部分是相关理论和技术的概述,包括XML技术基础介绍和企业数据异构性问题的分析;第三部分是基于XML的企业异构数据交换技术的设计与实现,介绍方案的实施过程和技术细节;第四部分是方案的有效性验证,通过实验进行方案的评估和推广;第五部分是案例分析,选取典型企业案例分析,探究方案的应用场景和优化;第六部分是总结与展望,总结研究成果,提出推广和改进的建议。
基于XML的空间数据异构共享与在线发布技术研究随着信息技术的不断发展,空间数据的异构共享与在线发布技术也越来越重要。
XML作为一种可扩展标记语言,已经被广泛应用于空间数据的存储、传输和共享中。
本文将从XML的应用场景、XML的数据模型以及基于XML的异构共享与在线发布技术三个方面,对XML在空间数据领域的应用进行探讨。
一、XML的应用场景XML作为一种轻量级的数据表示格式,常常被用于Web应用程序的数据交换和传输。
在空间数据领域,XML可以用来描述地图、遥感影像、三维模型、气象数据等各种地理信息数据。
例如,使用XML可以将行政区划信息以层级结构的形式存储,并通过网络共享给其他机构使用。
此外,XML还可以用作描述GIS服务的元数据格式,以便实现对地理数据的搜索、获取和分析。
二、XML的数据模型XML的数据模型是一种树形结构,其中每个元素都可以包含一个或多个其他元素或属性。
每个元素都有一个开始标签和一个结束标签,并通过尖括号来区分。
例如,以下是一个简单的XML示例:<城市><名称>北京</名称><面积>16410</面积><人口>2153</人口></城市>在这个例子中,城市元素包含了三个子元素:名称、面积和人口。
每个子元素都包含了一个值,用于描述这个城市的相关属性。
通过这样的数据模型,XML可以灵活地描述各种类型的空间数据。
三、基于XML的异构共享与在线发布技术基于XML的异构共享与在线发布技术是指通过XML描述空间数据,并通过网络共享给其他机构或用户使用。
其中,异构共享是指不同格式的空间数据之间的互相转换和共享,而在线发布则是指通过Web服务提供对空间数据的访问和查询。
在异构共享方面,通过将空间数据转换为XML格式,可以将不同格式的数据进行互相转换和共享。
例如,可以使用XML将SHP格式的矢量数据转换为KML格式的Keyhole标记语言,以便在Google Earth中显示。
《基于XML的异构数据库数据转换工具的设计与实现》一、引言随着信息化社会的快速发展,异构数据库的广泛使用使得不同系统之间的数据交互成为一种常态。
而为了满足各种应用需求,设计并实现一款基于XML的异构数据库数据转换工具,已成为业界的重要研究方向。
该工具能够帮助企业、组织实现异构数据库间的数据转换与交互,进而提高数据的使用效率和系统的灵活性。
二、背景与意义随着信息技术的不断发展,各种类型的数据库如关系型数据库、非关系型数据库等应运而生。
这些数据库的数据结构、存储方式等存在较大差异,导致不同系统间的数据交互变得困难。
而XML作为一种可扩展的标记语言,具有跨平台、跨语言、自描述性等优点,因此被广泛应用于数据交换和存储。
基于XML的异构数据库数据转换工具,能够在不同类型数据库间进行高效的数据转换和传输,有助于提高数据处理效率和系统兼容性。
三、设计与实现(一)设计思路本工具的设计以XML为桥梁,将异构数据库中的数据转化为XML格式,再进行数据间的转换和传输。
具体设计思路如下:1. 需求分析:明确工具的转换需求、目标用户和系统环境等。
2. 架构设计:采用模块化设计思想,将工具分为数据源模块、XML解析与生成模块、数据转换模块、XML解析与加载模块等。
3. 数据格式设计:以XML为载体,设计统一的数据格式规范,确保数据的准确性和可读性。
4. 接口设计:设计友好的用户界面和API接口,方便用户使用和二次开发。
(二)实现过程1. 数据源模块:从不同类型的数据源中提取数据,如关系型数据库、非关系型数据库等。
2. XML解析与生成模块:将提取的数据转化为XML格式,并生成相应的XML文件。
3. 数据转换模块:根据用户需求,对XML数据进行转换和格式化处理。
4. XML解析与加载模块:将转换后的XML数据加载到目标数据库或系统中。
(三)关键技术在实现过程中,涉及到以下关键技术:1. XML解析与生成技术:使用XML解析器对数据进行解析和生成。
基于XML的异构数据交换研究[摘要]数据交换是进行数据融合和集成的重要途径。
本文针对XML的特点,对基于XML的异构数据标准化、数据与XML之间的转换和异构数据交换方法进行了研究。
[关键词]XML;XML-Schema;数据交换0引言信息化建设大大提高了各类管理工作的效率。
随着各种信息系统的推广使用。
存储在信息系统数据库中的数据已经成为管理工作的重要基础。
由于各管理机构之间的相对独立以及信息系统开发初期缺乏总体规划,导致一个有机实体或部门内部出现大量的“信息孤岛”和“应用孤岛”。
信息集成是消除“信息孤岛”和“应用孤岛”、避免资源浪费的根本途径。
进行信息集成,必须首先实现各系统之间的数据交换。
数据交换是指各业务信息系统之间在业务需求的基础上,通过定义数据接口或数据交换平台互相交换数据,实现系统之间的数据共享与互操作。
在原有业务系统之间建立的数据接口或数据交换平台,必须满足以下要求:源数据位置透明;在不改变原有系统安全策略的情况下,保证数据安全性;集成系统具有继承性;保证数据实时性:系统易于维护等。
1XML与XML Schema电子数据交换(Electronic Data Exchange,EDI)在传统的异构数据集成中发挥了重要作用。
但由于传统EDI业务规则固定、数据传输成本高等缺点使之已难以适应异构数据源快速变化和新业务规则迅速增长的需要,而XML则能很好地适应新形势下信息集成的要求。
可扩展标记语言(eXtensible Markup Language,XML)是一种元语言,能针对特定的应用定义自己的应用语言,并具有良好的数据存取格式、可扩展性和自描述性、高度结构化、便于网络传输等特点。
这些特点使XML有着巨大的伸缩性和灵活性,可以广泛应用于不同数据源间的数据交互、分布式运算、数据展现等应用中。
XML文档的结构、数据类型等可通过XML Schema来进行定义和描述。
XML Schema是一种描述信息结构的模型,它为XML文档建立了一个模式,规范了XML文档中的标记(tag)和文本(text)可能的组合形式。
基于XML的异构数据交换的研究摘要:本文对目前较常用的异构数据交换的技术进行了分析,总结了各种方法的优缺点。
借鉴虚拟法的数据集成的实现思想,结合实际应用中数据集成的需求,提出基于XML技术实现异构数据交换集成的解决方案。
该方案简单易行,各系统仍然按照原来的方式运行,共同部分只是XML文档,当需要进行信息交流时,通过中间件把本地数据库数据转换成XML数据文件即可。
关键词:信息孤岛数据转换方法数据仓库法虚拟法XML 随着Internet技术的迅速发展,许多单位或部门都逐步实现了信息化管理。
由于各部门的业务和功能归属不同,形成许多相互隔离的、由不同核心技术设计的信息服务和管理系统。
由于系统中数据的表示不同,系统间交换数据很困难,形成“信息孤岛”[1],从而使得各个系统无法保证数据的一致性。
1 常用的解决办法企业应用集成EAI(Enterprise ApplicationIntegration)是解决这一问题的方法之一。
EAI的定义是:“通过硬件、软件、标准和业务过程的结合,实现两个或多个应用系统的无缝集成,使它们能够统一运作”[2]。
按照不同的实现技术,集成方法可以分为三类:数据转换方法、数据仓库法和虚拟法。
(1)数据转换方法:通过转换工具在不同数据库之间进行模式映射,将一个数据库中的数据复制、转换为另一个数据库中的数据,从而实现数据库之间的转换。
此种方法技术简单,容易实现。
(2)数据仓库法:在客户端与数据源之间增加一个数据仓库层,用于存储来自各数据源要交换的数据,系统提供对这个数据仓库的查询机制。
好处是既可用于数据集成,又可用于决策支持查询。
但当数据源的数据发生变化时,数据仓库中的数据也要作相应的更新。
因此,这种体系结构还需要一些数据加载和增量更新等操作。
(3)虚拟法:该方法中数据仍保存在各数据源上,集成系统仅提供一个虚拟的集成视图和对该集成模式的查询请求转化成对各异构数据源的查询。
在这种体系结构中,中间层根本不存储数据,当客户端发出查询请求时,只需将查询发送到相应的数据源上。
XML安全技术在电子商务异构数据交换中的应用研究引言随着电子商务的快速发展,数据交换在商务环境中变得越来越常见。
在不同的企业、组织、应用程序之间交换数据时,面临着数据格式不统一、数据安全性等问题。
为了确保数据的安全性和完整性,XML在电子商务数据交换中扮演着重要的角色。
本文将重点讨论XML安全技术在电子商务异构数据交换中的应用,并对其进行深入研究。
1. XML简介XML(可扩展标记语言)是一种用于描述和传输数据的标记语言。
它的主要特点是自我描述性、自定义标签和可扩展性。
通过使用XML,数据可以以结构化的形式进行组织和存储,并且可以跨不同的应用程序和平台进行交换。
2. 异构数据交换的挑战在电子商务环境中,不同的应用程序和组织通常会使用不同的数据格式来存储和表示数据。
这就导致了异构数据交换的挑战,包括但不限于以下几个方面:2.1 数据格式不统一不同的应用程序和组织可能使用不同的数据格式,如CSV、JSON等。
这使得数据的解释和处理变得困难,增加了数据交换的复杂性。
2.2 数据安全性在不同组织之间交换数据时,数据的安全性是至关重要的。
未经保护的数据可能会面临泄露、篡改等风险。
因此,确保数据的机密性和完整性至关重要。
3. XML安全技术为了解决异构数据交换中的安全性问题,XML安全技术被广泛应用。
以下是几种常见的XML安全技术:3.1 XML数字签名XML数字签名是一种数字加密技术,用于确保XML数据的完整性和认证性。
通过数字签名,接收方可以验证发送方的身份,并确保数据未被篡改。
3.2 XML加密XML加密是一种用于保护敏感数据的加密技术。
通过XML加密,数据可以在传输过程中进行加密,确保只有授权的接收方才能解密和查看数据。
3.3 XML安全通信XML安全通信是一种用于保护XML数据传输的技术。
它使用安全协议,如SSL/TLS,确保数据在传输过程中不被窃听或篡改。
3.4 XML访问控制XML访问控制是一种用于控制对XML数据的访问权限的技术。
基于XML的异构数据库数据交换模型的研究与设计的开题报告一、选题背景随着互联网的快速发展,互联网应用越来越普及。
异构数据库面临着很大的挑战,数据应用的快速增长,数据的种类和格式越来越复杂,不同的数据库也越来越多。
因此异构数据库的数据交换和数据共享变得越来越困难。
基于XML的数据交换模型是目前广泛使用的一种数据交换模式,它能够方便地将不同数据库之间的数据进行转换和交换。
在异构数据库之间进行数据交换,基于XML的数据交换模型非常具有优势。
因此,本文将研究和设计基于XML的异构数据库数据交换模型,旨在提高异构数据库数据交换的效率和可靠性。
二、研究目的本文旨在探讨基于XML的异构数据库数据交换模型,并通过实验验证其效果,以提高异构数据库数据交换的效率和可靠性。
三、研究内容1. 研究基于XML的数据交换模型2. 系统分析不同数据库的数据类型和特点3. 基于XML设计异构数据库数据交换模型4. 实现基于XML的异构数据库数据交换5. 实验验证基于XML的异构数据库数据交换的效果四、研究方法本文将采用文献调研、实验验证等方法,探讨基于XML的异构数据库数据交换模型,并通过实验验证其效果。
文献调研:通过查阅相关文献,了解异构数据库的数据交换现状和基于XML的数据交换模型的研究进展。
实验验证:选取不同类型的数据库,实现基于XML的异构数据库数据交换,并比较不同方法、不同环境下的性能指标。
五、预期成果1. 探讨基于XML的数据交换模型2. 基于XML设计异构数据库数据交换模型3. 实现基于XML的异构数据库数据交换4. 实验验证基于XML的异构数据库数据交换的效果5. 提高异构数据库数据交换的效率和可靠性六、研究意义本研究可以为异构数据库之间数据交换提供一种新的方法,提高异构数据库数据交换的效率和可靠性,使得不同数据库之间数据的共享和交换更加方便和快捷。
基于XML的制造业应用软件异构数据库数据交换技术研究的开题报告一、选题的背景和意义随着制造业信息化的日趋完善,制造业企业在信息化建设中普遍采用了企业资源计划(ERP)系统,产品数据管理(PDM)系统,计划生产管理(PPM)系统等多种应用软件,这些应用软件形成了一个完整的信息系统。
信息系统在应用软件之间共享数据是一个重要问题,由于制造业应用软件的异构性,数据共享变得非常困难,难以实现数据的一致性和完整性。
在数据交换技术的研究领域中,很长一段时间都是以结构化数据格式为主,如数据库、表格等。
但是在面向异构多源数据的集成、共享和交换过程中,这些数据格式显得较为不便,因为各种应用软件所用的数据格式不同,传统的数据交换方式已经无法胜任这一任务。
基于XML的数据交换技术具有独特的优势,可以支持异构数据交换,同时可以将不同数据归一化,从而解决数据格式不同的问题,使得数据共享更为有效。
因此,基于XML的制造业应用软件异构数据库数据交换技术研究具有重要的理论和应用价值。
二、研究目的和内容本课题旨在对基于XML的制造业应用软件异构数据库数据交换技术进行研究。
通过对相关文献进行调研和分析,探索XML技术在异构数据库数据交换中的应用,设计和实现一个基于XML的异构数据库数据交换系统,验证XML技术在数据交换中的可行性和优越性。
具体包括以下内容:1. 调研当前数据交换技术的发展状况及应用现状,分析XML技术在异构数据库数据交换中的应用优势;2. 设计基于XML的异构数据库数据交换系统的总体结构,包括数据源选择、XML文档设计、数据转换和数据存储等模块;3. 实现基于XML的异构数据库数据交换系统,验证其可行性和优越性;4. 进行实验和测试,分析系统的性能和稳定性;5. 对研究结果进行总结和归纳,探讨XML技术在制造业应用软件异构数据库数据交换中的应用前景。
三、研究方法和技术路线本课题的研究方法主要包括文献调研、系统分析和实验研究等。
基于XML的异构数据交换模型的研究的开题报告一、选题背景与意义随着计算机和网络技术的飞速发展,越来越多的应用系统之间需要进行数据交换,数据的异构性也越来越明显。
不同的应用系统、不同的数据库管理系统等都可能采用不同的数据格式和数据结构来存储同一类数据。
因此,为了实现不同应用系统之间数据的有效交换和共享,需要设计一种有效的异构数据交换模型。
目前,基于XML的异构数据交换模型已经成为了一个研究热点。
XML作为一种通用的数据表示格式,被广泛应用于Web服务、电子商务等领域,具有良好的可扩展性和互操作性。
因此,使用XML作为异构数据交换的中间语言,可以有效地解决异构数据交换中数据格式和数据结构不同的问题。
二、研究内容和方法本文的研究内容是基于XML的异构数据交换模型的设计和实现。
具体包括以下几个方面:1.设计基于XML的异构数据交换模型,包括数据格式定义、数据结构映射、数据转换等方面的内容。
2.基于实际的应用场景,对异构数据进行建模和处理,以验证异构数据交换模型的可靠性和有效性。
3.实现异构数据交换模型的原型系统并进行评估。
本文采用的研究方法主要有文献综述、需求分析、设计实现、原型测试等。
通过对相关文献的综述和需求分析,提炼出基于XML的异构数据交换模型的需求和设计要点;在此基础上进行设计和实现,并通过原型测试来评估其可行性和可靠性。
三、预期成果与意义本文的预期成果是设计和实现基于XML的异构数据交换模型,并通过原型测试验证其可行性和可靠性。
具体包括以下几个方面:1.提出基于XML的异构数据交换模型的设计方案,包括数据格式定义、数据结构映射、数据转换等方面的内容。
2.实现异构数据交换模型的原型系统,并对其进行评估。
3.对异构数据交换模型的优缺点进行分析,并提出改进方案。
本文的成果具有以下意义:1.为不同应用系统之间的数据交换和共享提供了一种有效的解决方案,具有重要的应用价值。
2.为异构数据交换模型的研究提供了一个新的思路和方法,具有一定的学术价值。
基于XML的异构数据交换系统的研究与设计摘要:实现异构数据库系统之间的数据共享和数据互访,是信息化发展迫切需要解决的问题之一。
探讨了利用XML技术实现异构数据库之间的数据交换,提出了异构数据交换系统的模型。
关键词:异构数据;数据交换;XML0引言目前,信息化建设渗透到各个领域,已经成为政府机构和企事业单位发展的重要手段和战略选择。
由于初期阶段,信息化未得到统一规划和统筹安排,各个职能领域的管理平台或系统相对独立,系统间的数据流通困难,相当数量的政府机构和企事业单位都积累了大量的基于不同平台和数据库管理系统的数据以及众多的非结构化数据,造成了多数据库并存的异构问题,严重阻碍了信息化的深化及数据的使用。
如何实现异构数据库系统之间的数据共享和数据互访,是信息化发展迫切需要解决的问题之一。
1XML与异构数据1.1XML简介可标记扩展语言XML(ExtensibleMarkupLanguage)是由W3C 的XML工作组制订的,它是一种通用的标记语言,是特别设计的一组定义语义标记的规则。
XML适用于异构数据的交换,它具有如下特点:(1)XML具有自描述性,可以不预先规定数据结构,非常适用于不同应用间的数据库交换,在数据交换中使用XML,开发人员可以方便地使用自定义的标记来描述数据。
(2)XML具有可扩展性,用户在遵守标记命名规则的前提下,可以在XML文档中增加有意义并且能供用户使用的标记。
(3)XML具有跨平台性,XML文件无论是在Windows平台、Unix平台或是其他平台上,含意都是一样的。
(4)XML文件不仅包含数据,还包含了数据的数据结构。
XML 文档不需要结构描述部分,它自身的层次关系就可以体现数据结构,能非常清晰地表达数据间的依赖关系。
(5)互联网是XML的最大的载体,与传统的电子数据交换的V AN联网方式相比,互联网具有成本较低、连接广泛、扩展性好的特点。
XML的扩展性允许它描述不同种类的数据,又由于基于XML 的数据是自我描述的,数据不需要有内部描述就能被交换和处理,所以XML能够使不同来源的结构化数据很容易在不同操作系统、数据库和应用软件之间进行数据交换和集成,以做进一步处理。
基于XML的异构数据集成研究及应用的开题报告题目:基于XML的异构数据集成研究及应用一、研究背景随着互联网应用的快速发展,数据的多样性成为了数据管理领域面临的一个重要挑战。
在现实生活中,不同组织和应用系统的数据格式、数据结构和数据语义常常是各不相同的,这些数据之间缺乏一致性和集成性,给数据管理和应用带来了诸多问题。
而异构数据集成技术则是解决这些问题的重要手段,它能够将多个数据源中的数据进行整合和转换,以满足用户的查询和分析需求。
作为一种基本的数据交换和共享格式,XML(可扩展标记语言)具有语言中立、灵活性高、数据自描述、数据可扩展性强等优点,在异构数据集成中得到了广泛应用。
本研究将探讨如何利用XML技术对异构数据进行集成,并将其应用于实际数据管理和应用场景中,以提高数据的集成性、一致性和可用性。
二、研究内容1. 异构数据的概念与特点2. XML技术的特点和应用3. 异构数据的XML集成技术研究与实现4. 基于XML的异构数据集成系统设计与实现5. 异构数据集成的应用案例分析与评价三、研究目标1. 研究XML技术在异构数据集成中的应用方法和关键技术。
2. 设计和实现基于XML的异构数据集成系统。
3. 探索基于XML的异构数据集成在实际应用中的可行性和有效性。
四、研究方法本研究采用文献综述法、实验室实验法和案例分析法相结合的方法,通过对相关文献进行调研和分析,设计并实现基于XML的异构数据集成系统,并对其进行应用案例分析和评价。
五、预期成果1. 研究异构数据集成中XML技术的应用方法和关键技术,为相关领域的研究和实践提供参考。
2. 设计并实现基于XML的异构数据集成系统,提高数据的一致性和可用性,为实际应用提供技术支持。
3. 探索基于XML的异构数据集成在实际应用中的可行性和有效性,为实践提供一定的理论和实践价值。
3 2010204206收到,2010206223改回33 李 沐,女,1985年生,在读硕士,研究方向:人工智能。
文章编号:100325850(2010)0820037204基于X ML 的异构数据交换技术的研究Research on Heterogeneous Da ta Exchange ba sed on X ML李 沐 谢红薇(太原理工大学计算机与软件学院 太原 030024)【摘 要】随着电子政务的不断发展,政府的各个部门间需要交换的数据日益繁重,因此,基于电子政务的异构数据交换技术的研究显得格外重要。
论文提出了基于XM L 的异构数据交换技术,使用XM L 可以将来自异构系统的不同数据源的数据很容易的集成在一起,应用软件可以在中间层的服务器上对后台数据库的数据进行集成,然后以XM L 格式发送给客户端或其他服务器。
客户端在接收到数据以后,可以使用本地软件来解析数据,并对数据作进一步处理,这样就能有效地解决网络中日益繁重的异构数据交换问题。
【关键词】XM L ,数据交换,异构系统中图分类号:T P 3111138文献标识码:AABSTRACT W ith the continuous developm ent of e 2governm ent ,data w h ich needs to be exchanged betw een vari ous governm ent departm ents is becom ing heavier 1T herefo re ,the research based on data exchange of e 2governm ent system s in heterogeneous system s is particularly i m po rtant 1U se the X M L can integrate the data from different data sources very easy 1A pp licati on softw are can integrate data from back 2end database server in the m iddle level ,and then ,send data to the client o r o ther servers in X M L fo r m at 1T he local softw are can parse the received data ,and use the data fo r further p rocessing 1T h is can so lve the increasingly seri ous p roblem of heterogeneous data exchange in the netw o rk 1KEYWOR D S X M L ,data exchange ,heterogeneous system s 近年来,随着信息技术的不断发展,政府的各个部门都建立了基于各种数据库的信息管理系统,由于建设初期各种资源和技术的限制,各个部门采用的网络环境、操作系统和数据库系统都有所差异,因此数据共享比较困难,形成了众多信息孤岛。
然而随着电子政务的不断发展,各部门之间需要交换的数据日益繁重,异构系统数据交换技术的研究显得格外重要。
异构系统的异构性主要包括以下几个方面:①网络环境的异构:网络的拓扑结构、通信协议的异构等;②操作系统的异构:操作系统可以是L inux 、U n ix 、W indow s 等;③数据库管理系统的异构:可以是数据模型相同厂商不同的数据库系统,如SQL Server 、O racle 、DB 2等,它们都是关系数据库,但数据的存储模式不同,数据处理语言也不同;也可以是数据模型不同的数据库系统,如层次模型、网状模型、关系模型以及面向对象模型等。
目前,政府部门的数据异构主要是数据库管理系统的异构,因此异构交换技术主要实现的是异构数据库系统间的数据交换。
目前常见的异构数据交换技术可以分为电子数据交换(ED I )方式、中间数据库法、中介层方式、数据仓库方式、中间数据方式等几种方式,各有其优缺点[1]。
本文提出一种理想的基于XM L 技术的异构系统数据交换技术,此技术是通过数据交换中间件实现的,它可以处理日益繁多的电子政务需要交换的数据。
由于XM L 文档本身是纯文本格式的,良好的数据存储格式使得XM L 文档能方便有效的在网络中传输,而且XM L 采用结构化的方式来组织数据,使数据具有统一的格式,方便其他应用程序对数据做进一步处理,因此,XM L 是目前最好的数据交换的标准。
1 XM L 技术的优势XM L 是Ex ten sib le M arkup L anguage 的缩写,意为可扩展置标语言,用于置标电子文档,使其数据具有结构化的格式[3]。
XM L 作为SG M L 的一个子集,保留了SG M L 的强大功能,降低了SG M L 的复杂性,使其具有强大的扩展性和灵活性。
在各种应用中XM L 都有一定的优点,如:①由于XM L 本身是纯文本格式的,可以很轻松的实现数据在W eb 上发布,而且描述的数据具有统一的格式,其他程序可以对数据作进一步处理,有利于开发灵活的W eb 应用程序;②XM L 采用结构化的方式描述的是数据的本身,数据的显示要使用CSS 和XSL 以及XSL T 来控制,这样用户可以使用丰富的样式来显示数据;③使用XM L 可以将来自不同数据源的数据很容易的集成在一起,应用软件可以在中间层的服务器上对后台数据库的数据进行集成,然后以XM L 格式发送给客户端或其他服务器,接收到数据以后可以使用本地的软件来解析数据,并对数据作进一步处理,XM L 文档的DOM 模型允许使用脚本或其他程序设计语言来处理文档中的数据,使数据的转换具有了灵活性,这样有利于解决网络中日益繁重的异构数据交换问题。
本文就是利用XM L 的这些特性来实现异构数据交换的。
2 基于XM L 的异构数据交换的总体过程由于系统的异构性,需要交换的数据具有多个数据源,不同数据源的数据模式可能不同,导致源数据和目标数据在结构上存在差异。
在进行数据交换时,首先必须将数据模以统一的XM L 格式来描述,这就需要使用XM L 的D TD 或XM L Schem a 来定义文档的结构,D TD 定义XM L 文档的基本结构,但不涉及到任何有关的实际数据,通过定义适当的D TD 将源数据库中的数据转换成XM L 文档,然后使用DOM 技术来解析XM L 文档,这样就可以将XM L 文档中的数据存入目标数据库,从而实现了异构数据的交换。
由于D TD 文档定义的数据结构与源数据库中得数据结构保持一致,这样保证了生成的XM L 文档与源数据库中数据的保持一致。
其总体交换过程如图1所示。
3 数据库数据与XM L 文档的映射原理在XM L 数据和数据库之间转换时,需要考虑许多问题,XM L 不支持任何有实际意义的数据模型,所有XM L 文档中的数据都会被当成纯文本处理。
通常数据转换中间件需要把XM L 文档中的纯文本转换成数据库的数据类型,或把数据库的数据类型转换为纯文本的XM L 格式。
在XM L 文档结构和数据库模式结构之间进行相互映射,一般有两种映射方法:模板驱动映射与模型驱动映射。
311 模板驱动映射基于模板驱动的映射是一种浅层次的映射[4],是一种基于模板的D TD 到关系模式的转换算法,其转换比较简单,只要给出模板,就可以快速生成相应XM L 文档。
基于模板的映射方法不用预定义XM L 数据与数据库数据之间的映射关系,只是在XM L 文档中嵌入带参数的SQL 命令,这些模板中的命令由数据转换中间件来处理,在转换过程中被识别和执行,将执行的结果替换到命令所在的位置上,从而生成XM L 文档。
因为使用模板驱动映射在数据转换时需要生成大量合理的模板,所以系统要为用户提供生成模板的工具,以及相应的指令执行程序。
其过程如图2所示。
在下面的模板中,用<Select >元素内嵌了SEL ECT 语句,从而可以查询数据库中的公文信息,并将其以XM L 文档输出:<?xm l versi on ="110"encoding ="gb 2312"?><公文><Intro >查到的公文信息如下:< Intro ><Select >SEL ECT 发文字号,发文机关标识,缓急时限,标题FROM 公文< Select >< 公文>当数据转换中间件处理该文件时,每个SEL ECT 语句都会用数据库的查询结果来替换,从而形成XM L 文档,其转换结果是:<?xm l versi on ="110"encoding ="gb 2312"?><公文><Intro >查到的公文信息如下:< Intro ><发文字号>晋政发〔2010〕4号< 发文字号><发文机关标识>山西省人民政府文件< 发文机关标识><缓急时限>普件< 缓急时限><标题>山西省人民政府关于促进房地产市场平稳健康发展的通知< 标题>< 公文>基于模板映射的优点是转换步骤简单,查询语言灵活性大,支持通过H T T P 的传递参数,允许嵌套查询,支持SEL ECT 语句的参数化,支持编程结构,如可以由程序构建loop 循环或if 判断等。
目前大多数的数据库产品都属于模板映射,如SQL Server 、DB 2和O racle 等。
缺点是模板驱动映射是以XM L 内嵌的SQL 执行的数据结果集为依据,不涉及数据库赖以存在的数据模型,它只能将关系数据库的数据转换为XM L 文档,并舍弃了关系模式的约束条件,所以也不支持反向的转换。
312 模型驱动映射模型驱动映射是一种深层次的映射,其原理是利用XM L 文档中的数据模型的结构显性或隐性地映射成其他数据模型的结构。
要实现数据库和XM L 文档间的数据转换的关键是在数据库模式和XM L Schem as 或D TD 之间建立映射关系,用具体的模型来实现数据间的映射。
通常关系数据库利用关系模型,面向对象数据库利用对象模型,而XM L 文档依赖的是Schem as 或D TD 。
当数据从数据库转换成XM L 文档时,因为依照得是单个模型,通常需要结合XSL 来控制模板驱动,从而保证了系统的灵活性。