一种基于XML的异构数据库集成方法
- 格式:pdf
- 大小:237.42 KB
- 文档页数:3
科技资讯S I N &T NOLOGY I NFORM TI O N随着网络的发展,特别是在信息化时代和全球经济竞争的新环境下,数据资源的共享己经成为一个热门并且需要解决的问题。
基于XML 的数据集成中间件就是解决信息孤岛问题的一种很好的方法。
本文利用X ML 和中间件技术,提出一种基于X M L 和中间件的数据集成方案。
通过该中间件,可将各种异构数据库集成在一起,并为高层提供一个统一的访问服务接口。
1数据集成框架模型在进行集成分析和设计时可以把各个应用系统作为一个单独的应用模块加以考虑。
本文在对XM L 技术进行分析探讨的基础上,设计了以下模型,如图1所示。
图1该模型由以下四层组成:1.1客户端层用户交互界面,接受用户的信息请求并返回请求结果。
1.2W e b 层为企业提供We b 服务,包括信息的发布、交互和处理的功能。
只存在于基于We b 的分布式企业信息系统中。
1.3业务层数据集成中间件封装了系统的业务逻辑,提供集成的业务服务,构成系统的业务层。
接收客户端的查询请求,接收来自数据库的源数据格式的查询结果,并将其转化为X ML 文档。
合成的XML 文档经语法分析、处理,协同XS L ,依据客户端要求的文件格式返回。
1.4数据库层处于最底层,是系统的数据提供者,分布于各个需要集成的异构数据库。
2模型分析本集成模型与包装器/调节器模型的类似之处在于:l )翻译器类似于包装器,两者实现对底层数据库的包装,为用户提供透明访问;2)对应于调节器,本模型提供了转换器和集成器,都实现对包装翻译过的信息的进一步集成。
不同之处在于:l )包装器/调节器模型中包装器与数据库需要一一对应,而本共享模型只需要实现一个统一的翻译器;2)包装器需与调节器一一对应,因此不利于系统扩展。
而本共享模型,增加一个数据源。
不必重新实现翻译器、转换器和集成器,只需提供数据源的连接信息和翻译、转换、集成的必要信息;3)对于用户查询,调节器将查询请求分解为包装器可以执行的小查询,派发给包装器,并组合查询结果。
基于XML的异构数据集成方案一、设计任务设计出基于XML的异构数据集成方案,具体要求:i. 数据源包括:结构化数据、非结构化数据和半结构化数据ii. 实现功能包括:能够用统一的方式实现查询等处理iii. 应用的技术为XML技术,实现异构数据集成二、设计应用的具体集成方法2.1异构数据集成方法简介:异构数据集成方法包括:模式集成和数据复制方法。
1、模式集成方法中的数据仍保存在各数据源上,由集成系统提供一个虚拟的集成视图(即全局模式)以及全局模式查询的处理机制。
用户直接在全局模式的基础上提交请求,由数据集成系统处理这些请求,转换成各个数据源在本地数据视图基础上能够执行的请求。
2、数据复制方法将各个数据源的数据复制到与其相关的其它数据源上,并维护数据源整体上的数据一致性、提高信息共享利用的效率。
3、模式集成包括:联邦数据库和中间件集成方法是现有的两种典型的模式集成方法。
4、数据复制方法:数据仓库方法。
2.2异构数据集成方案分析1.联邦数据库数据集成联邦数据库是数据库集成的最简单结构,将所有组件数据库进行一对一的连接为了实现各个数据库和其它数据库数据之间的互操作,需要解决各个数据库之间的格式冲突问题,就要为每一个数据库向其它数据库的数据类型转换提供转换规则。
这就是说这样的异构数据库系统需要建立NX(N一1)/2个转换规则,或者说要编写N X (N一1)/2段代码来支持两两之间的查询访问。
在联邦数据库数据集成方式中,如果要向系统中加入新的节点,就需要再建立很多转换规则,并且为系统之间只有通过编写软件来实现互相的信息正确地传递,这样做既费时又费工。
如果各个子系统需要修改,那么会带来更多的问题,大大影响了系统的可扩展性、移植性和稳定性。
其模型示意图如下图所示:图1 联邦数据库集成方法示意图2中间件集成方法中间件数据集成基于一个“公共数据模型”,实质上数据仍旧保存在各个参加集成的数据源中,通过各数据源的“包装器’将数据虚拟成公共数据模式,用户的查询是基于公共数据模式基础上的,即建立基于公共数据模式的虚拟数据库集成系统。