当前位置:文档之家› 基于J2EE和XML的数据集成技术

基于J2EE和XML的数据集成技术

科技信息2013年第5期

SCIENCE&TECHNOLOGYINFORMATION0引言

J2EE 是企业级应用开发的主流平台,它通过基于组件的程序模

型为分布式应用提供统一的标准,包括多层的分布式应用模型、组件重用策略、一致化的安全模型等,它作为一个开放的标准,所开发出来的平台或组件不会被束缚在任何厂商和API 上。然而,在企业的信息化建设过程中,各企业和及部门根据各自的信息要求和特定的应用开发了不同数据库源的应用系统,如何将这些应用系统数据集成,在企业内部或企业之间给企业用户提供企业数据一个统一透明的访问界面,并根据集成之后的数据及时调整业务和策略,对企业有十分重要的意义。

1

数据集成方法

1.1

数据集成的概念

数据集成的目的是运用一定的技术手段将异构数据源按照一定规则组织成一个整体,使用户能有效地对数据进行操作,并在统一的用户界面上显示,其他用户能够透明地访问这些数据源,而不必考虑应该从哪一个数据源获取所需数据或者需要使用哪种接口访问这些数据源。异构数据源集成系统提供了底层数据源存储数据的“全局视图”,使用户操作所有数据源就像操作一个数据源一样,多个数据源的存在对用户来说是透明的,无数用户好像只对一个单一数据源进行操作一样。

1.2基于J2EE 与XML 数据集成原理

由于J2EE 的体系结构分为客户层、Web 层、业务层和企业信息系统层(EIS ),它们为企业应用开发提供了一个标准化的、组件化的、分布式的多层架构开发平台,同时,XML 作为数据表示与交换的标准,提供表示数据结构和内容的通用格式,具有跨平台的能力,可为来自不同数据源的数据无缝集成,能为数据提供统一的接口。为此,在处理异构数据源集成问题上,可充分发挥J2EE 多层组件化的特点与XML 跨平台优点二者技术的结合,构建基于XML 数据集成模型。模型设计目标主要有以下几点:①能解决数据的异构性问题,使不同格式、不同关系型或面向对象型数据库系统中的数据能够相互交流和转换;②使应用程序能够统一、透明、高效地访问和操纵各种分布、异构的数据资源,使企业能够方便管理和访问位于不同硬件平台、操作系统、网络协议和数据管理系统中的数据,快速地将数据资源转化为信息资源,为企业及时了解市场,以便调整业务策略;③保持已有系统的自治性,在进行数据集成的同时不能影响已有系统的正常运行。

2

数据集成模型

2.1

结构体系

本文J2EE 和XML 的异构数据源数据集成模型采用中间件模式,即在数据源和应用/逻辑层之间构建一个中间件模块,从而屏蔽底层各数据源,以统一的全局模式数据呈现给应用/逻辑层。通过对全局查询语言的分解形成对各底层数据源的子查询,并最终通过子查询的执行得到应用/逻辑层要求的查询结果。模型主要包括两级映射:一是,底层数据模式与数据源的输出模式之间的映射,需将所有异构数据源的模式都必须转化为XML 的输出模式,实现与XML 的数据交换;二是,局部数据源的输出模式与XML 全局数据模式之间的映射,这是集成模式生成全局模式的前提,通过全局模式给应用/逻辑层提供对底层数据库的透明访问。模型包括两个核心部分,模式集成和查询处理,

集成模型的核心模块分为中介器和包装器,它们完成大部分的集成任务,其体系结构如图1所示。

图1基于J2EE 和XML 的数据集成体系结构

2.2

中介器

中介器处于应用/逻辑层与底层数据库之间,是两者之间沟通的桥梁。它提供异构数据源的统一视图和XQuery 语言的查询访问,它包括了查询解析、分解和查询结果合并等过程。当用户有查询请求时,XQuery 解析器首先检查语句的语法,如果查询语法正确,生成查询结构,否则,返回错误提示信息。然后查询分解器根据数据源描述信息及映射规则针对全局模式的查询分解成针对每个数据源输出模式的子查询。其中,数据源描述信息来自各异构数据源的元数据信息,每各异构数据源注入该集成模型时,都必须在中介器注册/配置其数据源描述信息,而映射规则由局部数据源输出模式生成全局模式时产生。最后,查询结果合并器根据数据源描述信息和映射规则,将来自各异构数据源的查询结果整合成XML 全局模式数据,为应用/逻辑层提供统一的数据视图。2.2.2包装器

包装器处于数据源与中介器之间,包装器主要的任务是包装数据源的模式与数据。包装数据源模式就是把异构的数据源用统一的模式显示出来,即把各异构数据源的局部模式转化为统一的全局模式;包装数据就是将从各个数据源获得的查询结果转换成相同的数据格式。包装器负责中介器与底层数据源间的通信,它是用于访问底层数据库的SQL/OQL 包装器。在本文数据集成模型中包装器实现把数据源输出模式的查询转换成实际数据源能够处理的SQL 查询,并将获得的结果转换成XML 形式。从中介器的角度看包装器,它能够执行中介器传来的针对一个局部的数据源的查询,返回给中介器XML 形式的结果。从数据源的角度看包装器,它相当于数据源的外壳,不影响数据源本身,所以保持了数据源本身的自治性及数据源的透明性。

3

数据集成模型的关键技术关键

3.1

数据源与XML 之间的相互映射问题

中介器和包装器是J2EE 与XML 集成模型重点,在这两个模块实现模式集成和查询处理关键之一是要实现数据源与XML 之间的相互映射,由于目前企业使用的主流数据库以关系型数据库RDB 为主,因此本文提出的数据集成模型主要针对和考虑RDB 数据源。RDB 与XML 之间相互映射的算法主要对XML Schema 处理。映射算法的基本

基于J2EE和XML的数据集成技术研究

刘雍1陈振中2

(1.琼州学院电子信息工程学院,海南三亚572022;2.海南大学信息学院,海南海口572000)

【摘要】本文提出了一种基于J2EE 和XML 的数据集成模型,采用了中间件系统模式的集成方式,使用XML Schema 作为异构数据源的公共数据模型,以全局模式的数据视图呈现给应用层或用户,从而屏蔽后台,实现用户对异构数据源的透明访问。在查询处理上采用了XQuery 作为全局查询语言,为应用层或用户提供统一的查询接口。此模型利用J2EE 企业平台的优势和XML 数据与结构相分离的特点,为J2EE 和XML 的集成模型提供了较强的跨平台性、可移植性和可扩展性。

【关键词】J2EE ;数据集成;XML

作者简介:刘雍(1979—),女,四川阆中人,硕士,琼州学院电子信息工程学院,讲师,主要从事数据库与嵌入式软件开发

○IT论坛○

103

相关主题
文本预览
相关文档 最新文档