异构数据库在高校管理信息系统整合中的应用
- 格式:doc
- 大小:29.50 KB
- 文档页数:5
高校信息化三大平台功能补充一、门户平台(1)门户平台系统集成•系统集成是门户的重要价值点。
•系统集成按照集成深度可分为:界面集成、数据集成、应用集成。
界面集成如不同业务系统的界面统一集成为火麒麟门户界面;数据集成典型的如基于全局库(共享库)开发查询类应用,如一卡通查询;应用集成往往涉及多个应用,并基于这些应用进行流程重编排,产生出新的价值点. (2)提供服务:信息门户的作用在于为数字化校园提供以下三个方面的服务:整合数据:搜集和组织大量的、未相互连接的、分散数据;发布信息:将这些数据以一种易用的、可定制的、基于浏览器的界面呈现给各类用户.信息访问:通过多种访问机制,使用户可以不受时间、地点的约束进行访问。
二、数据交换平台(1)数据交换平台是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为高校提供全面的数据共享。
(2)数据集成平台通过统一的全局数据模型来访问异构的数据库、遗留系统、Web 资源等。
它位于异构数据源系统(数据层) 之间,向下协调各数据源系统,向上可以为访问集成数据的应用提供统一数据模式和数据访问的通用接口。
(3)实施步骤:1)建立学校级的数据交换中心;2)和学校信息建设办公室或信息化领导小组确定需要进行数据交换的部门;3)对每一个部门进行数据交换规则调研,并由学校最终确定交换规则;4)对已有系统的部门进行原有系统调研,并确认不同系统之间的数据接口;5)改造数据接口;6)整合各个部门数据,并按照交换规则进行数据交换;7)完成数据交换后和原有系统并行试用一段时间,确定交换准确性和可行性;三、统一身份认证:(1)数字身份管理:统一用户数字身份管理主要实现用户资源的统一管理和维护,实现全局范围的统一用户管理与授权系统,从而实现人员、组织、角色、工作组、应用的集中逻辑互连管理。
根据学校用户管理比较分散的特点,提供从权威数据采集用户数据,并实时更新目录服务器中的用户数据,提供:⏹数据源采集点和采集周期定义;⏹数据源变化跟踪和自动采集.(2)应用系统认证管理:身份认证及权限管理系统存放应用系统的配置信息,对新建应用系统使用同一资源管理进行人员身份认证,也可进行访问权限控制和进行单点登录等,对原有系统人员基本信息可与目录服务中的人员基本信息进行统一和同步。
多源异构数据融合的方法研究及应用随着互联网的发展和信息技术的普及,越来越多的数据产生和存储在不同的系统和平台中,这些数据有可能是结构化数据,如关系型数据库,也有可能是非结构化或半结构化数据,如文本、图片、音频、视频等。
由于数据来源和格式的多样性,企业在分析和利用数据方面面临很多难题。
多源异构数据融合技术应运而生,它可以将来自不同系统和平台的数据进行整合,形成一张全局视图,为企业提供更准确和全面的数据分析和应用支持。
一、多源异构数据的特点1.来源多样化。
多源异构数据有可能来自不同的系统和平台,如关系型数据库、文本、图片、音频、视频等。
2.格式不一致性。
由于数据来源的多样性,数据的格式也存在着差异,如数据的结构、记录、字段名、编码、精度等方面。
3.数据质量不可靠。
由于数据来源的不确定性和数据收集的不完全性,数据的质量可能会存在着各种问题,如重复、缺失、错误、无效、不一致等。
4.数据量庞大。
多源异构数据的规模通常很大,可能存在着海量的数据,需要进行有效的存储、管理和分析。
二、多源异构数据融合的方法1.数据预处理。
在数据融合之前需要对原始数据进行预处理,包括数据清洗、去重、存储、标准化等。
数据清洗可以将无效数据或异常数据进行删除或修复;去重可以避免重复数据的出现;存储可以选择适当的数据存储格式和机制以便于后续的数据访问和管理;标准化可以将不同格式或表示的数据转换成一致的形式。
2.数据集成。
数据集成是将原始数据进行整合,以便于生成一张全局视图。
数据集成的核心就是实现数据的对齐和匹配,将不同数据源中的相应数据元素进行匹配和对齐,以便于构成一个全视图。
数据集成的方式可以有两种,即逻辑集成和物理集成。
逻辑集成是指通过一定的方式来定义数据元素之间的关系,物理集成是指将数据元素存储到同一个物理位置下。
3.数据匹配。
数据匹配是数据融合过程中最关键和难点的一个环节,主要是对数据元素进行对齐和匹配,以便于生成全局视图。
数据匹配一般由两个步骤组成,一是对数据元素进行规范化处理,二是对数据元素进行相似度计算和匹配。
多源异构数据融合技术的应用随着信息技术的不断发展,大量的数据被积累和存储下来,各种数据格式和来源也变得越来越多样化。
在这样的背景下,多源异构数据融合技术应运而生。
本文将探索这种技术的应用,以及它对我们的生活和工作所产生的巨大影响。
一、多源异构数据融合技术的概念多源异构数据融合技术是指将来自不同数据来源的异构数据进行分析、处理、整合和提炼,以达到获得更准确、更完整信息的目的,是一种综合利用信息的技术手段。
这种技术可以将数据之间的联系和内在规律展现出来,帮助人们更好地理解数据背后的本质和规律性。
多源异构数据融合技术已经被广泛应用于人工智能、大数据分析、信息安全等领域。
二、多源异构数据融合技术的应用1. 智慧城市建设随着城市化进程的加速,人们对城市的生活环境和公共服务的要求越来越高。
多源异构数据融合技术可以利用从城市中不同的传感器、监测器和其他设备中收集到的数据信息,进行数据整合和分析,实现对公共交通、环境质量、市政设施等方面的实时监管和管理。
2. 医疗行业在医疗行业中,多源异构数据融合技术可以将临床、医学、人口统计等资料进行综合分析,获得更真实和细致的疾病监测和预测数据。
此外,它还可以通过对医疗信息的整合分析,为病人提供更好地医疗服务和个性化治疗方案。
3. 金融行业在金融领域,多源异构数据融合技术通过将来自政府、企业、银行等各数据源的数据进行整合分析,为投资者提供更准确、更全面的市场分析和决策支持。
在风险管理、投资决策、市场分析等方面,多源异构数据融合技术都发挥着重要的作用。
三、多源异构数据融合技术的发展趋势随着人工智能和大数据技术的不断发展,多源异构数据融合技术也迎来了快速的发展期。
未来,它将有望从数据整合和分析的基础工具向一种智能化的数据决策辅助系统方向发展。
预计未来的多源异构数据融合技术将具备更高效率、更高精度、更加场景化的特点。
总之,多源异构数据融合技术是在大数据、人工智能等领域里必不可少的技术手段。
异构数据集成框架设计及应用异构数据集成框架是一种用于整合不同数据源的技术,它能够有效地将异构数据源中的数据进行整合和转换,为用户提供一致的视图和访问接口。
在当今大数据时代,由于不同组织和系统之间存在着各种异构的数据源,如关系数据库、NoSQL数据库、文件系统等,如何将这些异构数据整合起来成为了一个重要的问题。
本文将介绍异构数据集成框架的设计原理、关键技术以及应用场景,并探讨其在实际应用中的挑战和未来发展方向。
一、设计原理1.1 数据源抽象与封装在设计异构数据集成框架时,首先需要对不同类型的数据源进行抽象与封装。
通过定义统一的接口和规范,将各种类型的数据库、文件系统等不同类型的数据源进行封装,并提供统一的访问接口。
这样可以屏蔽底层细节,使用户能够以统一方式对各种类型的数据进行操作。
1.2 数据转换与映射由于不同类型的数据库或文件系统之间存在着差异性,在进行异构数据集成时需要对不同格式或结构化程度较低的原始数据进行转换和映射。
通过定义数据模型和映射规则,将不同数据源中的数据映射到统一的模型中,使得用户可以以一致的方式对数据进行查询和分析。
1.3 数据一致性与冲突解决在进行异构数据集成时,不同数据源中的数据可能存在一致性问题或冲突。
例如,同一个实体在不同数据库中可能存在多个副本或不一致的信息。
因此,在设计异构数据集成框架时需要考虑如何解决这些问题。
可以通过定义一致性规则和冲突解决策略来保证整合后的数据的准确性和完整性。
1.4 数据访问与查询优化为了提高异构数据集成框架的查询效率,需要设计高效的查询优化算法。
通过对用户查询进行解析和优化,在执行阶段选择合适的执行计划,并利用索引等技术提高查询效率。
同时,还可以利用缓存技术和分布式计算等方式提高系统整体性能。
二、关键技术2.1 元数据管理元数据管理是异构数据集成框架设计中非常重要的一个环节。
通过建立元数据库来管理各种类型数据库或文件系统中存储着关于表结构、索引、关系等信息,并为用户提供元数据库访问接口。
随着人工智能技术的发展,深度学习已经成为了处理各种复杂任务的重要工具。
而在深度学习中,如何处理和融合异构数据成为了一个重要的问题。
异构数据指的是不同来源、不同结构、不同类型的数据,包括了文本、图像、音频、视频等等。
在深度学习中,如何有效地处理和融合这些异构数据,成为了一个具有挑战性的课题。
一、异构数据处理的挑战在深度学习中,由于异构数据的多样性和复杂性,数据间存在着不同的分布特性和数据间的关联性,这给异构数据的处理带来了挑战。
以文本和图像为例,文本数据是离散的,而图像数据是连续的。
如何将这两种不同类型的数据有效地融合在一起,成为了一个需要解决的问题。
此外,由于不同类型数据的特征表示方式不同,还带来了数据融合的复杂性。
在深度学习中,如何解决异构数据处理的挑战,成为了一个重要的研究方向。
二、异构数据处理的方法为了解决异构数据处理的挑战,研究者提出了许多方法。
其中一种常用的方法是特征融合。
特征融合是指将不同类型的特征进行有效地融合,以提高深度学习模型的性能。
在文本和图像的融合中,可以将文本数据和图像数据分别输入到不同的神经网络中进行特征学习,然后将两种类型的特征进行融合。
另一种方法是多模态融合。
多模态融合是指将不同类型的数据在模态层面上进行融合,以提高深度学习模型的性能。
在文本和图像的融合中,可以将文本数据和图像数据输入到同一个神经网络中进行融合,以得到更好的性能。
除了特征融合和多模态融合外,还有一些其他的方法来处理异构数据。
例如,可以使用生成对抗网络(GAN)来进行数据融合。
生成对抗网络是一种由生成器和判别器组成的模型,可以通过对抗训练的方式来进行数据融合。
在处理文本和图像的融合中,可以使用生成对抗网络来生成文本描述图像的内容,从而实现文本和图像的融合。
此外,还可以使用迁移学习的方法来处理异构数据。
迁移学习是指将已有的知识从一个任务迁移到另一个任务上,以加快模型的训练和提高模型的性能。
在处理异构数据时,可以使用迁移学习的方法来将已有的知识从一个数据集迁移到另一个数据集上,以提高深度学习模型的性能。
异构数据融合中的数据治理与管理技术研究随着信息技术的快速发展和互联网的广泛应用,各个行业和领域中产生了大量的异构数据。
这些异构数据来源广泛,格式不一,难以统一管理和融合。
因此,研究如何进行异构数据融合中的数据治理与管理成为了一个重要课题。
本文将从理论和实践两个方面探讨这一课题,并提出相应的解决方案。
首先,我们需要明确什么是异构数据。
异构数据是指来自不同来源、不同格式、不同结构、不同语义的各种类型的数据。
例如,结构化数据库中存储着大量关系型表格;文本文件中包含了大量自然语言文本;图像文件包含了大量图像信息等等。
这些异构数据之间存在着巨大差异,如何将它们进行融合并提取有用信息成为了一个挑战。
在进行异构数据融合之前,我们首先需要进行数据治理与管理。
所谓“治理”是指对于各种类型、来源、格式等差异性较大的原始数据进行整理、清洗和标准化等操作;而“管理”是指对于整理好的数据进行存储、索引和查询等操作。
数据治理与管理的目的是为了提高数据的质量和可用性,为后续的数据融合提供良好的基础。
在进行数据治理与管理时,我们需要解决以下几个关键问题。
首先是数据清洗。
由于异构数据来源广泛,其质量参差不齐,可能存在错误、冗余、不一致等问题。
因此,我们需要对原始数据进行清洗操作,去除其中的噪声和错误,并保证其一致性和准确性。
其次是数据标准化。
由于异构数据存在不同格式和结构,我们需要对其进行标准化操作,使得它们能够在同一平台上进行统一管理和融合。
最后是数据集成与索引。
异构数据融合需要将各个来源、格式、结构等差异较大的原始数据集成到一个统一的平台上,并建立索引以便于后续查询。
在实践中,我们可以借鉴一些已有技术来解决上述问题。
首先是使用机器学习算法来进行自动化清洗操作。
机器学习算法可以通过学习大量样本来自动识别并去除噪声和错误,并提高清洗效率和准确性。
其次是使用本体论技术来进行数据标准化操作。
本体论技术可以对异构数据进行语义建模,使得它们能够在同一平台上进行统一管理和融合。
多源异构数据融合与管理技术研究在当今的数字化时代,数据已经成为企业和机构中最重要的资产之一。
这些数据来自不同的数据源和类型,这些数据源通常是异构的。
这就需要对这些多源异构的数据进行融合和管理,从而提高数据的价值和有效性。
多源异构数据融合与管理技术,成为当前数据管理领域中的重要研究方向。
一、多源异构数据的概念与分类多源异构数据是指来自不同来源、类型和格式的数据,它们之间存在着数据差异和数据质量差异。
多源异构数据一般可以分为结构化数据和非结构化数据两大类。
1.结构化数据结构化数据一般指已经规范化和标准化的数据,其中每个数据元素都能够被确定的标识和分配。
结构化数据可以使用数据库存储,并能够使用SQL等数据库语言进行检索和操作。
2.非结构化数据非结构化数据是指没有预先定义好的数据格式和结构的数据,比如文本、图像、音频、视频等,这些数据需要进行处理和分析才能得到有意义的信息。
二、多源异构数据的融合技术多源异构数据的融合技术包括数据集成和数据合并两个方面。
1.数据集成数据集成是指将来自不同数据源的数据进行整合、修正、转换和清洗,从而形成一个统一的数据集,方便用户进行查询和分析。
数据集成有两种常见的技术方式:(1)传统方式:需要先对数据源进行分析和整理,再使用ETL工具进行导入和转换。
但这种方式需要额外的人力和资源进行处理。
(2)实时方式:通过数据中间件技术将来自不同数据源的数据进行整合,这样可以实现实时数据的更新和查询,同时也减少了数据处理的负担。
2.数据合并数据合并是指将来自多个数据源的数据并列进行比较和分析,从而得到数据的相关性和差异性,进而形成更为精确和全面的数据信息。
数据合并采用的方法有:(1)数据聚合:将来自不同数据源的数据进行统计和汇总,以得到更加全面和精确的数据结果。
(2)数据关联:将不同数据源中的数据进行关联和对比,以得到数据之间的相关性和差异性。
三、多源异构数据的管理技术多源异构数据的管理技术包括数据标准化和数据质量控制两个方面。
面向多源异构数据的大数据融合与分析技术研究随着信息技术的发展,大数据已经逐渐成为了当今社会的一个热门话题。
在许多领域中,数据量不断增加,数据源不断增多,数据类型也日益多样化。
在这种情况下,如何实现多源异构数据的融合与分析成为了关键的问题,而面向大数据的融合与分析技术也因此成为了学术研究中的重大挑战。
一、背景和概述所谓多源异构数据,是指数据来源于多个不同的数据源,且这些数据源包含不同类型、格式和结构的数据。
这可能来自于不同的领域、不同的业务系统或不同的数据仓库。
因为这些数据是来自多个不同的来源,甚至使用不同的标准进行处理和计算,所以这些数据是相互独立的。
在这种情况下,为了提高数据利用率和数据分析的准确性,需要将多源异构数据进行融合与集成。
这将有助于增强信息处理效率、优化信息管理和提高信息利用率。
面向大数据的融合与分析技术,是一种有效的解决方案。
这种技术能够充分利用现有的数据,并且将这些数据进行有效的整合、转换和分析,以便更好地支持业务决策和管理活动。
这种技术还能够帮助组织更好地利用自己的数据资源,提高业务处理效率和准确性,减少常规操作中的错误处理和数据处理成本。
二、多源异构数据融合与集成多源异构数据融合与集成是一项复杂而关键的任务。
该任务需要考虑以下几个方面问题:1.数据的整合和转换不同数据源的数据一般具有不同的格式、结构、标准和元数据,因此需要进行数据整合和转换。
在数据整合过程中,需要根据不同数据源的要求,为数据进行格式和结构转换。
同时,还需要关注数据的完整性和一致性,确保数据的精确性和准确性。
2.数据的存储在进行数据融合和集成的过程中,需要涉及到数据的存储问题。
需要将不同数据源的数据存储在同一位置,并按照一定的规则进行存储和管理,以方便后续的数据分析和查询。
3.数据质量的保证在进行数据融合和集成的过程中,需要保证数据的质量。
这需要通过数据清晰、去重和数据校验等方式来实现。
同时,还需要考虑到数据的安全性和隐私问题。
异构系统互联技术的研究与应用随着物联网的不断推广和发展,各类设备与终端的异构性日益增加,这也加剧了各种数据终端之间的交互和数据传输的难度。
同时,现在的各种网络技术也难以同时满足不同设备的数据传输需求,如何让这些设备之间实现互联,成为了亟待解决的问题。
异构系统互联技术的研究与应用,正是为了应对这一现实而生的一种技术手段。
异构系统互联技术是指将不同架构的系统通过某种方式连接在一起,共同合作完成一项任务的方法。
其主要应用于工业控制、智能制造、信息化等领域,逐渐成为了关注的焦点。
而异构系统互联技术的发展,也离不开以下几个方面的支持。
统一数据格式与标准化处理不同的设备和系统使用各自的数据格式,这就给数据交互和数据共享带来了很大的困难。
为了解决这一问题,需要对数据格式进行标准化处理,统一不同设备所使用的数据格式。
如何实现标准化处理呢?可以通过使用JSON、XML等格式实现,这样就能够将来自不同系统的数据在统一平台上形成标准数据格式,从而实现数据交互和共享。
构建统一的通信支持平台为了实现不同设备之间的通信,需要建立通信支持平台,这是实现异构系统互联的必要条件。
通信支持平台主要实现不同设备的互联与数据交换,为各种系统间集成创造了一个开放的环境。
目前,有许多通信支持平台,例如OPC、OPC UA和MQTT等,可以实现不同系统之间的连接和数据交流。
选择合适的互联技术在实现异构系统互联技术的过程中,需要选择合适的互联技术。
目前,比较流行的异构系统互联技术有以下几种:1. 遥控协议(RDP):它是一种用于远程桌面服务的协议,可使用户通过网络远程访问另一台电脑。
2. 数据高速公路(CAN):它是一种广泛应用于汽车总线上的通信协议,因其具有可靠、安全性高、带宽大等优点,所以在实现工业设备之间的通信中,也被广泛地使用。
3. 统一建模语言(UML):它是一种通用的面向对象建模语言,适用于多种系统、多种对象和多种场景。
通过使用UML,可以表示系统中各种设备、对象和任务之间的关系,为实现异构系统互联提供了有力的工具支持。
异构数据库在高校管理信息系统整合中的应用
随着“互联网+”国家战略的提出,政府及公共服务部门也围绕着这一计划提出了服务升级的需求。
如何将原有孤立、自治的管理信息系统进行资源整合,实现信息共享是当下的研究热点。
此文以高校的管理信息系统整合为案例,探索了一条成本小、可靠性强的中间件异构数据库方式来实现原有管理信息系统整合的道路。
通过XML解析工具将各子系统数据库更新的数据转换为XML消息,再通过中间件应用服务器提供的JMS消息服务,来实现各子系统数据库应用程序和中央數据库系统应用程序的消息传递,以达到信息同步、资源共享的目的。
标签:异构数据库;中间件技术;管理信息系统
0 引言
随着“互联网+”国家战略的提出,如何基于互联网为大众提供方便快捷的服务已是当下研究的一个热门课题。
高等学校作为公共服务的重要一环,办学规模不断扩大,为了便于管理,高校各部门都建立了各自的管理系统。
对现有的应用系统而言,各系统相互孤立,数据不能共享,造成了很多不必要的浪费和重复建设[1]。
如何将这些异构的信息系统整合,实现信息交互资源共享是当下校园信息化建设的一个难点。
异构数据库技术的提出解决了这一难题。
1 异构数据库定义
异构数据库是将各个已经存在的、自治的及异构的数据库系统集合在一起。
异构数据库继承和发展了分布式数据库技术,分布式数据库由多个结构相同的子数据库组成,在物理上可以分布在各地,但实际上只有一个数据库系统为其服务,提供统一的查询与更新;而异构数据库则是以多个结构不同、运行独立的数据库系统为基础,通过统一的规则集成的一个分布式数据库系统[2]。
简言之异构数据库系统,就是通过统一的表示、存储和管理集成存在的异构的且独立的数据库,使用户感觉获取到的数据都具有单一的模式且存储在单个数据库中。
2 异构数据库集成方法
一般来说,异构数据库集成方法主要有:数据仓库(Data Warehouse)及中
间件方式(Middleware)。
上述两种集成方法根据数据是否在本地存储,又可分为实际存储方式和虚拟存储方式两种。
“数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合,用以支持经营管理中的决策制定过程”,这一概念是W.H.Inmon在其《建立数据仓库》一书中提出的,它是一个能够支持企业或组织进行决策分析处理的数据集合,具有面向主题、集成性、稳定性及时变性四个特征。
数据仓库的关键技术包括数据的抽取、清洗、转换、加载和维护技术。
它属于实际存储方式。
数据仓库法是将数据通过ETL(Extract,Transform and load抽取,转换和加载)工具定期从各个分散的数据库中抽取出来,集中存储于一个存储数据的仓库,在数据进入数据仓库之前必须要统一数据格式,如字段的同名异义、异名同义、字段长度不一致等,另外需要进行数据的整合与计算以满足数据仓库的格式要求,经过必要的清洗加工后加载到数据仓库中,供用户查询。
如上所述,数据仓库的体系结构如图1所示。
前台数据查询服务和后台数据预处理服务是数据仓库法中主要的两种数据服务。
前台数据查询服务的主要功能是将各种分析应用工具得到的可视化分析结果展现给最终用户,如数据查询结果、生成的各类报表等;后台数据预处理服务的主要职责是实现数据由数据源数据到数据仓库数据的格式转换,使数据仓库能够以多维数据模型进行主题数据存储。
抽取、转换和加载是后台数据预处理服务的三种重要数据操作。
抽取是从数据源抽取所需数据;转换是对抽取出的数据进行格式转换,使其与数据仓库中的数据格式一致;加载是将转换后的数据记录到数据仓库中。
数据仓库法会生成一个全新的数据库系统作为数据仓库,仓库所有数据都从各数据源中抽取,形成一个全局模式。
用户查询数据时,系统把查询所需数据预先提取存储到本地,用户直接访问本地数据[3]。
中间件集成解决方案是虚拟存储方式,它也使用了全局数据模式。
它不仅能够集成结构统一的数据源数据,还可以集成结构不同的数据源数据,如Web数据等[4]。
根据IDC对中间件的定义:中间件是一种独立的系统软件或服务程序,它位于客户机/服务器的操作系统之上,管理计算资源和网络通信,在底层操作系统包括底层通信协议和各分布式应用软件搭起了沟通的桥梁,从而实现分布式应用软件在不同技术平台间的资源共享[5]。
3 中间件方式实现异构数据库
通过以上两种集成方法的介绍,笔者认为中间件方式是实现异构数据库最简便,代价最小的办法。
中间件是一种起连接作用的分布式软件,处于操作系统(包括底层通信协议)和应用软件之间。
其作用是屏蔽底层分布式环境的复杂性和异
构性,为不同环境下的应用软件建立相互通信的操作机制,使各应用软件可以有效地进行数据交互与协同,从而提高软件的易移植性、适应性和可靠性[5]。
对于异构数据库系统集成而言,各子系统数据库的结构及运行环境均不重要,中间件的程序接口定义了一个统一的数据交互接口,无论各子系统数据库及其运行环境如何更新,只要中间件对外接口定义不变,中间件程序做相应更新,上层应用软件几乎不用修改,这样就避免了“推倒重建”的巨大代价,降低了高校集成各异构数据库系统的成本。
简言之,中间件就是一个分布式软件管理框架,通过API 的形式提供一组软件服务,具有良好的可扩展性和强大的通信能力[6]。
高校管理信息系统共享平台系统结构如图2所示:
图2 管理信息共享平台系统构架图
根据对数据流程的分析,集成模型的设计构想如图3所示:
图3 异构数据库集成系统总体模型结构图
整个系统可以分为五层,分别是:
①子系统数据库,即校内各部门现有的数据库系统,它们可能位于不同操作系统平台下且结构各不相同,各系系统独立运行相对自治。
②客户端层,将各子系统数据库中共享的数据变化情况通过触发器实时记录到相应的表格中,通过JA V A定时器定期将变化的数据从表格中提取出来,并利用XML解析工具将其转换为XML消息。
JMS客户端发送程序再将被包装成适合JMS传递的XML消息(即文本消息Text Message)发送给JMS主题或队列。
因为JMS中未定义XML消息,所以它在传递前还需要做转换,通常做法是将其作为一个Text Message或一个DOM对象来对待,以此方式来实现XML消息的传递。
这里所提出的模型是将XML消息转换为Text Message进行传递,因为此方式传递效果最佳。
③中间件层,实现中央服务器端应用程序和客户端应用程序的消息传递,该服务由应用服务器中间件配置的JMS来实现。
该层的功能就是维护建立的消息主题或队列,完成消息的发送和接收任务,屏蔽复杂的底层通信。
它是整个模型的重要组成部分,确保了消息通信的异步性、持久性和可靠性,是各個应用系统交换数据的平台。
④中央数据库客户端层,该层的主要功能就是监听JMS服务器的消息队列或主题是否有消息到来。
中央数据库客户端程序一直保持监听状态,若有消息到来,则进行相应的处理;若无消息则继续监听。
若接收到消息,则将其由文本格式转换为XML格式,然后依据数据模式映射文件转换成对应于中央数据库系统的XML消息,最后中央数据库再将转换后的XML消息通过解析工具记录在案。
⑤中央数据库,需要共享的数据都存储于此,它为数据共享提供统一的数据平台,是进一步进行数据挖掘、信息共享的基础。
整个模型的业务流程是:共享数据在发生变化时被触发器记录在相应的表格中;JA V A定时器定时提取表格中的变化数据,利用解析工具将其转换为XML 消息;将转换后的XML消息封装打包成文本消息,发送到JMS服务器的主题或队列中;监听该主题或队列的服务器接收到文本消息后,则通过解析工具将其解析成XML消息;通过映射文件将得到的XML消息转换为对应于中央数据库系统数据的XML消息;最后再将XML消息通过解析工具还原成中央数据库的数据,以实现异构数据库的同步刷新和集成共享[7]。
4 结束语
随着“互联网+服务”行动的不断深入,政府及各公共服务部门的管理系统整合需求也越来越大,以最小的代价整合现有的异构系统实现信息共享、资源整合、减少投资浪费势在必行。
本文所提出的以中间件方式实现异构管理系统整合是一个有益的尝试。
参考文献:
[1]周敏.面向异构数据的高校数据集成与交换平台研究[J].大众科技,2014(08):34-37.
[2]陈敏,姜大庆.基于工作流的服务集成研究[J].信息与电脑(理论版),2015(18):14-15-17.
[3]邹盟军,杨莹,王建红.分布式非结构数据管理平台的应用研究[J].电力信息与通信技术,2015(09):67-72.
[4]黄章伟.基于SOA和云计算的高校人事招聘系统的设计和研究[J].信息技术与信息化,2015(06):36-38.
[5]李枫.网络环境下档案信息资源的整合[J].赤子(上中旬),2015(21):210.
[6]胥献伟.高校信息化应用系统规划建设探讨——以四川文理学院为例[J].科技视界,2015(29):57-188.
[7]贾彩虹,赵文剑,邓记才.基于XML的异构数据集成系统的研究与设计[J].河南科技,2014(21):12-14.
2014年度江西省高等学校科技落地计划项目:基于虚拟接入面向服务的物联网中间件,No.KJLD14054,2014.01—2016.12。
刘好斌(1981.7-),江西于都人,南昌航空大学软件学院助理实验师;
韩宏旺(1982.12-),江西余干人,南昌航空大学学工处科长;
陈宇斌(1977.8-),江西南昌人,南昌航空大学软件学院讲师,复旦大学博士研究生。