云计算环境下异构数据库整合技术的研究与实现
- 格式:doc
- 大小:28.50 KB
- 文档页数:8
多源异构数据的融合算法研究随着各种传感器、云计算等技术的发展,数据的来源和类型也变得越来越多样化和异构化。
在这样的背景下,如何对多源异构数据进行融合,成为了数据挖掘与分析领域的一个热门研究方向。
本文将从算法的角度,探讨多源异构数据的融合算法研究。
一、多源异构数据的特点多源异构数据指的是由不同的数据源(如多个传感器、数据库等)采集得到的、类型和格式不同的数据。
由于来源的差异,多源异构数据具有以下的特点:1.数据量大:不同数据源同时采集得到的数据可能非常庞大,需要进行处理和筛选。
2.数据类型多样:不同的数据源可能会采用不同的数据类型(如文本、图像、音频等),使得数据的分析过程变得复杂。
3.数据质量参差不齐:由于不同的数据源采集环境和采集方式的不同,导致数据的质量存在差异(如只是部分数据存在噪声、无效数据等),这就需要进行有效的异常检测和数据清洗。
4.数据格式不同:由于不同的数据源可能存在不同的数据格式(如不同的编码、不同的数据结构等),所以需要进行数据转换或者规范化,以便进行统一的数据处理和分析。
二、多源异构数据的融合算法为了充分利用多源异构数据,同时避免由于数据的维数过高导致的数据过拟合问题,目前常用的做法是使用基于特征选择和特征融合的方法。
特征选择是一种针对原始特征选择出最重要的特征的技术,特征融合是指将不同来源的数据特征,进行整合或匹配,得到更加丰富的数据特征。
根据特征选择和特征融合的方法,目前的多源异构数据融合算法主要有以下几种:1.基于加权平均法的特征融合。
该算法将不同来源的特征进行平均,然后计算每一个特征在整个数据集上的加权得分,将具有高分的特征保留下来,其余则删除。
然后使用得分比较高的特征进行数据分析和建模。
2.基于主成分分析的特征选择和融合。
该算法将不同来源的数据特征进行降维处理,得到最具有代表性的主成分,并利用主成分上的变量来代替原始特征。
在此基础上,使用常规方法进行分类和预测。
3.基于迁移学习的特征融合。
云计算技术在计算机数据处理中的应用研究作者:廖宇翔来源:《电脑知识与技术》2021年第28期摘要:大数据及云计算信息技术的不断发展,使得不同行业都开始借助于云服务器、后台数据库,进行网络海量数据资源的虚拟化处理、分布式计算、并行计算处理,以实现对多源数据的高效搜集、统计处理与存储。
该文从云计算的Hadoop架构、SOA服务体系、数据挖掘、分布式计算和HDFS存储等技术着手,探讨将多种云计算技术,应用到海量数据信息处理中的实施策略,来为网络大数据服务系统的正常运转提供保障。
关键词:云计算技术;计算机;数据处理;应用中图分类号:TP311 文献标识码:A文章编号:1009-3044(2021)28-0030-02开放科学(资源服务)标识码(OSID):移动互联时代下的数据处理,面临着数据信息的海量化、实时化、低质化,如何对多种网络数据资源进行快速筛选、及时处理与分类存储,成为各企业网络数据信息传输、业务处理的主要困境。
因而引入大数据及云计算技术,依托云服务器、数据中心交换机、后台数据库等硬件设备,对广域网或局域网内的数据资源,进行采集、处理、分析与存储,将数据处理结果发送至客户终端设备进行显示,实现对计算机数据的实时掌控与应用。
1 云计算技术的主要内容及其与计算机数据处理的关联性1.1 大数据及云计算技术的内容概述“云计算”是美国国家标准与技术研究院提出的概念,其作为一种分布式计算技术,主要根据不同客户的数据资源处理需求,通过网络“云”将巨大的数据计算处理任务,分解为一个个小的数据计算任务,在多个后台服务器上进行数据处理、分析的工作执行。
特别随着虚拟化技术、并行计算技术的快速发展,网络云计算平臺也开始将多种软硬件虚拟化,包括网络通信接口、服务器、存储模块等的虚拟化。
之后利用虚拟化计算机,进行虚拟系统多个主节点、从节点的任务分配,来完成数据资源的配置、处理与存储工作。
因而现阶段云计算技术基础架构,通常由SOA服务体系、物理资源层、资源虚拟化层、用户与映像管理层等层级组成,具体如图1所示。
技术Special TechnologyI G I T C W 专题90DIGITCW2020.07在国土资源的日常管理和利用工作中,往往会涉及到许多结构不同、来源各异的数据信息,如空间信息中的栅格数据与矢量数据,非空间信息中的文档数据等,这些数据本身有着特殊的格式,要求使用专业软件进行处理,给数据的整合共享造成了一定难度。
以GIS 技术为支撑,GIS 平台能够为地理空间数据管理提供便利,实现对多源异构数据的有效管理。
1 数据类型多样性信息化时代背景下,国土资源息化水平不断提高,数据资源呈现多样性,不仅包括基础地理空间数据,还包括自然资源、经济、人口、环境等方面的专题数据。
另外,还有自然资源的土地资源、矿产资源、地质环境、人文经济的城市区域、产业布局、人口分布以及经济发展等多种类型的主题数据。
借助GIS 技术对多源数据进行综合处理分析,是实现数据有效整合的关键。
1.1 数据生产方式不同级别的自然资源管理部门生产的国土资源空间信息数据方式呈多样性,可利用遥感技术、GPS 测量技术、统计调查等方式完成国土资源空间信息的收集工作。
1.2 数据生产部门不同行业主管部门对同一类型的数据生产方式也有差异性,数据的分级分类、数据结构、软件平台都会有不同。
1.3 数据存储方式国土空间规划所需要的支撑数据不仅需要自然资源空间矢量数据,还需要所要表达的实体的属性信息,不同空间信息采集和处理的软件平台对空间数据信息存储方式不一样,例如关系型数据库、文件型数据库等。
1.4 数据处理方式不同行业,不同部门针对不同业务的自然资源空间数据的处理平台不一致,不同的GIS 软件读写数据的方式和存储方式都不同。
2 技术路线多源异构数据的整合共享减少了国土资源管理中的一些重复工作,可为自然资源管理部门提供更有效的服务和技术保障。
将种类繁多、数据量巨大的各类土地、地质、矿产数据库集成整合为支撑国土资源监管和管理的有效依据。
基于GIS 技术的国土资源多源异构数据整合共享主要是数据整合、数据地图服务共享和应用分析:2.1 数据整合对于各部门数据标准不同,格式不一,按照国家建设标准对各类数据进行资料整理、数据库建设以及整合多源多时态的空间数据,需要有效的信息获取、信息处理和信息核查方案。
2023年系统分析师下午真题及答案试题一(共25分)阅读以下关于软件系统分析的数述,在答题纸上回答问题1至问题3。
[说明]某软件企业拟开发一套基于移动互联网的在线运动器材销售系统,项目组决定采用FAST开发方法进行系统分析与设计,在完成了初步的调查研究之后进入了问题分析阶段,分析系统中存在的问题以及改进项,其分析的主要内容包括:1材销售订单处理的时间应该减少20%;2动端支持IOS和Android两类操作系统;3材销售订单处理速度太慢导致根多用户取消订单;4台服务器硬件配置比较低;5用户单过程中应该减少用户输入的数据量;6单处理过程中用户需要输入大量信息;7用云计算服务可以降低50%的服务器处理时间;8司能投入的技术维护人员数量有限;9量的并发访问会导致App页面无法正常显示。
【问题1](12分)FAST开发方法在系统分析中包括了初始研究、问题分析、需求分析和决策分析等四个阶段,请简要说明每个阶段的主要任务。
【问题2](8分)在问题分析阶段,因果分析方法常用于分析系统中的问题和改进项,请结合题目中所描述各项内容,将题干编号(1)-(9)填入表IT的(a)~(d)中。
分析阶段,需要对候选方案所述内容按照操作可行性、技术可行性、经济可行性和进度可行性进行分类。
请将下列(1)~(5)内容填入表1-2的(a)-(d)中。
1开发的器材销售系统能够满足用户所需的所有功能;2统开发的成本大约需要40万元人民币;3要对移动端APP开发工程师进行技术培训;4统开发周期需要6个月;5统每年维护的费用大约5万元人民币。
表1-2候选方案指标分类可行性准则候选方案描述操作可行性(a)技术可行性(b)经济可行性(C)进度可行性(d)参考答案【问题U初步研究阶段:1、列出问题和机会2、协商项目的初步范围3、评估项目价值4、计划项目进度表和预算5、汇报项目计划问题分析阶段:1、研究问题领域2、分析问题和机会3、分析业务过程4、制定系统改进目标5、修改项目计划6、汇报调查结果和建议需求分析阶段:定排修交1、定义需求2、排列需求的优先次序3、修改项目计划4、交流需求陈述决策分析阶段:确分比修推1、确定候选方案2、分析候选方案3、比较候选方案4、修改项目计划5、推荐一种系统【问题2](a)(6)(b)(3)(4)(9)(c)(1)(5)(7)(d)(2)(8)【问题3】(a)(3)(b)(1)(c)(2)(5)(d)(4)试题解析器材销售订单处理的时间应该减少20%【系统目标】移动端支持IOS和Android两类操作系统【系统约束条件】器材销售订单处理速度太慢导致根多用户取消订单【原因/结果】后台服务器硬件配置比较低【原因/结果】用户下单过程中应该减少用户输入的数据量【系统目标】订单处理过程中用户需要输入大量信息【问题/机会】利用云计算服务可以降低50%的服务器处理时间【系统目标】公司能投入的技术维护人员数量有限【系统约束条件】大量的并发访问会导致App页面无法正常显示【原因/结果】新开发的器材销售系统能够满足用户所需的所有功能【技术可行性】系统开发的成本大约需要40万元人民币【经济可行性】需要对移动端APP开发工程师进行技术培训【操作可行性】系统开发周期需要6个月【进度可行性】系统每年维护的费用大约5万元人民币【经济可行性】试题二(共25分)阅读以下关于系统分析与设针的叙述,在答题纸上回答问题1至问题3。
2022年11月全国计算机技术与软件专业技术资格(水平)考试《系统集成项目管理工程师(中级)》真题及详解(综合知识)单项选择题(共计75题,每题1分。
每题的四个选项中只有一个答案是正确的)1.()不属于“提升云计算自主创新能力”的工作内容。
A.加强云计算相关基础研究、应用研究、技术研发、市场培育和产业政策密衔接与统筹协调B.引导大型云计算中心优先在能源充足、气候适宜、自然灾害较少的地区部署,以实时应用为主的中小型数据中心在电力保障稳定的地区灵活部署C.加强核心电子器件、高端通用芯片及基础软件产品等科技专项成果与云计算产业需求对接,积极推动安全的云计算产品和解决方案在各领域的应用D.充分整合利用国内外创新资源,加强云计算相关技术研发实验室、工程中心和企业技术中心建设【答案】B【解析】提升云计算自主创新能力,加强云计算相关基础研究、应用研究、技术研发、市场培育和产业政策的紧密衔接与统筹协调。
发挥企业创新主体作用,以服务创新带动技术创新,增强原始创新能力,着力突破云计算平台大规模资源管理与调度、运行监控与安全保障、艾字节级数据存储与处理、大数据挖掘分析等关键技术,提高相关软硬件产品研发及产业化水平。
加强核心电子器件、高端通用芯片及基础软件产品等科技专项成果与云计算产业需求对接,积极推动安全可靠的云计算产品和解决方案在各领域的应用。
充分整合利用国内外创新资源,加强云计算相关技术研发实验室、工程中心和企业技术中心建设。
建立产业创新联盟,发挥骨干企业的引领作用,培育一批特色鲜明的创新型中小企业,健全产业生态系统。
完善云计算公共支撑体系,加强知识产权保护利用、标准制定和相关评估测评等工作,促进协同创新。
B 项属于统筹布局云计算基础设施。
2.物联网从架构上面可以分为()、网络层和应用层。
A.数据链路层B.感知层C.控制层D.物理层【答案】B【解析】物联网从架构上面可以分为感知层、网络层和应用层。
(1)感知层:负责信息采集和物物之间的信息传输,信息采集的技术包括传感器、条码和二维码、RFID射频技术、音视频等多媒体信息,信息传输包括远近距离数据传输技术、自组织组网技术、协同信息处理技术、信息采集中间件技术等传感器网络。
环境保护部办公厅关于印发《生态环境大数据建设总体方案》的通知文章属性•【制定机关】环境保护部(已撤销)•【公布日期】2016.03.07•【文号】环办厅[2016]23号•【施行日期】2016.03.07•【效力等级】部门规范性文件•【时效性】现行有效•【主题分类】环境保护其他规定正文关于印发《生态环境大数据建设总体方案》的通知环办厅[2016]23号各省、自治区、直辖市环境保护厅(局),机关各部门,各派出机构、直属单位:为贯彻落实《国务院关于印发促进大数据发展行动纲要的通知》(国发〔2015〕50号)精神,积极开展生态环境大数据建设与应用工作,我部组织编制了《生态环境大数据建设总体方案》。
现印发给你们,请遵照执行。
生态环境大数据建设总体方案大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。
全面推进大数据发展和应用,加快建设数据强国,已经成为我国的国家战略。
党中央、国务院高度重视大数据在推进生态文明建设中的地位和作用。
习近平总书记明确指出,要推进全国生态环境监测数据联网共享,开展生态环境大数据分析。
李克强总理强调,要在环保等重点领域引入大数据监管,主动查究违法违规行为。
国务院《促进大数据发展行动纲要》等文件要求推动政府信息系统和公共数据互联共享,促进大数据在各行业创新应用;运用现代信息技术加强政府公共服务和市场监管,推动简政放权和政府职能转变;构建“互联网+”绿色生态,实现生态环境数据互联互通和开放共享。
陈吉宁部长要求,大数据、“互联网+”等信息技术已成为推进环境治理体系和治理能力现代化的重要手段,要加强生态环境大数据综合应用和集成分析,为生态环境保护科学决策提供有力支撑。
目前,环境信息化存在体制机制不顺,基础设施和系统建设分散,应用“烟囱”和数据“孤岛”林立,业务协同和信息资源开发利用水平低,综合支撑和公众服务能力弱等突出问题,难以适应和满足新时期生态环境保护工作需求。
异构数据库转储平台设计与实现
艾萍;曾顺;岳兆新
【期刊名称】《信息技术》
【年(卷),期】2013(000)009
【摘要】探讨了采用ODBC技术对当前主流数据库进行整合,异构数据库统一转储的一种思路和方法.数据库转储克服了各大主流数据库之间的不兼容性,使转储后的目标数据库能满足大多数商业化需求和科研需求等.同时总结了异构数据库统一转储设计时需考虑的问题及应遵循的原则,并对当前异构数据库统一转储实践中存在的问题及面临的困难进行了分析,实践证明了文中数据库转储方法的可行性和可靠性.
【总页数】6页(P18-22,27)
【作者】艾萍;曾顺;岳兆新
【作者单位】河海大学水文水资源学院,南京210098;河海大学计算机与信息学院,南京211100;河海大学计算机与信息学院,南京211100
【正文语种】中文
【中图分类】TP311
【相关文献】
1.Oracle海量数据异构平台迁移(将Windows平台的Oracle数据库迁移到SolarisX64平台) [J], 王宇韬;
2.Oracle海量数据异构平台迁移(将Windows平台的Oracle数据库迁移到
Solaris X64平台) [J], 王宇韬
3.异构型数据库数据转储模块的研究与实现 [J], 邸晓奕;万映辉;张水平
4.跨平台异构企业基础数据交换平台设计与实现 [J], 李洋;李禀津
5.自动实现linux平台下的sybase数据库转储及远程备份 [J], 马占宽
因版权原因,仅展示原文概要,查看原文内容请购买。
云计算环境下异构数据库整合技术的研究与实现摘要:该文提出一种通过利用云资源、分布式部署实体数据库代理服务端agent、异构数据库服务端server和服务网站等模块,构建一个异构数据库整合的多线程原型系统的方法。
系统中agent实现对实体数据库进行第一层虚拟和执行sql请求;server解析自定义查询语言和整合agent返回结果;服务网站则提供基本的注册、申请和下载服务;原型系统各模块间通过套接字进行网络通信,通信内容为xml格式,外部可以通过自定义的查询语言访问原型系统。
通过实现这套分布式的原型系统,达到高效整合异构数据库的目的。
关键词:异构数据库;数据整合;云计算中图分类号:tp391 文献标识码:a 文章编号:1009-3044(2013)14-3232-04云计算[1]是近些年新兴的一种重要的信息技术。
它是构建在互联网上的一组新兴技术,可以将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,实现计算资源、信息资源、知识资源等的全面共享。
云计算的这些诸多特性为异构数据库的访问和整合等提供了一种新的平台访问方式。
通过对云计算的应用对异构数据库进行整合,可以很好的利用分布在不同数据库中的相关数据。
随着计算机应用的发展和普及,存储器容量的扩大,数据需求的明细化,地域分布的不平衡化等,在这样的背景下,数据量也呈现出了高增长性。
现而今怎样高效利用这些分布在异构数据库中的数据或者方便的对分布在不同地域、不同数据库管理软件中的数据进行统一访问并对数据进行整合成为了一个具有意义的挑战[2-4]。
本文针对在云计算环境下如何设计与实现异构数据库整合这个问题展开讨论,提出一套可行的方案及其实现方法。
1 不同数据库的差异性数据库系统发展至今,出现过层次模型、网状模型、关系模型等数据库模型[5]。
当前使用最广泛的数据库大多都是关系型数据库,其中oracle、sqlserver和mysql占有了很大的比例[6]。
这三种数据库各有各的特性和用户群体,以及许多各自的细节问题。
1.1 整体框架上的差异性oracle是一种分布式数据库,是目前最流行的b/s体系结构的数据库之一,其可扩展性、可维护性都较强,但是由于其模块较多,组织形式也叫复杂;sqlserver只能运行在windows上,一个sqlserver服务就是一个实例,另外还要运行sqlserver agent执行作业、监视 sql server、激发警报及允许自动执行某些管理任务和sqlserver browser实现远程服务。
mysql可以在多种操作系统上运行,虽然其跟oracle等大型数据库相比在大数据量上性能不是很好,但是其小巧灵活,所以仍有许多市场。
1.2 不同数据库不同的连接方式首先这三种数据库都能够实现远程连接、远程控制,说明其都实现了底层的套接字通信,而在默认的监听端口上oracle是1521,sqlserver是1433,mysql是3306。
除此之外,监听的端口信息还可以自由配置,虽增加了灵活性,但也因此使连接到数据库变得更加复杂。
而且要连接到这些数据库,数据驱动也不相同,需要根据是哪种数据库而加载不同的数据驱动。
1.3 sql底层执行时的略微不同三种数据库虽然都以sql作为结构化查询语言,但是各自都对sql 做了相应的修改,因此在许多细节方面都存在差异。
比如将主键定义为自动增长标识符类型,mysql的方法是把表的主键设为auto_increment类型,sqlserver则为identity类型,而oracle 则为设置customer_id_seq序列的方法设置自增序列。
三种数据库在数据类型方面也有些不同。
2 异构数据库方案的设计4)insert,与sql相同,语法和用法省略。
除了这些与sql有关联的之外,还有其他一些操作:5)dblist:查询已连接的数据库信息,从虚库中查询。
6)vdb:查询虚拟数据库的信息;7)add:添加一个与agent交互的连接添加内容,并修改虚拟数据库和服务实体数据库,参数是agent端的ip和端口号,需要admin 权限;8)help:显示帮助信息。
2.2 简单的词法、语法解析及执行自定义sql过程为了保证简单的自定义查询语言在使用过程中的正确性,需要进行词法和语法的分析,其中词法分析器的作用是扫描有无非法字符,并将单词抠出,方便下一步语法分析;语法分析器的作用是判断关键词是否正确,语法格式是否正确,标识符是否使用正确等等。
在底层查询过程中,通过扫描虚库获取数据库名和字段名,再将其与自定义的查询语言设计部分相整合,便可构成一条完整的sql 查询语句,之后便可以在实体数据库中执行。
2.3 底层数据查询方案在第二层中,第一个values中存储的是字段名,之后是查询的数据。
2.4 数据整合2.4.1 整合方案server端收到了来自各个agent返回的xml格式的查询结果,需要将其整合成统一的结果返回给连接到server的客户端或者api调用。
整合的步骤是:1)第一层整合是在底层执行完sql请求之后对返回的resultset 进行解析,采用dom4j的方式将数据整合成2.3底层数据查询方案格式;2)第二层整合是在扫描虚库完成,也就是底层sql请求完全执行完成的时候,将所有结果整合成一个xml格式的字符串,并加入相应的实体数据库信息。
2.4.2 用xml表示数据信息3.2 虚拟数据库获取算法在分析了oracle、sqlserver、mysql的系统结构之后,除了oracle 之外都存在可用的系统库——sqlserver可以默认连接到“master”库,mysql可默认连接到“mysql”库,因为oracle比较特殊,因此需要用户输入需要连接库的信息。
根据这些默认信息和数据库管理员账户等信息便可以连接到数据库,获取默认的连接;之后根据这个连接通过java.sql.connection. getmetadata()方法获取整个数据库的信息;解析getmetadata()方法返回的resultset,得到所有库信息,便可以得到每个库的connection,并一致放入hashmap。
在获取到上述的关键信息之后便可以查询到数据库的细节信息,包括每个字段的名称、类型和大小信息。
基本思路就是一边获取数据库信息,一边构造xml节点,并将获取到的信息写入到xml节点,成为虚拟数据库的信息。
3.3构建监听服务监听即套接字监听,为防止统一监听某个端口可能导致某台计算机只能运行一个agent的现象,监听端口采用探测的方式在某个范围内选择。
因为处理底层数据查询可能很耗费时间,因此监听和监听后的处理被放入两个线程:监听线程和服务处理线程。
监听线程的主要任务是启动一个serversocket监听,启动服务处理线程,之后监听来自server的可能连接,并将socket交予服务处理线程处理。
服务处理线程主要功能就是根据server传递的命令进行不同的操作,所以要实现网络通信和命令解析。
采用统一的架构,对客户端的信息统一处理、统一返回处理结果,既降低了各个模块之间的耦合,又使不同模块之间通信有统一的方式处理。
3.4实体数据库查询监听处理线程在收到需要执行的sql请求之后,调用handledata 对象的execute*()方法,对传递的自定义sql请求进行解析,然后扫描虚拟数据库,根据扫描信息提供表信息和字段信息构建sql 请求,然后执行并将结果返回。
如果是sql查询,则返回数据格式如2.3底层数据查询方案所示。
3.3 server 实现3.3.1 自定义查询语言解析由于这里自定义的查询语言是无法被实体数据库执行的,因此需要对自定义的查询语言进行解析。
解析包括了简单的词法分析和语法分析,这些都被封装在继承自抽象类isqlquery的实体类里,根据不同的操作调用不同的实体类即可判断出词法、语法是否通过。
在通过之后调用传入表信息和字段信息即可构建一条完整的sql 请求,这部分被封装在各个模块的tosql()方法中。
3.3.2 高效的大数据网络通信虚拟数据库的xml描述和查询的结果集有可能比较庞大,如果完全将其交给tcp去传送而不做处理则可能导致性能的下降和不可预见性的错误[7]。
因此需要将这些数据分批次发送,并在接收端进行重新整合。
在java的网络通信中数据是按照流的方式传递的,datainputstream和dataoutputstream这两个类非常适合网络传输大数据,只要将数据分块并转换成字节码就可以连续发送。
将接收的字节码合并,再读取成字符串就是需要的数据了,这里借助一个缓冲文件进行中转,之后读取文件内容就可以了。
采用这种网络通信之后,可以连续的将大数据从一端传递到另一端,达到充分利用和完全控制网络通信的目的。
3.4 服务网站实现网站采用基础的jsp+servlet的模式,让jsp作为viewer显示界面,servlet作为处理器,持久层高度封装数据操作。
采用上述方案,实现了用户注册、权限申请、资料下载等服务功能。
javaapplet具有在网页中执行复杂java程序的能力,因此设计了一个继承自jtextarea却有着控制台特性的javaconsole类,在实现了ientercaller接口后便可以根据输入命令回车之后进行相应操作,该类在3.5 api设计4 结束语本文介绍了在云计算环境下进行异构数据库整合的方案,其通过对现有的技术手段的应用,实现了虚拟化数据库、线程同步、自定义查询语言以及高效的网络通信等功能模块,然后通过有机的结合实现了一个轻量级的异构数据库整合系统,其可以利用云计算的资源或作为某个云的一个子模块。
通过整合,屏蔽了各种数据库之间的不同点,已注册用户可以通过客户端或api像使用一个数据库那样查询所有库,并返回整合后的数据。
参考文献:[1] danielson, krissi. distinguishing cloud computing from utility computing[r]. 2008-03-26.[2] 罗军舟,金嘉晖,宋爱波,东方.云计算:体系架构与关键技术[j].通信学报,2011,32(7):3-18[3] 陈康,郑纬民.云计算:系统实例与研究现状[j].软件学报,2009,20(5):1337-1348.[4] foster i,young z,raicu i,et al.cloud computing and grid computing 360-degree compared[z].2008,1-10.[5] 董健全,丁宝康.数据库实用教程[m].北京:清华大学出版社,2007:15-21.[6] testbase data slicer. db-engines[eb/ol].http:///en/.[7] 谢希仁.计算机网络[m].5版.北京:电子工业出版社,2008:187-202.[8] bruce eckel.thinking in java[m].上海:机械工业出版社,2007:576-633.。