分布式数据库技术的演变与发展
- 格式:pdf
- 大小:3.28 MB
- 文档页数:28
(完整)分布式数据库研究现状及发展趋势编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((完整)分布式数据库研究现状及发展趋势)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(完整)分布式数据库研究现状及发展趋势的全部内容。
山西大学研究生学位课程论文(2014 —--— 2015 学年第 2 学期)学院(中心、所):计算机与信息技术学院专业名称:计算机应用技术课程名称:分布式数据库技术论文题目:分布式数据库研究现状及发展趋势授课教师(职称): 曹峰()研究生姓名: 刘杰飞年级: 2014级学号: 201422403003成绩:评阅日期:山西大学研究生学院2015年 6 月 17日分布式数据库研究现状及发展趋势摘要随着大数据、云时代的到来,数据库应用需求的拓展和计算机硬件环境的变化,特别是计算机网络与数字通信技术的飞速发展,卫星通信、蜂窝通信、计算机局域网、广域网和激增的Intranet及Internet得到了广泛应用,使分布式数据库系统应运而生。
为了符合当今信息系统的应用需求和企业组织的管理思想和管理模式。
分布式数据库提供了解决整个信息资产被分裂所成的信息孤岛,为孤岛联系在一起提供桥梁.本文主要介绍分布式数据库的研究现状,存在的一些问题以及未来的发展趋势。
关键词分布式数据库;发展趋势;现状及问题1.引言随着信息技术的飞速发展,社会经济结构、生产方式和消费结构已经发生了重大变化,这些变化深刻地影响着人民生活的方方面面。
尤其是近十年来人们对计算机的依赖性越来越强,同时也对计算机提出了更高的要求。
随着数据库在各个行业中的不断发展,各行业也对数据库提出了更高的要求,数据量也急剧增加,同时有关大数据分析的讨论正在愈演愈烈.甚至出现了爆炸性增长的趋势,一方面是由于移动互联网和移动智能终端的普及发展,数据信息正以每年40%的速度增长,造成数据量庞大;同时,数据种类呈多样性,文本、图片、视频等结构化和非结构化数据共存;另一方面也要求实时交互性强;最重要的是大数据蕴含了巨大的商业价值。
分布式数据库的产生与发展(产生背景)比较成熟的数据库系统出现于20世纪六十年代末和七十年代。
以IMS为代表的层次型数据库系统于1968年问世。
20世纪七十年代初,美国CODASYL的数据库任务组的提出了有名的网络数据库模型DBTG。
分布式数据库的研究始于20世纪70年代中期。
E. F. Codd于20世纪七十年代中期提出了关系数据库。
世界上第一个分布式数据库系统SDD-1是由美国计算机公司(CCA)于1979年在DEC计算机上实现。
七十年代,计算机科学技术的发展与飞速发展的现代通信技术相结合,导致了计算机网络的出现。
这个时期,世界上先后建成了许多规模巨大的、全国性的广域计算机网络对经济、国防、情报、科学技术和社会生活产生了深刻的影响。
随着微型计算机的广泛应用,又自然地提出了这样的新问题,为了加强和扩大微型计算机处理数据的功能,要求将许多分布在不同地点上的微型计算机互连起来,共同工作。
这样,进入了分布式数据库时代。
20世纪90年代以来,分布式数据库系统进入商品化应用阶段,传统的关系数据库产品均发展成以计算机网络及多任务操作系统为核心的分布式数据库产品,同时分布式数据库逐步向客户机/服务器模式发展。
随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩充,数据库应用已经普遍建立于计算机网络之上。
这时集中式数据库系统表现出它的不足:数据按实际需要已在网络上分布存储,再采用集中式处理,势必造成通信开销大;应用程序集中在一台计算机上运行,一旦该计算机发生故障,则整个系统受到影响,可靠性不高;集中式处理引起系统的规模和配置都不够灵活,系统的可扩充性差。
在这种形势下,集中式DB的“集中计算”概念向“分布计算”概念发展,以分布式为主要特征的数据库系统的研究与开发受到人们的注意。
分布式数据库是数据库技术与网络技术相结合的产物,在数据库领域已形成一个分支。
分布式数据库研究现状及发展趋势
一、研究现状
1、分布式数据库系统重新获得新生
传统的数据库系统广泛使用,但是随着移动应用和大数据的兴起,传
统的数据库系统显得力不从心。
这就导致分布式的数据库系统应运而生,
分布式的数据库系统让应用可以更好的工作,可以处理海量的数据,让更
多用户可以同时访问,更好的利用机器资源。
基于这些优势,分布式数据
库系统迅速的受到市场的认可,许多大的企业和企业都开始采用分布式数
据库系统,使得分布式数据库系统重新获得新生。
2、大数据的发展带来更多的新技术
近几年,大数据的发展越来越快,使得我们面临更多的挑战,其中,
分布式数据库是解决大数据的重要方法之一、在数据量不断增长的情况下,传统的数据库已经不能满足我们的需求,这就需要我们开发更多的技术来
处理大数据,比如:分布式数据库技术、多数据源技术、流式数据处理技
术等等,这些新技术都大大提高了处理大数据的效率,使得大数据的分析
可以更加准确、快速。
3、分布式技术广泛应用
随着科技的发展,分布式技术也被广泛应用到各行各业,不管是金融业、电商业还是医疗行业,都开始使用分布式技术来处理大数据,以满足
其业务发展的需求。
分布式数据库研究现状及发展趋势
一、研究现状
分布式数据库系统(Distributed Database System, DDBS)是指将一个大的数据库分布在多台计算机上存储和处理,使用数据拆分、数据复制和文件共享来管理分布式数据库。
近年来,由于企业网络的不断进步,网络环境的性能和可靠性的改进,以及数据中心规模的不断扩大,分布式数据库系统的应用越来越广泛。
目前,分布式数据库系统的应用领域普遍体现在大型网络环境下的一些业务数据库,比如在电子商务中的商品和客户数据,在银行业务中的存款人名册信息等。
分布式数据库系统在网络环境下实现数据的存储、处理和管理,并且实现多种分布数据库系统所需要的丰富功能,如数据拆分、数据复制和文件共享等,形成了一个完整的分布式数据库管理系统(DDMS),其中包括分布式数据库引擎(DBE),服务器管理模块(SMM),分布式数据库管理模块(DMM)等。
研究表明,目前已经有许多高级的分布式数据库系统用于实现分布式数据库管理服务,如Oracle、Microsoft SQL Server、MySQL等,并且可以实现多种复杂的分布式数据库管理模型,比如事务处理、数据复制和负载均衡等。
细说分布式数据库的过去、现在与未来_光环大数据培训随着大数据这个概念的兴起以及真实需求在各个行业的落地,很多人都热衷于讨论分布式数据库,今天就这个话题,主要分为三部分:第一部分讲一下分布式数据库的过去和现状,希望大家能对这个领域有一个全面的了解;第二部分讲一下TiDB的架构以及最近的一些进展;最后结合我们开发TiDB过程中的一些思考讲一下分布式数据库未来可能的趋势。
一、分布式数据库的历史和现状1、从单机数据库说起关系型数据库起源自1970年代,其最基本的功能有两个:把数据存下来;满足用户对数据的计算需求。
第一点是最基本的要求,如果一个数据库没办法把数据安全完整存下来,那么后续的任何功能都没有意义。
当满足第一点后,用户紧接着就会要求能够使用数据,可能是简单的查询,比如按照某个Key来查找Value;也可能是复杂的查询,比如要对数据做复杂的聚合操作、连表操作、分组操作。
往往第二点是一个比第一点更难满足的需求。
在数据库发展早期阶段,这两个需求其实不难满足,比如有很多优秀的商业数据库产品,如Oracle/DB2。
在1990年之后,出现了开源数据库MySQL和PostgreSQL。
这些数据库不断地提升单机实例性能,再加上遵循摩尔定律的硬件提升速度,往往能够很好地支撑业务发展。
接下来,随着互联网的不断普及特别是移动互联网的兴起,数据规模爆炸式增长,而硬件这些年的进步速度却在逐渐减慢,人们也在担心摩尔定律会失效。
在此消彼长的情况下,单机数据库越来越难以满足用户需求,即使是将数据保存下来这个最基本的需求。
2、分布式数据库所以2005年左右,人们开始探索分布式数据库,带起了NoSQL这波浪潮。
这些数据库解决的首要问题是单机上无法保存全部数据,其中以HBase/Cassadra/MongoDB为代表。
为了实现容量的水平扩展,这些数据库往往要放弃事务,或者是只提供简单的KV接口。
存储模型的简化为存储系统的开发带来了便利,但是降低了对业务的支撑。
分布式数据库发展历史随着信息技术的快速发展,数据量不断增加,传统的中央集中式数据库已经不能满足大规模数据存储和处理的需求。
为了解决这个问题,分布式数据库应运而生。
本文将从分布式数据库的发展历史出发,介绍其起源、发展和未来趋势。
一、起源分布式数据库的概念最早可以追溯到20世纪60年代。
当时,随着计算机技术的迅猛发展,人们开始意识到单一数据库无法满足大规模数据存储和处理的需求。
于是,分布式数据库的概念被提出,即将数据分散存储在多个地理位置上的数据库系统中。
二、初期发展在分布式数据库的初期发展阶段,主要关注的是数据分布和数据复制的问题。
为了提高数据的可用性和可靠性,人们开始研究如何将数据复制到多个节点,并通过数据同步机制保持数据的一致性。
此外,为了提高查询性能,还研究了分布式查询优化和分布式事务处理等关键技术。
三、分布式数据库的成熟随着分布式数据库技术的不断发展,越来越多的企业和组织开始采用分布式数据库来存储和管理海量数据。
在这个阶段,分布式数据库技术得到了广泛应用,并取得了显著的成果。
人们逐渐意识到,分布式数据库不仅可以提高数据存储和处理的能力,还可以提供更好的数据安全性和可扩展性。
四、新兴技术的出现近年来,随着云计算、大数据和人工智能等新兴技术的兴起,分布式数据库面临着新的挑战和机遇。
人们开始关注分布式数据库在云环境下的部署和管理,以及如何应对大规模数据的存储和处理需求。
此外,为了提高数据的处理效率和查询性能,还出现了新的分布式数据库技术,如NoSQL数据库和新一代分布式文件系统等。
五、未来发展趋势随着人工智能和物联网等技术的迅猛发展,数据量将继续呈指数级增长。
未来,分布式数据库将面临更多的挑战和机遇。
人们预计,分布式数据库将更加注重数据的安全性和隐私保护,采用更加灵活和高效的数据存储和处理方式。
同时,分布式数据库还将更加注重与人工智能和大数据等新兴技术的融合,为企业和组织提供更好的数据分析和决策支持。
数据库技术发展简史
数据库技术的发展从最早的手工处理,一直到现在世界上最先进的分
布式数据库系统,是一个漫长而又充满变化的过程。
早期的数据库技术源
自20世纪50年代,当时,人们开始开发具有存储能力的实时联机处理系统,以满足企业对处理和存储数据的需求。
1960年,数据库技术开始迅速发展,IBM公司开发了第一个商业数据
库系统IMS,它是基于网络数据库模型的。
IBM在此之后又推出了IDMS和DB2等系统,这些都是基于概念数据库模型的。
1970年,芝加哥大学的数据库研究小组开发了“关系数据库模型”,这是一种新型的数据库管理技术,使用它可以更加方便地存储和检索数据,而且可以有效地适应用户的变化需求。
1980年代,关系数据库技术发展迅速,开发出了许多新的数据库产品,其中最知名的是艾伦·图灵奖获得者弗兰克·埃文斯创建的“Oracle”。
在他推出Oracle之前,数据库管理系统中存在的许多缺陷
得到了有效的解决,包括:运行效率低,存储空间不够,安全性差,失败
恢复能力差等。
1990年代,信息技术技术的发展越来越快,计算机硬件系统性能也
有了长足的进步。
分布式- 演进过程
分布式系统的演进过程可以分为以下几个阶段:
1. 集中式系统:早期的计算机系统都是集中式的,即所有的计算资源都集中在单一的计算机上进行处理。
这种系统的优点是简单易用,但存在单点故障、扩展困难等缺点。
2. 分布式文件系统:为了解决集中式系统的问题,人们开始将计算资源分散到多台计算机上,在这些计算机上实现分布式文件系统,使得多台计算机可以共享存储资源。
这种系统的优点是容错性强,但存在一些性能问题。
3. 分布式数据库系统:分布式文件系统不能提供完整的数据库管理功能,因此人们开始研究如何实现分布式数据库系统。
这种系统可以将数据库的不同部分分散到不同的计算机节点上进行处理,从而提高整个系统的性能和可靠性。
4. 分布式计算系统:分布式数据库系统虽然能提供比较好的数据库管理功能,但处理大量计算密集型任务时性能仍然不高。
因此人们开始研究分布式计算系统,利用多台计算机的计算能力完成任务。
这种系统广泛应用于大规模数据处理、科学计算等领域。
5. 云计算系统:云计算是一种新的计算范式,即将计算资源(包括计算、存储、网络等)抽象成一种服务,并通过互联网进行交付。
云计算系统本质上是一种大
规模的分布式计算系统,但具有更高的灵活性和可扩展性。
现在大数据是一个十分火热的技术,这也使得很多人都开始关注大数据的任何动态,因为大数据在某种程度上来说能够影响我们的生活。
在这篇文章中我们就给大家介绍一下大数据的分布式数据库的发展趋势,希望这篇文章能够帮助大家更好理解大数据的分布式数据库的发展趋势。
其实不论是Hadoop还是分布式数据库,技术体系上两者都已经向着计算存储层分离的方式演进。
对于Hadoop来说这一趋势非常明显,HDFS存储与YARN调度计算的分离,使得计算与存储均可以按需横向扩展。
而分布式数据库近年来也在遵循类似的趋势,很多数据库已经将底层存储与上层的SQL引擎进行剥离。
传统的XML数据库、OO数据库、与pre-RDBMS正在消亡;新兴领域文档类数据库、图数据库、Table-Style数据库与Multi-Model数据库正在扩大自身影响;传统关系型数据库、列存储数据库、内存分析型数据库正在考虑转型。
可以看到,从技术完整性与成熟度来看,Hadoop确实还处于相对早期的形态。
直到今天,很多技术在很多企业应用中需要大量的手工调优才能够勉强运行。
同时,Hadoop的主要应用场景一直以来面向批处理分析型业务,传统数据库在线联机处理部分不是其主要的发展方向。
同时Hadoop技术由于开源生态体系过于庞大,同时参与改造的厂商太多,使得用户很难完全熟悉整个体系,这一方面大大增加了开发的复杂度,提升了用户使用的难度,另一方面则是各个厂商之间维护不同版本,使得产品的发展方向可能与开源版本差别逐渐加大。
而分布式数据库领域经历了几十年的磨练,传统RDBMS的MPP技术早已经炉火纯青,在分类众多的分布式数据库中,其主要发展方向基本可以分为“分布式联机数据库”与“分布式分析型数据库”两种。
对比Hadoop与分布式数据库可以看出,Hadoop的产品发展方向定位,与分布式数据库中列存储数据库相当重叠而在高并发联机交易场景,在Hadoop中除了HBase能够勉强沾边以外,分布式数据库则占据绝对的优势。