数据库技术发展简史精品PPT课件
- 格式:ppt
- 大小:367.00 KB
- 文档页数:15
【重磅】现代数据仓库的技术演变和关键特性(附完整版PPT)谢谢赵老师,今天非常高兴来到讲台上面。
首先,一句话介绍一下星环科技。
星环科技是一家专门做Hadoop发行版和基础软件的一家公司。
目前在Hadoop之上的SQL引擎以及流处理引擎在技术上面已经远远领先于国外的同行,同时我们覆盖的行业也是最多。
下面我来介绍一下数据仓库的演变。
十年前,MPP数据库诞生,它的目标是替换和革原来数据仓库技术的命,然而却一直未能成功,国外的MPP数据库厂商也已基本被收购。
四年前,迈克·奥森宣布利用Hadoop进攻数据仓库市场,四年间虽在数据揭示上小有成就,但在整个数据仓库市场上并没有得到广泛应用。
随着SQL-on-Hadoop技术的成熟,Hadoop技术已逐渐进入到数据仓库的领域。
所以我们现在来具体看下什么是数据仓库。
数据仓库有各式各样的表现形态,有的是一个数据库(或数据库管理系统),有的是一体机,如T eradata 一体机,然而这只是它们的表象,实质上可能并不一定是一个数据库的形态。
如左图,有人认为它是一个酒杯,有人认为它是两个人脸的侧面像,同理,只从表面看,很多人可能会以为数据仓库就是一个数据库,但是它本质上是一个集中化的数据平台,把所有数据都集中在一个平台上面,进行数据的加工、处理和挖掘。
这使得现在Gartner 把数据仓库慢慢改变名称,以前是数据仓库数据库管理系统魔力象限,从2015年开始改成数据仓库和数据管理系统魔力象限,不再局限于数据库,这也意味着在数据仓库当中要引入一些新的技术,特别是像Hadoop技术来作为数据仓库。
引入它的重要原因就在于传统的数据仓库已碰到些许瓶颈。
接着我们来看一下传统数据仓库的构成。
企业客户会把数据分成内部数据和外部数据,内部数据通常分为两类,OLTP交易系统以及OLAP分析系统数据,他们会把这些数据全部集中起来,经过转换放到数据库当中,这些数据库通常是Teradata、Oracle、DB2数据库等。