Velocity 速度
• 1s 是临界点. • 对于大数据应用而言,必须要在1秒钟内形成答案,否则处理结果就是过时和无
效的. • 实时处理的要求,是区别大数据引用和传统数据仓库技术,BI技术的关键差别
之一.
讨论一下: 传统的数据库与大数据的区别?
问题1:大数据与传统数据库的区别
大数据是在传统数据库学科的分支——数据仓库与数据挖掘的基 础上进一步发展起来的。但有两点比较主要的不同:
PB是大数据層次的临界点. KB->MB->GB->TB->PB->EB->ZB->YB->NB->DB
Variety 多样性
•企业内部的经营交易信息;物联网世界中商品,物流信息;互联 网世界中人与人交互信息,位置信息等是大数据的主要来源. •文本/图片/视频 等非结构化/半结构化数据 •能够在不同的数据类型中,进行交叉分析的技术,是大数据的 核心技术之一.语义分析技术,图文转换技术,模式识别技术,地 理信息技术等,都会在大数据分析时获得应用.
• 噪声(异常)数据的处理:传统数据库通常把异常数据先剔除,应用在需要 高精确度的领域,如银行对每个账户的管理;大数据则允许异常数据存在, 更多应用在预测方面,找出大量数据中隐藏的关联关系,少量异常数据不会 对总体结果产生影响。
相关领域的应用
大数据使移动电商进入个性化时代
各种网络平台的开封不 仅增加了数据的规模,而 且使数据具有较强的流动 性和有效性
半结构化数据爆发式的增长
PB
EB
ZB
1GB(Gigabyte)=1024MB 1TB(Terabyte)=1024GB 1PB(Petabyte)=1024TB 1EB(Exabyte) =1024PB 1ZB(Zettabyte)=1024EB