cSlave0 存储真实数据
cSlave1
cSlaveN
存储真实数据
……
存储真实数据
10
5.1 引例 分布式存储
对内 对外
客户-服务器模式
只要保证store master正常工作,我们很容易随意添加 store slave,硬盘存储空间无限大。
统一存储空间,统一文件接口
整个集群就像是一台机器、一片云,硬盘显示为统一 存储空间,文件接口统一。
<china,2> <cstor,1>
处理本机数据
cSlave1存储file1 cstor china cstor
cSlave1处理file1
<china,1> <cstor,2>
cSlave0处理汇 总至本机数据
<china,2> <china,1>
cSlave1处理汇 总至本机数据
<cstor,1> <cstor,2>
5.1 引例 5.2 Hadoop 2.0简述 5.3 Hadoop 2.0部署 5.4 Hadoop 2.0体系架构 5.5 Hadoop 2.0访问接口 5.6 Hadoop 2.0编程接口
人均5TB
5.1 引例
5.1.1 5.1.2 5.1.3 5.1.4
问题概述 常规解决方案 分布式下的解决方案 小结
<cstor,1> <cstor,2>
计算后 得结果
<cstor,3>
结果存至DFS
洗牌
汇总计算
存结果
分布式计算
13
5.1 引例 分布式计算
本地计算 (Map)