单 Ha击do此o处p1编V辑S母H版ad标oo题p样2 式
单 集击群此资处源编管辑 理母版标题样式 Hadoop介绍
单 Ya击rn此运处行编原辑理母图版标题样式
单 Hb击as此e处介编绍辑母版标题样式
1 高可靠性 2 高效性 3 面向列 4 可伸缩 5 可在廉价PC
Server搭建大规模 结构化存储集群
单 Ta击bl此e&处R编eg辑io母n 版标题样式
Table随着记录增多不断变大,会自动分裂成多份Splits,成为Regions 一个region由[startkey,endkey)表示 不同region会被Master分配给相应的RegionServer进行管理
单 Hr击eg此io处nS编e辑rve母r 版标题样式
在数据库和HDFS之间高效传输数据的工具 分布式、可靠、和高可用的海量日志聚合的系统。
Chukwa是基于Hadoop的大集群监控系统,由yahoo贡献。
单 Ha击do此o处p介编绍辑母版标题样式
单 HD击F此S 处特编点辑母版标题样式
存储大文件
• 百兆以上级别文件 • 百万级文件由于亿级别文件
流式处理数据
单 HD击F此S 处部编署辑结母构版标题样式
单 HD击F此S 处读编写辑过母程版标题样式
单 Ma击p此Re处du编c辑e 母部版署标结题构样式
JobTracker
• 管理集群资 源和Job调度
TaskTracker
• 管理Task运 行
单 Ma击p此Re处du编c辑e 母计版算标模题型样式
Input
k1, v1 Map k2, v2 Reduce k3, v3
Output
单 Ma击p此Re处du编c辑e 母扩版展标接题口样式