4
.
4
第三篇 Hbase简单介绍
一 :简介 二:数据模型 三:行、列、时间戳、API
5
.
5
第一篇HDFS 分布式文件系统
.
6
1 The Design of HDFS
Very large files
大数据集合为目标数
以千万计的文件
典型文件大小一般都在千兆至T字节
Streaming data access
通信接口
.
9
2.1 HDFS Concepts-blocks
files in HDFS are broken into block-sized chunks(64 MB by default)
1. 减少元数据的量 2. 有利于顺序读写(在磁盘上数据顺序存放) 3. 副本的默认数目是3
a file can be larger than any single disk in the network.
.
12
2.2.1 HDFS Concepts-Namenodes and Datanodes- Basic model
查看块信息hadoop fsck –files –blocks 部分运行结果
.
13
2.2.2 HDFS Concepts-Namenodes and Datanodes- NameNode
.
23
3 Hadoop应用程序示例
//在hdfs://master:9000/user/coole目录下创建文件并写入内容 public class DFSOperator {
public static void main(String[] args) { Configuration conf = new Configuration(); try { FileSystem fs = FileSystem.get(conf); Path t = new Path("hdfs://master:9000/user/coole/dfs_operator.txt"); FSDataOutputStream os = fs.create(t,true); int i = 0; for (i = 0 ;i<5; i++) os.writeChars("test"); os.close(); } catch (IOException e) { e.printStackTrace(); } }