当前位置：文档之家› tokyocabinet源码分析

tokyocabinet源码分析

码农70%时间看别人的代码，30%的时间自己写代码。本人也是这样

由于手头上的项目，花几天的时间把Tokyocabinet看了一下。

Tokyocabinet 是一个DBM的实现，这里的数据库由一系列key-value对的记录构成。Key 和value都可以是任意长度的字节序列。

Tokyocabinet的源码结构

md5.c

myconf.c

tcadb.c

tcamgr.c

tcatest.c

tcawmgr.c

tcbdb.c

tcbmgr.c

tcbmttest.c

tcbtest.c

tcfdb.c

tcfmgr.c

tcfmttest.c

tcftest.c

tchdb.c

tchmgr.c

tchmttest.c

tchtest.c

tctdb.c

tctmgr.c

tctmttest.c

tcttest.c

tcucodec.c

tcumttest.c

tcutest.c

tcutil.c

其中,tca*.c是抽象出来的数据库的代码，这个的库可以是hashtable,fix-length array database,b+ tree database 中的任何一种。tcb*.c是b+ tree数据库的相关代码,tcf*.c是fix-length array 数据库的相关代码,tch*.c是hashtable型数据库相关代码,tct*.c是table database相关的代码。理解了这些数据存储类型的区别,才能理解后来tokyotyrant的一些参数设置.在下一节就专门讲述这些; tcu*.c是工具类的杂项函数集。基本上所有的数据库类型都有*test和*mttest,*mgr三个二进制程序。比如fix-length-array database有tcftest.c,tcftest.c,tcfmttest.c都有是main函数的。

Tokyocabinet的存储类型

?如果DB名字为“*”内存中的Hash存储

?如果DB名字为“+”内存中的B+存储

?如果DB名字为“.tch”硬盘上的HASH存储

?如果DB名字为“.tch”硬盘上的B+存储

?如果DB名字为“.tcf”像数组一样的连续数字对应定长值的存储

?如果DB名字为“.tct”一个key值下面对应很多个name->value的形式

Tokyocabinet的关键参数

bnum : 指定bucket array的数量。推荐设置为存储总记录的0.5 – 4倍，使key的哈希分布更均匀，减少在bucket内二分查找的时间复杂度。

xmsiz: 指定TCHDB的扩展MMAP内存大小。

rcnum: 缓存内存的记录条数

dbgfd : 设置为1，调试信息

下面是硬盘上HASH存储的源码分析

文件结构

bnum个bucket

256字节头Buckets记录数据

图1 tch文件格式

如上图，文件大概分为3个部分

1256个字节的头，见下表；

2bnum个bucket数组，每个bucket保存offset, bucket 下第一个数据的绝对偏移量（文件）；

3数据部分

表1 头的结构

magic number 0 32 identification of the database. Begins with "ToKyO CaBiNeT"

database type 32 1 hash (0x01) / B+ tree (0x02) / fixed-length (0x03) / table

(0x04)

additional flags 33 1 logical union of open (1<<0) and fatal (1<<1)

alignment power 34 1 the alignment size, by power of 2

free block pool power

35 1 the number of elements in the free block pool, by power of 2

options 36 1 logical union of large (1<<0), Deflate (1<<1), BZIP2 (1<<2),

TCBS (1<<3), extra codec (1<<4)

bucket number 40 8 the number of elements of the bucket array

record number 48 8 the number of records in the database

file size 56 8 the file size of the database

first record 64 8 the offset of the first record

opaque region 128 128 users can use this region arbitrarily

On-memory hash 结构

……………….

maps

buckets

………

…………

records

图2

这是On-memory hash结构图

1 最上层是maps数组，长度固定为8，对key的访问先hash到其中一个map;

2 每个map由buckets数组组成（bnum/8）。Key经过第二次hash到其中一个bucket;

3 hash到同一bucket的records用二叉搜索树查找，先比较hash,再比较key。

Hash硬盘结构

……………….

buckets

records

图3

与图2比较起来，少了一个map层。

接口流程

Tchdbopen 的流程

tchdbopen

tchdbopenimpl

Open 数据库文

件

tch的文件是

否>0

读取tch的头

初始化头结构（前256字节）

Y N

初始化的Buf写

入到tch文件中

初始化结构

图4

不说明，直接见源码

Tchdbget 的流程

tchdbget

Tchdbbidx(kb uf,ksize)

对key 进行一次hash,算法为

time33的变种算法

tchdbgetimpl

参数rcnum 是否

根据上面hash 得到的值隐射到对应的bucket 下获取该bucket 中的值，off

该bucket 下第一条记录的绝对

偏移量

off 是否>0

返回空

根据off 获取该bucket 下

的第一条记录N

在该bucket 进行二叉树的查找，先比较hash,再

比较key

是否查到到对应的Key

返回空

把查找到的

写入到内存中

返回value

把经常用的数据写入内存中，类似内存和二级cache 的置换策略

从tch 中查找数据。

对key 进行hash,算出mi

隐射到对应的map 下再对key 进行hash,算出

hash 值根据hash 隐射到该map 下

对应的bucket

在上次hash 的结构下，再对key 进行一次hash,算出最终比较的hash 值

在map->bucket 下进行二叉树的搜索查询，先比较hash,再比较key

是否查找到OK 返回value

先从内存中查找

图5

Tchdbput的流程

tchdbput

Tchdbbidx算出

hash和bidx

清除内存中该key

对应的value

tchdbgetbucket获

取off

off是否>0

tchdbfbpsearch

是否找到

freepool

类似于内存管理

插入到freepool中插入文件的末尾

更新bucket的

值，指向该记录

在对应的bucket下进

行二叉搜索查询

是否找到对应

的key

替换该key对应的

value

插入叶子节点

更新叶子节点的left或

right值，指向该节点

N Y

Y N

hadoop学习课程介绍

云凡教育Hadoop网络培训第二期开课时间：2014年1月20日授课方式:YY在线教育+课程视频+资料、笔记+辅导+推荐就业 YY教育平台：20483828 课程咨询：1441562932 大胃云凡教育Hadoop交流群：306770165 费用：第二期优惠特价：999元；授课对象：对大数据领域有求知欲，想成为其中一员的人员想深入学习hadoop，而不只是只闻其名的人员基础技能要求: 具有linux操作一般知识（因为hadoop在linux下跑）有Java基础(因为hadoop是java写的并且编程也要用java语言) 课程特色 1，以企业实际应用为向导，进行知识点的深入浅出讲解； 2，从零起步，循序渐进，剖析每一个知识； 3，萃取出实际开发中最常用、最实用的内容并以深入浅出的方式把难点化于无形之中学习安排： Hadoop的起源与生态系统介绍(了解什么是大数据；Google的三篇论文；围绕Hadoop形成的一系列的生态系统；各个子项目简要介绍)

1_Linux系统环境搭建和基本命令使用针对很多同学对linux命令不熟悉，在课程的学习中，由于命令不熟悉导致很多错误产生，所以特意增加一节linux基础课程，讲解一些常用的命令，对接下来的学习中做好入门准备； 02_Hadoop本地（单机）模式和伪分布式模式安装本节是最基本的课程，属于入门级别，主要对Hadoop 介绍，集中安装模式，如何在linux上面单机（本地）和伪分布模式安装Hadoop，对HDFS 和MapReduce进行测试和初步认识。 03_HDFS的体系结构、Shell操作、Java API使用和应用案例本节是对hadoop核心之一——HDFS的讲解。HDFS是所有hadoop操作的基础，属于基本的内容。对本节内容的理解直接影响以后所有课程的学习。在本节学习中，我们会讲述hdfs的体系结构，以及使用shell、java不同方式对hdfs 的操作。在工作中，这两种方式都非常常用。学会了本节内容，就可以自己开发网盘应用了。在本节学习中，我们不仅对理论和操作进行讲解，也会讲解hdfs 的源代码，方便部分学员以后对hadoop源码进行修改。 04_MapReduce入门、框架原理、深入学习和相关MR面试题本节开始对hadoop核心之一——mapreduce的讲解。mapreduce是hadoop 的核心，是以后各种框架运行的基础，这是必须掌握的。在本次讲解中，掌握mapreduce执行的详细过程，以单词计数为例，讲解mapreduce的详细执行过程。还讲解hadoop的序列化机制和数据类型，并使用自定义类型实现电信日志信息的统计。最后，还要讲解hadoop的RPC机制，这是hadoop运行的基础，通过该节学习，我们就可以明白hadoop是怎么明白的了，就不必糊涂了，本节内容特别重要。 05_Hadoop集群安装管理、NameNode安全模式和Hadoop 1.x串讲复习 hadoop就业主要是两个方向：hadoop工程师和hadoop集群管理员。我们课程主要培养工程师。本节内容是面向集群管理员的，主要讲述集群管理的知

Xmodem协议详解以及源代码剖析

研究 Xmodem 协议必看的 11个问题 Xmodem 协议作为串口数据传输主要的方式之一,恐怕只有做过 bootloader 的才有机会接触一下, 网上有关该协议的内容要么是英语要么讲解不详细。笔者以前写 bootloader 时研究过 1k-Xmodem ,参考了不少相关资料。这里和大家交流一下我对 Xmodem 的理解,多多指教! 1. Xmodem 协议是什么? XMODEM协议是一种串口通信中广泛用到的异步文件传输协议。分为标准Xmodem 和 1k-Xmodem 两种,前者以 128字节块的形式传输数据,后者字节块为 1k 即 1024字节,并且每个块都使用一个校验和过程来进行错误检测。在校验过程中如果接收方关于一个块的校验和与它在发送方的校验和相同时,接收方就向发送方发送一个确认字节 (ACK。由于 Xmodem 需要对每个块都进行认可, 这将导致性能有所下降, 特别是延时比较长的场合, 这种协议显得效率更低。除了 Xmodem ,还有 Ymodem , Zmodem 协议。他们的协议内容和 Xmodem 类似,不同的是 Ymodem 允许批处理文件传输,效率更高; Zmodem 则是改进的了Xmodem ,它只需要对损坏的块进行重发,其它正确的块不需要发送确认字节。减少了通信量。 2. Xmodem 协议相关控制字符 SOH 0x01 STX 0x02 EOT 0x04 ACK 0x06 NAK 0x15

CAN 0x18 CTRLZ 0x1A 3.标准 Xmodem 协议(每个数据包含有 128字节数据帧格式 _______________________________________________________________ | SOH | 信息包序号 | 信息包序号的补码 | 数据区段 | 校验和 | |_____|____________|___________________|__________|____________| 4. 1k-Xmodem (每个数据包含有 1024字节数据帧格式 _______________________________________________________________ | STX | 信息包序号 | 信息包序号的补码 | 数据区段 | 校验和 | |_____|____________|___________________|__________|____________| 5.数据包说明对于标准 Xmodem 协议来说,如果传送的文件不是 128的整数倍,那么最后一个数据包的有效内容肯定小于帧长,不足的部分需要用 CTRL- Z(0x1A来填充。这里可能有人会问,如果我传送的是 bootloader 工程生成的 .bin 文件, mcu 收到后遇到0x1A 字符会怎么处理?其实如果传送的是文本文件,那么接收方对于接收的内容是很容易识别的,因为 CTRL-Z 不是前 128个 ascii 码, 不是通用可见字符, 如果是二进制文件, mcu 其实也不会把它当作代码来执行。哪怕是 excel 文件等,由于其内部会有些结构表示各个字段长度等,所以不会读取多余的填充字符。否则 Xmodem太弱了。对于 1k-Xmodem ,同上理。 6.如何启动传输?

java 基础知识之hadoop源码阅读必备(一)

java 程序员你真的懂java吗？一起来看下hadoop中的如何去使用java的大数据是目前IT技术中最火热的话题，也是未来的行业方向，越来越多的人参与到大数据的学习行列中。从最基础的伪分布式环境搭建，再到分布式环境搭建，再进入代码的编写工作。这时候码农和大牛的分界点已经出现了，所谓的码农就是你让我做什么我就做什么，我只负责实现，不管原理，也不想知道原理。大牛就开始不听的问自己why？why？why？于是乎，很自然的去看源码了。然而像hadoop这样的源码N多人参与了修改和完善，看起来非常的吃力。然后不管如何大牛就是大牛，再硬的骨头也要啃。目前做大数据的80%都是从WEB开发转变过来的，什么spring mvc框架、SSH框架非常熟悉，其实不管你做了多少年的WEB开发，你很少接触到hadoop中java代码编写的风格，有些人根本就看不懂什么意思。下面我来介绍下hadoop源码怎么看。 hadoop体现的是分布式框架，因此所有的通信都基于RPC来操作，关于RPC的操作后续再介绍。hadoop源码怎么看系列分多个阶段介绍，下面重点介绍下JA V A基础知识。一、多线程编程在hadoop源码中，我们能看到大量的类似这样的代码 return executor.submit(new Callable() { @Override public String call() throws Exception { //方法类 } 下面简单介绍下java的多线程编程启动一个线程可以使用下列几种方式 1、创建一个Runnable，来调度，返回结果为空。 ExecutorService executor = Executors.newFixedThreadPool(5); executor.submit(new Runnable() { @Override public void run() { System.out.println("runnable1 running."); } }); 这种方式启动一个线程后，在后台运行，不用等到结果，因为也不会返回结果 2、创建一个Callable，来调度，有返回结果 Future future1 = executor.submit(new Callable() { @Override public String call() throws Exception { // TODO Auto-generated method stub //具体执行一些内部操作 return "返回结果了！"; } }); System.out.println("task1: " + future1.get());

LWIP协议栈的分析和设计

---《计算机网络与控制》论文 LWIP协议栈的分析

摘要近些年来，随着互联网和通讯技术的迅猛发展，除了计算机之外，大量的嵌入式设备也需求接入网络。目前，互联网中使用的通讯协议基本是TCP/IP协议族，可运行于不同的网络上，本文研究的就是嵌入式TCP/IP协议栈LWIP。文章首先分析了LWIP的整体结构和协议栈的实现，再介绍协议栈的内存管理，最后讲解协议栈应用程序接口。关键词: 嵌入式系统;协议；LWIP；以太网 Abstract With the rapid development of internet and communication technology, Not only computers but also embeded equipments are need to connect networks. At present, the basic communication protocol using in internet is TCP/IP, it can run in different network. This paper analyses the Light-Weight TCP/IP. The process model of a protocol implementation and processing of every layer are described first, and then gives the detailed management of Buffer and memory. At last, a reference lwIP API is given. Key words: Embedded System, Protocol, Light weight TCP/IP,Ethernet 引言

hadoop入门学习资料大全

Hadoop是一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来，Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。 Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有着高容错性（fault-tolerent）的特点，并且设计用来部署在低廉的（low-cost）硬件上。而且它提供高传输率（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。搜索了一些WatchStor存储论坛关于hadoop入门的一些资料分享给大家希望对大家有帮助 jackrabbit封装hadoop的设计与实现 https://www.doczj.com/doc/d113430876.html,/thread-60444-1-1.html 用Hadoop进行分布式数据处理 https://www.doczj.com/doc/d113430876.html,/thread-60447-1-1.html

Hadoop源代码eclipse编译教程 https://www.doczj.com/doc/d113430876.html,/thread-60448-1-2.html Hadoop技术讲解 https://www.doczj.com/doc/d113430876.html,/thread-60449-1-2.html Hadoop权威指南(原版) https://www.doczj.com/doc/d113430876.html,/thread-60450-1-2.html Hadoop源代码分析完整版 https://www.doczj.com/doc/d113430876.html,/thread-60451-1-2.html 基于Hadoop的Map_Reduce框架研究报告 https://www.doczj.com/doc/d113430876.html,/thread-60452-1-2.html Hadoop任务调度 https://www.doczj.com/doc/d113430876.html,/thread-60453-1-2.html Hadoop使用常见问题以及解决方法 https://www.doczj.com/doc/d113430876.html,/thread-60454-1-2.html HBase：权威指南

详解hadoop核心架构

详解Hadoop核心架构通过阶段性的调研总结，从内部机理的角度详细分析，HDFS、MapReduce、Hbase、Hive是如何运行，以及基于Hadoop数据仓库的构建和分布式数据库内部具体实现。 HDFS的体系架构整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持，并通过MR来实现对分布式并行任务处理的程序支持。 HDFS采用主从（Master/Slave）结构模型，一个HDFS集群是由一个NameNode 和若干个DataNode组成的（在最新的Hadoop2.2版本已经实现多个NameNode 的配置-这也是一些大公司通过修改hadoop源代码实现的功能，在最新的版本中就已经实现了）。NameNode作为主服务器，管理文件系统命名空间和客户端对文件的访问操作。DataNode管理存储的数据。HDFS支持文件形式的数据。从内部来看，文件被分成若干个数据块，这若干个数据块存放在一组DataNode上。NameNode执行文件系统的命名空间，如打开、关闭、重命名文件或目录等，也负责数据块到具体DataNode的映射。DataNode负责处理文件系统客户端的文件读写，并在NameNode的统一调度下进行数据库的创建、删除和复制工作。NameNode是所有HDFS元数据的管理者，用户数据永远不会经过NameNode。图中涉及三个角色：NameNode、DataNode、Client。NameNode是管理者，DataNode是文件存储者、Client是需要获取分布式文件系统的应用程序。文件写入： 1）Client向NameNode发起文件写入的请求。 2）NameNode根据文件大小和文件块配置情况，返回给Client它管理的DataNode的信息。 3）Client将文件划分为多个block，根据DataNode的地址，按顺序将block 写入DataNode块中。文件读取： 1）Client向NameNode发起读取文件的请求。 2）NameNode返回文件存储的DataNode信息。 3）Client读取文件信息。 HDFS作为分布式文件系统在数据管理方面可借鉴点：文件块的放置：一个Block会有三份备份，一份在NameNode指定的DateNode 上，一份放在与指定的DataNode不在同一台机器的DataNode上，一根在于指定

hadoop3.0.0源码编译

1. 2.编译步骤 (1)jdk安装和部署 1.安装jdk cd /home/lly/下载/hadoop/ rpm –ivhjdk-8u101-linux-x64.rpm 2.添加环境变量 $sudo vim /etc/profile 3.加入如下内容 export JAVA_HOME=/usr/java/jdk1.8.0_101 export JRE_HOME=$JAVA_HOME/jre export CLASSPATH=.:$JAVA_HOME/lib:$JER_HOME/lib:$CLASSPATH export PATH=$JAVA_HOME/bin:$JER_HOME/bin:$PATH 按”esc” :w :q 4.立刻应用改变 $sudo source /etc/profile 5.测试 java –version java version "1.8.0_101" Java(TM) SE Runtime Environment (build 1.8.0_101-b13) Java HotSpot(TM) 64-Bit Server VM (build 25.101-b13, mixed mode) (2)maven安装和部署 1.解压 cd /home/lly/下载/hadoop/ tarzxvfapache-maven-3.3.9-bin.tar.gz -C /usr/soft 2.添加环境变量 $sudo vim /etc/profile

3.加入如下内容 export MAVEN_HOME=/usr/soft/apache-maven-3.3.3 export PATH=.:$PATH:$JAVA_HOME/bin:$MAVEN_HOME/bin 按”esc” :w :q 4.立刻应用改变 $sudo source /etc/profile 5.测试 mvn -version Apache Maven 3.3.9 (bb52d8502b132ec0a5a3f4c09453c07478323dc5; 2015-11-11T00:41:47+08:00) Maven home: /usr/soft/apache-maven-3.3.9 Java version: 1.8.0_101, vendor: Oracle Corporation Java home: /usr/java/jdk1.8.0_101/jre (3)依赖安装 1.输入命令 $sudoyum install g++ autoconfautomakelibtoolcmakezlib1g-dev pkg-configlibssl-de (4)安装cmake 1.解压 cd /home/lly/下载/hadoop/ tarzxvfcmake-3.6.2.tar.gz -C /usr/soft 2.安装 cd/usr/soft/cmake-3.6.2 ./bootstrap make make install 3.测试 cmake–version (5)安装protobuf 1.解压 cd /home/lly/下载/hadoop/ tarzxvfprotobuf-2.5.0.tar.gz -C /usr/soft 2.安装 cd/usr/soft/protobuf-2.5.0 ./configure --prefix=/usr/soft/protobuf-2.5.0 make

lwip各层协议栈详解

竭诚为您提供优质文档/双击可除lwip各层协议栈详解篇一：lwip协议栈源码分析 lwip源码分析 -----caoxw 1lwip的结构 lwip（lightweightinternetprotocol）的主要模块包括：配置模块、初始化模块、netif模块、mem（memp）模块、netarp模块、ip模块、udp模块、icmp模块、igmp模块、dhcp模块、tcp模块、snmp模块等。下面主要对我们需要关心的协议处理进行说明和梳理。配置模块：配置模块通过各种宏定义的方式对系统、子模块进行了配置。比如，通过宏，配置了mem管理模块的参数。该配置模块还通过宏，配置了协议栈所支持的协议簇，通过宏定制的方式，决定了支持那些协议。主要的文件是opt.h。初始化模块：初始化模块入口的文件为tcpip.c，其初始化入口函数为： voidtcpip_init(void(*initfunc)(void*),void*arg)

该入口通过调用lwip_init()函数，初始化了所有的子模块，并启动了协议栈管理进程。同时，该函数还带有回调钩子及其参数。可以在需要的地方进行调用。协议栈数据分发管理进程负责了输入报文的处理、超时处理、api函数以及回调的处理，原型如下： staticvoidtcpip_thread(void*arg) netif模块： netif模块为协议栈与底层驱动的接口模块，其将底层的一个网口设备描述成协议栈的一个接口设备（netinterface）。该模块的主要文件为netif.c。其通过链表的方式描述了系统中的所有网口设备。 netif的数据结构描述了网口的参数，包括ip地址、mac 地址、link状态、网口号、收发函数等等参数。一个网口设备的数据收发主要通过该结构进行。 mem（memp）模块： mem模块同一管理了协议栈使用的内容缓冲区，并管理pbuf结构以及报文的字段处理。主要的文件包括mem.c、memp.c、pbuf.c。 netarp模块： netarp模块是处理arp协议的模块，主要源文件为etharp.c。其主要入口函数为： err_tethernet_input(structpbuf*p,structnetif*netif)

深度探索Hadoop HDFS数据访问流程

深度探索Hadoop分布式文件系统（HDFS）数据读取流程1.开篇 Hadoop分布式文件系统（HDFS）是Hadoop大数据生态最底层的数据存储设施。因其具备了海量数据分布式存储能力，针对不同批处理业务的大吞吐数据计算承载力，使其综合复杂度要远远高于其他数据存储系统。因此对Hadoop分布式文件系统（HDFS）的深入研究，了解其架构特征、读写流程、分区模式、高可用思想、数据存储规划等知识，对学习大数据技术大有裨益，尤其是面临开发生产环境时，能做到胸中有数。本文重点从客户端读取HDFS数据的角度切入，通过Hadoop源代码跟踪手段，层层拨开，渐渐深入Hadoop机制内部，使其读取流程逐渐明朗化。 2.HDFS数据读取整体架构流程如上图所示：描绘了客户端访问HDFS数据的简化后整体架构流程。（1）客户端向hdfs namenode节点发送Path文件路径的数据访问的请求（2）Namenode会根据文件路径收集所有数据块（block）的位置信息，并根

据数据块在文件中的先后顺序，按次序组成数据块定位集合（located blocks），回应给客户端（3）客户端拿到数据块定位集合后，创建HDFS输入流，定位第一个数据块所在的位置，并读取datanode的数据流。之后根据读取偏移量定位下一个 datanode并创建新的数据块读取数据流，以此类推，完成对HDFS文件的整个读取。 3.Hadoop源代码分析经过上述简单描述，我们对客户端读取HDFS文件数据有了一个整体上概念，那么这一节，我们开始从源代码跟踪的方向，深度去分析一下HDFS的数据访问内部机制。 (一)namenode代理类生成的源代码探索为什么我们要先从namenode代理生成说起呢？原因就是先了解清楚客户端与namenode之间的来龙去脉，再看之后的数据获取过程就有头绪了。（1）首先我们先从一个hdfs-site.xml配置看起 dfs.client.failover.proxy.provider.fszx https://www.doczj.com/doc/d113430876.html,node.ha.ConfiguredFailoverProxyProvider 配置中定义了namenode代理的提供者为ConfiguredFailoverProxyProvider。什么叫namenode代理？其实本质上就是连接namenode服务的客户端网络通讯对象，用于客户端和namenode服务端的交流。（2）接着我们看看ConfiguredFailoverProxyProvider的源代码继承关系结构：

LwIP协议栈源码详解

LwIP协议栈源码详解 ——TCP/IP协议的实现 Created by.. 老衲五木 at.. UESTC Contact me.. for_rest@https://www.doczj.com/doc/d113430876.html, 540535649@https://www.doczj.com/doc/d113430876.html,

前言最近一个项目用到LwIP，恰好看到网上讨论的人比较多，所以有了写这篇学习笔记的冲动，一是为了打发点发呆的时间，二是为了吹过的那些NB。往往决定做一件事是简单的，而坚持做完这件事却是漫长曲折的，但终究还是写完了，时间开销大概为四个月，内存开销无法估计。。这篇文章覆盖了LwIP协议大部分的内容，但是并不全面。它主要讲解了LwIP协议最重要也是最常被用到的部分，包括内存管理，底层网络接口管理，ARP层，IP层，TCP层，API 层等，这些部分是LwIP的典型应用中经常涉及到的。而LwIP协议的其他部分，包括UDP，DHCP,DNS,IGMP,SNMP,PPP等不具有使用共性的部分，这篇文档暂时未涉及。原来文章是发在空间中的，每节每节依次更新，后来又改发为博客，再后来就干脆懒得发了。现在终于搞定，于是将所有文章汇总。绞尽脑汁的想写一段空前绝后，人见人爱的序言，但越写越觉得像是猫儿抓的一样。就这样，PS:由于本人文笔有限，情商又低，下里巴人一枚，所以文中的很多语句可能让您很纠结，您可以通过邮箱与我联系。共同探讨才是进步的关键。最后，欢迎读者以任何方式使用与转载，但请保留作者相关信息，酱紫！码字。。。世界上最痛苦的事情莫过于此。。。 ——老衲五木

目录 1 移植综述------------------------------------------------------------------------------------------------------4 2 动态内存管理------------------------------------------------------------------------------------------------6 3 数据包pbuf--------------------------------------------------------------------------------------------------9 4 pbuf释放---------------------------------------------------------------------------------------------------13 5 网络接口结构-----------------------------------------------------------------------------------------------16 6 以太网数据接收--------------------------------------------------------------------------------------------20 7 ARP表-----------------------------------------------------------------------------------------------------23 8 ARP表查询-----------------------------------------------------------------------------------------------26 9 ARP层流程-----------------------------------------------------------------------------------------------28 10 IP层输入-------------------------------------------------------------------------------------------------31 11 IP分片重装1--------------------------------------------------------------------------------------------34 12 IP分片重装2--------------------------------------------------------------------------------------------37 13 ICMP处理-----------------------------------------------------------------------------------------------40 14 TCP建立与断开----------------------------------------------------------------------------------------43 15 TCP状态转换-------------------------------------------------------------------------------------------46 16 TCP控制块----------------------------------------------------------------------------------------------49 17 TCP建立流程-------------------------------------------------------------------------------------------53 18 TCP状态机----------------------------------------------------------------------------------------------56 19 TCP输入输出函数1-----------------------------------------------------------------------------------60 20 TCP输入输出函数2-----------------------------------------------------------------------------------63 21 TCP滑动窗口-------------------------------------------------------------------------------------------66 22 TCP超时与重传----------------------------------------------------------------------------------------69 23 TCP慢启动与拥塞避免-------------------------------------------------------------------------------73 24 TCP快速恢复重传和Nagle算法-------------------------------------------------------------------76 25 TCP坚持与保活定时器-------------------------------------------------------------------------------80 26 TCP定时器----------------------------------------------------------------------------------------------84 27 TCP终结与小结----------------------------------------------------------------------------------------88 28 API实现及相关数据结构-----------------------------------------------------------------------------91 29 API消息机制--------------------------------------------------------------------------------------------94 30 API函数及编程实例-----------------------------------------------------------------------------------97

Hadoop源代码分析(完整版)

关键字: 分布式云计算 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章，介绍了它们的计算设施。 GoogleCluster： https://www.doczj.com/doc/d113430876.html,/archive/googlecluster.html Chubby：https://www.doczj.com/doc/d113430876.html,/papers/chubby.html GFS：https://www.doczj.com/doc/d113430876.html,/papers/gfs.html BigTable：https://www.doczj.com/doc/d113430876.html,/papers/bigtable.html MapReduce：https://www.doczj.com/doc/d113430876.html,/papers/mapreduce.html 很快，Apache上就出现了一个类似的解决方案，目前它们都属于Apache的Hadoop项目，对应的分别是： Chubby-->ZooKeeper GFS-->HDFS BigTable-->HBase MapReduce-->Hadoop 目前，基于类似思想的Open Source项目还很多，如Facebook用于用户分析的Hive。 HDFS作为一个分布式文件系统，是所有这些项目的基础。分析好HDFS，有利于了解其他系统。由于Hadoop的HDFS和MapReduce 是同一个项目，我们就把他们放在一块，进行分析。下图是MapReduce整个项目的顶层包图和他们的依赖关系。Hadoop包之间的依赖关系比较复杂，原因是HDFS提供了一个分布式文件系统，该系统提供API，可以屏蔽本地文件系统和分布式文件系统，甚至象Amazon S3这样的在线存储系统。这就造成了分布式文件系统的实现，或者是分布式文件系统的底层的实现，依赖于某些貌似高层的功能。功能的相互引用，造成了蜘蛛网型的依赖关系。一个典型的例子就是包conf，conf用于读取系统配置，它依赖于fs，主要是读取配置文件的时候，需要使用文件系统，而部分的文件系统的功能，在包fs中被抽象了。 Hadoop的关键部分集中于图中蓝色部分，这也是我们考察的重点。

lwip协议栈源码分析

LWIP源码分析 ----- caoxw 1 LWIP的结构 LWIP（Light weight internet protocol）的主要模块包括：配置模块、初始化模块、NetIf 模块、mem（memp）模块、netarp模块、ip模块、udp模块、icmp 模块、igmp模块、dhcp 模块、tcp模块、snmp模块等。下面主要对我们需要关心的协议处理进行说明和梳理。配置模块：配置模块通过各种宏定义的方式对系统、子模块进行了配置。比如，通过宏，配置了mem管理模块的参数。该配置模块还通过宏，配置了协议栈所支持的协议簇，通过宏定制的方式，决定了支持那些协议。主要的文件是opt.h。初始化模块：初始化模块入口的文件为tcpip.c，其初始化入口函数为： void tcpip_init(void (* initfunc)(void *), void *arg) 该入口通过调用lwip_init()函数，初始化了所有的子模块，并启动了协议栈管理进程。同时，该函数还带有回调钩子及其参数。可以在需要的地方进行调用。协议栈数据分发管理进程负责了输入报文的处理、超时处理、API函数以及回调的处理，原型如下： static void tcpip_thread(void *arg) NetIf模块： Netif模块为协议栈与底层驱动的接口模块，其将底层的一个网口设备描述成协议栈的一个接口设备（net interface）。该模块的主要文件为netif.c。其通过链表的方式描述了系统中的所有网口设备。 Netif的数据结构描述了网口的参数，包括IP地址、MAC地址、link状态、网口号、收发函数等等参数。一个网口设备的数据收发主要通过该结构进行。 Mem（memp）模块： Mem模块同一管理了协议栈使用的内容缓冲区，并管理pbuf结构以及报文的字段处理。主要的文件包括mem.c、memp.c、pbuf.c。 netarp模块： netarp模块是处理arp协议的模块，主要源文件为etharp.c。其主要入口函数为： err_t ethernet_input(struct pbuf *p, struct netif *netif) 该入口函数通过判断输入报文p的协议类型来决定是按照arp协议进行处理还是将该报文提交到IP协议。如果报文是arp报文，该接口则调用etharp_arp_input，进行arp请求处理。如果是ip报文，该接口就调用etharp_ip_input进行arp更新，并调用ip_input接口，将报文提交给ip层。在该模块中，创建了设备的地址映射arp表，并提供地址映射关系查询接口。同时还提供了arp报文的发送接口。如下：

详解Hadoop核心架构

详解Hadoop核心架构通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce 处理过程，以及数据仓库工具Hive和分布式数据库Hbase的介绍，基本涵盖了Hadoop分布式平台的所有技术核心。通过这一阶段的调研总结，从内部机理的角度详细分析，HDFS、MapReduce、Hbase、Hive是如何运行，以及基于Hadoop数据仓库的构建和分布式数据库内部具体实现。如有不足，后续及时修改。 HDFS的体系架构整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持，并通过MR来实现对分布式并行任务处理的程序支持。 HDFS采用主从（Master/Slave）结构模型，一个HDFS集群是由一个NameNode 和若干个DataNode组成的（在最新的Hadoop2.2版本已经实现多个NameNode 的配置-这也是一些大公司通过修改hadoop源代码实现的功能，在最新的版本中就已经实现了）。NameNode作为主服务器，管理文件系统命名空间和客户端对文件的访问操作。DataNode管理存储的数据。HDFS支持文件形式的数据。从内部来看，文件被分成若干个数据块，这若干个数据块存放在一组DataNode 上。NameNode执行文件系统的命名空间，如打开、关闭、重命名文件或目录等，也负责数据块到具体DataNode的映射。DataNode负责处理文件系统客户端的文件读写，并在NameNode的统一调度下进行数据库的创建、删除和复制工作。NameNode是所有HDFS元数据的管理者，用户数据永远不会经过NameNode。

如图：HDFS体系结构图图中涉及三个角色：NameNode、DataNode、Client。NameNode是管理者，DataNode是文件存储者、Client是需要获取分布式文件系统的应用程序。文件写入： 1）Client向NameNode发起文件写入的请求。 2）NameNode根据文件大小和文件块配置情况，返回给Client它管理的DataNode的信息。 3）Client将文件划分为多个block，根据DataNode的地址，按顺序将block 写入DataNode块中。文件读取： 1）Client向NameNode发起读取文件的请求。 2）NameNode返回文件存储的DataNode信息。 3）Client读取文件信息。 HDFS作为分布式文件系统在数据管理方面可借鉴点：

LwIP协议栈开发嵌入式网络的三种方法分析

LwIP协议栈开发嵌入式网络的三种方法分析摘要轻量级的TCP/IP协议栈LwIP，提供了三种应用程序设计方法，且很容易被移植到多任务的操作系统中。本文结合μC/OS-II这一实时操作系统，以建立TCP服务器端通信为例，分析三种方法以及之间的关系，着重介绍基于raw API的应用程序设计。最后在ST公司STM32F107微处理器平台上验证，并给出了测试结果。关键词LwIP协议栈；μC/OS-II；嵌入式网络；STM32F107；随着嵌入式系统功能的多样化以及网络在各个领域的中的广泛应用，具备网络功能的嵌入式设备拥有更高的使用价值和更强的通用性。然而大部分嵌入式设备使用经济型处理器，受内存和速度限制，资源有限，不需要也不可能完整实现所有的TCP/IP协议，有时只需要满足实际需求就行。LwIP是由瑞典计算机科学研究院开发的轻量型TCP/IP协议栈，其特点是保持了以太网的基本功能，通过优化减少了对存储资源的占用。LwIP是免费、开源的，任何人可以使用，能够在裸机的环境下运行，当然设计的时候也考虑了将来的移植问题，可以很容易移植到多任务操作系统中。本文介绍了以ARM微处理器STM32F107和PHY接口DP83848为平台，构建的嵌入式系统中，采用LwIP和嵌入式操作系统μC/OS-II，使用协议栈提供的三种应用程序接口，实现嵌入式设备的网络通信功能。 1LwIP和μC/OS-II介绍 1.1 LwIP协议栈 LwIP协议是瑞士计算机科学院的Adam Dunkels等开发的一套用于嵌入式系统的开放源代码TCP/IP协议栈。LwIP含义是light weight(轻型)IP协议，在实现时保持了TCP协议的主要功能基础上减少对RAM的占用，一般它只需要几十K的RAM和40K左右的ROM 就可以运行，这使LwIP协议栈很适合在低端嵌入式系统中使用。 LwIP协议栈的设计才用分层结构的思想，每一个协议都作为一个模块来实现，提供一些与其它协议的接口函数。所有的TCP/IP协议栈都在一个进程当中，这样TCP/IP协议栈就和操作系统内核分开了。而应用程序既可以是单独的进程也可以驻留在TCP/IP进程中，它们之间利用ICP机制进行通讯。如果应用程序是单独的线程可以通过操作系统的邮箱、消息队列等，与协议栈进程通讯。如果应用程序驻留在协议栈进程中，则应用程序可以通过内部回调函数和协议栈进程通讯。 1.2 μC/OS-II实时操作系统 μC/OS-II是一个源码公开、可移植、可固化、可裁剪及占先式的实时多任务操作系统，是专门为嵌入式应用设计的实时操作系统内核，已广泛的应用在各种嵌入式系统中。 μC/OS-II是多任务系统，内核负责管理各个任务，每个任务都有其优先级，μC/OS-II 最多可以管理64个任务，其每个任务都拥有自己独立的堆栈。μC/OS-II提供了非常丰富的系统服务功能，比如信号量、消息邮箱、消息队列、事件标志、内存管理和时间管理等，这些功能可以帮助用户实现非常复杂的应用。 1.3 LwIP协议栈移植到μC/OS-II LwIP协议栈在设计的时候就考虑到了将来的移植问题，因此把所有与硬件、操作系统、编译器有关的部分都全部独立起来，形成了一个操作系统模拟层。操作系统模拟层用进程间的信号量、邮箱机制处理通信问题，而μC/OS-II是一个基于任务调度的嵌入式实时操作系