当前位置:文档之家› 基于卷积神经网络的目标检测模型的研究

基于卷积神经网络的目标检测模型的研究

上海交通大学硕士学位论文

目录

第一章引言 (1)

1.1 研究背景与意义 (1)

1.2 本文主要工作 (3)

1.3 本文章节安排 (4)

第二章传统目标检测模型 (5)

2.1 人工神经网络 (5)

2.1.1 人工神经网络的发展历史 (5)

2.1.2 人工神经网络的结构模型 (9)

2.1.3 人工神经网络的主要特点 (11)

2.2 支持向量机 (12)

2.2.1 支持向量机的主要特点 (12)

2.2.2 支持向量机的损失函数 (14)

2.2.3 支持向量机的线性分类 (17)

2.2.4 支持向量机的核函数 (21)

2.3 目标特征提取 (22)

2.3.1 类哈尔特征 (23)

2.3.2 尺度不变特征转换 (24)

2.3.3 方向梯度直方图 (26)

2.4 本章小结 (28)

第三章卷积神经网络 (29)

3.1 背景介绍 (29)

3.2 网络结构 (32)

3.3 主要特点 (36)

3.3.1 稀疏连接 (36)

3.3.2 权值共享 (38)

3.3.3 采样 (39)

3.4 本章小结 (40)

第四章基于CNN的隐式训练目标检测 (41)

V

万方数据

上海交通大学硕士学位论文

4.1 背景介绍 (41)

4.2 主要特点 (41)

4.2.1 部件检测 (42)

4.2.2 隐式训练 (43)

4.2.3 两段式学习 (44)

4.3 三层部件模型 (44)

4.3.1 网络结构 (44)

4.3.2 激活函数 (45)

4.3.3 前向传播 (47)

4.4 四层全局模型 (49)

4.4.1 网络结构 (49)

4.4.2 预训练 (50)

4.4.3 前向传播 (50)

4.5 本章小结 (51)

第五章基于CNN的隐式训练学习算法 (52)

5.1 背景介绍 (52)

5.2 基本原理 (52)

5.2.1 成本函数 (53)

5.2.2 损失函数 (54)

5.2.3 参数更新 (55)

5.2.4 学习速率 (56)

5.3 算法流程 (57)

5.3.1 偏置梯度 (57)

5.3.2 权值梯度 (60)

5.3.3 隐式训练 (60)

5.3.4 流程示意 (61)

5.4 本章小结 (62)

第六章实验结果与分析 (63)

6.1 实验环境 (63)

6.2 实验数据库 (63)

6.2.1 INRIA人类数据库 (63)

6.2.2 A-MNIST数字角点库 (65)

VI

万方数据

上海交通大学硕士学位论文

6.3 实验结果分析 (67)

6.3.1 多部件检测对比实验 (67)

6.3.2 多部件检测扩展实验 (69)

6.3.3 多子类检测对比实验 (70)

6.4 本章小结 (71)

第七章总结和展望 (72)

7.1 主要工作与创新点 (72)

7.2 后续研究工作 (72)

7.2.1 结构参数和学习方法 (72)

7.2.2 算法加速 (73)

参考文献 (75)

致谢 (79)

攻读硕士学位期间已发表或录用的论文 (80)

VII

万方数据

上海交通大学硕士学位论文

图录

图1-1检测识别的应用领域 (1)

图2-1神经元基本结构 (6)

图2-2MP模型结构 (6)

图2-3ADALINE模型结构 (8)

图2-4 ANN的四种连接方式 (10)

图2-5逻辑回归的逻辑函数 (15)

图2-6逻辑回归的损失函数 (16)

图2-7 SVM的损失函数 (17)

图2-8二维平面的超平面 (18)

图2-9二维平面的几何间隔 (19)

图2-10二维平面的支持向量 (20)

图2-11非线性变换 (21)

图2-12类哈尔特征的特征模板 (23)

图2-13多尺度空间的图像金字塔 (25)

图2-14多尺度空间的极值点 (26)

图2-15描述子生成 (26)

图2-16 HoG的特征提取 (28)

图3-1新认知机的网络结构 (29)

图3-2人工特征建模过程 (30)

图3-3 CNN结构 (33)

图3-4均值采样 (35)

图3-5稀疏连接 (37)

图3-6权值共享 (39)

图4-1行人的部件检测 (42)

图4-2三层部件模型的结构 (45)

图4-3 Sigmoid函数 (46)

图4-4本文采用的tanh函数 (46)

图4-5最大值采样 (48)

VIII

万方数据

上海交通大学硕士学位论文

图4-6三层部件模型检测流程 (49)

图4-7四层全局模型的结构 (50)

图4-8四层全局模型检测流程 (51)

图5-1梯度学习算法 (53)

图5-2均值恢复采样 (59)

图5-3最大值恢复采样 (59)

图5-4三层部件模型学习流程 (61)

图5-5四层全局模型学习流程 (62)

图6-1INRIA标准库正样本 (64)

图6-2 INRIA原库负样本 (64)

图6-3 MNIST数据库样本 (65)

图6-4条形码角点数据库样本 (66)

图6-5正样本裁剪 (67)

图6-6不同模型DET曲线图 (68)

图6-7扩展实验DET曲线图 (69)

图6-8多子类实验结果图 (70)

IX

万方数据

上海交通大学硕士学位论文

表录

表2-1重要的传统ANN一览表 (9)

表2-2 ANN和SVM的主要特点和区别 (14)

表5-1 LeNet-5模型学习速率 (57)

X

万方数据

上海交通大学硕士学位论文

第一章引言

1.1研究背景与意义

随着过去几十年间经济的飞速发展,目标检测和识别已经成为包括国防军事、社会安全、公共交通、互联网发展和商业应用等各领域的基础性研究课题之一,

如图1-1所示。所谓目标检测和识别,就是通过分析目标的几何或统计特征,从

图像或视频中准确识别出目标并将其分割出来。鉴于它在现代社会的重要性,大

量的研究都对目标检测,比如行人检测等等,产生了浓厚而热忱的兴趣[2,3]。然而,

目标通常具有各种不同的形态、颜色、光亮和遮挡等多变因素,目标所处的场所

环境也缤纷复杂,这些因素使得基于计算机视觉的目标检测面临着巨大的挑战。

图1-1检测识别的应用领域

Fig.1-1 The application field of target detection and recognition

传统检测模型通常采用复杂的人工特征提取方法,比如尺度不变特征转换[4](Scale-invariant feature transform, SIFT)、方向梯度直方图[2](Histogram of gradient, HoG)等等,来获取原始输入中和目标有关的表达信息,并在提取的和目标有关

的特征信息上学习分类器。然而,人工特征提取方法存在着诸多的局限:SIFT特

征基于高斯微分函数来提取图像中对尺度、旋转等不变的特征点,解决了局部图

像特征描述的很多问题,但其需要大量的纹理特征,否则容易造成错配;HoG特

征基于图像的边缘(梯度)特征来提取目标形状,并采用了分块处理方法,很好

地处理了图像的局部信息,但其很难处理局部遮挡的目标。这些限制使得模型对

- 1 -

万方数据

相关主题
文本预览
相关文档 最新文档