降维 3 填充 4 数据格式
什么是填充值呢?
提到卷积层,就会不可避免地涉及填充这个名词以及填充值这个名词。那么,什么是填 充值呢?如图6-10所示,有一个5×5的图片,图片中的每一个格子都代表着一个像素,我 们依次滑动窗口,窗口大小我们取2×2,滑动步长我们设定为2,那么,我们会发现图中 会有一个像素没有办法滑动完毕,那么,该采用何种办法才能解决这样的问题呢? 为了保证滑动操作能够顺利完成,我们需要在不足的部分上再补充一些像素,我们在原 先的矩阵图像上添加了一层填充值,使得图片变成了如图6-11所示的6×6的矩阵图像, 按照填充后的图像来进行步长为2的滑动,则刚好能够将所有像素遍历完成,这就是填充 值最显著的作用。
6.1:卷积神经网络
卷积神经网络(Convolutional Neural Network, CNN)是深度学习技术中 极具代表的网络结构之一,属于人工神经网络的一种。其应用最成功的领域就 是图像处理。在国际标准的ImageNet数据集上,许多成功的模型都是基于卷积神 经网络的应用。
卷积神经网络相较于传统的图像处理算法的优点在与避免了对图像处理时复 杂的前期预处理过程(提取人工特征等),可以直接输入原始图像。
1 输入和卷积核 2 降维 3 填充 4 数据格式
卷积是图像处理常用的方法,给定输入图像,在输出图像中每 一个像素是输入图像中一个小区域中像素的加权平均。其中权 值由一个函数定义,这个函数称为卷积核,比如说卷积公式:
R(u,v) G(u i, v j) f (i, j)
其中f为输入,G为卷积核。
该模型的基本参数为。
输入:224×224大小的图片,3通道。 第一层卷积:11×11大小的卷积核96个,每个GPU上48个。 第一层max-pooling:2×2的卷积核。 第二层卷积:5×5大小的卷积核256个,每个GPU上128个。 第二层max-pooling:2×2的卷积核。 第三层卷积:与上一层是全连接,3×3大小的的卷积核384个。分到两个GPU上各192 个。