基于改进Mobilenet算法的深度人脸识别算法

  • 格式:pdf
  • 大小:1.42 MB
  • 文档页数:6

下载文档原格式

  / 6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

引言

近年来,由于深度学习在图像识别领域内的卓越表现,人脸识别任务也逐渐开始采用深度学习方法来突破性能瓶颈。2014年,Facebook 团队利用深度学习在LFW 人脸数据库上得到97.35%的平均分类精度[1];同年,香港中文大学的团队[2]取得了97.45% 的成绩。由此,人脸识别任务的主要技术方法从传统的人工提取特征结合分类识别算法转变为基于卷积神经网络的深度学习方法,这种端对端的自主学习方法,可以更方便高效地提取人脸特征[3]。其后,Google 于2015年提出了FaceNet 模型,在 LFW 数据集上的准确率高达99.63%[4],接着更具挑战的MegaFace 数据集应运而生,该数据集采集了690572个ID 的1027060张公开人脸图像[5],对人脸识别的研究起到了至关重要的作用。

为了提高算法的性能,专家学者们研究设计出了很多表现优秀的损失函数。Triplet Loss [6]、L-Softmax Loss(Large-margin Softmax Loss)[7] 、Center Loss [8]、SphereFace 采用的A-Softmax(Angular Softmax Loss)[9]、AM-Softmax(Additive Margin Softmax)[10]等都对人脸识别

基于改进Mobilenet算法的深度人脸识别算法

的性能做出了很大的贡献。

除此以外,研究人员不断增加网络的层数以获得更好的性能,从最初7层的AlexNet 增加到16层的V G G ,到22层的G o o g l e N e t ,再到152层的ResNet [11]。随着网络深度的增加,模型的性能得到了显著提升,但是与此同时模型所需要的存储空间和预测所需要的时间也增加了很多。所以对移动端的人脸识别任务而言,通过增加网络的层数提高模型性能是不切实际的。所以设计出能仅利用移动端的硬件资源就能够快速完成基于深度学习模型的人脸识别任务至关重要。为了解决这些问题,目前提出的轻量级网络有SqueezeNet [12]、MobileNet [13]、ShuffleNet [14]等,它们在移动设备上都获得了不错的性能。

本文将采用传统的人工提取特征结合分类识别的方法进行人脸检测和人脸对齐,然后训练改进的Mobilenet 算法进行人脸识别,在轻量级网络上达到了较高的识别率。

1 人脸检测与特征点定位

人脸检测与特征点定位是人脸识别的关键步骤,会

摘 要 针对深度人脸识别任务在移动端遇到的存储空间受限、预测所需时间长、算法性能不高等问题,提出了一种改进的Mobilenet 算法。将Mobilenet 算法的监督信号Softmax 改进为AM-Softmax ,通过多次实验,设计出AM-Softmax 比较适合Mobilenet 算法的附加余量和缩放因子值。训练集和验证集来源于数据集MS-Celeb-1M-v1c 和数据集Asian-Celeb ,并在LFW 数据集上对改进Mobilenet 算法的有效性进行了验证。通过与初始Mobilenet 算法模型的对比实验发现,采用改进Mobilenet 算法的性能较优,准确率比softmax 提升了十个百分点。充分利用数据集Asian-Celeb 中的亚洲名人ID ,增加训练样本数,将性能进一步提高了四个百分点。关键词 深度学习;人脸识别;Mobilenet ;损失函数

刘梦雅 毛剑琳

昆明理工大学 昆明 650500

对最终的识别结果产生重要的影响。目前人脸检测与特征点定位的许多研究难点,例如人脸的差异性、人脸图像的大小、光照强度与方向等都得到了较好的解决。针对人脸检测与特征点定位任务的方法主要可分为以下三种:基于几何特征的方法、基于肤色模型的方法和基于统计理论的方法[15]。

基于几何特征的方法主要根据人脸轮廓特征、灰度分布特征、器官特征和模板特征等进行人脸检测与特征点定位。

基于肤色模型的方法是采用一些模型来确定人脸图片中属于肤色的像素,从而实现人脸检测。这种方法可以检测出人脸区域的像素,也会将人体其他区域(颈部、手、胳膊等)的肤色像素点检测出来,所以需要结合其他方法一起使用才能取得较好的效果。

基于统计理论的人脸检测与特征点定位方法是对从人脸图像提取的统计特征进行分析,再利用机器学习的方法查找统计特征,进而设计出分类器,再将人脸图像输入到设计出的分类器中进行人脸检测与特征点定位。神经网络、支持向量机、Adaboost算法等都是基于统计理论的方法。

本文采用基于统计理论的人脸检测与特征点定位方法,利用计算机视觉库 Opencv,将人脸的多种特征(LAB、SURF、SIFT)结合boosted分类器实现人脸图像的初步检测。

2 基于MobileNet的人脸识别算法

MobileNet是Google提出的一种深度学习网络,具有高效、低耗的特性,在图像分类、图像识别等任务中,可以保持较高的准确率。MobileNet算法对传统的全卷积方式进行了优化,将全卷积操作分解为两部分,分别是 Depthwise 卷积以及 Pointwise 卷积(深度可分离卷积),大大减少了需要学习的参数量,同时,这种稀疏化表达方式也减少了很多的冗余信息。在此基础上,模型又设置了两个超参数,分别为宽度因子和分辨率因子,以控制模型的大小和输入图像的分辨率,从而使得模型在规模和速度上更可控。

图1左侧为传统的卷积方式,经过3×3卷积后,再经过BN( Batch Normalization)层和Relu(Rectified Linear Unit)激活函数;右边是MobileNet算法提出的深度可分离卷积方式:3×3的传统卷积方式被替换为Depthwise 卷积和1×1的Pointwise卷积,然后与传统卷积一样分别经过BN和ReLU激活函数

图1 传统卷积与深度可分离卷积

在表1中,具体展示了MobileNet在ImageNet上训练时使用的网络架构(表格中含有dw表示这一层采用了Depthwise结合1x1Pointwise的方式),网络共有28 层。输入图片经过多次卷积池化,然后经过全连接和Softmax分类输出分类结果。

3 改进的MobileNet算法

如表1所示的MobileNet在ImageNet上训练时使用的网络架构中,分类器使用的是最传统的Softmax,但随着对Softmax研究的深入,更多优化后的Softmax 出现了。本文在做了众多对比实验后发现,针对MobileNet算法,AM-Softmax的分类效果比其它优化后的Softmax分类器更好,所以本文选择AM-Softmax分类器替换MobileNet原始的Softmax分类器。

3.1 Softmax

Softmax损失函数如式(1)所示。