基于深度学习的人脸识别方法

 2022-09-30 14:46:02

论文总字数:31557字

摘 要

论文作者签名:_____导师签名:____日期:____

摘要

当前来看,深度学习方法或取代传统模式识别方法已成为了业界的一种共识,这主要因为前者能够更精确、更高效、更通用地实现识别任务。

本文应用三种经典的卷积神经网络(VGG,AlexNet,CaffeNet),实现了基于深度学习的人脸识别。整个工作包括:平台搭建-数据制作-功能实现-性能对比-网络优化,共五个部分。本文首先在CASIA-WebFace数据集上有监督地训练网络模型,再利用训练完成后的模型提取全连接层作为图像的深度表示,并在LFW数据集上进行人脸验证。人脸验证过程中,本文对比了AlexNet、CaffeNet、 VGG网络的性能,并通过选用不同的网络功能模块(如Local Response Normalization与Batch Normalization,Dropout等),调整重要参数设置(Batch大小,基础学习率,正则化权重衰减速率等),探索优化卷及神经网络的方法。最后,参考2016年DeepMind提出的进化网络模型,采用了迁移学习方法将VGG网络识别精度提升至91.7%,与传统的fine-tune微调相比收敛速度更快精度也更高。

关键词:深度学习,卷积神经网络,网络优化,迁移学习

Abstract

According to the technology trends, deep learning enable a prediction that traditional pattern method is being replaced by deep approach. This opinion also has been widely accepted by academic researchers and engineers. Because the former can realize recognition task more efficiently, robustly and universally.

This thesis applies three classic convolutional neural networks (VGG, AlexNet,CaffeNet) for realizing face recognition task. The whole work is composed by five parts, respectively are: platform construction, data configuration, preliminary implementation, performance comparison, network optimization. Firstly, we train network on a labeled dataset, CASIA-WebFace, and then extract a full connected layer from the network as a deep representation of input image. Next, we test our trained model and certificate face pairs to get recognition accuracy. In face verification, we contrast the performance of three CNNs, and work on exploring the optimized method to refine original CNN, mainly by adopting different function nodules (such as Local Response Normalization and Batch Normalization, Dropout.) and adjusting parameter setting of CNN (Batch size, basic learning rate, weight decay of regulation, etc.). Finally, referring to the progressive network proposed by DeepMind in 2016, we improve the recognition accuracy of VGG to 91.7%. Additionally, the corresponding convergence rate is also quicker than fine-tune.

Key words: deep learning, convolutional neural network, network optimization, transfer learning

目 录

摘要 I

Abstract II

第一章 绪论 1

1.1 引言 1

1.2 研究现状 1

1.3 本文的研究目的与研究内容 6

1.3.1 研究目的 6

1.3.2 研究内容 6

第二章 深度学习综述 7

2.1 人工神经网络与标准反向传播算法 7

2.2 卷积神经网络 10

2.2.1 输入层 11

2.2.2 卷积层 12

2.2.3 激励层 14

2.2.4 池化层 15

2.2.5 全连接层 16

2.2.6 输出层 16

2.3 Dropout与Batch Normalization 18

2.4 迁移学习与进化网络 20

2.5 本章小结 22

第三章 项目架构与方案设计 23

3.1 总体架构 23

3.2 方案设计 24

3.2.1 网络选择 24

3.2.2 网络优化 24

3.3 本章小结 25

第四章 实验 26

4.1 实验开发框架Caffe 26

4.2 数据库 27

4.3 网络训练 28

4.4 模型验证 29

4.5 结果与分析 30

4.6 本章小结 32

第五章 总结与展望 33

5.1 总结 33

5.2 展望 33

致谢 34

参考文献 35

绪论

引言

人脸识别问题由来已久。其主要过程是利用计算机提取目标人脸的特征,再根据这些特征进行身份即分类,这个过程分为三个步骤:人脸检测、面部特征点对齐、特征提取与分类器设计,而一般提及人脸识别指的是“特征提取 分类器”部分。人脸识别的核心是各种特征提取与分类算法,这决定其识别率和识别速度。由于人脸具有唯一性,且与其他生物特征相比,识别的效果更直观,但目标人脸可能处于十分复杂的环境,识别正确率又受到人物表情、动作姿态、面部遮挡(如眼镜、胡须)、环境光照诸多因素的影响,故而学界又常常将人脸识别问题视作计算机视觉领域的标杆,并广泛地将相关先进技术应用于刑侦、信息安全等领域。值得注意的是,不同于常见的虹膜、指纹识别技术,由于人脸信息采集过程侵入性较小,更加受到业界的关注与青睐。

从人脸识别技术的发展潮流来看,最初多是对条件严格限制的标准正脸进行识别,后来又逐渐展开对多姿态、大姿态人脸识别的研究,而研究视角也从2D拓展到3D空间,伴随其间的是传统的识别方法(如PCA提取特征脸匹配,LDA线性判别分析等)正快速地被以深度学习为代表了的更先进的方法取代。

研究现状

早在上世纪60年代,人脸识别技术就已诞生。虽然这种方法还是半自动,与今天各种“数据驱动”的方法来比,显得十分稚嫩,但这可说是人脸识别研究的滥觞。1988,Kirby和Sirovich等[1]首次应用主成分分析(PCA)—经典的降维算法,对一组目标人脸图片提取特征脸后进行人脸识别。首先图片会进行矫正对齐,而后将其视作一组高维数据,然后通过去均值、特征值与特征向量提取、排序、选取,去除掉数据中的冗余部分,得到能够通过线性组合出目标人脸的任意图片的“基”,称之为特征脸(如图1-1所示,从CASIA集选取的15张同身份的人脸进行PCA操作。第一行前三张来自15张输入图片,第四张是平均脸,第二行四张都是计算得到的特征脸)。将需要判别的人脸与目标人脸集内的人脸都以特征脸表示,再求取两者之间的欧几里得(Euclidean)距离,当距离小于阈值时可断定二者属于同一个人。

剩余内容已隐藏,请支付后下载全文,论文总字数:31557字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;