基于级联多任务卷积网络的人脸检测和人脸对齐

 2022-05-19 22:03:48

论文总字数:29216字

摘 要

人脸检测与人脸对齐是许多人脸分析应用的必要步骤,其处理的问题为确定人脸及人脸关键点在图像中的位置。人脸检测与人脸对齐在如今的社会中有着非常广泛的应用场景,也是实现机器智能化的重要步骤之一。

本论文基于级联多任务卷积神经网络,针对开放场景下的正脸图像,实现了同时的人脸检测和人脸对齐,在保持较高精确度的情况下仍有较快的运行速度。具体地,本文的主要工作如下:

1. 本文使用了四个精心设计的卷积神经网络组成的级联结构,靠前的网络使用简单的结构保证人脸候选框的快速过滤,靠后的网络使用更为复杂的结构确保人脸框及面部关键点的精准定位。

2. 本文借助于多任务学习,在同一个网络中同时进行人脸检测和人脸对齐,实验结果显示人脸对齐任务提升了人脸检测任务的精确度。

3. 本文依次完成了对四个卷积神经网络的训练数据采集以及训练调优,并对实验结果进行了对比分析。

本文实现的人脸检测与人脸对齐算法,在速度和精确度上有着良好的表现,将为现实应用提供有价值的参考。

关键词:人脸检测,人脸对齐,多任务学习,级联网络

ABSTRACT

Face detection and face alignment are essential to many face applications, they aim to locate faces and fiducial facial points in the given image. Face detection and face alignment have a very wide range of applications today, which is one of the important steps to achieve machine intelligence.

Based on the cascaded multi-task convolutional neural network, this paper achieves joint face detection and face alignment results for the frontal face image under unconstrained conditions, and still has a promising running speed while maintaining good precision. The main work of this paper is listed as follows:

1. A cascaded structure consisting of four well-designed convolutional neural networks is used, the former network uses a simple structure to ensure rapid filtering of face candidates, and the later network structure uses a more complex structure to obtain precise bounding boxes and landmarks.

2. With the help of multi-task learning, face detection and face alignment are performed simultaneously in the same network. The experimental results show that the face alignment task improves the accuracy of the face detection task.

3. The training data acquisition and fine-tuning of four convolutional neural networks are performed in turn, and the experimental results are compared and analyzed.

The face detection and face alignment algorithms implemented in this paper have good performance in speed and precision, and will provide valuable reference for real-world applications.

KEY WORDS: Face detection, Face alignment, Multi-task learning, Cascaded network

目 录

摘 要 I

ABSTRACT II

第一章 引言 1

1.1 研究背景及意义 1

1.1.1 视频监控 1

1.1.2 人脸认证 2

1.1.3 智能机器人 2

1.2 国内外研究现状 2

1.3 本文主要内容 3

第二章 人脸检测概述 5

2.1 应用 5

2.2 挑战 5

2.3 性能评测 5

2.3.1 评测指标 5

2.3.2 评测数据集 8

2.4 人脸检测算法概述 8

2.4.1 基于刚性模板的人脸检测算法 8

2.4.2 基于可变形组件的方法 12

第三章 人脸对齐概述 13

3.1 评价指标 13

3.2 算法分类 14

第四章 卷积神经网络与多任务学习概述 16

4.1 卷积神经网络 16

4.1.1 卷积神经网络的提出背景 16

4.1.2 卷积神经网络的结构 17

4.2 多任务学习 17

4.2.1 多任务学习定义 17

4.2.2 多任务学习动机 17

4.2.3 深度学习中的两种常见多任务学习模式 18

第五章 MTCNN算法 19

5.1 算法框架 19

5.1.1 整体流程 19

5.1.2 网络结构 20

5.1.3 基本原理 20

5.2 学习目标 24

5.2.1 损失函数 24

第六章 程序实现与结果 26

6.1 训练数据 26

6.1.1 训练数据制作 26

6.1.2 训练数据加载 27

6.2 网络训练 27

6.3 FDDB数据集检测 28

6.3.1 算法精度 28

6.3.2 算法速度 29

6.4 在线难例挖掘效果 30

6.5 多任务学习效果 30

6.6 结果展示 31

第七章 总结与展望 34

参考文献 35

致 谢 37

引言

研究背景及意义

随着计算机技术的发展和进步,原先需要大量人力来完成的重复枯燥的工作逐渐地被交给计算机来完成。计算机视觉作为图像处理、机器学习和模式识别等领域的交叉学科,近年来得到了快速的发展。计算器视觉的主要任务为模拟人的视觉能力,尝试建立能从图像或其它多维数据中获取“信息”的人工智能系统。人脸检测是计算机视觉中一个重要并且有挑战性的研究领域,其定义为:给定输入图片或者视频帧,判断其中是否有人脸,如果有则给出其具体位置。人脸检测作为通用目标检测领域的一个特例,从通用目标检测算法中汲取了许多有效的思路,但人脸检测也有自身的特性,所以也有其特定的解决方式。人脸检测是人脸识别、人脸验证、人脸追踪、表情分析和面部属性分析等研究的基础和前提,一个优秀的人脸检测算法能够为这些研究提供有力的支持和保障。人脸检测在工业界的应用主要包括智能门禁、刷脸支付、手机人脸解锁和智能视频监控等。由于人脸兼具刚性和柔性,外观容易受到尺度、遮挡、光照、视角、姿态和表情等因素的影响,这给人脸检测带来挑战的同时也吸引了大量的研究人员投身其中。

在人脸检测的基础上,人脸对齐也是计算机视觉中一个重要的研究方向,其定义为:对于给定的人脸图像或者人脸视频帧,自动定位出面部的关键特征点,如眉毛、眼睛、鼻子和嘴角等。人脸对齐为人脸分析提供了更多的关键点位置信息,有助于人脸分析应用提取出更有表现力的特征。人脸对齐作为人脸检测之后的重要步骤,也为人脸识别、人脸验证和面部属性分析等应用提供了强力的支持。人脸对齐算法的输入与人脸检测算法的输入类似,所以影响人脸检测算法的因素也往往会影响到人脸对齐,如光照和遮挡等。

剩余内容已隐藏,请支付后下载全文,论文总字数:29216字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;