头部姿态估计原型系统

 2021-12-02 20:55:25

论文总字数:28684字

摘 要

头部姿态估计是计算机视觉中一个重要的组成部分,具有广泛的研究价值。在人脸识别以及目光方向估计中,起到重要的作用。许多头部姿态估计方法在最近几年被提出,比如非线性回归方法,子空间嵌入方法以及基于特殊特征的方法等等。但是这些方法不能很好的解决头部姿态标记错误的问题,即标记本身就不准确,使用错误的标记必然会对结果产生影响。而一种新的学习范式——标记分布学习可以很好的解决标记歧义性的问题。标记分布学习相比于单标记学习与多标记学习,更加适合实际问题,描述能力更强。在标记分布学习中,每一个标记对样例的描述程度组成标记分布,通过学习样例到标记分布的映射,可以得出待测样例的标记分布,从而解决问题。因此,标记分布学习解决头部姿态估计问题是非常合适的。通过实现头部姿态估计的多元标记分布算法,不仅减少了标记错误带来的问题,还在不增加总体训练样本的基础上为每一个姿态增加训练样本。实验结果显示基于多元标记分布的头部姿态估计算法效果明显好于目前最先进的头部姿态估计算法。本文结合多元标记分布算法,HOG特征提取以及人脸检测技术,实现了一个头部姿态估计系统。该系统可以完成样本的训练,参数载入以及头部姿态估计功能,并且直观的显示头部姿态预测结果,方便使用者理解多元标记分布算法。

关健词:标记分布学习,头部姿态估计系统

Head pose estimation system based on Multivariate Label Distribution

Abstract

Head pose estimation is a very important part with a wide range of research value in computer vision. It has an important influence in face recognition and gaze estimation. A lot of head pose estimation methods have been proposed in recent years, such as the nonlinear regression methods, the subspace embedding methods and the special-feature-based methods. But these methods can’t solve the problem that the label of ground truth pose is inaccurate, which can have a bad influence in head pose estimation results. But a novel learning paradigm ----label distribution learning can deal with the problem of label ambiguity. Compared to single label learning and multiple labels learning, label distribution learning is more suitable for real application. Label distribution learning can generate a mapping between the label distribution and the instance. By using this mapped model, we can predict a label distribution of a new instance. So, label distribution learning is suitable for head pose estimation. The multivariate label distribution algorithm can not only alleviate the problem of inaccurate pose labels, but also boost the training examples to each pose without increasing the total number of training examples. Experimental results show that the multivariate label distribution method performs better than the compared state-of-the-art head pose estimation algorithms. By using multivariate label distribution method, HOG features and face detection, this paper implements a head pose estimation demo which can achieve the training of examples, parameters load and head pose estimation. The demo can display the pose predict result intuitively, this can help people who use this demo to understanding the multivariate label distribution algorithm better.

Keywords: label distribution learning, head pose estimation demo

目录

摘要 I

Abstract II

第一章 绪 论 1

1.1头部姿态估计背景 1

1.2头部姿态估计主要内容 1

1.3头部姿态估计的研究现状 2

1.3.1非线性回归方法 2

1.3.2人脸外观模板方法 2

1.3.3基于流形嵌入的方法 2

1.3.4基于几何的方法 3

1.3.5基于分类器的方法 3

1.3.6 其他方法 3

1.4本文主要工作 3

第二章 标记分布学习 4

第三章 多元标记分布算法 5

3.1多元标记分布算法的提出背景 5

3.2多元标记分布 5

3.3 MLD学习算法 6

3.4 MLD预测 9

第四章 HOG特征提取 10

4.1标准化Gamma空间和颜色空间 10

4.2计算图像梯度 11

4.3基于梯度幅值的方向权重投影 11

4.4 HOG特征向量归一化 11

4.5得到最终的特征向量 12

第五章 Haar分类器人脸检测 13

5.1 Haar特征 13

5.2 积分图法 14

5.3分类器学习算法 15

5.4 级联分类器 16

第六章 L-BFGS优化算法 18

第七章 实验结果 20

7.1实验方法 20

7.2实验结果 20

第八章 头部姿态估计系统 22

8.1系统开发工具 22

8.2系统界面 22

8.3系统主要组成部分 22

8.4系统功能介绍 23

8.4.1 三种头部姿态估计方法 23

8.4.2 八个按钮控件及其功能 23

8.4.3 三个图像显示及其功能 23

8.4.4操作流程 23

第九章 总结和展望 25

9.1本文工作总结 25

9.2展望 25

致谢 26

参考文献(References) 26

第一章 绪 论

1.1头部姿态估计背景

头部姿态在人与人之间的交流中扮演着一个重要的角色。静止的头部姿态指向着一个特定的方向,而这个方向可能就是人的注意力所在,是交流的重点。改变头部姿态这个动作也可以传递丰富的信息,比如同意,不同意,理解,困惑,惊讶等等。此外,头部姿态对于很多其他应用来说是关键的信息,比如人脸识别,目光方向估计。在人脸识别的系统中,人脸检测是人脸识别前期一项非常重要的工作,要识别人脸,首先要找到人脸。但是在很多情况下,头部并不是保持正面姿态,在图像中可能出现不同方向的多种姿态中的一种。而在目光方向估计中,如果图像的眼睛并不是清晰可见的,那么头部姿态估计可以粗略的作为目光方向。如果图像的眼睛是清晰可见的,那么头部姿态估计可以作为精确预测目光方向的一部分,生理学已经证明目光注视方向与头部姿态和眼睛方向都有关[1]。所以,在人脸识别和目光方向估计的过程中必须要考虑头部姿态的问题。由上可知,头部姿态估计已经成为了计算机视觉和模式识别中的一个重要的应用。

1.2头部姿态估计主要内容

在计算机视觉中,头部姿态估计通常指的是头部在三位空间XYZ方向上的旋转角度估计。通常假设人的头部是一个刚体并且在头部姿态上有三个自由度,也就是在水平方向上的旋转(Yaw),在垂直方向上的旋转(Pitch)和在平面上的旋转(Roll),如图1-1。对于许多现存的有限离散数据的头部姿态数据集,只有水平方向上的旋转角度和垂直方向上的旋转角度是可用的[1],因为在平面上的旋转角度可以通过面部器官的几何位置来确定,而水平方向的旋转和垂直方向的旋转并不能从图像中直观的得到。因此在本毕设中,我们将头部姿态估计的问题放在有限离散的水平方向上的旋转角度和垂直方向上的旋转角度上,也就是头部的两个自由度。毕业设计中使用的方法也可以被拓展到三个自由度或者根据不同的应用而采用一个自由度。

图1-1 头部姿态中三个方向的自由度

1.3头部姿态估计的研究现状

在水平方向上的旋转角度,在垂直方向上的旋转角度和在平面上的旋转角度是连续的,但是在许多系统中,仅仅考虑一些有限离散的角度。在许多情况下,训练集被表示为,,其中表示人脸图像,表示一个姿态,也就是水平方向和垂直方向的旋转角度。当每一个姿态被认为是一个类别时,头部姿态估计是一个分类问题。但是,头部姿态旋转角度是有序的,因此,头部姿态估计也可以是一个回归问题[2]。许多头部姿态估计方法在最近几年被提出,以下做简单的介绍。

1.3.1非线性回归方法

非线性回归方法通过学习一个从图像空间到一个或多个姿态标记的函数映射来进行头部姿态估计。这个方法的优点是只要有标记好的训练数据,就可以建立一个可以生成离散的或者连续的头部姿态估计模型。而这个方法的缺点是对于一个特定的回归方法,并不能保证得到很好的函数映射。除此之外,高维空间的图像对于一些回归方法来说也是很大的挑战。将PCA降维应用于支持向量回归可以实现头部姿态估计,E.Murphy[3]等人采用局部梯度方向直方图和支持向量回归在头部姿态估计上得到更高的准确率。

1.3.2人脸外观模板方法

该方法通过在大量训练样本的基础上进行学习,得到姿态与人脸外观的一些特征的对应关系,也就是得到模板,将待测图像与各个模板进行比较,取最相似的模板的姿态作为待测图像的姿态。Chen[4]等人将人脸分为肤色和发色组成的区域,并通过样本建立这些区域的几何属性与姿态之间的对应关系。对于待测图像,首先提取区域中的几何属性,然后进行匹配得到姿态信息。通过这种对应关系来进行头部姿态估计,优点是人脸外观模板拓展性很好,并且可以根据系统和场景的不同随时改变并适应。除此之外,人脸外观模板不需要负训练样本或者面部特征点,只需要切割好的人脸图像以及对应的姿态信息即可,它也可以很好的适应不同分辨率的图像。但是这种方法也有很多的缺点,不使用插值法,它只能估计离散的姿态,并且它假设头部姿态区域已经被确定好,如果头部定位错误的话会降低正确率。人脸外观模板方法的计算量非常大,并且需要大量的训练样本。

1.3.3基于流形嵌入的方法

虽然头部图像可以被认为是高维空间的数据样本,但是其中只有很少的维数信息是头部姿态可以改变的。对于一个头部刚体模型,可以用三个维度来表示它的方向,用三个维度表示它的位置。因此,高维空间上的头部姿态图像依赖于低维连续的流形。这种方法首先为各种人脸姿态建立流形模型,然后通过子空间嵌入的方法将测试图像投影到流形上,并估计姿态。相比于传统的线性降维方法,流形嵌入方法能够更好的发现和保持数据的内在规律,并且在发生旋转,扭曲和具有非线性结构的数据上有更好的效果。

1.3.4基于几何的方法

基于几何的方法通常利用人脸器官的几何形状以及精确的特征点来估计人脸姿态。使用人脸精确的特征点,比如眼睛,嘴巴,鼻尖等,根据这些特征点在集合上的关系来判断人脸姿态。Gee[5]等人利用两个外眼角点,鼻尖和两个嘴角这五个人脸特征点,先通过双眼和嘴巴来找到人脸对称轴,然后根据鼻尖在五个特征点中的几何关系来确定姿态信息。基于几何的方法在人脸特征点精确定位的情况下,具有很高的准确率。但是该方法的缺点是人脸特征点如何精确定位,这种方法对于图像具有高分辨率的要求,并且特征点必须全部在图像上,否则无法进行正确的姿态估计。当人脸有眼镜等遮挡物时,对于特征点的提取将非常的困难。

1.3.5基于分类器的方法

由于分类训练方法已经得到了广泛的应用,并且取得了很好的效果,那么也可以利用这种方法来训练头部姿态分类器,每一个分类器对应一个不同的姿态,利用这些分类器来进行姿态识别。具体实现中,在所有的训练样本里寻找正样本和负样本,利用这两类样本训练二元分类器。支持向量机(SVM)的方法得到了广泛的应用,Huang[6]等人利用SVM进行姿态估计取得了良好的实验结果,它可以直接实现头部姿态估计并且适用于不同分辨率的图像。但是这种方法需要为每一个姿态训练一个分类器,训练的时间很长,也无法估计连续的姿态。

1.3.6 其他方法

除了上述五种方法外,文献[7]提出了一种基于随机森林的方法来实现头部姿态估计并且将它扩展到可以局部化一系列3D面部特征,文献[8]提出了一种基于生物学启发的特征描述子来进行头部姿态估计。这两种方法是基于图像特殊特征的,即利用特别的特征进行头部姿态估计。

1.4本文主要工作

本论文主要分为七章,具体安排如下:

第1章 绪论,主要介绍了头部姿态估计的背景,主要内容以及研究现状;

剩余内容已隐藏,请支付后下载全文,论文总字数:28684字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;