人脸检测技术在手机视力监测系统中的应用

 2021-12-02 20:54:09

论文总字数:26097字

摘 要

关键词:视力监控;人眼检测;人脸检测;AdaBoost

Face Detection in Vision Surveillance system

09011327 Ma Hongtao

Supervised by Fang Xiaolin

Abstract: Now the problem of myopia are more and more serious, we urgently need to monitor our eyesight to solve the problem. Vision surveillance systems in this paper refers to the widely equiped smart phones for the monitoring of our eyesight. This key point of the system is to monitor how the distance of the users’ eye-screen distance is changed. One of the key technologies of the system is eye-detction while the user is using a cell phone in a stable manner.Eye-detection invloves face-detection. This paper realized a face detection method based on AdaBoost , using a Viola and Jones face detection framework.The program, which using rectangle features to decribe a face roughly, is implemented in matlab.While the rectangle feature set is quiet large, we use a AdaBoost training process to select a small number of significant features, together with optimal thresholds, forming several weak classifiers. Then the final strong classifier is simplely weighted combination of the weak classifiers.The detection process is then the process of walking the strong classifier through the whole image.

Key words: Vision surveillance systems;eye detection;face detection;AdaBoost

目 录

摘要 I

Abstract II

第一章 绪论 1

1.1 人脸检测 1

1.1.1 人脸检测概念 1

1.1.2 人脸检测方法的分类 3

1.2 人脸检测方法的性能评测 5

1.2.1 人脸图像数据库 5

1.2.2 性能评估 5

1.2.3 主要方法的演进 7

1.3 主流算法介绍 7

1.3.1 基于样本学习方法 8

1.3.2 神经网络 9

1.3.3 支持向量机 10

第二章人脸检测方法 11

2.1 AdaBoost 11

2.1.1 背景 11

2.1.2 AdaBoost算法 11

2.1.3 AdaBoost的训练误差 12

2.1.4 Gentle AdaBoost 12

2.1.5 构造弱分类器 13

2.1.6 CART 14

2.1.7 强分类器 15

2.2 矩形特征和积分图 15

2.2.1 矩形特征 15

2.2.2 特征模板: 16

2.2.3 特征生成 17

2.2.4 积分图 18

矩形特征的计算 19

第三章 人脸检测的设计与实现 21

3.1 样本集 21

3.2 训练难点及优化 22

3.2.1 计算成本 22

3.2.2 减少特征数量 22

3.3 检测器检测 23

3.3.1 检测子窗口的归一化 23

3.3.2 人脸的合成 24

3.4 实验结果 24

3.4.1 检测器阈值的调整 24

结 论 28

致 谢 29

参考文献 30

第一章 绪论

近视是世界范围内一个越来越严重的问题,为了有效的控制这个问题,有效的视力监控手段必须付诸实施。我们可以通过现在几乎人手一部的只能手机来监控视力的恶化情况。因为只能手机为人们生活的一部分,其对视力的监控非常便利,而且只需要有一个前置摄像头我们就能对视力进行有效的监控。下面对视力监控系统的系统结构进行介绍,实力监控系统主要包括两个部分:活动识别和眼睛检测。活动识别是为了确定一个使用者是否在使用手机进行阅读,当确定使用者在使用手机进行阅读后我们将对使用者的眼睛进行识别,利用眼睛的距离和图像的大小比例进行一些列计算,估计人眼和屏幕之间的距离。活动识别组件是为了确定对使用者进行监控的时机。只有当使用者长时稳定地使用手机进行阅读或玩游戏的时候,才是对视力的进行监控的合适的时候。如果只是打一个电话,看一个短信等等瞬时的活动,在这种时候对视力进行监控是不具备任何意义的。识别当前的活动主要依靠一些手机上的传感器,如三轴加速仪,距离传感器等等。

人眼检测是视力监控系统的关键一环。对视力进行监控的重点就是监控人眼距离屏幕的距离。而对距离的监控则是通过人眼间距和图像宽度的比例来计算得出。当然其他的一些度量也可以用来计算人脸距离屏幕的距离,如头的大小和图像宽的比例,耳朵间距和图像宽的比例等等,但是这些度量会受到一些情况的干扰,比如头发。发型的改变将会显著的影响到检测的质量。最佳的度量方法是不会随着时间的改变而有所变化的度量方法。眼球的距离则具备这一性质。但是眼球间的距离也会随着眼球的转动而又些微的变化,但是我们的系统监控的是人脸距离屏幕的距离,在距离不远的情况下(远小于1m)而且目标较为小(远小于1m2),我们可以认为人眼球的转动是微乎其微的,眼球的距离变动可以忽略不计。

人脸检测技术和人眼检测技术是两种互补的技术。识别人眼的前提是识别人脸,识别到人脸后才能再从人脸中找出人眼。所以基于这种先后顺序并且由于篇幅有限,本文将主要介绍一种人脸检测的算法。

1.1 人脸检测

人脸检测源于人脸识别又超越于人脸识别。其应用范围现在已经越来越广泛。未来的人机交互方式的重要基石之一一定会有人脸检测技术的一席之地。本章将从其概念、主要的方法、难点以及检测等等方面来对人脸检测进行一个粗略的介绍。

1.1.1 人脸检测概念

信息化时代的到来,计算机的应用进入人们生活的方方面面。但是一直以来,计算机一直只是作为只知道0和1的大盒子,无法去用视觉去感知我们人类所能看见的万事万物。计算机视觉的发展使得电脑能够像人类一样能够去检测和识别它所拍摄到事物;人工智能的发展使得计算机能够自主地判断和处理它所接收到的信息。相信随着计算机视觉,人工智能和多种多样的传感器的迅猛发展,电子计算机所拥有的“电脑”这个别称也会越来越名副其实。

计算机视觉的的一个主要部分就是物体检测,物体检测的任务是在给定的输入图像中找到指定物体的位置和其尺寸大小,应用广泛的如汽车,人的上半身,人脸,人的五官等等。而人脸检测作为占据了计算机视觉很大比重的戏份的一个分支,它的发展最初开始于人脸识别,而后随着研究的进一步深入,它的发展和应用逐渐超出原有的范围,发展为一个独立的研究方向。

图1-1 人脸的遮挡,不同的表情,图像的质量、旋转等等都会影响到人脸检测

人脸检测(face detection)是指以任意的一幅图像作为输入,采用某种特定的策略算法对其进行搜索以找到其中的人脸,并返回其中人脸的位置、大小[1]。它是一个具有很大复杂度的二类模式分类问题,其难点可以从两个方面进行归纳:其一,来自人脸的不确定性;其二,来自人脸所处的环境的不确定性,如图1-1所示。

首先,来自人脸的不确定性:(1)每个人的脸都是独一无二的,其细节的变化微妙之处我们不可胜数,大到肤色的不同、脸型的差异,小到不同的表情特征,如一个人大笑是其脸上的形态也会发生显著地变化,即便是同卵双胞胎我们仍然可以找到其中的细微差别;(2)人脸的遮挡,人的眼睛、头发等附着物可能会对人的脸进行部分的遮挡;另一方面,环境的不确定性:(1)不同光照条件下人脸在图像中的成像可能会出现很大的差异,如曝光过度和曝光不足时人脸的明暗对比会有显著地差异;(2)成像的角度也会对人脸的检测产生很大的影响,检测正面竖立的人脸显然要比检测正面倾斜的人脸容易,检测正面倾斜的人脸又要比检测人的侧脸容易,因为后者比前者要有更多的变化;(3)图像的成像质量也对人脸的检测有很大的影响。

1.1.2 人脸检测方法的分类

人脸检测技术的研究其源头可以追溯到20世纪六、七十年代,人脸检测问题最初来源于人脸识别(face recognition),随后其长足的发展和不断涌现的全新的应用和需求让人脸检测技术逐渐脱离原有的人脸识别的框架,成为现在的计算机视觉中的重要的一环。

我们可以将人脸检测的方法分为四类[1]:

(1)基于知识的方法(Knowledge-based methods)

(2)特征不变量方法(Feature invariant methods)

(3)模板匹配方法(Template matching methods)

(4)基于外观的方法(Appearance-based methods)

图1-2 面部特征之间的关系

部分的人脸检测方法并不会准确的分布于上述的四个类别中,通常它们都会融合多种方法来进行人脸检测。此外,基于文献[2],还可以将人脸检测的方法仅仅分为两类:基于特征的方法(Feature-based approach)和基于图像的方法(Image-based)。基于脸部特征的方法主要起源于19世纪70年代,这种方法中利用到了很多关于人脸的先验知识,人脸的一些明显的特征被应用于系统的各个层次中,如肤色和五官等特征。而基于图像的方法则直接将一张小图像进行人脸和非人脸的划分,不进行脸部特征的提取和分析,与基于特征的方法的不同之处就在于这种方法将有关人脸的先验知识通过大量的训练样本来体现出来。基于图像的方法在现在应用的最广泛的一种方法。

基于知识的方法将人们对人脸已有的先验知识构造为一条条的规则(rules)。这些规则描述了人脸面部特征之间的关系,如人脸通常都有一张嘴,一个鼻子,一双对称的眼睛等等。这些面部特征之间的关系可以用他们之间的相对位置和距离来描述,如图1-2所示。

Yang和Hunag使用一种分层递进式基于知识的方法来检测人脸[3]。他们的人脸检测系统由3层组成。第一层对降低分辨率后的图像进行粗略的处理,得到候选的眼睛区域。第二层对得到的人脸候选区进行本地直方图均化(local histogram equalization),然后进行边缘检测。通过第二层检测的候选脸部区域将在第三层进行更加细化的检测,第三层的规则将包括面部特征之间的关系,如嘴和鼻子之间的相对距离。

特征不变量方法(Feature invariant method)与基于知识的方法的不同之处在于它试图去找到一种有具有恒常性的、不变的特征。其背后的支撑点是:人的眼睛可以不论姿势、旋转、光照、表情等等的不一致,都可以后不费力地检测出人脸,所以我们可以假设:人脸一定独立于外在环境因素和内在表情等变量的永不会变化的特征或属性。

人的肤色就是一个具有这样性质的好的属性。尽管不同的人种会有不同的肤色,但是研究表明肤色和其他色彩最主要的区别在于像素强度(pixel intensity)而不是色度(chrominance)。人脸的肤色集中在颜色空间中的很小的一部分,因此可以用来检测人脸。此外,人脸的纹理也可以用来区分人脸和其他物体。

模板匹配的方法:这是一种经典的模式识别方法,若干个人脸的模式被用来和图像进行匹配。给定一张图像,人脸轮廓、眼、鼻子、嘴巴和标准模式的相关性都会被计算出来,这些相关性的集合将用来决策该图像是否为人脸。这种方法实现起来很简单,但是它很难识别带有多种变化的人脸。图1-3给出了一种人脸的模式图例。

图 1-3:一个人脸模式,由16个区域组成(灰色区域),包含23个关系(图中箭头)

基于外观的方法:模板匹配的方法中,模板是有具有专业知识的专家进过严谨的科学计算而得出,基于外观的方法则更加相信经验——它的模板是通过大量的样本学习中得来。因此,基于外观的方法是依赖于统计分析和机器学习来找到人脸和非人脸之间的相关性特征。这些学习得来的相关性特征通常以分布模型或者判别函数的形式用于进行人脸检测。由于这些特征的维数通常都非常之巨大,为了计算成本的降低和检测效率的提高,我们需要对特征空间进行降维。

基于外观的方法可以找到用以将人脸和非人脸进行分门别类的一个判定函数(一个决策平面、阈值函数等)。在这种方法中,图像的模式被投影到一个高维空间中,对该高维空间进行降维得到一个低维空间,从而构成一个以这个低维空间为变量的分类函数,或者一个使用一个多平面的神经网络来构成一个非线性的决策平面。此外,支持向量机(SVM)和其他一些核心方法也被提出来。这些方法都差不多有这样一个共性:将图像模式映射到一个高维空间,然后利用统计分析的方法对这个高维空间进行降维,提高计算的代价和检测的效率,从而在人脸和非人脸模式间形成一个决策平面,利用该决策平面对人脸和非人脸的模式进行决策。

1.2 人脸检测方法的性能评测

1.2.1 人脸图像数据库

人脸图像数据库是人脸检测的重要训练数据来源和测试数据来源。人脸检测技术发展到现在,使用大量的训练数据来训练人脸检测器已经差不多成为大部分专家的共识,因此为了大家的人脸检测器有一个训练和测试的基准线,人脸图像数据库成为人脸检测器必不可少的一部分。由于人脸识别技术起源较早,已经发展起来一些大家公认的数据库,这些已有的数据库现在可以用来进行人脸检测的训练。但是这些人脸识别的人脸数据库通常都不会很大,一般仅仅包含100幅左右的人脸,如 MIT库、 Yale库、 CMU库等都是些小型人脸库。表1介绍了一些主要的人脸库。

1.2.2 性能评估

由于各个人脸图像数据库之间所取得的图像可能会有千差万别,如人物的不同,姿势的不同,表情的不同,光照的不同,分辨率的不同,图像质量的不同,使用不同的数据库的识别程序之间也很难以进行比较。为了促进人脸识别技术的标准化,美国国防部发起了人脸识别技术工程(Face Recognition Technology, FERET),它包括了一个通用的人脸数据库以及一套测试识别程序所用的标准,用于定期对各种人脸识别算法进行性能测试,在人脸识别领域的这种工作对人脸检测领域的工作也起到了一定的指导作用。

在人脸检测中,我们主要需要关注两个指标:

剩余内容已隐藏,请支付后下载全文,论文总字数:26097字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;