论文总字数:25107字
摘 要
目标对象检测是计算机视觉领域最为重要的研究课题之一,是大量高级视觉任务的前提,对图像的最终理解和分析起着至关重要的作用,同时大量的现实任务也需要使用到检测技术。因此,国内外众多学者对其展开大量研究,提出许多目标检测算法。目前,虽然在一些特殊对象如人脸、行人的检测上相应的检测技术已经非常成熟,但是对于通用对象的检测目前还不能达到令人满意的结果。为此本文针对基于图像的通用对象检测方法进行了研究和改进。首先,对于当前目标检测的常用方法进行了梳理和分析,我们发现特征提取的好坏对于目标检测的结果非常重要,而基于机器学习的深度学习方法是目前效果集中方法之一。本文使用了基于深度学习的检测方法,首先对图像使用区域生成算法生成大量区域,然后在区域内部使用深度卷积神经网络进行分类任务以及区域位置的回归任务。我们在训练中使用到了多任务学习,对分类任务和位置回归任务联合学习,并在在Pascal VOC 2007数据集进行测试,结果表明我们的方法检测效果良好,多任务学习对于检测结果有提升。
关键词:目标对象检测;深度学习;多任务学习
Object detection and recognition in image
Abstract
Object detection is one of the most important research topics in the field of computer vision, and it’s the premise of vast advanced vision tasks. It plays an significant role to the comprehension and analysis of image. Meanwhile, massive reality tasks also need the detection technology. Therefore, many researchers around the world have done much research on this task, and put forward numerous object detection algorithm. At present, although for some special targets, such as human face and pedestrian, the detection technology has been mature, the detection of the generic object hasn’t obtain satisfying result so far. The problem I am trying to solve in this paper is generic object detection in image. First, through the analysis of the common methods of object detection, we found that the quality of the feature extraction is very important to the result of object detection, and the deep learning method based on machine learning is one of the effective ways. In this paper, we adopt detection method based on deep learning. Firstly, we use a popular object proposal algorithm to generate lots of region proposals. Secondly, in each region, use a deep convolutional neural network to carry out the classification task and the regression task. In training state, we use multi-task learning and jointly learning classification and location task. We test our model on Pascal VOC 2007 dataset. The result indicates that our method has well detection effect, and multi-task learning is suitable for the detection.
Keywords: object detection, deep learning, multi-task learning
目录
摘要……………………………………………………………………………………………………………………………………………..I
Abstract……………………………………………………………………………………………………………………………………….II
1.绪论 1
1.1 引言 1
1.2图片中对象检测识别研究现状 1
1.3对象检测常用方法 3
1.4 本文的研究目的和主要工作 3
2. 对象检测基本原理 4
2.1 对象检测任务关键问题及难点 4
2.2 对象检测通用框架 5
2.3 多尺度形变部件模型 6
2.3.1 HOG特征计算 6
2.3.2 DPM模型 8
2.3.3 DPM检测流程 9
2.4 基于区域卷积神经网络模型(R-CNN) 10
2.4.1卷积神经网络 10
2.4.2区域卷积神经网络模型设计 12
2.5 SPP_net模型 14
2.5.1卷积神经网络的限制 14
2.5.2 空间金字塔池化 15
2.5.3 SPP_net用于目标检测 16
3.基于区域卷积网络的检测模型设计 17
3.1模型整体结构 17
3.2网络结构 18
3.2.1金字塔池化 19
3.3.2边界盒回归 19
3.4模型训练 20
4. 实验结果及分析 21
4.1使用数据集说明 21
4.3区域卷积神经网络检测模型实验结果 22
4.2多任务学习评估实验结果及分析 22
5. 结论 23
参考文献 24
谢词 26
1.绪论
1.1 引言
伴随着电子数码相机和智能手机等智能移动终端的普及,以及互联网社交媒体的广泛传播,图像的数据量迅速增长。图像作为一种信息的载体,其承载的丰富海量的信息在为人们提供巨大方便之际,同时也为图像数据的应用提出了巨大的挑战。伴随着图像处理技术的快速发展,对图像更全面的理解,对图像内容更精细的把握就显得越来越重要了。现实中,用户对于图像信息的关注不仅仅局限于图像对象的简单分类,而是希望可以准确的获得图片中对象的语义信息以及位置信息。因此,如何从海量数据中提取信息,是目前摆在数字图像处理前的一大难点和热点。
对于人而言,视觉是认识世界的重要途径。人在处理视觉图像时,由于人眼摄入物体的整体性,以及人脑在处理图像信息时的高度并行性,对于图像的识别是轻而易举的。然而,对于当前的计算机而言,这是非常困难的。因为当前的计算机处理图像数据都是按照逐像素进行,忽略了图像的空间结构特性,缺乏对图像的整体把握;同时人类在日常生活中积累了庞大的知识库,对于一些模糊残缺图像拥有高度的推理能力,这也是计算机所达不到的。虽然,图片中对象类别检测问题(Object Detection)作为计算机视觉领域的热门研究方向,相关的研究成果很多,但是在图像识别的效率和精确度上还有很大的提升空间。该领域仍具有技术研究的巨大潜力。
剩余内容已隐藏,请支付后下载全文,论文总字数:25107字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;