搜索详情-毕业论文网

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回

基于CNN算法的图像目标检测设计与实现 毕业论文

 2020-04-13 13:05:26  

摘 要

从数据挖掘的角度来看,本设计可自动从大量数据中搜索具有特殊关系的隐藏信息进行目标检测。数据挖掘通常与计算机科学相关,通过统计,在线分析和处理,智能检索,机器学习,专家系统(依靠过去的经验规则)和模式识别来实现目标检测。本文使用的CNN算法是通过使用摄像头和计算机而不是人眼进行训练来识别,跟踪和测量机器视觉等目标,从而将其概括为计算机的“视角”科学,并进一步进行图像处理,使计算机处理变得更加适合人眼观察或者传输到仪器以检测图像。如果输入图片或视频,计算机可以快速识别目标区域并对目标进行分类。这是一个重要的问题。传统的检测算法使用窗框作为框架,细分为区域选择,功能提取和分类三个步骤;而文中的CNN算法是基于深入学习算法,这些算法细分为区域提案和端到端。

本文研究基于深度学习的端到端算法,并使用Python 3.0编写培训程序以实现目标检测的目标。该算法将目标检测问题解决为回归问题,对输入图像进行统计汇总后,得到图像中所有目标的位置,类别及相关的可靠性概率。网络的训练和检测在一个单独的网络中进行,并且不显示建议的区域。

关键词:CNN;Python3.0;目标检测;回归问题.

Abstract

From the perspective of data mining, this design can automatically search hidden information with special relationships from a large amount of data for target detection. Data mining is usually related to computer science and achieves target detection through statistics, online analysis and processing, intelligent retrieval, machine learning, expert systems (relying on past experience rules) and pattern recognition. The CNN algorithm used in this paper is to identify, track and measure machine vision and other objectives by using cameras and computers instead of human eyes, so that it can be summarized as the computer's "perspective" science, and further image processing, so that the computer processing changes It is more suitable for human eyes or transmitted to the instrument to detect images. If you enter a picture or video, the computer can quickly identify the target area and classify the target. This is an important issue. Traditional detection algorithms use window frames as frames and are subdivided into three steps: region selection, function extraction and classification. The CNN algorithm in this paper is based on in-depth learning algorithms. These algorithms are subdivided into regional proposals and end-to-end.

This article examines end-to-end algorithms based on deep learning and uses Python 3.0 to write training programs to achieve the goal of target detection. The algorithm solves the target detection problem as a regression problem. After statistical summarization of the input image, it obtains the position, category and related reliability probability of all targets in the image. The training and detection of the network takes place in a separate network and the suggested areas are not displayed.

Keywords: CNN; Python 3.0; target detection; regression problem

目录

摘要 I

Abstract II

第1章 绪论 1

1.1研究的目的及意义 1

1.2国内外发展历程概述与研究现状分析 2

1.3研究内容和方向 3

1.4本章小结 4

第2章 基于CNN算法的图像目标检测总体设计方案 5

2.1图像目标检测需求分析 5

2.2 传统系统算法分析 5

2.3使用深度学习的算法分析 5

2.4深度学习算法图像候选区的生成 7

2.5本章小结 8

第3章 卷积神经网络层级结构设计 9

3.1 数据输入层 9

3.2卷积计算层 10

3.3卷积的计算 11

3.4激励层 13

3.5池化层 14

3.6全连接层 15

3.7本章小结 15

第4章 基于CNN算法的目标检测程序设计 17

4.1 CNN算法的目标检测流程 17

4.2 特征提取流程 19

4.3图像训练网络功能 19

4.4损失函数的设计 20

4.5本章小结 21

第5章 系统功能测试 22

5.1 影响目标检测的因素 22

5.2 图像目标检测的结果及分析 22

5.3 本章小结 23

第6章 总结与展望 24

参考文献 25

附录A训练model导入程序代码 26

附录B 对图片分类训练程序代码 28

附录C 描述神经网络的程序代码 30

附录D目标检测调用模块功能程序主代码 31

致谢 33

第1章 绪论

1.1研究的目的及意义

目标检测是计算机视觉领域的一个基础研究课题, 它有两种主要类型的检测任务:对对象实例检测和对对象类别检测. 第一类检查操作的目标是识别和识别已知对输入图像唯一的一个或多个物体,例如特定的机动车辆。这种类型的任务可以认为是特定对象的采样集合与待检测的输入图像中的特定对象之间的匹配问题,采样集合中设置的目标与待检测输入图像之间的差异主要是由于成像的条件的变化。第二类检查任务着重于对预先定义的类别涵盖的所有可能行的个体进行定位和分类,例如检测车辆和检测行人。与目标检测任务实例相比,目标类别检测有着更大的挑战。由于现实生活中存在许多不同类型的物体的视觉差异非常小,并且相同类别物体之间的差异不仅受条件城乡变化的影响,而且还受到物体的物理特征的变化的影响在生物学上,物体花朵极其多样化,有很多色彩,纹路和形状都在不停变化。在现实生活中,目标通常只占有整个图像的一小部分,并可能被另一个物体或类似于场景中出现的视觉效果的视觉结构所阻挡。这种情况的出现也对目标追踪任务构成巨大挑战。

总之,目标检测任务可以分为两个关键的子任务:目标分类和目标定位[1]。目标分类的作用是负责判断对象在输入图像中是否重要,并执行一系列带有分数的标签,该分数指示感兴趣对象出现在输入图像中的可能性[1]。目标定位任务负责确定输入图像中的感兴趣对象的位置和范围,输出对象的边界框或对象的中心,或对象的封闭边界等。通常,正方形边界框是最常见的选择。

目标检测是许多高级视觉任务的前提,如活动和事件的识别,对场景内容的理解,目标检测包括智能视频监控,基于内容的图像搜索,机器人导航,加强现实等。目标检测在计算机视觉和实际应用领域中发挥着重要作用。在过去的几十年中,大量研究人员被激励去投入大量的注意力和投资于研究。此外,随着强大的机器学习理论和特征分析技术的发展,近几十年来与目标检测主题相关的研究活动有所增加,最近的研究成果和实际应用已经出版并每年公布。尽管如此,目前该方法的检测精度仍然较低,不能应用于实际的一般检测任务。因此,目标检测还远未达到完美的解决方案,它仍然是一个重要的具有挑战性的研究课题,但实际上解决目标检测问题,更深入的理解是求解数据挖掘问题。

数据挖掘一般指的是自动搜索潜藏在大量数据中的具有特殊关系的信息的过程,数据挖掘通常与计算机科学相关,通过统计,在线分析处理,智能检索,机器学习,专家系统等实现这些目标[2]。(依靠过去的经验法则)和模式识别。计算机视觉是一门研究如何制作计算机“看”的科学。此外,它指的是使用摄像头和计算机来代替人眼来识别,跟踪和测量机器视觉,然后执行图形处理来进行计算机处理,这是更适合人眼观察或传输到设备检测的图像[2]。要插入图片或视频,计算机可以快速识别目标区域,并将目标分类是一个非常重要的问题。传统的目标检测算法分为三个步骤:区域选择,特征提取和分类。深度学习算法分为两部分:区域建议和端到端算法。

1.2国内外发展历程概述与研究现状分析

传统的目标检测算法一般采用滑动窗口框架,主要分为三步:

1.选择区域,因为目标可能出现在图像中的任何位置,所以无法确定尺寸比例和目标方面。因此,滑动窗口策略用于遍历整个图像,因为该算法应该包括所有可能的目标字段,高时间复杂度以及更多的过度窗口生成。

2.特征提取在区域选择完成后,必须提取区域内的函数,例如,HAR函数广泛应用于人脸检测,行人检测和HOG特征等常见目标检测中,由于目标形状的多样性,环境,照明和各种背景的变化,很难设计一个强大的鲁棒的特征。

以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。