基于深度学习的图像目标识别系统设计与实现

 2022-05-21 22:19:05

论文总字数:26687字

摘 要

随着人工智能领域技术的日渐发展与跃进,计算机视觉领域也迎来了一个崭新的飞速发展的时期。在计算机视觉内容中,目标识别领域吸引了大量研究人员的目光。图片的分类,检测和分割方法日新月异,学术界与产业界互相促进,为生产生活创造了大量价值。在理解一幅图片的过程中,从基本的结构化分类到固有的类别,给出图片的整体内容描述,到检测特定的物体目标,以及进行语义、实例分割或者边缘检测。目标识别通常要求在图像的背景中分离出不同的目标,创建对应的描述信息,在智能安防,人脸识别,姿态识别等领域有着大量应用。图像目标识别作为目前热度较高的计算机视觉研究方向,涌现出许多不同的具体实现方法与改进措施。边缘检测作为一种分割对象轮廓的方法,有助于目标识别中候选对象的提取,基于形状的对象识别以及各式各样的对象检测问题,因此本文提出的核心算法为一种有望改善目标识别精度的边缘检测算法。

在本文中,设计与实现了一个目标识别系统,其核心为边缘检测算法,以提高目前边缘检测算法在对象边界检测领域,进而在目标识别系统中的性能。首先,设计了一套边缘检测算法。在该框架内,现有网络可以逐个级联并进行端到端训练,以从输入中获取更多语义信息。然后,设计与开发了目标识别系统,包括训练模块,运行模型模块与界面模块。最后,利用自然图像中的物体边界场景进行测试。实验和分析表明,在级联结构的帮助下,级联的卷积网络可以提高一定的性能。该系统可应用于自动驾驶图像处理中的道路分割、安防领域中的人体轮廓检测、医疗领域的电镜肿瘤细胞分割、卫星遥感图像中的物体轮廓分割等方面。

关键词:边缘检测,计算机视觉,深度学习,人工智能

Abstract

With the rapid development and advancement of artificial intelligence technology, the field of computer vision has also ushered in a new period of rapid development. In the coverage of computer vision, the field of target recognition has attracted the attention of a large number of researchers. The classification, detection and segmentation methods of pictures are changing with each passing day. The academic and industrial circles promote each other and create a lot of value for production and life. In the process of understanding a picture, we started from basic structured classification to intrinsic categories, giving an overall description of the picture, to detecting specific object targets, and performing semantics, instance segmentation, or edge detection. Target recognition usually requires separating different targets in the background of the image, creating corresponding description information, and has a large number of applications in the fields of intelligent security, face recognition, gesture recognition and the like. Image target recognition now is a current hot computer vision research direction, so many different implementation methods and improvement measures have emerged. As a method of segmenting object contours, edge detection is helpful for the extraction of candidate objects in target recognition, shape-based object recognition and various object detection problems. Therefore, the core algorithm proposed in this paper is an edge detection algorithm aiming at improving the precision of target recognition.

In this paper, a target recognition system is designed and implemented whose core is the edge detection algorithm to improve the performance of the current edge detection algorithm in the object boundary detection field and then in the target recognition system. Firstly, an edge detection algorithm is designed. Within this framework, existing networks can be cascaded and end-to-end trained to get more semantic information from the input. Then, the target recognition system is designed and implemented, including the training module, the running model module and the interface module. Finally, the system is tested in the object boundary scene with the natural image. Experiments and analysis show that the concatenated convolution network can improve certain performance with the help of the cascade structure. The application value of the system includes road segmentation in automatic driving image processing, human body contour detection in the security field, electron microscope tumor cell segmentation in the medical field, and object contour segmentation in satellite remote sensing images.

KEY WORDS: edge detection, computer vision, deep learning, artificial intelligence

目 录

摘 要 Ⅰ

ABSTRACT Ⅱ

第一章 绪论 1

1.1研究背景与意义 1

1.2研究现状 2

1.2.1 传统边缘检测方法 2

1.2.2 基于深度学习的边缘检测方法 3

1.2.3 针对自然图像的对象边缘检测 4

1.2.4 小结 4

1.3研究目标与内容 5

1.3.1 研究目标 5

1.3.2 研究内容 5

1.4论文组织结构 6

第二章 边缘检测算法设计 7

2.1 网络结构 7

2.2 训练阶段 8

2.2.1 输入部分 9

2.2.2 损失函数 9

2.3 测试阶段 10

2.4 模型解释 11

2.4.1 级联架构与单级架构 11

2.4.2 端对端训练与逐步自我调整 11

2.5 本章小结 11

第三章 目标识别系统的设计与实现 12

3.1 系统总体设计 12

3.2 系统模块设计 12

3.3 系统实现 13

3.3.1 软硬件平台 13

3.3.2 数据集 13

3.3.3 prototxt设置 13

3.3.4 solver设置 14

3.3.5 数据预处理 14

3.3.6 环境调试 15

3.3.7 训练过程 17

3.3.8 界面设计 20

3.4 本章小结 20

第四章 系统测试 21

4.1 评价指标 21

4.2 结果评价 21

4.3 结果分析 22

4.4 改善策略 22

4.4.1 从HED架构出发 22

4.4.2 与传统方法结合 23

4.4.3 与其他目标识别方法结合 23

4.4.4 与其他轻量级网络结合 23

4.5 本章小结 24

第五章 总结与展望 25

5.1论文总结 25

5.2未来工作展望 25

参考文献 26

致谢 28

第一章 绪论

1.1研究背景与意义

计算机视觉的基本问题是分析计算机可以从图像中理解的信息。由于其强大的表现力,结合数据积累和增强的计算能力,深度学习模型已成为计算机视觉的热门研究趋势。

理解图像时,根据后续任务的需要,有三个主要级别:

剩余内容已隐藏,请支付后下载全文,论文总字数:26687字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;