论文总字数:30935字
摘 要
09014130 彭一峰
指导教师 沈傲东
近些年来,几乎大多数的研究者都将自己的注意力集中在当前最火的一个方面——深度学习。其代表性的前沿技术被著名的《MIT技术评论》评选为2013年世界10大突破技术之首。本论文利用当前比较前沿的深度学习技术yolov2,进行有关于密封圈缺陷的检测。利用深度学习简化人工操作。本文主要工作内容包括:
有关密封圈图像缺陷的标注工作。使用LabelImg图像标注软件中自带的voc数据集图像标注功能,对1000张密封圈图中有缺陷的位置用方框框起来。该软件可以根据方框得到数据以及自己的分类生成相应的文档,然后通过整理得到我们需要机器去识别的voc数据集。
在darknet环境下,进行yolov2的具体工作。yolov2在发行时有yolov2-tiny-voc和yolov2-voc两种yolov2深度学习神经网络。yolov2-tiny-voc是一种9层网络结构的小型轻便式神经网络,而yolov2-voc则是22层网络结构的神经网络。本次工作用网络yolov2-voc进行测试,得到的缺陷检测结果。
对于在yolov2网络上跑通后的结果要进行数据上的测评,例如rcall,mAP(mean Average Precision)等进行评估。通过最后结果,我们可以利用深度学习找到相应密封圈图像的缺陷,并在结果中有方框标出,并显示类别。极大地解决了人工标注图像缺陷的复杂以及易错的难点与不足,让繁琐的工作更加智能化。
关键词:深度学习,yolov2,密封圈缺陷,voc数据集,mAP(mean Average Precision)
Abstract
09014130 YiFeng Peng
Advisor Aodong Shen
In recent years, almost all researchers have focused their attention on one of the hottest aspects of the current era - deep learning. Its representative frontier technology was selected by the famous "MIT Technology Review" as the top ten breakthrough technology in the world in 2013. In this paper, we use the current more advanced deep learning technology yolov2, to carry out the detection of seal defects. Use deep learning to simplify manual operations. The main work of this article includes:
Sealing ring image defect marking work. Using the labeling function of the vocal data set in the LabelImg image labeling software, the defect positions in the 1000 seals are boxed. The software can generate the corresponding documents according to the box data and their own classification, and then get the vocal data set we need to identify the machine.
In darknet environment, specific work of yolov2 is carried out. Yolov2 has yolov2-tiny-voc and yolov2-voc two yolov2 deep learning neural networks at the time of its release. Yolov2-tiny-voc is a small lightweight neural network with a 9-layer network structure, while yolov2-voc is a neural network with a 22-layer network structure. This work uses two kinds of networks to test and compare the defect detection results obtained by the two networks.
For the results after running on the yolov2 network, data evaluations, such as the mean average precision (mAP), are performed. Through the final result, we can use deep learning to find the defects of the corresponding seal image, and in the results, there are boxes and the categories are displayed. It greatly solves the complex and error-prone difficulties of manually annotated images and makes the tedious work more intelligent.
KEY WORDS: deep learning, yolov2, Sealing ring defect,voc data set, mAP(mean Average Precision)
目 录
摘 要 1
Abstract 2
第一章 绪论 1
1.1 选题背景和意义 1
1.1.1 选题背景 1
1.1.2 课题意义 1
1.2 研究内容 2
1.3 论文组织结构 2
第二章 深度学习概念 4
2.1 深度学习 4
2.1.1 深度学习概论 4
2.1.2 深度学习所遇状况 5
2.1.3 各种神经网络 7
2.1.4 对图像识别领域研究现状 8
2.2 Yolov2 9
2.2.1 yolo原理 9
2.2.2 yolov2 11
第三章 数据集的准备 13
3.1 VOC数据集的图像标注 13
3.1.1 pascal voc数据集 13
3.1.2 图像标注工作 13
3.2 VOC数据集的创建 15
3.2.1 voc数据集结构 15
3.2.2 相关文件生成 16
3.3 本章小结 16
第四章 yolov2训练 17
4.1 路径文件以及txt格式文件生成 17
4.2 修改darknet中配置文件 18
4.3 训练数据 20
4.3.1 运行yolov2 20
4.3.2 运行时界面分析 20
4.3.3 所遇问题和解决办法 21
第五章 测试结果演示和分析 23
5.1 训练结果演示 23
5.2 测试结果数据 24
5.2.1 recall precision 24
5.2.2 mAP 25
5.2.3 训练优化与改进 26
5.3 本章小结 27
第六章 总结和展望 28
6.1 总结 28
6.2 展望 28
致 谢 29
参考文献(References) 30
绪论
选题背景和意义
选题背景
在1943年,由神经科学家麦卡洛克(W.S.McCilloch) 和数学家皮兹(W.Pitts)发表论文《神经活动中内在思想的逻辑演算》(A Logical Calculus of the Ideas Immanent in Nervous Activity),从而建立了MCP模型,即一种神经网络和数学模型。MCP总的来说就是通过对人类的神经元进行研究,通过不断了解神经元的工作方式与原理,以及其结构,通过不断地总结,构造出的简化和抽象的模型,从此打开了人工神经网络的大门。1958年罗森布拉特提出了“感知器”(Perceptrons),即这是一种由两层神经元组成的神经网络。其原理是从训练样本中运用梯度下降法自动学习并且更新权值。1962年,由于该方法能够达到收敛被证明后,引发了第一次神经网络理论与实践效果的浪潮。1986年神经网络之父GeoffreyHinton发明了的BP(Backpropagation)算法,这种算法适用于多层感知器(MLP)。该方法采用了Sigmoid进行非线性映射,有效的解决了非线性分类和学习的问题。但这种优秀的算法却也存在着梯度消失问题。2006年,加Geoffrey Hinton 和他的学生提出了深层网络训练中梯度消失问题的解决方案:无监督预训练对权值进行初始化 有监督训练微调。自此深度学习又一次风靡起来,进入大众的视线。
总的来说,深度学习是由多层非线性运算单元组成,较低一层的输出作为较高一层的输入,再从大量的数据中学习有效的特征表示。浅学习神经网络的学习算法是比较低级的,一般只有一个输入层,一个隐层,一个输出层;然后,深度学习是非线性运算组合水平较高的网络,与浅学习比,如深度学习具有3个隐层。[1]近年来,为了加强深度学习的实践意义,诞生了不少深度学习工具,例如caffe,TensorFlow,Theano。如caffe,就可以让只要会c 编程的人员就可以编写深度学习代码,将深度学习的门槛一下降低了很多。
剩余内容已隐藏,请支付后下载全文,论文总字数:30935字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;