论文总字数:21633字
摘 要
目前关于目标检测的发展十分显眼,本次设计基于tensorflow框架来实现Faster R-CNN和SSD深度学习神经网络模型。网络模型结构使用tensorflow框架中objection detection API提供的网络模型faster_rcnn_resnet101_coco和SSD_mobilenet_v1_coco。整个系统实现的开始,标注训练集。将当前数据集全部标注,然后将标注的训练集转化成VOC2007格式。使用它来训练上述网络模型。训练开始之前,调整网络模型各式参数。开始训练后可以通过tensorboard观察loss函数。生成的模型根据最终检测结果选择保留当前模型还是重新训练,逐渐训练出最终模型。最终检测部分为检测路口监控视频,通过对路口监控视频的车辆识别状况,来反映当前训练好的模型的效果。执行目标检测系统程序,可以看到结果截图部分,来往车辆都被框出,并且根据不同的车辆类型使用不同颜色的框。最终Faster R-CNN和SSD模型成功完成对目标视频中的车辆检测。
关键词:目标检测;Faster R-CNN;SSD
Abstract
Recently the development of the object detection is very conspicuous, the design is based on the tensorflow framework to implement the Faster R-CNN and SSD deep learning neural network models. The network model structure uses the network model Faster r-cnn_resnet101_coco and SSD_mobilenet_v1_coco provided by the objectiondetection API in the tensorflow framework.Firstly,label training set. Annotate the current data set, and then convert the annotated training set into VOC2007 format.Use the data set training network model structure. Before training, adjust various parameters of network model. After training,
you can observe loss function through tensorboard. According to the final test results, the generated model chooses to keep the current model or retrain it, and gradually trains the final model. The final detection part is to monitor video at the intersection. The effect of the currently trained model can be reflected by identifying the vehicle type of video at the intersection monitoring. Executing the objection detection system program, you can see the screenshot of the result. All the vehicles are boxed out and different color frames are used according to different vehicle types. Finally, the Faster R-CNN and SSD model successfully completed vehicle detection in the video.
KEY WORDS: Objection Dection;Faster R-CNN;SSD
目 录
摘要 I
Abstract II
第一章 绪论 1
1.1 研究的背景与意义 1
1.2 目前发展状况 2
1.3 主要研究内容 3
1.4 技术支持 3
第二章 基于实验的准备工作 5
2.1 QT 5
2.2 Tensorflow与Anaconda 5
2.2.1 Tensorflow 5
2.2.2 Anaconda 6
2.3 Tensorflow使用Objection Dection API 6
第三章 目标检测的实验模块 7
3.1 目标检测系统 7
3.1.1 界面布置与实现 7
3.1.2 调用功能实现 8
3.2 系统模型的理论知识 8
3.2.1 Faster R-CNN理论知识和技术框架 8
3.2.2 SSD理论知识和技术框架 11
3.3 目标检测系统各模块的实现 13
3.3.1 标注模块 13
3.3.2 训练模块 14
3.3.3 识别模块 14
第四章 本次检测的结果分析与结论 16
4.1 成果展示 16
4.2 结论综述 19
4.3 未来的期望 19
致 谢 21
参考文献 22
附录A 23
软件使用说明 23
绪论
研究的背景与意义
近年来随着网络的不断普及和发展,科技已经和我们的生活紧密相连,生活中无时无刻不享受着网络的便利。视频就是一个显著的代表,视频将我们的距离无限拉近,也将生活的每一刻真实的记录下来。如此便捷的技术自然有着广泛的使用,也因此产生了大量的视频数据。虽然人们自己对于画面内容能够准确的识别,然而在某些特殊场合则是无能为力,为了能够更加快捷的处理视频内的数据从而获得需要的信息,人们想到了让电脑代替人脑来分辨识别目标,那就是目标检测和目标识别。目标检测能够给人们生活带来许多的便利,帮助人们快速检测和处理大量的数据,而在人工智能的潮流下,物体检测和目标识别更是愈加火热。
在机器视觉领域,目标检测是一个非常热门的研究方向。物体检测对于人眼来说是件很轻松的事,在图片中不同区域看到的颜色、纹理的不同,根据自己的识别经验很容易识别出目标,但对于计算机来说,检测提取的是RGB像素矩阵,很难从数据中直接得到人类定义的抽象名字并识别出其位置,再加上物体形状因位置角度不同、光照和复杂背景混杂在一起,使得物体检测更加困难。而对于这一系列难题人们想出许多算法来破解,如ssd,rcnn等,大部分检查算法都是包含三个部分,检查窗口的选择,目标特征设计,分类器设计。随着技术的发展,目标检测算法经历了从传统的人工设计特征 浅层分类器的框架,到基于大数据和深度神经网络的End-To-End的物体检测框架,物体检测逐渐变得成熟起来。
目标检测在生活中有着比较广泛应用的课题,它旨在将视频画面或者图片中目标和非目标的干扰项分离,通过检测和识别,即检测该区域是否存在目标,如果存在则通过一系列手段识别出目标的位置。如此符合人们需求的技术,前景自然非常火热。随着几代人的不断努力,突破大量核心困难后,技术的不断地成熟,目标检测技术的应用水平也越来越接近人们的需求,也因此目标检测技术已经在实际生活中有了大量的应用,如视频监控、自动驾驶、图像检索、医学图像分析、无人机导航、遥感图像分析领域都担当着十分重要的地位。
剩余内容已隐藏,请支付后下载全文,论文总字数:21633字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;