论文总字数:20021字
摘 要
目标检测技术是现代社会图像处理与人工智能领域重要技术之一。足球比赛的视频录像是目前最有效的分析和评估球员表现、战术设计的资料,其中,球员的运动轨迹起到基础数据的作用。本文应用Faster-RCNN方法对足球场上的足球运动员进行了检测。全文主要工作内容包括:
综述了图像处理技术在体育领域的应用。简介了卷积神经网络和深度学习的发展历程和算法原理。综述从视频图像数据中运动目标提取的算法,着重分析了Faster-RCNN方法的流程和优势所在。
对Faster-RCNN方法的resnet101模型进行训练,当total loss收敛至基本稳定时完成训练。绘制total loss和迭代次数的折线图。将待检测视频分成许多张截图,将每段视频的所有截图用训练好的模型进行检测,计算出准确率和召回率。最后调用opencv函数将许多张jpg格式的图片转化为avi格式的视频。分析实验结果与实验中的不足,并对未来进行展望。
关键词:目标检测,Faster-RCNN,卷积神经网络
ABSTRACT
Object detection technology is one of the important technologies in the field of
image processing and artificial intelligence in modern society. Video recording of football matches is currently the most effective material for analyzing and evaluating player performance and tactical design. Among them, the player's trajectory plays a role in basic data. This article uses the Faster-RCNN method to detect soccer players
on the football field. The main work of the full text includes:
The application of image processing technology in sports is reviewed. The development course and algorithm principle of convolutional neural network and deep learning are introduced. This paper reviews algorithms for extracting moving objects from video image data, and focuses on analyzing the flow and advantages of the Faster-RCNN method.
The rester101 model of the Faster-RCNN method is trained to complete the training when the total loss converges to a basic stability. Plot the total loss and the number of iterations. Divide the videos to be detected into many screenshots, and use the trained model to detect all the screenshots of each video. Calculate the accuracy and recall rate.
At last use the opencv function to convert many jpg-format images into avi format video. Analyze the experimental results and the deficiencies in the experiment and look into the future.
KEYWORDS:Object Detection,Faster-RCNN,CNN
目 录
第一章 绪论 7
1.1选题背景及课题意义 7
1.1.1选题背景 7
1.1.2 课题意义 7
1.2 图像处理的在体育中的应用 8
1.2.1 门线技术与VAR技术 8
1.2.2 电视转播技术的应用 9
1.3 研究内容 10
1.4 论文组织结构 10
第二章 神经网络与深度学习 11
2.1 人工神经网络概述 11
2.2 深度学习与卷积神经网络 12
2.2.1 深度学习 12
2.2.2 卷积神经网络在图像处理中的应用 13
2.2.3 神经网络的训练方法 14
2.3 从RCNN到Faster-RCNN 14
2.3.1 RCNN 15
2.3.2 Fast-RCNN 15
2.3.3 Faster-RCNN 15
第三章 数据集与工程目录 18
3.1 数据集 18
3.1.1 数据集的搭建 18
3.1.2 数据集的预处理 18
3.2 工程目录 19
3.3 实验环境 19
第四章 训练Faster-RCNN模型 20
4.1 卷积神经网络的发展 20
4.2 训练模型 21
第五章 利用Faster-RCNN模型进行目标检测 24
5.1 检测实验数据 24
5.2 实验结果分析 25
5.3 截图重新转化为视频 27
第六章 总结与展望 28
6.1 总结 28
6.2 展望 29
致 谢 30
参考文献 31
绪论
1.1选题背景及课题意义
1.1.1选题背景
随着人工智能的发展和图像处理技术的进步,图像识别已经应用在了每个人的工作与生活中。目前图像识别广泛应用于人脸识别,车牌识别等方面。本文主要探讨球场上球员的识别,可以应用于电视转播或者教练员分析战术等方面。
图像目标检测(Object Detection) 就是在一个图片中找到预先储存在模型中的目标并进行标注,例如在马路上找到车辆,在一篇文章中找到某个字母,在足球场上找到足球运动员等。
最早的图像目标检测主流算法是DPM(Deformable Part Model)算法,是一种基于组件的检测算法。对于任意一张输入图像,DPM算法首先提取其DPM特征图,然后将原始图像进行高斯金字塔上采样,然后提取其DPM特征图。对原始图片和特征图反复进行卷积操作,得到响应图,将响应图加权平均得到最终的响应图。响应图的亮度越高代表其响应值越大。
随着卷积神经网络开始流行并应用在目标检测中,图像目标检测有很多更好的方法。其中主要的三类是YOLO,SSD和RCNN系列。在小物体检测上面,相比于前两者,RCNN的第三代产品Faster-RCNN有着很明显的优势。Faster-RCNN在边框回归时使用了RPN网络,因此召回率更高。本文因此选择用Faster-RCNN方法进行视频中球员的提取。
剩余内容已隐藏,请支付后下载全文,论文总字数:20021字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;