基于深度学习的目标跟踪算法的实现

 2022-08-08 09:34:56

论文总字数:28775字

摘 要

深度学习技术经常被用在计算机上,因为它们有能力利用大量的培训数据提高性能。不幸的是,大多数通用对象跟踪器仍然是在线训练,并没有从很多的,可以随时用于离线训练的视频中获益。现有一种离线训练神经网络的方法——GOTURN[40](Generic Object Tracking Using Regression Networks),这种方法能以100fps的速度在测试时间内跟踪新的对象。使用此算法的跟踪器显著快于以前使用的传统在线训练神经网络跟踪的方法,传统方法运行速度非常慢,对于实时应用来说不实用。此算法的跟踪器使用一个简单的,不需要在线训练的前馈网络。跟踪器学习对象运动模型和表观模型之间的一般关系,并且可以用来追踪没有在训练集中出现的新对象。目前,使用GOTURN算法的跟踪器是第一个能在100fps中学习跟踪通用对象的神经网络跟踪器。

本课题围绕GOTURN目标跟踪算法,针对跟踪器在跟踪不同速度的目标物体性能不一的问题,在原代码的基础上做出一些修改,从而使得跟踪器在跟踪不同速度的目标物体时能自适应的调整参数来更精准的跟踪。

关键词:目标跟踪,深度学习,神经网络,机器学习

Abstract

Deep learning techniques are often used on computers because they have the ability to use large amounts of training data to improve performance. Unfortunately, most common object trackers are still online training and do not benefit from the many videos that can be used for offline training at any time. There is a method for off-line training neural network GOTURN[40] (Generic Object Tracking Using Regression Networks). This method can track new objects in the test time at the speed of 100fps. The tracker using this algorithm is significantly faster than the previously used traditional on-line training neural network tracking method. The traditional method runs very slowly and is not practical for real-time applications. The tracker of this algorithm uses a simple feedforward network that does not require online training. The tracker learns the general relationship between the object motion model and the appearance model and can be used to track new objects that do not appear in the training set. So far, the tracker using GOTURN algorithm is the first neural network tracker that can learn and track common objects in 100fps.

It revolves around the GOTURN target tracking algorithm, when track the different speed target objects, tracker's performance is different. I made some modifications on the basis of the original code so that the tracker can be adaptive to adjust parameters when tracking different speed target objects for more accurate tracking.

KEY WORDS: Tracking, deep learning, neural networks, machine learning

目录

摘要 I

Abstract II

第一章 绪论 3

1.1 介绍 3

1.1.1 深度学习介绍 3

1.1.2 卷积神经网络介绍 5

1.1.3 目标跟踪介绍 7

1.2 相关工作 9

1.2.1 在线跟踪训练 9

1.2.2 基于模型的跟踪器 10

1.2.3 其他神经网络跟踪框架 10

第二章 算法原理 11

2.1 算法 11

2.1.1 算法概观 11

2.1.2 输入/输出格式 11

2.1.3 网络架构 12

2.1.4 跟踪 13

2.2 训练 13

2.2.1 从视频和图像训练 13

2.2.2 学习运动平滑度 14

2.2.3 训练过程 15

2.2.4 训练集 16

2.2.5 测试集 16

第三章 算法实现与改进 18

3.1 代码分析 18

3.1.1 visualizer 18

3.1.2 tracker 18

3.1.3 network 19

3.1.4 helper 19

3.2 性能评价概述 20

3.2.1 性能评价平台介绍 20

3.2.2 VOT评价标准的选取 20

3.2.3 Accuracy 22

3.2.4 Robustness 22

3.2.5 VOT评价指标的核心 23

3.3 算法性能 23

3.3.1 整体表现 23

3.3.2 详细结果 24

3.4 算法改进 29

3.4.1 原理 29

3.4.2 具体实现 29

总结 31

参考文献 32

绪论

介绍

深度学习介绍

深度学习是通过模拟人类大脑的机制,建立一个深层的神经网络来学习并分析学习图像/语音及文本等数据,属于机器学习的一个热门分支。在传统的机器学习中,学习成果有效性高低,在很大的程度上由人工设计的数据表示和输入的特征值的有效性来决定,而在机器学习的方法中,这个过程的作用只是把学习权重优化了,以方便输出最终的最好的学习结果。但与之相比,深度学习的方法不同,它一般是自己将完成数据表示和特征提取的工作完成,而且深度学习更加强调的是,通过学习过程提取出有效表示,这些有效表示分别是不同的水平和维度的,以这样在不同的抽象层次上来拔高对数据的解释能力。

深度学习的概念是来自于人工神经网络(Artificial Neural Network,即ANN)的研究。人工神经网络从信息处理的角度来抽象出人类大脑的神经元网络建立某一种模型,再根据多样的连接方式连接成不同的网络。详细来说,神经网络是一种运算模型,内部有很多互联的神经元(或者称节点),通常一个神经元就是一个输出函数,它也被称之为激励函数。人类的每一个神经元都有轴突和树突的结构,人工神经网络也不例外,它可以通过轴突向其他千千万万个神经元输出信号,也可以通过树突从成千上万个神经元来接受输入信息。每两个神经元(用树突或轴突连接)之间都有一个叫权重的东西,代表着通过该连接信号的加权值,就相当于神经网络的记忆。对于整个神经网络的输出,根据神经网络的连接方式,权重还有激励函数的不同而改变。

剩余内容已隐藏,请支付后下载全文,论文总字数:28775字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;