论文总字数:25482字
摘 要
单摄像头多目标跟踪(MOT)是一个重要的计算机视觉领域问题,其因学术和商业潜力而日益受到重视。尽管如今已经有很多种的方法来处理这个课题,但由于目标重叠、外观变化等方面,它仍然面临着的重大挑战。
本文在学习单摄像头多目标系统相关知识、关键原理及评估方法的基础上,研究了三种单摄像头多目标跟踪算法,通过分析和评估,从中选取效果较好的DeepCC算法作为研究目标。本文提出的Ci-DeepCC算法是一种利用目标外观和运动信息关联进行跟踪预测的算法。该算法在跟踪速度方面通过缩短视频读取时间,在跟踪准确度方面通过改进目标外观特征提取网络,来对DeepCC算法进行了改进。在DukeMTMC数据集上对算法进行跟踪测试得到的实验结果表明,Ci-DeeppCC算法比DeepCC算法更有效。
关键词:计算机视觉,单摄像头多目标跟踪,深度学习
Abstract
Multiple object tracking (MOT) with single camera is an important computer vision problem which has gained increasing attention due to its academic and commercial potential. Although different kinds of approaches have been proposed to tackle this problem, it still remains challenging due to factors like abrupt appearance changes and severe object occlusions.
In this work, three single camera multi-target tracking algorithms are studied on the basis of learning the relevant knowledge, key principles and evaluation methods of single camera multi-target system. Through analysis and evaluation, DeepCC algorithm with better effect is selected as the research target. The Ci-DeepCC algor-ithm is a tracking and prediction algorithm based on the association of the appearance and motion information of the target. In terms of tracking speed, the DeepCC algor-ithm is improved by shortening the video reading time and improving the target appe-arance feature extraction network in terms of tracking accuracy. The experimental results on Duke MTMC dataset show that Ci-DeeppCC algorithm is more effective than DeepCC algorithm.
KEY WORDS: computer vision, multiple object tracking with single camera, deep learning
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1 研究背景 1
1.2 研究现状 1
1.3 研究内容 2
1.4 论文组织结构 2
第二章 相关知识与技术 3
2.1单摄像头多目标跟踪系统 3
2.2 残差网络 3
2.3 单摄像头多目标跟踪算法介绍 4
2.3.1 Sort算法 4
2.3.2 DeepSort算法 4
2.3.3 DeepCC算法 5
2.4 单摄像头多目标跟踪评估标准 8
2.5 本章小结 9
第三章 Ci-DeepCC算法分析与设计 10
3.1算法分析 10
3.2 Ci-DeepCC算法改进思路 10
3.2.1 视频读取速度 10
3.2.2 特征提取模型与训练集 11
3.3 Ci-DeepCC算法设计 11
3.4 本章小结 15
第四章 实验 16
4.1 实验环境 16
4.2 数据集 16
4.3 跟踪效果 17
4.4 实验结果对比 18
4.5实验结果分析 21
4.6实验结论 22
4.7 本章小结 22
第五章 总结与未来的工作 23
参考文献 24
致谢 25
第一章 绪论
1.1 研究背景
随着城市智能化的发展,监控摄像遍布在城市各个公共角落,采集着视频数据,这数量庞大的数据集中蕴含着巨大的学术、商业、民用和军用价值。单摄像头的目标追踪是利用计算机视觉技术追踪该摄像头连续视频帧下目标运动轨迹的技术,即在给定摄像头的视频中同时对多个目标进行定位,并且维持目标的身份、生成目标的轨迹。在单监控中跟踪目标可弥补人视觉上的不足,为跨设备追踪提供基础。
单摄像头多目标追踪系统可广泛应用在机器人导航、智能监控视频、工业检测和航空航天等各种领域,例如,(1)在智能安保方面,可以通过系统检测来往人员异常行为,以节省大量的人力物力。(2)在人机交互方面,这类系统可以对复杂场景中目标交互的身份识别与处理。(3)在医学图像方面,这类系统可以应用于医学切片图像,以得到病理目标的帧间变化轨迹,根据每个目标的特性对其变化轨迹进行分析,以达到诊断医学图像中存在的病理。(4)在虚拟现实和增强现实方面,通过跟踪游戏中角色运动的轨迹,来实现对游戏下一个运动的预判。
1.2 研究现状
作为计算机视觉领域一个比较热门的研究方向,单摄像头多目标跟踪仍存在着目标重叠、外观变化等挑战。目前已经有很多种的方法和模型来处理单摄像头多目标跟踪问题,常用的四种跟踪模型[1]如下:
(1)外观模型。外观是多目标跟踪算法中重要的计算相似度的条件,在单目标跟踪中通常构建复杂的外观模型来将目标和背景区分开来不同,大多数单摄像头多目标跟踪算法则不将其作为核心的建模方法,而只作为一个重要的部分。外观模型的内容可以分为两部分:视觉表示和统计测量。视觉表示是指用单特征或多特征来描述一个目标,统计测量则是计算不同目标间的相似性,其中视觉表示分为本地特征、区域特征和一些辅助特征,统计测量分为单线索融合和多线索融合,通常利用线索间的距离来判断目标间相似性。例如目标i和j间的相似性如式1.1所示。
其中和是不同观测目标的视觉表示,F(· ,·)是测量目标之间相似性的函数。
剩余内容已隐藏,请支付后下载全文,论文总字数:25482字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;