论文总字数:34091字
摘 要
随着经济的快速发展,人员的流动与聚集将会越来越频繁,那么随之而来的便是大规模人群聚集所带来的安全隐患问题。因此,更加智能化的监控系统将是未来的趋势。
目前来说,对于视频中人员检测,有很多已经实现的算法。诸如识别整个人的,或者是根据图像进行密度化处理,通过积分得到人群密度,亦或是对于人头进行检测,从而估计场景中人群密度。相比于其他种类的算法,由于在密集场景中,遮挡情况很严重,相对于按照模型识别全身的人,按人头特征来识别人群,无疑更具有代表性。因此,现在国内外最新的研究方法多是在前人的基础上,通过对于人头特征的研究而开展的。
现在的人员检测是通过以滑动窗口方式扫描图像,或者是通过对于一系列离散的推荐来进行分类操作。本文所采用的是一种基于将图像解码成一系列的人员探测模型。这种模型以图像作为输入,直接输出一系列的不同的人员预测信息。因为这种模型是采用联合预测,所以诸如非最大抑制等常见的后处理步骤是不需要的。模型使用循环的LSTM(Long Short-Term Memory)层来进行序列生成,并使用一种新的损失函数对模型进行端到端的训练。这种模型在拥挤场景中进行人员检测有很好的可行性。
最终的测试结果表明,论文所述的模型能够在真实场景中,估计出人员所在位置,给出人员变化趋势曲线图,并且给予人数统计和人群密度等级划分,对于人群密度等级可以达到90%以上准确率的估计。
关键词:人群密度估计,深度学习,TensorFlow,视频监控,数字图像处理
Abstract
With the rapid development of the economy, the flow and gathering of people will become more and more frequent, then the attendant is the large-scale crowd gathered by the security risks. Therefore, a more intelligent monitoring system will be the future trend. For now, there are a lot of algorithms that have been implemented for people in the video. Such as identifying the whole person, by integrating the population density, or by head detection, so as to estimate the population density in the scene. Compared to other types of algorithms, because of the dense scene, the occlusion is very serious, relative to the body in accordance with the model to identify people, according to the head features to identify the crowd, no doubt more representative. Therefore, the latest research methods at home and abroad are based on the predecessors, through the study of the characteristics of the head and carried out. Current personnel detection is done by scanning the image in a sliding window, or by sorting a series of discrete recommendations. This article is based on a method based on the image decoding into a series of personnel detection model. This model takes the image as input and directly outputs a series of different person predictions. Because this model uses jointly predictions, common post-processing steps such as non-maximum suppression are not required. The model uses the looped LSTM (Long Short-Term Memory) layer for sequence generation and uses a new loss function to perform end-to-end training on the model. This model has a good feasibility for personnel testing in crowded scenes.
The results of the final test show that the model can be used to estimate the position of the staff in the real scene, and give the trend of the change trend of the personnel, and give the population statistics and the population density level, for the population density level can reach more than 90% Estimation of accuracy.
Key Words : Estimation of Population Density, Deep Learning, TensorFlow, Video Surveillance, Process of Digital Image
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究现状 2
1.2.1 传统计数方法 2
1.2.2 现代人群密度估计方法的发展 3
1.3 本文的主要工作 4
第二章 深度学习介绍 5
2.1 深度学习简介 5
2.2 深度学习框架——TensorFlow 7
2.3 本章小结 8
第三章 模型构建与应用 9
3.1 模型介绍 9
3.2 模型的构建与实现 9
3.2.1 模型的构建理论 9
3.2.2 模型的实现 10
3.3 模型实施细节 13
3.4 本章小结 15
第四章 人数统计与密度估计 16
4.1 人数统计 16
4.1.1 识别效果的判别和评价 16
4.1.2 目标的统计和记录 19
4.2 密度估计 21
4.2.1 等级划分 21
4.2.2 密度估计曲线 22
4.3 本章小结 26
第五章 实验测试结果与分析 27
5.1 实验环境介绍 27
5.2 测试流程 27
5.2.1 “前楼东外”测试 27
5.2.2 “大门口”测试 30
5.2.3 “餐厅”测试 33
5.3 结果分析 36
5.3.1 测试结果分析 36
5.3.2 实时性分析 37
5.4 本章小结 37
第六章 总结与展望 38
6.1 总结 38
6.2 展望 38
致 谢 39
参考文献 40
绪论
研究背景及意义
近些年来,发展最快最迅速的行业,无疑是互联网行业,而支持互联网行业如此迅速发展的便是计算机技术的迅猛发展。互联网行业的火热,将我们所处的时代引向了一个数据爆炸的时代,各行各业都向着智能化,数据化方向发展,大数据层出不穷。其中也就包括了机器视觉等领域的发展与应用。随着经济发展加快,国家的城市化进度加快,越来越多的人,走入城市,学习、工作,无疑使得城市人口激增,城市的公共区域出现密集人群的可能性也越来越高,随之而来的高人群密度所带来的潜在危险也就越来越大。众所周知,人群数量越多,人群密度越大,发生危险的可能性就越高。近些年,许多高人群密度导致的悲剧在国内外都时有发生,而这种人群拥挤所带来的危险对于我国这样一个人口大国来说,无疑是非常严重的,尤其是大城市公交,地铁的早高峰、晚高峰时期,特别是一年一度的春运时期,群众踩踏所导致的事故发生并不鲜为人知。而在国外,这种拥挤造成的踩踏也时有发生,世界杯、演唱会、NBA等大型场馆就是多发区。正是由于这种悲剧的严峻性,促使人们对于人群密度监控有了迫切的需要。
而如今,计算机技术的发展,带动了与计算机相关的各行业的发展,机器视觉[1],图像处理等领域也就有了很大的应用空间。而计算机视觉领域的基于监控视频对于人群密度估计也成为了机器视觉的一个重要研究方向。研究人群密度不仅仅是为了防止拥挤,踩踏等事件的发生,人群密度还可以用于人的行为分析,人群异常行为监控等等各个方面,当然这些都是要以人群密度为基础的。
剩余内容已隐藏,请支付后下载全文,论文总字数:34091字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;