基于机器学习的交通违法时空演化趋势预测研究

 2022-07-12 21:42:00

论文总字数:50326字

摘 要

我国近些年的综合实力快速增长,交通事业也正在快速发展,随之而来的是日益严重的交通安全问题。现有交通安全研究的关注点普通在交通事故上,却忽略了交通违法行为作为交通事故最重要的影响因素之一,若能对其从宏观上预测时空演化趋势,可以显著改善交通安全甚至整个道路交通环境。

本文首先利用多元统计分析理论中的对应分析方法,得到昆山市历史交通事故类型与交通违法类型的对应影响关系模型,从而针对特定事故类型确定所要分析研究和预测的违法类型对象,达到有效减少该类事故发生数量的目的。

其次,本文基于国内外对交通违法行为的研究现状,从驾驶员、车辆、道路交通环境、自然环境和社会环境等几个方面归纳提取出交通违法行为的主要影响因素,通过数据集成和特征工程的方法,构建出违法预测的特征集。

针对特征集与交通违法预测问题的内在特性,本文介绍并分析了线性回归、LASSO回归、岭回归、梯度提升决策树、XGBoost等常用机器学习模型的优劣势,从而选取出合适的机器学习模型进行预测,并且使用Blending的方法得到了融合模型。考虑到各区域之间在地理特征上具有高度相似性,本文进一步提出了基于聚类的分层融合模型。各模型在测试集上的验证结果,证明了本文的机器学习违法预测融合模型具有较高的准确度,且对比较为简单的回归模型有显著提高。

最后,基于模型得到的特征重要性和预测结果,分析得到违法数量在昆山市的时空演化趋势并且为交通监管部门提出有效预防管理该类违法行为的对策建议。这一系列交通违法行为的预测分析流程经过改进,可被应用于各地的交通违法监管中,使得执法部门可以预知各类型违法的时空分布,从而高效调配其监管资源,从根本上控制了交通事故的发生量。

关键词:机器学习模型,交通违法预测,融合模型,对应分析

Abstract

The transportation industry in China is developing rapidly. The focus of current traffic safety research is common in traffic accidents to improve traffic safety, but it neglects the traffic illegal behavior as one of the most important factors of traffic accidents. Thus, it is meaningful to predict the temporal and spatial evolution trend from the macroscopic.

This paper first uses the corresponding analysis method to obtain the corresponding relationship model between the historical traffic accident types and the traffic illegal types in Kunshan, so as to determine the illegal type objects which should be analyzed and studied and predicted in view of the specific type of accident, so as to achieve the purpose of reducing the number of such accidents.

Secondly, the main influencing factors of traffic illegal behavior are extracted from several aspects, such as drivers, vehicles, road traffic environment, natural environment and social environment. Through data integration and characteristic engineering methods, a feature set of illegal prediction is constructed.

In this paper, the advantages and disadvantages of linear regression, LASSO regression, ridge regression, GBDT, XGBoost and other common machine learning models are introduced in view of the intrinsic characteristics of the feature set and traffic illegal prediction. The suitable machine learning model is selected to predict the model, and the method of Blending is used to get the fusion model. Considering the high similarity of geographical features among different regions, a predicting model based on clustering is proposed. The validation results of each model on the test set show that the machine learning model in this paper has high accuracy.

Finally, based on the feature importance and prediction results obtained by the model, the temporal and spatial evolution trend of violations in Kunshan is analyzed, and the countermeasures and suggestions for effective prevention and management of this kind of illegal behavior are put forward for the traffic supervision department. This process of prediction analysis can be applied to traffic illegal supervision in various places. The enforcement departments can predict the temporal and spatial distribution of various types of illegal activities, so as to efficiently allocate their regulatory resources and fundamentally control the occurrence of traffic accidents.

KEY WORDS: Machine Learning Model; Traffic Violation Prediction; Ensembling;Corresponding Analysis

目录

摘要 I

Abstract II

第一章 绪论 1

1.1 研究背景及意义 1

1.2 研究目标及内容 1

1.2.1 研究目标 1

1.2.2 研究内容 2

1.3 研究方法及技术路线 2

1.4 本文结构安排 4

第二章 国内外研究现状概述 5

2.1 交通违法行为研究现状 5

2.2 机器学习预测模型研究现状 7

2.2.1 岭回归 7

2.2.2 LASSO回归 8

2.2.3 弹性网络回归 8

2.2.4 梯度提升决策树GBDT(Gradient Boosting Decision Tree) 9

2.2.5 XGBoost算法 9

第三章 事故类型和违法类型对应分析 11

3.1 对应分析模型建立 11

3.2 数据准备 14

3.2.1 事故类型定义 14

3.2.2 违法类型定义 14

3.3 实例分析 15

3.3.1 基于频数的卡方检验事故与违法的相关性 16

3.3.2 对应分析结果分析 16

第四章 违法预测的实验与结果分析 20

4.1 实验准备 20

4.1.1 实验环境 20

4.1.2 实验原始数据 20

4.2 特征工程 21

4.2.1 数据预处理 21

4.2.2 特征提取与构造 22

4.2.3 数据集成 23

4.2.4 特征选择 24

4.3 实验训练过程 25

4.3.1 准备数据 25

4.3.2 训练集与测试集划分 25

4.3.3 基模型的训练 26

4.3.4 改进的模型融合预测 28

4.3.5 基于聚类的分层融合模型 29

4.4 基于随机森林模型预测交通流和平均速度构造测试集特征 31

4.4.1 RF算法步骤 32

4.4.2 特征构造 32

4.4.3 预测结果 33

4.5 测试结果与分析 34

4.5.1 评价指标 34

4.5.2 模型性能 34

第五章 交通违法行为预防对策研究 36

5.1 违法行为主要影响因素 36

5.2 违法行为时空演化分析 36

5.2.1 违法实际数量与预测值的趋势一致性 36

5.2.2 违法预测值在各维度上的趋势 38

5.3 违法行为预防对策 41

第六章 总结与展望 45

6.1 主要工作成果 45

6.2 未来展望 45

致谢 46

参考文献 47

附录A 49

剩余内容已隐藏,请支付后下载全文,论文总字数:50326字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;