论文总字数:23356字
摘 要
在城市交通规划和管理的工作中,居民出行调查是一切政策制定、模型分析的基础。而在调查中所获得的出行信息也已经越来越成为交通系统问题诊断、交通系统规划以及交通管理政策制定的重要参考依据。但是,传统的用户出行调查的数据主要建立在受访人对过去行为的回忆的基础上,不仅消耗了大量的人力物力,还存在误报率高、受访率低等问题。随着信息化进程的加快,利用全球定位系统(GPS)定位用户信息从而获取交通信息的手段已经逐渐成为可能。本文基于微软开源GPS数据——即182 名用户为期五年的出行轨迹GPS数据,对大量数据进行分析处理,建立数据库,对数据进行了去噪、筛选和计算。通过主成分分析法得出速度均值和速度最大值是区分出行方式的关键。随后,基于模糊函数最大隶属度法则以及随机森林算法对交通方式划分,分析出了用户出行起点、出行终点、行程时间、通勤方式等相关信息。这一整套流程都可以作为日后专门处理OD信息的相关交通专业软件功能模块包下的一部分,在接下来的研究中作为市场软件的插件,积极迎合目前智能化交通发展的潮流。
关键词:数据处理、出行调查、信息挖掘、GPS、交通方式
Abstract
In the work of urban transport planning and management, residents’ travel surveys are the basis for all policy development and model analysis. The travel information obtained in the survey has become an increasingly important reference for the diagnosis of traffic systems, transportation system planning, and traffic management policy formulation. However, the data of traditional user travel surveys is mainly based on the interviewees' memories of past behaviors. It not only consumes a large amount of manpower and material resources, but also has high rates of false positives and low interviewing rates. With the developing of information, it has become possible to use GPS to locate users’ information and obtain traffic information. This paper is based on Microsoft's open-source GPS data, a five-year travel GPS data of 182 users. It analyzes and processes large amounts of data, builds databases, lower noises, filters, and calculates data. The use of principal component analysis to derive the velocity mean and velocity maxima is the key to distinguishing the way of transportation. Then, based on the maximum membership degree rule of ambiguity function and the random forest algorithm, this paper analyzes the relevant information of user travel starting point, travel destination, travel time, commuting mode and so on. This entire process can be used as a part of the related traffic professional software functional module package that deals with OD information in the future. As a plug-in of market software in the next research, it actively caters to the current trend of intelligent traffic development.
KEY WORDS: data processing, travel survey, information mining, GPS, transportation mode
目录
摘 要 I
Abstract II
第一章 绪论 1
1.1引言 1
1.2国外研究现状 1
1.3国内研究现状 2
1.4研究目的与意义 3
1.5研究内容 4
第二章 数据处理 5
2.1 处理流程 5
2.2 数据特征分析 5
2.2.1 原始数据特征 5
2.2.2 数据缺失及漂移 6
2.3 数据清洗 7
2.3.1 统一化 7
2.3.2 经纬度坐标转换 7
2.3.3 数据库建立及数据导出 8
2.4 出行特征识别 8
2.4.1 精度控制 8
2.4.2 速度计算 8
2.4.3 交通方式归类 9
第三章 数据分析 11
3.1 交通方式 11
3.1.1速度波形图 11
3.1.2 主成分分析 14
3.1.3 隶属度函数 15
3.2 随机森林算法 18
3.2.1 算法原理 18
3.2.2 算法实现 21
3.2.3 结果与反思 21
第四章 总结与展望 22
致谢 23
参考文献 24
第一章 绪论
1.1引言
城市交通连接着城市不同设施,是城市规模不断扩大和发展的必经之路和必要手段,也是居民生产生活过程中不可缺少的社会公共服务设施,在城市规划和管理中占有十分重要的地位。精确把握居民出行的交通规律并在此基础上维护和组织交通系统的运行,不仅仅要做到对交通系统的监控,还要及时通过各类交通调查分析交通发展的需求变化。
交通调查中最重要的部分是居民出行调查,受限于技术的发展,传统的居民出行调查几乎全部采用人工调查或者人工调查计算机辅助记录的方式,主要包括了入户问卷调查(Face-to-Face)或计算机辅助电话调查(Computer Assisted Telephone Interview,简称CATI)。但是这么做不仅效率低,而且得到的信息也常常不够准确,而且得到的信息中不包含出行路径信息(而出行路径的调查常常样本较少偏差率高),同时,由于出行调查一般包含较多问题,需要回忆很多信息,这给被访者带来了很大负担,所以经常被拒绝,调查成本非常高但是成功率相对则比较低。
美国军方在20世纪70年代开始陆续发射卫星,研究和部署全球定位系统(Global Positioning System,简称GPS),经过20多年的不断完善和发展,GPS系统作为美国军用系统已经能够在海、陆、空进行三维导航和定位。之后,美国军方将GPS系统的数据加密降准后对民间开放。20世纪90年代中期,首次有学者将其引进到交通调查领域中。GPS系统可以自动记录用户行动到某轨迹点的时间和轨迹点的位置,通过分析GPS出行轨迹数据,很容易地可以得到用户在每个轨迹点的时间,在适当地行程分割后,可以推算出用户的行程时间、出行速度等信息。由于GPS轨迹记录设备记录的数据本身只是按照时间顺序排列的轨迹点经纬度数据,因此,基于GPS数据的出行信息处理和行程特征识别算法已经逐渐成为交通工程领域炙手可热的研究方向之一。而且随着官方对精度权限的完全开放,通过GPS设备能获得的大量高精度数据也获得了大数据行业的青睐,成为许多预测算法的数据来源。
1.2国外研究现状
使用GPS数据识别和处理出行信息的早期研究主要侧重于数据处理的可行性和准确性,主要做法包括比较不同仪器的精度并将其与现有交通调查数据比较,综合分析出该做法的可行性,如(Wagner,1997;Wolf,2000),后期的研究主要集中于如何通过数据分析算法提高出行调查的准确度,如(Zmud and Wolf,2003)。
剩余内容已隐藏,请支付后下载全文,论文总字数:23356字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;