论文总字数:54799字
摘 要
本文通过研究美国联邦调查局犯罪统计方法,参考大数据网站统计结果,利用最小二乘法逆推计算过程等步骤,建立了合理的数学模型.并对一个现有10,000多条犯罪记录的城市”My City”进行统计分析,求出了该城市的犯罪指数.并利用所给数据对My City的犯罪情况进行了进一步的统计分析.由于My City是以芝加哥为蓝本的,故本文中的许多描述直接以芝加哥代替My City.
关键词:最小二乘法 数学建模 犯罪指数 统计分析
City Crime and Safety
Abstract
In this Paper, we establish a mathematical model by searching FBI crime statistics and using least square method to reverse the calculating process referring to a data website. Then use the model to calculate the crime index through more than 10,000 amounts of data of “My City”. Also do some further statistics for “My City”. As for My City is based on Chicago, so we make some replaces in the paper.
Key word: least square method mathematical modeling crime index statistics
目录
第一章 引言 1
第二章 问题描述及分析 2
2.1 问题描述 2
2.2 前期工作 2
2.2.1 犯罪描述翻译 2
2.2.2 官方统计背景 3
2.2.3 统计实例研究 3
2.3 问题分析 4
2.3.1 数据分析 4
2.3.2 一级分类的权重分配 5
2.3.3 二级分类的权重分配 5
第三章 模型建立及论证 8
3.1 模型假设 8
3.2 符号说明 8
3.3 模型建立 9
3.3.1 一级分类权重说明,计算及验证 9
3.3.2 数据预处理 10
3.3.3 模型计算过程及结果 10
3.4 模型论证及误差分析 10
3.4.1 合理性论证 10
第四章 指标犯罪的时间与案发区域分析 12
4.1 案发时间分析 12
4.1.1 犯罪时间图表 12
4.1.2 犯罪时间分析 17
4.2 案发所属警力区域分析 17
4.2.1 所属警力区域说明 17
4.2.2 案发所属警力区域图表 19
4.2.3 警力区域犯罪指数计算 26
4.2.4 警力所属区域分析 27
第五章 其他犯罪分析 29
5.1 非指标犯罪列举 29
5.2 逮捕率计算 29
5.2.1 计算原理 29
5.2.2 计算结果及结论 30
致谢 31
参考文献 32
附录 33
附录A 完整翻译表格 33
附录B Matlab程序 38
B1 权重计算程序 38
B2 权重检验程序 38
B3 数据预处理程序 39
B4 二级分类修正程序 44
B5 犯罪指数计算程序 44
B6 逮捕率计算程序 45
附录C 指标犯罪统计表 46
C1 按时段统计的指标犯罪 46
C2 按District统计的指标犯罪 49
引言
数据统计在各个领域都有广泛的应用,我们可以通过对大量数据的统计分析总结出一般规律,从而对当前及将来的状况做出判断和预测.就城市犯罪与安全问题而言,美国联邦调查局每年都会开展统一犯罪调查工作,以统计全美各州及城市的犯罪情况并加以分析.本文即遵循美国联邦调查局犯罪统计的原理,对所给犯罪数据进行统计和分析.
本论文结构如下:
第二章详细介绍了论文所研究的问题,前期准备工作和本文所参考的犯罪指数计算方式,并对问题进行了详细的分析,把关键性步骤列举出来,为后续的建模做好理论准备.
第三章就城市犯罪指数的计算进行建模,详细的描述了模型建立的过程,并对其中的一些步骤做了验证和误差分析,保证建模的准确性.
第四章将指标性犯罪单独提取出来进行统计分析,分为时段分析和所属区域分析两部分,分别反映出犯罪行为与时间的相关性和城市地理位置与犯罪率的一些联系.
第五章将所给数据中不属于指标性犯罪的其他罪名做了简单的统计,计算了各犯罪行为的逮捕率,从侧面反映出城市建设的一些问题.
论文中的完整统计表格,Matlab程序等在附录中给出.
问题描述及分析
本章描述了所研究的问题以及其背景, 考虑到该问题涉及犯罪学,社会学等其他学科领域,故在此对前期工作进行详细的说明,以求在将该问题转化为数学问题的过程中具有足够的说服力.
问题描述
本问题给出了一个数据量在10,000以上的名为My City的城市犯罪记录,该城市以美国伊利诺斯州芝加哥市为蓝本,人口约280万,周边人口在600万左右.数据记录了该城市2014年7月5日至2014年7月18日两周的所有犯罪记录,这些记录包括:案件号,具体案发时间,原发性犯罪描述(以下称一级分类),继发性犯罪描述(以下称二级分类),案发地点,逮捕情况,是否为家庭犯罪,案发所属警力区域等.要求从所给的文字性描述中,找到合适的量化标准,将文字性描述转化成数量化的值,根据量化标准来判断犯罪的危险程度,从而给出该城市的犯罪指数,以此来断定城市的安全等级,并对城市的犯罪情况进行一定的分析.
前期工作
犯罪描述翻译
由于记录所给的犯罪描述均为英文,首先进行翻译工作.犯罪记录中的一级描述共有27种,每种罪名下的二级分类更加繁多,一共约250种,考虑正文简洁性,在此以表格形式给出关键性罪名的一级与二级分类及其英文与中文描述,完整的翻译表格在附录A中给出.关于关键性罪名将在下文中详述.
表2.1关键性罪名分类及其中文描述
英文名称 | 中文名称 |
HOMICIDE | 杀人 |
CRIM SEXUAL ASSAULT | 暴力性侵 |
SEX OFFENSE | 性侵 |
ROBBERY | 抢劫 |
ASSAULT | 暴力伤害 |
BATTERY | 非法伤害 |
MOTOR VEHICLE THEFT | 机动车盗窃 |
BURGLARY | 入室行窃 |
ARSON | 纵火 |
THEFT | 偷窃 |
官方统计背景
在美国联邦调查局例行的年度统一犯罪调查中,将需要统计的罪名称为”指标犯罪”, 指标犯罪被分为两类,暴力指标犯罪,即对人造成直接伤害的,包括谋杀,强奸,抢劫以及严重的人身暴力;财产指标犯罪,即未对人造成直接伤害的,包括机动车盗窃,入室行窃,纵火以及偷窃.列表如下:
表2.2指标犯罪
分类 | 英文名称 | 中文名称 |
暴力犯罪 | Murder | 谋杀 |
Rape | 强奸 | |
Robbery | 抢劫 | |
Assault | 严重人身暴力 | |
财产犯罪 | Auto Theft | 机动车盗窃 |
Burglary | 入室行窃 | |
Arson | 纵火 | |
Theft | 盗窃 |
而上文中提到的”关键性罪名”,即一级分类属于以上表格中八中指标犯罪其中之一的.通过对关键性罪名的统计分析,就可以得到城市的犯罪指数并评估其安全等级了.
统计实例研究
虽然联邦调查局和芝加哥警署这两个官方机构都未曾给出芝加哥市的犯罪指数,但查阅其他文献及网站所得到的芝加哥市安全等级评估中,都将这八种罪名作为犯罪指数的评估因子.比较多个网站所进行的数据统计,选择年份跨度大,统计较为完整的City-Data.com所给出的城市犯罪指数作为参考.数据表如下:
剩余内容已隐藏,请支付后下载全文,论文总字数:54799字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;