论文总字数:19867字
摘 要
近几年来,互联网信息时代的高速发展为人类社会带来了巨大的变革和深远的影响。大数据也渐渐成为了人们广为关注的重要战略资源。数据挖掘技术也得到不断进步和完善。作为知识发现过程中的重要环节,数据挖掘的作用就是从海量的数据中抽取总结出用户感兴趣的知识。数据挖掘技术已经为人们带来了生活便利和巨大的经济效益。然而,现实生活中采集到的数据集合中常常含有噪声数据,并且可能存在不完备、不协调、不确定性的信息。如果在这种低品质的数据集上进行数据挖掘,根本无法得到我们期望的效率和结论。
由于汽车逐渐成为家庭的代步工具,使得汽车销售企业变得繁华起来。但在繁华的背后,存在着诸多的问题困扰着该行业的决策层。例如,当在市场投放一种新的车型时,如何对历史数据进行分析,从而判断出该车型的面向群体,为其广告的宣传进行导向等。一般的,当汽车销售企业运转多年,其操作型数据库中留有众多的历史信息记录,这其中便蕴藏有大量的有价值的信息,必要的分析其中的内容后,便能够看出汽车销售过程的销售轨迹。
本文针对这一状况,通过对汽车上牌销售大数据进行数据挖掘,从而筛选出对汽车生产制造商和客户所需要的有利信息,进而将这些数据生成Excel透视表。本文以Visual Studio和C#语言在winform平台上搭建了汽车上牌数据系统,SQL Server为后台数据库,对根据从网上获取的数据源以及市政府工信部发布的车辆信息进行数据挖掘,有效地筛选出符合客户或汽车生产制造商需要的信息,该系统对其他汽车销售其他方面的应用也有着较大的参考价值。
关键词:数据挖掘;Visual Studio;C#;大数据;数据仓库
Analysis and Design of License Data System Based on Winform
Abstract
In recent years, computer networks and information technology for the rapid development of human society has brought great changes and far-reaching impact. The data has gradually become an important strategic resource that people pay close attention to. Data mining technology has also been continuous progress and improvement. As an important part in the process of knowledge discovery, the role of data mining is to extract the knowledge from the mass of data. Data mining technology has brought convenience to people and huge economic benefits. However, the data collected in real life often contain noise data, and there may be incomplete, uncoordinated, uncertain information. If we do data mining on such a low-quality data set, we can not get the efficiency and conclusions we would expect.
Car sales companies, especially after the car into the home, has become a thriving enterprise, but there are many problems difficult to grasp the car sales business decision-makers at all levels, such as the new models put, how through historical data Analysis, to identify new models of possible customer groups, so as to guide advertising and so on. After many years of operation, the automobile sales enterprise has kept a lot of historical information records in the operation database, which contains a lot of useful information. By analyzing the information, it can reflect the certain process of automobile sales. Law.
In view of this situation, this paper chooses the favorable information for the automobile manufacturer and customer by data mining of the big card sales data, and then stores the data into the data warehouse. Based on Visual Studio and C # language, this paper builds the data system of vehicle license on the winform platform. SOL Server is the back-end database. It is used for data mining based on the data sources obtained from the Internet and the information released by the municipal government. Automobile manufacturers need information, the system of other car sales other aspects of the application also has a greater reference value.
Keywords: Data mining; Visual Studio; C#;Big Data;Database
目 录
摘 要 II
Abstract III
第一章 绪 论 1
1.1 研究背景 1
1.1.1 上牌数据 1
1.1.2 数据仓库 1
1.1.3 数据挖掘 2
1.2 研究目的及意义 2
1.3 技术路线及开发方法 2
1.4 论文框架 3
第二章 系统规划及分析 5
2.1 系统规划 5
2.2 可行性分析 5
2.3 需求分析 5
2.3.1 需求概述 5
2.3.2 用例模型 6
2.4 系统非功能性需求分析 6
2.4.1 可用性 7
2.4.2 可维护性 7
2.4.3 可扩展性 7
2.5 性能需求分析 7
2.6 逻辑结构分析 7
2.6.1 关系实体分析 8
2.6.2 数据流程分析 9
第三章 系统设计 10
3.1 总体设计方案 10
3.2 功能模块设计 10
3.2.1 数据导入模块 10
3.2.2 数据汇总模块 11
3.2.3 数据删除模块 11
3.2.4 数据统计模块 11
3.2.5 条件筛选模块 11
3.2.6 按数据导出模块 12
第四章 系统实施与测试 13
4.1 开发技术 13
4.1.1 开发语言 13
4.1.2 开发环境 13
4.2 数据库 13
4.3 开发模式 15
4.3.1 基于Winform开发 15
4.3.2 C/S开发模式 15
4.4 系统测试 16
4.4.1 系统测试原则 16
4.4.2 系统测试方法 16
4.4.3 系统测试结果 16
第五章 试运行与评价 18
5.1 系统运行 18
5.1.1 数据导入 18
5.1.2 数据汇总 18
5.1.3 数据统计 19
5.1.4 数据删除 20
5.1.5 导出条件筛选 20
5.1.6 导出数据 21
5.2 系统评价 21
第六章 总结与展望 22
6.1 总结 22
6.2 展望 22
致 谢 23
参考文献(References) 24
第一章 绪 论
1.1 研究背景
信息网络技术的发展以及互联网的普遍运用表示着全球的联网设备现在正以一种飞速的形式发展着。依据赛门铁克公司他们的研究表明,全球企业数据存储总量现在高达2.2Zb,甚至每年以70速率飞速发展。如李菁菁,邵培基,黄亦潇(2014)所说,21世纪是信息发展飞速的制高点,电子业务、社交媒体、移动互联网其运用也使得互联网的应用变得更加广泛,而使用领域也遍布各地。我们在享受便利的同时,也无偿贡献了自己的“行踪”[1]。如今的互联网使用便捷,我们可以通过互联网了解到自己所关注的人现在的地理方位,甚至可以知道他一天的行踪,在如今的互联网飞速发展的时代,每个人都变成了透明人。这飞速的变化则有可能导致绝大部分的企业还没意识到大数据将影响整个企业的未来发展形势。朱明(2012)认为随着信息科技时代的发展,将会有更多的人认识到信息数据对于企业未来发展必要性。信息时代的发展算是对21世纪的新新人类发出的一份新的考验书,而新世纪人们则需要强大的观察能力去探索大数据所隐藏的巨大宝藏与财富。如今这个时代,数据就像空气中的微小粒子渗透到世界的每个角落,政府、学术、商业界都层层深入并无法避免的已经开始这一进程,大数据的发展还将21世纪每一领域逐步渗透[2]。
虽然大数据这个领域对于人类而言不是那么熟悉,但其探索价值是永无止境的,不过以人类现在的技术,想要从浩瀚如海的大数据资料中筛选出自己想要的有利用价值的数据还是有一定的技术难度,陈京民(2012)认为其制约因素主要表现在如何有效存储海量的大数据、如何高效地传输大数据、如何迅速地对大数据进行有效挖掘,另外,单从运用数据挖掘技术而言也存在着较多的难题,比如在数据挖掘过程中对数据进行定位和寻址,大数据的表示方法、预处理、迅速匹配模式的开发以及通信过程中的能耗损失问题等,而上述的这系列问题依旧未能有较好的解决方案[3]。
1.1.1 上牌数据
上牌意思就是为新车辆办理好车辆的牌照号码,上牌数据其中的基本的信息数据包含有地区、年份、品牌、车系、制造商、发动机型号等。有很多种渠道可以获取到车辆上牌信息,例如这个汽车品牌的地级代理或者4s店;车管所;通过数据库的区域查询到品牌车企业,通过市政府工信部所发布出的数据等等。公开出了上牌数据,对发展整个汽车行业也依然有着很重要的意义。它不仅对于企业把握市场需求很有利,能够作出相对合理性的决策,也对消费者做出正确的购买决策很有利,更加有利于行业人士能够较好的了解到产业发展的现状,也能够更加的科学进行规划与布局,最终可以确保整个产业的可持续发展性,同时也可以杜绝发生出数据造假的事件。
1.1.2 数据仓库
从广义理解来说,数据仓库也被等同于认为是数据环境,甚至可以说,数据仓库就可以被认为是数据库。他是将各个应用通过集成而形成的以汇总历史数据为主要功能的平台,是决策支持系统和联机分析应用数据源的结构化后形成的。数据仓库的作用基本总结起来就是在数据库中得到的信息去研究现在所存在的问题。
1.1.3 数据挖掘
计算机硬件软件的共同发展,特别是数据库技术和应用在21世纪的飞速普遍化,如何更有效地使用数据海洋的宝库为人们所服务,现在已经成为了信息工作者的最大任务所在。和越来越成熟的数据管理技术和现在的软件工具作比较,人们会更青睐于数据分析的功能,但是它无法真正的去为使用者提供相关的知识,因此,这又成为了一种特别的现象“丰富数据、匮乏知识”。为了能更有效地去解决这个问题,从20世纪80年代便开始了数据的挖掘技术,这个技术的迅速发展也是归功于全球所拥有的强大的数据资源还有这些资源数据转变成信息以及知识资源。面对信息和知识的需求,不论是各个领域各个职业都可以说,数据挖掘是数据管理与分析技术的自然进化产物。
1.2 研究目的及意义
随着人民目前生活质量的提升,每家每户拥有私家车已经是普遍化的需求现象了。汽车销售行业近年来发展迅速,汽车行业的前景也是十分可观,如表所示,截止2016年12月份,我国汽车全年销量为2314万辆,比去年增长6.9%,稳坐全球第一宝座,如表1.1所示。在以前,汽车主要是面向企业、政府、事业等单位进行销售,而现如今销售对象更是扩大到每家每户,家庭轿车的销售问题也是日益放大。因此,企业对客户准确的分析、预测对新车型的研究投放广告宣传等方面,也越来越重要。市场与市场之间的竞争越来越激烈,汽车销售商也逐步地将重点从销售慢慢的转向了售后服务。销售是企业成功的起点,而售后也逐步成为了企业成功的转折点。汽车制造商和销售商在多年的持续经营中,也会留下许多有用的汽车销售数据留存在数据库里,然而,只有对这些数据只有有效的分析,才能反映汽车销售中存在的某种规律。用最初最原始的方式去分析这些数据是很难的,只有从汽车销售中提取出销售的核心数据,才能为科学的商业抉择提供好的帮助,这也是本设计的研究目的及意义。
剩余内容已隐藏,请支付后下载全文,论文总字数:19867字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;