论文总字数:16800字
目 录
一 绪 论 1
1.1 研究背景与意义 1
1.2 国内外研究现状 1
1.3 论文研究内容 1
1.4论文构成 1
二 聚类分析 1
2.1 数据挖掘简介 1
2.2 聚类技术 3
2.2.1聚类分析的简介 3
2.2.2聚类的过程 3
2.2.3聚类算法的分类 3
2.3 K-means算法 4
三 聚类在气象数据分析中的应用 5
3.1 气象数据简介 5
3.1.1气象要素 5
3.1.2气象数据的特点 5
3.2气象数据预处理 6
3.3气象数据聚类 6
3.3.1月均降水量聚类 6
3.3.2月均风速聚类 9
3.3.3月均气温聚类 12
3.4聚类结果的总结与分析 15
四 总结与展望 16
参考文献 18
致谢 19
聚类算法在气象数据分析中的应用
樊超
,China
Abstract:Nowadays, with the development of China's meteorological industry, there are more and more weather stations. Every weather station observes new data every day. As time goes by, more and more meteorological data become available. How to find the characteristics between data in a large number of meteorological data and to make a great deal of meteorological data more valuable is the foundation and key to accurately predict weather, understand the general laws of meteorological changes, prevent disasters more effectively, and promote weather services to a new level.
Data mining technology can handle a great deal of data well. This article uses clustering techniques to process weather data. Based on the data set of ground-based annual value of 1989-2010 from 69 meteorological stations in Jiangsu Province, the weather data were preprocessed, and the K-means algorithm was used to analyze the weather data in Jiangsu. The results of clustering are divided according to regions and visualized. Finally, the clustering results are analyzed, and corresponding suggestions are made for urban construction, agricultural planting, and meteorological equipment planning and construction.
Key words:Data minging,Cluster analysis,Weather data analysis
一 绪 论
1.1 研究背景与意义
如今,各个领域都积累了大量的数据,随着计算机技术的发展,计算机处理数据的能力也大大增加,所以,计算机被广泛地应用到了各个领域的数据处理中。不过,随着数据积累的越来越多,如何从海量的复杂的数据里挖掘出对生产活动有指导意义的信息就显得尤为重要。于是数据挖掘便逐渐地发展了起来。
随着时间的推移,气象领域积累了大量的数据。气象数据在经济建设、科学研究和民生方面都有重要的意义。这些气象数据里都蕴含了大量的气象规律,于是人们利用数据挖掘来挖掘其中的隐藏的有用的信息,从而来研究气象规律,对人们的生产与生活做出指导;更加准确的来预测天气以及对气象变化的总规律的认识更加深刻,对灾害性天气的预防具有重要的意义。
1.2 国内外研究现状
将一组物理或抽象对象分成类似对象的类的过程称为聚类。聚类是数据挖掘中对数据进行分析的一种方法。数据聚类正在蓬勃发展,研究领域包括数据挖掘、统计学、机器学习、空间数据库技术、生物学和市场营销等领域。聚类分析由于数据量大,已成为数据挖掘领域中一个非常活跃的研究课题。
聚类分析已被广泛研究多年。在数据挖掘领域,研究集中在寻找适用于大型数据库高效聚类分析的方法。积极的研究主题集中在聚类方法的可伸缩性,复杂形式和数据类型的聚类方法的效率,高维聚类技术以及用于在大型数据库中混合数字和分类数据的聚类方法。
目前,国内外有许多学者采用数据挖掘来分析气象数据,并且将聚类分析运用到气象数据的分析上。Michael Steinbach 等人提出了用聚类来发现影响气候的主要因素的思想,用以分析海洋和大气对陆地气候的影响;张瑶等人将聚类技术用在黑龙江的气象数据处理中,利用降水量、温度、相对湿度等信息将黑龙江省13个主要地区进行划分;乔梁利用Apriori算法和决策树生成算法来进行气象数据的改进;张淑芬等人提出经典K-Means算法与Hadoop云计算平台结合的HKM算法并将其用于处理气象类数据上。
1.3 论文研究内容
本论文主要了解气象数据的基本构成和物理意义,了解数据挖掘的基本知识,学习并掌握一种数据挖掘方法并将其运用于气象数据分析中。利用经典的聚类算法来进行气象观测数据的分析,并进行实验,将实验所获得的结果进行分析、比较,挖掘出有价值的信息,从而对人们的生产生活作出指导。
1.4论文构成
本论文总共分为四章。第一章介绍研究背景以和意义、国内外研究现状以及论文的研究内容;第二章简要介绍数据挖掘的基本信息以及应用领域,介绍聚类分析的基本概念以及聚类分析算法的分类,最后详细介绍K-means的算法以及相关的缺点。第三章将K-means算法应用于气象数据分析中,对聚类的结果进行分析与总结。第四章对本论文作出相应的总结,提出不足之处。
二 聚类分析
2.1 数据挖掘简介
随着数据库和信息技术的发展,存储在各个服务器中的数据越来越多,如果对这些数据不加以分析与利用,这些数据便成了一个“数据沙漠”,这样,重要的决策常常不是基于数据库中的丰富的数据,而是基于决策者直观的感觉。数据和信息之间越来越大的差距要求开发数据挖掘工具,将数据沙漠变成知识“金矿”。
数据挖掘从狭义上来说是知识发现过程中的一个步骤(见图2.1)。知识发现过程由以下步骤:数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估和知识表示。
剩余内容已隐藏,请支付后下载全文,论文总字数:16800字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;