SVM在大气臭氧预报中的应用

 2022-01-20 00:17:17

论文总字数:22522字

目 录

摘要 1

Abstract 2

1.引言 3

1.1 选题的目的及原因 3

1.2 国内外研究现状 3

1.3 研究内容与意义 5

2.实验与方法 5

2.1 观测数据与地点 5

2.2 支持向量机(SVM)方法简介 5

2.2.1 SVM回归方法 6

2.2.2 划分最优回归超平面 6

2.2.3确定非线性回归函数 7

2.3 LIBSVM工具箱简介 8

3.结果与讨论 9

3.1 训练预报模型 9

3.2 输入不同时长的过去臭氧浓度值对两种核函数下预报结果的影响 10

3.3 不同输入变量对两种核函数下预报结果的影响 12

3.3.1 不同输入变量与臭氧的关系 12

3.3.2 输入变量对两种核函数下预报精度的影响 15

4.结论 17

参考文献 18

致谢 21

SVM回归算法在臭氧预报中的应用

张玮航

, China

Abstract: In this research, the Support Vector Machine regression algorithm based on radial basis function and polynomial function is introduced into the prediction of ozone concentration. With the O3, NO, NOx, CO and other meteorological data from May 2016 to August 2016 from the observation site in Nanjing University of Information Science amp;Technology, we established SVM regression forecasting model based on both two kernel function, which we used to forecast the ozone concentration in September, 2016, and we compared the predicted ozone value with the observed one, and we also carried out a discussion about the effect of different input variables exert to the prediction. The results shows: we can obtain the best prediction model when we take all the physical quantities which correlated to O3 value—— NO, NOx, CO, Temperature, Wind Speed, Wind Direction, Solar Radiation, Quantity of Precipitation, Relative humidity and the Ozone concentration and Temperature in previous two hours—— as the input variables. The model based on the two kernel functions can both obtain desired prediction result. And compared the observed value with the predicted value obtained from the SVM regression model based on the kernel function of radial basis function, the mean error is 1.01, the mean absolute percentage error is 0.45, the correlation coefficient is 0.90, and the root mean square error is 9.87. Comparing the observed value with the predicted value obtained from the SVM regression model based on the kernel function of polynomial function, the mean error of it is 3.43, the mean absolute percentage error is 0.62, the correlation coefficient is 0.89, and the root mean square error is 11.61. The prediction results based on polynomial function are conservative to some extent, and the prediction based on the radial basis function is more accuracy.

Key words: Ozone concentration; Support Vector Machine; Regression algorithms1.引言

1.1 选题的目的及原因

近年来,随着我国科技的进步、经济的发展、人口及机动车数量的激增、能源结构的转型,全国许多地区空气质量不断下降,雾霾天气频繁出现,大气污染问题越来越受到人们的关注。臭氧(O3)是大气中重要的微量组分之一,其中约90%的O3主要集中在10-30km的平流层中,平流层臭氧能够吸收宇宙射线,对于保护地球生物圈有重要意义,因此平流层O3常被称为“好臭氧”。而对流层O3大约仅占大气中总臭氧浓度的10%,而正是这10%的O3,尤其是高浓度O3对动植物及生态环境有着极强的破坏作用:众所周知,对流层内的臭氧是一种非常重要的温室气体,它的浓度与地表温度密切相关[1];臭氧也是一种强氧化剂,在许多大气化学过程中都扮演重要角色,如促进SO2的氧化及氮氧化物的转化、促进酸雨形成、形成光化学烟雾等;更重要的是,对流层O3尤其是近地面O3对人类健康[2]、地表植被[3]和建筑[4]都有很大的危害,所以对流层O3常被称为“坏臭氧”。近年来,对流层臭氧成为世界上各大城市的重要污染物之一[5],越来越受到各国政府、研究机构、社会团体及广大人民群众的广泛关注。因此,为了保护人民的身体健康、保护我们赖以生存的环境、实现健康可持续发展,重视大气臭氧浓度的预报工作是很有必要的。

众所周知,臭氧并不是被直接排放到大气中的,而是在光照及稳定的气象条件下,由交通运输、石油化工、火力发电及生物质燃烧等排放的氮氧化物(NOx)和挥发性有机化合物(VOCs)以及一氧化碳(CO)、碳氢化合物等进行十分复杂的光化学反应而形成的二次污染物[6-7], 表现为十分显著的非线性。处理臭氧建模的传统方法是基于对气象和臭氧前体物的光化学过程的模拟[8],由于缺乏对这些过程的认识,气象场、排放源、下垫面及光化学反应的对臭氧浓度的影响又增加了臭氧建模的不确定性[9]。因此选用一个可靠、精确的建模方法对臭氧预报来说是至关重要的。

1.2 国内外研究现状

随着数值预报技术的迅猛发展和广泛应用,如何从海量信息源中获取所需的可用于预报的关键要素越来越成为研究人员必须面对的重要实际问题,这个问题可通过机器学习得以解决。当我们面对大量数据进行建模时,统计分析方法通常是我们使用的主要方法。然而传统的统计学方法是基于大数定律的,在理论上只有当样本数量趋于无穷大时才得以成立,而我们在实际业务中的样本数量通常是有限的,因此很难通过传统的统计方法取得理想的效果。

因此,黄嘉佑、谢庄[10]和陆如华等[11]将多元线性回归(Multiple Linear Regression,简称MLR)方法和卡尔曼滤波(Kalman Filter,简称KF)方法应用到预报业务中,Lengyel, et al. [12]将主成分回归法(Principle Component Regression,简称PCR)和最小二乘回归(Partial Least Regression,简称PLR)相结合运用到匈牙利米什科尔茨地区的空气质量的监测和预报中去。然而线性相关是上述方法成立的基础,因此在处理非线性气象要素的预报中有很大的局限性。上世纪末,Yi amp; Prybutok[13]、Prybutok[14]等将人工神经网络(Artificial Neural Networks,简写为ANNs)方法,尤其是多层感知机(Multilayer Perceptron,简称MLP)运用到臭氧预报中去,这种方法具有很强的处理非线性关系的能力,较强的泛化能力使该方法能够为给定的输入变量产生精确的输出预报值。然而,实际数据中的噪声在很大程度上破坏了人工神经网络方法的准确性,且人工神经网络方法还有一个很大的不足在于它很难进行参数寻优,即使人为移除数据中的噪声,人工神经网络方法也会因为难以进行参数寻优而影响其准确性[15]。同时建模过分依赖人工建模技巧、计算量巨大、学习过拟合等也都是人工神经网络方法目前存在着的缺点[16],因而在实际业务中我们使用人工神经网络方法很难取得理想的预报效果。

在这种情况下,由Vapnik等[16]提出的一种新的智能机器学习方法——支持向量机(Support Vector Machine,简称SVM)方法被普遍认为是一个针对小样本的分类、回归等非线性问题的极佳理论,能够很好的处理气象领域中的非线性问题,如气温、降水、冰雹、雷暴等气象要素或天气现象的预报。陈永义[17]、冯汉中[18]等将SVM分类和回归方法首次应用于气象预报实验,结果显示SVM方法模型对非线性的气象要素有良好的预报能力。此后针对SVM在预报中的应用,国内外开展了一系列研究。马晓光、胡非等[19]首次结合相空间技术将SVM方法应用于大气污染物浓度预报;吴爱敏等[20]分别将SVM方法应用于风速[21-22]和冰雹等气象要素及天气的预报。此外,SVM方法还在风速预报、大雾预报[23]、天空云量预报[24-25]、霾识别和能见度预报[26]及热带气旋路径预报[27]等业务中表现出较强的应用能力。

剩余内容已隐藏,请支付后下载全文,论文总字数:22522字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;