基于ARIMA模型与BP神经网络的雾霾污染预测分析

 2022-01-17 23:50:11

论文总字数:20318字

目 录

1 引言 1

1.1 研究背景和目的 1

1.2 国内外研究现状 1

2 方法介绍 2

2.1 聚类分析法 2

2.1.1 系统聚类法 2

2.1.2 K-means聚类法 3

2.1.3 聚类方法比较 3

2.2 时间序列模型 4

2.2.1 ARIMA模型 4

2.2.2 带自变量的ARIMA模型 4

2.3 BP神经网络 5

3 实证分析 6

3.1 数据来源及预处理 6

3.2 雾霾的聚类 6

3.3 PM2.5浓度预测 7

3.3.1 ARIMA模型对PM2.5浓度预测 7

3.3.2 带自变量的ARIMA模型对PM2.5浓度预测 9

3.3.3 BP神经网络对PM2.5浓度预测 11

3.4 模型的比较 12

4 讨论 13

5 结论 13

参考文献 14

致谢 16

基于ARIMA模型与BP神经网络的雾霾污染预测分析

廖晓颖

,China

Abstract:Based on the SO2, NO2, PM2.5, PM10, CO, O3 concentration and temperature data of China's provincial cities in 2014-2016, this paper first analyzed the pollution situation of each city, and divides the national air quality into four categories. Then the Autoregressive Integrated Moving Average (ARIMA) model, the ARIMA model with the independent variables, and the BP neural network model were established for the representative cities of the four categories, and the PM2.5 monthly and daily subsidence were predicted. The results show that most of the heavily polluted areas are concentrated in the North China region, and the fine areas are mainly distributed in the coastal areas; The ARIMA model can only make a short-term prediction with a large error; the prediction error of the ARIMA model with independent variables is reduced and the prediction period is increased, but the relevant variables need to be introduced for auxiliary prediction; And the BP neural network model adding temperature meteorological factors is built to improve the effectiveness and practicability, which is more suitable than the time series model in predicting pollutant concentration.

Key words:Haze; K-means Clustering; ARIMA Model; ARIMA Model with independent variables; BP neural network

1 引言

1.1 研究背景和目的

随着经济的飞速发展和城市人口的不断增加,特别是大型工业开发区的建设,我国乃至全球的大气环境污染情况愈趋严峻。于是人们逐渐意识到环境空气质量的重要性,将空气质量指数(Air Quality Index, AQI)作为衡量城市生活环境状况的一个主要因素。空气污染物的种类有很多,常见的有SO2、NO2、CO、O3和悬浮颗粒物等,现阶段PM2.5是雾霾的首要污染物。PM2.5意指空气动力学等效直径等于或小于2.5微米的大气颗粒物,这类颗粒物也被称为细微颗粒。PM2.5不仅会导致大气能见度降低[1, 2],还会对人们的身体健康带来一定的危害。大量流行病学研究表明,长期生活在含有较高浓度的PM2.5环境中,肺部病变或过早死亡的概率都会有所增加[3-5]。所以,我国在2012年《环境空气质量标准》中就已经新增PM2.5检测指标,用来认识和防范其危害。

环境空气质量关系到每一个人的身体健康,目前,我国环境所面临的突出问题仍是雾霾。空气质量监测部门可通过对PM2.5的预测,及时了解目前的空气质量状态及变化趋势,分析PM2.5的变化原因,并制定有效的预防和治理措施。对PM2.5质量浓度作出准确预测,不仅能研究人类活动对PM2.5质量浓度的影响,更有利于政府部门进行合理的规划,做出正确的决策,更好的为社会提供公共服务。同时,若能够及时获取精确的区域PM2.5质量浓度预测值,在一定程度上就能采取相应措施,避免或减轻空气污染对人体健康带来的影响。故对PM2.5质量浓度预测具有一定的必要性,对我国的可持续发展、公众身体健康具有十分重要的现实意义。

为此,本文基于全国的雾霾污染情况,对地区进行分类处理,不断优化预测模型,提高预测精度,为人工测算颗粒物、实时提供PM2.5预测值提供一种简便的计算方法,为社会活动及监管控制部门提供依据。

1.2 国内外研究现状

目前,国内有许多学者致力于研究城市空气污染浓度的预测模型。高会旺等[6]利用近5年的空气污染指数对中国73个城市进行了聚类分析和趋势分析。朱亚杰等[7]运用贝叶斯法建立了时空预测模型,对京津冀区域的PM2.5浓度进行预测,预测结果较精确。周国亮等[8]建立多层前向神经网络数学模型对上海市的空气质量状况指标进行评价,模型得到较高的评价标准,具有较低的误差率。杨云等[9]采用遗传算法优化的神经网络对宝鸡市PM2.5的小时浓度进行预测,得到采用遗传算法优化的BP神经网络比传统的神经网络的预测结果更具有准确度。于宗艳等[10]采用免疫粒子群算法对大气污染损害公式的参数进行寻优,得到了环境空气质量评价模型,但未进行预测。秦侠等[11]建立传统的神经网络对PM2.5的小时浓度进行预测,并讨论了扩大样本集、在输入向量中加入气象变量等因素对建模所产生的影响。李嵩等[12]利用主成分分析法对大气PM2.5污染指数的各种影响因素进行分析,在建立BP神经网络模型的基础上采用遗传算法对模型参数寻优,最终获得准确的预测结果。

在国外的研究中,Misiti等[13]基于相关气象变量和PM10历史浓度数据,建立混合线性回归模型对日均PM10浓度进行预测。Thomas和Jacko[14]考虑了气象因素、交通因素和污染物的历史浓度数据,建立回归模型和神经网络模型对PM2.5和CO的浓度进行了实时预测,相对于确定性模型而言,这两个模型计算更简便,需要的变量更少。UI-Saufie等[15]利用其他污染物变量和气象变量,分别建立多元线性回归模型和人工神经网络模型对马来西亚槟城的PM10浓度进行预测,认为神经网络的预测效果更好。Lu等[16]建立了神经网络模型,并通过粒子群算法进行改进,对香港中部的污染物水平进行预测,结果表明该模型能够实时有效地预测空气质量问题。Voukantsis等[17]结合主成分分析法和人工神经网络模型对PM10及PM2.5的日均值进行了预测,取得了较好的预测结果。Dimitriou和Kassomenos[18]利用多元回归分析对PM2.5的浓度进行了预测分析,得到当地PM2.5浓度有50%的贡献率来自于本地排放,并且预测效果良好。

然而这些研究仍存在以下不足之处:第一,国内研究大都只限于小时的预测,没有详细的月浓度和日浓度的预测,因而其预测应用的意义不大;第二,当前对于污染物的时间序列预测主要集中在传统的时间序列模型上,并没有仔细研究传统时间序列模型的改进。

为此,本文基于各城市的实际污染情况,选取合适的污染指标进行聚类分析,将31个城市分为“重度污染”、“轻度污染”、“良”、“优”四类,进一步分别建立差分自回归移动平均(Autoregressive Integrated Moving Average, ARIMA)模型、带自变量的ARIMA模型和BP神经网络模型,对每一类代表城市的PM2.5浓度进行预测,并对模型的预测效果进行比较分析。

2 方法介绍

2.1 聚类分析法

聚类分析是数据挖掘最重要的算法之一,它通过分析个体之间的相似度,基于最大化类内同质性和类间异质性的准则,对数据集进行分类,在金融投资、大气环境、医疗生物等领域具有广泛应用[19-21]。在目前实际应用中,系统聚类法和K-means聚类法是聚类分析中最常用的两种方法。

2.1.1 系统聚类法

系统聚类又是两种方法中用的较多的一种,其详细过程如下:

剩余内容已隐藏,请支付后下载全文,论文总字数:20318字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;