1.一种基于神经网络的PM2.5逐小时预测方法,其特征在于,包括以下步骤:(1)获取气溶胶光学厚度AOD数据、ECMWF气象数据、地基数据及辅助数据;所述的地基数据包括大气边界层高度BLH和地基站点PM2.5浓度;所述的辅助数据包括位置参数和时间参数;所述的ECMWF气象数据包括温度、风速、湿度、臭氧浓度;
(2)将温度、风速、湿度插值为气溶胶光学厚度AOD数据的同一分辨率,得到修正温度、修正风速、修正湿度;
(3)选取修正温度、修正风速、修正湿度、大气边界层高度BLH、辅助数据和气溶胶光学厚度AOD数据进行预处理得到包括修正温度、修正风速、修正湿度、大气边界层高度BLH、辅助数据的输入数据、包括气溶胶光学厚度AOD数据的输出数据组成第一训练样本;
(4)基于深度神经网络构建AOD填补模型,利用第一训练样本中输入数据作为AOD填补模型的输入,以输出数据作为AOD填补模型的输出,训练AOD填补模型,得到参数调优后的AOD填补模型;
(5)将修正温度、修正风速、修正湿度、大气边界层高度BLH、辅助数据输入至参数调优后的AOD填补模型中,预测并补全气溶胶光学厚度AOD数据缺失值;
(6)对步骤(5)补全后的气溶胶光学厚度AOD数据、修正温度、修正风速、修正湿度、臭氧浓度、大气雾霾层高度HLH、辅助数据、地基站点PM2.5浓度进行预处理得到包括补全后的气溶胶光学厚度AOD数据、修正温度、修正风速、修正湿度、臭氧浓度、大气雾霾层高度HLH、辅助数据的输入数据、包括地基站点PM2.5浓度的输出数据组成第二训练样本;所述的大气雾霾层高度HLH根据雷达参数修正大气边界层高度BLH得到,修正公式为:HLH=BLH×(α+α×β)
α为雷达实测后向散射系数在大气边界层内的积分与假设大气边界层内气溶胶均匀分布时的积分之比;β为雷达实测后向散射系数在大气边界层上方到洁净大气范围内的积分与大气边界层内的积分之比;
(7)根据深度神经网络构建学习模型,利用第二训练样本中的输入数据作为学习模型的输入,输出数据作为学习模型的输出,训练学习模型,并采用集成学习bagging算法集成每轮训练的学习模型得到PM2.5预测模型;
(8)将待测地区补全后的气溶胶光学厚度AOD数据、修正温度、修正风速、修正湿度、臭氧浓度、大气雾霾层高度HLH、辅助数据输入至PM2.5预测模型中,经计算输出待测地区的PM2.5浓度。
2.根据权利要求1所述的基于神经网络的PM2.5逐小时预测方法,其特征在于,所述的预处理方法为:每个训练样本中,输入数据和输出数据进行时空匹配后,再将输入数据中每类数据单独进行标准化处理。
3.根据权利要求2所述的基于神经网络的PM2.5逐小时预测方法,其特征在于,所述的标准化处理方法为:X=(x‑μ)/σ,x为输入数据,μ为输入数据的均值,σ为输入数据的标准差,X为标准化的输入数据。
4.根据权利要求1所述的基于神经网络的PM2.5逐小时预测方法,其特征在于,所述的深度神经网络为由结构镜像的编码器和解码器组成的自编码器;其中,编码器的每一层输出与解码器相应层的输出连接,形成残差结构。
5.根据权利要求4所述的基于神经网络的PM2.5逐小时预测方法,其特征在于,所述的编码器和解码器的每层采用神经网络层。
6.根据权利要求5所述的基于神经网络的PM2.5逐小时预测方法,其特征在于,所述的编码器与解码器分别包括4层神经网络层,包含的神经元节点个数分别为128、64、32、16。
7.根据权利要求1所述的基于神经网络的PM2.5逐小时预测方法,其特征在于,步骤(4)中,所述的训练方法为:每三周数据进行一次训练,第一周加入时间指数‑1,第二周加入时间指数0,第三周加入时间指数1,第二周作为训练周,训练AOD填补模型。
8.根据权利要求7所述的基于神经网络的PM2.5逐小时预测方法,其特征在于,所述的训练参数为:迭代轮数epoch:100,学习率lr:0.001,batch_size:1024,weight_decay:
0.005。
9.根据权利要求1所述的基于神经网络的PM2.5逐小时预测方法,其特征在于,在第二训练样本中随机挑选80%的数据用于训练学习模型,该过程进行100次迭代,可以得到100个学习模型的集成,将100个学习模型取均值得到PM2.5预测模型。