1.一种基于CNN‑LSTM的铁路区域货运量短期预测方法,其特征在于:包括如下步骤:步骤一、建立影响因素数据仓库,影响因素包含内部影响因素和外部影响因素,其中:内部影响因素来源于指铁路货运系统内部,包括铁路基础设施建设、经营管理水平、铁路从业人员数量、铁路货运运价;外部影响因素包括宏观经济、区域经济、大宗商品、交通运输结构;
步骤二、确定关键影响因素;
步骤三、对关键影响因素数据与货运量数据进行预处理,并将预处理后的数据进行训练集和测试集的划分;
步骤四、构建基于CNN‑LSTM的铁路区域货运量近短期预测模型,设置模型初始参数值,使用训练集对模型进行超参数优化,得到最优模型;其中,基于CNN‑LSTM的多变量铁路货运量近短期预测模型的基本结构包括输入层、隐含层以及输出层;首先,将数据组织为模型能够识别的形式并通过输入层导入模型;随后核心部分隐含层进行处理,其中CNN层解析货运量与其影响因素之间的关联特征,继而LSTM层提取时序数据在时间维上的特征;然后通过Dense层增加模型的复杂度,并将数据从高维映射到低维,保留有用信息;同时,在每层之后连接一个Dropout层用于增强模型的鲁棒性并防止模型过拟合;最后,通过输出层输出预测值;模型的输入为货运量xt、xt‑1、…、xt‑λ+1和关键影响因素所构成的二维矩阵,且二维矩阵大小为(λ,k+1);使用训练集对模型进行超参数优化的方法包括如下步骤:第一步,确定卷积核大小以及池化方式;
第二步,初始化CNN‑LSTM模型的权值和偏置;
第三步,将训练集数据导入CNN‑LSTM模型,使用前向传播算法计算模型输出结果;
第四步,计算模型的输出结果与真实值之间的误差;
第五步,依据误差使用后向传播算法计算梯度;
第六步,根据梯度大小对参数进行更新;
第七步,重复第三步至第六步,直到满足训练结束条件;
步骤五、将测试集导入训练好的最优模型,输出预测结果并评估模型质量。
2.根据权利要求1所述的基于CNN‑LSTM的铁路区域货运量短期预测方法,其特征在于:步骤二所述确定关键影响因素的方法为:
(1)构建反应系统特征的参考数列和影响系统特征的比较数列,并进行无量纲化处理;
(2)计算每个比较数列与参考数列在每个时刻的关联系数;
(3)计算每个比较数列与参考数列在整个时段集合的关联度;
(4)将关联度进行排序并剔除关联度值低于设定值的比较数列,最终得到关键影响因素。
3.根据权利要求1所述的基于CNN‑LSTM的铁路区域货运量短期预测方法,其特征在于:步骤三所述对关键影响因素数据与货运量数据进行预处理的方法包括:数据降噪、数据重采样、数据拼合、归一化。
4.根据权利要求3所述的基于CNN‑LSTM的铁路区域货运量短期预测方法,其特征在于:数据重采样时以宽度为7、步长为1的滑动时间窗对日货运量数据进行滑动采样。
5.根据权利要求3所述的基于CNN‑LSTM的铁路区域货运量短期预测方法,其特征在于:归一化时采用min‑max法对原始数据列进行无量纲化处理。
6.根据权利要求1所述的基于CNN‑LSTM的铁路区域货运量短期预测方法,其特征在于:将预处理后的80%的数据作为训练集,20%的数据作为测试集。
7.根据权利要求1所述的基于CNN‑LSTM的铁路区域货运量短期预测方法,其特征在于:评估模型质量的指标包括:
1)按如下公式计算的均方根误差RMSE:其中, 为货运量的预测值,yi为货运量的真实值,n为样本个数;
2)按如下公式计算的平均绝对误差MAE:2
3)按如下公式计算的决定系数R:
其中, 为货运量真实值的均值;
4)按如下公式计算的可解释方差EVS:
其中,Va*表示方差。