1.一种基于大数据的城市区域客流量预测方法,其特征在于,包括:建立城市区域客流量预测模型,训练建立的城市区域客流量预测模型,采用训练完成的城市区域客流量预测模型对城市区域客流量进行预测,得到预测结果;
所述城市区域客流量预测模型,包括:AutoFM模块、基于注意力机制的双通道LSTM模块、基于转移权重的卷积神经网络模块、基于树模型的特征选择模块;
所述城市区域客流量预测模型的训练过程,包括:
S1:对原始数据进行处理,按照特征类型,将数据划分为属性特征,时间特征和空间特征;
S2:将属性特征Fa输入AutoFM模块,将属性特征经过One‑Hot编码变成向量特征,向量特征通过自适应特征交互,得到交叉属性特征F′a;
向量特征通过自适应特征交互,得到交叉属性特征F′a,包括:
其中,F′a表示交叉属性特征,Fa表示属性特征,w0、wi分别表示AutoFM模块的初始可学习权重和第i阶段可学习权重,Fai和Faj分别表示Fa中第i个特征和第j个特征,vi、vj分别表示Fai和Faj的隐向量,Pi(i∈[1,n])表示当前特征最优自动范式,n表示属性特征Fa包含的特征总量;
S3:将交叉属性特征F′a分别与时间特征Ft和空间特征Fs进行拼接送入基于注意力机制的双通道LSTM模块和基于转移权重的卷积神经网络模块,提取到卷积时间特征F′t和卷积空间特征F′s;
S4:将交叉属性特征F′a、卷积时间特征F′t和卷积空间特征F′s送入基于树模型的特征选择模块进行客流量预测,得到客流量预测,并采用平均绝对值误差计算损失值进行梯度回传,完成模型训练。
2.根据权利要求1所述的一种基于大数据的城市区域客流量预测方法,其特征在于,通过基于注意力机制的双通道LSTM模块提取卷积时间特征F′t,包括:将attention机制加入双通道LSTM中,将交叉属性特征F′a与时间特征Ft拼接后输入双通道LSTM中,通过attention机制区分提取长期时间特征和突发事件特征,通过筛选函数对突发事件特征进行筛选,将筛选出来的突发事件特征与长期时间特征进行融合,得到融合后的卷积时间特征F′t。
3.根据权利要求2所述的一种基于大数据的城市区域客流量预测方法,其特征在于,拼接后的特征采用双通道LSTM区分提取长期时间特征和突发事件特征,包括:长期时间特征:
f长期时间=Mm,i∈[1,m]
突发事件特征:
f突发事件=Nm,i∈[1,m]
其中,f长期时间表示长期时间特征,f突发事件表示突发事件特征,Mi表示第i步LSTMcell1输出的隐藏状态,Ni表示第i步LSTMcell2输出的隐藏状态,LSTMcell1和LSTMcell2分别表示LSTM的通道1和通道2, 表示第i步通道1的细胞状态, 表示第i步通道2的细胞状态,xi‑1表示拼接后的特征x在双通道LSTM中第i‑1步的特征向量,attention()表示注意力机制。
4.根据权利要求2所述的一种基于大数据的城市区域客流量预测方法,其特征在于,通过筛选函数对突发事件特征进行筛选,包括:f′突发事件=mask·f突发事件
其中,f′突发事件表示筛选出来的突发事件特征,f突发事件表示突发事件特征,mask表示筛选矩阵,tanh表示双曲正切函数,max_num表示设定的异常阈值,func表示筛选函数。
5.根据权利要求2所述的一种基于大数据的城市区域客流量预测方法,其特征在于,将筛选出来的突发事件特征与长期时间特征进行融合,包括:F′t=k1f′突发事件+k2f长期时间
其中,F′t表示卷积时间特征,k1、k2分别表示突发事件特征与长期时间特征的可学习权重,f′突发事件表示筛选后的突发事件特征,f长期时间表示长期时间特征。
6.根据权利要求1所述的一种基于大数据的城市区域客流量预测方法,其特征在于,通过基于转移权重的卷积神经网络模块进行空间特征F′s提取,包括:将交叉属性特征F′a与空间特征Fs拼接后的特征输入基于转移权重的卷积神经网络模块的CNN层并结合均值池化,得到空间区域特征f1;
所述空间区域特征f1,表示为:
f1=meanpooling(ReLU(conv(Input)))其中,meanpooling表示均值池化,ReLU表示线性整流函数,conv表示卷积层,Input表示输入的将交叉属性特征F′a与空间特征Fs拼接后的特征;
采用转移权重矩阵表示客流量的移动方向,得到可学习参数矩阵空间表示的空间趋势特征f2,f2中元素(i,j)表示第i个地点到第j个地点的移动概率;
所述空间趋势特征f2,表示为:
T
f2=f1‑f1
T
其中,f1表示空间区域特征,f2表示空间趋势特征,f1表示f1的转置;
将f2与f1按位相乘,并提取i行和i列的向量进行拼接得到卷积空间特征F′s,i表示当前样本的地点;
将f2与f1按位相乘,并提取i行和i列的向量进行拼接得到F′s,表示为:F′s=[[f1·f2]...i;[f1·f2]i...]
其中,F′s表示卷积空间特征,[;]表示拼接,[f1·f2]i...表示i行,[f1·f2]...i表示i列。
7.根据权利要求1所述的一种基于大数据的城市区域客流量预测方法,其特征在于,将属性特征F′a、卷积时间特征F′t和卷积空间特征F′s送入基于树模型的特征选择模块进行客流量预测,得到客流量预测,包括:将属性特征F′a、卷积时间特征F′t和卷积空间特征F′s送入树模型LightGBM中进行特征分裂,根据特征分裂结果结合属性特征、时间特征和空间特征的类别,得到每一类特征的平均特征重要性(w1,w2,w3);
将每一类特征的平均特征重要性与交叉属性特征F′a、卷积时间特征F′t和卷积空间特征F′s进行交互,并通过线性层得到预测结果。
8.根据权利要求7所述的一种基于大数据的城市区域客流量预测方法,其特征在于,将平均特征重要性与属性特征F′a、时间特征F′t和空间特征F′s进行交互,并通过线性层得到预测结果,包括:output=c4[tanh(c1w1F′a+t1),tanh(c2w2F′t+t2),tanh(c3w3F′s+t3)]+t4其中,output表示输出的预测结果,tanh表示双曲正切函数,F′a表示交叉属性特征,F′t表示卷积时间特征,F′s表示卷积空间特征,c1表示交叉属性特征权重,w1表示属性特征重要性,t1表示属性特征偏置,c2表示卷积时间特征权重,w2表示卷积时间特征重要性,t2表示卷积时间特征偏置,c3表示卷积空间特征权重,w3表示卷积空间特征重要性,t3表示卷积空间特征偏置,t4表示总偏置,c4表示总权重。