1.一种基于时空图表示学习的交通事故预测方法,其特征在于,包括如下步骤:(1)根据传感器网络构建交通路网的邻接矩阵,并获取原始交通数据,对原始交通数据进行筛选和统计得到区域的速度、容量和占有率;
(2)对交通事故数据进行清洗,从原始交通数据中获取事故发生前的交通数据,并对数据进行归一化构建路网的特征矩阵;
(3)构建基于时空图表示学习的交通事故预测模型,通过模型的时空图卷积模块捕获交通数据中的时空动态关联,并通过模型的变分图自编码器将高维的交通数据表征为低维交通状态,以此提高模型拟合能力;其中构建基于时空图表示学习的交通事故预测模型时,将交通路网定义成一个无向图结构,G=(V,E,A);|V|=N代表节点的总数;E代表节点之间的连接,其中节点指的是传感器; 是包含了交通网络拓扑信息的邻接矩阵,其中Ai,j为1表示节点i和j相连,Ai,j为0代表不连通;传感器每隔固定的时间长度收集当前状态的交通数据,交通数据包括流量,占有率,速度; 代表节点i在t时刻下的特征,代表t时刻下所有节点的特征; 代表T时间段下所有特征;通过将邻接矩阵和特征矩阵输入到基于时空变分图自编码器中,获取低维的交通状态表征,并将其输入到一个卷积神经网络中预测未来时刻交通事故发生的概率;
通过时空图表示学习方法实现交通数据到交通状态的转换,即X→Z,Z为输出低维时变表示向量,即交通状态;其中编码器定义如下:其中,gθ表示卷积核,θ表示多项式系数的向量,gθ*表示图卷积操作,x∈X表示交通信息, I表示单位矩阵,度矩阵D=ΣjAij是对角矩阵,λmax是L的最大值,A是邻接矩阵;Tk是k阶Chebyshev递推多项式,在空间维度上对图的每个节点捕捉相邻信息的图卷积操作之后,利用时间维度标准卷积,通过合并相邻时间片上的信息来更新节点的信息:l T
h=ReLU(Φ*(ReLU(w·gθ*x)+b))
l
其中,h表示第l个时空卷积块的输出,ReLU代表激活函数,Φ表示时间卷积核参数,Φ*()表示时间卷积操作,w表示模型的权重,b表示模型的偏置,x∈X表示交通信息;因此第l+
1个卷积块的输出可以被重写为:
l+1 T l
h =ReLU(Φ*(ReLU(w·gθ*h)+b))
l+1
其中,h 是第l+1个卷积块的输出,其他参数同上;使用两个时空图卷积模块将时空图l+1进行表征,表征向量h 组成新的特征矩阵X,交通状态Z可以通过如下方式得到:μ=GCNμ(X,A)
logσ=GCNσ(X,A)
2
Z~N(μ,σ)
其中,A是邻接矩阵,GCN()是图卷积操作,μ是分布的均值,σ是分布的方差,从均值和方差形成的分布中采样得到了事故发生前交通状态Z;在得到表征向量后,通过点乘的解码器来重构邻接矩阵,以保证编码器能够准确的表征交通中的时空信息;编码器定义为:T
其中,Z是Z是转置矩阵,代表重构后的邻接矩阵;编码器和解码器被定义为:2
其中,q(zi|X,A)=N(zi|μi,diag(σ)),q是编码器的输出,X是特征矩阵,A是邻接矩阵,2
zi∈Z是编码器表征后的变量,μi∈μ是编码后变量分布的均值,diag(σ)是编码后分布的方T差,代表分布的均值;p(Ai,j=1|zi,zj)=Sigmoid(ZZ),p是解码器的输出,即重构后的邻接矩阵,A是邻接矩阵,zi,zj∈Z是编码器表征后的向量;
基于时空变分图自编码器的损失函数分为两个部分,第一是计算原始邻接矩阵A和重构的邻接矩阵 之间的二元交叉熵,第二部分是计算q(Z|X,A)和p(Z)之间的KL距离,即KL‑divergence,如下所示:Lossvgae=Eq(Z|X,A)[log p(A|Z)]‑KL[q(Z|X,A)||p(Z)]其中E是计算原始的邻接矩阵和重构的邻接矩阵之间的二元交叉熵,p(Z)=ΠiN(0,I)代表方差为I的正态分布,KL是计算表征后的交通状态和正态分布之间的距离;通过基于时空图表示学习的交通事故预测模型得到交通状态的表征后,将表征向量用于交通事故预测,即通过一层卷积层和全连接层,得到未来时间片上发生交通事故的概率,如下所示:其中,Z是时空变分图自编码器表征后的向量,是发生的事故概率;Φ表示时间卷积核参数,Φ*()表示时间卷积操作,w表示模型的权重,b表示模型的偏置;
(4)对交通事故预测模型进行训练,优化模型中的参数以获得最优的交通事故预测模型,从而获得最优的交通事故预测效果。
2.根据权利要求1所述的一种基于时空图表示学习的交通事故预测方法,其特征在于:所述步骤(2)清洗数据时,利用正则化方法处理错误数据,以防止模型过拟合;通过在训练的目标函数中加入L1惩罚项以降低神经网络模型的复杂程度,从而自动降低其对噪声数据的关心程度;并对数据进行归一化处理,归一化公式如下式所示:其中,xi是原始交通数据,min(x)是历史数据中的最小值,max(x)是历史数据中的最大值;通过线性归一化后使得数据较为均匀地分布在[0,1]之间。
3.根据权利要求1所述的一种基于时空图表示学习的交通事故预测方法,其特征在于:所述步骤(4)中对模型中的参数进行调优以获得最优的交通事故预测模型,其中参数包括网络结构参数和学习算法参数,通过学习获得的最终优化参数为:VGAE学习速率为1e‑3;
CNN学习速率为1e‑3;卷积块个数为2个;空间卷积块输出特征维度为64;时间卷积块输出特征维度为32;图卷积输出特征维度为1;训练轮数为50;每轮学习数为2400;基于时空图表示学习的神经网络模型采用图卷积神经网络模型和标准卷积网络组成;网络共有10层;第一层是图卷积网络,输出特征维度为64,第二层是卷积核为1×5的标准卷积网络,第三层是卷积核为1×5的残差网络,第四层是输出维度为32的图卷积网络,第五层是卷积核为1×5的标准卷积网络,第六层是卷积核为1×5的残差网络,第7、8层输出维度为1图卷积网络,用于生成表征向量;第9层是卷积核为10的标准卷积网络,第10层是输出层包含55个神经元的全连接网络。