1.一种基于LSTM网络和深度增强学习的多目标跟踪方法,其特征在于,包括以下步骤:(1)采用目标检测器对待测视频中的每一帧图像进行检测,输出检测结果,设t时刻对应图像的检测结果为集合 为t时刻对应图像第j个检测结果,N为检测总数量;
(2)构建多个基于深度增强学习技术的单目标跟踪器,每个单目标跟踪器包括卷积神经网络和全连接层,所述卷积神经网络构建在VGG-16网络的基础上,输出每个单目标跟踪器的跟踪结果,设t时刻对应图像的跟踪结果为集合 为t时刻对应图像第i个单目标跟踪器的输出结果,M为t时刻能同时跟踪的目标总数;
所述步骤(2)中单目标跟踪器输出跟踪结果的具体方法如下:
基于深度增强学习技术的单目标跟踪器是将每个目标看作一个智能体,利用深度增强学习技术对该智能体进行训练,每个智能体根据自身状态和环境给出的反馈决定动作;
t时刻的动作at为七维向量,七维向量包括水平两个方向的运动、垂直两个方向的运动、尺寸变化及终止搜索动作,设t时刻状态向量为st=(pt,vt),vt是历史动作的向量,pt为t时刻的跟踪目标图像块,t+1时刻的状态向量st+1=(pt+1,vt+1)由t时刻状态st=(pt,vt)决定,pt+1为t+1时刻的跟踪目标图像块,根据状态转换方程为pt+1=ft(pt,at)和动作变化方程vt+1=fv(vt,at)由t时刻的动作及t时刻的状态向量预测t+1时刻的状态向量;
在训练的过程中,智能体会收到一个反馈信号rt,在跟踪过程中的每个迭代时刻,rt=
0,当在终止时刻T选择终止搜索动作时,反馈信号rT是交并比IoU的阈值函数:
其中,IoU(pT,g)=area(pT∩g)/area(pT∪g);g为图像块的真实值,即人工标定的目标的真实位置;τ是人工设定的阈值,pT是终止时刻T的跟踪目标图像块;
(3)根据步骤(1)的 和步骤(2)的 计算数据关联的相似矩阵
是 和 之间的欧几里得距离,
(4)基于LSTM网络构建数据关联模块,输入相似矩阵 得到分配概率向量
为第i个目标和所有可能的目标检测结果之间的匹配概率, 是第i个目标和检测结果j之间的匹配概率,得到的匹配概率最大的目标检测结果作为第i个目标的跟踪结果。
2.根据权利要求1所述的基于LSTM网络和深度增强学习的多目标跟踪方法,其特征在于,步骤(1)中的目标检测器采用YOLO V2。
3.根据权利要求1所述的基于LSTM网络和深度增强学习的多目标跟踪方法,其特征在于,步骤(1)中采用目标检测器输出的检测结果和步骤(2)中目标跟踪器的输出结果均为四维向量, 其中,(x't,y't)为目标检测器中目标跟踪矩形框的中心坐标,w't为目标检测器中目标跟踪矩形框的宽,h't为目标检测器中目标跟踪矩形框的高;(xt,yt)为单目标跟踪器中目标跟踪矩形框的中心坐标,wt为单目标跟踪器中目标跟踪矩形框的宽,ht为单目标跟踪器中目标跟踪矩形框的高。
4.根据权利要求1所述的基于LSTM网络和深度增强学习的多目标跟踪方法,其特征在于,步骤(4)中LSTM网络包括输入参数:第i步隐藏状态hi、第i步细胞状态ci、相似矩阵输出参数第i+1步隐藏状态hi+1、第i+1步细胞状态ci+1、分配概率向量首先对隐藏状态hi、细胞状态ci进行初始化,逐步输入第i步隐藏状态hi、第i步细胞状态ci及相似矩阵 输出第i+1步隐藏状态hi+1、第i+1步细胞状态ci+1及