1.一种基于行人搜索的目标追踪样本扩充方法,其特征在于:包括如下步骤:(1)输入视频流数据;
(2)使用行人搜索网络进行样本扩充,包括如下步骤:
(21)将视频流中目标追踪网络的追踪目标同时设定为行人搜索网络的搜索目标;
(22)当目标追踪网络的目标追踪正确率低于90%时,每隔n帧对行人搜索网络的搜索目标进行采样;
(23)将采样结果按时间顺序保存至扩充样本集C={ct,ct-1,ct-2,…}中,ct表示t时刻的样本帧;
(3)运行目标追踪网络:
情况①:若目标追踪网络的目标追踪正确率低于90%,根据强化学习策略,将扩充样本集扩充至目标追踪网络样本集中,优化当前的目标追踪网络;所述强化学习策略具体为:(41)初始化:目标追踪网络样本集为U,动作集A={a0,a1,a2,a3,…},动作ai表示将扩充样本集中最新的im个样本帧扩充至U中,即 动作ai的奖赏值为rai,{rai}=0,m为正整数;进入步骤(42);
(42)跟踪目标追踪网络的目标追踪正确率:若低于90%,则进入步骤(43);否则,进入步骤(42),即持续跟踪目标追踪网络的目标追踪正确率,直至发现低于90%;
(43)执行max{rai}对应的动作ai,即执行奖赏值最高的动作,继续跟踪目标追踪网络的目标追踪正确率:若低于90%,则进入步骤(44);否则,进入步骤(45);
(44)i=i+1,执行动作ai,继续跟踪目标追踪网络的目标追踪正确率:若低于90%,则进入步骤(44);否则,进入步骤(45);
(45)进入该步骤,则说明执行动作ai后,改善了目标追踪网络的目标追踪正确率,并且达到了90%的设定阈值,给予动作ai一个奖赏,rai=rai+1,返回步骤(42);
情况②:若目标追踪网络的目标追踪正确率高于或等于90%,维持当前的目标追踪网络。
2.根据权利要求1所述的基于行人搜索的目标追踪样本扩充方法,其特征在于:所述步骤(43)中,若存在两个以上max{rai}对应的动作ai,执行i最小的动作,且i≠0。
3.根据权利要求1所述的基于行人搜索的目标追踪样本扩充方法,其特征在于:所述步骤(22)中,n≥30。
4.根据权利要求1所述的基于行人搜索的目标追踪样本扩充方法,其特征在于:所述步骤(41)中,m≥30。