欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019104811906
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于相关滤波的目标长时跟踪方法,其特征在于,包括以下步骤:输入数据集,包含所要跟踪目标的视频序列帧;

根据初始帧的目标,提取目标图像的特征;

为目标图像训练相关滤波器,包括平移相关滤波器fT,长时相关滤波器fL,尺度相关滤波器fS;

利用上一步训练获得的平移相关滤波器估计下一帧的目标位置;

利用长时相关滤波器对此次跟踪结果进行可靠性判断;

动态调整学习率η;

利用尺度相关滤波器对定位好的目标位置进行尺度估计;

模型更新与自适应阈值更新;

输出目标位置。

2.根据权利要求1所述一种基于相关滤波的目标长时跟踪方法,其特征在于:所述训练相关滤波器,在大小为M×N的图像块x上训练的相关滤波器等价于岭回归模型,训练相关滤波器的线性岭回归的目标函数为: 其中f为分类函数,λ为正则化参数,防止训练产生过拟合,xi表示第i个训练样本,yi表示第i个期望输出,M表示图像块的高,N表示图像块的宽,w表示表示权重矩阵。

3.根据权利要求2所述一种基于相关滤波的目标长时跟踪方法,其特征在于:所述目标函数的解是一个线性估计,即f(x)=wTx,则岭回归模型对于循环矩阵X具有近似解w,w=(XTX+λI)-1XTy,I表示单位矩阵、y表示回归分数,令 为x的傅里叶变换,则所以得到傅里叶域上W的解为: 其中W为w在傅里叶域的对应表示, 为y的复共轭矩阵,χ表示为X在傅里叶域上的对应表示; 表示χ的复共轭矩阵。

4.根据权利要求3所述一种基于相关滤波的目标长时跟踪方法,其特征在于:进一步用核函数在核空间训练相关滤波器,核函数表示为:k(x,x')=<φ(x),φ(x')>,则f(x)=wTφ(x)=∑iαik(xi,x'),其中f(x)为分类器函数,φ(x)和φ(x')分别为x和x'的傅里叶变换函数,αi为wi的对偶向量,αi的求解公式为: 为核相关矩阵k的傅立叶转换形式,表示为: x=[x1,x2,...,xc]为目标对象的多特征通道,c表示特征通道的总数,x'为训练阶段x的另一种表示形式,σ为尺度参数, 为傅里叶逆变换,χc为在特征通道上的特征, 为训练阶段特征通道上的特征的复共轭矩阵表示。

5.根据权利要求1-4任一项所述一种基于相关滤波的目标长时跟踪方法,其特征在于:所述估计目标位置具体包括:在每一帧的跟踪过程中,以上一帧图像中的目标位置为中心,裁剪和图像块x大小相同的图像块z,利用之前在傅里叶域上学习的fT计算z的响应图,计算公式为 通过搜索响应图中的最大值,估计目标的位置。

6.根据权利要求5所述一种基于相关滤波的目标长时跟踪方法,其特征在于:所述跟踪结果可靠性判断具体包括:利用所述响应图的计算公式,计算相关滤波器的相关响应图比较 中的最大值 与检测阈值Tr的大小,若 则此次跟踪结果可靠;反之,此次跟踪结果不可靠,则此时激活在线检测器重新检测,再次利用平移相关滤波器对目标进行重定位。

7.根据权利要求6所述一种基于相关滤波的目标长时跟踪方法,其特征在于:所述动态调整学习率η,按照以下公式进行, 其中η0表示初始学习率,t表示视频帧视频帧序号,max(·)表示目标响应图的输出最大值, 表示在第t帧时候的相关响应值。

8.根据权利要求6所述一种基于相关滤波的目标长时跟踪方法,其特征在于:所述对目标位置进行尺度估计具体包括:以目标位置为中心,设置不同的尺度池S以及目标的宽PM和高PN,对于每一个尺度,以目标位置为中心截取大小为s'PM×s'PN的图像块,然后将这些截取的图像块重新调整统一的大小为PM×PN,通过提取每一个样本块的HOG特征构建一个包含目标多尺度表示的特征金字塔,对于每一个目标尺度目标特征xs',都有一个回归目标分数g, s'表示每一个尺度,σ1尺度控制参数,最优的尺度的求解公式为:*

s表示最优尺度,xs表示在此尺度下的目标特征。

9.根据权利要求6-8任一项所述一种基于相关滤波的目标长时跟踪方法,其特征在于:所述模型更新与自适应阈值更新具体包括:

更新目标的运动特征模型 和相关滤波器系数 更新公式为:

其中η为学习率,t为视频帧序号;

为了保持在线检测器的分类能力,更新在线检测器,更新公式为:l(h:(v,c)),τ表示超参数,h表示分类超平面。

为了保持fL的判断准确性,使用运动特征模型更新公式更新目标外观特征模型和fL;

自适应阈值更新的公式为T=1-δ+δ·Vmax,Tr=0.6·T,Vmax表示当前帧的最大响应值。