1.一种基于非对称的视频间映射的半耦合字典对学习的行人重识别方法,其特征在于,所述基于非对称的视频间映射的半耦合字典对学习的行人重识别方法包括以下步骤:步骤一,分别提取CGVID数据集中真彩视频和灰阶视频的时空特征;
步骤二、输入训练集以及参数α、β、λ、ρ1、ρ2,训练模型;经过多次迭代更新,训练得到字典对DC和DG、视频间映射W和V、映射矩阵P;
步骤三,根据学习到的模型,对测试集的灰阶视频和真彩视频分别进行稀疏表示;
步骤四、给定测试集中任一灰阶视频,计算与各真彩视频的距离,并按距离值大小升序排列,选取距离值最小的真彩视频作为该灰阶视频的真实匹配;
步骤二包括:摄像机A的采集到的训练样本是真彩视频,摄像机B采集到的是灰阶视频;
将A=[A1,A2,...,Ai,...,AN]和B=[B1,B2,...,Bi,...,BN]分别表示真彩和灰阶训练视频的特征集合,N表示训练集中样本的数量; 表示第i个真彩视频的特征集,
表示第i个灰阶视频的特征集, d为视频特征
的维度;
利用字典学习对视频样本进行稀疏表示,X是A在DC上的编码系数矩阵,Y是B在DG上的编码系数矩阵;DC和DG分别表示为摄像机A和B的真彩和灰阶视频特征的字典;视频重构损失项定义如下:其中W和V分别为真彩和灰阶样本的非对称视频间映射;
非对称的视频间映射W和V需要最小化每个行人的特征集之间的差异,具体为:其中μi表示相应的第i个行人视频的特征中心; 是Ai的第j个特征向量; 是Bi的第j个特征向量;
步骤二进一步包括:摄像机A捕捉的真彩视频作为查询集,摄像机B捕捉的灰阶视频作为测试集;利用学习到的映射矩阵,摄像机B的灰阶视频特征接近于同一个人在摄像机A中的真彩视频特征;半耦合映射项为:其中P表示真彩和灰阶视频特征的编码系数之间的半耦合映射矩阵;
判定保真项定义如下:
其中∈S意味着第i个和第j个元素属于同一个行人; 表示属于不同的行人;S和 分别表示相同样本对和不同的样本对的集合;|·|表示集合中元素的数量;β是调整变量;通过学习到的映射P,摄像机B的灰阶特征系数将接近摄像机A的真彩特征系数;
最后目标函数分析视频重构损失、半耦合映射以及判定保真性,具体为:其中α和λ是平衡因子;ρ1和ρ2用来控制视频内映射和半耦合映射,先验设置为是正则项,作用是将编码系数、视频间映射和映射矩阵正则化;
步骤二进一步包括:目标函数的优化分为四个子问题:更新视频间映射矩阵W和V、更新编码系数X和Y、更新字典对DC和DG以及更新稀疏表示系数的映射函数P;
更新视频间映射矩阵W和V时,当其他变量固定后,对于W和V,目标函数写为:通过对W求导,得到的解为:
其中I是单位矩阵;V的解与W相似;对V求导,得到的解为:更新编码系数X和Y时,通过移除X以外的其他变量,目标函数简化为:通过将Xi的导数设置为0,得到的解为:
对于Y,目标函数简化为:
通过将Yi的导数设置为0,得到Yi的解为:
更新字典DC和DG时,其他变量固定,目标函数简化为:通过交替方向乘子算法ADMM得到
的解;
更新映射矩阵P时,其他变量固定,目标函数简化为:通过将P的导数设置为0,得到解为:
2.如权利要求1所述的基于非对称的视频间映射的半耦合字典对学习的行人重识别方法,其特征在于,步骤三包括:通过学习到的字典对DC和DG、映射P、视频间子空间映射W和V,进行测试视频的离散表示;若F表示某一灰阶测试视频的特征,C表示真彩训练视频的特征集合,根据学习到的P,W,V,基于灰阶字典DG对测试视频的表示系数f进行编码:基于真彩字典DC对查询视频的表示系数g进行编码:
3.一种实施权利要求1所述的基于非对称的视频间映射的半耦合字典对学习的行人重识别方法的基于非对称的视频间映射的半耦合字典对学习的行人重识别系统。
4.一种终端,其特征在于,所述终端搭载实现权利要求1~2任意一项所述基于非对称的视频间映射的半耦合字典对学习的行人重识别方法的控制器。
5.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-2任意一项所述的基于非对称的视频间映射的半耦合字典对学习的行人重识别方法。
6.一种实施权利要求1所述的基于非对称的视频间映射的半耦合字典对学习的行人重识别方法的交通视频信息监控设备。