1.一种基于位置信息加权词汇树的车辆图像检索方法,其特征在于,包括以下步骤:
S01、词汇树的创建:对训练图像库中的每幅图像先提取车身部分,对于剔除掉背景部分的车辆图像提取SIFT特征,得到一个特征集合F={f(i)},然后对特征集合F进行分层k-means聚类,初始时,在词汇树的第一层上对特征集合F进行第一次k-means聚类,计算出每个聚类的中心向量Ci,类似的,对新产生的每个聚类再用k-means聚类聚成k个簇集,不断地重复上述操作直到树的深度达到预先设定的L值,每个簇集定义为一个视觉单词,得到视觉单词词汇树;
S02、用权值向量来表示图像:提取测试图像库中图像的车身部分,对于剔除掉背景部分的车辆图像提取SIFT特征,分别将每个SIFT特征分配给词汇树中最为接近的视觉单词,然后依据每幅图像中视觉单词出现的次数以及视觉单词与图像的相关程度来计算图像的视觉单词权值;
S03、视觉单词空间位置权值的计算:根据每幅图像SIFT特征之间的距离远近计算SIFT特征点之间的相互影响,再将SIFT点之间的影响转化为视觉单词之间的空间位置信息,计算位置相似度作为权值;
S04、图像相似度计算:将视觉单词的空间位置权值作为加权系数,计算图像权值向量的欧式距离来判断图像之间的相似程度,并将最为相近的图像作为结果输出;
所述步骤S03包括:
(1)定义图像上一个SIFT特征点的空间边界是以u(i)为中心的半径大小为rc×s(i)的一个圆形区域,记为SCRf(i),其中rc为位置空间的尺度系数,用于控制空间上下文区域的大小,设置尺度系数为1.5,u(i)表示特征点所在图像空间的坐标,s(i)是指该特征的尺度;
(2)当SIFT特征点f(i)对应的视觉单词是Fm,表示为fm(i),SIFT特征点f(j)对应的视觉单词是Fk,表示为fk(j)时,对于SIFT特征点 定义其到fm(i)的相对距离为(3)根据与fm(i)距离较近的SIFT点对fm(i)的影响程度较大,反之则影响程度较小的原则,定义fk(j)在fm(i)中的空间上下文特性中的权重为(4)由于不同的SIFT点分属于不同的视觉单词,视觉单词Fk在视觉单词Fm中的上下文特性中的权重为(5)对于视觉单词Fm,其余视觉单词对它的空间位置影响为SC(Fm)=[c1(Fm),c2(Fm),…,ct(Fm)],对于查询图像q和图像库中的图像d的同一个视觉单词Fm,它的空间位置信息相似度表示为
2.根据权利要求1所述的一种基于位置信息加权词汇树的车辆图像检索方法,所述步骤S02包括:
(1)对测试库中每一幅图像首先提取车身部分,对车身部分提取SIFT特征,得到特征集合F={f(i)}以及相应的图像ID集合imgID={id(i)};
(2)根据距离最近原则将SIFT特征分配给词汇树中最邻近的视觉单词,每幅图像的SIFT特征转化成视觉单词;
(3)wi,j则表示图像dj中视觉单词Fi的权值,即视觉单词Fi与图像dj的相关程度,权值是按照TF-IDF的原理定义的,mi,j表示视觉单词Fi在图像dj中出现的次数,用于衡量视觉单词用来描述图像的好坏程度,N表示图像库中图像的总数,ni表示包含视觉单词Fi的图像数目,逆文献频率定义为idfi=lg(N/ni),它表示的含义是视觉单词对于区分相似图像和不相似图像的作用大小,所以,wi,j表示为(4)图像dj用视觉单词的权值向量来表示为dj=[w1,j,w2,j,…,wt,j],测试图像库中的所有图像用矩阵表示为