1.一种融合颜色特征与词汇树的车辆图像检索方法,其特征在于,包括以下步骤:
S01、词汇树的创建:对训练图像库中的每幅图像先提取车身部分,对于剔除掉背景部分的车辆图像提取SIFT特征,这样就得到了一个特征集合F={f(i)},然后对特征集合F进行分层k-means聚类,初始时,在词汇树的第一层上对特征集合F进行第一次k-means聚类,计算出每个聚类的中心向量Ci,类似的,对新产生的每个聚类再用k-means聚类聚成k个簇集,不断地重复上述操作直到树的深度达到预先设定的L值,每个簇集定义为一个视觉单词,得到视觉单词词汇树;
S02、用权值向量来表示图像:提取测试图像库中图像的车身部分,对于剔除掉背景部分的车辆图像提取SIFT特征,分别将每个SIFT特征分配给词汇树中最为接近的视觉单词,然后依据每幅图像中视觉单词出现的次数以及视觉单词与图像的相关程度来计算图像的视觉单词权值;
S03、颜色特征权重的计算:提取图像车身部分HSV颜色空间模型,采用均匀分段的方法对特征进行量化,再将特征向量统一到一个特征度中,计算查询图像与待检索图像之间的特征度欧式距离排序并标号,根据颜色标号建立颜色特征权重;
S04、感知哈希进制数的选择:为提高大规模图像的检索效率,本发明采用感知哈希算法原理,将视觉单词分别量化给不同的哈希码,在综合考虑本发明的量化时间与检索正确率之后,本发明的进制数选取为4;
S05、图像相似度计算:通过汉明距离计算图像哈希序列的感知距离,再将颜色特征权重作为汉明距离的加权系数得到最终查询图像与待检索图像的相似度sim(q,d)=CqdHqd,将最为相似图像输出。
2.根据权利要求1所述的融合颜色特征与词汇树的车辆图像检索方法,所述步骤S02包括:
(1)对测试库中每一幅图像首先提取车身部分,对车身部分提取SIFT特征,这样就得到了一个特征集合F={f(i)}以及相应的图像ID集合imgID={id(i)};
(2)根据距离最近原则将SIFT特征分配给词汇树中最邻近的视觉单词,这样每幅图像的SIFT特征就转化成了视觉单词;
(3)wi,j则表示图像dj中视觉单词Fi的权值,即视觉单词Fi与图像dj的相关程度,权值是按照TF-IDF的原理定义的,mi,j表示视觉单词Fi在图像dj中出现的次数,它可以用来衡量视觉单词用来描述图像的好坏程度,N表示图像库中图像的总数,ni表示包含视觉单词Fi的图像数目,逆文献频率定义为idfi=lg(N/ni),它表示的含义是视觉单词对于区分相似图像和不相似图像的作用大小,所以,wi,j可以表示为(4)图像dj可以用视觉单词的权值向量来表示为dj=[w1,j,w2,j,L,wt,j],测试图像库中的所有图像可以用矩阵表示为
3.根据权利要求1所述的融合颜色特征与词汇树的车辆图像检索方法,所述步骤S03包括:
(1)对图像直接提取HSV空间颜色特征向量,为了降低计算复杂程度,采用均匀分段的方法对颜色特征进行量化,为了降低计算复杂程度,采用均匀分段的方法对颜色特征进行量化,在根据公式L=HQSQV+SQV+V将特征向量统一到一个特征度中,其中QS、QV分别表示饱和度和亮度分量的量化级数;
(2)计算查询图像与待检索图像之间的特征度欧式距离,根据欧式距离由小到大进行排序并标号,颜色最相似的标号为1,第二相似标号为2,以此类推;
(3)根据颜色的标号建立颜色特征权重,查询图像q和图像d的颜色特征权重计算公式为 其中Rqd表示在查询图像为q时,图像d的标号。
4.根据权利要求1所述的融合颜色特征与词汇树的车辆图像检索方法,所述步骤S04包括:
(1)鉴于本发明的进制数为4,计算同一视觉单词在各个图像中权值的和,平均将它分为四段,每一段表示一个哈希码,得到四个哈希码区间;
(2)将每个视觉单词与其对应的视觉单词的哈希码区间进行比较,分别将各个视觉单词映射给哈希码,得到图像的哈希码序列。