欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2017100299356
申请人: 华侨大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于深度学习与局部特征融合的哈希图像检索方法,其特征在于,包括如下步骤:

1)将输入的图像进行预处理,依次对每张图像进行去均值化、裁剪和镜像;

2)将预处理后的图像构建成三元组的形式输入到深度卷积网络进行训练;

3)将GoogLeNet网络中inception 4b层、inception 4e层和inception 5b层输出的特征图分别进行最大值池化和卷积处理,然后使用合并层将处理后的特征图进行拼接;

4)将合并层输出的特征图进行卷积核大小为1×1的卷积操作,得到大小为128×5×5的特征图;

5)将1×1卷积操作后的特征图进行总和池化处理,并将128个特征图连接成一个128维的向量,向量每个维度上的值对应单个特征图的所有元素总和值;

6)将输出的大小为128×1×1的特征图经过一个结点个数为1024的全连接层映射,得到1个1024维的局部聚合向量;

7)将得到的局部聚合向量输入到哈希映射层,并利用感知哈希算法计算得到哈希码;

8)将得到的局部聚合向量进行L2范数归一化,归一化后的向量使用三元组损失形成约束优化,并与交叉熵损失函数同时进行训练。

2.如权利要求1所述的基于深度学习与局部特征融合的哈希图像检索方法,其特征在于,步骤1)中所述预处理,包括:将输入的图像重置大小为256×256,对每一个图像进行裁剪,裁剪的是图片中央、4个角以及镜像共10张图片并去均值化,依次处理所有输入的训练图像,从而得到的每一个图像大小为224×224。

3.如权利要求2所述的基于深度学习与局部特征融合的哈希图像检索方法,其特征在于,步骤2)中所述构建三元组的形式,包括:从训练数据集中随机选一个样本锚点;

随机选取一个和锚点属于同一类的正样本和不同类的负样本,构成三元组;

对应的损失函数L表示为:

其中, 和 分别表示锚点、正样本和负样本的特征向量;N表示网络训练的批大小;+表示括号内式子的值大于零的时候取该值为损失,反之则损失为零;α表示为可接受的不同类样本间的距离间隔。

4.如权利要求3所述的基于深度学习与局部特征融合的哈希图像检索方法,其特征在于,步骤3)中,将GoogLeNet模型中的inception 4b、inception 4e和inception 5b输出的特征图进行最大值池化和卷积处理后,分别得到3个尺度为256×5×5的特征图,采用合并层对这些特征图进行合并,生成大小为768×5×5的特征图。

5.如权利要求4所述的基于深度学习与局部特征融合的哈希图像检索方法,其特征在于,步骤5)中,所述将1×1卷积操作后的特征图进行总和池化处理,其表达式如下:

其中,H和W分别为特征图的高度与宽度,x、y为特征图的空间坐标,I是输入的特征图,则f(x,y)表示特征图I上对应点(x,y)的值,总和池化实际上是对得到的每一个特征图I进行累加求和,如果有n个特征图,最终生成一个n×1×1的特征向量。

6.如权利要求5所述的基于深度学习与局部特征融合的哈希图像检索方法,其特征在于:步骤7)中,所述利用感知哈希算法计算得到哈希码,包括:定义哈希映射层的输出特征向量V(v1,v2,...,vm),通过均值感知哈希算法计算阈值得到二进制哈希码特征向量H(h1,h2,...,hm),表示式如下:

其中,1≤j≤m。

7.如权利要求6所述的基于深度学习与局部特征融合的哈希图像检索方法,其特征在于:步骤8)中,所述将得到的局部聚合向量进行L2范数归一化,包括:定义局部聚合向量Y(y1,y2,...,yp),将归一化后的向量表示为Y'(y1',y'2,...,y'p),归一化操作的表达式如下:

其中,1≤k≤p。