欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020100536762
申请人: 山东师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于多层次深度学习网络的行人重识别方法,其特征是,包括:

获取待进行行人重识别的图像;对待进行行人重识别的图像中的一幅,标记待重识别行人的标签;

将已标记的图像和未标记的图像,输入到预训练的多层次深度学习网络中;预训练的多层次深度学习网络通过提取已标记图像的融合特征,提取未标记图像的融合特征;所述融合特征包括行人的局部特征和行人的全局特征;

多层次深度学习网络主要包含两个结构:基于部分的多层次网络PMN和全局‑局部特征分支网络GLB;PMN网络包括第一局部特征提取模块、第二局部特征提取模块和第三局部特征提取模块,GLB网络包括第四局部特征提取模块和全局特征提取模块;

其中,第一局部特征提取模块,包括:依次连接的第一平均池化层Average pooling、第一分割层、第一卷积层、第一批处理层batch mormalization layer、第一Relu函数层、第一全局池化层Global pooling、第一全连接层和第一softmax函数层;第一局部特征提取模块、第二局部特征提取模块和第三局部特征提取模块的内部结构是一样的;第四局部特征提取模块,包括:依次连接的第四分割层、第四平均池化层Average pooling、第四全连接层和第四softmax函数层;所述全局特征提取模块,包括:依次连接的第五平均池化层Average pooling、第五全连接层和第五softmax函数层;

构建的多层次深度学习网络,包括:依次连接的输入层、ResNet50神经网络的Stage1模块、ResNet50神经网络的Stage2模块、ResNet50神经网络的Stage3模块和ResNet50神经网络的Stage4模块;其中,ResNet50神经网络的Stage1模块的输出端与第一局部特征提取模块连接;ResNet50神经网络的Stage2模块的输出端与第二局部特征提取模块连接;

ResNet50神经网络的Stage3模块的输出端与第三局部特征提取模块连接;ResNet50神经网络的Stage4模块的输出端与第四局部特征提取模块连接;ResNet50神经网络的Stage4模块的输出端还与全局特征提取模块连接;第一局部特征提取模块的输出端、第二局部特征提取模块的输出端、第三局部特征提取模块的输出端、第四局部特征提取模块的输出端和全局特征提取模块的输出端均与特征融合模块连接,特征融合模块与输出层连接;

构建的多层次深度学习网络工作原理,包括:输入层,用于输入待进行行人重识别的图像;ResNet50神经网络的Stage1模块,用于对待进行行人重识别的图像进行处理获取第一特征图;第一局部特征提取模块,从第一特征图中提取第一局部特征;ResNet50神经网络的Stage2模块,用于对第一特征图进行处理获取第二特征图;第二局部特征提取模块,从第二特征图中提取第二局部特征;ResNet50神经网络的Stage3模块,用于对第二特征图进行处理获取第三特征图;第三局部特征提取模块,从第三特征图中提取第三局部特征;ResNet50神经网络的Stage4模块,用于对第三特征图进行处理获取第四特征图;第四局部特征提取模块,从第四特征图中提取第四局部特征;全局特征提取模块,从第四特征图中提取全局特征;

计算已标记图像的融合特征与未标记图像的融合特征之间的距离;按照距离从小到大对未标记图像中的行人进行排序,将排序前M个的未标记图像中的行人进行标记,输出未标记图像中对待重识别行人的标记结果,M为正整数,M为设定值。

2.如权利要求1所述的方法,其特征是,所述预训练的多层次深度学习网络,训练步骤包括:

S31:构建多层次深度学习网络;

S32:构建训练集;所述训练集为Market‑1501数据集或CUHK03数据集;

S33:将训练集输入到多层次深度学习网络进行学习,当损失函数达到最小值时,训练结束,输出训练好的多层次深度学习网络。

3.如权利要求2所述的方法,其特征是,所述S33中,将训练集输入到多层次深度学习网络进行学习步骤之前,还包括:利用ImageNet数据集对多层次深度学习网络进行预训练。

4.如权利要求1所述的方法,其特征是,构建的多层次深度学习网络工作原理,还包括:

特征融合模块,对第一局部特征、第二局部特征、第三局部特征、第四局部特征和全局特征进行特征求和融合;对第一局部特征、第二局部特征、第三局部特征、第四局部特征和全局特征对应的损失函数进行求和,求和结果作为多层次深度学习网络的损失函数值。

5.如权利要求1所述的方法,其特征是,构建的多层次深度学习网络,还包括:

特征融合模块,用于对第一局部特征提取模块的损失函数值、第二局部特征提取模块的损失函数值、第三局部特征提取模块的损失函数值、第四局部特征提取模块的损失函数值和全局特征提取模块的损失函数值进行求和处理;

所述特征融合模块的总损失函数为:

其中, 表示全局特征提取模块的损失函数值, 表示第四局部特征提取模块的损失函数值, 表示第一局部特征提取模块的损失函数值, 表示第一局部特征提取模块的损失函数值, 表示第一局部特征提取模块的损失函数值。

6.基于多层次深度学习网络的行人重识别系统,实现权利要求1~5任一项权利要求所述的方法,其特征是,包括:获取和标记模块,其被配置为:获取待进行行人重识别的图像;对待进行行人重识别的图像中的一幅,标记待重识别行人的标签;

特征提取模块,其被配置为:将已标记的图像和未标记的图像,输入到预训练的多层次深度学习网络中;预训练的多层次深度学习网络通过提取已标记图像的融合特征,提取未标记图像的融合特征;所述融合特征包括行人的局部特征和行人的全局特征;

距离计算模块,其被配置为:计算已标记图像的融合特征与未标记图像的融合特征之间的距离;

输出模块,其被配置为:按照距离从小到大对未标记图像中的行人进行排序,将排序前M个的未标记图像中的行人进行标记,输出未标记图像中对待重识别行人的标记结果,M为正整数,M为设定值。

7.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1‑5任一项所述的方法。

8.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1‑5任一项所述的方法。