欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019105434654
申请人: 广西师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-11-22
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于稀疏注意力网络的行人再辨识方法,其特征是,包括如下步骤:步骤1、将已知的行人再辨识数据集中的图像分为训练集和测试集,并分别对训练集和测试集中的图像进行预处理;

步骤2、对步骤1所得的训练集中的所有训练图像进行复制,分别得到原训练图像和复制训练图像;

步骤3、对于步骤2所得的原训练图像,先将原训练图像送入卷积层提取图像的卷积特征,再将提取的卷积特征送入最大池化层提取图像的最大池化特征,后将提取的最大池化特征送入3个重复叠加的第一残差模块提取图像的第一残差卷积特征;

步骤4、将步骤3所得的第一残差卷积特征送入第一归一化的压缩-激励模块提取图像的第一注意力特征;

步骤5、将步骤3所得的第一残差卷积特征和步骤4所得的第一注意力特征相乘,得到第一稀疏注意力特征;

步骤6、利用步骤2所的复制训练图像与步骤5所得的第一稀疏注意力特征相加,得到第一阶段图像特征;

步骤7、对步骤6所得的所有第一阶段图像特征进行复制,分别得到原第一阶段图像特征和复制第一阶段图像特征;

步骤8、对于步骤7所得的原第一阶段图像特征特征送入4个重复叠加的第二残差模块提取图像的第二残差卷积特征;

步骤9、将步骤8所得到第二残差卷积特征送入第二归一化的压缩-激励模块提取图像的第二注意力特征;

步骤10、将步骤8所得的第二残差卷积特征与步骤9所得的第二注意力特征相乘,得到第二稀疏注意力特征;

步骤11、将步骤7所得的复制第一阶段图像特征与步骤10所得的第二稀疏注意力特征相加,得到第二阶段图像特征;

步骤12、对步骤11所得的所有第二阶段图像特征进行复制,分别得到原第二阶段图像特征和复制第二阶段图像特征;

步骤13、对于步骤12所得的原第二阶段图像特征特征送入6个重复叠加的第三残差模块提取图像的第三残差卷积特征;

步骤14、将步骤13所得到第三残差卷积特征送入第三归一化的压缩-激励模块提取图像的第三注意力特征;

步骤15、将步骤13所得的第三残差卷积特征与步骤14所得的第三注意力特征相乘,得到第三稀疏注意力特征;

步骤16、将步骤12所得的复制第二阶段图像特征与步骤15所得的第三稀疏注意力特征相加,得到第三阶段图像特征;

步骤17、对步骤16所得的所有第三阶段图像特征进行复制,分别得到原第三阶段图像特征和复制第三阶段图像特征;

步骤18、对于步骤17所得的原第三阶段图像特征特征送入3个重复叠加的第四残差模块提取图像的第四残差卷积特征;

步骤19、将步骤18所得到第四残差卷积特征送入第四归一化的压缩-激励模块提取图像的第四注意力特征;

步骤20、将步骤18所得的第四残差卷积特征与步骤19所得的第四注意力特征相乘,得到第四稀疏注意力特征;

步骤21、将步骤17所得的复制第三阶段图像特征与步骤20所得的第四稀疏注意力特征相加,得到第四阶段图像特征;

步骤22、将步骤21所得的所有第四阶段图像特征送入平均池化层提取图像的平均池化特征;

步骤23、将步骤22所得到的所有平均池化特征送入分类层,由此得到行人类别的预测模型;

步骤24、利用步骤2所得的测试集中的所有测试图像对步骤23所得的行人类别的预测模型进行测试,由此得到最终行人类别的预测模型;

步骤25、从实时采集的视频中筛选出所有的行人图像,并将这些行人图像全部送入到最终行人类别的预测模型中对其进行辨识分类,从中找出指定对象的所有行人图像。

2.根据权利要求1所述的基于稀疏注意力网络的行人再辨识方法,其特征是,步骤1中,所述行人再辨识数据集为Market-1501和DukeMTMC-reID。

3.根据权利要求1所述的基于稀疏注意力网络的行人再辨识方法,其特征是,步骤1中,对训练集中的训练图像和测试集中的测试图像的预处理过程分别如下:对训练集中的训练图像的预处理过程为:先对训练图像进行裁剪,再将裁剪后的图像水平翻转,后将翻转后的训练图像进行归一化;

对测试集中的测试图像的预处理过程为:对测试图像进行裁剪。

4.根据权利要求1所述的基于稀疏注意力网络的行人再辨识方法,其特征是,第一残差模块、第二残差模块、第三残差模块和第四残差模块的结构相同,均包括3层卷积层和1条短连接;其中第一层卷积层具有C/4个步长为1且内核大小为1×1的过滤器,第二层卷积层具有C/4个步长为1且内核大小为3×3的过滤器,第三层卷积层具有C个步长为1且内核大小为

1×1的过滤器;短连接连接第一层卷积层的头部与第三层卷积层的尾部,并将第一层卷积层的输入与第三层卷积层的输出相加后,得到整个残差模块的输出;

其中第一残差模块的通道值C的取值为256,第二残差模块的通道值C的取值为512,第三残差模块的通道值C的取值为1024,第四残差模块的通道值C的取值为2048。

5.根据权利要求1所述的基于稀疏注意力网络的行人再辨识方法,其特征是,第一归一化的压缩-激励模块、第二归一化的压缩-激励模块、第三归一化的压缩-激励模块和第四归一化的压缩-激励模块的结构相同,均包括7层:其中第一层为平均池化层;第二层为降维层,其具有C/16个步长为1且内核大小为1×1的过滤器;第三层为批量归一化层,其执行C/

16个归一化运算;第四层为线性整流层;第五层为升维层,其具有C个步长为1且内核大小为

1×1的过滤器;第六层为批量归一化层,其执行C个归一化运算;第七层为Sigmoid激活层;

其中第一归一化的压缩-激励模块的通道值C的取值为256,第二归一化的压缩-激励模块的通道值C的取值为512,第三归一化的压缩-激励模块的通道值C的取值为1024,第四归一化的压缩-激励模块的通道值C的取值为2048。

6.根据权利要求5所述的基于稀疏注意力网络的行人再辨识方法,其特征是,第四层即线性整流层执行的线性整流函数为:其中,x即第四层的输入特征。

7.根据权利要求5所述的基于稀疏注意力网络的行人再辨识方法,其特征是,第七层即Sigmoid激活层执行的Sigmoid激活函数为:其中,z即第七层的输入特征。