欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020105903984
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-11-18
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,包括以下步骤:输入带有精确年龄标签的人脸图像集合作为数据集,并对人脸图像数据集进行预处理;

将预处理后的人脸图像输入到基线模型ResNet-50中,经过卷积层和最大池化层提取出浅层特征图;

在提取所述浅层特征图后连接有四组顺次相连的残差模块,并构成残差网络,将所述残差网络作为全局支路并提取出人脸图像的全局特征;

在第一组残差模块和第二组残差模块之间嵌入有全局二阶池化块,从而在全局支路中生成高维的全局图像表示;

将所述浅层特征图作为长短期记忆神经网络的输入,构建出局部支路并提取年龄敏感区域的局部特征;

联合优化求解两条支路的交叉熵损失函数,对由全局支路和局部支路所构成的卷积神经网络进行迭代训练至收敛,保存训练好的卷积神经网络模型;

将待测的人脸图像输入到训练好的卷积神经网络模型中,分类器根据年龄特征计算输出最终预测年龄。

2.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,对人脸图像数据集进行预处理包括采用多任务卷积神经网络进行人脸检测与人脸对齐,并将人脸图像剪裁到相同的尺寸,对人脸图像数据集中的候选训练集进行数据增强操作,根据下述公式对人脸图像作像素归一化:Xpix=(Xpix-128)/128

其中,Xpix是输入的人脸图像像素值。

3.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,基线模型ResNet-50的卷积层和最大池化层的构造包括人脸图像输入到ResNet-50中,首先经过卷积核大小为7×7,步长为2的卷积层,输出特征图为112×112,再经过最大池化层,输出人脸图像的浅层特征图。

4.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,在提取出浅层特征图后,将经过人脸图像特征图依次经过四组不同的残差模块,各残差模块组依次包含数量为3,4,6,3的残差模块,每组的残差模块输出维度各不相同,输出特征图的大小依次为56×56,28×28,14×14,7×7。

5.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,全局二阶池化块的嵌入过程包括:在残差网络中插入用于提取高阶信息的块,具体地,输入为h′×w′×c′的三维张量,将三维张量先进行1×1卷积,得到h′×w′×c的三维张量;其中h′,w′分别为输入人脸图像的长度和宽度,c′为通道数,c<c′;

计算通道的相关性,获得一个固定大小的c×c协方差矩阵,对协方差矩阵进行行方向的归一化;

执行协方差矩阵行卷积以及Sigmoid非线性激活两个连续操作,输出为c×1的权向量;

将输入张量的每个通道乘以权重向量中的相应元素,得到新的三维张量h′×w′×c,将其作为后续残差模块的输入;

在所述残差网络的最后一个残差模块末端插入矩阵归一化协方差矩阵生成人脸图像最终的全局特征表示。

6.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,基于长短期记忆神经网络构建出局部支路并提取年龄敏感区域的局部特的过程包括:长短期记忆神经网络通过长期和短期存储机制自动保留与当前人脸图像相似的其他人脸图像的位置信息来实现定位功能,计算公式包括:Cnext=forgetgate⊙Cprev+ingate⊙Cin-tanhnext=outgate⊙tanh(Cnext)

Cin-tan=tan h(WC[hprev,xinput]+bC)其中,forgetgate表示长短期记忆神经网络LSTM的遗忘门,ingate表示LSTM的输入门,outgate表示LSTM的输出门;⊙表示同或符号;Cprev和Cnext、hnext分别为LSTM的先前状态、当前状态和隐藏状态;Cin-tan是用于更新单元状态的候选向量,WC和bC分别表示权重和偏置,xinput为LSTM的输入;

通过状态更新生成对年龄敏感的局部区域框的坐标,宽度和高度,公式包括:l1-4=L(W*Snext)

其中,l1-4表示一个四维向量,分别表示坐标(x,y),宽度和高度,Snext为LSTM的联合输出,W为总的参数,L(.)表示卷积函数;

根据位置坐标剪裁得到年龄敏感区域的局部特征,将其依次输入到残差网络中的四组残差模块进行局部特征学习。

7.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,所述交叉熵损失函数表示如下:Pfinal(Xi)=Pglobal+0.5Plocal

其中,表示卷积神经网络的损失,Pglobal表示全局支路中样本i的预测年龄概率,Plocal表示全局支路中样本i的预测年龄概率,Pfinal(Xi)表示样本i的最终预测年龄,n表示人脸图像的训练集总样本数。

8.一种嵌入高阶信息的多尺度人脸年龄估计系统,其特征在于,包括图像获取模块、数据预处理模块、数据增强模块、神经网络模块以及输出模块;

图像获取模块用于输入数据集,获取人脸图像信息或待测人脸图像;

数据预处理模块用于对人脸图像信息或待测人脸图像进行人脸检测、人脸对齐、剪裁,并对人脸图像作像素归一化处理;

数据增强模块用于按照随机水平翻转、缩放、旋转和平移操作对训练集进行扩展;

神经网络模块用于构建并训练以全局模块和局部模块所形成的卷积神经网络;

所述全局模块用于全局特征的提取和学习,所述局部模块用于局部特征的提取和学习;

输出模块用于输出待测人脸图像的最终预测年龄。

9.根据权利要求8所述的一种嵌入高阶信息的多尺度人脸年龄估计系统,其特征在于,所述全局模块包括残差模块和高阶模块,残差模块用于提取出人脸图像的全局特征,高阶模块将全局二阶池化块从较低层引入到较高层,使得人脸图像的二阶统计信息得以充分利用。

10.根据权利要求8所述的一种嵌入高阶信息的多尺度人脸年龄估计系统,其特征在于,所述局部模块包括长短期记忆神经网络、局部区域定位模块和剪裁模块,长短期记忆神经网络用于状态的更新,局部区域定位模块用于定位年龄敏感区域的坐标,宽度和高度,剪裁模块根据局域位置信息剪裁得到局部特征图。