1.一种基于深度残差网络的人脸表情识别方法,其特征在于,包括以下步骤:
步骤1)、获取待训练人脸表情图片,对人脸表情图片进行预处理,裁剪去除多余的背景信息得到放大的人脸表情图片;
步骤2)、构建用于人脸识别的深度残差网络模型,利用放大的人脸表情图片对深度残差网络模型进行训练:通过深度残差网络模型对放大的人脸表情图片进行特征提取,然后对提取的特征进行降维处理,对降维处理后的进行残差处理得到不同尺度的图形特征,将不同尺度的图形特征进行卷积与压缩处理得到学习图形特征,将学习图形特征进行下采样处理,将下采样处理后的学习图形特征进行分类处理;深度残差网络模型包括依次相连的卷积层、Maxpool层、第一残差模块、第一过渡层、第二残差模块、第二过渡层、全局池化层、Dropout层和Softmax分类层;卷积层用于放大的人脸表情图片经过3个3*3卷积层提取特征,对提取的特征经过最大池化层进行降维、压缩数据和参数量;第一残差模块用于从进行降维、压缩数据和参数量的特征中提取到不同尺度的图形特征,第一过渡层对不同尺度的图形特征进行压缩,再将压缩后的图形特征输入到第二残差模块继续提取特征,并将提取的特征输入到第二过渡层进行压缩得到学习图形特征;
步骤3)、重复步骤2)直至达到设定训练步数,得到训练后的深度残差网络模型,利用训练后的深度残差网络模型进行人脸表情识别。
2.根据权利要求1所述的一种基于深度残差网络的人脸表情识别方法,其特征在于,第一残差模块由若干个残差学习单元组成,残差学习单元包括含有三条卷积层的支路。
3.根据权利要求1所述的一种基于深度残差网络的人脸表情识别方法,其特征在于,学习图形特征经过全局池化层和Dropout层进行下采样处理,下采样处理后的学习图形特征经过Softmax分类器进行分类。
4.根据权利要求3所述的一种基于深度残差网络的人脸表情识别方法,其特征在于,Softmax分类器的输入是一个任意实数的向量,输出是一个向量,其中每个元素的取值在(0,1)之间,且其和为1,设有一个数组,其Softmax表达式为:i j
其中Si表示Softmax的取值,e表示第i个元素,∑je表示所有元素之和;深度残差网络模型的输入大小为112*112。
5.根据权利要求1所述的一种基于深度残差网络的人脸表情识别方法,其特征在于,步骤2)中,利用放大的人脸表情图片对深度残差网络模型进行训练开始前,对深度残差网络模型进行权值初始化,然后将放大的人脸表情图片输入权值初始化后的深度残差网络模型中,放大的人脸表情图片经过深度残差网络模型的前向传播得到输出值,根据每次深度残差网络模型的输出值得到深度残差网络模型中的损失值。
6.根据权利要求5所述的一种基于深度残差网络的人脸表情识别方法,其特征在于,采用交叉熵损失函数获取深度残差网络模型中的损失值,交叉熵H(p,q)是用来评价当前训练得到的概率分布和真实分布的差异情况,减少交叉熵损失就是在提高模型的预测准确率,其中p(x)是指真实分布的概率,q(x)是模型通过数据计算出来的概率估计。
7.根据权利要求6所述的一种基于深度残差网络的人脸表情识别方法,其特征在于,根据获取的深度残差网络模型中的损失值进行反向传播更新权值,重复深度残差网络模型的训练,直至达到设定的训练步数时结束训练,得到训练后的深度残差网络模型。