欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019103888262
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于样本权值分配和深度学习的人脸表情识别方法,其特征在于包括如下步骤:步骤(1)人脸表情图片预处理,对训练样本进行一些人工图像变换,实现数据增强;

步骤(2)训练样本权值参数的获取过程:将预处理后的每张原始的人脸表情图片,通过VGG-11网络进行5折交叉验证方法,根据每张人脸表情图片的正确率来确定其权重参数;

步骤(3)设计与训练自适应Inception-Resnet网络:将步骤(2)中带权重参数的人脸表情图片输入到自适应Inception-Resnet网络进行训练;

步骤(4)人脸表情图片识别:将测试数据进行数据增强处理后,输入到步骤(3)训练好的自适应Inception-Resnet网络进行决策,输出预测结果。

2.根据权利要求1所述的一种基于样本权值分配和深度学习的人脸表情识别方法,其特征在于步骤(1)所述的人脸表情图片预处理,选用数据库中人脸表情图片的大小是48*

48,通过多次随机裁剪大小为44*44的图像,并对裁剪后的图像进行镜像处理,获得预处理后的训练集。

3.根据权利要求2所述的一种基于样本权值分配和深度学习的人脸表情识别方法,其特征在于所述步骤(2)训练样本权值参数的获取方法如下:

2-1.将通过步骤(1)获得的训练集随机划分数量相同的k组训练数据,其中一组作为训练集对VGG-11网络进行训练,剩下的k-1组作为验证集,进行k折交叉验证,训练出k个VGG-

11网络模型;

2-2.将所有的训练集中的训练样本输入到k个VGG-11网络模型,计算出所有训练样本各自的分类准确率,计算公式如下:式(1)中N为分类网络模型个数,K(xi)为第i个训练样本分别在K个分类网络模型中的正确分类次数总和;

2-3.按照如下公式对每个训练样本分配权重:

Wi=(1-α)*C(xi)+α         (式2)

Wi为第i个训练样本的权重,α为常数,0<α<1,C(xi)为训练样本的分类准确率。

4.根据权利要求3所述的一种基于样本权值分配和深度学习的人脸表情识别方法,其特征在于步骤(3)所述的设计与训练自适应Inception-Resnet网络的实现如下:自适应Inception-Resnet网络借鉴了Inception-Resnet结构,包括两个主要模块:一是Inception模块,即对输入图像并行执行多个卷积操作和池化操作,并将所有输出结果拼接成一个特征图;二是ResNet模块,即残差结构的使用;ResNet直接将输入信息绕过输出,保护了信息的完整性,使得整个网络只需要学习输入和输出的区别;使用Inception-Resnet模块来获取关于输入图像的不同信息;将权重参数添加到这些模块中不同的分支和上一层的输入;将权重参数由网络初始化,并在网络训练过程中进行自我调整,使网络能够选择最合适的卷积操作和池化操作;在最后一个卷积层之后进行Dropout操作,最后使用全连接层(FCN)和Softmax作为分类器;

设计的Softmax损失方程如下:

式(3)中L为损失值,sj为Softmax输出向量S的第j个值,yj为one-hot形式的样本标签,T是总类数,Wi是样本的权重。

5.根据权利要求4所述的一种基于样本权值分配和深度学习的人脸表情识别方法,其特征在于步骤(4)所述的数据增强具体实现如下:将一张48×48的测试图片从中间、左上角、左下角、右上角和右下角的图像进行剪切和镜像,生成10张不同的44×44的测试图片,然后将这10张测试图片输入到步骤(3)训练好的Inception-Resnet中,对这10张测试图片进行表情分类,这10张测试图片中的每一张测试图片都有一个输出分类,统计10张测试图片的输出分类结果,输出最多的分类即为该48×48的人脸表情图片所对应的分类。