欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019106769123
申请人: 首都师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-29
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种表情识别方法,其特征在于,包括:

将待识别图像进行处理,以获取人脸图像;

将所述人脸图像中的各个像素点使用四元数进行表示,形成人脸四元矩阵,其中,四元数中的每一虚数的权重表示对应的一颜色分量的值;

将所述人脸四元矩阵作为目标神经网络模型的输入,对所述待识别图像进行识别,以得到所述待识别图像中的人脸的表情。

2.根据权利要求1所述的方法,其特征在于,所述将所述人脸图像中的各个像素点使用四元数进行表示,形成人脸四元矩阵的步骤,包括:将所述人脸图像中的各个像素点使用四元数表示,以确定出各个像素点的第一四元数,每一像素点对应的第一四元数中的三个虚数的权重分别表示三个颜色分量的值;

根据各个像素点的所述第一四元数使用设定计算公式计算得到矩阵元素,以得到人脸四元矩阵。

3.根据权利要求2所述的方法,其特征在于,所述设定计算公式包括:其中,

其中,|m|≤n且n-|m|为偶数,μ表示单位纯四元数,(r,θ)表示极坐标,q表示四元数矩阵形式,fq(r,θ)表示坐标为(r,θ)的像素点的第一四元数,Rn,m(r)表示一中间变量,Zn,m表示人脸四元矩阵中的第n行第m列的值,s表示一临时变量。

4.根据权利要求2所述的方法,其特征在于,所述将所述人脸图像中的各个像素点使用四元数表示,以确定出各个像素点的第一四元数的步骤,包括:通过将所述人脸图像中的各个像素点在笛卡尔坐标系下使用四元数表示,确定出各个像素点的中间四元数;

将所述各个像素点的中间四元数转换成各个像素点在极坐标系下的四元数,各个像素点在极坐标系下的四元数为所述第一四元数。

5.根据权利要求4所述的方法,其特征在于,所述通过将所述人脸图像中的各个像素点在笛卡尔坐标系下使用四元数表示,确定出各个像素点的中间四元数通过以下公式实现:fq(x,y)=ifR(x,y)+jfG(x,y)+kfB(x,y);

q

其中,f (x,y)表示坐标为(x,y)的像素点的中间四元数,i,j,k分别表示四元数的三个虚数单位,R,G,B分别表示红、绿、蓝色道,fR(x,y)表示坐标为(x,y)的像素点在R色道的颜色分量,fG(x,y)表示坐标为(x,y)的像素点在G色道的颜色分量,fB(x,y)表示坐标为(x,y)的像素点在B色道的颜色分量。

6.一种表情识别模型训练方法,其特征在于,包括:

将初始数据集进行处理,以获取人脸图像集,所述初始数据集中的各个图像中包含人脸部分;

将所述人脸图像集中的各个人脸图像中的各个像素点使用四元数进行表示,以得到所述人脸图像集中的各个人脸图像的人脸四元矩阵,各个人脸图像的人脸四元矩阵形成训练数据集,其中,四元数中的每一虚数的权重表示其中一颜色分量的值;

将所述训练数据集输入初始神经网络模型中进行训练,以得到目标神经网络模型,所述目标神经网络模型为权利要求1-5任意一项所述的方法中的目标神经网络模型。

7.根据权利要求6所述的方法,其特征在于,所述将所述训练数据集输入初始神经网络模型中进行训练,以得到目标神经网络模型的步骤,包括:a.将所述训练数据集输入当前神经网络模型的前向传播公式进行计算,得到输出特征,其中,第一次训练时,所述当前神经网络模型为所述初始神经网络模型,第N次训练时,所述当前神经网络模型为最近一次更新后得到的当前神经网络模型,N为大于一的整数;

b.当所述输出特征的误差大于设定值时,根据反向传播公式计算所述初始神经网络模型中的各个待确定参数的更新值;

c.通过所述待确定参数的更新值对所述初始神经网络模型进行更新,得到更新后的当前神经网络模型;

在当前的输出特征的误差小于或等于设定值时,将所述当前神经网络模型作为所述目标神经网络模型,在当前的输出特征的误差大于设定值时,执行步骤a-c,直至当前的输出特征的误差小于或等于设定值。

8.根据权利要求7所述的方法,其特征在于,所述前向传播公式包括:其中,xt表示t时间的输入向量;ht表示隐藏层,Whx、Whh分别表示输入层和隐藏层权重矩阵;bh表示隐藏层偏差;α表示一四元数分离的激活函数;

α定义为:

α(Q)=g(a)+g(b)i+g(c)j+g(d)k;

其中,a、b、c、d分别表示激活函数的输入参数,i,j,k分别表示四元数的三个虚数单位;

上述的前向传播公式输出向量为pt:

Why表示输出层的权重矩阵;β表示任意的分离激活函数;

在t时刻的初始神经网络模型中的遗忘门ft,输入门it,输出门ot,神经元状态Ct以及隐藏层状态ht的公式包括:ht=ot×tanh(Ct);

其中,tanh(·)表示激活函数,xt表示t时间的输入向量,α表示一四元数分离的激活函数,Wf、Wi、Wo、Wc分别表示输入权重矩阵,R表示循环权重矩阵,b表示偏置向量,×表示两四元数的分量形式乘积, 表示两四元数的Hamilton乘积,bf、bi、bc、bo分别表示遗忘门、输入门、输出门、神经元状态对应的偏置向量。

9.根据权利要求7所述的方法,其特征在于,所述反向传播公式包括:待确定参数的更新公式包括:

其中,λ表示学习率,yt表示表情的标签向量, 表示ht的共轭四元数,Et表示初始神经网络模型的损失函数,W表示权重矩阵,Wi、Wj、Wk分别表示三个虚数对应的权重矩阵,Whx表示输入层的权重矩阵,bh表示隐藏层偏差,b表示偏置向量。

10.一种表情识别装置,其特征在于,包括:

第一获取模块,用于将待识别图像进行处理,以获取人脸图像;

形成模块,用于将所述人脸图像中的各个像素点使用四元数进行表示,形成人脸四元矩阵,其中,四元数中的每一虚数的权重表示其中一颜色分量的值;

识别模块,用于将所述人脸四元矩阵作为目标神经网络模型的输入,对所述待识别图像进行识别,以得到所述待识别图像中的人脸的表情。

11.一种表情识别模型训练装置,其特征在于,包括:

第二获取模块,用于将初始数据集进行处理,以获取人脸图像集,所述初始数据集中的各个图像中包含人脸部分;

得到模块,用于将所述人脸图像集中的各个人脸图像中的各个像素点使用四元数进行表示,以得到所述人脸图像集中的各个人脸图像的人脸四元矩阵,各个人脸图像的人脸四元矩阵形成训练数据集,其中,四元数中的每一虚数的权重表示其中一颜色分量的值;

训练模块,用于将所述训练数据集输入初始神经网络模型中进行训练,以得到目标神经网络模型,所述目标神经网络模型为权利要求1-5任意一项所述的方法中的目标神经网络模型。

12.一种电子设备,其特征在于,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行如权利要求1至9任一所述的方法的步骤。

13.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至9任一所述的方法的步骤。