1.一种跨模型人脸特征向量的转换系统,其特征在于,包括数据提取模块、网络训练模块、转换模块;所述数据提取模块用于收集人脸图像数据集、源特征向量以及目标特征向量;标注人脸图像数据集的身份类别并形成训练数据集,所述训练数据集的训练样本为人脸图像数据与源特征向量;
所述网络训练模块用于将训练数据集输入网络模型进行训练并得到训练后的网络模型;所述网络模型由卷积网络部分和变形注意力机制网络部分组成;所述网络训练模块用于将训练数据集中的源特征向量、人脸图像数据对应输入到网络模型中的卷积网络部分、变形注意力机制网络部分进行训练;
所述转换模块用于将待转换的人脸特征向量输入网络训练模块中训练后的网络模型,并输出转换后的人脸特征向量。
2.根据权利要求1所述的一种跨模型人脸特征向量的转换系统,其特征在于,所述变形注意力机制网络部分包括依次设置的卷积层、多头注意力机制模块、批归一化层、全连接层、激活函数层,所述卷积层用于将图像下采样提高语义性;所述多头注意力机制模块用于将卷积特征分片,并提取每片特征之间的关系信息。
3.根据权利要求2所述的一种跨模型人脸特征向量的转换系统,其特征在于,所述变形注意力机制网络部分由从前至后依次设置的第一集成模块、位置嵌入向量层、第二集成模块、批归一化层、全连接层、激活函数层、全连接层、激活函数层封装得到;所述第一集成模块、第二集成模块分别设置有若干个;所述第一集成模块与位置嵌入向量层相加后并与第二集成模块连接;所述第一集成模块由从前至后依次设置的卷积层、批归一化层、激活函数层组成,所述第二集成模块由重组向量层、多头注意力机制模块、特征相加层、批归一化层组成。
4.根据权利要求3所述的一种跨模型人脸特征向量的转换系统,其特征在于,所述多头注意力机制模块由依次设置的若干个第三集成模块以及特征拼接层、全连接层组成;若干个第三集成模块分别与特征拼接层连接,所述第三集成模块由从前至后设置的3个全连接层以及特征相乘层、特征向量开方层、柔性最大值层、特征相乘层构成,前2个全连接层分别输入特征相乘层处理,然后依次与特征向量开方层、柔性最大值层连接;最后与剩下的1个全连接层经过特征相乘层处理后输入特征拼接层。
5.根据权利要求1所述的一种跨模型人脸特征向量的转换系统,其特征在于,所述卷积网络部分由10块从前至后依次设置的卷积层、批归一化层、激活函数层堆叠的块组成。
6.根据权利要求1‑5任一项所述的一种跨模型人脸特征向量的转换系统,其特征在于,所述转换系统还包括特征拼接层、第一全连接层、第二全连接层、第三全连接层,所述卷积网络部分和变形注意力机制网络部分的输出端分别与特征拼接层连接,所述特征拼接层与第一全连接层连接,所述第一全连接层的输出端分别与第二全连接层、第三全连接层连接,所述第二全连接层、第三全连接层的输出端分别对应设置有分类类别损失函数、向量转换损失函数。
7.一种跨模型人脸特征向量的转换方法,采用权利要求1‑6任一项所述的转换系统进行转换,其特征在于,包括以下步骤:步骤S100:收集人脸图像数据集、源特征向量以及目标特征向量;标注人脸图像数据集的身份类别并形成训练数据集;将人脸图像数据与源特征向量作为训练样本,且标注的身份类别作为真实标签值;
步骤S200:将训练样本输入网络模型进行训练,并计算网络模型的损失函数,并通过端到端的训练达到优化目的;
步骤S300:随机初始化网络模型的权重参数,并设定最大迭代次数,选择优化器优化损失值,重复计算,直至损失值收敛,网络模型性能最优,得到训练后的网络模型;
步骤S400:将待转换的人脸特征向量输入训练后的网络模型,并输出转换后的人脸特征向量。
8.根据权利要求7所述的一种跨模型人脸特征向量的转换方法,其特征在于,所述步骤S200中的损失函数包括分类类别损失函数和向量转换损失函数;所述分类类别损失函数采用柔性最大值损失函数,用于计算预测身份类别与真实身份类别标签之间的损失值;所述向量转换损失函数是计算网络模型预测得到的特征向量与目标特征向量之间的余弦夹角损失值,并通过衰减余弦夹角损失值达到网络模型性能优化的目的。
9.根据权利要求7所述的一种跨模型人脸特征向量的转换方法,其特征在于,所述步骤S300中利用预热余弦学习率下降法在迭代计算时衰减学习率,优化器为带牛顿动量的随机梯度下降法,且动量参数设为0.9;所述最大迭代次数为20000次,其中预热迭代次数预先设为1000次。