1.一种基于通用逆扰动防御矩阵的对抗攻击防御方法,其特征在于,包括:(1)准备训练集,采用多种攻击方法对训练集进行攻击,生成对抗样本;
(2)使用迭代方法生成通用逆扰动防御矩阵,具体过程为:(2-1)构造用于样本分类的深度学习网络模型,使用训练集对网络模型进行训练,训练结束后保存模型参数;
(2-2)把步骤(1)中生成的对抗样本与训练集按比例混合后得到数据集x,将数据集x输入到通用逆扰动矩阵X=(x1,x2,x3...xm)中进行迭代训练;训练通用逆扰动矩阵时,模型的输入为x+X,预测的输出结果为y’,样本的真实标签为y,每次迭代后,更新通用逆扰动矩阵的权重,到达迭代上限后结束,得到通用逆扰动防御矩阵;
(3)应用时,将待分类样本先经过训练好的通用逆扰动防御矩阵后再输入模型,使待分类样本中的对抗样本能够被正确识别,完成对对抗样本的防御。
2.根据权利要求1所述的基于通用逆扰动防御矩阵的对抗攻击防御方法,其特征在于,步骤(1)中,所述的多种攻击方法包括CW攻击、FGSM攻击、Box-constrained L-BFGS攻击、DeepFool攻击、Jacobian-based Saliency Map攻击和Universal Adversarial Perturbations攻击。
3.根据权利要求1所述的基于通用逆扰动防御矩阵的对抗攻击防御方法,其特征在于,步骤(2-1)中,训练网络模型时,使用交叉熵作为损失函数:其中,yi是类别i的真实标签,pi是softmax函数计算出来的类别i的概率值;k是类别数,N是样本总数,其状态Softmax的计算公式:公式中的分子ezi是要计算的类别i的网络输出的指数,分母 是所有类别网络输出的指数和。
4.根据权利要求1所述的基于通用逆扰动防御矩阵的对抗攻击防御方法,其特征在于,步骤(2-2)中,更新通用逆扰动矩阵的权重w公式为:其中C是迭代的步长,j(w,x)是对错误分类敏感的准则函数,使权重能够沿着最快的方向更新;设准则函数为:T T
j(w,x)=|wx|-wx
当预测输出的标签与样本的真实标签不一致时,wTx<0,j为正值,权重更新:w(k+1)=w(k)+2C
当预测输出的标签与样本的真实标签一致时,wTx>0,j=0,权重保持不变。
5.根据权利要求1所述的基于通用逆扰动防御矩阵的对抗攻击防御方法,其特征在于,步骤(2-2)中,训练通用逆扰动矩阵时,使用交叉熵函数作为训练的损失函数,使用Adam优化器进行优化,该交叉熵损失函数公式:loss=-[ylogy’+(1-y)log(1-y’)]其中,y’为预测的输出结果为,y为样本的真实标签。
6.一种基于通用逆扰动防御矩阵的对抗攻击防御方法,其特征在于,包括:(1’)准备训练数据集,采用多种攻击方法对训练数据集进行攻击,生成对抗样本;
(2’)使用通用逆扰动防御矩阵生成网络生成通用逆扰动防御矩阵,具体过程为:(2-1’)构建通用逆扰动防御矩阵生成网络,其包括解码器和编码器,生成网络的输入为高维噪声和样本,样本包括良性样本和步骤(1’)中的对抗样本,输出为通用逆扰动防御矩阵;
(2-2’)使用良性样本和对抗样本交替训练通用逆扰动防御矩阵生成网络;其中,编码器对输入的样本进行映射,得到编码后的向量,解码器对编码的向量进行映射,得到重构后的向量,编码器和解码器同时训练,训练的目标是最小化重构误差;
(2-3’)训练结束以后,利用通用逆扰动防御矩阵生成网络生成通用逆扰动防御矩阵;
(3’)应用时,将待分类样本先经过得到的通用逆扰动防御矩阵后再输入模型,使待分类样本中的对抗样本能够被正确识别,完成对对抗样本的防御。
7.根据权利要求6所述的基于通用逆扰动防御矩阵的对抗攻击防御方法,其特征在于,步骤(2-2’)中,编码器的映射是将输入样本x映射成低维的向量y,降维执行以下变换:y=W(x-m)
其中,W是投影矩阵,从样本集中获取,m是样本集的均值向量;
编码器的映射是将降维后的向量y重构出原始的向量x的过程,通过重构算法实现:x=WTy+m
解码器映射函数为h,解码器的映射函数为g,训练时优化的目标函数为:其中,l为训练样本数,θ和θ'分别是编码器和解码器的内部参数。
8.一种基于通用逆扰动防御矩阵的对抗攻击防御方法,其特征在于,包括:(1”)准备训练数据集,采用多种攻击方法对训练数据集进行攻击,生成对抗样本;
(2”)使用通用逆扰动防御矩阵生成网络生成通用逆扰动防御矩阵,具体过程为:(2-1”)构建通用自集成逆扰动防御矩阵生成网络,其包括解码器和编码器,且生成网络的输出口设有多个并行的单层卷积,单层卷积之间增加lock卷积层,生成网络的输入为高维噪声和样本,样本包括良性样本和步骤(1”)中的对抗样本,输出为通用逆扰动防御矩阵;
(2-2”)使用良性样本和对抗样本交替训练通用逆扰动防御矩阵生成网络;其中,编码器对输入的样本进行映射,得到编码后的向量,解码器对编码的向量进行映射,得到重构后的向量,编码器和解码器同时训练,训练的目标是最小化重构误差;
(2-3”)训练完以后,利用自集成通用逆扰动防御矩阵生成网络生成多个通用逆扰动防御矩阵;
(3”)应用时,将待分类样本先经过得到的多个通用逆扰动防御矩阵后再输入模型,采用多数投票方式确定最后的识别结果,使待分类样本中的对抗样本能够被正确识别,完成对对抗样本的防御。