1.一种基于信号边界摸索攻击的防御方法,包括以下步骤:S101,筛选待攻击信号A,并对该待攻击信号进行初始化添加扰动,以得到对抗信号A';
S102,根据待攻击信号A和对抗信号A'的置信度变化,判断待攻击信号A的周边的决策边界分布状况;
S103,根据待攻击信号A的周边的决策边界分布状况,对对抗信号A'进行扰动修饰,使得对抗信号A'接近预期的边界;
S104,在S103的基础上,随机产生偏离扰动,使得对抗信号A'进行摸索边界,具体过程包括:
S1041,利用公式(1)求出待攻击信号A与对抗信号A'之间的差量评估值diff:diffi=||A'i‑Ai||2 (1)其中,||A'i‑Ai||2为待攻击信号A与A'各个维度上的欧几里得距离;
S1042,产生随机扰动perturb,同时利用公式(1)估计perturb的差量,记作dp,并通过公式(2)对随机扰动perturb的扰动方向进行优化:perturb=[perturb*delta*mean(diff)/dp]·[|A'‑A|/diff] (2)其中,delta是会随着迭代次数不断更新的辅助参数,用来调整对抗信号A'在预定方向上的前进步伐,同样,mean(diff)是对攻击信号A与待优化对抗信号A'之间的差量评估值,mean()表示对diff求算数平均值,dp是用来对信号A'做范围限制的,只不过它不以信号差量为条件,而是根据对实验的预估调整,属于调参,|A'‑A|/diff是通过每个维度的距离偏差,调整待攻击信号A与待优化的对抗信号A'之间的像素差;
S1043利用公式(3)~(6)调整随机扰动perturb的大小,并限定随机扰动perturb的范围;
overflow=perturb+A'‑max (3)perturb=perturb‑overflow*(overflow>0) (4)underflow=‑1*min‑perturb‑A' (5)perturb=perturb+underflow*(underflow>0) (6)其中,max,min分别表示对抗信号中信号点的上限值和下限值,用来防止扰动溢出;
overflow和underflow分别表示信号在添加扰动后,溢出上限与下限的值;
S1044,将优化完成的扰动perturb,添加到对抗信号A'中,并输入信号分类模型获得分类结果,如果分类结果与刚完成初始化的对抗信号A'一致,同样是错误的分类结果,执行S105;如果分类结果不一致,那么对抗信号A'在添加扰动时,摸索到了错误的边界,则需要调整辅助参数delta和辅助参数dp,重复S1041~S1044;
S105,在S104的基础上,优化扰动,以使对抗信号A'不偏离预期轨迹,具体过程包括:S1051,在S104的基础上,利用公式(1)求出待攻击信号A与对抗信号A'之间的差量评估值,记作diff;
S1052,在S1051的基础上,利用公式(7)生成弥补扰动rep,并将添加弥补扰动rep到对抗信号A'中,在保持完整对抗性的同时,减小对抗信号A'的损失;
rep=(A'‑A)*epsilon/diff (7)其中,epsilon表示步长,是训练开始前人为预设的一个参数,用来调节弥补的大小;
S1053,将对抗信号A'并输入信号分类模型获得分类结果,如果分类结果与初始化的对抗信号A'一致,同样是错误的分类结果,则执行S106;如果分类结果不一致,那么对抗信号A'在添加扰动时,摸索到了错误的边界,则需要调整参数epsilon,重复S1051~S1053;
S106,重复S104和S105,直到达到迭代上限或得到对抗信号A';
S107,对对抗信号进行筛选获得优质的对抗信号,将筛选后的对抗信号加入到训练集中,然后利用训练样本集对信号分类模型进行训练,以获得能够防御对抗攻击的信号分类模型;
S108,利用信号分类模型对待分类信号进行分类,以实现对攻击的防御。
2.如权利要求1所述的基于信号边界摸索攻击的防御方法,其特征在于,S102中,将待攻击信号A和对抗信号A'输入至信号分类模型中,计算并输出待攻击信号A和对抗信号A'的置信度,根据两个置信度的变化情况,分析判断该待攻击信号A周边的决策边界分布状况。
3.如权利要求1所述的基于信号边界摸索攻击的防御方法,其特征在于,S103中,根据待攻击信号A的周边的决策边界分布状况,优化完善对抗信号A'的扰动特性,具体过程为:观察对抗信号A'的置信度,先确定一个预估值,为对抗信号A'置信度距离0.55的偏差值乘以极大扰动;其次,将对抗信号A'在极大扰动的相反方向添加预估值,并做极小方向的偏移。
4.如权利要求1所述的基于信号边界摸索攻击的防御方法,其特征在于,S107中,通过观察对抗信号的置信度,类标,以及添加扰动大小,添加扰动可见程度,调整参数delta,epsilon的初始值,生成大量的对抗性全面的不同类型信号的对抗信号,按照同样标准,对对抗信号进行筛选获得优质的对抗信号。