欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018107623139
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于生成对抗网络与自适应比例生成新样本的方法,包括以下步骤:S1,在输入样本上直接添加由生成对抗网络生成的与输入样本分布接近的噪声;

S2根据样本方差构造自适应比例,将输入样本与生成对抗网络生成的噪声以该比例进行融合生成新样本,新样本根据自适应比例调节噪声与输入样本比重;

S3通过像素相加的操作为新样本补充输入样本信息,生成有益于提高DNN检测率的最终样本。

2.根据权利要求1所述的基于生成对抗网络与自适应比例生成新样本的方法,其特征在于,所述步骤S1具体包括:步骤一,生成对抗网络中的生成网络使用四个卷积层对输入样本Xi进行下采样操作,得到低维隐变量,再将低维隐变量经过四次相反的卷积操作,对隐变量进行上采样操作,将其映射回高维数据空间,得到与输入样本相似的噪声;其中,Xi为输入样本,假设样本总数为N,i∈[1,N],N是一个有限的实数,其大小等于训练集中样本的总数,训练集确定下来后,N的大小也随之确定;例如:假设训练集中有10000图片,N的大小就是10000;

步骤二,将输入样本与噪声共同送入生成对抗网络中的鉴别网络,鉴别网络与生成网络形成对抗机制,在二者的博弈过程中,噪声的分布与输入样本的分布越来越接近,最终生成网络与鉴别网络达到动态平衡,生成网络的输出就是所需要的最终的噪声。

3.根据权利要求2所述的基于生成对抗网络与自适应比例生成新样本的方法,其特征在于,所述步骤一具体为:假设输入样本Xi的分布为Pdata,生成网络利用若干卷积层将输入样本映射到低维隐变量空间,得到分布为PZ(Zi)的低维隐变量Zi,然后生成网络根据低维隐变量Zi生成分布为Pg的新图片,该新图片就是本发明所需要添加到Xi上的噪声,用符号G(X)表示生成网路根据Xi生成新图片的过程;D(X)表示鉴别网络判断X来自于Pdata或Pg;训练鉴别网络时最大化拥有正确标签图片的概率;训练生成网络时,最小化log(1-D(G(X))),相当于使生成图片的分布越接近Pdata;用公式(1)表示如下所示;

minGminDV(D,G)  (1)

其中,

令V(D,G)关于D(X)的导数为0,有公式(2);

那么,最优判别网络如公式(3)所示;

从公式(3)中可以看出,一个样本X来自真实分布Pdata和生成分布Pg的可能性是相对比例;如果Pdata(X)=0,Pg(X)≠0,最优判别网络的概率0;如果Pdata(X)=Pg(X),说明样本是真假的概率各占一半,最优判别网络的概率为0.5;将最优判别网络带入V(D,G),进行简单变换最终到公式(4);

此时可以直观的看出生成对抗网络使用JS散度衡量真实分布与生成分布之间的距离,网路在优化JS散度时,相当于将生成分布Pg拉向真实分布Pdata,最终以假乱。在对抗机制下,Pg慢慢逼近Pdata,从而得到本发明所需的与输入样本分布相似的噪声。

4.根据权利要求1-3任一所述的基于生成对抗网络与自适应比例生成新样本的方法,其特征在于,所述步骤S2具体包括:步骤三,提取一个批量上所有样本的方差,并将该批量上所有样本方差归一化,当前样本的方差vari与所有当前批量样本之和 的比值就是自适应比例ratioi,将该自适应比例作为输入样本的权重,将该1-ratioi作为步骤二中生成噪声的权重,生成新样本用公式表示为:当损失函数比较陡峭时,新样本 中的噪声比例减小,避免损失函数越过最小值;当损失函数比较平坦时,新样本中的噪声比例增大,有助于加快网络的收敛速度。

5.根据权利要求4所述的基于生成对抗网络与自适应比例生成新样本的方法,其特征在于,所述步骤三包括:输入样本与模型参数的关系的建立、模型参数与最小值的关系的建立、根据样本方差设计自适应比例。

6.根据权利要求5所述的基于生成对抗网络与自适应比例生成新样本的方法,其特征在于,所述输入样本与模型参数的关系的建立具体为:假设第i个样本为Xi,经过一个线性模型后得到h(θ,Xi);

h(θ,Xi)=θTXi  (5)

其中,θ表示模型参数(不包括输入样本),假设样本总数为N,i∈[1,N];

采用DNN中常用的损失函数最小均方误差(MSE),假设损失函数为f(θ,X),f(θ,X)表示预测值h(θ,Xi)与真实值yi之间差值的平方,其中,系数1/2无限定意义,仅为了便于计算;

在GD算法中,每次迭代都用到所有样本,参数更新如下:

其中,j表示迭代次数,j≥0,η是一个超参数,根据具体应用,赋予其合适的常数值;

在SGD中使用一个样本进行梯度更新,即 中的N等于1,每一次更新参数使用一个样本;在样本量很大的情况下(如几十万),那么可能只用其中几万条或者几千条的样本,就能够将θ迭代到最优解,SGD参数更新如下:θj+1=θj-ηgj  (10)

在模型训练时,SGD算法一般计算一个批量的梯度,此时将公式(9)中的gj写成公式(11)gB的形式,其中, 是一个大小为M的mini-batch(小批量);

i i i

从公式(9)中可以看出||gj||∝||h(θ,X)||,由于||h(θ,X)||∝||X||,那么||gj||∝||Xi||,gB是计算一个小批量上的gj,gB∝gj;在数据集中所有样本独立同分布,那么模型参数θ的一阶导数方差var(gi)与样本Xi方差vari之间存在正比的关系,即var(gj)∝vari,那么var(gB)∝vari;DNN中通过卷积层和激活函数对输入样本进行变化,卷积操作可以看作是线性变化过程,激活函数虽然引入了一定的非线性,但是一般也是与输入样本成正比,所以var(gB)仍然近似正比于vari;

以SGD为例,继续分析,SGD相当于通过一个小批量估计gB来估计数据集的梯度gN,由Chaudhari&Soatto定理可知,在回置抽样(有放回的抽样)中,大小为B的小批量的方差等于当损失函数接近最小值时,D(θ,X)相当于Hessian矩阵 的缩放版,即 由于var(gB)∝vari,那么

由于var(gB)≥0,在D(x)为 的缩放版,

时,

7.根据权利要求5所述的基于生成对抗网络与自适应比例生成新样本的方法,其特征在于,所述模型参数与最小值的关系的建立具体为:为了更直观的分析最小值与模型参数的θ关系,引入三种局部平滑序列;

假设θ*是 为最小值时的模型参数,{θj}j≥0为参数更新过程,θ*的邻域为其中 θ*的局部平滑序列定义为{Λ{θj}j≥0,如公式(14)所示,

在{θj}j≥0中的前向邻域记为 其中 一个理想局

部平滑序列为 如公式(15)所示,

在{θj}j≥0中的后向邻域记为 其中 一个预测局

部平滑序列为{L(θj)}j≥0,如公式(16)所示,

Λ(θj)控制θ*和θj之间的平滑度确保参数更新的收敛性, 是一个理想局部平滑能够使θj快速移向θj+1,由于θ*和θj+1未知,Λ(θj)和 不能直接被计算,L(θj)与θj、θj-1相关,通过预测平滑序列,从而构造预测噪声;当损失函数二阶连续可导,有下面公式,将L(θj)的导数作为SGD等算法的自适应学习率,当L(θj)大的时候,即大,学习率降低,每次更新的步长为学习率与 的乘积,在

不变的情况下,参数更新时的步长减小;当L(θj)减小的时候, 的值减小,学习率增大,参数更新时的步长增大;在每次迭代时,函数fθ(θ,Xi)的平滑度L(θj)与成反比,那么在整个网络的参数更新中,L(θ)与 成反比:当 大时,由于损失函数变化剧烈,函数波形陡峭,参数更新时的步长减小;

当 小时,由于函数变化缓慢,函数波形平坦,参数更新时步长增大。

8.根据权利要求5所述的基于生成对抗网络与自适应比例生成新样本的方法,其特征在于,根据样本方差设计自适应比例具体为:由于 与函数平滑度成反比,由于这里的vari≥

0, 可以将 的绝对值去掉;下面提到的 就是

指去掉绝对值的Hessian矩阵;设计自适应比例为ratioi,将生成对抗网络生成的噪声与当前输入样本Xi融合生成新样本如公式(18)所示。

ratioi由根据样本方差生成,当样本方差vari增大时,ratioi增大, 的值增大,损失函数比较“陡峭”,由公式(18)可知噪声的权重为1-ratioi,即新样本 根据vari自动调小噪声的比例,减小加到样本上的噪声,因为如果此时ratioi过大,那么参数更新时可能越过最小值点;在vari值减小时,ratioi减小, 值减小,当损失函数比较平坦,噪声的比例大,扰动大,参数更新时变化幅度大,有助于加速函数收敛;在一个批量(大小为M)上提取样本方差,为了消除样本幅度不一致带来的影响,将所有样本的方差归一化,即vari∈[0,1],i∈[1,2,…,M],并且将归一化后的样本方差相加得到假设当前输入样本是Xi,那么该样本权重为ratioi=vari/var,该样本所添加的噪声的权重为1-ratioi;当样本噪声vari增大时,样本权重ratioi增大,噪声权重1-ratioi随之减小;当样本噪声vari减小时,样本权重ratioi减小,噪声权重1-ratioi随之增大;从而添加到样本中的噪声能能够根据样本方差自适应调节比例,有益于网络收敛到局部最小值。

9.根据权利要求4所述的基于生成对抗网络与自适应比例生成新样本的方法,其特征在于,所述步骤S3具体包括:步骤四:由于步骤三中,自适应比例小于等于1,所以由噪声与输入样本生成的新样本丢失一部分真实信息,此时将 与Xi进行像素相加,为 补充输入样本信息,最终生成有益于提高DNN检测率的新样本