欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 201810692852X
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种自动生成样本的多牌号化工过程软测量建模方法,其特征在于,所述方法包括以下步骤:

(1)划分多牌号化工过程数据集

将从多牌号化工过程中采集到的数据作为原始数据,按设定比例划分为训练集和测试集,以便于交叉验证;

(2)AGAN模型原理及训练过程建立基于梯度惩罚和Wasserstein距离的生成对抗网络AGAN,将所划分的训练集输入所建立的生成对抗网络,对网络进行训练;

(3)构建新训练集

利用训练好的AGAN生成虚拟样本,与原有的训练集共同形成新的训练集;

(4)根据新的训练集调节软测量模型参数利用新的训练集作为驱动数据,进行软测量建模的训练,调节软测量模型参数以适应新的训练集,利用训练好的软测量模型进行多牌号化工过程关键质量变量的预测;

所述步骤(2)的过程如下:

步骤2.1:建立基于梯度惩罚和Wasserstein距离的生成对抗网络;

Wasserstein距离是用于衡量两分布之间的距离,计算公式如下:其中:Pr为真实数据的分布;Pg为生成数据的分布;Π(Pr,Pg)为Pr和Pg组合起来的所有可能的联合分布的集合;(x,y)~γ表示为从γ中采样得到一个真实数据x和一个生成数据y;||x‑y||为真实数据与生成数据之间的距离;为期望;inf表示取下界;整个W函数表示为在所有的联合分布中对期望值取到的下界,将此期望值定义为Wasserstein距离;

将上述计算公式转换为如下公式:

其中:x服从Pr的分布;服从Pg的分布;f(x)为包含x的函数, 为包含 的函数;K为函数f的Lipschitz常数,表示为在一个连续函数f上加一个限制,使得存在一个常数K≥0让定义域内的任意x1和x2都满足|f(x1)‑f(x2)|≤K|x1‑x2|;||f||L≤K表示函数f的Lipschitz常数不超过K;sup表示取上界;整个W函数表示在函数f的Lipschitz常数不超过K的情况下,

1/K倍的 的上界;

其中:fw(x)为包含x的函数; 为包含 的函数;fw为带参数w的一系列函数,此函数将由生成对抗网络中的网络构造;

根据Wasserstein距离的理论推导,生成对抗网络中,判别器D和生成器G的损失函数如下:

其中:S(D)为判别器损失函数;S(G)为生成器损失函数;Pr为真实数据的分布;Pg为生成数据的分布;x服从Pr的分布;服从Pg的分布;D(x)为包含x的函数; 为包含 的函数;

改进后的判别器的损失函数如下:

其中:为在 和x的连线上随机插值采样的值; 为 的分布;ε为[0,1]之间的随机数;λ是梯度惩罚的系数; 为 函数的梯度的2范数;第一个部分为是生成器生成数据判别为真实数据的概率的期望,第二个部分为真实数据判别为真实数据的概率的期望,第三部分为梯度惩罚;

步骤2.2:基于梯度惩罚和Wasserstein距离的生成对抗网络的网络结构AGAN由生成器和判别器两部分组成,分别为生成器和判别器;生成器由多层感知机构成,输入为符合标准高斯分布噪声,感知机的层数需要根据应用对象决定,第一层为输入层,中间层为隐藏层,最后一层为输出层,输出层的维度输入层维度相同,输入层和隐藏层的激活函数为修正线性单元ReLU;判别器由多层感知机构成,输入为原始训练数据或者生成数据,感知机的层数需要根据具体应用对象决定,第一层为输入层,中间层为隐藏层,最后一层为输出层,输入层和隐藏层的激活函数为修正线性单元;

步骤2.3:基于梯度惩罚和Wasserstein距离的生成对抗网络的训练过程如下生成器用于捕捉样本数据分布,判别器用于估计一个样本数据来自真实数据而非生成数据的概率;生成器的输入为一组高斯分布的噪声,为生成器提供预先的数据分布,生成器能够将此数据分布转化为一组虚拟数据,即生成数据;判别器的输入为真实数据和生成数据,判别器的输出为输入样本是真实数据的概率;根据生成器损失函数,最大化判别器的输出概率能让生成器的损失下降,即生成器的能力提高,使得虚拟数据越接近真实数据的分布;根据判别器损失函数,最小化判别器的输出概率能让判别器的能力提高,使得判别器分辨真实数据与虚拟数据准确率越高;这就是生成对抗网络中,判别器和生成器的对抗性,当判别器和生成器达到平衡时,此时训练过程结束;

步骤2.4:基于梯度惩罚和Wasserstein距离的生成对抗网络参数更新,过程如下:初始化相关参数:梯度惩罚系数:λ=10;w为判别器参数;θ为生成器参数;每次训练生成器,训练判别器的次数,ncritic=5;自适应矩估计的参数:α=0.0001,β1=0,β2=0.9;m为采样的个数;

2.4.1)x从真实数据分布Pr中采样,z服从隐空间P(z),隐空间由上述高斯分布的噪声定义,ε为[0‑1]之间的随机数;

2.4.2)判别器损失的计算公式如下:(i)

其中:Gθ(z)为包含z的函数,将z通过生成器进行数据的生成;S(D) 为第i个数据在判别器中计算的损失; 为包含 的函数;Dw(x)为包含x的函数; 为 函数的梯度的2范数;

2.4.3)根据自适应矩估计算法Adam,优化判别器的参数,梯度计算公式如下:其中: 为 的梯度,采用批梯度下降法,每次使用m个样本更新w参数;

2.4.4)重复步骤1‑4ncritic次;

2.4.5)从P(z)中采样m个样本 根据Adam梯度下降法,优化生成器的参数,梯度计算公式如下:

其中: 为 的梯度,采用批梯度下降法,每次使用m个样本更新θ参数。