1.一种基于半监督集成学习的软测量建模对脱丁烷塔底丁烷浓度进行预测的方法,其特征在于,所述方法包括:
步骤1:采集过程有标签样本集L={XL,YL},L表示有标签;和无标签样本集U={XU},U表示无标签,对无标签样本集U采用Bagging算法生成三个无标签样本子集U1、U2、U3;
步骤2:利用有标签样本子集建立初始软测量模型,fi=Learn(Li),Learn为软测量建模方法,初始有标签样本子集Li=L,i=1,2,3;
步骤3:对于U1中的每一个样本xu,采用近邻法分别从L2和L3中选择出num个距离近的样本,得到近邻样本集Ω2和Ω3;
步骤4:如式(1)采用f2和f3对xu进行预测,得到xu的伪标记yu,2和yu,3,{xu,yu,j}被称为伪标记样本,对添加伪标记样本后的有标签样本子集建立如式(2)所示的软测量模型;
yu,j=fj(xu),j=2,3 (1)f′j=Learn(Lj∪{xu,yu,j}) (2)步骤5:根据式(3)计算xu在学习机f2和f3下对应的置信度指标 根据式(4)对两个置信度进行融合得到最终的置信度指标Threshold;
其中Ωj为无标签样本xu分别从L2和L3中选取出的近邻样本集,yi为num个近邻样本的真实标签值,fj(xi)为xi对应的初始模型预测结果,fj′(xi)为添加伪标记样本xu之后建立的软测量模型的预测结果;
步骤6:根据Threshold选择置信度高的无标签样本并对其添加标记,对应的标记值为yu=(yu,2+yu,3)/2,并将添加标记后的伪标记样本{xu,yu}添加到L1有标签样本集中,Threshold值越小代表置信度越高;
步骤7:同理可利用U2和U3对L2和L3进行样本扩充;
步骤8:重复上述步骤2‑步骤7T次,直至达到最大迭代次数或L1、L2、L3不再发生改变;
步骤9:利用更新后的有标签样本集L1、L2、L3,建立软测量回归模型,得到fi=Learn(Li);
步骤10:对于新来样本,分别采用模型fi,i=1,2,3进行预测,采用均值融合方式,对各模型的预测值进行融合,得到最终的预测输出值;
样本中的数据来自于脱丁烷塔E过程。
2.根据权利要求1所述的方法,其特征在于,采用Tri‑training回归算法估计出缺失的主导变量值,建立融合的单一置信度计算方式对无标签进行选择标记,采用集成学习的思想建立差异性的模型。