1.一种分层集成的高斯过程回归软测量建模对脱丁烷塔底丁烷浓度进行预测的方法,其特征在于,该方法步骤为:步骤1:收集过程输入输出数据,组成历史训练数据库,所述数据来自于脱丁烷塔过程;
步骤2:基于历史训练数据估计得到高斯混合模型的参数,然后把完整的输入和输出训练数据划分到不同的操作阶段,所述的高斯混合模型算法为:高斯混合模型假设数据服从具有未知参数的混合高斯分布,给定训练样本集X∈Rn×m和y∈Rn×1,其中n是样本点个数,m是样本维数,假定训练样本X服从K成分的高斯混合模型,则概率密度可以表示为:其中,m是过程变量的维数,n是训练样本的个数,Θ={π1,…,πK,μ1…μK,Σ1,…,ΣK}是高斯混合模型的参数,其中μk、ΣK和πk分别代表第k个高斯成分的均值、协方差和权值;同时,参数πk满足 和0≤πk≤1,式(1)中N(X|Θi)表示多元高斯概率密度函数:通过期望最大化算法估计模型的参数,对于新来样本xq对于每个高斯成分的后验概率可通过式(3)计算得到;
步骤3:根据步骤2辨识得到的不同操作阶段,对应建立不同的子数据库,针对不同的操作阶段数据采用子空间PCA进行分解,子空间PCA算法为:假设有训练样本集D={X,y},其中X={xi∈Rm}i=1,2,...,n是n个训练输入样本,m是辅助变量个数,y={yi∈R}i=1,2,...,n是n个输出样本,PCA模型如式(4)和(5)所示:X=TPT+E (4)
T=XP (5)
m×t n×t n×m
式中,P∈R 和T∈R 分别表示第k个操作阶段下的载荷矩阵和得分矩阵,E∈R 表示残差矩阵,t表示选择的主成分数目,不同主元之间互不相关,根据主元方向构建不同的子模型,增加模型间的差异性,在每个主元方向上,由每个变量的贡献指数来衡量其重要性,贡献指数的定义如式(6)所示:其中i=1,2,...,m,j=1,2,...,t,pij是载荷矩阵对应的第j个主元上的第i个元素,CI的值越大,表示变量包含的信息越多,与主元方向的相关性越强,根据CI的值进行降序排列,设置不同的CI阈值确定各子空间模型选取的辅助变量个数;
基于主元方向的不相关性,根据不同主元方向将训练样本集X划分为d个不同的子空间;
步骤4:在d个不同主元方向将第k个操作阶段下的样本集Sk划分为d个不同的子空间;
步骤5:对不同的子空间建立离线的局部SPCA-GPR模型;
给定数据集{X,y},其中X∈Rn×m,y∈Rn×1,n样本点数,m是样本维数,输入输出之间满足式(8)所示关系:y=f(x)+ε (8)式中ε是均值为0,方差为 的高斯噪声,f是未知的函数形式;GPR假设回归函数y=f(x)具有零均值的高斯先验分布,描述如式(9):y~N(0,C) (9)
式中C为n×n的协方差矩阵,其i行j列元素定义为Cij=C(xi,xj;θ),协方差矩阵通过核函数计算得到,文中选取平方指数协方差核函数,定义如式(10)所示:式中δij=1仅在i=j时成立,否则δij=0,l为方差尺度, 为信号方差, 为噪声方差,为GPR的超参数,超参数的选取对模型性能有很大影响,采用最大似然估计法可以获得最优的超参数;
对于新来的样本xq,其对应的GPR模型输出均值和方差如式(11)和(12)所示:其中c(xq)=[C(xq,x1),...,C(xq,xn)]是新来样本与训练样本间的协方差矩阵,C是训练样本之间的协方差矩阵,C(xq,xq)是新来样本的自协方差;
步骤6:对于新来样本点,根据式(12)所示建立好的离线SPCA-GPR模型,得到子空间下的预测值,由式(13)得到第一层集成输出;
其中 是第k个操作阶段第i个子空间模型的预测输出, 是第k个操作阶段的局部输出;
步骤7:计算新来样本点对于各操作阶段的后验概率,根据式(14)进行融合输出,得到最终的质量预测,完成第二层集成输出:其中的P(Sk|xq)根据式(3)可计算得到:
步骤8,预测产品塔底丁烷浓度的在线预测值和实际值拟合曲线散点分布,与所建立的基于随机子空间的分层集成软测量模型进行了比较,基于分层集成的高斯过程回归软测量模型能够有效地预测脱丁烷塔过程中的塔底丁烷浓度含量。