1.基于实时学习的高斯过程回归多模型融合建模方法,其特征在于,该方法步骤为:步骤1:收集输入输出数据组成历史训练数据库步骤2:利用这些训练数据估计得到高斯混合模型(Gaussian mixture model,GMM)的参数。然后把完整的输入和输出训练数据分配到不同的操作阶段。所述的GMM算法为:n×m
GMM是由多个高斯成分混合而成,关于数据X∈R 的概率密度函数可以表示为:其中,m是过程变量的数目,n是样本数据的大小。 是高斯混合模型的参数,其中μk、 和πk分别代表第k个高斯成分的均值、协方差和权值。
同时,参数πk满足 和0≤πk≤1。式(1)中 表示多元高斯概率密度函数:
通过期望最大化算法(expectation-maximization,EM)估计模型的参数,求解过程分为不断迭代的两步:E-步:根据已有观测数据和由第k个成分产生的概现有模型估计缺失数据γk(xi),得到Q函数:M-步:求解Q函数对每个参数的偏导数,可以获得新的参数估计值:*
根据估计得到的GMM的参数,对于新的输入x,其关于每个高斯成分的后验概率可以通过式(5)求得:步骤3:根据步骤2辨识得到的不同操作阶段,对应建立不同的子数据库。当一个新数据到来,根据这个新的数据隶属于每个子数据库的后验概率,对应的后验概率最大的子数据库发生更新。
步骤4:针对不同的操作阶段,为了对过程变量进行降维,解决不同变量之间很强的相关性,利用传统的PCA方法对过程变量进行分析得到PCA模型的得分变量。PCA算法为:n×m
给定训练数据X∈R ,m是过程变量的维数,n是训练数据的数目。PCA是在X的协方差矩阵基础上实现的。一般情况下,可以通过奇异值分解(singular value decomposition,SVD)的方法建模PCA模型。假设PCA模型有q个主成分,X可以被分解为[11]如下形式 :
n×q
式 中,T∈R 和
m×q
分别是主成分子空间和残差子空间的得分矩阵,P∈R 和 是主成分子空间和残差子空间相应的载荷矩阵,E是残差矩阵。
步骤5:当需要对输入进行预测输出时,不需要知道这个新的数据具体隶属于哪个操作阶段,用JITL在每个操作阶段选择最相似的数据建立各个操作阶段的局部PCA-GPR模型。
JITL算法如下:Step1:计算xq和xi之间的欧氏距离和角度:Δxq=xq-xq-1,Δxi=xi-xi-1如果cos(θi)≥0,计算相似系数si:式中γ是介于0和1之间的权重系数,如果cos(θi)<0,丢弃数据(xi,yi)。计算得到的si也在0和1之间,si越接近1,xi与xq的相似度越高。
Step2:对计算所得的所有相似系数si进行降序排列,建立局部模型时,只选择前L个相似系数较大的数据。为了选择合适比例的建模数据,针对于TE化工过程,数据比例选择从10%逐渐增大到100%,最后得到最佳的数据比例为70%。
根据JITL选择的数据建立的局部GPR模型为:给定训练样本集X∈RD×N和y∈RN,其中X={xi∈RD}i=1…N,y={yi∈R}i=1…N分别代表D维的输入和输出数据。输入和输出之间的关系由公式(10)产生:y=f(x)+ε (10)其中f是未知的函数形式,ε是均值为0,方差为 的高斯噪声。对于一个新的输入* *x,相应的概率预测输出y也满足高斯分布,其均值和方差如式(11)和(12)所示:* * T * -1
y(x)=c(x)C y (11)* * * T
式中c(x)=[c(x,x1),…,c(x,xn)]是训练数据和测试数据之间的协方差矩阵。
* *
是训练数据之间的协方差矩阵,I是N×N维的单位矩阵。c(x,x)是测试数据的自协方差。
GPR可以选择不同的协方差函数c(xi,xj)产生协方差矩阵Σ,只要选择的协方差函数能保证产生的协方差矩阵满足非负正定的关系。本文选择高斯协方差函数:d
式中v控制协方差的量度,ωd代表每个成分x 的相对重要性。
对式(4)中的未知参数v,ω1,…,ωD和高斯噪声方差 的估计,一般最简单的方法就是通过极大似然估计得到参数为了求得参数θ的值,首先将参数θ设置为一个合理范围内的随机值,然后用共轭梯*度法得到优化的参数。获得最优参数θ后,对于测试样本x,可以用式(11)和(12)来估计GPR模型的输出值。
步骤6:对步骤5建立的各个操作阶段的局部模型利用式(5)进行融合得到全局预测模型:
2.根据权利要求1所述的基于实时学习的高斯过程回归多模型融合建模方法,其特征在于,当需要对新的数据用软测量模型进行预测时,实时对模型进行更新,而且不需要知道当前过程具体的操作模型。