1.一种带时延估计的加权高斯模型软测量建模方法,其特征在于,所述方法包括:步骤1:获取历史采样输入和输出数据,组成历史训练样本数据库;根据过程机理和经验确定最大时延参数Tmax;
步骤2:将历史训练样本数据库中的训练样本数据进行归一化处理,通过滑动灰关联度分析算法确定各输入变量的最优时延参数,所述最优时延参数定义为λ1,λ2,…,λm;其中m为训练样本的维度;
步骤3:对训练样本数据按照滑动灰关联度分析算法确定的最优时延参数进行数据重构;
步骤4:当查询样本xq到来时,在线对查询样本xq建立加权高斯模型;
所述步骤2中,通过滑动灰关联度分析算法确定各输入变量的最优时延参数,包括:通过滑动灰关联度分析算法选择重要的输入变量:构建输入和输出变量之间的函数关系,从而确定对输出变量重要的输入变量;假设有m个输入变量{xi,i=1,2,...,m}和输出变量y,采集到的样本个数为n,令xi(t)为第t时刻样本的第i个变量,y(t)为对应的输出变量;
引入时滞信息,原有的输入变量xi转变为Tmax+1维:{xi(t),xi(t-1),...,xi(t-λ),...,xi(t-Tmax)},其中,t为输出变量的采样时刻,λ为待确定的时延变量;对于每个输入变量xi(t-λ),i=1,2,...,m在t时刻与其输出变量y(t)的关联系数定义为:式(1)中,r(xi(t-λ),y(t))表示t时刻第i个变量时延值为λ的滑动灰关联度大小;ρ∈[0,1],为分辨系数;
通过式(1)得到n个样本的关联系数,对于一个整体的待比较数列而言,定义其灰关联度为:对r(xi,λ,y)按大小进行排序,得到各个时延参数下辅助变量对主导变量的重要程度;
根据各个时延参数下辅助变量对主导变量的重要程度确定各输入变量的最优时延参数。
2.根据权利要求1所述的方法,其特征在于,所述根据各个时延参数下辅助变量对主导变量的重要程度确定各输入变量的最优时延参数,包括:若式(2)得到的灰关联度r(xi,λ,y)越接近1,相对应的辅助变量xi(t-λ)对主导变量的贡献率越大;由此确定各输入变量的最优的时延参数。
3.根据权利要求2所述的方法,其特征在于,所述当查询样本xq到来时,在线对查询样本xq建立加权高斯模型,包括:历史训练样本数据库中的输入样本xi与查询样本xq相应的欧氏距离定义为:其中,di是查询样本与第i个历史样本之间的距离;距离越大,表示历史样本与查询样本的相关性越小,对应的权重越小;权重定义如下:式中,δ为调整参数;
在查询样本xq周围构建加权高斯模型。
4.根据权利要求3所述的方法,其特征在于,所述在查询样本xq周围构建加权高斯模型,包括:假设历史输入和输出联合向量为Z=[xT,yT]T,查询样本xq周围的输入和输出变量的联合密度分布服从高斯分布:其中,θw={μw,Cw},μw、Cw分别表示权重为w下的均值和方差;
采用加权对数似然函数对参数μw进行估计,确定最优参数;
对所述加权对数似然函数进行极大似然估计,得到加权高斯模型的最优参数为:在使用历史训练样本数据库中的训练样本数据对得到的加权高斯模型进行训练后,在查询样本周围得到一个加权高斯模型来描述输入和输出变量的联合密度分布;
对于多变量高斯分布,根据联合向量Z将均值向量μw和协方差Cw分割成与其相对应的输入和输出部分;
其中,uw,x表示权重为w的历史输入样本的均值,uw,y表示权重为w的历史输出样本的均值,Cw,xx表示权重为w的历史输入样本的自协方差,Cw,yy表示权重为w的历史输出样本的自协方差;Cw,xy表示权重为w的历史输入输出样本的协方差,Cw,yx表示权重为w的历史输出输入样本的协方差;
对于特定的查询样本xq,输出变量的分布服从高斯分布;因此,查询样本xq的预测输出值 和预测方差 分别为:
5.根据权利要求1~4任一所述的方法,其特征在于,所述方法为应用于复杂工业过程中对无法直接测量的变量的预测方法。
6.根据权利要求5所述的方法,其特征在于,所述复杂工业过程包括化工、冶金、发酵和污水处理过程。
7.根据权利要求6所述的方法,其特征在于,所述方法为应用于脱丁烷塔过程中对于丁烷浓度的预测方法。