1.一种基于集成变量选择型偏最小二乘回归的软测量方法,其特征在于,包括以下步骤:(1):利用集散控制系统收集工业生产过程中容易测量的数据组成软测量模型的输入训练数据矩阵X∈Rn×m,并对其进行标准化处理使各个过程变量的均值为0,标准差为1,得到新数据矩阵 其中,n为训练样本数,m为过程测量变量数,R为实数集,Rn×m表示n×m维的实数矩阵;
(2):采用离线分析手段获取与输入训练数据X相对应的产品质量数据组成输出训练数据Y∈Rn×1,计算向量Y的均值μ与标准差ε,并对其进行标准化处理得到新输出数据(3):利用偏最小二乘回归(PLSR)算法建立输入数据 与输出 之间的回归模型,如下所示:m×d 1×d
其中, 为PLSR模型中d个得分向量组成的矩阵,P∈R 与G∈R 分别为输入与输出数据的载荷矩阵,E∈Rn×m与F∈Rn×1分别为输入与输出数据的模型误差,U∈Rm×d为投影变换矩阵,β=UGT为回归系数向量,上标号T表示矩阵或向量的转置;
(4):分别利用回归系数PLSR(β-PLSR)法、变量重要性PLSR(VIP-PLSR)法、和无益变量剔除PLSR(UVE-PLSR)法建立相应的软测量模型,并保留各自的回归系数向量β1,β2,β3,以及各自用于变量选择的位置标号集θ1,θ2,θ3以备调用;
(5):按照如下所示公式,分别利用β-PLSR、VIP-PLSR、和UVE-PLSR模型中的回归系数向量β1,β2,β3计算对应于输出 的估计值,分别记做y1,y2,y3,即:yk=Xkβk (2)
上式中,Xk为依据位置标号θk从矩阵 中选取相应的列组成的数据矩阵,下标号k=1,
2,3,并将y1,y2,y3组成新的输入矩阵Z=[y1,y2,y3]∈Rn×3;
(6):再次利用PLSR算法建立新输入Z与输出 之间的回归模型 其中,b=[b1,b2,b3]∈R3×1为回归系数向量,元素b1,b2,b3分别为β-PLSR、VIP-PLSR、和UVE-PLSR模型的权值,值得指出的是,利用PLSR算法建立Z与 之间的回归模型的具体实施过程与步骤(3)相似,这里不再赘述;
(7):收集新的容易测量的数据xt∈Rm×1,并对其进行与X相同的标准化处理得到下标号t表示当前最新采样时刻;
(8):依据位置标号θ1,θ2,θ3分别从向量 中选取相应的元素,对应组成新输入向量x1,x2,x3;
(9):根据如下所示公式,利用β-PLSR、VIP-PLSR、和UVE-PLSR模型中的回归系数向量分别计算得到t时刻的输出估计值 即:(10):通过加权法计算t时刻的输出估计值 那么t采样时刻的质量指标的最终估计值为
2.根据权利要求1所述的基于集成变量选择型偏最小二乘回归的软测量方法,其特征在于,所述步骤(3)中利用PLSR算法建立输入矩阵 与输出向量 之间回归模型的详细实施过程具体为:①初始化d=1,并设置向量 向量 和矩阵
T T
②依据公式wd=X0u/(u u)计算输入权值向量wd,并用公式wd=wd/||wd||单位化向量wd;
③依据公式sd=X0wd/(wdTwd)计算得分向量sd;
④依据公式gd=y0Tsd/(sdTsd)计算输出权值gd;
⑤依据公式u=y0gd更新向量u;
⑥重复②~⑤直至sd收敛(即向量sd中各元素不再变化);
⑦保留输入权值向量wd与输出权值gd,并依据公式pd=X0Tsd/(sdTsd)计算投影向量ph;
⑧依据如下两式更新输入矩阵X0与输出向量y0:
X0=X0-sdpdT (4)
y0=y0-sdgd (5)
⑨令d=d+1后,若d≤3m/4,重复②~⑧求解下一个wd、gd、和pd;若d>3m/4,则执行⑩;
⑩将得到的所有输入权值向量组成矩阵W=[w1,w2,…,wd]、所有输出权值向量组成行向量G=[g1,g2,…,gd]、以及所有投影向量组成矩阵P=[p1,p2,…,pd],那么PLSR模型中的T -1投影变换矩阵为U=W(PW) ,d个得分向量组成的矩阵为 回归系数向量为β=UGT=W(PTW)-1GT。
3.根据权利要求1所述的基于集成变量选择型偏最小二乘回归的软测量方法,其特征在于,所述步骤(4)中实施β-PLSR、VIP-PLSR、和UVE-PLSR方法的操作过程具体为:实施β-PLSR方法的具体步骤为:
②对回归系数向量β中各元素求取绝对值得到新向量B,并计算向量B的均值,记为α;
②找出向量B中大于α的元素,并将相应的位置标号存放于位置标号集θ1中;
③根据记录的位置标号θ1,从输入数据矩阵 中选取相应的列组成新的输入数据矩阵X1;
④利用PLSR算法建立输入X1与输出 之间的回归模型,并记录相应的回归系数向量β1;
实施VIP-PLSR方法的具体步骤为:
①初始化h=1;
②根据如下所示公式计算输入数据矩阵 中第h个变量的重要性,即:其中,wj,h表示向量wj中的第h个元素,符号|| ||表示计算向量的长度;
③判断h<m?若是,置h=h+1后,若返回②计算下一个变量的重要性;若否,执行下一步骤④;
④找出向量v=[v1,v2,…,vm]中大于1的元素,并将相应的位置标号存放于位置标号集θ2中;
⑤根据记录的位置标号θ2,从输入数据矩阵 中选取相应的列组成新的输入数据矩阵X2;
⑥利用PLSR算法建立输入X2与输出 之间的回归模型,并记录相应的回归系数向量β2;
实施UVE-PLSR方法的具体步骤为:
①随机产生一个n×m的数据矩阵N,矩阵N中各元素都是在区间[0,1]上均匀分布的随机数;
②对矩阵N中各列进行标准化处理得到 并将数据矩阵 与 组成新的输入数据矩阵③利用PLSR算法建立输入 与输出 之间的回归模型,并记录相应的回归系数向量④将向量 中前1至m个元素组成向量b1,第m+1至第2m个元素组成向量b2,并记录向量b2中元素绝对值最大的数为δ;
⑤找出向量b1中绝对值大于δ的元素,并将相应的位置标号存放于位置标号集θ3中;
⑥根据记录的位置标号θ3,从输入数据矩阵 中选取相应的列组成新的输入数据矩阵X3;
⑦利用PLSR算法建立输入X3与输出 之间的回归模型,并记录相应的回归系数向量β3。