1.一种基于分布式PCA的多工况故障监测方法,其特征在于,所述方法包括:步骤1:获取正常数据集Xorig,通过局部邻域标准化LNS方法将其标准化得到数据集Zorig,所述LNS方法为:假设m维原始过程数据为X∈Rn×m,LNS方法利用每个样本的局部邻域均值和标准差信息进行标准化,将每个工况都做归一化处理,得到单一分布的标准化数据;
其标准化后的数据为:
其中, 表示样本xi在X中的a个最近邻,距离评判标准由欧式距离确定;表示样本xi的第一个邻居, 和 代表xi的第一个邻居的局部邻域均值和方差;
步骤2:将数据集Zorig进行PCA分解,将过程划分成k+1个子块,得到子块数据集合{X1,X2,…,Xk+1};划分子块方法为:记已进行标准化后的数据集为Zorig∈Rn×m,其中n代表样本个数,m代表过程变量个数,则Zorig经PCA处理后为:其中,ti表示得分向量,pi表示载荷向量,Eorig表示残差矩阵,k表示所选取的主元个数,式(2)等价表示为:其中,Torig∈Rn×k,Porig∈Rm×k分别为主元得分矩阵和载荷矩阵,为残差得分矩阵和载荷矩阵;
PCA投影后的每个主元彼此不相关,通过在每个不相关的主元方向上构建子块,能够满足子块划分多样性的要求;同时,将整个残差空间看作一个子块,将整个过程划分成k+1个子块;在每个子块上选择对该子块贡献最大的变量进行建模,满足子块模型的精度要求;载荷向量pi代表了第i个主元上的投影方向,每个变量对各个主元即前k个子块的贡献值大小通过式(5)计算:其中,v=1,2,…,m,m代表过程变量数目;w=1,2,…k,k为选取的主元个数;pvw与plw分别代表载荷矩阵Porig的第v和l行、第w列的元素;
对于第k+1个子块,每个变量在其残差空间中所有主元上的贡献平均值为:其中, 代表残差载荷矩阵 中第v行、第w列的元素,mean表示求取均值;通过式(7)计算所有变量对第k+1个子块的贡献率:其中 表示第l个变量对所有主元的贡献值,根据式(5)、式(7)以及累计贡献率法求取对每个子块贡献度最大的变量,并由这些变量组成该子块的数据集Xi,由此得到k+1个子块的数据集合{X1,X2,…,Xk+1};
步骤3:对子块数据集合{X1,X2,…,Xk+1}分别进行LNS标准化后得到数据集合{Z1,Z2,…,Zk+1},使用PCA方法对每个子块建立故障监测模型,利用式(11)、(12)得到各模型的控制限;
对于新的测试样本xtest,依次利用正常数据集合{Z1,Z2,…,Zk+1}的局部邻域信息将其标准化得到集合{ztest,1,ztest,2,…,ztest,k+1},利用式(9)计算每个子块的得分向量;
控制限计算方法为:
对每个子块选取变量,将各子块的PCA模型写成:
Zi=TiPiT+Ei (8)
其中,Zi(i=1,2,…,k+1)为第i个子块的PCA模型表达式,Ti和Pi分别表示该子块的主元得分矩阵与载荷矩阵,Ei表示该子块的残差矩阵;
对于一个新的测试样本xtest,在第i个子块中采用该子块的局部邻域信息将其标准化为ztest,i,则该测试样本在第i个子块中的得分向量ti表示为:ti=PiTztest,i,i=1,2,…k+1 (9)通过式(11)与式(12)分别计算每个子块PCA模型的T2与平方预测误差SPE统计量,并与其控制限相比较;
其中i=1,2,…,k+1,λi,j表示第i个PCA子块中的第j个主元的特征值,ki是第i个PCA子块中所选取的主元个数;
每个子块的T2和SPE统计量控制限的计算公式为:其中, α表示显著性水平,cα是正态分布在显著性水平为α下的临界值;
2
步骤4:利用式(10)、(11)分别计算每个子块的T 和SPE统计量,采用贝叶斯推断方法通过式(17)、(18)计算最终的贝叶斯信息准则BIC统计量并与其控制限作比较,若超出控制限,则表明发生了故障;
贝叶斯推断算法描述为:
在贝叶斯推断中,新样本ztest在第i个子块中T2统计量的故障条件概率表示为:其中,条件概率 和 定义如下:
其中,“N”和“F”分别代表正常和故障的情况, 是正常样本的先验概率,其值为置信度β,则 为1-β; 是新样本在第i个子块的T2统计量; 是第i个子块的T2统计量控制限;
最终融合的BIC统计量通过式(17)计算;
同样的,SPE统计量的最终监测指标由式(18)计算;在BIC监测指标下,两种统计量控制限均为1-β;当BIC指标大于控制限时,表示监测到了故障。
2.根据权利要求1所述的方法,其特征在于,所述方法为应用于工业过程中故障检测的方法。
3.根据权利要求2所述的方法,其特征在于,所述工业过程包括化工、冶金及发酵过程。
4.根据权利要求3所述的方法,其特征在于,所述方法为应用于TE过程中对TE过程中的
21种故障进行监测的方法。