1.基于多阶段ICA-SVDD的间歇过程故障监测的方法,其特征在于,该方法步骤为:
步骤1:间歇过程的三维数据集X(I×J×K)进行二维展开,其中,I代表批量数,J代表变量数,K代表采样点数。采用沿批次方向和沿变量方向相结合的数据处理方式,先将三维形式的数据X(I×J×K)沿批次方向转化为二维矩阵X(I×KJ),然后标准化二维矩阵;再按照变量方向重新组合,形成新的二维矩阵X(KI×J);
步骤2:对生产过程进行合理的阶段划分,以便建立多个子模型进行故障监测。首先根据各个时间片的均值向量的相似度对生产过程进行模糊阶段划分,得到初步的阶段数目。
然后通过K均值算法把数据特征相似的时刻归为一类,进而得到更精确的阶段划分;
Step1:将三维过程数据X(I×J×K)先按批次方向展开得到二维矩阵X(I×KJ),然后按时间轴方向切割为批次和变量组成的二维数据时间片矩阵Xk(I×J),k=1,2,…,K;
Step2:求取每一个时间片矩阵Xk(I×J)的均值向量,记为 这些均值向量
代表了每个时间片的特征信息,利用这些特征信息对时间片进行初始阶段划分,并进行各个阶段的识别,以第一个时间片X1作为第一个阶段的基准Xbase,然后按照相似度计算公式:依次计算Xbase后面的时间片和其相似度,并设定相似度阈值α,如果X2和Xbase的相似度大于阈值α,则认为X2也属于当前时段,然后继续计算下一个时间片和Xbase的相似度;否则,认为X2属于下一个阶段,并令Xbase=X2,按上述步骤继续进行;
依据相似度把相似的时间片连接形成一个时间段,得到初步的模糊划分。可以得到对应的阶段个数P,这为后面用聚类算法选取聚类数提供了依据,但是,这种模糊划分法会出现某些点或者极少的连续点不能准确的划分到某个阶段;
Step3:通过K-means聚类算法对时间片的均值向量进行聚类,算法输入是均值向量集合 以及聚类个数P,任意选择P个聚类中心,进行多次迭代计算,当算法满足收敛条件时,可以得到P个子类的聚类中心,计算每个均值向量 到所有聚类中心的距离,就可以得到 对于P个子类的隶属关系,由于聚类算法的输入是按照时间顺序排列的时间片均值向量,因此按照时间顺序,可以将模糊划分中无法确定所属阶段的点,划分到一个对应的阶段中,就可以得到更精确的阶段划分;
步骤3:使用独立成分分析(independent component analysis,ICA)进行特征信息提取,ICA更加充分的利用了数据高阶统计信息,并且可从观测数据中进一步提取出相互独立的潜在变量,这些潜在变量可以更本质地提取反应过程特征;
ICA模型定义为
X=AS+E (2)
其中X=[x(1),x(2),...,x(n)]∈Rm×n是观测数据矩阵,A=[a1,a2,...,ad]∈Rm×d是未知的混合矩阵,S=[s(1),s(2),...,s(n)]∈Rd×n是隐藏的独立成分矩阵,E∈Rm×n是残差矩阵。n为采集的样本个数,由d≤m可知,ICA其实和PCA类似也是一种数据压缩技术,通过尽可能少的数据来描述尽可能多的信息;
ICA的目的是从观测数据X中估计出混合矩阵W和独立成分S,因此,ICA目标:找到一个解混矩阵W,可从观测信号中分离出源信号,即当d=m时,即解混矩阵W是混合矩阵A的逆时,就是独立成分S的最佳估计;
当采用ICA算法提取全部独立成分后,按照非高斯程度大小重新排列,选取前d个独立性较强的独立成分得到对应矩阵 由于已经对间歇过程进行了多阶段划分,所以要对每个阶段的Xp(KpI×J)进行ICA分析来进行特征提取,其中p表示所对应的第p阶段,Xp表示第p阶段沿变量方向展开的二维矩阵,Kp表示第p阶段对应的采样个数,进而可以提取出每个阶段对应的非高斯特征信息和残差信息,以便建立监测统计模型来进行故障监测;
步骤4:采用支持向量数据描述(Support vector data description,SVDD)进行间歇过程的在线监测,SVDD是一种单值分类算法,其基本思想是针对训练数据集X={xi,i=
1,…,N},通过非线性转化Φ:X→F将原始空间数据投影到特征空间{Φ(xi),i=1,…,N},然后可以在特征空间中找到可以包含所有数据样本的最小体积的超球体,SVDD通过核函数将输入空间映射到高维空间来学习得到灵活并且准确的数据描述模型,得到的超球体数据描述边界是通过一小部分的支持向量进行表示的,为了构建这样的最小超球体,SVDD需要解决以下优化问题:式(4)中,a为超球体的球心,R为超球体的半径,惩罚系数C权衡了超球体的体积和训练样本的误分率,松弛变量ξi的引入代表对第i个训练样本产生误分的惩罚项,上述优化问题可以转化为解决相应的对偶问题:此处是引入核函数K(xi,xj)代替内积函数(xi,xj),利用二次规划,可以求出ai,如果x0代表任意的一个支持向量,则超球体的球心和半径可表示为:对于新来的样本xnew,可以得到其到超球体球心的距离:
如果Distnew≤R则该样本正常;反之,该样本为异常样本;
采用ICA对间歇过程的各个阶段进行特征提取后,可以分别得到独立成分的非高斯空间和剩余的残差空间的数据,通过SVDD方法对提取出的独立成分 和残差矩阵E建立统计分析模型,首先针对独立成分 建立SVDD模型如下:式中: 表示第k个样本,αk为对应样本的拉格朗日乘子,K(·)表示高斯核函数,可以得到独立成分 所形成的SVDD超球体的球心和半径如(9)式所示:同样,再对残差矩阵E建立SVDD模型如下:
那么,残差矩阵E所形成的SVDD超球体的球心和半径如(11)式所示:
对于间歇过程的各个阶段,可以分别得到对应阶段的超球体半径R,在线过程监控时,当获得当前时刻的采样数据xnew时,通过数据预处理和ICA特征提取后,分别求取独立成分和残差矩阵Enew到对应球心的距离 和DistE_new,因此当Dist≤R时,可以认为当前时刻的样本是正常的,而当Dist>R,则表示当前时刻的样本为故障数据。
2.根据权利要求1所述的基于多阶段ICA-SVDD的间歇过程故障监测的方法,其特征在于,由于间歇过程具有多阶段性和数据分布非高斯性的问题,基于独立成分分析和支持向量数据描述的多阶段间歇过程的故障监测方法,可以同时解决过程数据非高斯和非线性的监测问题。