1.一种精馏塔能效退化检测方法,其特征在于包括以下步骤:
1)采集精馏过程中精馏塔的测量变量数据样本,并且通过后续离线分析得到样本所对应的 效值,作为离线样本集;
2)对步骤1)中的训练样本集进行异常数据剔除和数据归一化处理,构建模型训练样本集;对训练样本进行数据预处理,预处理内容包括采用箱型图分析方法剔除异常数据和数据归一化,具体实施步骤如下:
21)箱型图分析方法剔除异常数据;
对于训练样本数据集x1,x2,…xN,判断第i个样本xi是否满足下式的条件,若满足,则认为xi是正常样本,应予以保留;否则剔除该样本:xL-1.5*xR≤xi≤xU+1.5*xR,i=1,2,…,N (1)其中,xL为xi的下四分位数,xU为xi的上四分位数,xR为xi的四分位数间距,即上下四分位数之差;
22)归一化处理;
对于训练样本数据x1,x2,…xN,样本xi的归一化处理计算公式为:其中,xi、 分别表示第i个原始离线样本和归一化后的样本,θ为所有样本数据的算术平均值,σ为所有样本的方差。经过归一化处理,可消除变量量程所造成的检测误差;
3)计算步骤2)获取的训练样本集中各个测量变量与 效之间的互信息值,根据累计互信息贡献度筛选出与 效相关性最大的一组能效特征变量,构建能效特征样本集;建立能效特征样本的详细步骤为:
31)估算边缘熵和条件熵;
互信息通常是由概率密度函数和复杂积分构成,但是在实际应用中,概率密度函数难以得到,所以采用k近邻方法来估计熵值:其中,υi代表第i个样本点到距离它最近的k个点的距离,N为样本点的总量,C为Euler-Mascheroni常数;
32)计算变量与 效的互信息;
互信息可以等价为两个变量的边缘熵与联合熵之差:
I(X,Y)=H(X)+H(Y)-H(X,Y) (4)其中,H(X)和H(Y)分别为变量X、Y的边缘熵,H(X,Y)为X、Y的联合熵;
33)能效特征提取;
为了确保互信息能有效地提取能效信息,可使选取的g个测量变量的累积互信息贡献度大于0.85:从m个变量类型中选取累积互信息贡献度最大的g个变量类型,其余变量类型剔除,达到能效特征样本提取的目的;
4)由步骤3)获得的能效特征样本集建立支持向量数据描述模型,根据模型参数和支持向量得到能效退化检测模型的统计量和统计限;详细步骤为:
41)找寻最优超球体;
将互信息提取所得的能效特征样本构造最优超球体,这个超球面半径最小化问题可以描述为下列带有不等式约束的二次规划问题:其中,a为超球体的中心,R为超球体半径,C为给定的惩罚因子,ξi为松弛变量,用来增强分类的鲁棒性。
42)问题的对偶形式;
将该二次规划问题转化为其对偶形式后,往往更加容易求解,并且能引入核函数,将原始空间投影到高维空间从而解决非线性问题:K(xi,xj)=exp(-(xi-xj)2/2δ2) (8)其中,αi为拉格朗日乘子,K为高斯核函数,δ为核函数的核宽。转换后的新问题是原始问题的对偶问题,在满足某些条件的情况下,这两者相等,这个时候就可以通过求解对偶问题来间接地求解原始问题。二次规划问题求解得到拉格朗日乘子αi后,即可获得落在超球面上的支持向量。
43)统计量与统计限;
对于新样本数据点z,其对应支持向量数据描述的统计量为样本数据点z到超球心的空间几何距离Ω,统计限即为超球体半径R:其中,xk为支持向量,得到支持向量数据集和拉格朗日乘子即得到了能效退化检测模型;
5)对在线样本集进行数据预处理和能效特征提取,计算新样本对应能效退化检测模型的统计量,根据统计量与统计限的大小关系来判断样本是否属于能效退化状态,具体步骤为:根据步骤2)对在线样本集f1,f2,...,fL进行异常数据剔除和归一化,由步骤3)得到的能效特征来对在线样本集提取能效特征样本,最后计算特征样本对应能效退化检测模型的统计量。如果样本数据点fl满足下式条件,则判定该样本数据点存在能效退化故障;反之,则判定为正常工况;