1.一种故障相关的变量选择方法,其特征在于,具体包括以下步骤:
11、采集工业过程运行的正常数据 和故障数据 建立训练数据集,其中,Nn表示正常情况下的样本数目,Nf表示故障情况下的样本数目,m表示测量变量的数目;
12、以KL散度来度量某个变量在正常和故障情况下的差异,差异大的变量被认为是有助于反映故障效应的变量,定义第i个测量变量对于反映故障效应的贡献值为式(1)所示:其中,i=1,2,…,m,pf(xi)和pn(xi)分别为变量xi在故障和正常情况下的概率密度函数;
13、将m个变量的贡献值按照降序排列,记为式(2)cont(x[1])≥cont(x[2])≥…≥cont(x[m]) (2)其中,cont(x[i])为第i个最大的贡献值;
14、计算前d个最大的贡献值的累积贡献率,如式(3)所示:其中,1≤d≤m;
15、对于指定的阈值α,0<α≤1,假设d为最小的正整数使得CCR(d)≥α,那么选择这d个最大的贡献值对应的测量变量,以此作为后续数据建模的基础。
2.如权利要求1所述的一种故障相关的变量选择方法,其特征在于,在以KL散度来度量某个变量在正常和故障情况下的差异过程中,在采样数目足够大的情况下,假设每个测量变量服从高斯分布:
121、分别计算第i个测量变量在正常情况下的样本均值和样本标准差,具体为式(4)、(5):其中,i=1,2,…,m, 表示变量xi在正常情况下的第j个测量值;
122、分别计算第i个测量变量在故障情况下的样本均值和样本标准差,如式(6)、(7)所示:其中,i=1,2,…,m, 表示变量xi在故障情况下的第j个测量值;
123、此时,式(1)定义的贡献值表示为如式(8)所示的形式: