1.一种异常变量精确识别与定位方法,其特征在于,包括:根据训练数据集通过k最近邻方法建立模型,计算近邻平方距离,确定模型的正常控制阈值;
根据实时数据计算所述实时数据的近邻平方距离,比较所述正常控制阈值与所述实时数据的近邻平方距离以进行故障检测,所述实时数据的近邻平方距离大于所述正常控制阈值,则所述实时数据样本为故障样本;
将故障样本的近邻平方距离分解为对应的变量贡献值,并计算所述训练数据集中的变量贡献控制阈值,比较所述变量贡献值与所述变量贡献控制阈值以进行异常变量“一次”识别,所述变量贡献值大于所述变量贡献控制阈值,则所述变量为异常变量;
将识别出的异常变量重构并替换所述异常变量在所述故障样本中的位置得到新样本数据,通过k最近邻方法建立模型得出重构后的近邻平方距离,并与所述正常控制阈值比较以进行异常变量“二次”识别,所述重构后的近邻平方距离大于所述正常控制阈值,则所述新样本数据仍存在故障,则回到异常变量“一次”识别步骤继续进行异常变量识别,直至不再出现异常变量;
其中,将训练数据集中的距离统计量分解为变量贡献累加和,通过核密度估计方法中的高斯核函数法估算样本中的所述变量贡献控制阈值;
所述故障样本中的异常变量重构的方法包括中心最近邻重构方法,其中,所述中心最近邻重构方法包括:
构造出由所述故障样本中去除所述异常变量后组成的新样本集,进而筛选出新样本在新样本集中的前k个最近邻样本,通过所述新样本在所述新样本集中对应新样本数据的k个均值的差方计算确定k值,所述新样本与其第一近邻样本距离小于所述新样本与其前k个最近邻距离平均值的差方时,用所述新样本集中第一近邻样本对应变量数据对所述异常变量进行重构,否则,用所述新样本集中距离最近的前k个对应变量数据的均值对所述异常变量进行重构;
所述k的值通过以下计算公式确定:其中,x′f表示所述故障样本去掉所述异常变量后由剩余变量组成的样本;n'l(x'f)表示所述x'f在n×(m‑1)个所述剩余变量中的第l个邻近样本的标签,n和m为所述训练数据集的维度,其中l=1,2,…,k。
2.根据权利要求1所述的异常变量精确识别与定位方法,其特征在于,所述训练数据集直接利用正常工作条件下的过程数据。
3.根据权利要求1所述的异常变量精确识别与定位方法,其特征在于,所述k最近邻方法的建模过程包括:
标准化所述训练数据集,将其转化为零均值,单位标准差的矩阵;
计算所述训练数据集中任意样本与其他样本之间的欧氏距离,并对其排序,找到每个样本的前k个最近邻样本;
计算每个正常样本与其k个近邻的近邻平方距离之和作为距离统计量;
对得到的距离统计量进行估算,确定所述正常控制阈值进而对所述实时数据进行检测。
4.根据权利要求3所述的异常变量精确识别与定位方法,其特征在于,所述距离统计量的估算得到所述正常控制阈值的方法为核密度估计方法中的高斯核函数法。
5.根据权利要求1所述的异常变量精确识别与定位方法,其特征在于,样本数据的第l个变量对距离统计指标的变量贡献值等于该样本与其前k个最近邻第l个分量的平方距离之和。
6.一种计算机设备,其特征在于,包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述异常变量精确识别与定位方法终端执行根据权利要求1至5中任一项所述的异常变量精确识别与定位方法。
7.一种计算机可读存储介质,其特征在于,其存储有权利要求6所述的计算机程序。