欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021101887173
申请人: 上海理工大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-03-29
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种用于冷水机组故障诊断的传感器优化选择方法,其特征在于,具体包括如下步骤:

1)数据预处理:针对制冷系统常见故障,设置需要采集的特征参数,通过实验采集特征参数数据,特征参数包括直接由一个传感器测量出的直接测量特征参数和由数个传感器测量数据计算转换的间接计算特征参数,每组数据包含M个特征参数作为一样本数据,总共N组特征参数数据;对实验样本数据进行预处理,即将采集到的各类故障的特征数据随机划分为训练数据与测试数据,并将数据进行归一化处理,消除量纲影响;

2)建立并优化随机森林诊断模型,具体步骤如下:

2.1)从经过预处理后的训练数据中有放回的随机抽取特征数据组成子训练集,得到n个子训练集,形成的n个子训练集用来训练决策树,即每个子训练集作为一个决策树根节点处的样本,形成n个决策树的根节点处样本;

2.2)对于每个子训练集,从子训练集中随机选取特征作为节点分裂特征,构建决策树;

2.3)按照步骤2.1)~2.2)建立n个决策树,构成随机森林,在形成随机森林的过程中使用网格搜索与交叉验证对随机森林参数进行优化;

2.4)投票法类别判定:利用测试集对随机森林进行测试,根据每一棵决策树的类别输出,采用投票法进行类别判定;

3)生成分析样本集并输入训练好的随机森林诊断模型中:将未做预处理的训练数据中每一类故障的数据分开,依据各故障数据中各特征参数的最大值与最小值定义每一类故障的分析样本集的特征参数空间,使用Sobol序列生成每一类故障的样本特征参数集并进行归一化处理,将生成的各类故障样本特征参数集分别输入到训练好的随机森林模型中,并保存模型输出;

4)针对步骤3)输入和输出数据,采用Sobol法对模型进行方差分解,计算每类故障下特征的总敏感指数以及平均敏感指数;

5)针对步骤1)中未经过预处理的采集特征数据,采用典型相关性分析计算特征参数间的相关性;

6)选择步骤4)中各类故障中的高灵敏特征参数以及灵敏特征参数组成特征集,利用步骤5)典型相关性分析的结果对相关系数在0.8以上的特征进行合并,去除平均敏感指数较低的特征;

7)将步骤6)获得的特征参数送入步骤2)的建立的随机森林诊断模型,将测试数据送入随机森林诊断模型进行模型诊断;若诊断准确率达到要求,则确认随机森林诊断模型;若特征参数诊断效果不能达到诊断准确率,可选择中等灵敏特征参数或多相关性特征参数作为增补特征参数以进一步提高诊断性能,再次运用训练、测试数据对随机森林诊断模型按照步骤2)重新训练优化并测试其诊断性能,直到满足要求;

8)若步骤7)获得的特征参数中,除了温度差特征参数,其他间接计算特征参数去除,按此重新设置需要采集的特征参数,重复步骤1)、2)对随机森林诊断模型进行建立和优化,再用测试数据对优化后随机森林诊断模型进行验证,如符合诊断准确率,则以此特征集作为最优特征集,实现高效准确的故障诊断;如不符合诊断准确率,再调整部分去除的间接计算特征参数重新加入,再去验证模型,直到符合诊断准确率。

2.根据权利要求1所述用于冷水机组故障诊断的传感器优化选择方法,其特征在于,所述步骤2.2)具体实现方法:每个样本有M个特征,在决策树上的每M;然后从这m个特征中采用Gini系数来选择1个特征作为该节点的分裂特征,依最优特征与最优切分点,从现节点生成两个子节点,将训练数据依特征分配到两个子节点中;对于下一个节点,重复再从这m个特征中采用Gini系数来选择1个特征作为这个节点的分裂特征,直到决策树不能再分裂;决策树形成过程中如果出现节点选出来的那一个特征是刚刚其父节点分裂时用过的特征,则该节点已经达到了叶子节点,无须继续分裂了;Gini系数计算公式如下:其中,D为子训练集,A为某特征,D1、D2分别为对集合D进行二元切分后得到的两个子集合;对于每一个特征A及其可能取得的每个值a将样本D分为D1及D2两部分,计算所有A=a时的Gini系数;Gini系数表示一个集合的不确定性,Gini系数值越大,不确定性就越大;在所有可能的特征A以及它们所有可能的切分点a中,选择Gini系数最小的特征及其对应的切分点作为最优特征与最优切分点;依最优特征与最优切分点,从现节点生成两个子节点,将训练数据依特征分配到两个子节点中。

3.根据权利要求1所述用于冷水机组故障诊断的传感器优化选择方法,其特征在于,所述步骤2.3)在形成随机森林的过程中使用网格搜索与交叉验证对随机森林参数进行优化,具体方法为:使用网络搜索将各个特征可能的取值进行排列组合,列出所有可能的组合结果生成网格;然后将各组合用于随机森林模型的训练,并使用交叉验证对表现进行评估,最后返回模型的最佳特征组合。