1.一种基于自监督学习和聚类的滚动轴承故障诊断方法,其特征在于,包括以下步骤:(1)将采集到的滚动轴承的驱动端和风扇端的振动信号分为源域数据和目标域数据,其中源域数据包括有标签的源域数据和无标签的源域数据,目标域数据为无标签的目标域数据,对两域的无标签数据进行时频变换,获取自监督学习的滚动轴承故障诊断数据集Dself,随机初始化自监督学习网络的模型参数,并基于数据集Dself训练自监督学习网络,重复最小化损失函数以更新自监督学习网络的模型参数θ1,直至损失函数收敛;
(2)以锁定的形式迁移部分自监督学习网络的模型参数θ1至源域监督学习网络,源域数据及源域标签作为源域监督学习网络的输入,得到其初始化参数,重复最小化损失函数以更新源域监督学习网络的模型参数θ2,直至损失函数收敛;
(3)通过源域监督学习网络预测滚动轴承故障诊断数据集中目标域数据的初始伪标签以及对应的置信度 其中nt表示目标域中不带标签的数据个数, 表示目标域数据中第j个数据对应的初始伪标签,以锁定的形式迁移部分源域监督学习网络的模型参数θ2至两域迁移学习网络,将两域带标签数据集作为两域迁移网络的输入,得到其初始化参数θ3;所述两域带标签数据集包括:源域数据、源域标签、目标域数据和目标域初始伪标签;
(4)计算两域带标签数据集中目标域与源域的边缘分布距离和条件分布距离以及条件分布的自适应权重因子,最小化损失函数以更新两域迁移网络的模型参数θ3;
(5)通过优化后的两域迁移学习网络更新两域带标签数据集中目标域的伪标签 并提取目标域数据的域不偏移特征,基于K‑Means算法对提取的域不偏移特征进行聚类,并利用聚类结果和伪标签生成对应的字典映射,基于字典映射和强簇规则,生成对应的强簇,并利用强簇进一步更新滚动轴承数据集中伪标签 根据伪标签的预测概率和聚类结果生成对应两域带标签数据集中目标域数据类别的置信度(6)重复步骤(4)和(5),直至损失函数收敛或者两域带标签数据集中目标域的伪标签不再更新;将目标域测试数据输入到更新后的两域迁移网络,得到滚动轴承故障识别的准确率;
在步骤(3)中,置信度 的表达式如下:
T
其中, 是滚动轴承故障诊断数据集中目标域数据 全部类别C中某一类k的样本总数, 为样本属于相应类别的概率, 的表达式如下:其中, 为滚动轴承故障诊断数据集中目标域数据 通过源域监督学习网络F2产生预测类别的概率值,概率最高的类别被选为伪标签所述强簇规则为,将同一批次网络预测伪标签和聚类生成的伪标签生成字典映射,先设置字典映射的阈值α和最小样本数n=batch/N·β,其中batch为批大小,N为类别数,β是决定最小样本大小的参数,若对于聚类生成伪标签的第i类与网络预测伪标签的第j类字典映射比例大于阈值α且字典映射的样本数量大于最小样本数n,则把聚类生成的伪标签i及置信度作为网络的伪标签及置信度,该置信度为步骤(5)中 否则将网络预测的伪标签j及置信度作为网络的伪标签及置信度;
在步骤(5)中,置信度 的表达式如下:
其中, 是预测为其他标签而不是聚类标签的样本数。
2.根据权利要求1所述基于自监督学习和聚类的滚动轴承故障诊断方法,其特征在于,步骤(1)中的损失函数的表达式如下:其中,loss(xi,θ)为损失函数,K为采用的时频变换方法的个数, 表示滚动轴承故Y障诊断原始数据{xi}对应的某种时频变换,F1 (g(xi|Y)θ1)是输出数据通过自监督学习网络F1产生预测类别的概率值,θ1代表自监督学习网络F1的参数。
3.根据权利要求1所述基于自监督学习和聚类的滚动轴承故障诊断方法,其特征在于,步骤(2)中的损失函数的表达式如下:其中, 为损失函数,ns为源域中数据个数, 为源域数据中第i个数据对应的标签, 为滚动轴承故障诊断数据集中的源域数据 通过源域监督学习网络F2产生预测类别的概率值,θ2是源域监督学习网络F2的参数。
4.根据权利要求1所述基于自监督学习和聚类的滚动轴承故障诊断方法,其特征在于,在步骤(4)中,计算两域带标签数据集中源域与目标域的边缘分布距离DM和条件分布距离DC:其中, 指希尔伯特空间映射, 是滚动轴承故障诊断数据集中源域数据 全部类T (k)别C中某一类k的样本总数,σ 为第k类样本的置信度,其初始值为步骤(3)得到的(k)后续的σ 为强簇规则更新后的置信度, 为两域带标签数据集中目标域数据 通过两域迁移网络F3产生预测类别的概率值;
计算条件分布的自适应权重因子μ:
其中, 为DM的无偏估计, 为DC的无偏估计;
计算损失函数:
其中, 为损失函数,λ是正则化参数, 为两域数据的联合分布适配
距离: