1.一种基于半监督动态图注意的齿轮箱故障诊断方法,其特征在于,所述方法包括:步骤一:获取齿轮箱不同故障类型下的少量已知故障类型的振动信号与大量未知故障类型的振动信号,所述振动信号为一维时序数据;
步骤二:利用固定长度的滑动窗口截取所述一维时序数据构建样本数据集,并根据实际故障类型设置已知的样本标签;按照预设比例将所得样本数据集划分成训练集、验证集与测试集;所述训练集包含有标签和无标签样本,所述验证集与所述测试集仅包含有标签样本;
步骤三:将训练集、验证集与测试集中的样本作为图节点分别构建KNN图,其中:所述KNN图作为后续动态图注意网络的输入,包括图节点集和边集;所述图节点为各集合经过归一化和快速傅里叶变换所得齿轮箱振动信号的频谱序列;所述边集为根据图节点之间的相似度确定节点间是否存在边来获取,所述图节点之间的相似度基于模糊欧式距离计算,所述模糊欧氏距离为利用池化函数对所述图节点进行处理后的节点间欧式距离;
步骤四:构建动态图注意网络,其中:
所述动态图注意网络包括图节点特征聚合网络及末端分类网络;
所述图节点特征聚合网络包括图注意层与批归一化层,输入为所述KNN图,输出为维度相同的特征向量,其维度等于故障类别,表示对应故障的预测概率;所述图注意层引入动态图注意和多头注意力机制;所述末端分类网络包括依次相连的第一全连接层、丢弃层、第二全连接层和Softmax分类器;
步骤五:将所述训练集的KNN图输入所述动态图注意网络进行半监督训练并调优,其中:所述半监督训练为将所述训练集的KNN图输入至所述动态图注意网络得到各个有标签图节点的预测输出,再与该有标签图节点的真实值计算交叉熵损失,使用动态裁剪优化的Adam优化器反向传播优化网络参数,当训练到一定Epoch后根据无标签图节点的预测输出赋予其伪标签,将伪标签图节点加入训练集中进行标签传播,直到训练损失稳定到设定值以下或达到迭代次数,并根据所述动态图注意网络在所述验证集上的表现调优内部超参数,得到最优故障诊断模型;
步骤六:将所述测试集中的待检测振动信号样本按照一定长度进行截取,按照步骤三中的方法构建KNN图,再输入至步骤五得到的所述最优故障诊断模型,得到故障诊断结果。
2.根据权利要求1所述的基于半监督动态图注意的齿轮箱故障诊断方法,其特征在于,在所述步骤三中:所述KNN图的结构表示为:
G=(H,A);
n×d
式中,H={h1,h2,...,hn}∈R ,代表图中节点的集合,h是节点,n是节点总数,d是节点n×n特征维数,A∈R 是节点之间边信息构成的邻接矩阵;
原始振动信号经过归一化和快速傅里叶变换后,由于对称性取一半频谱序列;节点之间基于模糊欧式距离的大小作为相似度度量,每个图节点在与其距离最小的其他节点中选取一定个数的节点形成边连接,所述模糊欧式距离的计算公式为:式中, 是节点hi的第q个位置对应的值,Lij是节点hi和节点hj之间的距离,P(·)表示池化函数,d'是节点池化后的特征维度;
根据此距离对图节点集合H进行KNN聚类,将边信息记录到邻接矩阵Aij中,表示为:Aij=KNN(k,Lij,Ωi);
式中,k是所述KNN图的参数,表示对任一节点hi,有k个其它节点与hi相连,Ωi={Li1,Li2,…,Lin}是其他节点与hi的升序距离集合,如果 则KNN(·)=1,表示节点hi和节点hj之间存在边,否则KNN(·)=0,表示节点hi和节点hj之间不存在边。
3.根据权利要求1所述的基于半监督动态图注意的齿轮箱故障诊断方法,其特征在于,在所述步骤四中:图节点特征聚合网络结构包括依次相连的第一动态图注意层、第一批归一化层、第二动态图注意层和第二批归一化层;其中,第一和第二动态图注意层的计算公式为:(l)
式中,l为网络层数, 是节点hi在第l层对应的值,W 为可学习的权重矩阵;||表示向量拼接,使用前馈神经网络将拼接向量映射到实数上;LeakyRelu(·)为激活函数, 是节点 对节点 的注意力系数, 是节点 对节点 的注意力权重,结构为前馈神经网络;
为了更好的分配注意力权重 使用Softmax函数进行标准化,按照分配的注意力权重进行相邻节点的线性累加得到所述图注意层的输出,标准化计算公式为:式中,N(i)表示与节点 相邻的所有节点组成的集合,q∈N(i)表示该集合中的节点;
引入所述多头注意力机制来提高模型特征提取能力,用K代表注意力头数进行多次注意力聚合操作,得到第l层图注意层的最终更新输出为:式中,σ(·)为Sigmoid激活函数, 是节点hi在第l层网络进行信息聚合后更新的节点向量,k1表示第k1个设定的注意力头。
4.根据权利要求1所述的基于半监督动态图注意的齿轮箱故障诊断方法,其特征在于,在所述步骤四中:所述丢弃层为防止方法在少标签样本的情况下发生过拟合而采用的随机失活操作,所述丢弃层的计算公式为:(l)
式中,l为网络层数,r 是由Bernoulli(·)函数以概率p随机生成的0或1组成的向量,(l) (l) (l)下标i、j表示维度;y 为上层提供的本层输入向量, 为根据概率向量r 将y 对应维度的值随机失活后的向量; 为失活后的向量经过线性变换的输出, 和 为下层线性变换的参数;f(·)为激活函数, 为本层的输出。
5.根据权利要求1所述的基于半监督动态图注意的齿轮箱故障诊断方法,其特征在于,在所述步骤四中:图节点特征聚合网络结构包括依次相连的第一动态图注意层、第一批归一化层、第二动态图注意层和第二批归一化层;对于批量输入的样本xi,第一和第二批归一化层均包含以下操作:2
式中,μ为均值,σ为方差,m为输入样本总数,ε为常数,γ和β为可学习参数, 为所述第一和第二批归一化层的输出。
6.根据权利要求1所述的基于半监督动态图注意的齿轮箱故障诊断方法,其特征在于,在所述步骤四中:所述Softmax分类器是一种监督学习分类器,输出为一维特征向量,向量各位置的值对应相应故障类型的概率;假设所述训练集分为C个故障类型,记第i个样本的预测输出为pi(pi∈1,2,...,c),输入样本xi属于第c类的概率用P(pi=c|xi)表示,则所述Softmax分类器输出的各位置的值gw,b(xi)表示为:c c
式中,w 和b 分别是各故障类型的参数;所述Softmax分类器的最终分类结果为拥有最大概率值维度所对应的故障类型。
7.根据权利要求1所述的基于半监督动态图注意的齿轮箱故障诊断方法,其特征在于,在所述步骤二中:每个所述滑动窗口取相同大小的尺寸2048,截取方式为使已知和未知故障类型振动信号的相应窗口存在重叠的划窗截取采样;所述训练集、验证集与测试集比例为1:5:15,所述样本标签设置为1,2,…,C,C为齿轮箱实际故障类型总数。
8.根据权利要求1所述的基于半监督动态图注意的齿轮箱故障诊断方法,其特征在于,在所述步骤五中:交叉熵损失函数与所述Softmax分类器组合使用来计算预测故障类型与真实故障类型的差异程度,以最小化损失函数为目标进行反向传播更新模型内部参数,所述交叉熵损失函数的数学表达式为:式中,n为样本总数;C为齿轮箱实际故障类型总数;dic为第i个样本属于第c类故障的预测分布,yic为第i个样本属于第c类故障的真实值;
所述伪标签为所述Softmax分类器的输出向量中拥有最大概率值维度所对应的故障类型,表示为独热编码,伪标签yli由下式确定:yli=argmax(Fi(c));
式中,Fi(c)=dic表示第i个样本的预测输出向量对应类别c的预测概率;
所述Adam优化器的迭代过程如下:
式中,mt和nt为目标函数梯度gt的一阶矩阵和二阶矩阵,t表示当前迭代批次,t‑1表示上一迭代批次;β1和β2表示矩阵指数衰减速率, 和 是对mt和nt的校正;θ表示模型参数,η表示学习率,ε为常数;
对所述学习率进行动态裁剪,给定学习率的上下界,稳定后期模型收敛。