1.融合注意力机制与孪生网络结构的滚动轴承故障诊断方法,其特征在于,将数据分别输入到两个完全相同的网络块,通过网络块进行特征提取,并输入全连接层映射到特征空间得到特征向量,使用距离公式比较两组特征的相似程度,从而达到样本分类的目的;融合注意力模块与孪生网络故障诊断模型的特征提取部分为融合了长短时记忆结构的复合动态卷积网络,复合动态卷积网络由动态卷积层、注意力模块和长短时记忆层构成,其在保持模型较低计算预算的前提下提升网络的特征表达和提取能力,并使网络具有长时记忆的能力,从而习得样本间得关系;动态卷积层用以初步提取时频图的相关特征,长短时记忆网络进一步提取复杂场景下的轴承故障程度特征,注意力模块针对不同故障类型和严重程度进行自动选择,实现各种故障特征的加权表达凸显重要特征;具体操作步骤如下:步骤1:对振动信号进行标准化处理并转换为时频图,并分为训练样本和测试样本;其中振动信号转换为图像的方法为:以Coiflets为小波基的小波变换;
步骤2:构建融合注意力模块与孪生网络的故障诊断模型,所述故障诊断模型架构包括两个复合动态卷积网络,其中复合动态卷积网络的特征提取部分融合了长短时记忆结构,并利用训练样本对该故障诊断模型进行训练;
所述复合动态卷积网络的构造细节情况如下:
①2个动态卷积层:动态卷积层1:将样本输入到注意力模块中,注意力模块生成K个归一化注意力权重参数:П1,Π2,...,ΠK,与K个平行卷积的卷积核对应相乘后相加得到新卷积核,该新卷积核以卷积的方式结合到分类网络中;注意力模块:动态输入样本信息,通过池化处理捕捉样本信息得到池化特征图1*1*c,c为通道数;池化特征图进入第一个全连接层进行降维,得到第一特征图;通过ReLU函数对降维后的第一特征图引入非线性因素,得到第二特征图;第二特征图进入第二全连接层进行升维,维度升至1*1*c得到第三特征图,即为元素个数为c的一维向量;最后利用softmax函数对一维向量进行归一化,得到K个注意力权重:Π1,Π2,...,ΠK,动态卷积层2与动态卷积层1结构相同;
②2个注意力长短时记忆网络层;
注意力长短时记忆网络1:将动态卷积层2的输出作为注意力长短时记忆网络的输入,根据该层的输入和Key计算权重系数,并通过类SoftMax进行归一化处理,后根据权重系数对Value进行加权求和,将注意力模块的输出与动态卷积层2的输出一同作为长短时记忆网络的输入;
注意力长短时记忆网络2:每层长短时记忆网中的计算单元数量为T,第d层LSTM网络的第D时刻下长短时记忆网络的计算单元的计算流程为:式中, 分别表示第d层长短时记忆网络的第t时刻下长短
时记忆网络计算单元 中的输入门、遗忘门、输出门、候选记忆细胞、记忆细胞以及隐藏状态的计算值,下标d=1,2,...,D,D表示的是长短时记忆网络的总层数;当d=1时,Y为输入序列中第t个数据向量,当d>1时,Y为第d‑1层长短时记忆网络的第t时刻的输出值为第d层长短时记忆网络中第t‑1时刻计算单元的输出值,且当t=1时, 为0;
分别为输入门、遗忘门、输出门和候选记忆细胞预设的权重参数;
分别为输入门、遗忘门、输出门和候选记忆细胞预设的偏置参数;σ(·)
为sigmoid函数,tanh(·)为双曲线正切函数;⊙为同或运算符,[·]为矩阵乘法运算符;
所述故障诊断模型的结构为:
故障诊断模型同时接受两个相同或不同类型样本的输入,分别经过一个相同且参数相同的复合动态卷积网络,得到两组低维的特征值,并统一输入到误差层;孪生网络由输入层、特征提取层、相似性度量层以及故障诊断层组成,构造细节情况如下:①特征提取层为两个结构相同、参数相同的复合动态卷积网络;
②相似性度量层通过一阶范数的指数函数对第一个复合动态卷积网络输出的特征向量T1和第二个复合动态卷积网络输出的特征向量T2进行相似性度量,其公式为:Dt(T1,T2)=exp(‑||T1‑T2||1)∈[0,1]式中:Dt(T1,T2)表示训练时特征向量T1和特征向量T2的距离;||·||表示范数运算符;
③故障诊断层为softmax层,用于对第一个复合动态卷积网络输出的特征向量T1进行分类得到输入数据对应的状态类型,从而确定设备的运行状态;
④故障诊断模型的损失函数采用对比损失函数,其公式为:
式中:N为样本个数;l为两个输入是否为相同类别的控制变量,当l=0时,两个输入属于同一类,l=1时,两个输入不属于同一类;Dt为训练时特征向量T1和特征向量T2的距离;z为设定的阈值;
步骤3:根据样本特征和输出之间的正确程度,选择最适合该故障诊断模型构架的损失函数;
步骤4:利用不同的样本量训练融合注意力模块与孪生网络的故障诊断模型,对比得出该模型所需的最少样本量;
步骤5:将测试数据输入训练好的故障诊断模型中,得到故障类型结果。
2.根据权利要求1所述的融合注意力机制与孪生网络结构的滚动轴承故障诊断方法,其特征在于,步骤1中Coiflets小波变换的具体方法为:对标准化处理后的时频图划分为训练集及测试集,且训练集图片带有类别标签:从相同或不同组中对应选取图片组成样本对,相同组选取的样本对其类别标签为1,不同组选取的样本对其类别标签为0。
3.根据权利要求1所述的融合注意力机制与孪生网络结构的滚动轴承故障诊断方法,其特征在于,步骤5具体如下:①通过预训练好的滚动轴承故障诊断模型,计算所有标准集的特征向量V;
②给定预测样本X,通过故障诊断模型输出其特征向量Vx;
③计算预测样本X与标准集中所有故障类型的平均欧式距离Sm,公式为
Sm=mean(S(Vx,Vm))
S(Vx,Vm)={Dp(Vx,Vmn)|1≤n≤N}
其中,Vm表示标准集特征V中的第m类故障类型特征向量,Dp表示预测时第m类故障类型特征向量与预测样本X的特征向量两个特征Vx的欧式距离;Vmn表示的是第m类故障样本的第n个样本的特征向量。