1.一种基于深度迁移学习的旋转机械故障诊断方法,其特征在于,该方法包括如下步骤:步骤10)准备阶段,具体包括:
步骤101)数据准备:采用旋转机械的时域振动信号作为模型训练和测试的数据,将源域数据及不同工况下的目标域数据分别划分为训练集和测试集;
步骤102)模型准备:指定深度迁移学习诊断模型的深度及各层节点数、概率适配正则参数、流形适配正则参数、小批训练样本数、预训练及微调两个阶段的学习率、迭代次数;
步骤20)适配概率分布的诊断模型无监督预训练,具体包括:步骤201)设置当前层数i=1
步骤202)初始化自编码器:利用模型的第i层及其上一层(第i+1层)构建自编码器,并初始化该自编码器的编码参数矩阵U(1)和解码参数矩阵U(2);
步骤203)计算目标函数对解码参数矩阵的梯度:首先计算自编码器的输出层均方误差选取激活函数为sigmoid函数,则输出层均方误差为:其中Xs为小批源域样本对应的输入矩阵,同时也是期望输出矩阵,Zs为小批源域样本对应的实际输出矩阵,⊙为hadamard积运算;
然后计算误差对解码参数矩阵的梯度▽U(2):其中 为小批源域样本的隐含层输出矩阵H和元素均为1的列向量组成,ns为小批源域训练样本数目;
步骤204)计算目标函数对编码参数矩阵的梯度:为了在深层模型中逐层减少源域与目标域样本的概率分布差异,基于自编码器隐含层的带权输入Qs和Qt计算最大均值差异(maximum mean discrepancy,MMD),并将其平方项作为正则化项加入自编码器的优化目标,得到新的优化目标函数:JAE(θ)=LMSE(Xs,Zs)+λMMD2(Qs,Qt) (3)其中θ={U(1),U(2)}为自编码器的参数,λ为概率适配正则参数,用于控制这两项的相对重要性,由于将MMD平方项加入优化目标函数,因此目标函数对编码参数的梯度包括两项:其中均方误差对编码参数的梯度为:
式中 为小批源域训练输入矩阵和
元素均为1的列向量组成;
MMD平方项对编码参数的梯度为:
其中 s为高斯核函数k()的带宽参数;
将 和 利用公式(4)计算获得▽U(1);
步骤205)更新自编码器的参数:利用小批随机梯度下降法,根据式(7)-(8)更新自编码器的解码和编码参数矩阵:U(2)=U(2)-η▽U(2) (7)(1) (1) (1)
U =U -η▽U (8)
其中η为预训练阶段的学习率;
步骤206)如果i=L-1(L为最高隐含层对应的层数),即完成适配概率分布的诊断模型无监督预训练,否则i=i+1,返回步骤202);
步骤30)诊断模型的流形一致性微调,具体包括:步骤301)设置当前层数i=L;
步骤302)计算流形正则项对层间参数的梯度矩阵:利用源域和目标域样本共同构造流形正则项并将其加入微调阶段的优化目标,得到模型流形一致性微调的目标函数:J(θ')=LMSE(Xs,Ys)+γMR(Xs,Xt) (9)其中θ'表示模型所有参数集合,LMSE(Xs,Ys)为源域小批样本的均方误差,MR(Xs,Xt)为流形正则项,γ为流形适配正则参数,用于控制这两项的相对重要性,设连接第i层与第i+1层的层间参数矩阵为U(i),流形正则项对U(i)的梯度矩阵根据i的不同情况计算:如果i=L,即U(i)=U(L)为连接最高隐含层与输出层的参数矩阵,梯度矩阵为:其中 由小批源域和目标域样本对应的第L层输出矩阵 和元素均为1的列向量组成,nL为第L层节点数,Lp是由源域和目标域样本共同计算得到的拉普拉斯矩阵Lp=D-W,D为对角矩阵,其对角元素Dii=∑jWw,ij,W为图邻接矩阵,Nk(xi)为样本xi的k近邻集合,β为经验系数,β=2
1/(ns+nt) ,Ys+t为源域和目标域小批样本构成的输出矩阵;
如果i
其中 由小批源域和目标域样本对应的第i层输出矩阵 和元素均为1的列向量组成,ni为第i层节点数;
步骤303)计算均方误差对层间参数的梯度矩阵,利用小批源域样本Xs及其标签Ys,根据i的不同情况计算:如果i=L,梯度矩阵为:
其中 为小批源域样本的实际输出矩阵,其中 为小批源域样本在最高隐含层输出矩阵H(L)和元素均为1的列向量组成;
如果i
步骤304)如果层数i=1,则继续步骤305),否则i=i-1,返回步骤302);
步骤305)更新层间参数矩阵:利用小批随机梯度下降法更新各层U(i),首先计算各层U(i)的梯度矩阵:
然后利用小批随机梯度下降法,按照式(17)更新参数矩阵:(i) (i) (i)
U =U -η'▽U (17)
其中η'为微调阶段的学习率。
2.根据权利要求1所述的一种基于深度迁移学习的旋转机械故障诊断方法方法,其特征是步骤204)中,自编码器优化目标函数的正则参数λ,其取值随隐含层数增加而递增。