1.一种基于改进卷积神经网络的故障诊断方法,其特征在于,所述方法包括:
获取样本数据集,所述样本数据集中包括各个状态类型的时间序列数据,对所述样本数据集进行数据预处理得到训练集和测试集,所述训练集和所述测试集中分别包括若干个状态类型对应的时序图,所述状态类型包括正常状态以及q类故障状态,q为正整数,每个所述时序图中包括p个数据;
建立改进的卷积神经网络模型,所述改进的卷积神经网络模型依次包括输入层、若干层特征提取层、新增卷积层、全连接层和输出层,每层所述特征提取层分别依次包括卷积层和池化层;
将所述训练集输入所述改进的卷积神经网络模型训练得到故障诊断模型,将所述测试集输入训练得到的所述故障诊断模型对所述故障诊断模型进行测试;
获取系统运行过程中的待诊断的时间序列数据,将所述待诊断的时间序列数据输入测试完成的故障诊断模型得到对应的状态类型完成对所述系统的故障诊断。
2.根据权利要求1所述的方法,其特征在于,所述将所述训练集输入所述改进的卷积神经网络模型训练得到故障诊断模型,包括对于输入的每个时序图:所述输入层将所述时序图处理为初始特征;
每层所述特征提取层对获取到的输入特征进行故障特征提取得到故障特征映射,第一层特征提取层获取到的输入特征为所述初始特征,其他层特征提取层获取到的输入特征为上一层特征提取层输出的故障特征映射;在每层所述特征提取层中,所述特征提取层中的卷积层对获取到的输入特征提取得到n个初始特征映射、对所述n个初始特征映射进行批归一化处理得到n个重构输出、将所述n个重构输出输入ReLU激活函数得到n个中间特征映射,所述特征提取层中的池化层对所述n个中间特征映射进行矩形分割和压缩得到 个故障特征映射并输出,S为所述池化层的尺寸;
所述新增卷积层对最后一层特征提取层输出的故障特征映射进行进一步故障特征提取得到n′个初始特征映射、对所述n′个初始特征映射进行批归一化处理得到n′个重构输出、将所述n′个重构输出输入ReLU激活函数得到n′个故障特征映射;
所述全连接层对所述新增卷积层输出的n′个故障特征映射进行组合,使用softmax针对每个输入返回的概率,将输入分配到其中一个互斥类得到概率序列{y11,y12,…y1B;y21,y22,…y2B;…yA1,yA2,…yAB}并计算损失函数,其中,A为样本数量且A=p+1,B为类别数且B=q+1,yab表示属于第b个类别的样本a的输出,1≤a≤A,1≤b≤B;
以最小损失函数为学习目标,使用具有动量的随机梯度下降反向更新所述改进的卷积神经网络模型的模型参数,当损失函数满足预设终止条件时完成模型训练得到所述故障诊断模型。
3.根据权利要求2所述的方法,其特征在于,在每层所述特征提取层中,所述特征提取层中的卷积层对获取到的输入特征提取得到n个初始特征映射,包括当所述卷积层位于所述改进的卷积神经网络模型中的第l层时,计算方法为:其中, 为第l层的第j个初始特征映射,j∈[1,n],l≥2, 为从上一层即第l-1层获取到的第i个输入特征,i为参数,Mj表示上一层即第l-1层中的第j个卷积区域,所述 为第l层在生成第j个初始特征映射时应用在第l-1层输入的第i个输入特征上的卷积核, 为第l层输出第j个初始特征映射时的偏置矩阵。
4.根据权利要求2所述的方法,其特征在于,在每层所述特征提取层中,当所述卷积层位于所述改进的卷积神经网络模型中的第l层时,所述卷积层对所述n个初始特征映射进行批归一化处理得到n个重构输出,包括计算:所述卷积层对将所述n个重构输出输入ReLU激活函数得到n个中间特征映射,包括计算:其中, 为第l层的第j个初始特征映射,j∈[1,n],l≥2, 为对第l层的第j个初始特征映射批归一化处理后的结果,μβ是从上一层获取到的各个输入特征的均值,σβ是从上一层获取到的各个输入特征的标准差,ε、γ和β均为参数, 为第l层的第j个重构输出, 为第l层的第j个中间特征映射。
5.根据权利要求2所述的方法,其特征在于,在每层所述特征提取层中,当所述卷积层位于所述改进的卷积神经网络模型中的第l层、所述池化层位于所述改进的卷积神经网络模型中的第l+1层时,所述池化层采用最大池化,则所述池化层对所述n个中间特征映射进行矩形分割和压缩得到 个故障特征映射并输出,包括计算:其中, 为第l+1层池化层所在的所述特征提取层输出的第j0个故障特征映射,为所述卷积层输出的第l层的第j个中间特征映射中第r个神经元的值,r∈[(j0-1)S+1,j0S],j∈[1,n],l≥2。
6.根据权利要求3所述的方法,其特征在于,所述损失函数为:
其中,tab表示第a个样本是否属于第b个类别。
7.根据权利要求6所述的方法,其特征在于,所述使用具有动量的随机梯度下降反向更新所述改进的卷积神经网络模型的模型参数,包括:每次从所述训练集中随机选择一个时序图进行学习,计算梯度的指数加权平均值,并利用所述梯度更新每一层在输出第j个初始特征映射时使用的卷积核Kij和偏置矩阵bj,更新过程如下:其中,η为学习率,vK(t)为第t次学习时卷积核Kij的动量,vb(t)为第t次学习时偏置矩阵bj的动量,且vK(t)和vb(t)的自更新过程为:其中,momentum为动量因子且momentum∈[0,1]。
8.根据权利要求1所述的方法,其特征在于,所述对所述样本数据集进行数据预处理得到训练集和测试集,包括:对所述样本数据集按状态类型分为q+1个时间序列数据集,每个时间序列数据集包括对应的状态类型的时间序列数据;
对所述q+1个时间序列数据集进行标准化处理;
对标准化处理后的每个时间序列数据集进行随机分段得到对应的分段数据集,分段的数量为p,每个所述分段数据集包括对应的状态类型的p个时间序列数据;
将每个状态类型对应的分段数据集转换成对应的时序图,将q+1个状态类型对应的时序图划分为所述训练集和所述测试集。
9.根据权利要求8所述的方法,其特征在于,所述对所述q+1个时间序列数据集进行标准化处理,包括对每个时间序列数据集中的时间序列数据进行z-score标准化处理使其均值为0、标准差为1:其中,x*表示对所述时间序列数据集中的时间序列数据标准化后的数据,x为所述时间序列数据集中的时间序列数据,μ为所述时间序列数据集中的时间序列数据的均值,σ为所述时间序列数据集中的时间序列数据的标准差。