1.一种智慧轨道无人驾驶车辆故障基因识别方法,其特征在于,包括以下步骤:S1、采用基于增量式网络爬虫方法获取列车历史振动数据;
S2、对所述振动数据的振动幅度EA,振动周期ET进行预处理,输出新的X;
S3、将X作为故障检测模块的输入,检测故障序列后,输出故障序列数据E;
S4、将所述故障序列数据E作为降维模型的输入,输出可编码的基因序列I1,I2,I3,I4;
S5、将所述可编码的基因序列I1,I2,I3,I4整合为DNA序列S=S1,S2,S3,...,SN,提取所述DNA序列的碱基特征,并排列组合所述碱基特征,形成可预测的预判定候选车辆部件故障基因Vs;
S6、利用所述候选车辆部件故障基因训练双向长短时记忆网络深度学习模型,得到分类模型;
优选的,还包括:
S7、根据实时采集的振动数据,利用所述分类模型识别车辆故障。
2.根据权利要求1所述的一种智慧轨道无人驾驶车辆故障基因识别方法,其特征在于,步骤S1的具体实现过程包括:将故障信息公开数据集的历史振动幅度、振动周期、振动频率作为爬虫算法的输入,去除历史振动幅度、振动周期、振动频率中的重复信息,所述爬虫算法输出的信息即为列车历史振动数据。
3.根据权利要求1所述的一种智慧轨道无人驾驶车辆故障基因识别方法,其特征在于,步骤S2的具体实现过程包括:
*
1)将振动幅度EA,振动周期ET整合为矩阵X;
*
2)利用下式计算矩阵X 中任意一段数据的中值mi:mi=median[xi‑p,xi‑(p‑1),...,*
xi,...,xi+(p‑1),xi+p];其中,xi是X的第i个样本;p是相邻样本点的数量,所述相邻样本点是*
指数值差小于阈值Ξ的两个样本点;i=1,2,...,n;n为振动数据矩阵X中样本点的总数;
3)利用下式计算绝对偏差MADi:MADi=median[|xi‑p‑mi|,...,|xi‑mi|,...,|xi+(p‑1)‑mi|,|xi+p‑mi|];定义振动样本分数Z':
4)设定如下边界条件:
*
5)若振动数据矩阵X中的数据不满足所述边界条件,则判定该值为离群值,剔除该值;
*
6)重复步骤2)~5),直至遍历完矩阵X中的所有数据,得到新的矩阵X。
4.根据权利要求1所述的一种智慧轨道无人驾驶车辆故障基因识别方法,其特征在于,步骤S3的具体实现过程包括:设定初始时序差分的的最小数值为Tc,设定最小阈值为Ay,当X中的振动起始数据点和振动终止数据点的时间差大于阈值Tc,且振动幅度大于最小阈值Ay时,判定当前时刻有故障发生,记录此时的数据位置和波形幅值变化情况,将被判定为有故障发生的信号数据整合为新矩阵数据E。
5.根据权利要求1所述的一种智慧轨道无人驾驶车辆故障基因识别方法,其特征在于,步骤S4的具体实现过程包括:
将矩阵E排列展开,进行非负矩阵分解降维处理,将降维后的数据分解为两个非负数矩阵J,K的乘积,其中,数据E通过基空间J映射到K;定义降维维度U,高维数据E经过降维后被A,T,C,G四种碱基元素表达的U维特征向量所映射,分别用I1,I2,I3,I4代替四种碱基表达A,T,C,G。
6.根据权利要求1所述的一种智慧轨道无人驾驶车辆故障基因识别方法,其特征在于,可预测的预判定候选车辆部件故障基因Vs=(W11,W12,...,WUU,C1,...,CU,D1,...,DU);其中,碱基Bi转移到碱基Bj的概率 ni为单个碱基点Bi在DNA序列S中出现的次数;Bi为DNA序列S中第i个数据点位置的碱基;1≤i≤U;U指碱基元素所代表特征向量的维度;N为DNA序列S的长度;nij为碱基对BiBj在DNA序列S中出现的次数;碱基含量碱基位置比 DNA序列S中碱基Bi出现的位置标记为Si,其中si是Si中的值。
7.根据权利要求1所述的一种智慧轨道无人驾驶车辆故障基因识别方法,其特征在于,步骤S5之后,还包括:将所述候选车辆部件故障基因Vs作为聚类模型的输入,建立DNA序列模板库。
优选地,建立DNA序列模板库的具体实现过程包括:步骤1:将经过非负矩阵分解降维得到的预判定的候选车辆部件故障基因Vs作为随机邻接嵌入算法的输入,得到高维数据点Vi和Vj的条件概率pj|i,低维数据点vi和vj的条件概率qj|i,将条件概率最小化,得到最小化的高维数据的条件概率pj|i和最小化的低维数据的条件概率qij;
步骤2:依据条件概率最小化结果计算出高低维条件概率差异的最小值pij,通过梯度下降法最小化代价函数L: 得到最优解 将所述最优解 作为tSNE聚类算法的聚类结果输出,输出的聚类信息熵簇对应DNA序列的聚类模板template:template=[CT,ZXJ,QY,ZD,LJ,SL,SB];
其中,CT,ZXJ,QY,ZD,LJ,SL,SB FDJ,DP,CS,DQ为DNA序列模板库中的故障类别;CT:车体故障;ZXJ:转向架故障;QY:牵引传动控制系统故障;ZD:制动系统故障;LJ:车端连接装置故障;SL:受流装置故障;SB:车辆内部设备和驾驶室设备故障;n代表数据样本数,KL表示散度。
8.根据权利要求7所述的一种智慧轨道无人驾驶车辆故障基因识别方法,其特征在于,步骤S6之后,还包括:
判断所述故障分类模型输出的预测序列对应的故障类别是否与所述聚类结果中的故障类别匹配,若所述故障类别从属于聚类结果中某一故障类别中的子类别,则将所述故障类别划入该故障类别中;若分类模型输出的结果无法与所述聚类结果中的故障类别匹配,则由判断是否需要更新,若需要更新,则将该分类结果的原始信号阈值设置为新的故障判定阈值,并在所述聚类结果中的故障类别中设置一个新类别,若不更新,则直接丢弃该分类结果。
9.根据权利要求1~8之一所述的一种智慧轨道无人驾驶车辆故障基因识别方法,其特征在于,步骤S6的具体实现过程包括:A)将车辆部件故障基因Vs随机划分为训练集和测试集;初始化二进制灰狼优化算法的迭代次数κ、预期精度;
B)将所述训练集、隐含层初始神经元个数Θ0作为双向长短时记忆网络深度学习模型的输入,以具有隐含层神经元个数Θκ的双向长短时记忆网络深度学习模型作为输出,训练双向长短时记忆网络深度学习模型;
C)将所述测试集、隐含层神经元个数Θκ作为二进制灰狼优化算法目标优化函数的输入,计算优化目标函数值;
D)根据所述目标优化函数值,更新双向长短时记忆网络深度学习模型隐含层神经元个数Θκ的搜索路径,使得下一次目标函数值小于当前次目标函数值,得到新的隐含层的每层神经元个数Θκ+1;
E)迭代次数加1,将新的隐含层的每层神经元个数Θκ+1作为二进制灰狼优化算法目标优化函数的输入,返回步骤C),直至二进制灰狼优化算法目标优化函数值达到预期精度或完成所设定的迭代次数,完成双向长短时记忆网络深度学习模型的训练,并获取最优参数Θoptimal,该最优参数Θoptimal对应的双向长短时记忆网络深度学习模型即分类模型;
优选地,所述目标优化函数表达式为:式中εf为双向长短时记忆网络中第f层的神经元数量,αf为结合权重;
Accuracy的计算过程包括:每一次迭代过程中,对于测试集中的每一个样本点,当分类器的输出分类数值和测试集中该样本点的数值相同且为正时,TP的值加1;当分类器的输出分类数值和测试集中该样本点的数值相反且分类器的输出分类数值为正时,FP的值加1;当分类器的输出分类数值和测试集中该样本点的数值相反且分类器的输出分类数值为负时,FN的值加1;当分类器的输出分类数值和测试集中该样本点的数值相同且为负时,TN的值加
1;所述分类器是指每一次迭代过程中,具有隐含层神经元个数Θκ的双向长短时记忆网络深度学习模型;其中,真阳性TP、假阳性FP、真阴性TN、假阴性FN的初始值均为0。
10.一种智慧轨道无人驾驶车辆故障基因识别系统,其特征在于,包括计算机设备;所述计算机设备被配置或编程为用于执行权利要求1~9之一所述方法的步骤。