1.一种基于多分类支持向量数据描述的旋转机械故障诊断方法,其特征在于,包括离线建模阶段和在线诊断阶段;其中,一、离线建模阶段
步骤1:分别采集旋转机械正常以及不同齿轮故障类型下的一段传感器测量数据作为训练数据集;
步骤2:通过经验公式对训练数据进行时域和频域的特征提取,获取用于旋转机械故障诊断的常用特征参数,组成特征参数矩阵;
步骤3:根据核空间中样本间余弦相似度均值和方差进行特征选择,将所选择的特征参数组成特征参数子集,同时确定高斯径向基函数的宽度参数;
步骤4:建立步骤3所构造的数据矩阵的支持向量数据描述模型,计算各个故障类别超球体的球心和半径并保存,留作在线诊断阶段用;
二、在线诊断阶段
步骤5:采集旋转机械实时工况下不同齿轮故障类别的传感器测量数据作为测试数据;
步骤6:根据步骤3中所选择的特征参数构建测试数据的特征参数子集,计算特征参数子集中的样本与球心之间的距离;
步骤7:将步骤6所得距离与步骤4中的半径进行对比,判断测试数据是属于正常状态还是某种故障状态,最终得到故障分类及诊断结果。
2.根据权利要求1所述的一种基于多分类支持向量数据描述的旋转机械故障诊断方法,其特征在于,所述步骤2具体过程为:通过经验公式对每一路传感器所采集信号的时域和频域进行特征提取,获得具有不同物理意义的特征参数;利用行星齿轮箱故障诊断常用的特征参数来进行特征向量构建,获得时域和频域的特征参数,不同的特征参数分别反映不同的信息;最后,得到包含所有特征参数的特征矩阵Q。
3.根据权利要求1所述的一种基于多分类支持向量数据描述的旋转机械故障诊断方法,其特征在于,所述步骤3具体过程为:特征选择包括子集搜索和评价两个部分,通过利用高斯径向基函数(GBRF)在核空间中的余弦相似度是否有利于分类,来判断特征子集的有效性;余弦相似度是用两个向量之间夹角的余弦值衡量它们之间差异的度量,在核空间中表示为:其中,x和z代表两个样本向量,θ代表二者在核空间中的夹角;为映射函数,将有限维空间中的点映射到高维特征空间中;根据Mercer定理,提出各种核函数,其中GBRF应用十分广泛:
其中,σ为宽度参数,控制了函数的径向作用范围;根据GBRF公式,任一样本在核空间中与自身之间的核函数值为1,即κ(x,x,σ)=1;且两个样本之间的夹角在核空间中的余弦值等于它们的核函数值,即:
通过两个样本之间的夹角来衡量它们之间的余弦相似性,夹角越小则核函数的值越大,两个样本也就越相似;反之,夹角越大则核函数的值越小;基于核空间中余弦相似度的进行特征选择需要满足以下两点:来自同一类别样本的GBRF值较大;来自不同类别样本的GBRF值较小;定义余弦相似度度量矩阵如下:其中, 的上标表示样本属于第i类,下标表示第i类样本的数量;
定义类内余弦相似度均值为:
其中,L代表样本类别的数量,AVG表示求取矩阵中所有非零元素的均值;当同一类别中的样本足够相似时,Wm的值是接近于1的;定义类间余弦相似度均值为:余弦相似度的方差反映更多数据分布的细节特点;通过将余弦相似度均值和方差结合起来,得到更全面的、同时涵盖整体和细节的描述;在此引入核空间中类内余弦相似度方差的概念:
其中, 表示第i类余弦度量矩阵内所有元素的均值,VAR表示求取各个类的方差的均值;通过特征选择后,同一类别的样本之间凝聚度进一步增大,不同类别之间的样本差异度增大;定义类别可分性目标函数:
其中,ω是权重向量,且ωW+ωB+ωV=1;在进行特征选择时,目标函数值越小,则同类样本越相似,不同类的样本差别越大;在子集搜索环节,后向搜索是从完整的特征集合中,每次尝试去掉一个无关特征,逐渐减少特征参数;根据后向搜索策略,定义单个特征参数的敏感性系数为:
λi=J‑Ji i=1,2,…,s (9)其中,J表示用包含所有特征参数的特征矩阵Q计算得到的目标函数值,Ji表示用删掉第i个特征参数的特征矩阵计算得到的目标函数值,s表示特征参数的个数;敏感性系数的值越大,则对应的特征参数越不利于样本的分类,即该特征参数被舍弃时,同类样本之间相似度更高,不同类别的样本相似度低;定义如下特征选择的准则:其中, 表示所有敏感性系数的均值;将所有符合上述准则的敏感性系数所对应的特征参数舍弃,余下的特征参数共同组成特征子集P;
根据网格搜索的思想,首先确定宽度参数σ的大致范围,然后逐步增大σ的值,重复进行上述特征参数选择的步骤,计算目标函数的最小值,得到最小的目标函数所对应的宽度参数以及特征参数子集并保存,留作在线诊断阶段使用。
4.根据权利要求1所述的一种基于多分类支持向量数据描述的旋转机械故障诊断方法,其特征在于,步骤4具体过程为:选定步骤1所采集传感器数据中的一个类别,根据该类别中的n个样本构建一个球心为a,半径为R的超球体,在最小化超球体体积的同时,使全部或尽可能多的样本被包含在超球体内,该超球体需要满足如下要求:
2 2
s.t.||xi‑a||≤R+ξi,i=1,2,...,n其中,松弛变量ξi≥0,i=1,2,...n,参数C用于控制最小超球体的体积与数据误差之间的平衡;xi代表第i个样本;将上述问题转化成Lagrange极值问题:其中,αi≥0,βi≥0为Lagrange系数,上式为二次优化问题,通过求偏导,计算出αi的最2
优解 R由任一满足αk
5.根据权利要求1所述的一种基于多分类支持向量数据描述的旋转机械故障诊断方法,其特征在于,所述步骤6具体过程为:对于一个待检测样本z,计算其与超球体球心a之间的距离,使用如下公式:通过上述公式计算待检测样本与每一类超球体球心之间的距离。
6.根据权利要求1所述的一种基于多分类支持向量数据描述的旋转机械故障诊断方法,其特征在于,所述步骤7具体过程为:对于一个待检测样本z,分别计算待检测样本与各个类别球心之间的距离,若样本与第i类球心之间的距离小于第i类超球体半径,并且与其他类别球心之间的距离大于对应的超球体半径,则判断新样本z属于第i类。