1.一种多标签文本智能分类方法,其特征在于,包括以下步骤:S1.获取多标签文本训练数据集,所述多标签文本训练数据集包括文本集合以及文本集合所对应的标签集合;
S2.构建多标签分类模型,其包括局部分层注意力模块、MV‑MoE多视角专家分类模块和标签语义融合模块;
S3.对文本和文本所对应的标签分别预处理,得到文本向量和标签向量;
S4.将文本向量和标签向量输入局部分层注意力模块进行特征交互,得到交互文本特征向量和交互标签特征向量;
S5.采用MV‑MoE多视角专家分类模块对交互文本特征向量进行多视角分类,对多视角分类结果加权求和得到预测标签概率;
S6.通过标签语义融合模块对预测标签概率和交互标签特征向量进行处理,得到多标签文本分类结果;采用分类损失函数计算损失调整模型参数;
步骤S6采用标签语义融合模块处理预测标签概率和交互标签特征向量的过程:S61.根据每个标签的出现次数计算得到对应的标签频率向量,通过标签的共现次数得到标签共现矩阵;
S62.根据每个标签的标签频率向量和标签共现矩阵计算标签共现概率矩阵;
S63.将预测标签概率与标签共现概率矩阵相乘得到带有标签共现信息的标签概率矩阵;对标签概率矩阵进行random drop处理;
S64.将处理后的标签概率矩阵与交互标签特征向量交互加权,得到新标签表征向量;
S65.计算新标签表征向量的标签分类权重,并与预测标签概率加权融合得到多标签文本分类结果;
S7.获取待分类文本输入训练好的多标签分类模型中,输出待分类文本的分类结果。
2.根据权利要求1所述的一种多标签文本智能分类方法,其特征在于,步骤S3对文本及其标签进行处理的过程包括:通过word2vec对文本和文本所对应的标签进行词向量处理,得到文本词向量Etext={a1,a2,...,ag}和标签词向量Elabel={b1,b2,...,bl},其中g表示文本最大长度,l表示标签的总数,ag表示文本第g个词的向量,bl表示第l个标签的向量;
对文本词向量和标签词向量分别进行Embeding得到文本向量和标签向量。
3.根据权利要求1所述的一种多标签文本智能分类方法,其特征在于,步骤S4采用局部分层注意力模块处理文本特征向量和标签特征向量的过程包括:S41.将文本向量送入transformer的encoder模块中处理得到文本特征向量;所述encoder模块包括多头注意力单元、FFN单元和残差单元;
S42.将文本特征向量通过带有dropout的第一线性层,得到表征向量 将文本特征向量再次通过带有dropout的第二线性层,得到表征向量QT2;
S43.将标签向量通过带有dropout的第三线性层,得到特征向量KL;将标签向量再次通过带有dropout的第四线性层,得到特征向量VL;
S44.分别针对 和(QT2,KL,VL)计算相应的注意力权重,并进行加权求和得到带有标签语义的交互文本特征向量;
S45.将标签向量通过带有dropout的第五线性层,得到表征向量QL1;将标签向量再次通过带有dropout的第六线性层,得到表征向量QL2;
S46.将文本特征向量通过带有dropout的第七线性层,得到表征向量KT;将文本特征向量再次通过带有dropout的第八线性层,得到表征向量VT;
S47.分别针对(QL1,KT,VT)和(QL2,KT,VT)计算相应的注意力权重,并进行加权求和得到带有文本语义的交互标签特征向量。
4.根据权利要求1所述的一种多标签文本智能分类方法,其特征在于,步骤S5采用MV‑MoE多视角专家分类模块对交互文本特征向量进行处理的过程包括:S51.基于特征维度将交互文本特征向量分割为4块,采用平均池化对每一块交互文本特征向量进行压缩,得到4个局部文本句向量;
S52.对4个局部文本句向量进行组合排列得到24种组合局部特征向量;
S53.选用24个不同的专家分类网络对24种组合局部特征向量分别进行分类,得到24种分类结果,将24种分类结果拼接得到拼接向量;
S54.对拼接向量进行加权处理和维度压缩处理,得到预测标签概率。
5.根据权利要求1所述的一种多标签文本智能分类方法,其特征在于,分类损失函数表示为:L=‑[yn·log(σ(xn))+(1‑yn)·log(1‑σ(xn))]其中,xn表示第n个文本的预测结果,yn表示第n个文本的真是真实结果。