1.一种基于文本分类识别用户意图的方法,其特征在于,所述方法包括:获取数据集,基于文本分类模型对数据集进行文本分类,得到第一样本集和第二样本集;其中,第一样本集为符合长尾分布的多个文本类的样本集,所述第二样本集为未被所述文本分类模型的训练集覆盖的样本集;
从所述第二样本集中提取第一文本特征,分析所述第一文本特征的类别区分度;
确定所述第一文本特征中符合类别区分条件的多个目标类别,获取各目标类别对应的预设类别区分度阈值;所述类别区分条件是指可被识别出至少一个类别的识别条件;
将所述第一文本特征输入所述文本分类模型,以对所述文本分类模型进行训练更新,并生成对应的分类结果;
分别将各类别的特征的类别参数值与对应的预设类别区分度阈值进行比较,将分类结果中类别参数值高于对应预设类别区分阈值的特征所对应的类别作为目标类别;所述目标类别是指对所述文本分类模型中已有类别的补丁或更新;
分别为每类目标类别设置对应的标签,以更新所述文本分类模型对应的文本标签体系;所述标签包括用户情感或用户意图;
根据所述目标类别的数量调整补丁规则数量;所述补丁规则数量是指当前待被更新至所述文本分类模型的目标类别的数量;
接收用户输入的待识别文本,基于文本分类模型识别用户意图的目标类别和所述待识别文本中的关键信息,根据所述目标类别和所述关键信息确定向用户推荐的目标服务,并向终端发送与所述目标服务对应的数据。
2.根据权利要求1所述的方法,其特征在于,基于文本分类模型对数据集进行文本分类,得到第二样本集,包括:
使用双向长短期内存网络,以边距损耗作为特征提取器,从所述数据集中提取所述第一文本特征;
通过最大化类间方差和最小化类内方差学习所述第一文本特征中符合敏感性的深度特征,并将所述深度特征向量化为特征向量;
基于密度的新颖性检测算法对所述特征向量进行保证金损失检测,以检测出所述特征向量表征的未知意图;
将符合未知意图的样本分类到同一个样本集,以得到所述第二样本集。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:确定各类别文本被错分的代价;
基于第二样本集进行采样,得到第一验证集;
对文本分类模型进行语义压测,以评估所述文本分类模型的至少一项指标是否达到预设性能条件、以及对所述文本分类模型中的模型参数进行调优。
4.根据权利要求3所述的方法,其特征在于,所述数据集包括训练集和测试集,所述方法还包括:
将所述训练集和所述测试集分别设置不同的标签,并基于设置标签后的所述训练集和所述测试集对文本分类模型进行训练,使用对抗验证方式验证所述训练集和所述测试集之间是否存在差异;
采用度量分布差异方法从所述数据集中确定出与已知类别之间的相似度低于预设相似度的样本。
5.根据权利要求1‑4中任一项所述的方法,其特征在于,所述根据所述目标类别的数量调整补丁规则数量,包括:
对各类别参数的预设类别区分阈值的大小进行动态调整,以动态调整所述补丁规则数量。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:从所述第一验证集中确定未纠错的目标文本;
将所述目标文本输入所述文本分类模型中进行文本分类,以对所述文本分类模型进行训练。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:生成对抗样本;
获取对抗性任务;
按照所述对抗性任务,基于所述对抗样本攻击该文本分类模型中的至少一个神经网络,以对所述文本分类模型进行对抗性训练。
8.一种用户意图识别装置,其特征在于,所述用户意图识别装置包括:输入输出模块,用于获取数据集,基于文本分类模型对数据集进行文本分类,得到第一样本集和第二样本集;其中,第一样本集为符合长尾分布的多个文本类的样本集,所述第二样本集为未被所述文本分类模型的训练集覆盖的样本集;
处理模块,用于从所述第二样本集中提取第一文本特征,分析所述第一文本特征的类别区分度;确定所述第一文本特征中符合类别区分条件的多个目标类别,获取各目标类别对应的预设类别区分度阈值;所述类别区分条件是指可被识别出至少一个类别的识别条件;
所述输入输出模块还用于将所述第一文本特征输入所述文本分类模型,以对所述文本分类模型进行训练更新,并生成对应的分类结果;
所述处理模块还用于分别将各类别的特征的类别参数值与对应的预设类别区分度阈值进行比较,将分类结果中类别参数值高于对应预设类别区分阈值的特征所对应的类别作为目标类别;所述目标类别是指对所述文本分类模型中已有类别的补丁或更新;分别为每类目标类别设置对应的标签,以更新所述文本分类模型对应的文本标签体系;所述标签包括用户情感或用户意图;
所述处理模块还用于根据所述目标类别的数量调整补丁规则数量;所述补丁规则数量是指当前待被更新至所述文本分类模型的目标类别的数量;通过所述输入输出模块接收用户输入的待识别文本,基于文本分类模型识别用户意图的目标类别和所述待识别文本中的关键信息,根据所述目标类别和所述关键信息确定向用户推荐的目标服务,并向终端发送与所述目标服务对应的数据。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于文本分类识别用户意图的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的基于文本分类识别用户意图的方法。