欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2015100242999
申请人: 青岛理工大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语句识别方法,其特征在于,包括:

获取待识别语句;

确定所述待识别语句中的非停用词为关键词;

在预设语句库中,选取包含所述关键词的候选语句;

利用预先构建的分类模型,确定所述待识别语句的主题分类标签和意图分类标签;

当所述意图分类标签为未知类且所述候选语句为多个时,将多个所述候选语句按照各自的预设意图标签进行分类,获得多个分组;

将每个所述分组中的候选语句确定为目标语句;其中,所述目标语句的预设主题标签与所述待识别语句的主题分类标签相同;

显示每个所述目标语句对应的预设信息。

2.根据权利要求1所述的语句识别方法,其特征在于,还包括:当所述意图分类标签非未知类时,确定所述待识别语句与每个所述候选语句的相似度;

将超过预设相似度阈值的最大相似度对应的候选语句确定为目标语句;

显示所述目标语句对应的预设信息。

3.根据权利要求1所述的语句识别方法,其特征在于,所述将每个所述分组中的候选语句确定为目标语句包括:确定所述待识别语句与每个所述候选语句的相似度;

依据相似度的大小进行降序排序,在每个所述分组中,选取排序在前且超过预设相似度阈值的预设个数的候选语句为目标语句。

4.根据权利要求1所述的语句识别方法,其特征在于,所述利用预先构建的分类模型,确定所述待识别语句的主题分类标签和意图分类标签包括:按照预设特征词提取规则,在所述待识别语句中提取多个分类特征;

将所述多个分类特征输入至所述分类模型,获得多个意图概率值及多个主题概率值;

将最大意图概率值对应的分类标签确定为所述待识别语句的意图分类标签,并将最大主题概率值对应的分类标签确定为所述待识别语句的主题分类标签。

5.根据权利要求1所述的语句识别方法,其特征在于,所述分类模型的构建过程包括:获取包含多个已标注语句的训练集;其中,每个所述标注语句具有各自的意图标签及主题标签;

利用预设训练方法,对所述训练集进行训练,获得分类模型;其中,所述分类模型用于对待识别语句的意图及主题进行分类。

6.根据权利要求2或3所述的语句识别方法,其特征在于,所述确定所述待识别语句与每个所述候选语句的相似度包括:分别计算所述待识别语句与每个所述候选语句的语义相似度、主题意图相似度及句法相似度;其中,所述语义相似度为待识别语句的关键词与候选语句的关键词之间的语义相似度;所述主题意图相似度为待识别语句的主题及意图与候选语句的主题及意图的相似度;所述句法相似度为待识别语句的句法结构与候选语句的句法结构的相似度;

将每个所述候选语句各自对应的所述语义相似度、主题意图相似度及所述句法相似度进行加权求平均值,获取所述待识别语句与每个所述候选语句各自的相似度。

7.根据权利要求6所述的语句识别方法,其特征在于,计算所述待识别语句与所述候选语句的语义相似度包括:依次计算所述待识别语句的每个关键词分别与所述候选语句的每个关键词的词语相似度,获得相似度矩阵;

统计所述相似度矩阵的各行中最大词语相似度的总值,并计算该总值的行平均值;

统计所述相似度矩阵的各列中最大词语相似度的总值,并计算该总值的列平均值;

计算所述行平均值及所述列平均值的平均值,获得所述待识别语句与所述候选语句的语义相关度。

8.根据权利要求6所述的语句识别方法,其特征在于,计算所述待识别语句与所述候选语句的主题意图相似度包括:判断所述待识别语句的主题分类标签与所述候选语句的预设主题分类标签是否相同,获得第一判断结果;

判断所述待识别语句的意图分类标签是否为未知类,获得第二判断结果;

判断所述待识别语句的意图分类标签与所述候选语句的预设意图标签是否相同,获得第三判断结果;

当所述第一判断结果为是且所述第二判断结果为是时,确定所述主题意图相似度为1;

当所述第一判断结果为是、所述第二判断结果为否且所述第三判断结果为是时,确定所述主题意图相似度为1;

当所述第一判断结果为是、所述第二判断结果为否且所述第三判断结果为否时,确定所述主题意图相似度为大于0且小于1的预设值;

当所述第一判断结果为否时,确定所述主题意图相似度为0。

9.根据权利要求6所述的语句识别方法,其特征在于,计算所述待识别语句与所述候选语句的句法相似度包括:对所述待识别语句进行句法分析,获得所述待识别语句的第一句法成分,并获取所述候选语句的预设的第二句法成分;

计算所述第一句法成分与所述第二句法成分的相同成分的第一词语相似度;

计算所述第一句法成分与所述第二句法成分的相同修饰成分的第二词语相似度;

获取所述第一句法成分与所述第二句法成分的非相同成分的预设惩罚因子;

利用所述第一词语相似度、所述第二词语相似度及所述预设惩罚因子,计算加权平均值,获得句法相似度。

10.根据权利要求1所述的语句识别方法,其特征在于,当确定出的关键词为多个时,所述在预设语句库中,选取包含所述关键词的候选语句包括:统计所述预设语句库中每个语句包含待识别语句中关键词的个数;

依据包含的关键词的个数进行降序排序,选取排序在前的预设数量的语句为候选语句。

11.根据权利要求1所述的语句识别方法,其特征在于,所述确定所述待识别语句中的非停用词为关键词包括:对所述待识别语句进行分词,获得多个分词词语;

去除所述多个分词词语中的停用词,获得关键词。

12.一种语句识别装置,其特征在于,包括:

待识别语句获取模块,用于获取待识别语句;

关键词确定模块,用于确定所述待识别语句中的非停用词为关键词;

候选语句获取模块,用于在预设语句库中,选取包含所述关键词的候选语句;

主题和意图确定模块,用于利用预先构建的分类模型,确定所述待识别语句的主题分类标签和意图分类标签;

候选语句分组模块,用于当所述意图分类标签为未知类且所述候选语句为多个时,将多个所述候选语句按照各自的预设意图标签进行分类,获得多个分组;

目标语句确定模块,用于将每个所述分组中的候选语句确定为所述待识别语句对应的目标语句;其中,所述目标语句的预设主题标签与所述待识别语句的主题分类标签相同;

预设信息显示模块,用于显示每个所述目标语句对应的预设信息。