欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2017103795771
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语义解析信息的领域识别方法,其特征在于,所述方法包括:获取预设领域中、解析用户输入的语音数据生成语义解析信息所采用的至少一个预设关键词提取模板;各所述预设关键词提取模板中包括至少一个关键词;

若所述至少一个预设关键词提取模板的类型包括片段模板,根据各所述预设关键词提取模板中各所述关键词在所述预设领域的重要程度标识,获取各所述关键词的主题权重;

根据各所述关键词的主题权重计算所述语义解析信息的主题分值;

根据所述语义解析信息的主题分值识别所述语义解析信息是否属于所述预设领域。

2.根据权利要求1所述的方法,其特征在于,获取预设领域中、解析用户输入的语音数据生成语义解析信息所采用的至少一个预设关键词提取模板之前,所述方法还包括:在各所述预设领域中,设置多个所述预设关键词提取模版 ,各所述预设关键词提取模板中包括至少两个所述关键词;

在各所述预设领域的各所述预设关键词提取模板中,标识对应的所述预设关键词提取模板中包括的各所述关键词在对应的所述预设领域中的重要程度标识。

3.根据权利要求2所述的方法,其特征在于,在各所述预设领域的各所述预设关键词提取模板中,标识对应的所述预设关键词提取模板中包括各所述关键词在对应的所述预设领域中的重要程度标识之前,所述方法还包括:获取各所述预设关键词提取模板中包括的各所述关键词在对应的所述预设领域中的重要程度标识。

4.根据权利要求3所述的方法,其特征在于,获取各所述预设关键词提取模板中包括的各所述关键词在对应的所述预设领域中的重要程度标识,具体包括:采集各所述预设领域的数条语料,生成对应的所述预设领域的语料库;

对所述语料库中的各所述语料进行分词,提取各所述语料中的有效分词作为所述语料包括的所述关键词;

统计各所述关键词在所述语料库中的所述数条语料分词后得到的所有所述关键词中出现的频率,作为对应的所述关键词在所述语料库中的词频;

根据各所述关键词在所述语料库中的词频占所述数条语料分词后得到的所有所述关键词出现的频率的概率,为对应的所述关键词设置在所述预设领域的重要程度标识。

5.根据权利要求1‑4任一所述的方法,其特征在于,根据各所述关键词提取模板中各所述关键词在所述预设领域的重要程度标识,获取各所述关键词的主题权重,具体包括:若所述预设关键词提取模板中的所述关键词在所述预设领域的重要程度标识为high,根据所述重要程度标识与主题权重的对应关系,获取所述high对应的主题权重为0;

若所述预设关键词提取模板中的所述关键词在所述预设领域的重要程度标识为middle,根据所述重要程度标识与主题权重的对应关系,获取所述middle对应的主题权重为第一质数;

若所述预设关键词提取模板中的所述关键词在所述预设领域的重要程度标识为low,根据所述重要程度标识与主题权重的对应关系,获取所述low对应的主题权重为第二质数;

所述第二质数不等于第一质数;所述high标识的所述关键词在所述预设领域的重要程度,高于所述middle标识的所述关键词在所述预设领域的重要程度;所述middle标识的所述关键词在所述预设领域的重要程度,高于所述low标识的所述关键词在所述预设领域的重要程度。

6.根据权利要求5所述的方法,其特征在于,根据各所述关键词的主题权重计算所述语义解析信息的主题分值,具体包括:将各所述关键词的主题权重相乘,得到所述语义解析信息的主题分值。

7.根据权利要求6所述的方法,其特征在于,根据所述语义解析信息的主题分值识别所述语义解析信息是否属于所述预设领域,具体包括:若所述语义解析信息的主题分值为0,确定所述语义解析信息属于所述预设领域;或者若所述语义解析信息的主题分值对第一参数或者第二参数求余等于0,确定所述语义解析信息中包括所述重要程度标识为所述middle的所述关键词,且包括的所述关键词的数量大于1,确定所述语义解析信息属于所述预设领域;其中所述第一参数等于所述第一质数的平方,所述第二参数等于所述第一质数和所述第二质数的乘积;或者若所述语义解析信息的主题分值既不等于0,又对第一参数或者第二参数求余不等于

0,则确定所述语义解析信息不属于所述预设领域。

8.一种语义解析信息的领域识别装置,其特征在于,所述装置包括:模板获取模块,用于获取预设领域中、解析用户输入的语音数据生成语义解析信息所采用的至少一个预设关键词提取模板;各所述预设关键词提取模板中包括至少一个关键词;

主题权重获取模块,用于若所述至少一个预设关键词提取模板的类型包括片段模板,根据各所述预设关键词提取模板中各所述关键词在所述预设领域的重要程度标识,获取各所述关键词的主题权重;

计算模块,用于根据各所述关键词的主题权重计算所述语义解析信息的主题分值;

识别模块,用于根据所述语义解析信息的主题分值识别所述语义解析信息是否属于所述预设领域。

9.根据权利要求8所述的装置,其特征在于,所述装置还包括:设置模块,用于在各所述预设领域中,设置多个所述预设关键词提取模版 ,各所述预设关键词提取模板中包括至少两个所述关键词;

重要程度标识模块,用于在各所述预设领域的各所述预设关键词提取模板中,标识对应的所述预设关键词提取模板中包括的各所述关键词在对应的所述预设领域中的重要程度标识。

10.根据权利要求9所述的装置,其特征在于,所述装置还包括:重要程度标识获取模块,用于获取各所述预设关键词提取模板中包括的各所述关键词在对应的所述预设领域中的重要程度标识。

11.根据权利要求10所述的装置,其特征在于,所述重要程度标识获取模块,具体用于:采集各所述预设领域的数条语料,生成对应的所述预设领域的语料库;

对所述语料库中的各所述语料进行分词,提取各所述语料中的有效分词作为所述语料包括的所述关键词;

统计各所述关键词在所述语料库中的所述数条语料分词后得到的所有所述关键词中出现的频率,作为对应的所述关键词在所述语料库中的词频;

根据各所述关键词在所述语料库中的词频占所述数条语料分词后得到的所有所述关键词出现的频率的概率,为对应的所述关键词设置在所述预设领域的重要程度标识。

12.根据权利要求8‑11任一所述的装置,其特征在于,所述主题权重获取模块,具体用于:

若所述预设关键词提取模板中的所述关键词在所述预设领域的重要程度标识为high,根据所述重要程度标识与主题权重的对应关系,获取所述high对应的主题权重为0;

若所述预设关键词提取模板中的所述关键词在所述预设领域的重要程度标识为middle,根据所述重要程度标识与主题权重的对应关系,获取所述middle对应的主题权重为第一质数;

若所述预设关键词提取模板中的所述关键词在所述预设领域的重要程度标识为low,根据所述重要程度标识与主题权重的对应关系,获取所述low对应的主题权重为第二质数;

所述第二质数不等于第一质数;所述high标识的所述关键词在所述预设领域的重要程度,高于所述middle标识的所述关键词在所述预设领域的重要程度;所述middle标识的所述关键词在所述预设领域的重要程度,高于所述low标识的所述关键词在所述预设领域的重要程度。

13.根据权利要求12所述的装置,其特征在于,所述计算模块,具体用于:将各所述关键词的主题权重相乘,得到所述语义解析信息的主题分值。

14.根据权利要求13所述的装置,其特征在于,所述识别模块,具体用于:若所述语义解析信息的主题分值为0,确定所述语义解析信息属于所述预设领域;或者若所述语义解析信息的主题分值对第一参数或者第二参数求余等于0,确定所述语义解析信息中包括所述重要程度标识为所述middle的所述关键词,且包括的所述关键词的数量大于1,确定所述语义解析信息属于所述预设领域;其中所述第一参数等于所述第一质数的平方,所述第二参数等于所述第一质数和所述第二质数的乘积;或者若所述语义解析信息的主题分值既不等于0,又对第一参数或者第二参数求余不等于

0,则确定所述语义解析信息不属于所述预设领域。

15.一种计算机设备,其特征在于,所述设备包括:一个或多个处理器;

存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1‑7中任一所述的方法。

16.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑7中任一所述的方法。