欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021103047160
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-03-29
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种信息转换模型的训练方法,包括:获取具有第一标签的第一样本信息,所述第一标签指示了基于所述第一样本信息转换得到的结构化信息;

采用实体特征提取模型来从所述第一样本信息中提取第一实体特征,并采用语义理解模型来从所述第一样本信息中提取第一语义特征;

根据所述第一实体特征和所述第一语义特征,采用初始信息转换模型得到针对所述第一样本信息的预测结构化信息;以及根据所述预测结构化信息和所述第一标签指示的结构化信息,训练所述初始信息转换模型,得到经训练的信息转换模型。

2.根据权利要求1所述的方法,其中,所述第一样本信息还具有第二标签,所述第二标签指示了针对所述第一样本信息的词性信息;所述方法还包括:根据所述第一实体特征和所述第一语义特征,经由词性预测模型得到针对所述第一样本信息的预测词性信息,其中,所述词性预测模型与所述经训练的信息转换模型共享除输出层外的其他层;

其中,训练所述初始信息转换模型包括:根据所述预测结构化信息和所述第一标签指示的结构化信息之间的差异以及所述预测词性信息和所述第二标签指示的词性信息之间的差异,训练所述初始信息转换模型。

3.根据权利要求1所述的方法,还包括生成所述具有第一标签的第一样本信息,包括:获取用于查询信息的关键词;

基于所述关键词和第一预定文本模板,得到包含所述关键词的第一文本信息;

基于所述关键词和第一预定标签模板,得到包含所述关键词的第一标签;以及将包含所述关键词的第一标签作为所述第一文本信息的标签,以生成具有第一标签的第一样本信息。

4.根据权利要求1所述的方法,其中,所述结构化信息为用于查询数据库中数据的查询语句。

5.根据权利要求1所述的方法,还包括在提取第一实体特征之前,训练所述实体特征提取模型,包括:

获取用于查询信息的实体词库;

基于所述实体词库、第二预定文本模板和第二预定标签模板,获得针对实体特征提取模型的第二样本信息;以及

基于所述第二样本信息训练所述实体特征提取模型。

6.根据权利要求5所述的方法,其中,获得针对实体特征提取模型的第二样本信息包括:

基于所述实体词库和第二预定文本模板,得到包含所述实体词库中的实体词的第二文本信息;

基于所述第二预定标签模板和所述第二文本信息包含的实体词库中的实体词,得到第三标签;以及

将所述第三标签作为所述第二文本信息的标签,获得所述第二样本信息,其中,所述第三标签指示了所述第二文本信息包含的实体词的类型。

7.根据权利要求6所述的方法,其中,获得针对实体特征提取模型的第二样本信息还包括:

获取用于查询信息的第一历史文本信息,所述第一历史文本信息包括自然语言文本;

以及

从所述第一历史文本信息中确定包含所述实体词库中的实体词的文本信息,作为所述第二文本信息。

8.根据权利要求1所述的方法,还包括在提取第一语义特征之前,训练所述语义理解模型,包括:

获取第二历史文本信息,所述第二历史文本信息包括自然语言文本;以及基于所述第二历史文本信息训练所述语义理解模型。

9.根据权利要求1所述的方法,其中,所述第一样本信息用于查询信息;所述采用语义理解模型来从所述第一样本信息中提取第一语义特征包括:采用预定分类模型确定所述第一样本信息所查询信息的第一存储信息;以及基于所述第一存储信息和所述第一样本信息,采用所述语义理解模型提取得到所述第一语义特征。

10.一种文本信息的转换方法,包括:获取用于查询信息的待转换文本信息,所述待转换文本信息包括自然语言文本;

采用实体特征提取模型来从所述待转换文本信息中提取第二实体特征,并采用语义理解模型来从所述待转换文本信息中提取第二语义特征;以及根据所述第二实体特征和所述第二语义特征,经由信息转换模型得到针对所述待转换文本信息的结构化信息,

其中,所述信息转换模型是使用根据权利要求1~9中任一项权利要求所述的方法来训练的。

11.根据权利要求10所述的方法,其中,采用语义理解模型来从所述待转换文本信息中提取第二语义特征包括:

采用预定分类模型确定所述待转换文本信息所查询信息的存储信息;以及基于所述存储信息和所述待转换文本信息,采用语义理解模型提取得到所述第二语义特征。

12.一种信息转换模型的训练装置,包括:样本信息获取模块,用于获取具有第一标签的第一样本信息,所述第一标签指示了基于所述第一样本信息转换得到的结构化信息;

第一特征提取模块,用于采用实体特征提取模型来从所述第一样本信息中提取第一实体特征,并采用语义理解模型来从所述第一样本信息中提取第一语义特征;

结构化信息获得模块,用于根据所述第一实体特征和所述第一语义特征,采用初始信息转换模型得到针对所述第一样本信息的预测结构化信息;以及转换模型训练模块,用于根据所述预测结构化信息和所述第一标签指示的结构化信息,训练所述初始信息转换模型,得到经训练的信息转换模型。

13.根据权利要求12所述的装置,其中,所述第一样本信息还具有第二标签,所述第二标签指示了针对所述第一样本信息的词性信息;所述装置还包括:词性信息获得模块,用于根据所述第一实体特征和所述第一语义特征,经由词性预测模型得到针对所述第一样本信息的预测词性信息,其中,所述词性预测模型与所述经训练的信息转换模型共享除输出层外的其他层;

其中,所述转换模型训练模块具体用于根据所述预测结构化信息和所述第一标签指示的结构化信息之间的差异以及所述预测词性信息和所述第二标签指示的词性信息之间的差异,训练所述初始信息转换模型。

14.根据权利要求12所述的装置,还包括样本生成模块,用于生成所述具有第一标签的第一样本信息;所述样本生成模块包括:关键词获取子模块,用于获取用于查询信息的关键词;

文本信息获得子模块,用于基于所述关键词和第一预定文本模板,得到包含所述关键词的第一文本信息;

标签获得子模块,用于基于所述关键词和第一预定标签模板,得到包含所述关键词的第一标签;以及

第一样本生成子模块,用于将包含所述关键词的第一标签作为所述第一文本信息的标签,以生成具有第一标签的第一样本信息。

15.根据权利要求12所述的装置,其中,所述结构化信息为用于查询数据库中数据的查询语句。

16.根据权利要求12所述的装置,还包括第一模型训练模块,用于在所述第一特征提取模块提取第一实体特征之前,训练所述实体特征提取模型;所述第一模型训练模块包括:词库获取子模块,用于获取用于查询信息的实体词库;

第二样本生成子模块,用于基于所述实体词库、第二预定文本模板和第二预定标签模板,获得针对实体特征提取模型的第二样本信息;以及第一训练子模块,用于基于所述第二样本信息训练所述实体特征提取模型。

17.根据权利要求16所述的装置,其中,所述第二样本生成子模块包括:文本信息获得单元,用于基于所述实体词库和第二预定文本模板,得到包含所述实体词库中的实体词的第二文本信息;

标签获得单元,用于基于所述第二预定标签模板和所述第二文本信息包含的实体词库中的实体词,得到第三标签;以及样本获得单元,用于将所述第三标签作为所述第二文本信息的标签,获得所述第二样本信息,

其中,所述第三标签指示了所述第二文本信息包含的实体词的类型。

18.根据权利要求17所述的装置,其中,所述第二样本生成子模块还包括:历史文本获得单元,用于获取用于查询信息的第一历史文本信息,所述第一历史文本信息包括自然语言文本,

其中,所述文本信息获得单元还用于从所述第一历史文本信息中确定包含所述实体词库中的实体词的文本信息,作为所述第二文本信息。

19.根据权利要求12所述的装置,还包括第二模型训练模块,用于在所述第一特征提取模块提取第一语义特征之前,训练语义理解模型;所述第二模型训练模块包括:历史文本获得子模块,用于获取第二历史文本信息,所述第二历史文本信息包括自然语言文本;以及

第二训练子模块,用于基于所述第二历史文本信息训练所述语义理解模型。

20.根据权利要求12所述的装置,其中,所述第一样本信息用于查询信息;所述第一特征提取模块包括:

第一存储信息确定子模块,用于采用预定分类模型确定所述第一样本信息所查询信息的第一存储信息;以及

第一语义特征提取子模块,用于基于所述第一存储信息和所述第一样本信息,采用所述语义理解模型提取得到所述第一语义特征。

21.一种文本信息的转换装置,包括:文本信息获取模块,用于获取用于查询信息的待转换文本信息,所述待转换文本信息包括自然语言文本;

第二特征提取模块,用于采用实体特征提取模型来从所述待转换文本信息中提取第二实体特征,并采用语义理解模型来从所述待转换文本信息中提取第二语义特征;以及信息转换模块,用于根据所述第二实体特征和所述第二语义特征,经由信息转换模型得到针对所述待转换文本信息的结构化信息,其中,所述信息转换模型是使用根据权利要求12~20中任一项所述的装置来训练的。

22.根据权利要求21所述的装置,其中,所述第二特征提取模块包括:第二存储信息确定子模块,用于采用预定分类模型确定所述待转换文本信息所查询信息的存储信息;以及

第二语义特征提取子模块,用于基于所述存储信息和所述待转换文本信息,采用语义理解模型提取得到所述第二语义特征。

23.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1~11中任一项所述的方法。

24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1~11中任一项所述的方法。

25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1~11中任一项所述的方法。