欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021115539397
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种模型训练方法,包括:

获取文本样本集,其中,所述文本样本集包括已标注样本和未标注样本;

获取初始模型,并分别将所述已标注样本和所述未标注样本输入所述初始模型,以生成多个预测结果和所述多个预测结果的分数;

根据选取策略和所述多个预测结果的分数,对所述多个预测结果进行排序,以得到预测结果序列;

从所述预测结果序列的列首开始获取N个预测结果;

若所述N个预测结果的分数满足分数条件,则根据所述N个预测结果,从所述文本样本集中选取所述N个样本,其中,所述N为正整数;

对所述N个样本进行标注,以得到N个训练样本;

根据所述已标注样本和所述N个训练样本对所述初始模型进行训练,以得到目标模型。

2.根据权利要求1所述的方法,其中,所述获取初始模型,包括:获取待训练的模型;

根据所述已标注样本对所述模型进行训练,以得到所述初始模型。

3.根据权利要求1所述的方法,其中,所述根据所述已标注样本和所述N个训练样本对所述初始模型进行训练,以得到目标模型,包括:根据所述已标注样本和所述N个训练样本对所述初始模型进行训练,以生成训练后的初始模型;

响应于所述训练后的初始模型满足训练完成条件,将所述训练后的初始模型作为所述目标模型。

4.根据权利要求3所述的方法,其中,所述根据所述已标注样本和所述N个训练样本对所述初始模型进行训练,以得到目标模型,还包括:获取测试样本和所述测试样本对应的标签;

将所述测试样本输入所述训练后的初始模型,以生成测试结果;

根据所述测试结果和所述标签,计算所述训练后的初始模型的准确率;

若所述准确率开始降低,则确定所述训练后的初始模型满足所述训练完成条件;

若所述准确率未开始降低,则确定所述训练后的初始模型不满足所述训练完成条件。

5.根据权利要求3所述的方法,其中,所述根据所述已标注样本和所述N个训练样本对所述初始模型进行训练,以得到目标模型,还包括:响应于所述训练后的初始模型未满足所述训练完成条件,分别将所述已标注样本和所述未标注样本输入所述训练后的初始模型,以重新生成多个预测结果和所述重新生成的多个预测结果的分数;

根据所述选取策略、所述重新生成的多个预测结果和所述重新生成的多个预测结果的分数,从所述文本样本集中重新选取N个样本;

对重新选取的N个样本进行标注,以重新得到N个训练样本;

根据所述已标注样本和重新得到的N个训练样本对所述训练后的初始模型进行训练,以得到所述目标模型。

6.一种命名实体识别方法,包括:

获取输入文本;

调用目标模型对所述输入文本进行命名实体识别,以生成所述输入文本的命名实体,其中,所述目标模型由权利要求1‑5任一项所述的模型训练方法训练得到。

7.一种模型训练装置,包括:

第一获取模块,用于获取文本样本集,其中,所述文本样本集包括已标注样本和未标注样本;

第二获取模块,用于获取初始模型,并分别将所述已标注样本和所述未标注样本输入所述初始模型,以生成多个预测结果和所述多个预测结果的分数;

选取模块,用于根据选取策略、所述多个预测结果和所述多个预测结果的分数,从所述文本样本集中选取N个样本,其中,所述N为正整数;

标注模块,用于对所述N个样本进行标注,以得到N个训练样本;

训练模块,用于根据所述已标注样本和所述N个训练样本对所述初始模型进行训练,以得到目标模型;

所述选取模块,具体用于:

根据所述选取策略和所述多个预测结果的分数,对所述多个预测结果进行排序,以得到预测结果序列;

从所述预测结果序列的列首开始获取N个预测结果;

若所述N个预测结果的分数满足分数条件,则根据所述N个预测结果,从所述文本样本集中选取所述N个样本。

8.根据权利要求7所述的装置,其中,所述第二获取模块,具体用于:获取待训练的模型;

根据所述已标注样本对所述模型进行训练,以得到所述初始模型。

9.根据权利要求7所述的装置,其中,所述训练模块,具体用于:根据所述已标注样本和所述N个训练样本对所述初始模型进行训练,以生成训练后的初始模型;

响应于所述训练后的初始模型满足训练完成条件,将所述训练后的初始模型作为所述目标模型。

10.根据权利要求9所述的装置,其中,所述训练模块,还用于:获取测试样本和所述测试样本对应的标签;

将所述测试样本输入所述训练后的初始模型,以生成测试结果;

根据所述测试结果和所述标签,计算所述训练后的初始模型的准确率;

若所述准确率开始降低,则确定所述训练后的初始模型满足所述训练完成条件;

若所述准确率未开始降低,则确定所述训练后的初始模型不满足所述训练完成条件。

11.根据权利要求9所述的装置,其中,所述训练模块,还用于:响应于所述训练后的初始模型未满足所述训练完成条件,分别将所述已标注样本和所述未标注样本输入所述训练后的初始模型,以重新生成多个预测结果和所述重新生成的多个预测结果的分数;

根据所述选取策略、所述重新生成的多个预测结果和所述重新生成的多个预测结果的分数,从所述文本样本集中重新选取N个样本;

对重新选取的N个样本进行标注,以重新得到N个训练样本;

根据所述已标注样本和重新得到的N个训练样本对所述训练后的初始模型进行训练,以得到所述目标模型。

12.一种命名实体识别装置,包括:

获取模块,用于获取输入文本;

识别模块,用于调用目标模型对所述输入文本进行命名实体识别,以生成所述输入文本的命名实体,其中,所述目标模型由权利要求1‑5任一项所述的模型训练方法训练得到。

13.一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑5中任一项所述的模型训练方法,或者,执行权利要求6中所述的命名实体识别方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1‑5中任一项所述的模型训练方法,或者,执行根据权利要求6中所述的命名实体识别方法。