欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019105208884
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种事件检索方法,其特征在于,包括:

训练得到用于识别两个事件描述是否对应同一事件的识别模型;

基于所述识别模型形成事件向量抽取服务,所述事件向量表示所述识别模型对于事件描述的理解;

根据所述事件向量抽取服务,分别获取待检索的事件描述对应的事件向量以及事件库中的事件的事件描述对应的事件向量;

根据获取到的事件向量,确定出所述事件库中与所述待检索的事件描述相匹配的事件。

2.根据权利要求1所述的方法,其特征在于,

所述训练得到用于识别两个事件描述是否对应同一事件的识别模型包括:构建作为训练样本的正样本和负样本,其中,所述正样本中包含对应于同一事件的两个事件描述,所述负样本中包含对应于不同事件的两个事件描述;

根据所述正样本和所述负样本训练得到所述识别模型。

3.根据权利要求2所述的方法,其特征在于,

所述构建作为训练样本的正样本和负样本包括:

从指定数据源抽取事件描述;

根据抽取出的事件描述构建所述正样本和所述负样本。

4.根据权利要求1所述的方法,其特征在于,

所述识别模型包括:基于转换器双向编码器特征BERT的微调fine-tune模型。

5.根据权利要求4所述的方法,其特征在于,

所述事件向量抽取服务包括:当向所述识别模型输入一个事件描述时,抽取所述识别模型中所述事件描述的最后一层句子分隔符[SEP]向量,作为所述事件描述对应的事件向量。

6.根据权利要求1所述的方法,其特征在于,

所述根据获取到的事件向量,确定出所述事件库中与所述待检索的事件描述相匹配的事件包括:基于近似最近邻ANN工具,确定出所述事件库中的事件的事件描述对应的事件向量中、与所述待检索的事件描述对应的事件向量相匹配的事件向量,将相匹配的事件向量对应的事件作为与所述待检索的事件描述相匹配的事件。

7.一种事件检索装置,其特征在于,包括:模型训练单元、服务生成单元以及事件检索单元;

所述模型训练单元,用于训练得到用于识别两个事件描述是否对应同一事件的识别模型;

所述服务生成单元,用于基于所述识别模型形成事件向量抽取服务,所述事件向量表示所述识别模型对于事件描述的理解;

所述事件检索单元,用于根据所述事件向量抽取服务,分别获取待检索的事件描述对应的事件向量以及事件库中的事件的事件描述对应的事件向量;根据获取到的事件向量,确定出所述事件库中与所述待检索的事件描述相匹配的事件。

8.根据权利要求7所述的装置,其特征在于,

所述模型训练单元进一步用于,构建作为训练样本的正样本和负样本,其中,所述正样本中包含对应于同一事件的两个事件描述,所述负样本中包含对应于不同事件的两个事件描述,根据所述正样本和所述负样本训练得到所述识别模型。

9.根据权利要求8所述的装置,其特征在于,

所述模型训练单元从指定数据源抽取事件描述,根据抽取出的事件描述构建所述正样本和所述负样本。

10.根据权利要求7所述的装置,其特征在于,

所述识别模型包括:基于转换器双向编码器特征BERT的微调fine-tune模型。

11.根据权利要求10所述的装置,其特征在于,所述事件向量抽取服务包括:当向所述识别模型输入一个事件描述时,抽取所述识别模型中所述事件描述的最后一层句子分隔符[SEP]向量,作为所述事件描述对应的事件向量。

12.根据权利要求7所述的装置,其特征在于,

所述事件检索单元基于近似最近邻ANN工具,确定出所述事件库中的事件的事件描述对应的事件向量中、与所述待检索的事件描述对应的事件向量相匹配的事件向量,将相匹配的事件向量对应的事件作为与所述待检索的事件描述相匹配的事件。

13.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~6中任一项所述的方法。

14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~6中任一项所述的方法。