1.一种事件检索方法,其特征在于,包括:
训练得到用于识别两个事件描述是否对应同一事件的识别模型,包括:从指定数据源抽取事件描述,并进行聚类,针对得到的每个簇,基于用户的颜色标记构建出作为训练样本的正样本和负样本,其中,所述正样本中包含对应于同一事件的两个事件描述,所述负样本中包含对应于不同事件的两个事件描述,根据所述正样本和所述负样本训练得到所述识别模型;
基于所述识别模型形成事件向量抽取服务,所述事件向量抽取服务用于:当向所述识别模型输入一个事件描述时,抽取所述识别模型中所述事件描述的最后一层句子分隔符[SEP]向量,作为所述事件描述对应的事件向量;所述事件向量表示所述识别模型对于事件描述的理解;
根据所述事件向量抽取服务,分别获取待检索的事件描述对应的事件向量以及事件库中的事件的事件描述对应的事件向量;
根据获取到的事件向量,确定出所述事件库中与所述待检索的事件描述相匹配的事件。
2.根据权利要求1所述的方法,其特征在于,
所述识别模型包括:基于转换器双向编码器特征BERT的微调fine‑tune模型。
3.根据权利要求1所述的方法,其特征在于,
所述根据获取到的事件向量,确定出所述事件库中与所述待检索的事件描述相匹配的事件包括:基于近似最近邻ANN工具,确定出所述事件库中的事件的事件描述对应的事件向量中、与所述待检索的事件描述对应的事件向量相匹配的事件向量,将相匹配的事件向量对应的事件作为与所述待检索的事件描述相匹配的事件。
4.一种事件检索装置,其特征在于,包括:模型训练单元、服务生成单元以及事件检索单元;
所述模型训练单元,用于训练得到用于识别两个事件描述是否对应同一事件的识别模型,包括:从指定数据源抽取事件描述,并进行聚类,针对得到的每个簇,基于用户的颜色标记构建出作为训练样本的正样本和负样本,其中,所述正样本中包含对应于同一事件的两个事件描述,所述负样本中包含对应于不同事件的两个事件描述,根据所述正样本和所述负样本训练得到所述识别模型;
所述服务生成单元,用于基于所述识别模型形成事件向量抽取服务,所述事件向量抽取服务用于:当向所述识别模型输入一个事件描述时,抽取所述识别模型中所述事件描述的最后一层句子分隔符[SEP]向量,作为所述事件描述对应的事件向量;所述事件向量表示所述识别模型对于事件描述的理解;
所述事件检索单元,用于根据所述事件向量抽取服务,分别获取待检索的事件描述对应的事件向量以及事件库中的事件的事件描述对应的事件向量;根据获取到的事件向量,确定出所述事件库中与所述待检索的事件描述相匹配的事件。
5.根据权利要求4所述的装置,其特征在于,
所述识别模型包括:基于转换器双向编码器特征BERT的微调fine‑tune模型。
6.根据权利要求4所述的装置,其特征在于,
所述事件检索单元基于近似最近邻ANN工具,确定出所述事件库中的事件的事件描述对应的事件向量中、与所述待检索的事件描述对应的事件向量相匹配的事件向量,将相匹配的事件向量对应的事件作为与所述待检索的事件描述相匹配的事件。
7.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~3中任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~3中任一项所述的方法。