欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019107002975
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种实体相似度计算的方法,其特征在于,包括:

确定第一实体和第二实体的第一相似度;所述第一相似度为:根据所述第一实体的特征向量和所述第二实体的特征向量计算得到的相似度;

获取所述第一实体的边关系集合,以及所述第二实体的边关系集合;所述第一实体的边关系集合中包括与所述第一实体关联的信息,所述第二实体的边关系集合包括与所述第二实体关联的信息;

根据所述第一实体的边关系集合和所述第二实体的边关系集合,计算所述第一实体和所述第二实体的第一层距离;

根据所述第一相似度和所述第一层距离,计算所述第一实体和第二实体的第二相似度。

2.根据权利要求1所述的方法,其特征在于,所述根据所述第一实体的边关系集合和所述第二实体的边关系集合,计算所述第一实体和所述第二实体的第一层距离,包括:计算所述第一实体的边关系集合中的第n个信息与所述第二实体的边关系集合中的第m个信息的距离,n=0,1,2……,N-1;m=0,1,2……,M-1,N为所述第一实体的边关系集合中信息的个数,M为所述第二实体的边关系集合中信息的个数,M和N均为大于或等于1的整数;

根据所述第一实体的边关系集合和所述第二实体的边关系集合,确定所述n个信息与所述第m信息的相似度参数;其中,全部的所述相似度参数相加的和为1;

根据所述第一实体的边关系集合中的信息和所述第二实体的边关系集合中的信息的相似度参数和距离,计算所述第一实体和所述第二实体的第一层距离。

3.根据权利要求2所述的方法,其特征在于,所述n个信息与各所述第m信息的相似度参数相同。

4.根据权利要求2所述的方法,其特征在于,根据所述第一实体的边关系集合和所述第二实体的边关系集合,确定所述n个信息与所述第m信息的相似度参数,包括:根据所述第一实体与所述n个信息的第一边关系,以及所述第二实体与所述第m个实体的第二边关系,判断所述第一边关系和所述第二边关系是否满足预设条件,所述预设条件为:所述第一边关系和所述第二边关系相同,且所述第一边关系和所述第二边关系均属于预设的边关系核心属性集合;

当所述第一边关系和所述第二边关系满足所述预设条件时,确定所述第n个信息和所述第m个信息相似度参数为第一相似度参数;

当所述第一边关系和所述第二边关系不满足所述预设条件时,确定所述第n个信息和所述第m个信息相似度参数为第二相似度参数,其中,所述第一相似度参数大于所述第二相似度参数。

5.根据权利要求4所述的方法,其特征在于,所述第一相似度参数是所述第二相似度参数的两倍。

6.根据权利要求2-5任一项所述的方法,其特征在于,所述根据所述第一实体的边关系集合和所述第二实体的边关系集合,计算所述第一实体和所述第二实体的第一层距离,具体满足下述公式:其中,∑a∈Si∑b∈Sjγa,b=1

其中,i表示第一实体,j表示第二实体, 为所述第一层距离;Si为所述第一实体的边关系集合,Sj为所述第二实体的边关系集合,a为与所述第一实体存在边关系的信息,b为与所述第二体存在边关系的信息, 表示a和b之间的距离,γa,b表示a和b之间的相似度参数。

7.根据权利要求6所述的方法,其特征在于,所述根据所述第一相似度和所述第一层距离,计算所述第一实体和第二实体的第二相似度,具体满足下述公式:其中, 为所述第二相似度, 为所述第一相似度,β为预设的权重值。

8.根据权利要求1所述的方法,其特征在于,所述根据所述第一相似度和所述第一层距离,计算所述第一实体和第二实体的第二相似度之后,还包括:在所述第二相似度高于预设相似度阈值的情况下,对所述第一实体和所述第二实体进行实体融合。

9.根据权利要求8所述的方法,其特征在于,所述在所述第二相似度高于预设相似度阈值的情况下,对所述第一实体和所述第二实体进行实体融合之后,还包括:在所述实体融合的融合效果不满足预设效果的情况下,根据所述第一实体的边关系集合和所述第二实体的边关系集合,计算所述第一实体和所述第二实体的第二层距离;

根据所述第二相似度和所述第二层距离,计算所述第一实体和所述第二实体的第三相似度。

10.根据权利要求1-6、或8-9任一项所述的方法,其特征在于,所述第一实体的特征向量、所述第二实体的特征向量、所述第一实体的边关系集合以及所述第二实体的边关系集合均是从预设的知识图谱中获取的。

11.一种实体相似度计算的装置,其特征在于,包括:

第一相似度确定模块,用于确定第一实体和第二实体的第一相似度;所述第一相似度为:根据所述第一实体的特征向量和所述第二实体的特征向量计算得到的相似度;

边关系集合获取模块,用于获取所述第一实体的边关系集合,以及所述第二实体的边关系集合;所述第一实体的边关系集合中包括与所述第一实体关联的信息,所述第二实体的边关系集合包括与所述第二实体关联的信息;

第一层距离计算模块,用于根据所述第一实体的边关系集合和所述第二实体的边关系集合,计算所述第一实体和所述第二实体的第一层距离;

第二相似度计算模块,用于根据所述第一相似度和所述第一层距离,计算所述第一实体和第二实体的第二相似度。

12.根据权利要求11所述的装置,其特征在于,所述第一层距离计算模块包括:距离计算子模块,用于计算所述第一实体的边关系集合中的第n个信息与所述第二实体的边关系集合中的第m个信息的距离,n=0,1,2……,N-1;m=0,1,2……,M-1,N为所述第一实体的边关系集合中信息的个数,M为所述第二实体的边关系集合中信息的个数,M和N均为大于或等于1的整数;

相似度参数计算子模块,用于根据所述第一实体的边关系集合和所述第二实体的边关系集合,确定所述n个信息与所述第m信息的相似度参数;其中,全部的所述相似度参数相加的和为1;

第一层距离计算子模块,用于根据所述第一实体的边关系集合中的信息和所述第二实体的边关系集合中的信息的相似度参数和距离,计算所述第一实体和所述第二实体的第一层距离。

13.根据权利要求12所述的装置,其特征在于,所述n个信息与各所述第m信息的相似度参数相同。

14.根据权利要求12所述的装置,其特征在于,所述相似度参数计算子模块包括:相似度参数计算单元,用于根据所述第一实体与所述n个信息的第一边关系,以及所述第二实体与所述第m个实体的第二边关系,判断所述第一边关系和所述第二边关系是否满足预设条件,所述预设条件为:所述第一边关系和所述第二边关系相同,且所述第一边关系和所述第二边关系均属于预设的边关系核心属性集合;当所述第一边关系和所述第二边关系满足所述预设条件时,确定所述第n个信息和所述第m个信息相似度参数为第一相似度参数;当所述第一边关系和所述第二边关系不满足所述预设条件时,确定所述第n个信息和所述第m个信息相似度参数为第二相似度参数,其中,所述第一相似度参数大于所述第二相似度参数。

15.根据权利要求14所述的装置,其特征在于,所述第一相似度参数是所述第二相似度参数的两倍。

16.根据权利要求12-15任一项所述的装置,其特征在于,所述第一层距离计算模块的根据所述第一实体的边关系集合和所述第二实体的边关系集合,计算所述第一实体和所述第二实体的第一层距离,具体满足下述公式:其中,∑a∈si∑b∈Sjγa,b=1

其中,i表示第一实体,j表示第二实体, 为所述第一层距离;Si为所述第一实体的边关系集合,Sj为所述第二实体的边关系集合,a为与所述第一实体存在边关系的信息,b为与所述第二体存在边关系的信息, 表示a和b之间的距离,γa,b表示a和b之间的相似度参数。

17.根据权利要求16所述的装置,其特征在于,所述第二相似度计算模块的根据所述第一相似度和所述第一层距离,计算所述第一实体和第二实体的第二相似度,具体满足下述公式:其中, 为所述第二相似度, 为所述第一相似度,β为预设的权重值。

18.根据权利要求11所述的装置,其特征在于,还包括:

融合模块,用于在所述第二相似度高于预设相似度阈值的情况下,对所述第一实体和所述第二实体进行实体融合。

19.根据权利要求18所述的装置,其特征在于,还包括:

第二层距离计算模块,用于在所述实体融合的融合效果不满足预设效果的情况下,根据所述第一实体的边关系集合和所述第二实体的边关系集合,计算所述第一实体和所述第二实体的第二层距离;

第三相似度计算模块,用于根据所述第二相似度和所述第二层距离,计算所述第一实体和所述第二实体的第三相似度。

20.根据权利要求11-16、或18-19任一项所述的装置,其特征在于,所述第一实体的特征向量、所述第二实体的特征向量、所述第一实体的边关系集合以及所述第二实体的边关系集合均是从预设的知识图谱中获取的。

21.一种电子设备,其特征在于,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。

22.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的方法。