欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020100398847
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于实体关系消歧的知识图谱问答方法,其特征在于,包括以下步骤:S1、获取用户终端输入的问句文本,识别出所述问句文本中的实体提及词、属性提及词和特定关系,并抽取出候选实体;

S2、将实体提及词和属性提及词链接到预先构建的知识图谱中,并根据链接到知识图谱中的候选实体的二度关系子图建立出语义超图;

S3、从所述语义超图中提取每个实体的多粒度上下文特征,使用极端梯度提升算法进行二分类线性回归对实体和关系进行联合消歧;

S4、在联合消歧后的语义超图中,将每个实体顶点的一度关系子图中各个一度关系子树的实体及其实体关系按顺序拼接为第一字符串,计算出生成第一字符串的字符集合与问句字符集合的第一字面相似度,以及第一字符串与问句的第一语义相似度;

S5、计算出各个一度关系子树中的实体关系集合与步骤S1抽取出的特定关系集合的第一交集数;根据所述第一交集数、所述第一语义相似度以及所述第一字面相似度计算出各个一度关系子树的评价得分;选择高评价得分的作为第一候选答案子树;

S6、对第一候选答案子树进行拓展,将扩展后的二度关系子树中的实体及其实体关系按顺序拼接为第二字符串,计算生成第二字符串的字符集合与问句字符集合的第二字面相似度;若该第二字面相似度小于步骤S5所计算的第一字面相似度,则去掉该二度关系子树;

否则继续计算第二字符串与问句的第二语义相似度;

S7、计算出各个二度关系子树中的实体关系集合与步骤S1抽取出的特定关系集合的第二交集数;根据所述第二交集数、所述第二语义相似度以及所述第二字面相似度计算出各个二度关系子树的评价得分;并将各个二度关系子树作为第二候选答案子树;

S8、获得在第一候选答案子树与第二候选答案子树中评价得分最高的候选答案查询子树,用该评价得分最高的候选答案查询子树生成查询语句在对应的图数据库中查询答案。

2.根据权利要求1所述的一种基于实体关系消歧的知识图谱问答方法,其特征在于,所述步骤S1中包括利用基于神经网络的实体关系联合抽取模型,抽取问句中的实体提及词和特定关系;使用实体提及词典、属性提及词典抽取问句文本中的实体提及词和属性提及词,并进行扩充,形成候选实体和属性值提及词集合。

3.根据权利要求1所述的一种基于实体关系消歧的知识图谱问答方法,其特征在于,所述步骤S3包括从所述语义超图中提取每个实体顶点的词语级特征,知识图谱上下文特征以及自然语言问句级特征;使用极端梯度提升算法进行二分类线性回归进行初步的联合消岐,保留语义超图中得分前五的实体顶点以及所述实体顶点的连接关系;其中词语级特征包括实体的长度特征fe‑length,提及词与问句的词重叠数fm‑overlap,实体与问句的词重叠数fe‑overlap,提及词的词频逆文本频率fm‑tf‑idf,提及词的句中位置fm‑position以及提及词的长度fm‑length;知识图谱上下文特征包括实体的一度关系数目f1‑hop‑num,实体的二度关系数目f2‑hop‑num,一度关系与问句的相似度f1‑hop‑similarity,二度关系与问句的相似度f2‑hop‑similarity;

自然语言问句级特征包括问句的长度fs‑length。

4.根据权利要求1所述的一种基于实体关系消歧的知识图谱问答方法,其特征在于,所述评价得分的计算方法包括将语义相似度、字面相似度以及交集数通过二分类线性回归,从而获得第一候选答案子树的评价得分或/和第二候选答案子树的评价得分。

5.根据权利要求1所述的一种基于实体关系消歧的知识图谱问答方法,其特征在于,所述第一语义相似度以及第二语义相似度均采用基于BERT的文本相似度匹配模型计算而得。

6.根据权利要求1所述的一种基于实体关系消歧的知识图谱问答方法,其特征在于,所述第一字面相似度以及第二字面相似度均通过杰卡德距离计算而得。

7.一种基于实体关系消歧的知识图谱问答系统,其特征在于,所述系统包括:识别抽取模块:用于获取用户终端输入的问句文本,识别出用户终端输入的问句文本中的实体提及词、属性提及词和特定关系,并抽取出候选实体;

语义超图构建模块:用于将实体提及词和属性提及词链接到预先构建的知识图谱中,并根据每个实体的二度关系子图,建立出用于问句理解的语义超图;

特征抽取模块:用于所述语义超图中提取每个实体的多粒度上下文特征;

联合消岐模块:用于通过极端梯度提升算法进行二分类线性回归对语义超图中的实体和关系进行联合消歧;

一度关系子图构建模块:用于构建语义超图的一度关系子图,并在联合消歧后的语义超图中,将每个实体顶点的一度关系子图中各个一度关系子树的实体及其实体关系按顺序拼接为第一字符串,计算出生成第一字符串的字符集合与问句字符集合的第一字面相似度,以及第一字符串与问句的第一语义相似度;

第一候选答案子树选择模块:用于计算出各个一度关系子树中的实体关系集合与抽取出的特定关系集合的第一交集数;根据所述第一交集数、所述第一语义相似度以及第一字面相似度计算出一度关系子图中各个一度关系子树的评价得分,选择高评价得分的一度关系子树作为第一候选答案子树;

二度关系子图构建模块:用于对第一候选答案子树进行扩展,将扩展后的二度关系子树中的实体及其实体关系按顺序拼接为第二字符串,计算生成第二字符串的字符集合与问句字符集合的第二字面相似度;若该第二字面相似度小于所计算的第一字面相似度,则去掉该二度关系子树;否则继续计算第二字符串与问句的第二语义相似度;

第二候选答案子树选择模块:用于计算出各个二度关系子树中的实体关系集合与抽取出的特定关系集合的第二交集数;通过所述第二交集数、第二语义相似度以及所述第二字面相似度计算出各个二度关系子树的评价得分,并将各个二度关系子树作为第二候选答案子树;

回归查询模块:获得在第一候选答案子树与第二候选答案子树中评价得分最高的候选答案查询子树 ,用该评价得分最高的候选答案查询子树生成查询语句在对应的图数据库中查询答案。

8.一种基于实体关系消歧的知识图谱问答终端,其特征在于,包括处理器和存储器,所述存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1~6任一所述的方法。