欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021109700894
申请人: 东北林业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于所述方法具体过程为:将在线问答平台的问题文本和外部知识图谱输入到训练好的KOCIN模型中获得推荐的标签;

所述KOCIN模型包括:知识集成层、序列编码层、关联捕获层;所述知识集成层用于从问题文本qi和外部知识图谱 中提取知识三元组,然后将知识三元组集成到问题文本qi中,生成句子树Qtree;

所述序列编码层采用基于BERT的序列编码器,用于将Qtree转化为Qtree的稠密向量化表示进而获得预测的问题文本原始标签;

所述关联捕获层包括:多个标签关联网络CorNet,用于根据预测的问题文本原始标签获得问题文本的推荐标签,如下式:

y'=W1δ(W2σ(y)+b1)+b2+y其中,y'是问题文本的推荐标签,W1、W2是权重矩阵,b1,b2是偏差,σ是sigmoid激活函数,δ是ELU激活函数,y是预测的问题文本原始标签;

KOCIN模型的损失函数为:

loss(y',b)=Mean{l1,...lN}其中,m∈[1,N]为批量的序号,N为批量的数目,b为问题文本的真实标签,lm为第m个批量的损失值,Mean{}是求平均函数;

所述lm为第m个批量的损失值,如下式:lm=‑(bm*log(σ(y'm))+(1‑bm)*log(1‑σ(y'm)))其中,y'm是第m个批量的问题文本的推荐标签,bm是第m个批量问题文本的真实标签。

2.根据权利要求1所述的基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于:所述知识集成层用于从问题文本和外部知识图谱 中提取知识三元组,然后将知识三元组集成到问题文本中,生成句子树Qtree,包括以下步骤:步骤一一、对于问题文本qi中的每个实体ej进行知识查询,从而提取知识三元组的集合E;

步骤一二、将知识三元组的集合E中的所有知识三元组插入到问题文本qi中,生成句子树Qtree。

3.根据权利要求2所述的基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于:所述步骤一一中对于问题文本qi中的每个实体ej进行知识查询,从而提取知识三元组的集合E,如下式:

其中,E={(ej,rj1,ej1),…,(ej,rjk,ejk)}是与ej匹配的知识三元组的集合,rj1是实体ej与匹配到的第一个知识三元组的关系,ej1是实体ej匹配到的第一个知识三元组的实体,(ej,rjk,ejk)是第k个知识三元组,K_Query()是查询函数, 是外部知识图谱。

4.根据权利要求3所述的基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于:所述步骤一二中将知识三元组的集合E中的所有知识三元组插入到问题文本qi中,生成句子树Qtree,如下式:Qtree=K_Insert(ej,E)={w1,w2,...ej{(rj1,ej1),...,(rjk,ejk)},...,wn}其中,Qtree={w1,w2,...ej{(rj1,ej1),...,(rjk,ejk)},...,wn},wi是构成句子的词,i∈[1,n],K_Insert()是插入函数,n是构成句子的词的总数量。

5.根据权利要求4所述的基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于:所述序列编码层采用基于BERT的序列编码器,用于将Qtree转化为Qtree的稠密向量化表示进而获得预测的问题文本原始标签,包括以下步骤:步骤二一、将步骤一二获得的Qtree的开头插入多个[CLS]标记,获得插入[CLS]标记后的句子树:

Qtree_CLS={[CLS1],…,[CLSc],w1,w2,…ej{(rj1,ej1),...,(rjk,ejk)},...,wn}其中,c是插入的[CLS]标记总数;

步骤二二、序列编码器利用Qtree_CLS获得[CLS]标记的隐藏状态向量,再根据[CLS]标记的隐藏状态向量获取Qtree的稠密向量化表示;

步骤二三、利用Qtree的稠密向量化表示获得问题文本的原始标签。

6.根据权利要求5所述的基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于:所述步骤二二中的根据[CLS]标记的隐藏状态向量获取Qtree的稠密向量化表示,如下式:

其中, 为第a个[CLS]对应的隐藏状态向量,a∈[1,c],MaxPooling()是最大池化函数。

7.根据权利要求6所述的基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于:所述步骤二三中利用Qtree的稠密向量化表示获得预测的问题文本原始标签,如下:

y=Wσ(u)+b

其中,W是权重矩阵,b是偏差,σ是sigmoid激活函数。