欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2022107455093
申请人: 长安大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种异构环境下嵌入预期价值的文献推荐方法,其特征在于:包括以下步骤:S1:根据文献数据集构建初始特征向量;

S2:根据初始特征向量构建异构文献图;

其中,异构文献图表示为G={X,E};

X={XP,XA,XJ},表示三类不同节点的特征信息:XP表示所有文献向量特征,XA表示所有作者向量特征,XJ表示所有期刊向量特征,取值自于步骤S1初始特征向量;

根据节点的不同,边集E={EPP,EPA,EPJ,EAA,EAJ,EJJ}含有六种不同类型,包括三种同构关联关系:EPP为文献引用信息、EAA为作者合著信息和EJJ为来源关联信息,以及三种异构关联关系:EPA为文献‑作者关系、EPJ为文献‑来源关系、EAJ为作者‑来源关系;

S3:根据S2中的异构文献图构建异构图卷积网络,并将节点初始特征向量输入异构图卷积深度网络获得异构节点特征向量;

其中异构图卷积网络构成方法如下:

S301:首先基于步骤S2中的异构文献图,依据不同的节点和边信息构造六类邻接矩阵R={RPP,RPA,RPJ,RAA,RAJ,RJJ};

式中:

和 分别为文献‑引用信息、文献‑作者关系、文献‑来源关系、作者‑合著信息、作者‑来源关系和来源关联信息所对应的领接矩阵,其中NP、NA和NJ分别表示数据集中文献、作者和期刊的总数, 表示对应矩阵的元素值;

S302:临界矩阵初始化,并根据初始化的邻接矩阵生成转置矩阵;

S303:基于邻接矩阵R构造增广邻接矩阵式中:RAP、RJA和RJP分别为步骤S302中RPA、RAJ和RPJ的转置矩阵;

*

S304:基于R构建L层异构图卷积层,其中第l层的异构图卷积过程为:其中,Relu(·)表示修正线性单元函数, 为卷积核,ds表示卷积核宽度,* *是基于R构造的矩阵,其值为R+I,其中 为单位矩阵, 表示异构图的度矩阵, 表示取度矩阵 的第i行第j列的数据, 表示取 矩阵l

的第i行第j列的数据,Z 表示深度图卷积网络第l层的数据特征,其中0

由节点初始特征向量构成,Z的构造方式分别为:S4:构建深度注意力层,并利用注意力层获取每个卷积层的权重调节因子,然后利用权重调节因子生成所有的异构节点最终向量表示;

具体过程如下:

S4.1:构建三个可学习的投射向量 分别用于计算不同卷积层中的文献、作者和期刊向量权重,式中dα表示投射向量的长度;

S4.2:依据不同节点类型,将所有异构节点向量进行堆叠,获得关于文献、作者和来源的张量 和 然后利用下述过程为L个卷积层生成权重调节因子:

和 分别生成的所有卷积层中文献向量、作者向量和来源向量的权重因子;其中,σ(·)为sigmoid函数,softmax(·)为多分类函数,为可学习的映射矩阵;

S4.3:根据三类权重调节因子,依据下式生成所有的异构节点最终向量表示:其中, 表示Hadamard积, 表示向量加和取平均;

S5:将所获得的异构节点最终向量表示利用解码器还原文献网络结构;

具体过程如下:

将最终异构节点最终向量表示输入解码器以概率 还原文献网络结构,其解码方式为最大化如下似然函数:式中,N*=NP+NA+NJ表示节点总数, 和 表示 中任意两个节点向量, 为增广邻接*矩阵R中 和 节点所对应的邻接值;

S6:利用对抗生成机制,将文献预期价值信息嵌入文献向量中;

S7:针对每一篇候选文献计算得分,最终根据得分对文献进行推荐。

2.如权利要求1所述的一种异构环境下嵌入预期价值的文献推荐方法,其特征在于:所述步骤S1具体过程如下:S1.1:根据文献数据集,对于每一篇文献,通过Word2Vec工具获取每个词的词向量,并将该文献中的词向量取平均获得文献初始向量;

S1.2:根据文献数据集,对于每一个作者,取其发表过的所有文献的初始向量并取平均,从而获得作者初始向量;

S1.3:根据文献数据集,对于每一个期刊,取其包含的所有文献的初始向量并取平均,从而获得期刊初始向量。

3.如权利要求1所述的一种异构环境下嵌入预期价值的文献推荐方法,其特征在于:所述步骤S6具体过程如下:S6.1:构建文献幂律分布生成器:

将数据集中所有文献的被引次数在[0,C]范围内分为M个区间,其中引用次数超过C值的文献被归为第M个区间,定义h为某个被引次数区间,p(h)为该被引次数区间中的文章数量,则可以获得如下幂律分布:‑α

p(h,C,α)=β(h)

式中,α和β是可估计参数;

S6.2:随机多批次选取文献,然后按被引次数划分统计每次选择子样本集的文献引用次数,则可以获得如下观测序列 其中N表示每一批次获取的样本总数,将此观测序列作为训练数据,采用极大似然估计法,通过下式估计获得中α和β的参数值:S6.3:利用获得的幂律分布,动态采样获得一组符合该幂律分布的值,记为文献预期价值向量S6.4:利用卷积神经网络,将所有文献向量表示 矩阵转化为预期文献价值向量其中,T表示矩阵转置,CovX(·)表示带一层卷积和k‑max池化层的卷积神经网络,为卷积核,所用卷积核个数为NC,同时NC*k=M,k表示卷积之后最大的k个值;

*

S6.5:利用对抗生成网络,将H作为约束加入文献向量表示 的学习过程中,对抗生成*网络的判别器会将 判定为假,并将从幂律分布中采样获得的H判定为真,此时由数据集*中的文献向量产生的价值向量 与幂律分布器产生的价值向量H保持近似,从而将文献预期价值信息嵌入文献向量中;此过程等价于如下过程:其中,D(·)表示判别器,G(·)表示生成器,包含CovX(·)及S3到S5所述的异构图卷积网络;

S6.6:通过重复步骤S3‑步骤S6.5,直到所有参数值收敛或达到最大训练次数,最大训练次数取500次。

4.如权利要求1所述的一种异构环境下嵌入预期价值的文献推荐方法,其特征在于:所述步骤S7具体过程如下:S7.1:首先给定查询q=[qw,qΑ,qJ],其中qw为查询文本所有词,qΑ为查询作者所有词,qJ为查询来源所有词,然后将查询q=[qw,qΑ,qJ]转化为向量 其中 为查询文本所有词的平均向量, 为查询作者所发表过的所有文献所包含词的平均向量, 为查询来源中所有文献所包含词的平均向量;

S7.2:选取数据集中的所有文献为候选文献di,针对每一篇候选文献di,以下式计算得分其中, 和 分别候选文献di的文本、作者和来源向量表示,其取值均来自于步骤S4.3中的最终选择得分较高的文献,作为结果推荐。