欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020113310459
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于用户购买行为的用户特征预测方法,其特征在于该方法包括以下步骤:步骤1:采集目标用户特征信息、历史订单信息、订单商品信息;

目标用户特征信息包括用户画像信息;

历史订单信息包括订单用户编号、购买商品编号;

订单商品信息包括商品名称;

步骤2:对步骤1中订单商品信息中的商品名称进行分词,提取商品名称中包含一定信息的实体,构建商品名称中包含所有实体的实体集合S(e);

步骤3:构建知识子图

在公开知识图谱中查找步骤2获得的实体集合S(e)中的各个实体ei∈S(e);若存在则获取该实体ei相关的三元组特征 并进行三元组特征拓展,得到所有实体拓展后的三元组特征,构建知识子图 若不存在则跳过该实体,并将其从实体集合中删除;其中,ei代表实体集合S(e)中第i个实体并作为三元组 的头实体;表示第1轮拓展得到的第j个实体,并作为三元组 的尾实体;r代表ei和 之间的关系;

步骤4:构建用户邻接矩阵、实体邻接矩阵、实体关系矩阵将步骤3获得的所有实体拓展后的知识图谱三元组作为知识子图 并定义关联关系contain将用户历史订单信息中购买商品与购买商品名称中的实体进行关联,将购买商品加入到知识子图 根据知识子图 以及历史订单信息构建用户邻接矩阵、实体邻接矩阵、实体关系矩阵:

(1)根据历史订单信息,构建用户邻接矩阵 用来保存每名用户的前Ku名具有相同交互商品的用户, 即近邻用户,其中M代表用户数,Ku表示购买相同商品用户采样数且Ku<M;

(2)根据知识子图 构建实体邻接矩阵 用来存储两个直接相连的实体,这两个实体即为近邻实体,其中I表示实体数量,Ke表示近邻实体采样数且Ke<I;

(3)根据知识子图 构建实体关系矩阵 用来保存实体邻接矩阵中两个近邻实体之间的知识子图关系,其中I表示实体数量,Kr表示关系采样数且Kr=Ke,Kr<I;

步骤5:根据步骤4中得到的知识子图 用户邻接矩阵 实体邻接矩阵以及实体关系矩阵 构造基于图卷积神经网络的用户特征预测模型;

所述的基于图卷积神经网络的用户特征预测模型包括输入层、嵌入层、图卷积层、聚合层、全连接层、输出层;

所述图卷积神经网络的用户特征预测模型中:(1)输入层的输入为用户、用户交互过的实体,构建用户交互实体集合Ne(u);

(2)嵌入层将用户、用户交互过的实体进行向量化表示,并根据用户邻接矩阵获得用户的近邻用户嵌入向量,构建近邻用户集合Nu(u);

(3)图卷积层对嵌入层输出实体特征向量进行局部近邻特征学习,分别从实体邻接矩阵 以及实体关系矩阵 中获得实体的近邻实体和相应的两个近邻实体间关系,利用图卷积网络根据两个近邻实体间关系与用户u的嵌入向量的相似度对实体的近邻实体进行加权聚合,获得具有近邻结构特征的实体嵌入向量;

(4)聚合层:对嵌入层输出的用户嵌入向量、近邻用户嵌入向量以及图卷积层输出的具有近邻结构特征的实体嵌入向量进行聚合,得到输入用户最终的嵌入向量;

(5)全连接层:全连接层将聚合层输出的输入用户最终的嵌入向量转化为与预测特征种类数相同维度的输出向量;

o=Woufinal+bo

其中,o表示用户输出向量,ufinal表示用户u最终的嵌入向量,Wo表示全连接层权重矩阵,bo表示全连接层偏移向量;

输出层:输出层利用softmax函数将用户的输出向量做归一化处理,将输出向量转化为用户对应各个类别的概率分布,并获取其中最大值所在索引作为模型输出的输入用户预测标签;

所述图卷积层获得具有近邻结构特征的实体嵌入向量具体操作如下:a)从实体邻接矩阵 中找到用户交互实体集合Ne(u)中任意实体e∈Ne(u)对应的近邻实体,并构建集合Se(e);根据集合Se(e),从实体关系矩阵 找到连接两个近邻实体的关系,构建集合Sr(e);

b)根据用户对实体间不同关系的相似度迭代聚合近邻实体特征,近邻实体表示向量计算公式如下:

其中, 表示实体e的近邻实体表示向量,vi为集合Se(e)中第i个实体ei的嵌入向量,为连接实体e与实体ei的关系嵌入向量与用户u的嵌入向量经过softmax归一化后的相似度,作为实体ei归一化后的聚合权重,用于表示用户偏好;

αi的计算公式如下:

αi=g(u,ri)

其中u表示用户u的嵌入向量,ri表示连接实体e与实体ei的关系ri的嵌入向量,g(·)表示向量的内积计算;

对于任意实体ei∈Se(e),其聚合权重αi的softmax归一化过程为:其中αj表示实体ej的聚合权重,exp(·)表示以自然常数e为底的指数函数;

c)使用加权 聚合对实体e的嵌入向量v与近邻实体表示向量 进行聚合,得到具有近邻结构特征的实体嵌入向量:

其中Wagg、bagg分别表示聚合操作采用的权重矩阵和偏移向量,σ表示激活函数;

所述聚合层获得输入用户最终的嵌入向量具体操作如下:a)根据用户u的嵌入向量u与用户u交互实体集合Ne(u)中各实体嵌入向量的相似度,对集合Ne(u)中实体进行加权求和,得到用户u的交互实体表示向量:其中 表示用户u的交互实体表示向量,vi为集合Ne(u)中第i个实体ei的嵌入向量,为经过softmax函数归一化后的u与vi的相似度,作为用户u的交互实体嵌入向量的归一化后的聚合权重;

βi的计算方式如下:

βi=g(u,vi)

其中,g(·)表示向量内积计算;

对于任意交互实体ei∈Ne(u),其聚合权重βi的softmax归一化过程如下:其中βj表示交互实体ej的聚合权重,exp(·)表示以自然常数e为底的指数函数;

b)根据用户u的嵌入向量u与用户u的近邻用户集合Nu(u)中各用户的嵌入向量的相似度,对集合Nu(u)中的元素进行加权求和,得到用户u的近邻用户表示向量:其中, 表示用户u的近邻用户表示向量,ui为集合Nu(u)中第i个用户的嵌入向量,为u与ui经过softmax归一化后的相似度,作为用户u的近邻用户嵌入向量归一化后的聚合权重;

γi的计算方式如下:

γi=g(u,ui)

同样,g(·)表示向量内积计算;

对于任意近邻用户ui∈Nu(u),其聚合权重γi的softmax归一化过程如下:其中γj表示近邻用户uj的聚合权重,exp(·)表示以自然常数e为底的指数函数;

c)对用户交互实体表示向量 和用户近邻用户表示向量 进行串联,将串联后得到的中间向量变换为与用户嵌入向量相同维度的用户近邻特征表示向量:其中 代表用户u的近邻特征表示向量,Wconcat、bconcat分别代表串联操作使用的权重矩阵和偏置向量,concat(·)代表串联操作;

d)将用户u的嵌入向量u与 相加,得到用户u的最终表示向量:其中ufinal表示用户u的最终表示向量,σ表示激活函数ReLU。

2.如权利要求1所述的一种基于用户购买行为的用户特征预测方法,其特征在于步骤(3)公开知识图谱中存在若干条实体相关的三元组特征,其组织形式为(头实体,关系,尾实体)。

3.如权利要求1所述的一种基于用户购买行为的用户特征预测方法,其特征在于步骤(3)实体的三元组特征拓展具体如下:(1)初始化:迭代次数H=1;

(2)将 中尾实体 作为头实体,在公开知识图谱查找 相关的三元组特征(3)更新迭代次数H=H+1,将上一轮迭代得到的三元组特征尾实体作为头实体,继续在公开知识图谱查找与该头实体相关的三元组特征,直至迭代次数达到最大迭代次数。

4.如权利要求1‑3任一所述的一种基于用户购买行为的用户特征预测方法,其特征在于基于图卷积神经网络的用户特征预测模型的反向传播过程采用softmax交叉熵损失函数,其公式为:

上述公式中i代表第i个类型,y′i代表目标用户第i维特征真实值,yi代表目标用户第i维特征的预测值,第二项为L2正则化项, 防止模型过拟合,其中λ为L2正则化系数,Θ为模型参数。

5.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1‑4中任一项所述的方法。

6.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1‑4中任一项所述的方法。