欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020113060203
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于异构信息网络嵌入的Top-K电影推荐方法,具体步骤如下:步骤1.预处理数据,具体包括:

1.1清洗数据;对原始数据清洗,过滤掉原始数据集中的无效数据,包括观看次数小于预定值的用户数据和评价次数小于预定值的电影数据,进而到训练数据和测试数据;

1.2构造异构信息网络数据和构建训练数据、测试数据;将清洗好的数据,构建异构信息网络;将清洗的数据构建三元组,来表示异构信息网络,三元组的形式如下:(h,r,t)    (1)

其中,h代表头节点,t代表尾节点,r代表头节点h和尾节点t之间的关系,即二者之间的边;

步骤2.嵌入学习异构信息网络,具体包括:

2.1初始化嵌入;首先对异构信息网络中的节点和边向量初始化,这里采用TransR模型,将异构信息网络中的节点和边使用相同维度的向量来初始化,分别是Eh、Et、Er,代表了头节点、尾节点和边;然后按照关系类型来对节点进行映射,即针对每一种关系r,都有一个映射矩阵Mr,将节点映射到关系r的向量空间中去,公式如下:其中, 分别是节点h和t映射到r后的向量表示;

2.2表示学习异构信息网络;这里通过初始化得到了节点和边的向量表示,通过得分函数来学习异构信息网络:其中f(h,r,t)表示得分函数;通过该函数可以将有联系的节点彼此靠近,而将没有联系的节点对彼此疏远;学习过程的损失函数L1定义为:其中(h,r,t)∈G表示异构信息网络中的正样本, 是负样本,G表示异构信息网络;

步骤3.在异构信息网络中传播信息,具体包括:

3.1计算节点和邻居之间的注意力分数;

区别于使用预先准备好路径实例的元路径方法,本发明按照异构信息网络中节点的连通性,直接对节点和它的邻居计算注意力分数,例如节点h和它的一个邻居t的注意力分数π(h,r,t)为:其中tanh(·)是激活函数;节点和他们的邻居关联越紧密,注意力分数越大;由于一个节点有多个邻居,所以会有多个注意力分数,所以对得到注意力分数进行归一化处理:其中,分子exp(π(h,r,t))表示节点h和它的一个邻居t的注意力分数,分母表示节点h所有的邻居的注意力分数之和;

3.2节点间的信息传播,信息从邻居节点聚合到当前节点中这部分包含节点融合;具体的,以三元组(h,r,t)中的头节点h为例,它的邻居集合为Nh={(h,r,t)|(h,r,t)∈G},则节点h的邻居的向量表示为:其中 表示节点h的邻居节点传递过来的信息;

步骤4.聚合节点信息和边信息;节点h和它的邻居间的边的聚合 表示为:为了聚合这些信息,通过下面的函数来实现:

其中LeakReLU(·)是激活函数,Eh节点h初始化表示, 是边的表示, 是节点h邻居的信息;通过聚合节点以及边的表示,充分的挖掘异构信息网络中的信息;

步骤5.预测评分;通过上面的步骤,可以获得用户节点的表示Eu和物品节点的表示Ei,如下所示:将预测评分 表示为用户节点向量表示和物品节点向量表示的内积:评分预测的损失函数L2如下:

D={(u,i,j)|(u,i)∈R+,(u,j)∈R-}    (15)其中D为数据集,(u,i)∈R+表示正样本,(u,j)∈R-为负样本;总的损失函数Ltotal为:Ltotal=L1+L2    (16)

步骤6.Top-K评价;通过常用的两个指标:HR@K和NDCG@K来对推荐方法进行评价,公式如下:其中K表示去推荐结果中前K个数据;GT表示测试集合数据;reli则代表第i个位置的关联性,通常若第i个位置的物品在测试集合中,那么reli为1,否则为0;Zk代表归一化系数。

2.如权利要求1所述的基于异构信息网络嵌入的Top-K电影推荐方法,其特征在于:步骤1.1所述的预定值是20次。