1.一种基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,包括如下步骤:S1、数据采集
1 u |U|
获取一定时间内多个用户得音乐收听记录H={H ,… ,H ,…,H },是用户u∈U得音乐收听记录,ti是mi∈M的时间戳,U和M表示用户集合和音乐集合;
S2、数据建模
构建异构音乐图HMG,对各种数据和信息进行整合,包括用户收听记录和音乐的内容,HMG定义为G=(V,E,W),V=(U,S,M,F)表示HMG中不同类型节点的集合,其中U、S、M和F分别是用户集合、会话集合、音乐集合和内容特征集合,E是HMG中不同类型边的集合,W是E的权重集;
S3、表征学习
S31、预训练:利用预训练技术得到用HMG中的节点的初始特征向量,节点vi∈V的初始特|V|×d征向量定义为 其中V′∈R 是预训练的嵌入矩阵,d是向量的维度,是vi的独热向量表示;
S32、用户兴趣建模:首先从HMG中以用户的档案视角、行为视角和会话视角学习用户的兴趣表示,然后将三个视角的兴趣表示进行融合,得到用户的综合兴趣表征vu;
S33、音乐特征建模:首先从HMG中以音乐的属性视角、交互视角、转移视角和上下文视角学习音乐的特征表示,然后将四个视角的特征表示进行融合,得到音乐的综合特征表示vm;
S4、用户短期兴趣建模
从用户的最近的音乐收听行为中推断她/他的短期兴趣偏好;
S5、音乐推荐
基于用户的长期、短期和动态三种兴趣偏好进行推荐。
2.根据权利要求1所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S1中还包括数据处理,每个用户的音乐收听记录根据时间戳划分为不同的会话,其中间隔时间超过一定阈值的音乐播放记录会被划分到两个会话中,将用户u的播放记录可以被划分为n个会话, 此外,音乐和用户的内容特征词的集合表示为F。
3.根据权利要求1所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述集合V包括用户节点u∈U、会话节点s∈S、音乐节点m∈M和内容特征词f∈F,所述集合E包括用户‑音乐(u‑m)边、用户‑特征(u‑f)边、用户会话(u‑s)边、音乐特征(m‑f)边、音乐‑音乐(m‑m)边和音乐‑会话(m‑s)边。
4.根据权利要求3所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S32中,从HMG中以用户的档案视角上的兴趣表征方法如下:将用户u档案内容中的l′个特征词{f1,f2,…,fl′,}转换为相应的词嵌入矩阵其中 是fi的词向量,然后利用卷积操作将V′u,f转换为d×(l′‑l″+1)
V″u,f∈R ,l″是卷积核的大小,卷积层中的输入通道数和输出通道数分别为d和d′,最后,在V″u,f上使用双曲正切激活函数和均值池化策略,得到每个用户u的在档案视角上的兴趣表示从HMG中以用户的行为视角上的兴趣表征方法如下:将用户u在HMG上的音乐邻居进行聚合得到用户兴趣表示,即对于用户节点vu和她/他的k个音乐邻居{m0,m1,…,mk‑1},行为视角的用户兴趣表示定义为:其中 是音乐mi的初始特征向量,上标b表示行为视角, 是用户u对第i个音乐邻居节点mi在行为视角的注意力权重,其定义如下:其中 是用户u和音乐mi在HMG上的边的权重, 是u和mi之间的行为得分,表示用户偏好与音乐特征之间的相关性,正式定义为:其中σ是带泄漏的ReLU激活函数,而 是可学习的向量参数,d″是隐藏层大小,||是向量之间的拼接, 此外, 和 是用户u和音乐mi在行为视角中的隐藏表示,定义为
其中 和 是可学习的参数,tanh()是双曲正切激活函数,从HMG中以用户的会话视角上的兴趣表征方法如下:将用户u在HMG上的会话邻居进行聚合得到用户兴趣表示,即对于用户节点vu和她/他的k′个会话邻居{s0,s1,…,sk′‑1},会话视角的用户兴趣表示定义为:其中,其中上标s表示会话视图, 是u的会话si的嵌入, 是会话si和用户u之间的注意力权重,正式定义为:其中 是u和她/他的会话邻居si之间的边的权重, 是u和si之间的会话得分,表示用户全局偏好和会话偏好之间的相关性, 和 是可学习的参数, 和 是用户u和会话si的隐藏表示。
5.根据权利要求4所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S32中,用户的综合兴趣表征vu方法如下:用户的综合兴趣表征建模为三个视角中学到的用户兴趣,定义为:其中 和 分别是u在档案视角、行为视角和会话视角的兴趣表示, 和是三个视角的权重,通过注意力机制计算的,视角x(p、b或者s)的权重定义为:d″
其中,qu∈R 、 和 是可学习参数,d″是隐藏层的大小, 是用户u在视角x下的兴趣表示。
6.根据权利要求1所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S33中,从HMG中以音乐的属性视角学习音乐的特征表示:将音乐m内容特征中的l′个特征词{f1,f2,…,fl′,}转换为相应的词嵌入矩阵其中 是fi的词向量,然后利用卷积操作将V′u,f转换为V″u,fd×(l′‑l″+1)
∈R ,l″是卷积核的大小,卷积层中的输入通道数和输出通道数分别为d和d′,最后,在V″u,f上使用双曲正切激活函数和均值池化策略,得到每首音乐m的在属性视角上的兴趣表示 其中上标a表示属性视角;
从HMG中以音乐的交互视角学习音乐的特征表示:将音乐m在HMG上的用户邻居进行聚合得到音乐特征表示,即对于音乐m和它的n个用户邻居{u0,u1,…,un‑1},交互视角的音乐特征表示定义为:其中 是用户uj的初始兴趣向量,上标i表示交互视角, 是音乐m对第j个用户邻居节点uj在交互视角的注意力权重,其定义如下:其中 是音乐m和第j个用户邻居节点uj在HMG上的边的权重, 是m和uj之间的交互得分,表示音乐特征与用户偏好之间的相关性,σ是带泄漏的ReLU激活函数,d″是隐藏层大小,||是向量之间的拼接, 此外, 和 是m和uj在交互视角中的隐藏表示, 和 是可学习的参数,tanh()是双曲正切激活函数;
从HMG中以音乐的转移视角学习音乐的特征表示:将音乐m在HMG上的用户邻居进行聚合得到音乐特征表示,即对于音乐m和它的n′个音乐邻居{m0,m1,…,mn′‑1},转移视角的音乐特征表示定义为:其中 是音乐mj的初始特征向量,上标t表示转移视角, 是音乐m对第j个音乐邻居节点mj在转移视角的注意力权重,其定义如下:其中 是音乐m和第j个音乐邻居节点mj在HMG上的边的权重, 是m和mj之间的交互得分,表示音乐特征之间的相关性,σ是带泄漏的ReLU激活函数,d″是隐藏层大小,||是向量之间的拼接, 此外, 和 是m和mj在转移视角中的隐藏表示, 和 是可学习的参数,tanh()是双曲正切激活函数;
从HMG中以音乐的上下文视角学习音乐的特征表示:将音乐m在HMG上的会话邻居进行聚合得到音乐特征表示,即对于音乐m和它的n″个会话邻居{s0,s1,…,sn″‑1},上下文视角的音乐特征表示定义为:其中 是会话sj的初始特征向量,上标c表示上下文视角, 是音乐m对第j个会话邻居节点sj在上下文视角的注意力权重,其定义如下:其中 是音乐m和第j个会话邻居节点sj在HMG上的边的权重, 是m和sj之间的交互得分,表示音乐特征之间的相关性,σ是带泄漏的ReLU激活函数,d″是隐藏层大小,|是向量之间的拼接, 此外, 和 是m和sj在上下文视角中的隐藏表示, 和 是可学习的参数,tanh()是双曲正切激活函数。
7.根据权利要求6所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S33中,将属性视角、交互视角、转移视角和上下文视角四个视角的特征表示进行融合,得到音乐的综合特征表示vm方法如下:定义:
其中 和 分别是m在属性视角、交互视角、转移视角和上下文视角的特征表示, 和 是四个视角的权重,通过注意力机制计算的,视角y(a、i、t或者c)的权重定义为:d″
其中,y是a、i、t和c中任意一种,qm∈R 、 和 是可学习参数,d″是隐藏层的大小, 是音乐m在视角x下的特征向量。
8.根据权利要求1所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S4中,给定用户u和她/他的历史收听序列{m0,…,mo‑i,…,mo‑1},u的短期偏好表示用基于注意力的加权和策略定义为:其中 是音乐mj的综合特征表示,o是历史序列的长度,h是近期序列的长度, 是是历史记录mj在短期偏好推断过程中的权重, 用软注意机制定义为:其中 是mj对于u的短期偏好推断的得分, 定义为:d
其中vu∈R 是用户u的综合兴趣表征, 是最后一首音乐记录mo‑1的综合特征表ε d示, 和c∈R是可学习的参数。
9.根据权利要求1所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S5中,用户u对候选音乐m的兴趣分数定义为:lt st d
其中vm是音乐m的综合特征表示,ρ ,ρ 和ρ分别是长期、短期和动态兴趣偏好的权重,定义为ρ 3×3d ρ 3
其中W ∈R 和c∈R是可学习的参数,从而可以根据上述公式中的兴趣对候选音乐进行排序,并将得分高的音乐推荐给目标用户。