1.一种用户兴趣偏好捕获方法,其特征在于:所述方法使用融合用户经验直觉与逻辑推理的双认知过程构建兴趣偏好捕获系统,通过该兴趣偏好捕获系统并行学习用户的历史交互序列数据,挖掘其历史交互行为的动态变化与顺序联系,捕获下一时刻用户的兴趣偏好;该方法包括以下步骤:
S1、数据输入:使用按时间顺序构造的每个用户MN次历史交互组成的序列X作为输入,并且对于少于MN次交互的用户,在其序列的开头用零填充;
S2、数据处理:从历史交互序列数据中的第二个项开始,计算用户历史交互序列中当前项与其前后项之间的相似度,通过比较两者之间的大小划分同质序列,并将划分后的每一个序列嵌入为低维张量;
S3、潜在兴趣偏好捕获:利用双线性乘积模块学习用户的二阶兴趣偏好,同时利用多头注意力机制分别与卷积神经网络模块和全局池化模块结合学习用户的局部与全局兴趣偏好,再拼接重组上述双线性乘积模块、卷积神经网络模块和全局池化模块的输出的特征张量进而获得下一时刻用户的潜在兴趣偏好;
S4、动态兴趣偏好捕获:利用卷积神经网络提取各个同质序列包含的兴趣点,通过层间抽样构建用户的兴趣偏好进化图,将图映射为兴趣序列并输入到双掩蔽门控循环单元中学习下一时刻用户的动态兴趣偏好;
S5、兴趣偏好融合:将步骤S3与步骤S4捕获到的用户潜在兴趣偏好与动态兴趣偏好融合,输出下一时刻用户的兴趣偏好,完成整个兴趣偏好特征捕获过程。
2.根据权利要求1所述的一种用户兴趣偏好捕获方法,其特征在于,所述步骤S2具体为:
S21、使用Jaccard系数求得用户历史交互序列X={x1,x2,…xMN}中当前项xi与其前项xi‑1以及后项xi+1的相似度Ji‑1,i、Ji,i+1;
S22、比较Ji‑1,i与Ji,i+1的大小,设Ji‑1,i>Ji,i+1,当前项属于当前同质序列的下一项;设Ji‑1,i<Ji+1,i,当前项为下一同质序列第一项;
S23、判断当前项xi是否为序列X的最后一项,如果是则输出序列划分结果,否则i=i+1并返回步骤S21;
S24、将划分后的每一个同质序列Xi∈{X1,…,XM}嵌入为低维特征张量Ei=[e1,…,eN],其中ei为嵌入操作后的每一个项的向量表示。
3.根据权利要求1所述的一种用户兴趣偏好捕获方法,其特征在于,所述步骤S3具体为:
S31、在潜在兴趣偏好捕获阶段,将同质序列嵌入矩阵EM输入到双线性乘积模块中学习用户的二阶兴趣偏好特征矩阵Fdl=[ei·Wij⊙ej],其中Wij为所有字段嵌入向量相互作用间共享的参数矩阵,ei与ej分别为嵌入操作后的每一个项的向量表示;
S32、在潜在兴趣偏好捕获阶段,将同质序列嵌入矩阵EM输入到多头注意力模块中早期O O
融合兴趣特征输出加权矩阵Fa=concat(H1,H2,…,Hk)W ,其中W为附加的权重矩阵,Hi为每个注意头输出的兴趣偏好子空间;
S33、将早期融合兴趣特征输出加权矩阵Fa经过两层全连接层后输出高度拟合矩阵Faff;
l l
S34、确定卷积神经网络阶段卷积层中的卷积核大小C与池化层中的滑动窗口大小P;
S35、重置第一层卷积层的输入,执行卷积与池化操作直至循环结束;
S36、将最后一层池化层的输出作为局部兴趣偏好特征矩阵Fmp;
S37、利用与输入特征矩阵相同大小的滑动窗口求得全局兴趣偏好特征矩阵Fgp;
S38、将步骤S31、步骤S36与步骤S37输出的特征矩阵进行拼接,输出下一阶段用户潜在兴趣偏好Ic=concat(Fdl,Fmp,Fgp)。
4.根据权利要求1所述的一种用户兴趣偏好捕获方法,其特征在于,所述步骤S4具体为:
S41、利用卷积神经网络的卷积层与池化层提取每个同质序列嵌入矩阵Ek所包含的兴趣节点集合 并作为第k层的节点,其中ak为第k层兴趣节点的总数;
S42、利用最佳采样器采样下层节点并构建动态兴趣偏好进化图G,最佳采样器定义为:其中, 为给定k层节点 采样k'层节点 的概率, 是基于节点特征计算的自相关函数;
S43、利用映射函数mapgs将G=(V,E)映射为具有可变长度的兴趣偏好序列集合S=mapgs(G,Sk)={S1,…,SM};
S44、利用双掩蔽门控循环单元学习序列 中节点之间的互连方式,从而捕获下一序列中的节点如何链接到之前的节点;
S45、通过转移函数更新所有兴趣偏好序列得到下一阶段用户的动态兴趣偏好
5.根据权利要求1所述的一种用户兴趣偏好捕获方法,其特征在于,所述步骤S5具体为:
S51、将步骤S38与步骤S45捕获得到的用户潜在兴趣偏好Ic与动态兴趣偏好Ih进行拼接,得到拼接后的兴趣偏好I;
S52、将拼接后的兴趣偏好I作为最终捕获到的下一阶段用户兴趣偏好特征。
6.根据权利要求1所述的一种用户兴趣偏好捕获方法,其特征在于,所述步骤S1中的MN,M指用户长历史交互序列经过序列划分后的短序列的个数;N指短序列中包含的项的个数。
7.根据权利要求1所述的一种用户兴趣偏好捕获方法,其特征在于,所述步骤S4中的同质序列为经过序列划分后的长度为N的短序列,该序列中的项具有高相似度。
8.根据权利要求1所述的一种用户兴趣偏好捕获方法,其特征在于,所述步骤S4中的双掩蔽门控循环单元包括外重置门、外掩蔽门、内重置门和内掩蔽门。