1.一种空间距离自适应的下一个兴趣点推荐方法,其特征在于:该方法具体包括以下步骤:
步骤一、数据获取与预处理
获取用户一系列历史签到记录,每条签到记录包含签到时间、用户名称、兴趣点,提取出所有用户和所有兴趣点,删除其中出现次数少于a次的个别兴趣点和个别用户,得到用户集合和兴趣点集合;
步骤二、构建签到序列
将步骤一预处理后的每个用户的历史签到记录按照签到时间的先后顺序分别排序,得到每个用户按照时间顺序的签到序列;
步骤三、构建转移矩阵
u
根据步骤二得到的用户签到序列,采用马尔科夫链对每个用户u构建一个转移矩阵A ,其中元素 表示签到序列中是否存在用户u从兴趣点i出发到兴趣点l的记录,存在则为1,u
否则为0;合并所有用户的转移矩阵A得到一个转移张量A;
步骤四、估计用户签到概率
使用Tucker Decomposition线性分解模型对步骤三中得到转移张量A进行估计,得到估计张量
其中C为核心张量,U为用户特征矩阵,行表示用户,列表示用户的潜在特征因子;I为当前所在兴趣点i的特征矩阵,行表示当前所在兴趣点,列表示当前所在兴趣点的潜在特征因子;L为下一个兴趣点l的特征矩阵,行表示下一个兴趣点,列表示下一个兴趣点的潜在特征因子;然后根据张量模型成对之间的相互作用估计用户对兴趣点的签到概率,即估计张量中每个元素的估计值;
步骤五、计算用户标准化签到概率定义用户u从当前所在兴趣点i出发到下一个兴趣点l的签到概率pu(i,l)为:根据签到概率pu(i,l)计算用户的标准化签到概率其中ρ和k为待估计参数,使用最小二乘回归法学习; 表示用户u当前所在兴趣点i和下一个兴趣点l之间的距离;Max(pu)表示用户u历史签到序列中当前所在兴趣点和下一个兴趣点之间最大的转移概率;
步骤六、计算用户转移概率
将步骤五得到的用户标准化签到概率输入到sigmoid激活函数中,得到权重参数ξ:其中σ表示sigmoid激活函数, e表示自然常数; 表示对进行E(x)=wx+b的线性变换操作,w、b为常数;
然后根据权重参数ξ,得到位于兴趣点i的用户u对下一个兴趣点l的转移概率:估计张量 中的元素,uU,L表示用户U与下一个兴趣点L的关系矩阵分解后得到的用户u的潜在因子向量;lL,U表示下一个兴趣点L与用户U的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;lL,I表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的下一个兴趣点l的潜在因子向量;iI,L表示当前兴趣点I和下一个兴趣点L的关系矩阵分解后得到的当前所在兴趣点i的潜在因子向量;
步骤七、学习签到概率
对步骤六的结果进行排序,定义兴趣点m和n之间的排名关系为:其中m>u,in表示用户u从兴趣点i移动到兴趣点m的概率 大于移动到兴趣点n的概率 因此:
P(Θ|>u,i)∝P(>u,i|Θ)P(Θ) (7)其中Θ表示模型参数的集合,当每个用户的签到历史为独立的,且模型参数的先验概率服从正态分布 则通过最大化后验概率学习模型参数Θ,得到优化公式:然后根据优化公式,采用随机梯度下降法对参数Θ进行优化:其中ω表示梯度步长,对每个用户的签到序列进行采样,然后采用随机梯度下降法沿着负梯度方向更新参数Θ,迭代至收敛或迭代结束,学习每个用户下一个兴趣点的签到概率
步骤八、兴趣点推荐
根据步骤七学习得到的用户下一个兴趣点的签到概率,计算用户签到序列中的最后一个兴趣点对其他所有兴趣点的签到概率,将其中签到概率最大的K个兴趣点作为下一个兴趣点推荐给该用户。
2.如权利要求1所述一种空间距离自适应的下一个兴趣点推荐方法,其特征在于:步骤一中a的取值为10。
3.如权利要求1所述一种空间距离自适应的下一个兴趣点推荐方法,其特征在于:步骤七中使用的排序方法为贝叶斯个性化排序。