1.一种基于社交网络的用户行为预测方法,其特征在于,所述方法包括以下步骤:S1:获取用户的行为数据以及其相对应的朋友行为数据构建成初始数据集,行为数据包括但不限于用户历史上访问过的地点及其对应的时间数据;
S2:基于用户去过的地点数据构建用户行为影响网络;
S3:针对用户行为影响网络运行随机游走算法对用户行为数据进行采样;
S4:初始化序列预测模型;
S5:将采样得到的用户行为数据与用户原始行为数据融合成最终数据集输入到序列预测模型中进行训练;
S6:将新采集到的用户行为数据输入到训练好的模型中,输出即为用户接下来可能要去的地点;
所述步骤S2包括以下步骤:
S2.1:对于初始数据集中的所有地点数据进行自适应的DBSCAN聚类;
S2.2:按以下规则构建用户行为影响网络:
2.2.1.用户和其所有的朋友构建成一个网络,网络中的节点是用户去过的地点;对于用户来说,连边构建规则是用户前一次去过的地点节点指向用户后一次去过的地点节点;
对于用户的朋友来说,也是根据朋友前一次去过的地点节点指向朋友后一次去过的地点节点;对于用户地点节点和朋友地点节点之间的连边,按以下规则建立:记朋友去过的一个地点节点为A,访问A节点的时刻为Ta,用户去过的一个地点节点为B,访问B节点的时刻为Tb,若Tb‑Ta<t,其中t是一个可调参数,那么地点A节点和地点B节点之间建立连边;
2.2.2.网络中连边的权重按以下规则建立,用户行为数据上的连边以及朋友行为数据上的连边,权重都为1,而用户和朋友间的连边,权重按以下公式计算:其中 Calter和Cego分别表示朋友行为节点和用户行为节点在经过max
S2.1处理之后,各自所属的类别, 是前后两节点的时间差,Acc 是人类预测极限,它由以下公式计算得到:max max
h(a|b)=H(Acc )+(1‑Acc )log2(Lb‑1) (5)max max max max max
H(Acc )=‑Acc log2(Acc )‑(1‑Acc )log2(1‑Acc ) (6)其中La表示用户的数据长度,Lb表示用户朋友的数据长度,表示两次行为之间的距离特征,α和β是一组可调参。
2.根据权利要求1所述的一种基于社交网络的用户行为预测方法,其特征在于:所述步骤S1包括以下步骤:S1.1:采集ego用户的移动行为记录;
S1.2:采集alter用户列表及其移动行为记录;
S1.3:对ego数据和alter数据进行筛选,获取ego用户最早行为的时间ta和最晚行为的时间tb,去除alter数据在[ta,tb]之外的数据。
3.根据权利要求1或2所述的一种基于社交网络的用户行为预测方法,其特征在于:所述步骤S3包括以下步骤:S3.1:数据的采样是从用户行为影响网络的入度为1的一个用户行为节点出发的,将连边的权重值作为转移概率值,逆向的进行采样;如果采样到的行为节点来自用户,那么采样继续进行下去,如果采样到的行为节点来自朋友,那么在采样了一定的深度dp之后,转移到时间上最相近的用户行为节点上,使采样继续进行下去,dp是一个可调参数;
S3.2:在每个用户上运行上述采样算法的次数根据用户的朋友数量而定,同时采样次数不能超过指定的最大次数L,这里L是一个可调参数,默认值为5;
所述步骤S4的过程为:对行为预测模型的权重参数进行初始化。
4.根据权利要求1或2所述的一种基于社交网络的用户行为预测方法,其特征在于:所述步骤S5的过程为:将采样得到的行为数据作为用户的行为数据输入到行为预测模型中进行训练。
5.根据权利要求1或2所述的一种基于社交网络的用户行为预测方法,其特征在于:所述步骤S6的过程为:模型训练好之后,将新获取的用户行为数据输入到模型中,可以预测得到用户接下来可能会去的地点。