1.一种结合用户重叠行为的微博重叠社团划分方法,其特征在于,包括以下步骤:首先,根据用户的互相关注关系构建关系网络,采用评估函数合理量化评估用户重叠行为,所述重叠行为包括用户互相关注行为、转发行为和提及行为;
其次,对用户互相关注行为、转发行为和提及行为进行加权融合得到用户间的关系评估函数;
最后,对关系网络进行加权,将用户重叠行为融入改进的贪婪团扩张重叠社团划分算法,改进在包括将微博加权网络作为初始网络,并针对加权网络改进社区适应度函数,用社团内边的权重之和计算社区适应度,通过贪婪扩张使社区适应度函数达到最优,最终得到重叠社团结构。
2.根据权利要求1所述的结合用户重叠行为的微博重叠社团划分方法,其特征在于,所述根据用户的互相关注关系构建关系网络具体包括:将每个用户作为关系网络的节点,用户之间的互相关注关系作为节点之间的边,用户u1、u2互相关注表示为:
3.根据权利要求1所述的结合用户重叠行为的微博重叠社团划分方法,其特征在于,评估用户转发行为具体为:用户up转发uq微博行为的评估函数为:其中,NF(up,uq)表示用户up转发uq发布的微博数量。
4.根据权利要求1所述的结合用户重叠行为的微博重叠社团划分方法,其特征在于,评估用户提及行为具体为:用户up提及uq行为的评估函数为:其中,NA(up,uq)表示用户up提及uq次数。
5.根据权利要求1所述的结合用户重叠行为的微博重叠社团划分方法,其特征在于,根据用户重叠行为,加权融合得到用户间的关系评估函数,采用层次分析矩阵得到每项权值,用户节点up与uq边的加权函数为:W(up,uq)=p(up,uq)(λFw(up,uq)+(1‑λ)At(up,uq))其中,λ是参数,记wpq为节点up与uq边的权值,P(up,uq)为用户up、uq互相关注行为的评估函数,Fw(up,uq)为用户up转发uq微博行为的评估函数,At(up,uq)为用户up提及uq行为的评估函数。
6.根据权利要求1所述的结合用户重叠行为的微博重叠社团划分方法,其特征在于,所述将用户重叠行为融入贪婪团扩张重叠社团划分算法,将微博加权网络作为初始网络,改进社区适应度函数,用社团内边的权重之和计算社区适应度:其中 和 分别代表社团c内部和外部的边的权重之和,α是社团大小分辨率调节参数,较低的α值更适合较大的社团。
7.根据权利要求6所述的结合用户重叠行为的微博重叠社团划分方法,其特征在于,所述贪婪团扩张重叠社团划分算法具体包括:C1:在给定微博加权图中检测所有至少包含k个节点的极小团;
C2~C3:若存在未扩张的种子团,则选择最大未扩张的种子团作为候选社团C1;
C4:将候选社团C1进行贪婪扩张,采用公式(5)计算社团C1的社区适应度F(C1),直至加入任何节点都会降低社区适应度;
C5:判断是否接受社团C1,如果C1与任意已被接受的社团C的距离小于∈,社区距离公式:
那么C和C1是近似重复的社团,因此舍弃C1,否则,如果没有与C1近似重复的社团,接受C1;重复C2~C5步骤,直至没有剩余未扩张的种子团。