1.一种社交网络社区的搜索方法,其特征在于,所述方法包括:获取所述目标社交网络的初始社交网络社区数据,其中,所述初始社交网络数据以无向图G=(V,E)的数据类型配置,V为所述初始社交网络数据中包含的用户节点,E为所述无向图G=(V,E)中的边集;
根据不同所述用户节点的行为模式数据,计算相邻的所述用户节点之间的行为紧密度,并在所述无向图G=(V,E)中将所述行为紧密度作为对应用户节点之间的边的权值;
以所述权值为基础,结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′,所述目标用户节点为待搜索所属社交网络社区的用户节点;
在所述社交网络社区G′的基础上,采用重启随机游走算法,生成社交网络社区通过k‑truss模型,对所述社交网络社区 进行紧密用户节点搜索,得到社交网络社区以所述目标用户节点为中心,结合不同用户节点之间在行为模式向量上的相似度,对所述社交网络社区 进行二次社区搜索,得到社交网络社区H,作为所述目标用户节点所属的社交网络社区。
2.根据权利要求1所述的方法,其特征在于,所述k‑truss模型进行的所述紧密用户节点搜索,包括:
通过k‑truss模型,初始化所述社交网络社区 中每条边e的支撑度sup(e);
初始化所述社交网络社区 =所述社交网络社区 设置k=3;
比较所述社交网络社区 中的每条边e的支撑度wup(e)是否小于k‑2;
若是,则进行更新处理,所述更新处理包括确定当前边e对应顶点u和顶点v,将nb(u)以及nb(v)的交集顶点集合W中取出每个顶点w,找出所述顶点u以及所述顶点w构成的边e′(u,w),将sup(e′)=sup(e′)‑1,找出所述顶点v以及所述顶点w构成的边e′(v,w),将sup(e′)=sup(e′)‑1,从所述社交网络社区 中删除所述当前边e,其中,当遍历所述社交网络社区 中的每条边e并执行对应的所述更新处理后,判断所述社交网络社区 是否被更新,若是,则设置k=k+1,继续比较所述社交网络社区 中的每条边e的支撑度sup(e)是否小于k‑2,并执行对应的所述更新处理;
在满足预设输出条件时,退出循环处理,输出当前的所述社交网络社区
3.根据权利要求1所述的方法,其特征在于,所述以所述目标用户节点为中心,结合不同用户节点之间在行为模式向量上的相似度,对所述社交网络社区 进行二次社区搜索,得到社交网络社区H,作为所述目标用户节点所属的社交网络社区,包括:将所述目标用户节点初始化到所述社交网络社区H中;
计算所述社交网络社区H中包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim;
将所述社交网络社区H中包含的用户节点的行为模式向量进行相加,得到行为模式向量
忽略所述社交网络社区 中,与所述行为模式向量 在行为模式向量上的相似度小于所述相似度阈值sim的用户节点,并确定剩余的用户节点;
在所述剩余的用户节点中,将与所述行为模式向量 在行为模式向量上的相似度取得最大值的用户节点加入所述社交网络社区H中;
计算当前的所述社交网络社区H包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim 0;
若相似度阈值sim 0与所述相似度阈值sim之间的差值大于预设差值,则继续执行所述行为模式向量 所述剩余的用户节点以及所述社交网络社区H的循环处理;
若相似度阈值sim 0与所述相似度阈值sim之间的差值小于所述预设差值,则退出循环处理,输出当前的所述社交网络社区H。
4.根据权利要求3所述的方法,其特征在于,若所述目标用户节点的数量为一个,在所述计算所述社交网络社区H中包含的用户节点之间在行为模式向量上的相似度、所述将所述社交网络社区H中包含的用户节点的行为模式向量进行相加,得到行为模式向量 之前,所述方法还包括:
将所述社交网络社区 中,与所述目标用户节点在行为模式向量上的相似度取得最大值的用户节点,加入所述社交网络社区H中。
5.根据权利要求1所述的方法,其特征在于,所述不同用户节点之间在行为模式向量上的相似度,具体为余弦相似度,所述预先相似度通过对应两个向量之间的夹角的余弦值计算得到。
6.一种社交网络社区的搜索装置,其特征在于,所述装置包括:获取单元,用于获取所述目标社交网络的初始社交网络社区数据,其中,所述初始社交网络数据以无向图G=(V,E)的数据类型配置,V为所述初始社交网络数据中包含的用户节点,E为所述无向图G=(V,E)中的边集;
计算单元,用于根据不同所述用户节点的行为模式数据,计算相邻的所述用户节点之间的行为紧密度,并在所述无向图G=(V,E)中将所述行为紧密度作为对应用户节点之间的边的权值;
查询单元,用于以所述权值为基础,结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′,所述目标用户节点为待搜索所属社交网络社区的用户节点;
生成单元,用于在所述社交网络社区G′的基础上,采用重启随机游走算法,生成社交网络社区
搜索单元,用于通过k‑truss模型,对所述社交网络社区 进行紧密用户节点搜索,得到社交网络社区
二次搜索单元,用于以所述目标用户节点为中心,结合不同用户节点之间在行为模式向量上的相似度,对所述社交网络社区 进行二次社区搜索,得到社交网络社区H,作为所述目标用户节点所属的社交网络社区。
7.根据权利要求6所述的装置,其特征在于,所述k‑truss模型进行的所述紧密用户节点搜索,包括:
通过k‑truss模型,初始化所述社交网络社区 中每条边e的支撑度sup(e);
初始化所述社交网络社区 =所述社交网络社区 设置k=3;
比较所述社交网络社区 中的每条边e的支撑度sup(e)是否小于k‑2;
若是,则进行更新处理,所述更新处理包括确定当前边e对应顶点u和顶点v,将nb(u)以及nb(v)的交集顶点集合W中取出每个顶点w,找出所述顶点u以及所述顶点w构成的边e′(u,w),将sup(e′)=sup(e′)‑1,找出所述顶点v以及所述顶点w构成的边e′(v,w),将sup(e′)=sup(e′)‑1,从所述社交网络社区 中删除所述当前边e,其中,当遍历所述社交网络社区 中的每条边e并执行对应的所述更新处理后,判断所述社交网络社区 是否被更新,若是,则设置k=k+1,继续比较所述社交网络社区 中的每条边e的支撑度sup(e)是否小于k‑2,并执行对应的所述更新处理;
在满足预设输出条件时,退出循环处理,输出当前的所述社交网络社区
8.根据权利要求6所述的装置,其特征在于,所述二次搜索单元,具体用于:将所述目标用户节点初始化到所述社交网络社区H中;
计算所述社交网络社区H中包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim;
将所述社交网络社区H中包含的用户节点的行为模式向量进行相加,得到行为模式向量
忽略所述社交网络社区 中,与所述行为模式向量 在行为模式向量上的相似度小于所述相似度阈值sim的用户节点,并确定剩余的用户节点;
在所述剩余的用户节点中,将与所述行为模式向量 在行为模式向量上的相似度取得最大值的用户节点加入所述社交网络社区H中;
计算当前的所述社交网络社区H包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim 0;
若相似度阈值sim 0与所述相似度阈值sim之间的差值大于预设差值,则继续执行所述行为模式向量 所述剩余的用户节点以及所述社交网络社区H的循环处理;
若相似度阈值sim 0与所述相似度阈值sim之间的差值小于所述预设差值,则退出循环处理,输出当前的所述社交网络社区H。
9.一种处理设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的方法。