1.一种基于层次聚类的社交网络多尺度结构挖掘方法,其特征在于,包括以下步骤:S1:计算机对社交网络用户交互数据进行统计,以用户为点,构成网络G=
S2:计算机使用单连接层次聚类算法的准则,参照用户关联度LH不断添加边到网络的边集E中,每添加一条边就视为将该边连接的两个连通域合并为一个聚类簇,直到网络G=
S3:计算机根据S2中层次聚类添加边的顺序,生成二叉树状图;
S4:计算机依据先验知识对S3中生成的二叉树状图进行结构优化,使其更加接近社交网络真实结构;
S5:计算机输出最终的社区挖掘结果,用于后续推荐系统的构建;
所述步骤S3根据S2中层次聚类添加边的顺序,生成二叉树状图,具体为:S31:初始化树状图T为空图;
S32:取出边添加序列ES中当前所包含的添加时间最早的边ei,j;
S33:如果网络G中的节点i未出现在树状图上,则在树状图T中新建叶子节点以代表仅包含了网络G中的节点i的簇,如果网络G中的节点j未出现在树状图上,则在树状图T中新建叶子节点以代表仅包含网络G中的节点j的簇;
S34:将树状图T中包含节点i的最大的簇与包含j的最大的簇作为两个子节点连接到新建的父节点,父节点代表的簇包含两个子节点簇所包含的所有网络G中的节点;
S35:如果ES不为空,跳转至步骤S32;
S36:获取生成完毕的树状图T;
所述步骤S4计算机依据先验知识对S3中生成的二叉树状图进行结构优化具体步骤为:S41:根据先验知识,给出最小簇规模K,描述树状图T中除叶子节点外最小的簇的大小;
S42:对树状图T的根节点进行优化操作;
所述步骤S42的对树状图T某节点parent的优化操作具体为:若节点parent所代表簇的规模小于K,则将节点parent及其以下结构改动,变为节点parent所代表的簇中的所有节点个体直接作为叶子节点连接至parent的父节点,否则对parent的两个子节点执行优化操作。
2.根据权利要求1所述的一种基于层次聚类的社交网络多尺度结构挖掘方法,其特征在于,所述步骤S1对社交网络用户交互数据进行统计,以用户为点,构成网络G=
S12:构建网络G=
S13初始化 即网络G中没有边,所有节点各自属于一个独立的聚类簇;
S14:计算用户间的关联度 用于描述i,j两个节点之间的亲近程度,其值越大,表示两个用户之间关系越近;关联度计算公式如下:j
其中fi 表示用户i与用户j交互次数占用户i总交互次数的比例, 表示用户j与用户i交互次数占用户j总交互次数的比例,ε表示一个无穷小的数,以避免除0的情形。
3.根据权利要求2所述的一种基于层次聚类的社交网络多尺度结构挖掘方法,其特征在于,所述步骤S2具体为:S21:初始化未添加边对应的相似度集合为LH′=LH;边添加序列S22:抽取LH′中值最大的个体,找到其对应的边ei,j,如果其所属的节点i与节点j属于同一聚类簇即通过边添加序列ES中的边连通,则放弃向ES中添加边ei,j,如果其所属的节点i与节点j不属于同一聚类簇,则将节点i与节点j所属的两个簇合并,并将边ei,j添加进边添加序列ES中;
S23:若已添加边序列ES中边的数量达到n‑1,则进入步骤S3,否则返回步骤S22。
4.一种存储介质,该存储介质内部存储计算机程序,其特征在于,所述计算机程序被处理器读取时,执行上述权利要求1~3任一项的方法。