欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019110933440
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于层次聚类的社交网络多尺度结构挖掘方法,其特征在于,包括以下步骤:S1:计算机对社交网络用户交互数据进行统计,以用户为点,构成网络G=,V表示网络中点的集合,E表示网络中边的结合,基于获取的交互数据计算每两个用户间的用户关联度LH;

S2:计算机使用单连接层次聚类算法的准则,参照用户关联度LH不断添加边到网络的边集E中,每添加一条边就视为将该边连接的两个连通域合并为一个聚类簇,直到网络G=成为连通图;

S3:计算机根据S2中层次聚类添加边的顺序,生成二叉树状图;

S4:计算机依据先验知识对S3中生成的二叉树状图进行结构优化,使其更加接近社交网络真实结构;

S5:计算机输出最终的社区挖掘结果,用于后续推荐系统的构建;

所述步骤S3根据S2中层次聚类添加边的顺序,生成二叉树状图,具体为:S31:初始化树状图T为空图;

S32:取出边添加序列ES中当前所包含的添加时间最早的边ei,j;

S33:如果网络G中的节点i未出现在树状图上,则在树状图T中新建叶子节点以代表仅包含了网络G中的节点i的簇,如果网络G中的节点j未出现在树状图上,则在树状图T中新建叶子节点以代表仅包含网络G中的节点j的簇;

S34:将树状图T中包含节点i的最大的簇与包含j的最大的簇作为两个子节点连接到新建的父节点,父节点代表的簇包含两个子节点簇所包含的所有网络G中的节点;

S35:如果ES不为空,跳转至步骤S32;

S36:获取生成完毕的树状图T;

所述步骤S4计算机依据先验知识对S3中生成的二叉树状图进行结构优化具体步骤为:S41:根据先验知识,给出最小簇规模K,描述树状图T中除叶子节点外最小的簇的大小;

S42:对树状图T的根节点进行优化操作;

所述步骤S42的对树状图T某节点parent的优化操作具体为:若节点parent所代表簇的规模小于K,则将节点parent及其以下结构改动,变为节点parent所代表的簇中的所有节点个体直接作为叶子节点连接至parent的父节点,否则对parent的两个子节点执行优化操作。

2.根据权利要求1所述的一种基于层次聚类的社交网络多尺度结构挖掘方法,其特征在于,所述步骤S1对社交网络用户交互数据进行统计,以用户为点,构成网络G=,基于获取的交互数据计算每两个用户间的用户关联度LH,具体为:S11:获取社交网络用户与其他用户的交互数据;

S12:构建网络G=,i,j∈V,其中 表示社交网络中共n个的用户,表示网络G=中连接节点i与节点j的边,视网络中每一个连通域为一个聚类簇;

S13初始化 即网络G中没有边,所有节点各自属于一个独立的聚类簇;

S14:计算用户间的关联度 用于描述i,j两个节点之间的亲近程度,其值越大,表示两个用户之间关系越近;关联度计算公式如下:j

其中fi 表示用户i与用户j交互次数占用户i总交互次数的比例, 表示用户j与用户i交互次数占用户j总交互次数的比例,ε表示一个无穷小的数,以避免除0的情形。

3.根据权利要求2所述的一种基于层次聚类的社交网络多尺度结构挖掘方法,其特征在于,所述步骤S2具体为:S21:初始化未添加边对应的相似度集合为LH′=LH;边添加序列S22:抽取LH′中值最大的个体,找到其对应的边ei,j,如果其所属的节点i与节点j属于同一聚类簇即通过边添加序列ES中的边连通,则放弃向ES中添加边ei,j,如果其所属的节点i与节点j不属于同一聚类簇,则将节点i与节点j所属的两个簇合并,并将边ei,j添加进边添加序列ES中;

S23:若已添加边序列ES中边的数量达到n‑1,则进入步骤S3,否则返回步骤S22。

4.一种存储介质,该存储介质内部存储计算机程序,其特征在于,所述计算机程序被处理器读取时,执行上述权利要求1~3任一项的方法。