1.一种基于用户行为的个性化社区推荐方法,其特征在于该方法主要包括如下关键步骤:第1、目标用户属性及其行为分析:
第1.1、从微博社交平台爬取所需用户数据集合;
第1.2、对爬取到的数据进行筛选过滤,选出符合所需数据,处理并整合用户属性信息;
第1.3、数据分为训练集和测试集;
第2、目标用户相似度计算:
第2.1、遍历目标用户所关注博主集合;
第2.2、以及遍历目标用户所参与社区或讨论话题;
第2.3、利用如下扩展的Jaccard相似度计算公式得到相似用户集;
其中,F(u)指u关注的博主集合,F(v)指v关注的博主集合。C(u)是u参加过的社区,C(v)是v参加过的社区;
第3、相似用户集影响分析:
第3.1、数据库中获取与待推荐集相关的数据,计算用户活跃度和传播能力;
第3.2、PageRank是通过计算网页链接数量进行网页排名,在此基础上考虑微博用户所发帖子被转发程度,因此用转发概率进行衡量,用户影响力计算公式:其中,I(i)表示用户i的所有粉丝集合,d为转发概率。S(j,i)指j分给i的UBR值的比率,如下所示:其中,Si为i的传播力,Sk为j关注的博主的传播力,n为j追随的博主数,S(j,i)代表i占j所有关注人的UBR值比例;
第3.3、通过上述两步骤分析得到最终待推荐集;
第4、社区融合分析:
第4.1、获取最终推荐集所参与社区、话题等信息;
第4.2、进行社区重叠判断,如果用户已经关注过待推荐博主或者用户已经参与过话题社区的讨论,那就进行社区筛选过滤;相反若没有,则继续推荐给目标用户。