1.一种面向社交网络的用户关系分析方法,其特征在于包括以下步骤:(1)利用网络爬虫或者通过各社交网站开放API平台获取原始数据;
(2)提取用户的个人属性、用户的好友关系信息以及用户的社团信息,根据所提取的信息建立个人兴趣影响因子函数、好友关系影响因子函数和社团驱动影响因子函数;
(3)以最大熵原理为基础构建用户关系分析模型,并对用户关系分析模型进行参数训练,获得最优参数集合;
(4)根据最优参数集合以及用户关系分析模型对用户之间是否存在关系进行预测。
2.根据权利要求1所述一种面向社交网络的用户关系分析方法,其特征在于:所述步骤(1)中还包括去掉原始数据中属性缺失的、重复的以及无效的数据节点。
3.根据权利要求2所述一种面向社交网络的用户关系分析方法,其特征在于:所述提取用户的个人属性时,从清洗后的数据中构建初始用户关系网络G=(V,E),从初始网络G中抽取顶点对,若该顶点对存在好友关系则构成正样本,不存在好友关系的顶点对集合构建负样本;然后选取其中的一部分作为源网络Gs=(Vs,Es),从源网络Gs提取用户的个人属性信息。
4.根据权利要1或2或3所述一种面向社交网络的用户关系分析方法,其特征在于:所述用户的个人属性包括用户的ID、用户名称、性别、描述、所在地以及精英用户。
5.根据权利要求1所述一种面向社交网络的用户关系分析方法,其特征在于:所述个人兴趣影响因子函数为
其中,yk表示用户之间是否存在链接,如果存在,则yk=1,反之为0; 表示个人兴趣方面的第i个特征, 表示用户个人兴趣特征和用户关系的相关性。
6.根据权利要求1所述一种面向社交网络的用户关系分析方法,其特征在于:所述好友关系影响因子函数为
其中,yk表示用户之间是否存在链接,如果存在,则yk=1,反之为0; 表示好友关系特征和用户关系的相关性; 表示好友关系方面的第i个特征。
7.根据权利要求1所述一种面向社交网络的用户关系分析方法,其特征在于:所述社团驱动影响因子函数为
其中,yk表示用户之间是否存在链接,如果存在,则yk=1,反之为0; 表示社团驱动特征和用户关系的相关性; 表示社团驱动方面的第i个特征。