1.一种改进的RBF神经网络热点话题用户参与行为预测方法,其特征在于,包括以下步骤:
S1:从现有的社交平台的API获取,或者通过网络爬虫抓取web网页中的内容获取社交网络用户数据;
S2:提取相关属性的步骤:考虑到潜在用户参与话题主要原因包括用户个人特征属性以及用户外部社交属性的影响,将从这两个方面提取相关属性;并对用户的信息做时间切片化处理;
S3:建立模型的步骤:将用户属性进行基于云变换的数据拟合,得到正态云后可以构建出高维云,高维云的个数即为RBF神经网络中隐含层的神经元个数,其参数即为隐含层激励函数的聚类中心和带宽,确定好参数后即可对RBF神经网络进行训练,得到预测该用户是否会参与话题的预测模型;
S4:预测和分析过程步骤:通过采用指数平滑法预测未来话题趋势走向,将预测得出的热点话题参与人数的时间序列(y1,y2,…,yn)做三次指数平滑计算,即可拟合出热点话题的热度趋势变化,从而进行对下一时间段的预测。
2.根据权利要求1所述改进的RBF神经网络热点话题用户参与行为预测方法,其特征在于,所述步骤S1获取获取社交网络用户数据的具体内容为特定热点话题下的用户参与行为数据及用户关系数据;用户参与行为数据包括该话题被转发及评论的时间、参与用户的个人信息及历史行为数据;用户关系数据包括参与该话题下的用户的所有粉丝和关注用户,以及他们的个人信息。
3.根据权利要求1或2所述改进的RBF神经网络热点话题用户参与行为预测方法,其特征在于,所述步骤S2根据用户个人特征属性提取相关属性,主要包括:提取潜在用户个人特征属性:潜在用户的个人特征属性主要包括①潜在用户是否为活跃用户isActivity(vi);②潜在用户vi的标签中是否包括与热点话题相同的关键字isSameTag(Vi);③潜在用户的关注用户中参与话题的数量countOfHF(vi);④潜在用户的关注用户的话题带动力inf(vi);将以上有关潜在用户的自身特征属性用xik的统一形式描述,表示潜在用户vi的第k个属性。
4.根据权利要求3所述改进的RBF神经网络热点话题用户参与行为预测方法,其特征在于,所述步骤S2根据用户外部社交属性提取相关属性,主要包括:潜在用户的外部社交属性主要包括①潜在用户vi的关注用户是否为认证用户isVip(vi,vj);②潜在用户vi的关注用户是否为意见领袖isLeader(vi,vj);③潜在用户vi与其关注用户性别相同isSameS(vi,vj);
④潜在用户vi与其关注用户性别不同isDifS(vi,vj);⑤潜在用户vi与其关注用户地点相同isSameL(vi,vj);⑥潜在用户vi与其关注用户地点不同isDifL(vi,vj);同时,潜在用户是否会参与该热点话题还与其所处的社团影响力有关,因此定义其团队属性为groupInf(vi,Cm),即潜在用户所处的Cm社团是否为对该热点话题感兴趣的社团;将以上有关潜在用户的自身特征属性用xik的统一形式描述,表示潜在用户vi的第k个属性。
5.根据权利要求4所述改进的RBF神经网络热点话题用户参与行为预测方法,其特征在于,步骤S3建立模型的步骤主要分以下4个步骤:S31:对用户自身特征属性和用户外部社交属性分别采用极大值法进行云变换,云变换即对任意不规则的数据分布进行数学变换,它能对样本点进行软分类的模糊聚类,使其成为若干个不同的云的叠加;
S32:将通过云变换的属性值与RBF神经网络相结合,从而确定云模型的隐含层神经元;
根据峰值法云变化,对于输入层的每维属性X,可以得到ni个拟合正态云,根据高维云理论和n维正向云发生器构造出n维正态云作为RBF神经网络隐含层的神经元,可以得到(n1×n2×...×nn)个n维云模型,即n个隐含层节点;
S33:从基于n维云模型改进的隐含层神经元中取期望值作为RBF神经网络隐含层神经元的最终输出值;
S34:RBF神经网络中隐含层到输出层之间是一种线性感知器模型,且由于输出层节点由线性函数组成,采用最小二乘法求解连接的权值。
6.根据权利要求5所述改进的RBF神经网络热点话题用户参与行为预测方法,其特征在于,所述步骤S4预测和分析过程步骤包括:S41:将获得的时间序列做三次指数平滑变换;
S42:当时间序列体现出二次曲线趋势时,即建立二次曲线修正模型,该模型为非线性预测模型,能够体现出时序的变化趋势,预测话题热度的发展趋势。