欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018104535136
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法,其特征在于,所述方法包括如下步骤:

步骤1:构建问答社区中标签网络,如果同一个问题帖子下边出现多个标签,则认为这些标签具有连边,构建问答社区标签网络,得到源领域和目标领域社区的网络结构集合步骤2:计算各社区中网络结构的向量表征,采用graph2vec的方法,将每个网络Gi∈Ω用一个维度为d的向量来进行表征,最后学习得到每个社区网络图结构的向量表征Vi;

步骤3:计算源领域与目标领域之间的结构相似性,计算源领域网络结构表征向量 和和目标领域VT之间的余弦相似性γt:

步骤4:构建基于A-TrAdaboost算法的多源社区标签流行性预测模型,通过提取源领域DSt和目标领域DT中的样本标签及特征数据,把步骤3中计算的相似性γt作为各源领域迁移到目标领域上的初始权重,通过有权SVM的方法,不断迭代更新不同训练样本中的权重,得出最后的训练模型。

2.如权利要求1所述的一种基于A-TrAdaboost迁移算法的多源社区标签发展趋势预测方法,其特征在于:在所述步骤1中,构建问答社区中标签网络,对源领域问答社区Si中,统计其社区中所有的新标签,按时间排序,取比例为前α=10%中的新标签中最后一个标签出现的时刻 社区所有标签的网络,作为该社区的网络结构 时刻的社区网络结构初步形成,其结构特征能够代表该领域社区的网络结构,最后得到源领域和目标领域社区的网络结构集合

3.如权利要求1或2所述的一种基于A-TrAdaboost迁移算法的多源社区标签发展趋势预测方法,其特征在于:所述步骤2中,计算社区中网络结构的向量表征,采用graph2vec的方法,将每个网络Gi∈Ω用一个维度为d的向量来进行表征,首先,提取网络Gi的根子图结构,利用Weisfeiler-Lehman核方法对网络Gi中每一个节点依次提取最小子图结构,集合为vi表示网络Gi中的子图的种类,然后利用类比doc2vec的方法中的skip-gram的语言嵌入模型,将子图结构类比于单词,每个图类比一个文档,最后学习得到源领域社区和目标社区网络图结构的向量表征 和VT,t∈{1,2,…,n}。

4.如权利要求1或2所述的一种基于A-TrAdaboost迁移算法的多源社区标签发展趋势预测方法,其特征在于:所述步骤4中,构建基于网络结构相似性的A-Tradaboost算法模型,操作如下,获取源领域和目标领域社区的特征标记样本DS和DT,其中 为目标领域有标记数据集, 为目标领域无标记数据集,选择源领域数据和目标领域有标记样本数据集作为模型的训练集 测试集为 c(x)函数表示样本x的标记函数,c(x)∈{0,1},将步骤3所计算的余弦相似性γt分别作为源领域 中样本的权重 中样本的初始权重设为1,记为wT,即所有训练样本权重为作为A-TrAdaboost方法的初始权重,在每次迭代过程中,通过有

权SVM训练每次的基分类器ft,然后根据公式计算每次迭代后在目标领域有标记样本DTl上的误差率εt:

其中,βt表示为当前的基分类器的权重,再根据误差率更新训练样本的权重,使得对目标领域有益的样本权重增加,反之权重降低,迭代N次后,对最后得到的N个基分类器{f1,f2,…,fN}进行加权投票得出最后的出最后的预测模型fT,