欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2016106388255
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所述挖掘方法包括以下步骤:S1:通过用户已有行为的记录数据,分别建立出两类二分图与有向转移网络,即用户—餐馆地区,用户—口味标签;

S2:根据用户—餐馆地区与用户—口味标签的二分图,从网络的节点角度,提取出每对用户的节点相似度特征,节点相似度特征用于表征两个用户之间的行为偏好差异;根据用户—餐馆地区与用户—口味标签的有向转移网络,从网络的连边角度,提取出每对用户的有向连边属性特征,有向连边属性特征用于表征两个用户之间的相互影响;

S3:由原始数据已知用户之间的朋友关系,采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;

S4:取交叉验证的10次验证结果的平均值作为用户关系预测器模型的最终评价成绩。

2.如权利要求1所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所述步骤S1中,利用自适应DBSCAN密度聚类算法,各城市的所有餐馆根据地理经纬度信息,分别聚类到各自密度可达的地区聚类簇,从而归纳出各个餐馆所属的地区特征。

3.如权利要求1或2所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所述步骤S1中,建立二分图方法,构建用户—餐馆地区二分图、以及用户—口味标签二分图,建立用户—餐馆二分图的过程如下:定义二分图G(X,E1,Y),其中X=[x1,x2,…xm]表示各个用户,Y=[y1,y2,…yn]表示各个餐馆聚类簇,若用户xi去过餐馆聚类簇yj,则用有权连边eij表示该用户去了几次该餐馆聚类簇;同理,用户—口味标签二分图G(X,E2,T)。

4.如权利要求3所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所所述步骤S1中,建立有向转移网络方法,构建用户之间关于餐馆地区、以及口味标签的有向转移网络,建立用户—餐馆地区有向转移网络的过程如下:定义两个用户之间的有向转移网络 其中xi,xj分别表示用户xi,xj,{Yi},{Yj}分别表示用户xi,xj去过的餐馆聚类簇集合,根据原数据集已知各用户的用餐餐馆与相应用餐的时间,若用户xi,xj去过相同的餐馆聚类簇yi*=yj*,且用户xi去的时间先于用户xj,则用有向连边 表示用户xi指向用户xj,有向连边 的权重,根据用户xi,xj去该餐馆yi*=yj*的最小次数而定,若将各两两用户的有向网络合并可得整个社交社区的用户行为图谱;同理,构建用户之间的口味标签时序有向转移网络

5.如权利要求1或2所述的一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所所述步骤S2中,根据已建立的两类网络拓扑关系,分别提取关于节点或连边的用户之间社交行为的特征,包括以下步骤:S2-1:根据二分图,求得两两用户之间的行为偏好相似度,在用户—餐馆地区二分图G(X,E1,Y)中,可构建链接矩阵D∈R4×n,dij表示用户xi去餐馆聚类簇yj的次数,则用户xi去餐馆聚类簇yj的概率为

根据不相关熵的定义,餐馆聚类簇yj的熵为

Ej值越大,表示餐馆聚类簇yj越受用户青睐,

用户xi,xj选择餐馆在地理上的相似度特征cluster_similarij定义为

同理,可得用户—口味标签二分图G(X,E2,T)的两两用户之间选择餐馆,在共同口味上的相似度特征taste_similarij;

S2-2:根据有向转移网络,求得两两用户之间的行为影响,在用户—餐馆地区有向转移网络中,用户xj对用户xi关于选择餐馆的影响定义为

其中aij表示在历史记录中,用户xj选择餐馆行为对用户xi行为的影响,

βj表示用户xj去历史记录之外的同一座城市餐馆的概率,Ni表示用户xi行为记录最多城市Ci的餐馆总数,Ii,Oi分别是网络中用户xi的入度邻居与出度邻居,即选择就餐地理位置时,用户xi的影响用户集与被影响用户集;同理,可得用户—口味标签有向转移网络中的关于选择口味的影响。