欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2016106388255
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于用户行为的社交网络中朋友关系挖掘方法,其特征在于:所述挖掘方法包括以下步骤:

S1:通过用户已有行为的记录数据,分别建立出两类二分图与有向转移网络,即用户—餐馆地区,用户—口味标签;

S2:根据用户—餐馆地区与用户—口味标签的二分图,从网络的节点角度,提取出每对用户节点的相似度特征,节点相似度特征用于表征两个用户之间的行为偏好差异;根据用户—餐馆地区与用户—口味标签的有向转移网络,从网络的连边角度,提取出每对用户的有向连边属性特征,有向连边属性特征用于表征两个用户之间的相互影响;

S3:由原始数据已知用户之间的朋友关系,采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;

S4:取交叉验证的10次验证结果的平均值作为用户关系预测器模型的最终评价成绩;

所述步骤S1中,利用自适应DBSCAN密度聚类算法,各城市的所有餐馆根据地理经纬度信息,分别聚类到各自密度可达的餐馆地区聚类簇,从而归纳出各个餐馆地区特征;

所述步骤S1中,采用二分图方法,构建用户—餐馆地区二分图、以及用户—口味标签二分图,建立用户—餐馆地区二分图的过程如下:定义二分图G(X,E1,Y),其中X=[x1,x2,…xm]表示各个用户组成的集合,Y=[y1,y2,…yn]表示各个餐馆地区聚类簇组成的集合,若用户xi去过餐馆地区聚类簇yj,则用有权连边eij表示该用户去了几次该餐馆地区聚类簇;同理,构建用户—口味标签二分图G(X,E2,T),其中X=[x1,x2,…xm]表示各个用户组成的集合,T=[t1,t2,…tp]表示各个口味标签组成的集合,若用户xi吃过口味tj,则用有权连边e′ij表示该用户吃过几次该口味;

所述步骤S1中,采用有向转移网络方法,构建用户—餐馆地区与用户—口味标签的有向转移网络,建立用户—餐馆地区有向转移网络的过程如下:定义两个用户之间的有向转移网络 其中xi,xj分别表示用户xi,xj,{Yi},{Yj}分别表示用户xi,xj去过的餐馆地区聚类簇集合,根据原始数据已知各用户的用餐餐馆与相应用餐的时间,若用户xi,xj去过相同的餐馆地区聚类簇yi*=yj*,且用户xi去的时间先于用户xj,则用有向连边 表示用户xi指向用户xj,有向连边 的权重,根据用户xi,xj去该餐馆地区聚类簇yi*=yj*的最小次数而定,若将各两两用户的有向网络合并可得整个社交社区的用户行为图谱;同理,构建用户—口味标签的有向转移网络 其中xi,xj分别表示用户xi,xj,{Ti},{Tj}分别表示用户xi,xj吃过的口味标签集合,根据原始数据已知各用户的用餐餐馆口味标签与相应用餐的时间,若用户xi,xj吃过相同的口味ti*=tj*,且用户xi去吃该口味的时间先于用户xj,则用有向连边 表示用户xi指向用户xj,有向连边 的权重,根据用户xi,xj吃过该口味ti*=tj*的最小次数而定;

所述步骤S2中,根据已建立的两类网络拓扑关系,分别提取关于节点或连边的用户之间社交行为的特征,包括以下步骤:S2-1:根据二分图,求得两两用户之间的行为偏好相似度,在用户—餐馆地区二分图G(X,E1,Y)中,可构建链接矩阵D∈R4×n,dij表示用户xi去餐馆地区聚类簇yj的次数,则用户xi去餐馆地区聚类簇yj的概率为根据不相关熵的定义,餐馆地区聚类簇yj的熵为

Ej值越大,表示餐馆地区聚类簇yj越受用户青睐,

用户xi,xj选择餐馆在地理上的相似度特征cluster_similarij定义为

在用户—口味标签二分图G(X,E2,T)中,构建链接矩阵D′∈R4×p,d′ij表示用户xi吃过口味tj的次数,则用户xi去吃口味tj的概率为根据不相关熵的定义,口味tj的熵为

E′j值越大,表示口味tj越受用户欢迎;

则用户xi,xj选择餐馆在口味上的相似度特征taste_similarij定义为

S2-2:根据有向转移网络,求得两两用户之间的行为影响,在用户—餐馆地区有向转移网络中,用户xj对用户xi关于选择餐馆的影响定义为其中aij表示在历史记录中,用户xj选择餐馆行为对用户xi行为的影响,

βj表示用户xj去历史记录之外的同一座城市餐馆的概率,Ni表示用户xi行为记录最多城市Ci的餐馆总数,Ii是网络中用户xi的入度邻居,即选择就餐地理位置时,影响用户xi的用户集;Oj是网络中用户xj的出度邻居,即选择就餐地理位置时,用户xj的影响用户集;

在用户—口味标签有向转移网络中,用户xj对用户xi关于选择就餐口味的影响定义为其中a′ij表示在历史记录中,用户xj选择就餐口味对用户xi的影响,β′j表示用户xj打算去吃历史记录之外的其他就餐口味的概率,p表示原始数据中所有口味标签的总数,I′i是网络中用户xi的入度邻居,即选择就餐口味时,影响用户xi的用户集,O′j是网络中用户xj的出度邻居,即选择就餐口味时,用户xj影响的用户集。