欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021107187409
申请人: 杭州师范大学钱江学院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-08-01
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于联合嵌入学习模型的跨社交网络用户身份识别方法,其特征在于包括如下步骤:

A B

步骤1、针对社交网络G 和G的用户,利用用户名相似度和网络结构从两个社交网络中选取候选配对用户对;

步骤2、以所有的候选配对用户对P={pi}为节点,若用户对pi中的两个用户分别为对方的邻居,则pi和pj之间存在一条边,以此为原则构建用户对网络图UPG;

步骤3、在构建的用户对网络图UPG和已标注的用户对数据的基础上,融合已标注的配对用户信息标签、结构信息和属性信息搭建联合嵌入学习模型,并将联合嵌入学习模型设计成1个输入和2个输出的深度神经网络结构;

步骤4、利用随机梯度下降算法对联合嵌入学习模型的损失函数进行最小化学习,学习结束后利用模型对需要预测的用户对进行预测,并判断输出是否为相同用户;

步骤3具体实现如下:

3‑1.通过爬虫爬取的部分用户属性信息通过文本分析和匹配技术,并结合人工判定,标注用户在另外一个网络中的准确映射账号;标注出的用户匹配对,作为模型训练的监督信息;

3‑2.对步骤2‑1产生的候选配对用户集中的每两个用户 和 的属性通过one‑hot编码进行特征转换,分别记为 和 所述属性包括用户名、性别、毕业院校以及地理位置;

3‑3.针对构建的用户对网络构建联合嵌入学习模型;将节点中两个用户的属性向量进行拼接操作,记为 并将di作为联合嵌入学习模型的输入;输出有左、右两个分支,左边分支利用多层感知机模型输出节点标签yi为0和1的概率值,1代表节点中的两个用户为同一用户,0代表节点中的两个用户为不同用户;右边分支利用skipgram模型输出预测的Context节点的概率值;

skipgram模型的第m层表示为:m m

其中,δ(·)代表sigmoid函数,W 和b为m层的weights和biases参数;公式(4)和公式(5)分别代表左边分支和右边分支的第m+1层; 代表第m+1层的左边分支的weights参数, 则代表第m+1层的右边分支的weights参数, 和 依此类推;

该模型左边分支的最后一层设计为softmax层,该层的输入为:该模型右边分支的最后一层设计为softmax层,该层的输入为:其中,k代表左边分支隐含层的层数,k'代表右边分支隐含层的层数。

2.根据权利要求1所述的基于联合嵌入学习模型的跨社交网络用户身份识别方法,其特征在于步骤1具体实现如下:A A A A A A

1‑1.G=(U ,E ,X)代表社交网络A,U代表社交网络A的用户集,E 代表社交网络A的用A B B B

户关系集合,X代表社交网络A的用户属性矩阵, 代表社交网络A中的用户i;G=(U ,E ,B

X)代表社交网络B,其余各参数含义类似;

1‑2.使用爬虫获取不同社交网络平台的数据;

A B

1‑3.对分别来自社交网络G 和G 的用户 的用户名nk和nj,根据公式(1)计算相似度,选取相似度大于0.8的用户对加入到候选配对用户对集合P中;

其中,lev(nk,nj)代表Levenshtein距离,l(nk)代表用户名nk的字符长度;

1‑4.以用户对集合P中的每一对用户为种子用户对进行邻居节点的扩展,从种子用户对的邻居节点中选取具备r个共同邻居(已知配对)的用户对加入到P中,并根据不同的数据集设置不同的r值;

步骤2具体实现如下:

2‑1.UPG=(UUPG,EUPG)代表用户对网络图,UUPG表示节点集合,EUPG代表节点之间的关系集合;将候选配对用户对pi作为UPG的节点,并记为u'i,u'i∈UUPG;

2‑2.假定 和 为UPG中的两个节点,如果这两个节点之间存在以下关系,则他们之间存在一条边;

其中, 表示用户 的邻居节点集。

3.根据权利要求2所述的基于联合嵌入学习模型的跨社交网络用户身份识别方法,其特征在于步骤4具体实现如下:

4‑1.联合嵌入学习模型的左边分支为多层感机知模型,该分支的损失函数定义为:其中 代表UPG中的带标签节点,p(yi|di)代表给定di条件下yi的概率值,该值计算如下:

右边分支采用负采样机制定义损失函数定义为:其中δ(·)代表sigmoid函数,n=|UUPG|,u'代表节点u'i的上下文节点, 代表随机选取的t个负样本;

4‑2采用mini‑batch梯度下降法计算参数;设定左边分支的batch值b1设定为200,右边(L)

分支的batch值b2为200;从UUPG中随机采样b1个带标签节点,并计算L 的梯度值,按照梯度m m

值进行参数W和b, 和 更新;

m m

4‑3从UUPG中随机采样b2个节点,并计算 的梯度值,按照梯度值进行参数W 和b, 和的更新;

4‑4返回至步骤4‑2,迭代100次;

4‑5输入UPG中的待预测节点u'j,根据步骤3‑2计算得到该节点中两个用户的属性向量,并将其进行拼接得到向量dj,输入到联合嵌入学习模型中,计算得到待预测节点u'j的标签。