欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 201811102774X
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种团伙挖掘方法,其特征在于,包括:

获取各个用户的行为数据,所述行为数据包括第一行为数据和第二行为数据,所述第一行为数据为用户使用互联网、通信网络所产生的数据,所述第二行为数据为用户与其他用户在现实环境中接触所产生的数据,所述第一行为数据和第二行为数据包括多个类型的关联关系的数据;

根据所述各个用户的第一行为数据和第二行为数据,分别确定任意两个用户之间的多个类型的关联关系的权重;

使用多个调节参数,分别对所述任意两个用户之间的多个类型的关联关系的权重进行自动拟合处理,确定任意两个用户之间的权重信息,所述多个调节参数为对包括已知团伙信息的训练样本进行学习后获取的;其中,所述调节参数的个数与所述关联关系的类型的个数相同,所述权重信息融合了各个类型的关联关系的数据;

根据所述任意两个用户之间的权重信息构建待挖掘的关联网络;

通过计算模块度的方式对所述待挖掘的关联网络进行挖掘,输出团伙信息;

所述根据所述各个用户的第一行为数据和第二行为数据,分别确定任意两个用户之间的多个类型的关联关系的权重,包括:根据所述各个用户的第一行为数据和第二行为数据,分别获取任意两个用户之间的关联频次,所述关联频次包括多个类型的关联关系的关联频次;

根据所述任意两个用户之间的关联频次,分别确定任意两个用户之间的多个类型的关联关系的权重。

2.根据权利要求1所述的方法,其特征在于,所述根据所述任意两个用户之间的关联频次,分别确定任意两个用户之间的多个类型的关联关系的权重,包括:对于第d个类型的关联关系,根据所述任意两个用户的第一关联频次与所述任意两个用户的第二关联频次的比值,确定任意两个用户之间的第d个类型的关联关系的权重;

其中,所述任意两个用户的第一关联频次为所述任意两个用户之间的所述第d个类型的关联关系的关联频次,所述任意两个用户的第二关联频次为所述任意两个用户与其他用户之间的所述第d个类型的关联关系的关联频次,d分别取1至关联关系的类型总个数。

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:对于第k个用户和第l个用户,根据公式 确定第k个用户与第l个用户的第二关联频次;

其中, 表示第k个用户与第l个用户之间的第d个类型的关联关系的关联频次,N为所述各个用户的总个数,k和l分别取1至N中任意两个数。

4.根据权利要求1至3任一项所述的方法,其特征在于,所述使用多个调节参数,分别对所述任意两个用户之间的多个类型的关联关系的权重进行拟合处理,确定任意两个用户之间的权重信息,包括:对于第k个用户和第l个用户,根据公式

确定第k个用户和第l个

用户之间的权重信息 ;

其中, 表示第d个类型的关联关系中,第k个用户和第l个用户之间的权重信息,D为关联关系的类型总个数, 分别表示一个类型的关联关系的调节参数。

5.根据权利要求4所述的方法,其特征在于,所述根据所述任意两个用户之间的权重信息构建待挖掘的关联网络,包括:分别根据所述任意两个用户之间的权重信息构建两个结点之间的带权值的边,获取待挖掘的关联网络,其中,每个结点表示一个用户。

6.根据权利要求5所述的方法,其特征在于,所述通过计算模块度的方式对所述待挖掘的关联网络进行挖掘,输出团伙信息,包括:将每个结点作为一个初始团伙,分别计算所述结点加入到各个邻居结点后的模块度的变化量;

根据所述模块度的变化量,对初始团伙进行更新,获取更新后的团伙,将更新后的团伙作为新的结点,分别计算所述新的结点加入到各个邻居结点后的模块度的变化量;

当模块度不再变化时,输出更新后的团伙的团伙信息。

7.根据权利要求1至3、5至6任一项所述的方法,其特征在于,所述团伙信息包括属于同一团伙的各个用户的信息。

8.一种团伙挖掘装置,其特征在于,包括:

获取模块,用于获取各个用户的行为数据,所述行为数据包括第一行为数据和第二行为数据,所述第一行为数据为用户使用互联网、通信网络所产生的数据,所述第二行为数据为用户与其他用户在现实环境中接触所产生的数据,所述第一行为数据和第二行为数据包括多个类型的关联关系的数据;

权重确定模块,用于根据所述各个用户的第一行为数据和第二行为数据,分别确定任意两个用户之间的多个类型的关联关系的权重;

权重拟合模块,用于使用多个调节参数,分别对所述任意两个用户之间的多个类型的关联关系的权重进行自动拟合处理,确定任意两个用户之间的权重信息,所述多个调节参数为对包括已知团伙信息的训练样本进行学习后获取的;

关联网络确定模块,用于根据所述任意两个用户之间的权重信息构建待挖掘的关联网络;

输出模块,用于通过计算模块度的方式对所述待挖掘的关联网络进行挖掘,输出团伙信息;

所述权重确定模块,用于:

根据所述各个用户的第一行为数据和第二行为数据,分别获取任意两个用户之间的关联频次,所述关联频次包括多个类型的关联关系的关联频次;

根据所述任意两个用户之间的关联频次,分别确定任意两个用户之间的多个类型的关联关系的权重,其中,所述调节参数的个数与所述关联关系的类型的个数相同,所述权重信息融合了各个类型的关联关系的数据。

9.根据权利要求8所述的装置,其特征在于,所述权重确定模块,用于:对于第d个类型的关联关系,根据所述任意两个用户的第一关联频次与所述任意两个用户的第二关联频次的比值,确定任意两个用户之间的第d个类型的关联关系的权重;

其中,所述任意两个用户的第一关联频次为所述任意两个用户之间的所述第d个类型的关联关系的关联频次,所述任意两个用户的第二关联频次为所述任意两个用户与其他用户之间的所述第d个类型的关联关系的关联频次,d分别取1至关联关系的类型总个数。

10.根据权利要求9所述的装置,其特征在于,所述装置还包括关联频次确定模块,用于:对于第k个用户和第l个用户,根据公式 确定第k个用户与第l个用户的第二关联频次;

其中, 表示第k个用户与第l个用户之间的第d个类型的关联关系的关联频次,N为所述各个用户的总个数,k和l分别取1至N中任意两个数。

11.根据权利要求8至10任一项所述的装置,其特征在于,所述权重拟合模块,用于:对于第k个用户和第l个用户,根据公式

确定第k个用户和第l个

用户之间的权重信息 ;

其中, 表示第d个类型的关联关系中,第k个用户和第l个用户之间的权重信息,D为关联关系的类型总个数, 分别表示一个类型的关联关系的调节参数。

12.根据权利要求11所述的装置,其特征在于,所述关联网络确定模块,用于:分别根据所述任意两个用户之间的权重信息构建两个结点之间的带权值的边,获取待挖掘的关联网络,其中,每个结点表示一个用户。

13.根据权利要求12所述的装置,其特征在于,所述输出模块,用于:将每个结点作为一个初始团伙,分别计算所述结点加入到各个邻居结点后的模块度的变化量;

根据所述模块度的变化量,对初始团伙进行更新,获取更新后的团伙,将更新后的团伙作为新的结点,分别计算所述新的结点加入到各个邻居结点后的模块度的变化量;

当模块度不再变化时,输出更新后的团伙的团伙信息。

14.根据权利要求8至10、12至13任一项所述的装置,其特征在于,所述团伙信息包括属于同一团伙的各个用户的信息。

15.一种电子设备,其特征在于,包括:

存储器和处理器;

所述存储器用于指令,以使所述处理器执行所述指令,以实现如权利要求1‑7任一项所述的团伙挖掘方法。

16.一种存储介质,其特征在于,包括:所述存储介质包括指令,所述指令用于实现如权利要求1‑7任一项所述的团伙挖掘方法。