1.一种用于聚合设备标识符ID的方法,其特征在于,所述方法包括:从原始ID数据中采集多个ID对,每个ID对包括相关联的两个ID和属性数据;
利用连通图聚合算法在设备ID图中聚合所述多个ID对中的ID,生成至少一个连通图,其中所述多个ID对中的每个ID对应于设备ID图中的点,所述多个ID对中的每个ID对对应于设备ID图中连接该ID对的两个ID的边,每个连通图表示一个用户设备;
所述聚合进一步包括利用属性数据基于反作弊策略检测所述至少一个连通图中的异常边;删除检测到的异常边;
所述聚合还包括:
从连通图中的设备ID中按照设备ID的稳定性的优先顺序选择一个设备ID,用于标识相应的连通图所表示的用户设备,其中,所述设备ID的稳定性的优先顺序是基于所述原始ID数据的来源类型所确定的。
2.根据权利要求1所述的方法,其特征在于,所述原始ID数据来自浏览器端数据、APP端数据和/或跨端数据。
3.根据权利要求2所述的方法,其特征在于,所述原始ID数据包括以下数据中的一种或多种:被叫用户识别号CUID数据、媒体访问控制MAC地址数据、国际移动设备识别码IMEI数据和Cookie级别的ID数据。
4.根据权利要求1所述的方法,其特征在于,属性数据包括以下信息中的一种或多种:操作系统类型、操作系统版本、设备供应商、设备型号、浏览器类型、屏幕尺寸、运营商名称。
5.根据权利要求1或4所述的方法,其特征在于,所述方法包括预处理所述多个ID对,所述预处理包括:根据属性数据判断所述多个ID对中的ID的有效性,删除无效的ID;和/或对属性数据进行归一化。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括将采集到的多个ID对与历史上采集到的ID对进行整合,生成经整合的ID对,所述聚合步骤聚合经整合的ID对。
7.根据权利要求1所述的方法,其特征在于,所述聚合包括以下步骤:设备ID图中的每个点向其邻接的点发送其当前连通分量标识符;
设备ID图中的每个点根据其接收到的邻接点的连通分量标识符更新其自身的连通分量标识符。
8.根据权利要求1所述的方法,其特征在于,所述聚合包括以下步骤:设备ID图中的每个点向其连通分量标识符发送连通消息;
设备ID图中的每个点向其邻接的点发送其当前的连通分量标识符;
设备ID图中的每个点根据其接收到的连通消息和连通分量标识符更新其自身的连通分量标识符以及其连通的点。
9.一种用于聚合设备标识符ID的装置,其特征在于,该装置包括:采集单元,其被配置为从原始ID数据中采集多个ID对,每个ID对包括相关联的两个ID和属性数据;
聚合单元,其被配置为利用连通图聚合算法在设备ID图中聚合所述多个ID对中的ID,生成至少一个连通图,其中所述多个ID对中的每个ID对应于设备ID图中的点,所述多个ID对中的每个ID对对应于设备ID图中连接该ID对的两个ID的边,每个连通图表示一个用户设备;
所述聚合单元在进行所述聚合时,进一步被配置为利用属性数据基于反作弊策略检测所述至少一个连通图中的异常边;删除检测到的异常边;
聚合单元还进一步被配置为从连通图中的设备ID中按照设备ID的稳定性的优先顺序选择一个设备ID,用于标识相应的连通图所表示的用户设备,其中,所述设备ID的稳定性的优先顺序是基于所述原始ID数据的来源类型所确定的。
10.根据权利要求9所述的装置,其特征在于,所述原始ID数据来自浏览器端数据、APP端数据和/或跨端数据。
11.根据权利要求10所述的装置,其特征在于,所述原始ID数据包括以下数据中的一种或多种:被叫用户识别号CUID数据、媒体访问控制MAC地址数据、国际移动设备识别码IMEI数据和Cookie级别的ID数据。
12.根据权利要求9所述的装置,其特征在于,每个ID对还包括属性数据,所述属性数据包括以下信息中的一种或多种:操作系统类型、操作系统版本、设备供应商、设备型号、浏览器类型、屏幕尺寸、运营商名称。
13.根据权利要求12所述的装置,其特征在于,所述装置进一步包括预处理单元,其被配置为预处理所述多个ID对,所述预处理包括根据属性数据判断所述多个ID对中的ID的有效性,删除无效的ID;和/或对属性数据进行归一化。
14.根据权利要求9所述的装置,其特征在于,所述装置进一步包括整合单元,其被配置为将采集到的多个ID对与历史上采集到的ID对进行整合,生成经整合的ID对,所述聚合单元被配置为聚合经整合的ID对。
15.根据权利要求9所述的装置,其特征在于,所述聚合包括:设备ID图中的每个点向其邻接的点发送其当前连通分量标识符;
设备ID图中的每个点根据其接收到的邻接点的连通分量标识符更新其自身的连通分量标识符。
16.一种装置,其特征在于,所述装置包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至8中任一所述的方法。
17.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1至8中任一所述的方法。