1.一种基于用户页面行为轨迹的白名单生成系统,包括用户终端和直播平台服务器,其特征在于:用户终端内设置有轨迹记录单元,直播平台服务器内设置有缓存预处理单元、分布式实时计算单元和白名单输出单元;
所述轨迹记录单元用于:根据用户在观看直播过程中产生的页面间跳转的轨迹,记录下相应的页面跳转轨迹信息;将记录的页面跳转轨迹信息进行编码后提交给直播平台服务器;
所述缓存预处理单元用于:对各个用户终端提交的页面跳转轨迹信息进行缓存并预处理;定时将缓存的所有页面跳转轨迹信息以若干数据片的形式发送至分布式实时计算单元;
所述分布式实时计算单元包括若干个实时计算子单元,分布式实时计算单元用于将每个数据片按照哈希策略分配给一个指定的实时计算子单元;每个实时计算单元对数据片中的页面跳转轨迹信息进行解析并验证,将验证通过的页面跳转轨迹信息的用户ID添加到白名单中;
所述白名单输出单元用于:将添加有用户ID的白名单通过Restful接口或者RPC接口实时输出。
2.如权利要求1所述的基于用户页面行为轨迹的白名单生成系统,其特征在于:所述页面跳转轨迹信息包括当前页面URL、页面行为轨迹数据、用户ID和按照特定规则生成的识别码;所述页面行为轨迹数据是由页面ID拼接成的ID序列,所述识别码为固定长度,且生成后进行加密处理。
3.如权利要求2所述的基于用户页面行为轨迹的白名单生成系统,其特征在于:所述识别码的生成规则为:时间戳+设备API获取的唯一设备ID+随机数。
4.如权利要求2所述的基于用户页面行为轨迹的白名单生成系统,其特征在于:所述缓存预处理单元进行缓存时,会丢弃不符合要求的页面跳转轨迹信息;所述不符合要求的页面跳转轨迹信息包括:页面URL非法的页面跳转轨迹信息、页面行为轨迹数据无效的页面跳转轨迹信息、用户ID为空或者用户ID不符合数据字段类型的页面跳转轨迹信息、时间戳格式错误的页面跳转轨迹信息、用户终端类型标识非法的页面跳转轨迹信息。
5.一种应用权利要求1所述系统的基于用户页面行为轨迹的白名单生成方法,其特征在于,包括以下步骤:
A、每个用户终端的轨迹记录单元根据用户在观看直播过程中产生的页面间跳转的轨迹,记录下相应的页面跳转轨迹信息;将记录的页面跳转轨迹信息进行编码后提交给直播平台服务器,转入B;
B、直播平台服务器的缓存预处理单元对各个用户终端提交的页面跳转轨迹信息进行缓存并预处理,转入C;
C、缓存预处理单元定时将缓存的所有页面跳转轨迹信息以若干数据片的形式发送至分布式实时计算单元;分布式实时计算单元将每个数据片按照哈希策略分配给一个指定的实时计算子单元,转入D;
D、每个实时计算单元对数据片中的页面跳转轨迹信息进行解析并验证,将验证通过的页面跳转轨迹信息的用户ID添加到白名单中,转入E;
E、白名单输出单元将添加有用户ID的白名单通过Restful接口或者RPC接口实时输出,结束。
6.如权利要求5所述的基于用户页面行为轨迹的白名单生成方法,其特征在于:步骤A中所述页面跳转轨迹信息包括当前页面URL、页面行为轨迹数据、用户ID和按照特定规则生成的识别码;所述页面行为轨迹数据是由页面ID拼接成的ID序列,所述识别码为固定长度,且生成后进行加密处理;
步骤B中,所述缓存预处理单元进行缓存时,会丢弃不符合要求的页面跳转轨迹信息;
所述不符合要求的页面跳转轨迹信息包括:页面URL非法的页面跳转轨迹信息、页面行为轨迹数据无效的页面跳转轨迹信息、用户ID为空或者用户ID不符合数据字段类型的页面跳转轨迹信息、时间戳格式错误的页面跳转轨迹信息、用户终端类型标识非法的页面跳转轨迹信息。
7.如权利要求5所述的基于用户页面行为轨迹的白名单生成方法,其特征在于:步骤C中,缓存预处理单元定时将缓存的所有页面跳转轨迹信息以若干数据片的形式发送至分布式实时计算单元,具体包括以下操作:缓存预处理单元每隔1秒钟将当前缓存的所有页面跳转轨迹信息发送至分布式实时计算单元,每次发送时将页面跳转轨迹信息组合成若干小于等于1M的数据片进行发送。
8.如权利要求5所述的基于用户页面行为轨迹的白名单生成方法,其特征在于:步骤C中,分布式实时计算单元将每个数据片按照哈希策略分配给一个指定的实时计算子单元,具体包括以下操作:分布式实时计算单元为每个数据片分配一个唯一的ID号,将该ID号按照实时计算子单元的个数取模,获得的余数则对应指定的实时计算子单元的ID号;将数据片分配给对应ID号的实时计算子单元。
9.如权利要求5所述的基于用户页面行为轨迹的白名单生成方法,其特征在于:步骤A中所述页面跳转轨迹信息包括当前页面URL、页面行为轨迹数据、用户ID和按照特定规则生成的识别码;所述页面行为轨迹数据是由页面ID拼接成的ID序列,所述识别码为固定长度,且生成后进行加密处理;
步骤D具体包括以下操作:每个实时计算子单元对数据片中的页面跳转轨迹信息进行解析,根据解析的页面跳转轨迹信息的识别码判断该页面跳转轨迹信息是否有效,若为无效,直接丢弃该页面跳转轨迹信息,结束;若为有效,则对该页面跳转轨迹信息的页面行为轨迹数据进行验证,若验证失败,则直接丢弃该页面行为轨迹数据,结束,若验证成功,则将该页面行为轨迹数据的用户ID添加到白名单中,转入E。
10.如权利要求5所述的基于用户页面行为轨迹的白名单生成方法,其特征在于:所述白名单包括多个白名单分片;步骤D中所述将验证通过的页面跳转轨迹信息的用户ID添加到白名单中,具体包括以下操作:将验证通过的页面跳转轨迹信息的用户ID按照指定的添加规则,添加到对应的一个白名单分片中。