1.一种信息推送方法,其特征在于,所述方法包括:
对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析,并基于统计分析的结果将通过预定下载通道下载所述目标应用的各个用户进行用户分类,得到第一分类信息;
基于预先训练的第一用户分类模型和第二用户分类模型,根据通过所述预定下载通道下载的所述目标应用的在线信息和用户使用信息将通过所述预定下载通道下载所述目标应用的各个用户进行用户分类,得到第二分类信息和第三分类信息;其中,基于预先训练的第一用户分类模型,根据通过所述预定下载通道下载的所述目标应用的在线信息识别用户为正常用户的概率值;根据识别出的概率值将用户识别为黑用户、白用户或灰用户,从而得到第二分类信息;
根据所述第一分类信息、第二分类信息和第三分类信息确定通过所述预定下载通道下载所述目标应用的用户中的作弊用户;
基于通过所述预定下载通道下载所述目标应用的用户中的作弊用户所占的比例、以及所述预定下载通道在预定时长内的下载量,生成所述预定下载通道的状态信息,并将所述状态信息进行推送。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述预定下载通道的状态信息生成针对所述预定下载通道的优先级设置信息,并将所述优先级设置信息进行推送。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据基于统计分析得出的第一分类信息、基于第一用户分类模型得出的第二分类信息和基于第二用户分类模型得出的第三分类信息、以及确定的作弊用户分析基于统计分析、基于第一用户分类模型和基于第二用户分类模型的用户分类效果。
4.根据权利要求1所述的方法,其特征在于,所述在线信息包括在线时间,所述用户使用信息包括用户使用时间;以及所述对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析,并基于统计分析的结果将通过预定下载通道下载所述目标应用的各个用户进行用户分类,得到第一分类信息,包括:计算通过预定网站下载的目标应用每天的用户使用时间与在线时间的比例值,其中,比例值在统计上符合高斯分布;
计算比例值的均值和方差;
将比例值的均值和方差带入高斯分布的概率密度函数,并根据针对异常用户和正常用户设定的相应的置信水平分别计算异常用户和正常用户的置信区间,得到异常用户和正常用户对应的比例值范围;
根据计算的所述比例值范围将通过预定下载通道下载所述目标应用的用户分类为黑用户、白用户或灰用户,从而得到第一分类信息。
5.根据权利要求4所述的方法,其特征在于,所述基于预先训练的第一用户分类模型和第二用户分类模型,根据通过所述预定下载通道下载的所述目标应用的在线信息和用户使用信息将通过所述预定下载通道下载所述目标应用的各个用户进行用户分类,得到第二分类信息和第三分类信息,包括:基于预先训练的第二用户分类模型,根据通过所述预定下载通道下载的所述目标应用的用户使用信息识别用户为正常用户的概率值,根据识别出的概率值将用户识别为黑用户、白用户或灰用户,从而得到第三分类信息。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一分类信息、第二分类信息和第三分类信息确定通过所述预定下载通道下载所述目标应用的用户中的作弊用户,包括:将所述第一分类信息、第二分类信息和第三分类信息进行统计分析;
如果用户被第一分类信息、第二分类信息和第三分类信息中的两种或两种以上分类为黑用户,则确定该用户为作弊用户。
7.根据权利要求6所述的方法,其特征在于,所述基于通过所述预定下载通道下载所述目标应用的用户中的作弊用户所占的比例、以及所述预定下载通道在预定时长内的下载量,生成所述预定下载通道的状态信息,包括:计算通过所述预定下载通道下载所述目标应用的用户中作弊用户所占的比例;
如果计算得到的比例超过预先设定的作弊用户比例阈值,则判断所述预定下载通道为作弊下载通道,其中,作弊用户比例阈值是根据下载通道在预定时长内的下载量进行设定的。
8.根据权利要求5所述的方法,其特征在于,所述第一用户分类模型通过以下方式训练获得:将通过预定网站下载的所述目标应用的在线信息集合作为正样本在线信息集合;
将第一分类信息中的至少一个黑用户的在线信息作为负样本在线信息集合;
利用机器学习方法,基于所述正样本在线信息集合、负样本在线信息集合,训练得到第一用户分类模型。
9.根据权利要求5所述的方法,其特征在于,所述第二用户分类模型通过以下方式训练获得:将通过预定网站下载的所述目标应用的用户使用信息集合作为正样本用户使用信息集合;
将第一分类信息中的至少一个黑用户的用户使用信息作为负样本用户使用信息集合;
利用机器学习方法,基于所述正样本用户使用信息集合、负样本用户使用信息集合,训练得到第二用户分类模型。
10.根据权利要求8或9所述的方法,其特征在于,所述机器学习方法为逻辑回归算法。
11.一种信息推送装置,其特征在于,所述装置包括:
统计与分类单元,用于对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析,并基于统计分析的结果将通过预定下载通道下载所述目标应用的各个用户进行用户分类,得到第一分类信息;
分类单元,用于基于预先训练的第一用户分类模型和第二用户分类模型,根据通过所述预定下载通道下载的所述目标应用的在线信息和用户使用信息将通过所述预定下载通道下载所述目标应用的各个用户进行用户分类,得到第二分类信息和第三分类信息;其中,所述分类单元进一步用于:基于预先训练的第一用户分类模型,根据通过所述预定下载通道下载的所述目标应用的在线信息识别用户为正常用户的概率值,根据识别出的概率值将用户识别为黑用户、白用户或灰用户,从而得到第二分类信息;
确定单元,用于根据所述第一分类信息、第二分类信息和第三分类信息确定通过所述预定下载通道下载所述目标应用的用户中的作弊用户;
推送单元,用于基于通过所述预定下载通道下载所述目标应用的用户中的作弊用户所占的比例、以及所述预定下载通道在预定时长内的下载量,生成所述预定下载通道的状态信息,并将所述状态信息进行推送。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:生成单元,用于根据所述预定下载通道的状态信息生成针对所述预定下载通道的优先级设置信息,并将所述优先级设置信息进行推送。
13.根据权利要求11所述的装置,其特征在于,所述装置还包括:分析单元,用于根据基于统计分析得出的第一分类信息、基于第一用户分类模型得出的第二分类信息和基于第二用户分类模型得出的第三分类信息、以及确定的作弊用户分析基于统计分析、基于第一用户分类模型和基于第二用户分类模型的用户分类效果。
14.根据权利要求11所述的装置,其特征在于,所述在线信息包括在线时间,所述用户使用信息包括用户使用时间;以及所述统计与分类单元进一步用于:计算通过预定网站下载的目标应用每天的用户使用时间与在线时间的比例值,其中,比例值在统计上符合高斯分布;
计算比例值的均值和方差;
将比例值的均值和方差带入高斯分布的概率密度函数,并根据针对异常用户和正常用户设定的相应的置信水平分别计算异常用户和正常用户的置信区间,得到异常用户和正常用户对应的比例值范围;
根据计算的所述比例值范围将通过预定下载通道下载所述目标应用的用户分类为黑用户、白用户或灰用户,从而得到第一分类信息。
15.根据权利要求14所述的装置,其特征在于,所述分类单元进一步用于:基于预先训练的第二用户分类模型,根据通过所述预定下载通道下载的所述目标应用的用户使用信息识别用户为正常用户的概率值,根据识别出的概率值将用户识别为黑用户、白用户或灰用户,从而得到第三分类信息。
16.根据权利要求15所述的装置,其特征在于,所述确定单元进一步用于:将所述第一分类信息、第二分类信息和第三分类信息进行统计分析;
如果用户被第一分类信息、第二分类信息和第三分类信息中的两种或两种以上分类为黑用户,则确定该用户为作弊用户。
17.根据权利要求16所述的装置,其特征在于,所述推送单元进一步用于:计算通过所述预定下载通道下载所述目标应用的用户中作弊用户所占的比例;
如果计算得到的比例超过预先设定的作弊用户比例阈值,则判断所述预定下载通道为作弊下载通道,其中,作弊用户比例阈值是根据下载通道在预定时长内的下载量进行设定的。
18.根据权利要求15所述的装置,其特征在于,所述第一用户分类模型通过以下方式训练获得:将通过预定网站下载的所述目标应用的在线信息集合作为正样本在线信息集合;
将第一分类信息中的至少一个黑用户的在线信息作为负样本在线信息集合;
利用机器学习方法,基于所述正样本在线信息集合、负样本在线信息集合,训练得到第一用户分类模型。
19.根据权利要求15所述的装置,其特征在于,所述第二用户分类模型通过以下方式训练获得:将通过预定网站下载的所述目标应用的用户使用信息集合作为正样本用户使用信息集合;
将第一分类信息中的至少一个黑用户的用户使用信息作为负样本用户使用信息集合;
利用机器学习方法,基于所述正样本用户使用信息集合、负样本用户使用信息集合,训练得到第二用户分类模型。
20.根据权利要求18或19所述的装置,其特征在于,所述机器学习方法为逻辑回归算法。