1.一种识别恶意用户的方法,其特征在于,所述方法包括:获取训练样本集,所述训练样本集为回归树结构,所述训练样本集包括训练样本的特征以及与训练样本对应的标签,所述训练样本对应的标签用于标识用户是否为恶意用户;
从所述训练样本集中确定最优的切分特征与切分阈值;
将所述训练样本集分裂处理,得到第一样本集和第二样本集,所述第一样本集是指特征的取值不小于所述切分阈值的特征集,所述第二样本集是指特征的取值大于所述切分阈值的特征集;
将所述第一样本集和所述第二样本集中各特征的均值作为目标输出值;
根据所述目标输出值判断用户的是否为恶意用户;
将所述第一样本集和所述第二样本集中判断为恶意用户的训练样本对应的标签设置为恶意用户,以及将所述第一样本集和所述第二样本集中判断为非恶意用户的训练样本对应的标签设置为非恶意用户。
2.如权利要求1所述的方法,其特征在于,所述目标输出值用于评估用户的恶意等级;
所述训练样本的特征至少包括用户的异常弹幕数量、用户播放数量、用户在第一时段内发表的评论数量、用户在第二时段内发表的相同评论数量和用户账户余额。
3.如权利要求2所述的方法,其特征在于,所述根据所述目标输出值判断用户的是否为恶意用户之后,所述方法还包括以下之一:封禁判断为恶意用户的用户账号;
或者,封禁判断为恶意用户的用户账号且设置有效封禁时长;
或者,对判断为恶意用户的用户账号发送警告消息。
4.如权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括:设置封禁阈值;
所述根据所述目标输出值判断用户的是否为恶意用户,包括:若所述目标输出值大于所述封禁阈值,则确定用户的恶意等级满足恶意用户的判断条件。
5.如权利要求4所述的方法,其特征在于,所述训练样本包括第一特征、第二特征和第三特征,所述根据所述目标输出值判断用户的是否为恶意用户之后,方法还包括:生成反馈结果,所述反馈结果包括:所述第一特征的取值不大于第一数值,所述第二特征大于第二数值,所述第三特征不大于第三数值。
6.一种用于识别恶意用户的装置,其特征在于,所述装置包括:获取模块,用于获取训练样本集,所述训练样本集为回归树结构,所述训练样本集包括训练样本的特征以及与训练样本对应的标签,所述训练样本对应的标签用于标识用户是否为恶意用户;
处理模块,用于从所述训练样本集中确定最优的切分特征与切分阈值;将所述训练样本集分裂处理,得到第一样本集和第二样本集,所述第一样本集是指特征的取值不小于所述切分阈值的特征集,所述第二样本集是指特征的取值大于所述切分阈值的特征集;将所述第一样本集和所述第二样本集中各特征的均值作为目标输出值;根据所述目标输出值判断用户的是否为恶意用户;将所述第一样本集和所述第二样本集中判断为恶意用户的训练样本对应的标签设置为恶意用户,以及将所述第一样本集和所述第二样本集中判断为非恶意用户的训练样本对应的标签设置为非恶意用户。
7.如权利要求6所述的装置,其特征在于,所述目标输出值用于评估用户的恶意等级;
所述训练样本的特征至少包括用户的异常弹幕数量、用户播放数量、用户在第一时段内发表的评论数量、用户在第二时段内发表的相同评论数量和用户账户余额。
8.如权利要求6或7所述的装置,其特征在于,所述处理模块用于:设置封禁阈值;
若所述目标输出值大于所述封禁阈值,则确定用户的恶意等级满足恶意用户的判断条件。
9.一种数据处理装置,其特征在于,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5中识别恶意用户的方法中的步骤。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中识别恶意用户的方法中的步骤。