欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2022112195471
申请人: 湖南工程学院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种数据处理方法,其特征在于,所述数据处理方法包括以下步骤:基于历史交易数据集获取第一样本集,并确定所述第一样本集中第一样本的第一权重,其中,历史交易数据集包括欺诈交易数据以及正常交易数据;

基于所述第一权重确定所述第一样本集对应的裁剪阈值,并基于所述裁剪阈值以及所述第一样本集,获取第二样本集;

将所述第二样本集输入初始分类器进行训练,获得弱分类器和错误率,并将弱分类器添加至分类器集;

基于所述分类器集以及所述错误率,确定欺诈预测模型,并将当前交易数据输入所述欺诈预测模型,以确定所述当前交易数据中是否存在欺诈交易数据。

2.如权利要求1所述的数据处理方法,其特征在于,所述基于所述第一权重确定所述第一样本集对应的裁剪阈值,并基于所述裁剪阈值以及所述第一样本集,获取第二样本集的步骤包括:获取所述第一样本集中的第一样本个数,以及所述第一权重中的最大权重;

基于所述最大权重、所述第一样本个数和预设规范系数确定裁剪阈值;

将各个所述第一样本中第一权重大于所述裁剪阈值的目标样本作为第二样本集的第二样本。

3.如权利要求1所述的数据处理方法,其特征在于,所述将所述第二样本集输入初始分类器进行训练,获得弱分类器和错误率,并将弱分类器添加至分类器集的步骤包括:将所述第二样本集中各个第二样本输入初始分类器进行机器训练学习,获取弱分类器以及分类结果;

基于所述分类结果、第一权重和实际结果,获取错误率;

基于所述错误率获取所述弱分类器的分类器权重,并基于所述分类器权重将弱分类器添加至分类器集。

4.如权利要求1所述的数据处理方法,其特征在于,所述基于所述分类器集以及所述错误率,确定欺诈预测模型的步骤包括:确定所述错误率是否大于或等于预设值;

若所述错误率大于或等于预设值,则确定所述第二样本集与所述第一样本集是否相同;

若相同,基于所述分类器集中各个分类器以及所述分类器集中各个分类器的分类器权重,确定欺诈预测模型。

5.如权利要求4所述的数据处理方法,其特征在于,所述确定所述第二样本集与所述第一样本集是否相同的步骤之后,还包括:若不相同,则将第二样本集作为第一样本集,将第二样本集中各个第二样本对应的权重作为第一权重,返回执行所述基于所述第一权重确定所述第一样本集对应的裁剪阈值的步骤。

6.如权利要求4所述的数据处理方法,其特征在于,所述确定所述错误率是否大于或等于预设值的步骤之后,还包括:若错误率小于预设值,则更新当前迭代次数;

若当前迭代次数大于预期迭代次数或错误率小于最低错误率,则基于分类器集获取各个分类器权重,并基于所述分类器权重和分类结果,确定欺诈预测模型。

7.如权利要求6所述的数据处理方法,所述更新当前迭代次数的步骤之后,还包括:若当前迭代次数小于或等于预期迭代次数,则基于所述第二样本集对应的分类结果,获取所述第二样本集对应的连续错误次数;

基于所述错误率获取所述弱分类器的分类器权重,并基于所述连续错误次数获取惩罚因子;

基于所述惩罚因子、分类结果、实际结果、第二样本集中各个第二样本的权重以及分类器权重,获取第二样本集中各个第二样本的第二权重;

将所述第二样本集作为第一样本集,将所述第二权重作为第一权重,返回执行所述基于所述第一权重确定所述第一样本集对应的裁剪阈值的步骤。

8.如权利要求1至7任一项所述的数据处理方法,其特征在于,所述将当前交易数据输入所述欺诈预测模型,以确定所述当前交易数据中是否存在欺诈交易数据的步骤包括:基于所述欺诈预测模型,将当前交易数据输入所述欺诈预测模型中各个分类器中,获取各个分类器对应的预测结果;

基于所述各个分类器对应的预测结果,获取最终预测结果,并基于所述最终预测结果确定所述当前交易数据中是否存在欺诈交易数据。

9.一种数据处理设备,其特征在于,所述数据处理设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现如权利要求1‑8所述的数据处理方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如权利要求1‑8所述的数据处理方法的步骤。