欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019109772842
申请人: 未鲲(上海)科技服务有限公司
专利类型:发明专利
专利状态:授权未缴费
专利领域: 计算;推算;计数
更新日期:2024-07-15
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种可视化特征筛选方法,其特征在于,所述可视化特征筛选方法包括以下步骤:获取预设周期内用户的数据,根据数据类型和数据标识从所述用户的数据中提取第一特征集合、第二特征集合以及目标变量,其中,所述第一特征集合包括数值型的特征变量,所述第二特征集合中包括非数值型的特征变量,所述目标变量为所述用户的分类结果;

获取所述第一特征集合中各个特征变量的方差,并将所述第一特征集合中所述方差不满足第一预设条件的特征变量移除,得到第三特征集合;

在显示区域内绘制并显示雷达图坐标系,并且基于每一类用户的数据,分别计算各个第三特征集合中的特征变量对应的均值,根据所述均值在所述雷达图坐标系中绘制与所述每一类用户的数据对应的多边形;

接收第一指令,根据所述第一指令确定目标用户,并且获取所述目标用户在第三特征集合中的特征变量对应的特征值,根据所述特征值在所述雷达图坐标系中绘制并显示所述目标用户对应的多边形;

计算所述第二特征集合以及所述第三特征集合中的各个特征变量之间的第一关联度,并计算所述第二特征集合以及所述第三特征集合中的各个特征变量与所述目标变量的第二关联度;

根据所述第一关联度和所述第二关联度在所述显示区域绘制并显示对应的热力图,其中,所述热力图包括多个单元格,每一个所述单元格对应一所述第一关联度或所述第二关联度,根据所述第一关联度或第二关联度为所述单元格填充对应的颜色;

接收基于所述热力图发出的第二指令,将所述第二指令指示移除的特征变量从所述第二特征集合以及所述第三特征集合中移除,得到第四特征集合;

将所述第二关联度不满足第二预设条件的特征变量从所述第四特征集合中移除。

2.如权利要求1所述的可视化特征筛选方法,其特征在于,所述获取所述第一特征集合中各个特征变量的方差,并将所述第一特征集合中方差不满足第一预设条件的特征变量移除,得到第三特征集合的步骤之后还包括:计算所述第三特征集合中的各个特征变量与所述目标变量的皮尔逊相关系数,并将所述皮尔逊相关系数在预设系数阈值范围外的特征变量移除。

3.如权利要求1所述的可视化特征筛选方法,其特征在于,所述关联度为互信息值,所述第二预设条件为所述互信息值小于互信息阈值。

4.如权利要求1所述的可视化特征筛选方法,其特征在于,所述用户的数据为用户的金融数据,所述获取预设周期内用户的数据,从所述用户的数据中提取第一特征集合的步骤包括:获取预设周期内用户的金融数据,根据所述金融数据得到第一数值型特征变量;

对所述金融数据进行同比和/或环比,得到第二数值型特征变量;

将所述第一数值型特征变量和所述第二数值型特征变量的并集作为所述第一特征集合。

5.如权利要求1至4任一项所述的可视化特征筛选方法,其特征在于,所述获取预设周期内用户的数据的步骤之后还包括:对所述用户的数据进行降维处理,得到所述用户的数据在二维空间中的数据点;

在所述显示区域内绘制二维坐标系,并在所述二维坐标系中显示所述数据点。

6.如权利要求1至4任一项所述的可视化特征筛选方法,其特征在于,所述获取预设周期内用户的数据,从所述用户的数据中提取第一特征集合、第二特征集合以及目标变量的步骤之后还包括:在所述显示区域绘制并显示所述第一特征集合与所述第二特征集合中各个特征变量的概率分布图;

接收基于所述概率分布图的第三指令,并将所述第三指令指示移除的特征变量从所述第二特征集合以及所述第三特征集合中移除。

7.如权利要求1至4任一项所述的可视化特征筛选方法,其特征在于,所述获取预设周期内用户的数据,从所述用户的数据中提取第一特征集合、第二特征集合以及目标变量的步骤之后还包括:接收第四指令,并获取所述第四指令指示显示的目标特征变量,其中,所述目标特征变量为所述第一特征集合或所述第二特征集合中的特征变量;

获取所述目标特征变量在连续时间点的特征值;

在所述显示区域内绘制二维坐标系,并在所述二维坐标系中显示所述目标特征变量在连续时间点的特征值。

8.如权利要求1至4任一项所述的一种可视化特征筛选方法,其特征在于,所述将所述第二关联度不满足第二预设条件的特征变量从所述第四特征集合中移除的步骤之后还包括:获取待分类的用户数据,并从所述待分类的用户数据中提取待筛选的特征变量;

将所述待筛选的特征变量在所述第四特征集合中进行匹配,得到匹配的特征变量;

将所述匹配的特征变量输入预设的分类模型进行处理,得到用户分类结果;

对于每一类用户的每一个匹配的特征变量,获取对应的统计特征,并根据所述统计特征在所述显示区域绘制对应的箱线图,其中,所述统计特征包括最大值、最小值、中位数以及两个四分位数。

9.一种服务器,其特征在于,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的可视化特征变量筛选的处理程序,所述可视化特征变量筛选的处理程序被所述处理器执行时实现如权利要求1至6中任一项所述的可视化特征变量筛选方法的步骤。

10.一种存储介质,其特征在于,所述存储介质上存储有可视化特征变量筛选的处理程序,所述可视化特征变量筛选的处理程序被处理器执行时实现如权利要求1至8中任一项所述的可视化特征变量的筛选方法的步骤。