1.一种基于跨境电商大数据的智能风控策略系统,其特征在于,包括:整合模块,用于通过业务需求将跨境电商的数据进行ETL过程,并建立数据仓库存储电商数据,统一电商数据的格式标准;
模拟模块,用于对电商平台的所有行为进行业务流程映射,得到含有多个环节的业务流程,确定每个环节中的操作、输入和输出,调取数据仓库中的电商数据来填充每个环节中的操作、输入和输出,对业务流程进行模拟,监控电商数据流动情况;
确定模块,用于将电商数据流动情况体现在数据流图上,电商数据流动情况包括每个环节的数据流入、数据流入路径、数据流出、数据流出路径和数据处理操作,基于数据流图确定每个环节的风险值,将风险值标注在业务流程内所对应的环节上;
建立模块,用于在数据仓库中挑选出用户相关数据,根据用户相关数据进行风险行为特征筛选,并对用户进行分群处理,识别每个用户群体所对应的行为模式,将行为模式与每个用户群体中的用户进行匹配,建立用户身份和行为模式之间的映射列表;
风控模块,用于在用户登录电商平台时,获取用户身份信息以确定用户身份,通过用户身份在映射列表中寻找所对应的行为模式,将用户行为模式在业务流程中进行展开,结合环节内标注的风险值设置该用户在不同环节内的风控策略,以此进行风险控制;
其中,所述确定模块还包括流入风险单元和流出风险单元,
所述流入风险单元用于:
预先定义敏感数据,并分析每个环节中数据流入中敏感数据的占比,根据数据流入、数据流入路径和敏感数据的占比评估数据流入的风险;
所述流出风险单元,用于:
通过数据处理操作对流入数据进行处理,比对数据处理操作前后的流入数据差异,以此确定数据处理操作风险,根据数据流出、数据流出路径和数据处理操作风险评估数据流出风险,结合数据流入的风险、数据处理操作风险和数据流出风险得到该环节所对应的风险值;
所述流入风险单元,用于:
通过数据流入确定数据来源,数据来源包括之前环节和数据仓库,对于数据来源于数据仓库的数据直接评估数据来源风险;
对于数据来源于之前环节的数据,通过数据流入途径确定每类数据途径的环节数量和不同类数据途径同一环节的数据类数量,根据每类数据途径的环节数量和不同类数据途径同一环节的数据类数量分别确定第一风险和第二风险,根据第一风险和第二风险确定流入路径风险,并通过敏感数据的占比调整流入路径风险;
根据数据来源风险和调整后的流入路径风险确定数据流入的风险;
所述流出风险单元,用于:
定义数据处理操作前后的流入数据差异为数据格式、数据类型和数据值三方面的差异,从而确定差异指标,不同的差异指标对应有不同的数据处理操作风险;
通过数据流出途径确定每类数据途径的环节数量和不同类数据途径同一环节的数据类数量,根据每类数据途径的环节数量和不同类数据途径同一环节的数据类数量分别确定第三风险和第四风险,根据第三风险和第四风险确定流出路径风险,基于数据处理操作风险调整流出路径风险,并将调整后的流出路径风险作为数据流出风险;
结合数据流入的风险、数据处理操作风险和数据流出风险得到该环节所对应的风险值,包括:其中,
所述建立模块,用于:
通过用户相关数据得到所有行为特征类别,从数据仓库中抽离出历史风险事件,分析历史风险事件中所涉及的初始风险行为特征,将所有行为特征类别除初始风险行为特征之外的行为特征记作其它行为特征;
计算每种其它行为特征与每种初始风险行为特征之间的相关度,根据初始风险行为特征所在历史风险事件中的价值度确定相关度阈值,将初始风险行为特征和相关度超过相关度阈值的其它行为特征均作为风险行为特征;
依据风险行为特征确定每个用户的风险等级,按照风险等级将用户群体进行划分,一个用户群体对应有一个风险等级;
对每个用户群体进行业务流程中各个环节的描述性分析,确定该群体在不同环节上的描述性数值区间,并将用户在不同环节上的描述性数值区间上进行具体描述性数值的匹配,其中,描述性分析则是该用户或群体的购买次数、点击频率、浏览频率,具体描述性数值为描述性具体大小;
所述风控模块,用于:
预先确定不同的环节内的描述性数值-理论风险值的函数关系;
用户行为模式在业务流程中展开后,得到该用户在不同环节上的具体描述性数值,将具体描述性数值输入到预设的对应的描述性数值-理论风险值的函数关系中,得到理论风险值;
根据理论风险值和标注的风险值得到实际风险值,通过实际风险值确定该环节所对应的风控策略等级,不同的风控策略等级包括有不同的计算资源、防护资源和存储资源的组合。
2.如权利要求1所述的基于跨境电商大数据的智能风控策略系统,其特征在于,所述整合模块,用于:业务需求包括KPIs和BI,ETL过程包括数据提取、数据转换和数据加载;
通过KPIs和BI确定需要存储的事实数据,以此设计事实表和维度表的结构,维度表结构包括层次结构、属性、键和与事实表的关联;
通过BI需求确定数据结构模型,监控数据提取、数据转换和数据加载三个过程中的提取速率、提取错误率、转换速率、转换错误率、加载速率和加载错误率;
依据BI需求分别确定提取速率与提取错误率对应的权重、转换速率和转换错误率对应的权重、加载速率和加载错误率对应权重,从而确定兼顾速率与错误率的提取指标、转换指标和加载指标;
当提取指标、转换指标和加载指标满足对应的预设条件时,将数据移动到数据仓库中;
否则,对数据提取或数据转换或数据加载的过程进行资源倾斜或优化,以使数据提取、数据转换和数据加载的过程符合预设条件。
3.如权利要求1所述的基于跨境电商大数据的智能风控策略系统,其特征在于,所述模拟模块,用于:确定每个环节中的操作、输入和输出后,通过SQL数据访问工具查询数据仓库中的相关数据,并将查询到的相关数据填充到业务流程中每个环节中对应的操作、输入和输出。