1.一种基于大数据的金融风险分析方法,其特征在于,包括以下步骤:获取多个客户的借贷历史数据;
根据所述借贷历史数据分析得到所述借贷历史数据的投影值;
将每个所述投影值拟合成高斯模型,得到每个所述投影值的高斯值;
通过所述投影值和高斯值的差值获取多个离群点,每个所述离群点对应的借贷历史数据为异常数据;
获取每个所述异常数据对应的单个客户,根据每个所述单个客户的借贷历史数据分析得到借贷历史数据的投影值;根据所述单个客户的投影值及每两条借贷历史数据之间的时间间隔值,确定所述单个客户的异常值;
根据所述单个客户的异常值和借贷时间,确定所述单个客户的风险值;
设置风险阈值,根据所述单个客户的风险值与所述风险阈值的对比,对多个所述单个客户中风险客户和特殊群体客户进行区分;
所述借贷历史数据的投影值通过以下步骤获取:
将所述多个客户的借贷历史数据转化为多个结构化数据,再将所述多个结构化数据输入到PCA算法中,得到多个主成分方向,选取所述多个主成分方向对应特征值最大的主成分方向作为第一主成分坐标轴;
将单次所述借贷历史数据投影在所述第一主成分坐标轴上,得到单次所述借贷历史数据在所述第一主成分坐标轴上的投影值;所述投影值为所述借贷历史数据的投影值;
所述异常数据通过以下步骤获取:
对所述投影值进行次数统计,得到统计结果,并对所述统计结果采用多高斯混合模型拟合成高斯模型;
将每个所述投影值按从小到大的顺序进行排序,并将每个所述投影值的序号带入所述高斯模型中,得到所述投影值和对应序号的高斯值的差值;
设定阈值,当所述投影值和高斯值的差值大于所述阈值时,则所述投影值和高斯值的差值为离群点,所述离群点对应的所述借贷历史数据为异常数据;
所述单个客户的异常值通过下式得到:
其中: 为单个客户的异常值; 为第j个客户第i个借贷历史数据的投影值;
为第j个客户第i个借贷历史数据的上一个数据的投影值; 为第j个单个客户每两条借贷数据之间的时间间隔值;
所述单个客户的风险值通过下式得到:
其中: 为第j个单个客户的风险值; 为第j个单个客户所有异常值差值的方差值;
为第j个客户第t个借贷历史数据时间与当前分析时间的差值; 为第j个客户第t个借贷历史数据的投影值;
当所述单个客户的风险值大于所述风险阈值时,所述单个客户为风险客户;当所述单个客户的风险值小于所述风险阈值时,所述单个客户为特殊群体客户。
2.根据权利要求1所述的基于大数据的金融风险分析方法,其特征在于,所述阈值为
10,当所述投影值和高斯值的差值大于10时,则所述投影值和高斯值的差值为离群点,所述离群点对应的所述借贷历史数据为异常数据。
3.根据权利要求1所述的基于大数据的金融风险分析方法,其特征在于,所述第j个单个客户所有异常值差值的方差值 ,通过如下步骤获取:按照时间顺序将所述单个客户的异常值作差取绝对值;
对全部所述绝对值求取方差值,从而得到所述单个客户所有异常值差值的方差值 。
4.根据权利要求1所述的基于大数据的金融风险分析方法,其特征在于,所述风险阈值为5.5,当所述单个客户的风险值大于5.5时,所述单个客户为风险客户;当所述单个客户的风险值小于5.5时,所述单个客户为特殊群体客户。