1.一种基于大数据的金融风险智能分析方法,包括:获取金融数据,对获取的金融数据进行预处理;
将预处理后的金融数据输入到基于注意力机制的LSTM模型中,通过注意力机制层调整不同时间步特征的权重,得到时间序列特征;
对得到的时间序列特征进行小波变换处理,通过对时间序列特征进行多尺度分解,得到多尺度时间序列特征;
将得到的多尺度时间序列特征与金融数据中的其他风险特征进行组合,作为堆叠集成学习模型的输入;采用堆叠集成学习方法stacking对多个基础模型的预测结果进行组合,通过训练元模型来组合权重,得到堆叠集成学习模型的输出,作为初始的金融风险预测结果;其中,金融数据中的其他风险特征包含用户属性特征、宏观经济特征、市场行业特征和社交网络特征中的至少一种;
根据获取的金融数据与得到的初始的金融风险预测结果,通过概念漂移检测机制,对数据分布的变化进行检测;根据检测到的数据分布变化,对堆叠集成学习模型的参数进行调整,得到调整后的堆叠集成学习模型;
利用调整后的堆叠集成学习模型进行风险分析;
获取初始的金融风险预测结果,包括:
将通过小波包分解和对数能量熵得到的多尺度时间序列特征,与金融数据中的其他风险特征进行组合,构成风险特征集合;
采用信息增益方法对风险特征集合进行特征选择,得到特征子集;
采用Relief算法对得到的特征子集进行特征加权,得到加权后的特征向量;
选择决策树或支持向量机作为基础模型,将加权后的特征向量作为输入,训练选择的基础模型;
采用boosting集成方法生成多个训练后的基础模型实例;
采用训练后的基础模型实例,对加权后的特征向量进行预测,得到预测概率向量;
采用Isotonic Regression方法将预测概率向量转换为校准后的概率向量,作为基础模型的最终预测结果;
获取初始的金融风险预测结果,还包括:
将每个基础模型的最终预测结果作为元模型的输入特征,构建元模型训练集;
采用stacking方法,以元模型训练集作为输入,训练元模型,得到训练后的堆叠集成学习模型;
采用训练后的堆叠集成学习模型,对加权后的特征向量进行预测,得到金融风险预测结果向量,作为初始的金融风险预测结果。
2.根据权利要求1所述的基于大数据的金融风险智能分析方法,其特征在于:对得到的时间序列特征进行小波变换处理,通过对时间序列特征进行多尺度分解,得到多尺度时间序列特征,包括:利用Coiflets小波基函数,对时间序列特征进行小波包分解;在每一层分解中,将时间序列特征分解为低频和高频两个子带,递归分解直到达到预设的分解层数,得到小波包系数树;
根据小波包系数树,计算每个节点的对数能量熵,作为每个节点的评价指标值;
根据每个节点的评价指标值,选择最优的小波包基;其中,最优小波包基表示从小波包系数树的根节点到叶节点的路径中,评价指标值最大的节点路径;
根据选择的最优小波包基,提取小波包系数树中位于最优小波包基路径上的节点对应的子带系数,作为时间序列特征在不同尺度下的信息量子带;
对每个信息量子带的系数,计算统计特征,作为对应尺度下的局部特征向量;其中,统计特征包含均值和方差;
将不同尺度下的局部特征向量按顺序拼接为一个多尺度时间序列特征向量,作为时间序列特征的多尺度表示。
3.根据权利要求2所述的基于大数据的金融风险智能分析方法,其特征在于:计算每个节点的对数能量熵,通过如下公式:
其中,Ci为小波包系数树中第i个节点的系数,f(x)为节点系数的评估函数,∑f(Ci)为所有节点的评估函数值之和,E为对数能量熵。
4.根据权利要求3所述的基于大数据的金融风险智能分析方法,其特征在于:节点系数的评估函数f(x)采用组合函数的形式,具体为:其中,w1、w2、w3分别为幂函数、指数函数和对数函数的组合权重,用于控制不同非线性变换在组合函数中的比例;p为幂函数的幂指数,用于控制节点系数的幂次变换程度;α为指数函数的尺度参数,用于控制节点系数的指数变换程度;β为对数函数的尺度参数,用于控制节点系数的对数变换程度;|Ci|表示第i个节点系数的绝对值。
5.根据权利要求1所述的基于大数据的金融风险智能分析方法,其特征在于:得到训练后的堆叠集成学习模型,包括:
采用Logistic回归模型作为元模型,构建元模型的损失函数为交叉熵损失函数;
将元模型训练集作为输入,通过最小化交叉熵损失函数来训练Logistic回归模型;
将训练后的Logistic回归模型,作为训练后的堆叠集成学习模型。
6.根据权利要求5所述的基于大数据的金融风险智能分析方法,其特征在于:通过最小化交叉熵损失函数来训练Logistic回归模型,包括:在交叉熵损失函数中设置L1正则化项和L2正则化项,构建包含L1和L2正则化的损失函数;其中,L1正则化项用于特征选择,L2正则化项用于参数收缩;
将元模型训练集和构建的包含L1和L2正则化的损失函数作为输入,通过最小化构建的损失函数,采用梯度下降算法训练Logistic回归模型;
得到训练后的Logistic回归模型,作为包含L1和L2正则化的堆叠集成学习模型。
7.根据权利要求6所述的基于大数据的金融风险智能分析方法,其特征在于:通过最小化交叉熵损失函数来训练Logistic回归模型,还包括:设置Logistic回归模型的超参数搜索空间;
采用Bayesian优化方法,通过构建高斯过程代理模型,在超参数搜索空间中进行搜索,获取全局最优的超参数组合;
将元模型训练集、构建的包含L1和L2正则化的损失函数,以及获取的全局最优的超参数组合作为输入,通过最小化损失函数,训练Logistic回归模型;
得到基于全局最优超参数组合训练的Logistic回归模型,作为优化后的堆叠集成学习模型。
8.根据权利要求7所述的基于大数据的金融风险智能分析方法,其特征在于:超参数包括L1正则化系数、L2正则化系数和学习率。